CN105930446A - 一种基于Hadoop分布式技术的电信客户标签生成方法 - Google Patents

一种基于Hadoop分布式技术的电信客户标签生成方法 Download PDF

Info

Publication number
CN105930446A
CN105930446A CN201610248608.5A CN201610248608A CN105930446A CN 105930446 A CN105930446 A CN 105930446A CN 201610248608 A CN201610248608 A CN 201610248608A CN 105930446 A CN105930446 A CN 105930446A
Authority
CN
China
Prior art keywords
label
data
client
user
hdfs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610248608.5A
Other languages
English (en)
Other versions
CN105930446B (zh
Inventor
侯静
张治中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Zhongyou Huice Communication Technology Co Ltd
Original Assignee
Chongqing Zhongyou Huice Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Zhongyou Huice Communication Technology Co Ltd filed Critical Chongqing Zhongyou Huice Communication Technology Co Ltd
Priority to CN201610248608.5A priority Critical patent/CN105930446B/zh
Publication of CN105930446A publication Critical patent/CN105930446A/zh
Application granted granted Critical
Publication of CN105930446B publication Critical patent/CN105930446B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

为解决现有技术存在的缺乏用于电信客户标签生成的方法,难于采用标签化方式对客户进行管理并向客户提供个性化的服务等问题,本发明提出一种基于Hadoop分布式技术的电信客户标签生成方法,采用分布式文件系统HDFS对电信客户标签数据源进行管理,获取用户个性化特征的各种标签窄表,运用IMSI号关联所有客户的所有标签窄表,得到统一客户标签宽表;将客户标签保存到Hbase,运用Phoenix提供用户标签信息检索入口。本发明的有益技术效果是实现了用户个性化特征信息的标签化,能有效减少客户信息查询的带宽,同时查询效率高、扩展性好,提高了电信运营商在自有业务推荐、套餐制定和终端品牌营销方面的运营能力。

Description

一种基于Hadoop分布式技术的电信客户标签生成方法
技术领域
本发明涉及通信技术领域,具体涉及到一种基于Hadoop分布式技术的电信客户标签生成方法。
背景技术
随着4G网络的商用和广泛部署,电信市场竞争日趋激烈,电信运营商的经营模式逐渐从“技术驱动”向“市场驱动”和“客户驱动”转化。这就要求运营商要采取以“客户为中心”的策略,根据客户的实际需求提供个性化的服务解决方案。为此,能够体现用户个性化特征,包含电信客户的流量属性、时间属性、资费属性的客户标签相关概念应运而生。客户标签全方位标记客户的个性化属性,通过输入IMSI号即可查询客户的全部标签信息,也可根据标签筛选出相应的客户群。客户信息的标签化能减少用户信息查询的带宽,提高资源利用率,实现运营商在自有业务推荐、套餐制定、终端营销方面的高效运营。在客户标签部署过程中,移动互联网用户产生和应用的数据量日益增大,海量用户数据的出现和数据结构的多样化,传统的基于关系型数据库的处理方法已无法满足现有业务数据存储和处理需求。然而,现有技术中目前还没有一种用于电信客户标签生成的方法,难于采用标签化方式对客户进行管理并向客户提供个性化的服务。
另一方面,Hadoop分布式技术是Apache组织管理的一个开源项目,目前得到了大量的应用。Hadoop已经成长为包括Hadoop common、HDFS、MapReduce、ZooKeeper、Avro、Chukwa、HBase、Hive、Mahout和Pig等10个子项目在内的技术项目。Hadoop的核心是由HadoopCommon、HDFS(Hadoop Distributed File System)以及Map Reduce三个子系统组成。其中Hadoop Common部分为Hadoop整体的架构提供了基础支撑性功能,主要包括了文件系统、远程过程调用协议和数据串行化库,HDFS是分布式文件系统,具有高容错性而且使用成本较低的特点。Map Reduce主要用于大规模计算机集群上编写对海量数据进行快速处理的并行化程序,是一个编程模型和软件框架。在实际应用环境中,通常以Hadoop Common为架构,主要是提供基础支持;再加上HDFS和Map Reduce的逻辑组件相互组合完成对海量数据处理。
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。
Sqoop是在关系型数据库和HDFS间高效传输数据的工具,可以将一个关系型数据库中的数据导入到Hadoop的HDFS中,也可以将HDFS的数据导进关系型数据库中。
HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。
Phoenix是一个Java中间层,可以让开发者在Apache HBase上执行SQL查询。查询引擎可以SQL查询转换为一个或多个HBase Scan,并编排执行以生成标准的JDBC结果集。对于简单查询来说,其性能量级是毫秒,对于百万级别的行数来说,其性能量级是秒。
发明内容
为解决现有技术存在的缺乏用于电信客户标签生成的方法,难于采用标签化方式对客户进行管理并向客户提供个性化的服务等问题,本发明提出一种基于Hadoop分布式技术的电信客户标签生成方法。
本发明基于Hadoop分布式技术的电信客户标签生成方法,包括如下步骤:
S1、采用分布式文件系统HDFS对电信客户标签数据源进行管理,包括,将电信客户标签数据源导入到分布式文件系统HDFS,由HDFS提供高吞吐量的数据访问能力;所述分布式文件系统HDFS是指Hadoop分布式技术的子系统之一;所述Hadoop分布式技术是Apache组织管理的一个开源项目;所述数据源包括Boss数据、经分数据、IMSI库、爬虫库和用户实时上网CDR详单;
S2、根据不同的用户个性化特征信息,运用Map/Reduce框架获得所有输入用户的客户标签输出原始值,形成体现用户个性化特征的各种标签窄表;所述用户个性化特征信息,包括客户基本信息、访问特性、搜索信息、业务使用、流量消耗和终端品牌信息;所述Map/Reduce框架是指Hadoop分布式技术的子系统之一的编程模型和软件框架;所述标签窄表是指体现所有输入用户某一个性化特征的标签输出原始值的汇总表,其中,Key值为客户IMSI,Value值为该IMSI所代表的客户对应的标签输出原始值;所述标签输出原始值包括反映用户个性化特征信息的基本数据;
S3、运用IMSI号关联所有客户的所有标签窄表,得到统一客户标签宽表,并映射到Hive中,实现用户标签原始数据的快速查询;其中,统一客户标签宽表中,Key值为用户IMSI号,Value值为具有多列的标签输出原始值;所述Hive是指基于Hadoop分布式技术的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行;
S4、根据配置文件将统一客户信息宽表中的原始值代号/原始值输出为客户标签,并将客户标签保存到Hbase;所述Hbase是指适合于非结构化数据存储的数据库,是一个具有高可靠性、高性能、面向列、可伸缩的分布式存储系统;所述配置文件的格式为:匹配类型,标签编号,输出标签,原始值代号,标签含义;所述Hbase中表结构设计为:Rowkey为IMSI+标签序号,Column-family中包含单个列,其格式为Data:Label,存放客户标签;
S5、运用Phoenix提供用户标签信息检索入口,具备支持正向/反向的双向查询能力;所述Phoenix是指一个Java中间层,可以让开发者在Apache HBase上执行SQL查询,查询引擎可以SQL查询转换为一个或多个HBase Scan,并编排执行以生成标准的JDBC结果集。
进一步的,步骤S1中将电信客户标签数据源导入到分布式文件系统HDFS,包括,BOSS数据、经分数据、IMSI库和爬虫库通过Sqoop从关系型数据库导入到HDFS;用户实时上网CDR详单由入库程序导入到HDFS,并按照年、月、天的进行数据分区;所述Sqoop是指在关系型数据库和HDFS间高效传输数据的工具,可以将一个关系型数据库中的数据导入到HDFS中,也可以将HDFS的数据导进关系型数据库中。
进一步的,步骤S2中所述运用Map/Reduce框架获得所有输入用户的客户标签输出原始值,形成体现用户个性化特征的各种标签窄表,包括针对不同的用户个性化特征信息,运用Map/Reduce框架结合协同过滤算法、决策树、PageRank矩阵分块算法、关联分析算法和聚类算法,获得不同用户的标签输出原始值,形成标签窄表。
进一步的,步骤S5中所述具备支持正向/反向的双向查询能力,包括,正向查询即根据用户IMSI号,查询用户部分或者全部标签;反向查询即以标签为维度,筛选出具备该标签特征的用户群体。
本发明基于Hadoop分布式技术的电信客户标签生成方法的有益技术效果是实现了用户个性化特征信息的标签化,能有效减少客户信息查询的带宽,同时查询效率高、扩展性好,提高了电信运营商在自有业务推荐、套餐制定和终端品牌营销方面的运营能力。
附图说明
附图1为本发明基于Hadoop分布式技术的电信客户标签生成方法的步骤示意图。
下面结合附图对本发明基于Hadoop分布式技术的电信客户标签生成方法作进一步的说明。
具体实施方式
显而易见地,下面描述中的附图仅仅是本发明的一些实施例,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
附图1为本发明基于Hadoop分布式技术的电信客户标签生成方法的步骤示意图,由图可知,本发明基于Hadoop分布式技术的电信客户标签生成方法,包括如下步骤:
S1、采用分布式文件系统HDFS对电信客户标签数据源进行管理,包括,将电信客户标签数据源导入到分布式文件系统HDFS,由HDFS提供高吞吐量的数据访问能力;所述分布式文件系统HDFS是指Hadoop分布式技术的子系统之一;所述Hadoop分布式技术是Apache组织管理的一个开源项目;所述数据源包括Boss数据、经分数据、IMSI库、爬虫库和用户实时上网CDR详单;其中,所述BOSS数据、经分数据、IMSI库和爬虫库通过Sqoop从关系型数据库导入到HDFS,所述用户实时上网CDR详单由入库程序导入到HDFS,并按照年、月、天的进行数据分区;所述Sqoop是指在关系型数据库和HDFS间高效传输数据的工具,可以将一个关系型数据库中的数据导入到HDFS中,也可以将HDFS的数据导进关系型数据库中。
由于本发明将海量电信客户原始数据存储在HDFS上,为原始数据提供具备高容错、高吞吐、低成本的存储空间,支持以流的形式访问文件系统中的数据;将标签原始输出值映射到Hive中,通过类SQL语句快速实现简单的MapReduce统计;将客户标签存储在分布式数据库HBase中,为海量用户标签的存储提供了一个可行的解决方案,缓解了传统方法中单机存储客户数据的压力。
S2、根据不同的用户个性化特征信息,运用Map/Reduce框架获得所有输入用户的客户标签输出原始值,形成体现用户个性化特征的各种标签窄表;所述用户个性化特征信息,包括客户基本信息、区域属性、访问特性、资费套餐、搜索信息、业务使用、流量消耗和终端品牌信息;所述Map/Reduce框架是指Hadoop分布式技术的子系统之一的编程模型和软件框架;所述标签窄表是指体现所有输入用户某一个性化特征的标签输出原始值的汇总表,其中,Key值为客户IMSI,Value值为该IMSI所代表的客户对应的标签输出原始值;所述标签输出原始值包括反映用户个性化特征信息的基本数据。其中,所述运用Map/Reduce框架获得所有输入用户的客户标签输出原始值,形成体现用户个性化特征的各种标签窄表,包括针对不同的用户个性化特征信息,运用Map/Reduce框架结合协同过滤算法、决策树、PageRank矩阵分块算法、关联分析算法和聚类算法,获得不同用户的标签输出原始值,形成标签窄表。
以流量消耗标签为例,以本月流量总值/上月流量总值的比值定义用户类型,其中,上升型用户定义比值为130%以上、平衡型用户定义比值为85%-130%、下降型用户定义比值为85%及其以下。运用Map/Reduce框架获得所有输入用户(一个IMSI代表一个用户)的标签输出原始值,并转化为原始值代号,形成体现所有输入用户流量消耗特征的标签窄表,所述体现所有输入用户流量消耗特征的标签窄表格式如表1所示。
表1:体现所有输入用户流量消耗特征的标签窄表格式
IMEI号 流量增减 原始值代号
IMEI1 130% 1
IMEI2 110% 0
IMEI3 80% -1
…… …… ……
S3、运用IMSI号关联所有客户的所有标签窄表,得到统一客户标签宽表,并映射到Hive中,实现用户标签原始数据的快速查询;其中,统一客户标签宽表中,Key值为用户IMSI号,Value值为具有多列的标签输出原始值;所述Hive是指基于Hadoop分布式技术的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。
以反映用户区域属性、终端品牌、资费套餐和流量消耗等用户个性化特征信息的统一客户标签宽表为例,运用模糊匹配的方式输出用户区域属性(城市、农村)、终端品牌(如苹果、三星等)、资费套餐(如4G商旅128套餐)和流量消耗等标签窄表,运用IMSI进行关联,获得所有客户的统一信息宽表,同时,将该表映射到Hive中,由Hive提供类SQL查询。所述反映用户区域属性、终端品牌、资费套餐和流量消耗等用户个性化特征信息的统一客户标签宽表的格式如表2所示。
表2:反映用户区域属性、终端品牌、资费套餐和流量消耗等用户个性化特征信息的统一客户标签宽表的格式
本发明将客户个性化特征建立的任务分发到由低配置的计算机组成的集群环境中,运用Phoenix提供用户标签信息高效查询引擎,减少查询时间延迟。
S4、根据配置文件将统一客户信息宽表中的原始值代号/原始值输出为客户标签,并将客户标签保存到Hbase;所述Hbase是指适合于非结构化数据存储的数据库,是一个具有高可靠性、高性能、面向列、可伸缩的分布式存储系统;所述配置文件的格式为:匹配类型,标签编号,输出标签,原始值代号,标签含义;所述Hbase中表结构设计为:Rowkey为IMSI+标签序号,Column-family中包含单个列,其格式为Data:Label,存放客户标签。所述HBase中存储结构如表3所示,RowKey为IMSI+标签编号,列簇中有一列Data:Label,存放着用户标签.
表3:HBase中存储结构
S5、运用Phoenix提供用户标签信息检索入口,具备支持正向/反向的双向查询能力;所述Phoenix是指一个Java中间层,可以让开发者在Apache HBase上执行SQL查询,查询引擎可以SQL查询转换为一个或多个HBase Scan,并编排执行以生成标准的JDBC结果集。所述具备支持正向/反向的双向查询能力,包括,正向查询即根据用户IMSI号,查询用户部分或者全部标签;反向查询即以标签为维度,筛选出具备该标签特征的用户群体
显然,本发明基于Hadoop分布式技术的电信客户标签生成方法的有益技术效果是实现了用户个性化特征信息的标签化,能有效减少客户信息查询的带宽,同时查询效率高、扩展性好,提高了电信运营商在自有业务推荐、套餐制定和终端品牌营销方面的运营能力。

Claims (4)

1.一种基于Hadoop分布式技术的电信客户标签生成方法,其特征在于,该方法包括如下步骤:
S1、采用分布式文件系统HDFS对电信客户标签数据源进行管理,包括,将电信客户标签数据源导入到分布式文件系统HDFS,由HDFS提供高吞吐量的数据访问能力;所述分布式文件系统HDFS是指Hadoop分布式技术的子系统之一;所述Hadoop分布式技术是Apache组织管理的一个开源项目;所述数据源包括Boss数据、经分数据、IMSI库、爬虫库和用户实时上网CDR详单;
S2、根据不同的用户个性化特征信息,运用Map/Reduce框架获得所有输入用户的客户标签输出原始值,形成体现用户个性化特征的各种标签窄表;所述用户个性化特征信息,包括客户基本信息、访问特性、搜索信息、业务使用、流量消耗和终端品牌信息;所述Map/Reduce框架是指Hadoop分布式技术的子系统之一的编程模型和软件框架;所述标签窄表是指体现所有输入用户某一个性化特征的标签输出原始值的汇总表,其中,Key值为客户IMSI,Value值为该IMSI所代表的客户对应的标签输出原始值;所述标签输出原始值包括反映用户个性化特征信息的基本数据;
S3、运用IMSI号关联所有客户的所有标签窄表,得到统一客户标签宽表,并映射到Hive中,实现用户标签原始数据的快速查询;其中,统一客户标签宽表中,Key值为用户IMSI号,Value值为具有多列的标签输出原始值;所述Hive是指基于Hadoop分布式技术的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为 MapReduce 任务进行运行;
S4、根据配置文件将统一客户信息宽表中的原始值代号/原始值输出为客户标签,并将客户标签保存到Hbase;所述Hbase是指适合于非结构化数据存储的数据库,是一个具有高可靠性、高性能、面向列、可伸缩的分布式存储系统;所述配置文件的格式为:匹配类型,标签编号,输出标签,原始值代号,标签含义;所述Hbase中表结构设计为:Rowkey为IMSI+标签序号,Column-family中包含单个列,其格式为Data:Label,存放客户标签;
S5、运用Phoenix提供用户标签信息检索入口,具备支持正向/反向的双向查询能力;所述Phoenix是指一个Java中间层,可以让开发者在Apache HBase上执行SQL查询,查询引擎可以SQL查询转换为一个或多个HBase Scan,并编排执行以生成标准的JDBC结果集。
2.根据权利要求1所述基于Hadoop分布式技术的电信客户标签生成方法,其特征在于,步骤S1中将电信客户标签数据源导入到分布式文件系统HDFS,包括,BOSS数据、经分数据、IMSI库和爬虫库通过Sqoop从关系型数据库导入到HDFS;用户实时上网CDR详单由入库程序导入到HDFS,并按照年、月、天的进行数据分区;所述Sqoop是指在关系型数据库和HDFS间高效传输数据的工具,可以将一个关系型数据库中的数据导入到HDFS中,也可以将HDFS的数据导进关系型数据库中。
3.根据权利要求1所述基于Hadoop分布式技术的电信客户标签生成方法,其特征在于,步骤S2中所述运用Map/Reduce框架获得所有输入用户的客户标签输出原始值,形成体现用户个性化特征的各种标签窄表,包括针对不同的用户个性化特征信息,运用Map/Reduce框架结合协同过滤算法、决策树、PageRank矩阵分块算法、关联分析算法和聚类算法,获得不同用户的标签输出原始值,形成标签窄表。
4.根据权利要求1所述基于Hadoop分布式技术的电信客户标签生成方法,其特征在于,步骤S5中所述具备支持正向/反向的双向查询能力,包括,正向查询即根据用户IMSI号,查询用户部分或者全部标签;反向查询即以标签为维度,筛选出具备该标签特征的用户群体。
CN201610248608.5A 2016-04-20 2016-04-20 一种基于Hadoop分布式技术的电信客户标签生成方法 Active CN105930446B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610248608.5A CN105930446B (zh) 2016-04-20 2016-04-20 一种基于Hadoop分布式技术的电信客户标签生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610248608.5A CN105930446B (zh) 2016-04-20 2016-04-20 一种基于Hadoop分布式技术的电信客户标签生成方法

Publications (2)

Publication Number Publication Date
CN105930446A true CN105930446A (zh) 2016-09-07
CN105930446B CN105930446B (zh) 2019-04-16

Family

ID=56839471

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610248608.5A Active CN105930446B (zh) 2016-04-20 2016-04-20 一种基于Hadoop分布式技术的电信客户标签生成方法

Country Status (1)

Country Link
CN (1) CN105930446B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951552A (zh) * 2017-03-27 2017-07-14 重庆邮电大学 一种基于Hadoop的用户行为数据处理方法
CN108228628A (zh) * 2016-12-15 2018-06-29 亿度慧达教育科技(北京)有限公司 一种结构化查询语言数据库中的宽表生成方法及其装置
CN108874971A (zh) * 2018-06-07 2018-11-23 北京赛思信安技术股份有限公司 一种应用于海量标签化实体数据存储的工具和方法
CN109101652A (zh) * 2018-08-27 2018-12-28 宜人恒业科技发展(北京)有限公司 一种标签创建和管理系统
CN109684332A (zh) * 2018-12-20 2019-04-26 贵州工程应用技术学院 一种数据宽表生成方法、装置及系统
CN109828989A (zh) * 2019-01-31 2019-05-31 泰康保险集团股份有限公司 客户营销方法及装置
CN110019397A (zh) * 2017-12-06 2019-07-16 北京京东尚科信息技术有限公司 用于进行数据处理的方法及装置
CN110019447A (zh) * 2017-09-18 2019-07-16 镇江雅迅软件有限责任公司 一种基于关系型数据库的数据标签管理办法
CN110928893A (zh) * 2019-11-18 2020-03-27 中国建设银行股份有限公司 一种标签查询方法、装置、设备和存储介质
CN111125216A (zh) * 2019-12-10 2020-05-08 中盈优创资讯科技有限公司 数据导入Phoenix的方法及装置
CN111506621A (zh) * 2020-03-31 2020-08-07 新华三大数据技术有限公司 一种数据统计方法及装置
CN112434078A (zh) * 2020-11-20 2021-03-02 广州奇享科技有限公司 一种锅炉数据的处理方法、装置、设备及存储介质
CN112613907A (zh) * 2020-12-18 2021-04-06 北京思特奇信息技术股份有限公司 快速匹配符合用户条件的营销活动产品的方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103248677A (zh) * 2013-04-24 2013-08-14 深圳天源迪科信息技术股份有限公司 互联网行为分析系统及其工作方法
CN103425762A (zh) * 2013-08-05 2013-12-04 南京邮电大学 基于Hadoop平台的电信运营商海量数据处理方法
CN103714139A (zh) * 2013-12-20 2014-04-09 华南理工大学 一种移动海量客户群识别的并行数据挖掘方法
CN103886487A (zh) * 2014-03-28 2014-06-25 焦点科技股份有限公司 基于分布式的b2b平台的个性化推荐方法与系统
US8775425B2 (en) * 2010-08-24 2014-07-08 International Business Machines Corporation Systems and methods for massive structured data management over cloud aware distributed file system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8775425B2 (en) * 2010-08-24 2014-07-08 International Business Machines Corporation Systems and methods for massive structured data management over cloud aware distributed file system
CN103248677A (zh) * 2013-04-24 2013-08-14 深圳天源迪科信息技术股份有限公司 互联网行为分析系统及其工作方法
CN103425762A (zh) * 2013-08-05 2013-12-04 南京邮电大学 基于Hadoop平台的电信运营商海量数据处理方法
CN103714139A (zh) * 2013-12-20 2014-04-09 华南理工大学 一种移动海量客户群识别的并行数据挖掘方法
CN103886487A (zh) * 2014-03-28 2014-06-25 焦点科技股份有限公司 基于分布式的b2b平台的个性化推荐方法与系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
杨国博 等: "Hadoop平台在电信企业的应用实践", 《数字通信》 *
王翔: "基于Hadoop的电信运营商海量数据处理方法的研究与应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108228628A (zh) * 2016-12-15 2018-06-29 亿度慧达教育科技(北京)有限公司 一种结构化查询语言数据库中的宽表生成方法及其装置
CN108228628B (zh) * 2016-12-15 2020-11-17 亿度慧达教育科技(北京)有限公司 一种结构化查询语言数据库中的宽表生成方法及其装置
CN106951552A (zh) * 2017-03-27 2017-07-14 重庆邮电大学 一种基于Hadoop的用户行为数据处理方法
CN110019447A (zh) * 2017-09-18 2019-07-16 镇江雅迅软件有限责任公司 一种基于关系型数据库的数据标签管理办法
CN110019397B (zh) * 2017-12-06 2021-06-29 北京京东尚科信息技术有限公司 用于进行数据处理的方法及装置
CN110019397A (zh) * 2017-12-06 2019-07-16 北京京东尚科信息技术有限公司 用于进行数据处理的方法及装置
CN108874971A (zh) * 2018-06-07 2018-11-23 北京赛思信安技术股份有限公司 一种应用于海量标签化实体数据存储的工具和方法
CN108874971B (zh) * 2018-06-07 2021-09-24 北京赛思信安技术股份有限公司 一种应用于海量标签化实体数据存储的工具和方法
CN109101652A (zh) * 2018-08-27 2018-12-28 宜人恒业科技发展(北京)有限公司 一种标签创建和管理系统
CN109101652B (zh) * 2018-08-27 2022-04-19 宜人恒业科技发展(北京)有限公司 一种标签创建和管理系统
CN109684332A (zh) * 2018-12-20 2019-04-26 贵州工程应用技术学院 一种数据宽表生成方法、装置及系统
CN109828989A (zh) * 2019-01-31 2019-05-31 泰康保险集团股份有限公司 客户营销方法及装置
CN109828989B (zh) * 2019-01-31 2021-03-16 泰康保险集团股份有限公司 客户营销方法及装置
CN110928893A (zh) * 2019-11-18 2020-03-27 中国建设银行股份有限公司 一种标签查询方法、装置、设备和存储介质
CN111125216A (zh) * 2019-12-10 2020-05-08 中盈优创资讯科技有限公司 数据导入Phoenix的方法及装置
CN111125216B (zh) * 2019-12-10 2024-03-12 中盈优创资讯科技有限公司 数据导入Phoenix的方法及装置
CN111506621A (zh) * 2020-03-31 2020-08-07 新华三大数据技术有限公司 一种数据统计方法及装置
CN112434078A (zh) * 2020-11-20 2021-03-02 广州奇享科技有限公司 一种锅炉数据的处理方法、装置、设备及存储介质
CN112613907A (zh) * 2020-12-18 2021-04-06 北京思特奇信息技术股份有限公司 快速匹配符合用户条件的营销活动产品的方法和系统

Also Published As

Publication number Publication date
CN105930446B (zh) 2019-04-16

Similar Documents

Publication Publication Date Title
CN105930446A (zh) 一种基于Hadoop分布式技术的电信客户标签生成方法
CN108257043B (zh) 一种政务信息资源梳理及目录管理系统和方法
CN100531055C (zh) 数据同步系统及其方法
CN100579153C (zh) 一种信息管理系统以及信息管理方法
CN105138661A (zh) 一种基于Hadoop的网络安全日志k-means聚类分析系统及方法
CN102521246A (zh) 一种云数据仓库系统
CN106951552A (zh) 一种基于Hadoop的用户行为数据处理方法
CN105184624A (zh) 二手房屋交易信息系统
CN109033113A (zh) 数据仓库和数据集市的管理方法及装置
CN104391908B (zh) 一种图上基于局部敏感哈希的多关键字索引方法
CN111126852A (zh) 一种基于大数据建模的bi应用系统
CN102945270B (zh) 并行化分布式网络舆情数据管理方法及系统
CN114218291A (zh) 基于目标对象的画像生成方法、装置、设备及存储介质
CN105550351B (zh) 旅客行程数据即席查询系统及方法
CN1953490A (zh) 一种利用etl技术对计费数据进行抽取提供的方法
CN103955461A (zh) 一种基于本体集合概念相似度的语义匹配方法
CN103886065A (zh) 迷你小说阅读系统
Singh et al. Easy designing steps of a local data warehouse for possible analytical data processing
CN109542863A (zh) 人工智能存储挖矿机系统
Mitomo Data network effects: Implications for data business
CN103942249A (zh) 一种基于本体集合语义匹配的信息服务调度系统
CN101719162A (zh) 基于片段模式匹配的多版本开放式地理信息服务访问方法及系统
CN104112184A (zh) 精细化客服知识库系统及其工作方法
Hoang et al. Collective cubing platform towards definition and analysis of warehouse cubes
CN102300006A (zh) 一种计算机辅助电话访问系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: 401220 No. 6 Xinmin Road, Xinshi Street, Changshou District, Chongqing

Patentee after: Chongqing Zhongyou Huice Communication Technology Co., Ltd.

Address before: 401121 Chongqing North New District Yubei District high tech Park mercury science and Technology Development Center North Wing 5 floor

Patentee before: Chongqing Zhongyou Huice Communication Technology Co., Ltd.

CP02 Change in the address of a patent holder