CN106776984A - 一种分布式系统挖掘数据的清洗方法 - Google Patents

一种分布式系统挖掘数据的清洗方法 Download PDF

Info

Publication number
CN106776984A
CN106776984A CN201611109433.6A CN201611109433A CN106776984A CN 106776984 A CN106776984 A CN 106776984A CN 201611109433 A CN201611109433 A CN 201611109433A CN 106776984 A CN106776984 A CN 106776984A
Authority
CN
China
Prior art keywords
data
node
cleaning
module
load
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611109433.6A
Other languages
English (en)
Other versions
CN106776984B (zh
Inventor
安西民
林殷
朱巧霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Star Map Co., Ltd.
Original Assignee
Space Star Technology (beijing) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Space Star Technology (beijing) Co Ltd filed Critical Space Star Technology (beijing) Co Ltd
Priority to CN201611109433.6A priority Critical patent/CN106776984B/zh
Publication of CN106776984A publication Critical patent/CN106776984A/zh
Application granted granted Critical
Publication of CN106776984B publication Critical patent/CN106776984B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors

Abstract

本发明涉及一种分布式系统挖掘数据的清洗方法,根据各个计算节点的运行负载选择其一充当数据清洗节点,将数据挖掘的前期数据清洗准备工作从控制节点中分离出来,减轻控制节点的运行负载,加快系统处理速度,另外由于是根据数据清洗节点的运行负载来选择合适的数据清洗模式,保证数据清洗任务实现的同时不影响数据清洗节点本身其他任务的运行。

Description

一种分布式系统挖掘数据的清洗方法
【技术领域】
本发明属于数据清洗领域,尤其涉及分布式系统环境下挖掘数据的清洗方法。
【背景技术】
近年来随着网络技术的发展,分布式技术得到了深入的研究和广泛的应用,分布式系统中的各个计算机都具有独立计算能力,具有多种运行模式,其中一个控制节点和多个计算节点是比较常见的运行模式,由控制节点实现任务的调度、分配和资源控制等,计算节点实现任务处理、数据计算等。
数据挖掘是计算系统通常可以提供的外部服务,现有技术中对于分布式系统而言,数据挖掘服务通常是由控制节点提供,由于数据挖掘服务前期的数据清洗要耗费比较多的时间,控制节点进行数据清洗工作必然会占用其相当的计算资源,由于分布式系统中的控制节点还要进行任务的调度、分配和资源控制等,因此加重了控制节点的处理负载,对控制节点的硬件配置要求很高,如果控制节点配置达不到运行负载要求,则容易导致控制节点死机、系统瘫痪。
基于上述问题,现在亟需一种新的分布式系统挖掘数据的清洗方法,减轻控制节点的运行负载,加快系统处理速度。
【发明内容】
为了解决现有技术中的上述问题,本发明提出了一种分布式系统中挖掘数据的清洗方法。
本发明采用的技术方案如下:
一种分布式系统中挖掘数据的清洗方法,该方法包括如下步骤:
(1)将分布式系统中的节点按照性能划分为多个计算节点和一个控制节点,所述分布式系统中作为计算机资源的计算节点组成机群、提供计算机资源给控制节点,控制节点中存储有调度线程、负载监控线程、数据清洗线程和数据挖掘线程,其中控制节点负责分布式系统中的任务调度、各个计算节点的负载监控以及对外提供服务,所述服务包括数据挖掘服务;
(2)控制节点中的负载监控线程对各个计算节点的运行负载进行实时监控;
(3)当控制节点接收到数据挖掘服务请求时,上述负载监控线程对各个计算节点当前负载运行状态的实时监测数据进行分析和比较,选择其中最低运行负载的计算节点作为数据清洗节点,控制节点将其存储的数据清洗线程和所监测的上述数据清洗节点的当前负载运行状态传送给上述数据清洗节点;
(4)所述数据清洗节点接收上述数据清洗线程和当前负载运行状态,保存在本地,其中数据清洗线程由抽象组件来实现,包括输入构件、清洗服务组件、输出组件、连接组件和数据容器组件,所述输入组件用于清洗过程中从数据源提取数据,输出组件用于将清理的数据存入数据容器,所述连接组件用于粘合一个组件的输出端口和另一个组件的输入端口,数据容器组件用于存储清洗数据,清洗服务组件用于实现多个数据清洗功能;其中清洗服务组件包括数据标准化模块、错误数据查找模块、重复数据删除模块、数据关联、数据合并、数据分析、数据增强模块,其中数据标准化模块、错误数据查找模块和重复数据删除模块为基本清洗模块集,数据关联、数据合并为提高清洗模块集,数据分析、数据增强为附加清洗模块集;
(5)所述数据清洗节点将存储的当前负载运行状态与第一预设负载阈值进行比较,如果当前负载运行状态不低于第一预设负载阈值,则数据清洗节点选择基本清洗模块集、输入组件、连接组件、数据容器组件和输出组件构成新数据清洗线程并运行,实现基本数据清洗任务;如果当前负载运行状态低于第一预设负载阈值,则将当前负载运行状态与第二预设负载阈值进行比较;如果当前负载运行状态不低于第二预设负载阈值,则数据清洗节点选择基本清洗模块集和提高清洗模块集以及输入组件、连接组件、数据容器组件、输出组件构成新数据清洗线程并运行,实现提高数据清洗任务,如果当前负载运行状态低于第二预设负载阈值,则数据清洗节点选择基本清洗模块集、提高清洗模块集和附加清洗模块集以及输入组件、连接组件、数据容器组件、输出组件构成新数据清洗线程并运行,实现附加数据清洗任务。
本发明的有益效果包括:根据各个计算节点的运行负载选择其一充当数据清洗节点,将数据挖掘的前期准备工作负载(数据清洗)从控制节点中分离出来,减轻控制节点的运行负载,加快系统处理速度,进一步地,本申请是根据数据清洗节点的运行负载来选择合适的数据清洗模式,保证数据清洗任务的同时不影响数据清洗节点本身其他任务的运行。
【附图说明】
此处所说明的附图是用来提供对本发明的进一步理解,构成本申请的一部分,但并不构成对本发明的不当限定,在附图中:
图1是本发明分布式系统的结构图。
图2是本发明分布式系统中挖掘数据的清洗方法的流程图。
【具体实施方式】
下面将结合附图以及具体实施例来详细说明本发明,其中的示意性实施例以及说明仅用来解释本发明,但并不作为对本发明的限定。
参见附图1,是本发明所应用的分布式系统,该系统包括一个控制节点和多个计算节点。
参见附图2,一种分布式系统中挖掘数据的清洗方法,该方法包括如下步骤:
(1)将分布式系统中的节点按照性能划分为多个计算节点和一个控制节点,所述分布式系统中作为计算机资源的计算节点组成机群、提供计算机资源给控制节点,控制节点中存储有调度线程、负载监控线程、数据清洗线程和数据挖掘线程,其中控制节点负责分布式系统中的任务调度、各个计算节点的负载监控以及对外提供服务,在一个实施方式中,所述服务包括数据挖掘服务,在其他实施方式中,还可以包括其他对外服务;
(2)控制节点中的负载监控线程对各个计算节点的运行负载进行实时监控;
(3)当控制节点接收到数据挖掘服务请求时,上述负载监控线程对各个计算节点当前负载运行状态的实时监测数据进行分析和比较,选择其中最低运行负载的计算节点作为数据清洗节点,在一个实施方式中,假如有1个控制节点和5个计算节点,各个计算节点当前运行任务所分别占用的系统资源是60%,65%,70%,75%,80%,则选择最低运行负载60%的计算节点作为数据清洗节点;控制节点将其存储的数据清洗线程和所监测的上述数据清洗节点的当前负载运行状态(60%)传送给上述数据清洗节点;
(4)所述数据清洗节点接收上述数据清洗线程和当前负载运行状态(60%),保存在本地,在一个实施方式中本申请的数据清洗线程由抽象组件来实现,包括输入构件、清洗服务组件、输出组件、连接组件和数据容器组件,所述输入组件用于清洗过程中从数据源提取数据,输出组件用于将清理的数据存入数据容器,所述连接组件用于粘合一个组件的输出端口和另一个组件的输入端口,数据容器组件用于存储清洗数据,清洗服务组件用于实现多个数据清洗功能;在一个实施方式中,清洗服务组件包括数据标准化模块、错误数据查找模块、重复数据删除模块、数据关联、数据合并、数据分析、数据增强模块,其中数据标准化模块、错误数据查找模块和重复数据删除模块为基本清洗模块集,数据关联、数据合并为提高清洗模块集,数据分析、数据增强为附加清洗模块集;在其他实施方式中,还可以增加和设置其他的清洗服务组件,以及增加不同的清洗模块集。
(5)所述数据清洗节点将存储的当前负载运行状态与第一预设负载阈值进行比较,如果当前负载运行状态不低于第一预设负载阈值,在一个实施方式中,假设当前负载运行状态是60%,第一预设负载阈值是55%,60%不低于55%,则数据清洗节点选择基本清洗模块集、输入组件、连接组件、数据容器组件和输出组件构成新数据清洗线程并运行,实现基本数据清洗任务;
在其他实施方式中,如果当前负载运行状态低于第一预设负载阈值,假设当前负载运行状态是50%,第一预设负载阈值是55%,50%低于55%,则将当前负载运行状态与第二预设负载阈值进行比较;如果当前负载运行状态不低于第二预设负载阈值,假设第二预设负载阈值是40%,50%不低于40%,则数据清洗节点选择基本清洗模块集和提高清洗模块集以及输入组件、连接组件、数据容器组件、输出组件构成新数据清洗线程并运行,实现提高数据清洗任务,如果当前负载运行状态低于第二预设负载阈值,假设当前负载运行状态是50%,第二负载阈值是52%,50%低于52%,则数据清洗节点选择基本清洗模块集、提高清洗模块集和附加清洗模块集以及输入组件、连接组件、数据容器组件、输出组件构成新数据清洗线程并运行,实现附加数据清洗任务。在一个实施方式中,第一负载阈值、第二负载阈值预先设定,也可以由控制节点进行修改调整。
由于本申请是根据数据清洗节点的当前负载状态选择不同合适的清洗任务,在实现清洗任务的同时,又尽可能降低了对数据清洗节点本身任务运行的影响,使得系统负载处理平衡。
在一个实施方式中,所述数据标准化模块用于解决多来源数据标准不统一的问题,按照预先制定的数据仓库规范统一描述方式,实现全仓储数据格式标准化;所述错误数据查找模块用于查找和删除不合理数据、不合逻辑数据和矛盾数据;所述重复数据删除模块用于识别和删除相似重复数据。
在一个实施方式中,所述数据分析模块用于根据用户定义的模式对原始数据进行相关分析,根据用户定义的个性化分析需求进行有针对性的分析;所述数据增强模块用于利用外部字典和规则,补充原始数据中不完整的数据、遗漏的字段或者以增加字段的方式添加额外的信息。
在一个实施方式中,所述数据关联模块用于发现和识别相关数据并进行关联,比如相关于同一姓名字段的年龄、职业字段进行关联,建立关联关系;所述数据合并模块用于发现和识别同类数据并进行合并,比如同一日期下的多个购买记录进行合并,进行购买数量进行合并相加,或者一个月中同一物品的购买数量进行合并相加。
通过上述方法,本发明根据各个计算节点的运行负载选择其一充当数据清洗节点,将数据挖掘的前期准备工作负载(数据清洗)从控制节点中分离出来,减轻控制节点的运行负载,加快系统处理速度,另外,本申请是根据数据清洗节点的运行负载来选择合适的数据清洗模式,保证数据清洗任务的同时不影响数据清洗节点本身其他任务的运行。
以上所述仅是本发明的较佳实施方式,故凡依本发明专利申请范围所述的构造、特征及原理所做的等效变化或修饰,均包括于本发明专利申请范围内。

Claims (4)

1.一种分布式系统挖掘数据的清洗方法,其特征在于,该方法包括如下步骤:
(1)将分布式系统中的节点按照性能划分为多个计算节点和一个控制节点,所述分布式系统中作为计算机资源的计算节点组成机群、提供计算机资源给控制节点,控制节点中存储有调度线程、负载监控线程、数据清洗线程和数据挖掘线程,其中控制节点负责分布式系统中的任务调度、各个计算节点的负载监控以及对外提供服务,所述服务包括数据挖掘服务;
(2)控制节点中的负载监控线程对各个计算节点的运行负载进行实时监控;
(3)当控制节点接收到数据挖掘服务请求时,上述负载监控线程对各个计算节点当前负载运行状态的实时监测数据进行分析和比较,选择其中最低运行负载的计算节点作为数据清洗节点,控制节点将其存储的数据清洗线程和所监测的上述数据清洗节点的当前负载运行状态传送给上述数据清洗节点;
(4)所述数据清洗节点接收上述数据清洗线程和当前负载运行状态,保存在本地,其中数据清洗线程由抽象组件来实现,包括输入构件、清洗服务组件、输出组件、连接组件和数据容器组件,所述输入组件用于清洗过程中从数据源提取数据,输出组件用于将清理的数据存入数据容器,所述连接组件用于粘合一个组件的输出端口和另一个组件的输入端口,数据容器组件用于存储清洗数据,清洗服务组件用于实现多个数据清洗功能;其中清洗服务组件包括数据标准化模块、错误数据查找模块、重复数据删除模块、数据关联、数据合并、数据分析、数据增强模块,其中数据标准化模块、错误数据查找模块和重复数据删除模块为基本清洗模块集,数据关联、数据合并为提高清洗模块集,数据分析、数据增强为附加清洗模块集;
(5)所述数据清洗节点将存储的当前负载运行状态与第一预设负载阈值进行比较,如果当前负载运行状态不低于第一预设负载阈值,则数据清洗节点选择基本清洗模块集、输入组件、连接组件、数据容器组件和输出组件构成新数据清洗线程并运行,实现基本数据清洗任务;如果当前负载运行状态低于第一预设负载阈值,则将当前负载运行状态与第二预设负载阈值进行比较;如果当前负载运行状态不低于第二预设负载阈值,则数据清洗节点选择基本清洗模块集和提高清洗模块集以及输入组件、连接组件、数据容器组件、输出组件构成新数据清洗线程并运行,实现提高数据清洗任务,如果当前负载运行状态低于第二预设负载阈值,则数据清洗节点选择基本清洗模块集、提高清洗模块集和附加清洗模块集以及输入组件、连接组件、数据容器组件、输出组件构成新数据清洗线程并运行,实现附加数据清洗任务。
2.根据权利要求1所述的分布式系统挖掘数据的清洗方法,其特征在于,所述数据标准化模块用于解决多来源数据标准不统一的问题,按照预先制定的数据仓库规范统一描述方式,实现全仓储数据格式标准化;所述错误数据查找模块用于查找和删除不合理数据、不合逻辑数据和矛盾数据;所述重复数据删除模块用于识别和删除相似重复数据。
3.根据权利要求1所述的分布式系统挖掘数据的清洗方法,其特征在于,所述数据分析模块用于根据用户定义的模式对原始数据进行相关分析,所述数据增强模块用于利用外部字典和规则,补充原始数据中不完整的数据、遗漏的字段或者以增加字段的方式添加额外的信息。
4.根据权利要求1所述的分布式系统挖掘数据的清洗方法,其特征在于,所述数据关联模块用于发现和识别相关数据并进行关联,所述数据合并模块用于发现和识别同类数据并进行合并。
CN201611109433.6A 2016-12-02 2016-12-02 一种分布式系统挖掘数据的清洗方法 Active CN106776984B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611109433.6A CN106776984B (zh) 2016-12-02 2016-12-02 一种分布式系统挖掘数据的清洗方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611109433.6A CN106776984B (zh) 2016-12-02 2016-12-02 一种分布式系统挖掘数据的清洗方法

Publications (2)

Publication Number Publication Date
CN106776984A true CN106776984A (zh) 2017-05-31
CN106776984B CN106776984B (zh) 2018-09-25

Family

ID=58879187

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611109433.6A Active CN106776984B (zh) 2016-12-02 2016-12-02 一种分布式系统挖掘数据的清洗方法

Country Status (1)

Country Link
CN (1) CN106776984B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239581A (zh) * 2017-07-07 2017-10-10 小草数语(北京)科技有限公司 数据清洗方法及装置
CN109542360A (zh) * 2018-12-03 2019-03-29 郑州云海信息技术有限公司 数据重删方法、装置、设备、系统及计算机可读存储介质
CN109639480A (zh) * 2018-12-10 2019-04-16 北京京东金融科技控股有限公司 一种数据上报的系统和方法
CN109783314A (zh) * 2018-12-26 2019-05-21 广州裕鼎信息科技有限公司 It设备监控管理方法及服务器
CN110569238A (zh) * 2019-09-12 2019-12-13 成都中科大旗软件股份有限公司 一种基于大数据的数据治理方法、系统、存储介质和服务端
CN112000486A (zh) * 2020-09-11 2020-11-27 中国人民解放军国防科技大学 一种面向高性能计算机的海量计算节点资源监控管理方法
CN116882522A (zh) * 2023-09-07 2023-10-13 湖南视觉伟业智能科技有限公司 一种分布式时空挖掘方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7403942B1 (en) * 2003-02-04 2008-07-22 Seisint, Inc. Method and system for processing data records
US20100094910A1 (en) * 2003-02-04 2010-04-15 Seisint, Inc. Method and system for linking and delinking data records
CN102156659A (zh) * 2011-03-28 2011-08-17 中国人民解放军国防科学技术大学 一种文件作业任务的调度方法及系统
CN103188161A (zh) * 2011-12-30 2013-07-03 中国移动通信集团公司 分布式数据加载调度方法与系统
US20130281087A1 (en) * 2006-12-21 2013-10-24 Nokia Corporation Managing subscriber information
US20150134796A1 (en) * 2013-11-11 2015-05-14 Amazon Technologies, Inc. Dynamic partitioning techniques for data streams
CN105207818A (zh) * 2015-09-23 2015-12-30 杭州数梦工场科技有限公司 一种节点的控制方法和装置
CN105279603A (zh) * 2015-09-11 2016-01-27 福建师范大学 可动态配置的大数据分析系统及方法
CN105323111A (zh) * 2015-11-17 2016-02-10 南京南瑞集团公司 一种运维自动化系统及方法
US9471585B1 (en) * 2013-12-20 2016-10-18 Amazon Technologies, Inc. Decentralized de-duplication techniques for largescale data streams

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7403942B1 (en) * 2003-02-04 2008-07-22 Seisint, Inc. Method and system for processing data records
US20100094910A1 (en) * 2003-02-04 2010-04-15 Seisint, Inc. Method and system for linking and delinking data records
US20130281087A1 (en) * 2006-12-21 2013-10-24 Nokia Corporation Managing subscriber information
CN102156659A (zh) * 2011-03-28 2011-08-17 中国人民解放军国防科学技术大学 一种文件作业任务的调度方法及系统
CN103188161A (zh) * 2011-12-30 2013-07-03 中国移动通信集团公司 分布式数据加载调度方法与系统
US20150134796A1 (en) * 2013-11-11 2015-05-14 Amazon Technologies, Inc. Dynamic partitioning techniques for data streams
US9471585B1 (en) * 2013-12-20 2016-10-18 Amazon Technologies, Inc. Decentralized de-duplication techniques for largescale data streams
CN105279603A (zh) * 2015-09-11 2016-01-27 福建师范大学 可动态配置的大数据分析系统及方法
CN105207818A (zh) * 2015-09-23 2015-12-30 杭州数梦工场科技有限公司 一种节点的控制方法和装置
CN105323111A (zh) * 2015-11-17 2016-02-10 南京南瑞集团公司 一种运维自动化系统及方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239581A (zh) * 2017-07-07 2017-10-10 小草数语(北京)科技有限公司 数据清洗方法及装置
CN109542360A (zh) * 2018-12-03 2019-03-29 郑州云海信息技术有限公司 数据重删方法、装置、设备、系统及计算机可读存储介质
CN109639480A (zh) * 2018-12-10 2019-04-16 北京京东金融科技控股有限公司 一种数据上报的系统和方法
CN109783314A (zh) * 2018-12-26 2019-05-21 广州裕鼎信息科技有限公司 It设备监控管理方法及服务器
CN110569238A (zh) * 2019-09-12 2019-12-13 成都中科大旗软件股份有限公司 一种基于大数据的数据治理方法、系统、存储介质和服务端
CN110569238B (zh) * 2019-09-12 2023-03-24 成都中科大旗软件股份有限公司 一种基于大数据的数据治理方法、系统、存储介质和服务端
CN112000486A (zh) * 2020-09-11 2020-11-27 中国人民解放军国防科技大学 一种面向高性能计算机的海量计算节点资源监控管理方法
CN112000486B (zh) * 2020-09-11 2022-10-28 中国人民解放军国防科技大学 一种面向高性能计算机的海量计算节点资源监控管理方法
CN116882522A (zh) * 2023-09-07 2023-10-13 湖南视觉伟业智能科技有限公司 一种分布式时空挖掘方法及系统
CN116882522B (zh) * 2023-09-07 2023-11-28 湖南视觉伟业智能科技有限公司 一种分布式时空挖掘方法及系统

Also Published As

Publication number Publication date
CN106776984B (zh) 2018-09-25

Similar Documents

Publication Publication Date Title
CN106776984A (zh) 一种分布式系统挖掘数据的清洗方法
Vera-Baquero et al. Real-time business activity monitoring and analysis of process performance on big-data domains
CN108334557B (zh) 一种聚合数据分析方法、装置、存储介质及电子设备
CN105989163A (zh) 数据实时处理方法及系统
CN104715047A (zh) 一种社交网络数据采集与分析系统
CN114936019B (zh) 一种组件及策略联动方法、装置、设备、系统及存储介质
CN108650684A (zh) 一种关联规则确定方法及装置
CN106201837A (zh) 一种集成化硬件平台的日志解析方法和系统
CN105630797B (zh) 数据处理方法及系统
CN110895506A (zh) 测试数据的构造方法和构造系统
CN110705891A (zh) 一种基于高可配可变更的数据处理方法
Lin et al. Research on building an innovative electric power marketing business application system based on cloud computing and microservices architecture technologies
CN109472871A (zh) 一种三维模型重建方法、系统及电子设备
CN106257447A (zh) 云存储服务器的视频存储及检索方法、视频云存储系统
CN115438995B (zh) 一种基于知识图谱的服装定制企业的业务处理方法及设备
EP4086765A1 (en) System for optimizing resources for cloud-based scalable distributed search data analytics service
CN108153642A (zh) 一种根据运行负载选择计算节点的方法
Silva et al. Contribution of computational simulation for layout analysis in a wooden furniture industry
CN107018160A (zh) 一种基于层次化的制造资源和云化方法
CN113254544A (zh) 一种基于维度建模的数据处理装置及方法
Manjupriya et al. Customer churn prediction in the mobile telecommunication industry using decision tree classification algorithm
CN108153748A (zh) 一种挖掘数据的前期准备方法
CN108156207A (zh) 一种多节点系统的数据处理方法
Jitendra et al. Analysis of Airline Connectivity System using Graph Theory
CN111177227A (zh) 一种电力数据自助式分析系统及决策应用类迁移方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Du Jing

Inventor after: Tian Yuan

Inventor after: An Ximin

Inventor after: Lin Yin

Inventor after: Zhu Qiaoxia

Inventor before: An Ximin

Inventor before: Lin Yin

Inventor before: Zhu Qiaoxia

GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 101399 No. 2 East Airport Road, Shunyi Airport Economic Core Area, Beijing (1st, 5th and 7th floors of Industrial Park 1A-4)

Patentee after: Zhongke Star Map Co., Ltd.

Address before: 101399 Building 1A-4, National Geographic Information Technology Industrial Park, Guomen Business District, Shunyi District, Beijing

Patentee before: Space Star Technology (Beijing) Co., Ltd.