CN104376109B - 一种基于数据分布库的多维度数据分布方法 - Google Patents

一种基于数据分布库的多维度数据分布方法 Download PDF

Info

Publication number
CN104376109B
CN104376109B CN201410700945.4A CN201410700945A CN104376109B CN 104376109 B CN104376109 B CN 104376109B CN 201410700945 A CN201410700945 A CN 201410700945A CN 104376109 B CN104376109 B CN 104376109B
Authority
CN
China
Prior art keywords
data
distribution
logic
library
strategy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410700945.4A
Other languages
English (en)
Other versions
CN104376109A (zh
Inventor
杨志
张春平
胡牧
林峰
张启平
田洪迅
张建功
胡庆辉
沈力
王宏刚
张明明
黄高攀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
NARI Group Corp
Nari Information and Communication Technology Co
Information and Telecommunication Branch of State Grid Jiangsu Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Nari Information and Communication Technology Co
Nanjing NARI Group Corp
Information and Telecommunication Branch of State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Nari Information and Communication Technology Co, Nanjing NARI Group Corp, Information and Telecommunication Branch of State Grid Jiangsu Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201410700945.4A priority Critical patent/CN104376109B/zh
Publication of CN104376109A publication Critical patent/CN104376109A/zh
Application granted granted Critical
Publication of CN104376109B publication Critical patent/CN104376109B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/278Data partitioning, e.g. horizontal or vertical partitioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Abstract

本发明公开了一种基于数据分布库的多维度数据分布及方法,属于电网数据处理技术领域。本发明首先分析业务逻辑,分析出业务功能和数据库中的表之间的逻辑关系,然后确定水平或垂直分布,根据业务分析结果,确定数据整体拆分原则,对于简单逻辑的系统宜采用垂直分布策略,对于复杂逻辑的系统宜采用水平分布策略,接着确定多维度混合分布,结合业务逻辑,组合数据分布库中的分布策略成最佳的混合分布;并确定多维度分布的数据块的最细粒度,通过分析集群节点的存储空间,利用最大公约原则来确定数据块的最细粒度;最后实现数据分布。本发明能够实现高性能的数据查询与分析,满足用户对大数据处理的实时性需求。

Description

一种基于数据分布库的多维度数据分布方法
技术领域
本发明属于电网数据处理技术领域,更准确地说,本发明涉及一种基于数据分布库的多维度数据分布方法。
背景技术
随着电力企业业务信息系统应用的逐步深入,业务数据量激增,目前多个系统数据已达数亿条记录,信息系统性能和运行效率逐渐降低,当前对象化并行计算系统分布式缓存数据库数据到内存,借助于内存计算,可有效提升电力信息系统运行性能,但数据分布策略采用水平切片,比较单一,造成拆分后的数据块不均,无法达到负载均衡,此外没有考虑业务逻辑,没有达到最佳分布策略,严重影响系统运行效率。
数据分布是分布式并行系统实现的基础,数据分布策略是研究如何在多节点之间均衡分布数据,它的优劣,直接影响系统的运行效率。当前,业界在分布式文件系统、分布式数据库等技术中均有数据分布策略,为大数据的存储提出了数据分布解决方案。
分布式文件系统是主从结构,由一个主服务器和若干个数据节点构成。通常是一个节点一个机器,管理对应节点的存储。系统设计成能可靠地在集群中大量机器之间存储大量的文件,数据分布策略是将一个文件分割成一个或多个块,这些块被存储在一组数据节点中,以块序列的形式存储文件。文件中除了最后一个块,其他块都有相同的大小。提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序。
分布式数据库系统中的数据分布是指在多存储节点分配数据,使得系统对数据处理的并行性得以充分发挥,达到最小化数据处理时间的目的,数据分布过程主要有两个阶段:数据分段和数据分配。数据分段是将按照关系将数据划分为若干个数据子集。数据分配是将已划分的数据子集分配到不同的存储节点中。数据分段又分为垂直分段和水平分段。垂直分段是指以关系的属性为单位,通过投影操作产生若干数据子集;水平分段是指以关系的元组为单位,通过选择操作产生若干数据子集,当前数据分布多采用水平分段,因为这种分段方式通过数据子集的并操作还原关系,不仅有利于均衡负载,也有利于增强查询的并行性。
数据分布策略主要有水平分布、垂直分布和混合分布。水平分布是按特定策略将关系的元组划分成若干不相交子集,每个子集为关系的一个逻辑片段,各片段分布到不同节点上。垂直分布则将关系的属性集划分为若干子集,然后将关系的键和属性子集的值分布到不同节点上;混合分布则是水平和垂直分布两种策略的混合。由于关系型数据库在设计之初就要求小的冗余度,表的属性集较小,导致垂直分布代价较高,因此目前实际应用的多是水平分布,其主要有如下几种:
轮转划分。将元组轮转循环分布到各节点上。
范围划分。根据表中某一个或多个属性取值将所有元组划分成若干不相交子集后分布到各节点上。
散列划分。根据选定的函数和属性将元组散布到相应节点上。
此外,近年来由于面向对象数据库的兴起,使元组中某些属性的数据量极为庞大,关于垂直分布的研究逐渐增多。
现有并行计算方法(如专利CN1641957电力系统潮流分网并行计算方法),是将系统数据分割成若干个小数据集,分析出各个小数据集之间的关联矩阵,然后在小数据集上并行计算任务。
针对在电力行业大数据中,数据分布策略采用单一存储策略,无法达到负载均衡,影响系统运行效率,以上分布式文件系统、面向列的分布式数据库等技术具有局限性,只能在一定程度上缓解问题。上述方法没有考虑业务逻辑,虽然能达到数据存储负载均衡,但不适用于对象化并行计算系统,性能有待于进一步提升。
发明内容
本发明目的是:针对现有技术中电网信息系统中分布式文件系统的局限性,提供一种基于数据分布库的多维度数据分布方法。该方法基于多维度数据分布策略,结合业务逻辑,利用多维度数据分布策略实现负载均衡,为提升电网信息系统运行性能打下良好的基础。
具体地说,本发明是采用以下技术方案实现的,包括以下步骤:
1)分析业务逻辑,分析出业务功能和业务层使用的电力信息数据库中的表之间的逻辑关系,并分析出可用于分布的字段集合;
2)确定水平或垂直分布,根据业务分析结果,确定数据整体拆分原则,对于简单逻辑的系统可以采用垂直分布策略,对于复杂逻辑的系统采用水平分布策略;
3)确定多维度混合分布,利用业务分析结果,分析用户行为,明确查询、统计任务常用维度,然后利用数据分布库中的这些数据分布策略进行组合,将数据分成大小基本相同的数据块;
4)确定多维度分布的数据块的最细粒度,通过分析集群节点的存储空间,利用最大公约原则来确定数据块的最细粒度;所述最细粒度的数据块是不可再拆分的、最基本的数据块,以最细粒度的数据块为单位进行计算节点的存储空间;
5)实现数据分布,根据节点的可用存储空间,利用最细粒度的数据块来计算集群节点分布的数据,存储数据量。
上述技术方案的进一步特征在于:所述步骤4)中,最大公约原则是根据所有节点的存储空间数值的共有约数中最大的一个作为集群节点存储空间的最大公约数,依据这个数值作为确定数据块的最细粒度的原则。
上述技术方案的进一步特征在于:所述步骤5)中,节点的可用的存储空间计算方法按照下面公式进行:
可用空间=(物理空间-其他程序占用空间)×80%。
本发明的有益效果如下:本发明基于多维度数据分布策略,结合业务逻辑,利用多维度数据分布策略实现负载均衡,为提升电网信息系统运行性能打下良好的基础。因此,本发明能够实现高性能的数据查询与分析,满足用户对大数据处理的实时性需求
附图说明
图1为本发明数据分布库和数据分布方法关系图。
图2为本发明方法流程图。
具体实施方式
下面参照附图对本发明作进一步详细描述。
本发明基于多维度数据分布策略,结合业务逻辑,利用多维度数据分布策略,实现负载均衡,为提升系统运行性能打下良好的基础。电网信息系统数据分布库中数据分布方法主要有:
1)水平分布。水平分片是指按一定的业务逻辑关系将关系数据库中的数据按行分为若干个不相交的子集,每个子集为数据的一个片段。
2)垂直分布。垂直分布是指将关系数据库中的数据按列分为若干子集,垂直分布的片段必须能够重构原来的全局关系,即可以用连接的方式恢复原关系因此垂直分布的诸片段通常都包含关系。
3)地区分布。是指将关系数据库中的数据按照数据地区属性分成若干个子集,各个子集之间没有交集,所有子集能够重构原来的数据。比如将国网数据以省为单位进行分布,则数据分成北京、河北…,江苏等子集,每个省公司子集不包含其他省的数据,所有省的数据之和是国网公司的数据。
4)时间分布。是指将将关系数据库中的数据按照数据时间属性分成不相交的若干个子集,各个子集之间没有交集。比如:可以将国网公司的数据按照年月进行分布,2014年1月的数据为一个子集,2014年2月的数据为一个子集,以此类推。
5)电压分布。是指将关系数据库中的数据按照数据电压数据进行拆分成若干个不相交的子集,当前国网公司电压等级主要有:1000kv、500kv、…、10kv等,1000kv的数据分成一个子集,500kv的数据分为一个子集,由于线路电压不允许同时有两个值,因此,子集之间没有交集。
6)其他分布。关系数据库中的数据按照某个属性分成若干个不相交的子集,这些子集可能重构原有数据。
多维度分布策略主要有:
1)垂直或水平分布策略。垂直分布和水平分布是数据拆分的总策略,选择哪种分布要看数据之间的逻辑关系,如果数据之间关联性强,一次统计分析等任务需要多个表数据,那么数据不适合垂直分布,适合用水平分布。如果数据之间关联性不强,则适合垂直分布。
2)多维度混合分布策略。是指将数据按照多种分布方式组合进行分布,分布的原则就是达到拆分后的子集大小均衡,不能差异过大。例如将数据可以先按照地区拆分数据,不同省之间的数据量差异大,则在地区拆分的基础上进一步利用时间段拆分,如果混合分布方式拆分后的子集大小均衡,则完成拆分,否则继续混合其他分布方式,直到拆分后的子集均衡为止。
在上述多维度分布策略基础上,本发明方法的数据分布库和多维度数据分布方法关系见图1。集群系统以在对象化并行计算系统应用为例,该系统根据功能将集群中计算机分为:对象服务器、对象管理服务器、客户端代理三类。其中对象服务器负责创建对象,加载并缓存数据,管理所有对象。提供对象访问的远程接口,对内存对象的访问进行并发控制。屏蔽底层不同数据存储方式的差异,完成内存对象数据的持久化。完成内存对象数据同步,负责对象更新时事务管理。
本发明方法实施流程如图2所示,包括以下具体过程:
第一步,分析业务逻辑。业务逻辑是指电力行业内数据之间的逻辑,数据之间的关联关系依据电力业务规则构成了整个业务逻辑的动态模型。业务规则作用于领域实体,领域实体遵从业务规则进行运作。一般根据数据表组织业务模块,每个模块对应一个表,其中包含了这个表的相应处理。在业务层内,使用库-表结构的对象进行数据操作,做到最大限度与数据表的对应。分析出业务功能和数据库中的表之间的逻辑关系。简单逻辑就是一个业务功能对应一个或者两个数据库表,表之间没有关联或者仅有两个表之间有关联关系,复杂逻辑就是一个业务功能对应多个数据库表,表之间有复杂的关联关系。此外,分析出可用于分布的字段集合,即数据可用哪些字段进行拆分成若干个子集,子集之间没有交集。
第二步,确定水平或垂直分布。根据业务分析结果,确定数据整体拆分原则,对于简单逻辑的系统可以采用垂直分布策略,数据库表内能满足业务逻辑,这样数据库中每个表都可以独立成一个子集,系统运行任务时,只需调用单个子集即可满足需求,有利于提高效率。对于复杂逻辑的系统适宜采用水平分布策略,由于数据库表数据逻辑复杂,数据表之间需要关联,利用水平分布,则可以完整保留下这些逻辑关系,系统运行时,可有效避免各存储节点间迁移大量数据,提高运行效率。
第三步,确定多维度混合分布。多维度混合分布是指数据按照不同维度组合的分布策略进行分布,达到均衡的目的。分布原则是混合分布后的数据量基本相等或数据量之间差异在10%之内(经验值)。利用业务分析结果,分析用户行为,明确查询、统计等任务常用维度,例如地区、时间等。然后利用数据分布库中的这些数据分布策略进行组合,找出最佳组合。这种最佳组合可以是一种分布,也可以是多种分布混合组合。经过最佳组合分布后,数据被分成大小基本相同的数据块。
第四步,确定多维度分布的数据块的最细粒度。由于集群中节点的存储空间大小不一定相同,因此,为了最大有效地利用节点的存储空间,通过分析集群节点的存储空间,利用最大公约原则来确定数据块的最细粒度。最细粒度的数据块是不可再拆分的,最基本的数据块,节点的存储空间能存储多少数据,就以最细粒度的数据块为单位进行计算。最大公约原则是利用数学上的最大公约数方法分析获得的。最大公约数也称最大公因数、最大公因子,指两个或多个整数共有约数中最大的一个。集群节点存储空间的最大公约数就是指所有节点的存储空间数值的共有约数中最大的一个,即为最大公约数,依据这个数值作为确定数据块的最细粒度的原则。最大公约数的计算方法采用质因数分解法,该方法是把每个数分别分解质因数,再把各数中的全部公有质因数提取出来连乘,所得的积就是这几个数的最大公约数。
第五步,实现数据分布。集群节点分布的数据是根据节点的可用存储空间,利用最细粒度的数据块来计算可存储数据量。这里的可用存储空间不一定是所有物理存储空间,比如内存存储数据,假设内存物理存储空间为10G,其有效存储空间是能用来存储数据的空间,由于内存是操作系统、各种软件运行时都需要占用,因此存储数据的空间肯定比物理存储空间小(<10G),需要给节点其他软件预留出足够的内存空间,剩余空间就是可用的存储数据的空间。可用的存储空间计算方法按照下面公式进行:
可用空间=(物理空间-其他程序占用空间)×80%。
上面公式中的80%是经验值,预留出一定空间用于数据交换,便于提高运行效率。根据集群节点的可用空间,可以将数据均衡分布在集群节点存储空间中。
对象化并行计算系统借助于上述方法,可将系统数据结合业务逻辑均衡分布在集群内存中,为提高系统运行效率打下良好的基础。
虽然本发明已以较佳实施例公开如上,但实施例并不是用来限定本发明的。在不脱离本发明之精神和范围内,所做的任何等效变化或润饰,同样属于本发明之保护范围。因此本发明的保护范围应当以本申请的权利要求所界定的内容为标准。

Claims (2)

1.一种基于数据分布库的多维度数据分布方法,基于集群系统实现,其特征在于,包括以下步骤:
1)分析业务逻辑,分析出业务功能和业务层使用的电力信息数据库中的表之间的逻辑关系,并分析出可用于分布的字段集合;所述业务逻辑是指电力行业内数据之间的逻辑,所述电力信息数据库中的表之间的逻辑关系包括简单逻辑与复杂逻辑,简单逻辑指一个业务功能对应一个或者两个数据库表,表之间没有关联或者仅有两个表之间有关联关系,复杂逻辑指一个业务功能对应多个数据库表,表之间有复杂的关联关系;
2)确定水平或垂直分布,根据业务分析结果,确定数据整体拆分原则,对于简单逻辑的系统采用垂直分布策略,使数据库中每个表都独立成一个子集,对于复杂逻辑的系统采用水平分布策略,完整保留数据库表数据逻辑关系;
3)确定多维度混合分布,利用业务分析结果,分析用户行为,明确查询、统计任务常用维度,然后利用数据分布库中的数据分布策略进行组合,所述数据分布策略包括地区分布、时间分布、电压分布及其他分布,将数据分成大小基本相同的数据块;所述多维度混合分布是指数据按照不同维度组合的数据分布策略进行分布,采用的分布原则是让混合分布后的数据量基本相等或数据量之间差异在10%之内;
所述地区分布,是指将关系数据库中的数据按照数据地区属性分成若干个子集,各个子集之间没有交集;
所述时间分布,是指将关系数据库中的数据按照数据时间属性分成不相交的若干个子集,各个子集之间没有交集;
所述电压分布,是指将关系数据库中的数据按照电压数据进行拆分成若干个不相交的子集;
所述其他分布,是指关系数据库中的数据按照其他属性分成若干个不相交的子集;
4)确定多维度分布的数据块的最细粒度,通过分析集群节点的存储空间,利用最大公约原则来确定数据块的最细粒度,所述最大公约原则是根据所有集群节点的存储空间数值的共有约数中最大的一个作为集群节点存储空间的最大公约数,依据这个数值作为确定数据块的最细粒度的原则;所述最细粒度的数据块是不可再拆分的、最基本的数据块,以最细粒度的数据块为单位进行计算集群节点的存储空间;
5)实现数据分布,根据集群节点的内存可用存储空间,利用最细粒度的数据块来计算集群节点分布的数据,存储数据量,将系统数据结合业务逻辑均衡分布在集群内存中。
2.根据权利要求1所述的基于数据分布库的多维度数据分布方法,其特征在于,所述步骤5)中,集群节点的内存可用的存储空间计算方法按照下面公式进行:
可用空间=(物理空间-其他程序占用空间)× 80%。
CN201410700945.4A 2014-11-28 2014-11-28 一种基于数据分布库的多维度数据分布方法 Active CN104376109B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410700945.4A CN104376109B (zh) 2014-11-28 2014-11-28 一种基于数据分布库的多维度数据分布方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410700945.4A CN104376109B (zh) 2014-11-28 2014-11-28 一种基于数据分布库的多维度数据分布方法

Publications (2)

Publication Number Publication Date
CN104376109A CN104376109A (zh) 2015-02-25
CN104376109B true CN104376109B (zh) 2018-09-14

Family

ID=52555016

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410700945.4A Active CN104376109B (zh) 2014-11-28 2014-11-28 一种基于数据分布库的多维度数据分布方法

Country Status (1)

Country Link
CN (1) CN104376109B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105138638A (zh) * 2015-08-24 2015-12-09 浪潮通用软件有限公司 一种基于应用层的数据库分布方法
CN105138686B (zh) * 2015-09-17 2018-09-28 国家电网公司 一种用于多级存储数据的即时应用方法
CN107870829B (zh) * 2016-09-24 2022-03-08 华为技术有限公司 一种分布式数据恢复方法、服务器、相关设备及系统
CN110019396B (zh) * 2017-12-01 2023-02-17 中国移动通信集团广东有限公司 一种基于分布式多维分析的数据分析系统及方法
CN110222013B (zh) * 2019-06-11 2023-05-12 深信服科技股份有限公司 一种集群存储容量确定的方法、系统、设备及存储介质
CN110347343B (zh) * 2019-07-16 2020-09-18 珠海格力电器股份有限公司 数据管理方法和装置
CN111241195B (zh) * 2020-01-02 2023-03-21 腾讯云计算(北京)有限责任公司 分布式系统的数据库处理方法、装置、设备及存储介质
CN114328755B (zh) * 2022-03-10 2022-08-05 北京金山云网络技术有限公司 一种数据写入方法、数据读取方法、装置及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103095806A (zh) * 2012-12-20 2013-05-08 中国电力科学研究院 一种面向大电网的实时数据库系统的负载均衡管理系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103095806A (zh) * 2012-12-20 2013-05-08 中国电力科学研究院 一种面向大电网的实时数据库系统的负载均衡管理系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向对象数据库的分割模式及分割算法综述;姜誉等;《计算机研究与发展》;20000630;第37卷(第6期);第642页第15-25行 *

Also Published As

Publication number Publication date
CN104376109A (zh) 2015-02-25

Similar Documents

Publication Publication Date Title
CN104376109B (zh) 一种基于数据分布库的多维度数据分布方法
US8762407B2 (en) Concurrent OLAP-oriented database query processing method
Liao et al. Multi-dimensional index on hadoop distributed file system
US8660985B2 (en) Multi-dimensional OLAP query processing method oriented to column store data warehouse
US20120011144A1 (en) Aggregation in parallel computation environments with shared memory
Dehdouh et al. Columnar nosql star schema benchmark
Wang et al. Supporting a light-weight data management layer over hdf5
WO2013155751A1 (zh) 面向并发olap的数据库查询处理方法
Dehne et al. Scalable real-time OLAP on cloud architectures
Li et al. SCALLA: A platform for scalable one-pass analytics using MapReduce
Dehne et al. The cgmCUBE project: Optimizing parallel data cube generation for ROLAP
EP2469423B1 (en) Aggregation in parallel computation environments with shared memory
Hsieh et al. SQLMR: A scalable database management system for cloud computing
Pirzadeh et al. Performance evaluation of range queries in key value stores
KR101400214B1 (ko) Hybrid C 인터페이스를 지원하는 장치
Wang et al. A mapreducemerge-based data cube construction method
Lu et al. An efficient and compact indexing scheme for large-scale data store
Weidner et al. Fast OLAP query execution in main memory on large data in a cluster
US20160098471A1 (en) Fast OLAP Query Execution in Main Memory on Large Data in a Cluster
Li et al. Small files problem in parallel file system
CN108932258A (zh) 数据索引处理方法及装置
Dehne et al. Parallelizing the data cube
Arnaut et al. Phoenix: A relational storage component for the cloud
Guzun et al. A two-phase mapreduce algorithm for scalable preference queries over high-dimensional data
Chen et al. PnP: sequential, external memory, and parallel iceberg cube computation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
CB03 Change of inventor or designer information

Inventor after: Yang Zhi

Inventor after: Wang Honggang

Inventor after: Zhang Mingming

Inventor after: Huang Gaopan

Inventor after: Zhang Chunping

Inventor after: Hu Mu

Inventor after: Lin Feng

Inventor after: Zhang Qiping

Inventor after: Tian Hongxun

Inventor after: Zhang Jiangong

Inventor after: Hu Qinghui

Inventor after: Shen Li

Inventor before: Yang Zhi

Inventor before: Zhang Chunping

Inventor before: Hu Mu

Inventor before: Lin Feng

COR Change of bibliographic data
TA01 Transfer of patent application right

Effective date of registration: 20160205

Address after: 100031 Xicheng District West Chang'an Avenue, No. 86, Beijing

Applicant after: State Grid Corporation of China

Applicant after: Nanjing Nari Co., Ltd.

Applicant after: NANJING NARI INFORMATION COMMUNICATION SCIENCE & TECHNOLOGY CO., LTD.

Applicant after: Information & Telecommunication Branch of State Grid Jiangsu Electric Power Company

Address before: 100031 Xicheng District West Chang'an Avenue, No. 86, Beijing

Applicant before: State Grid Corporation of China

Applicant before: Nanjing Nari Co., Ltd.

Applicant before: NANJING NARI INFORMATION COMMUNICATION SCIENCE & TECHNOLOGY CO., LTD.

GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 100031 Xicheng District West Chang'an Avenue, No. 86, Beijing

Co-patentee after: NARI Group Corp.

Patentee after: State Grid Corporation of China

Co-patentee after: NARI INFORMATION AND COMMUNICATION TECHNOLOGY Co.

Co-patentee after: INFORMATION & TELECOMMUNICATION BRANCH OF STATE GRID JIANGSU ELECTRIC POWER Co.

Address before: 100031 Xicheng District West Chang'an Avenue, No. 86, Beijing

Co-patentee before: Nanjing Nanrui Group Co.

Patentee before: State Grid Corporation of China

Co-patentee before: NARI INFORMATION AND COMMUNICATION TECHNOLOGY Co.

Co-patentee before: INFORMATION & TELECOMMUNICATION BRANCH OF STATE GRID JIANGSU ELECTRIC POWER Co.

CP01 Change in the name or title of a patent holder