CN101916261A - 一种分布式并行数据库系统的数据分区方法 - Google Patents

一种分布式并行数据库系统的数据分区方法 Download PDF

Info

Publication number
CN101916261A
CN101916261A CN2010102396560A CN201010239656A CN101916261A CN 101916261 A CN101916261 A CN 101916261A CN 2010102396560 A CN2010102396560 A CN 2010102396560A CN 201010239656 A CN201010239656 A CN 201010239656A CN 101916261 A CN101916261 A CN 101916261A
Authority
CN
China
Prior art keywords
node
data
record
dimension table
database system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010102396560A
Other languages
English (en)
Other versions
CN101916261B (zh
Inventor
张卫平
张松波
刘为怀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Borqs Beijing Ltd.
Wuhan Borqs Technology Co., Ltd.
Beijing Borqs Software Technology Co Ltd
Original Assignee
Beijing Borqs Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Borqs Software Technology Co Ltd filed Critical Beijing Borqs Software Technology Co Ltd
Priority to CN2010102396560A priority Critical patent/CN101916261B/zh
Priority to PCT/CN2010/077565 priority patent/WO2012012968A1/zh
Publication of CN101916261A publication Critical patent/CN101916261A/zh
Priority to US13/325,810 priority patent/US20120109888A1/en
Application granted granted Critical
Publication of CN101916261B publication Critical patent/CN101916261B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/278Data partitioning, e.g. horizontal or vertical partitioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种分布式并行数据库系统的数据分区方法,包括以下步骤:根据构建的分布式并行数据库系统,创建事实表和维度表;根据分区规则将维度表和事实表纪录插入到不同节点上;将维度表纪录复制到事实表的节点上;对数据进行删除和更新处理。本发明在对数据集或数据流分区导入或插入分布式数据库系统时,能在每一个节点,满足数据库方案所定义的表间关系,特别是主-外键约束条件,使每一个节点上的数据,具有数据的局部完备性。对于利用主-外键约束条件进行表间连接的查询处理,由于各节点的数据对这类查询具有局部完备性,不需要在节点间做数据动态再分区,避免了数据的网络传输耗时,降低查询响应时间,提高查询效率。

Description

一种分布式并行数据库系统的数据分区方法
技术领域
本发明涉及一种分布式并行数据库系统,尤其涉及一种分布式并行数据库系统的数据分区方法。
背景技术
将数据存储在数据库中是常用的数据管理方法,特别是存储在关系型数据库中。我们可以根据所要管理的数据需求,选择成熟的数据库管理系统(DBMS:Database Management System),用标准的数据定义语言(如SQL DDL),定义包含数据表(Table)或关系(Relation)、数据结构、索引、主键(Primary Key)和外键(Foreign Key)等信息的数据库数据管理方案(Database Schema),部署数据库系统。而应用程序根据DBMS提供的数据操作语言(如SQL DML),可以进行数据操作,如插入、查询、更新、导入和导出等。
当前许多行业应用,产生和累积的数据量非常巨大,例如物联网感知数据(Sensor Data)、金融交易数据(Transaction Data)、电子商务商品数据(GoodsData)、公司销售数据(Sales Data)等数据集(Data Set)。这些数据集可能会达到几百TBs(TeraBytes)或PBs(PetaBytes)这样海量的规模,而且随着时间的增长和业务的发展,产生数据的速度也可能会不断提高。对这些海量数据的操作效率,如查询速度,提出了更高的要求。
对于海量数据的管理,单节点的数据库系统,受其计算或存储能力的局限,已经不能胜任。分布式并行结构或极大规模并行处理(MPP:Massively ParallelProcessing)结构的数据库或数据仓库系统可以提供更好的容量和性能方面的伸缩性和扩展性。其中的多节点无共享集群(Shared-nothing Cluster)架构已被证实具有管理大规模数据的优势。
无共享(Shared-nothing)多节点分布式并行数据库系统架构图如图1所示,前端服务器实现一个全局分区器(Partitioner),它将各个数据表按照某种规则(如按各数据表特定属性域的HASH值或时间段等)进行分区(Partitioning)或分片(Sharding),将数据分布存储在多个不同的存储和处理节点上(如图中的节点1~节点N),并由每个节点上运行的本地数据库实例(Local Database Instance),来管理根据分区器分配到该节点上的数据分区或分片;同时,一个运行在前端服务器上的全局优化查询器(Global Querier),对应用发起的特定查询(Query),进行分析,并发送(Dispatch)给各节点数据库系统实例,由各节点上的本地查询器(Local Querier)来处理,然后将结果返回给全局查询器,进行进一步的处理,如合并(Merge)和排序(Sort)等操作,最后将结果返回给相应的应用。
分区器在对各数据表进行划分时,采用诸如轮转划分(Round RobinPartitioning)、散列划分(Hash Partitioning)、范围划分(Range Partitioning)和链表划分(List Partitioning)等分区方法,将数据发送给相应的节点。由于采用的分区方法单独作用于各个数据表,因此,对于针对多个数据表的较复杂的关联查询时,特别是涉及多表间连接(Join)操作的查询,全局查询器无论根据Join查询判断式(Predicate)所涉及的任何一个表的分区信息,将查询发送给各分区所对应的节点上的局部查询器处理时,对于Join判断式所涉及的其他表,各节点都要从其他节点上的分区拷贝搬运数据。这种查询时的节点间数据搬运也称作动态再分区(Dynamic Repartitioning),不仅会消耗网络带宽,也会产生传输耗时,极大地增加查询的响应时间,影响查询效率。
发明内容
为了解决现有技术存在的不足,本发明的目的在于提供一种分布式并行数据库系统的数据分区方法,消除查询时节点间数据的拷贝和搬运,提高查询响应速度和效率。
为实现上述目的,本发明提供的一种分布式并行数据库系统的数据分区方法,该方法包括以下步骤:
根据构建的分布式并行数据库系统及分布规则,创建事实表和维度表,并将所述事实表纪录和维度表纪录插入到节点上;
将维度表纪录复制到事实表的节点上;
对数据进行删除和更新。
本发明在对数据集或数据流分区导入或插入分布式数据库系统时,能在每一个节点,满足数据库方案所定义的表间关系,特别是主-外键约束条件,使每一个节点上的数据,具有数据的局部完备性。对于利用主-外键约束条件进行表间连接的查询处理,由于各节点的数据对这类查询具有局部完备性,不需要在节点间做数据动态再分区,避免了数据的网络传输耗时,降低查询响应时间,提高查询效率。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,并与本发明的实施例一起,用于解释本发明,并不构成对本发明的限制。在附图中:
图1为现有技术中无共享多节点分布式并行数据库系统架构图;
图2为根据本发明的分布式并行数据库系统的数据分区方法流程图;
图3为根据本发明的事实表和维度表关联图;
图4为根据本发明的划分成单一星型后的数据表关系图;
图5为根据本发明的维度表纪录插入后数据分布图;
图6为根据本发明的事实表纪录插入后数据分布情况示意图;
图7为根据本发明的Bloom Filter位数组初始值示意图;
图8为根据本发明的根据x的哈希函数值设置位数组示意图;
图9为根据本发明的判断y是否属于集合示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
在构建数据库系统或以分布式数据库为基础构建的数据仓库时,一般总是将实际的事实数据和用于描述属性的数据用不同的表分隔,实际的事实数据存放于一类被称为事实表(Fact table)的表中,而从不同角度来描述属性的数据则放到不同的维度表(Dimension table)中。比如,一个Sales数据库或数据仓库可以这样设计,每一笔销售记录,应该会包含销售的产品,销售的客户,产品的供货商,销售的时间,销售的数量和获得的收入等。对于销售的数量和金额这类具体的数字型的数据,通常是系统要分析的对象,而对于像时间,产品,客户,供货商,我们往往希望从这些不同的角度来得到数字型数据的一个统计结果。所以,一般将数字型的数据存放在事实表中,将时间、产品、客户、供货商存放在不同的维度表中。自然,在维度表和事实表之间存在一个主-外键的关联,各个维度表之间则没有关系。
以类似上述的方式来建模数据库系统关系和属性的方式,由于它将不同的数据表分为维度表和事实表,并以主-外键相关联,拓扑上,事实表处于中间的位置,维度表则绕事实表围成一圈,形似一颗星,所以被称数据库系统的星形模型(Star Schema)。事实表中除了区分每条纪录的外键(关联维度表的主键)外,就只有我们关心的数字型数据,所以事实表中的每条纪录,有个专门的术语称之为度量(Measurement),因为我们利用数据库或数据仓库做统计分析的时候,这些数据就是统计分析的一个个基本单位,也就是度量值。我们知道,在数据库系统查询和分析中,一般的查询处理,总是基于对度量即事实表度量的分析和处理展开进行的,即在查询的判断式中,总是含有涉及事实表的判断式。
星型模型是数据库系统或数据仓库建模关系和数据的最主要的模型。另外,从星型模型中衍生出来主要有雪花模型(Snowflake Schema)。雪花模型就是在星形模型的基础上,对维度表做规范化后得到的模型。由于每个维度表规范化可能得到一个星形拓扑或多级的星形拓扑,使整个模型拓扑上形似雪花,所以称为雪花模型。雪花模型比起星模型就更加复杂,查询的时候也需要关联更多的表。
图2为根据本发明的分布式并行数据库系统的数据分区方法流程图,下面将参考图2,对本发明的分布式并行数据库系统的数据分区方法进行详细描述:
首先,在步骤201,根据所要管理的数据性质以及节点数,构建分布式并行数据库系统。例如,在销售数据库或数据仓库中,构建的数据表包含有销售的产品,销售的客户,产品的供货商,销售的时间,销售的数量和获得的收入等数据;
在步骤202,创建事实表和维度表。创建用于存放实际的事实数据的事实表,定义该事实表的主键和外键,并将事实数据的纪录插入到该事实表,该事实数据如上述Sales数据库或数据仓库中销售的数量和获得的收入这类具体的数字型的数据;创建用于存放从不同角度来描述属性的数据的维度表,定义该维度表的主键,并将描述属性的数据的纪录插入到该维度表中,描述属性的数据如上述Sales数据库或数据仓库中的时间、产品、客户、供货商等数据;利用事实表的外键与维度表的主键,对事实表和维度表进行关联。图3为根据本发明的事实表和维度表关联图,如图3所示,Table1和Table2定义为事实表,Table3、Table4和Table5定义为维度表。Table1的外键Field11关联Talbe3的主键ID3,Table1的外键Field12和Table2的外键Field21均关联Talbe4的主键ID4,Table2的外键Field22关联Talbe5的主键ID5;
图4为根据本发明的划分成单一星型后的数据表关系图,如图4所示,根据图3的事实表和维度表关联图,把维度表Table4划分成逻辑的2张表,形成2个单一的星型结构,维度表Table4在物理上仍然是一张表;
在步骤203,将事实表纪录和维度表纪录插入到节点上。在本步骤中是按照分区策略,将事实表纪录和维度表纪录插入到不同的节点上;
在步骤204,复制维度表纪录。事实表的纪录插入完成后,为了保证数据的局部完备性,将该事实表的纪录外键关联的维度表的纪录,复制到本节点。这样,表间连接(Join)生成连接表的时候,不需要搬运其他节点的数据,减少网络开销。
确定将维度表的纪录复制到事实表的节点上的方法是:首先要确定的是,事实表的外键所关联的维度表才需要复制;其次,该新插入纪录中的外键所关联的维度表中的纪录,需要复制到该事实表纪录的同一个节点上。例如,事实表的纪录的外键值为X,那么需要将维度表中主键值为X的纪录复制到本节点。如果事实表的纪录有多个外键,需要将每个外键关联的维度表的纪录复制过来。由于分区一般是以表的主键作为关键字,所以根据事实表外键的值(也就是维度表主键值),能够很容易找到维度表中需要的纪录位于哪个节点上。
图5为根据本发明的维度表纪录插入后数据分布图,如图5所示,以图4中的Table1、Table3和Table4这一星型为例,在维度表(Table3和Table4)纪录插入后,各节点上的数据分布情况,从图5可以看出,在事实表纪录插入之前,维度表的纪录在各节点上是不重叠的(Non-Overlap)。
图6为根据本发明的事实表纪录插入后数据分布情况示意图,如图6所示,在节点1插入一条Table1的纪录,其Field11(值为2)和Field12(值为3)所关联的Table3和Table4的纪录(分别为ID3=2和ID4=3)在节点1上不存在,所以需要分别从节点2和节点3复制过来;
在节点2插入一条Table1的纪录,其Field11(值为2)所关联的Table3的纪录(ID3=2)在节点2上已经存在,不需要复制。而Field12(值为1)所关联的Table4的纪录(ID4=1)在节点2上不存在,所以需要从节点1复制过来;
在节点3插入一条Table1的纪录,其Field11(值为3)和Field12(值为3)所关联的Table3和Table4的纪录(分别为ID3=3和ID4=3)在节点3上都已经存在,所以不需要复制。
我们可以看出,在事实表纪录插入后,维度表纪录可能在不同节点上产生重叠(Overlap),而事实表纪录是不重叠的(Non-Overlap)。我们把某个纪录按照初始分区策略划分的节点称为该纪录的主节点(Primary Node),而维度表纪录为保持局部完备性复制过去的节点称为该纪录的备份节点(Backup Node)。
上述方法,对于大量涉及到Join的查询操作,系统能够快速获取到外键关联的纪录,因为在同一节点已存储了这些关联的纪录,不需要每次都进行数据搬运,从而提高查询效率;
对于维度表的查询操作,先由前端服务器将查询请求发送到每个节点,每个节点获取本节点的纪录,然后返回给前端服务器进行汇总。由于维度表纪录可能在不同节点上产生重叠,所以前端服务器收到的维度表纪录可能会重复。解决这个问题的方法可以在前端服务器上过滤掉重复的纪录;也可以在单个节点上,对纪录区分主节点和备份节点,过滤掉备份节点的纪录;
在步骤205,数据的删除处理。删除事实表中的纪录,在事实表中的纪录被删除后,如果关联的维度表的纪录不再被其他事实表关联,则需要删除本节点上关联的维度表纪录(主节点的纪录不删除);维度表中纪录的删除,只需要删除主节点上的纪录。因为删除维度表纪录之前,需要先删除事实表纪录,而在删除事实表纪录的时候,已经删除那个节点上维度表纪录;
在步骤206,数据的更新处理。事实表中纪录更新后,如果涉及到外键的更新,需要先删除旧的维度表纪录(主节点的纪录以及被其他事实表关联的纪录不删除),再复制新的维度表纪录;维度表中纪录的更新,除了要更新主节点的纪录外,还需要更新备份节点的纪录。更新维度表纪录的一种实现方法是搜索所有节点的事实表,查看事实表中是否存在外键等于要更新的维度表纪录的主键,如果存在,则更新该节点上维度表的相关纪录。这种方式需要遍历所有节点的事实表,将消耗较长的时间;更新维度表纪录的一种优化的实现方法是针对每个维度表和每个节点,建立一个布隆过滤器(Bloom Filter)表,记录维度表纪录在节点上的分布情况,从而轻易找到保存某条指定纪录的节点。
布隆过滤器(Bloom Filter)是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。BloomFilter的这种高效是有一定代价的:在判断一个元素是否属于某个集合时,有可能会把不属于这个集合的元素误认为属于这个集合(False Positive)。因此,Bloom Filter不适合那些“零错误”的应用场合。而在能容忍低错误率的应用场合下,Bloom Filter通过极少的错误换取了存储空间的极大节省。
下面我们具体来看Bloom Filter是如何用位数组表示集合的。图7为根据本发明的Bloom Filter位数组初始值示意图,如图7所示,初始状态时,BloomFilter是一个包含m位的位数组,每一位都置为0。
为了表达S={x1,x2,…,xn}这样一个n个元素的集合,Bloom Filter使用k个相互独立的哈希函数(Hash Function),它们分别将集合中的每个元素映射到{1,…,m}的范围中。对任意一个元素x,第f个哈希函数映射的位置hf(x)就会被置为1(1≤f≤k)。注意,如果一个位置多次被置为1,那么只有第一次会起作用,后面几次将没有任何效果。图8为根据本发明的根据x的哈希函数值设置位数组示意图,如图8所示,在图8中,k=3,且有两个哈希函数选中同一个位置(从左边数第七位)。
在判断y是否属于这个集合时,我们对y应用k次哈希函数,如果所有hf(y)的位置都是1(1≤f≤k),那么我们就认为y是集合中的元素,否则就认为y不是集合中的元素。图9为根据本发明的判断y是否属于集合示意图,如图9所示,在图9中y1就不是集合中的元素,而y2要么属于这个集合,要么刚好是一个False Positive。
在计算机科学中,我们常常会碰到时间换空间或者空间换时间的情况,即为了达到某一个方面的最优而牺牲另一个方面。Bloom Filter在时间空间这两个因素之外又引入了另一个因素:错误率。在使用Bloom Filter判断一个元素是否属于某个集合时,会有一定的错误率。也就是说,有可能把不属于这个集合的元素误认为属于这个集合(False Positive),但不会把属于这个集合的元素误认为不属于这个集合(False Negative)。在增加了错误率这个因素之后,BloomFilter通过允许少量的错误来节省大量的存储空间。
本发明中,将每张维度表在每个节点上的纪录分布情况记录在一个BloomFilter表中,维度表的主键(Primary Key)作为Bloom Filter表的查询关键字,Bloom Filter表数量=(维度表数量×节点数量)。如果Bloom Filter发生错误(False Positive),产生的后果是试图更新一个节点上维度表纪录,但是这个节点上却没有保存这条纪录。这种错误不会影响数据的正确性和一致性,它是可以被容忍的。而且只要哈希算法和位数组的长度选择得当,这种错误率将非常低。
这些Bloom Filter表可以存储在前端服务器上,作为一个全局数据集;也可以分布存储在每个节点上,各节点负责记录本节点上维度表纪录的分布情况。由于Bloom Filter表占用的空间很小,在实现中,可以预先载入内存,以提高查询速度。
本发明的数据分区方法可以应用于涉及到大量关联表Join的查询操作的分布式数据库系统,例如在商品数据管理中,用户往往需要根据商品种类进行分类,根据价格进行排序等。运用本发明,我们可以将商品种类和价格定义在事实表中,另外定义一些外键关联维度表,如卖家,生产厂商等。事实表纪录插入的时候,将关联的维度表纪录复制到同一节点。在进行种类/价格/卖家/生产厂商等关联表的连接查询(Join)的时候,前端服务器把查询发送给每个节点,每个节点就可以进行这种Join操作,不需要到其他节点搬运数据,大大提高查询效率。各节点把各自的处理结果返回给全局查询器做汇总就可以了。
而在销售数据管理中,我们可以将销售额、利润值等定义在事实表中,将客户、销售时间等定义为维度表,并以主外键关联事实表。事实表纪录插入的时候,将关联的维度表纪录复制到同一节点。在对某一客户的销售额进行统计的时候,由前端服务器将统计工作分发到各节点。每个节点依靠所保存的信息,可以轻易判断事实表销售纪录是否属于该客户,因为本节点上已经存在该客户信息,从而可以很轻松地完成本节点的统计工作,最后发送给前端服务器汇总。
本领域普通技术人员可以理解:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种分布式并行数据库系统的数据分区方法,该方法包括以下步骤:
根据构建的分布式并行数据库系统及分布规则,创建事实表和维度表,并将所述事实表纪录和维度表纪录插入到节点上;
将维度表纪录复制到事实表的节点上;
对数据进行删除和更新处理。
2.根据权利要求1所述的分布式并行数据库系统的数据分区方法,其特征在于,所述事实表包含主键、外键和事实表纪录。
3.根据权利要求1所述的分布式并行数据库系统的数据分区方法,其特征在于,所述维度表包含主键和维度表纪录。
4.根据权利要求1所述的分布式并行数据库系统的数据分区方法,其特征在于,所述事实表和维度表是通过主-键外键进行关联,事实表的外键值与其关联的维度表的主键值相等。
5.根据权利要求1所述的分布式并行数据库系统的数据分区方法,其特征在于,所述将事实表纪录和维度表纪录插入到节点上是将所述事实表纪录和维度表纪录插入到不同节点上。
6.根据权利要求1所述的分布式并行数据库系统的数据分区方法,其特征在于,所述将维度表纪录复制到事实表的节点上的步骤进一步包括:
根据事实表的外键确定关联的维度表;
将事实表外键所关联的维度表中的纪录,复制到所述事实表的节点上。
7.根据权利要求1所述的分布式并行数据库系统的数据分区方法,其特征在于,所述对数据进行删除处理进一步包括以下步骤:
删除事实表中的纪录;
删除该节点中事实表关联的维度表纪录;
不删除主节点维度表中的纪录。
8.根据权利要求1所述的分布式并行数据库系统的数据分区方法,其特征在于,所述对数据进行更新处理进一步包括以下步骤:
更新某一节点的维度表;
查找与该维度表关联的事实表;
更新所述事实表节点上与其关联的维度表。
9.根据权利要求1所述的分布式并行数据库系统的数据分区方法,其特征在于,所述对数据的更新是针对每个维度表和每个节点,建立一个布隆过滤器表记录维度表纪录在节点上的分布情况,找到保存某条指定纪录的节点并对该节点上的维度表进行更新。
10.根据权利要求9所述的分布式并行数据库系统的数据分区方法,其特征在于,所述布隆过滤器表存储在前端服务器或每个节点上。
CN2010102396560A 2010-07-28 2010-07-28 一种分布式并行数据库系统的数据分区方法 Active CN101916261B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN2010102396560A CN101916261B (zh) 2010-07-28 2010-07-28 一种分布式并行数据库系统的数据分区方法
PCT/CN2010/077565 WO2012012968A1 (zh) 2010-07-28 2010-10-01 一种分布式并行数据库系统的数据分区方法
US13/325,810 US20120109888A1 (en) 2010-07-28 2011-12-14 Data partitioning method of distributed parallel database system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102396560A CN101916261B (zh) 2010-07-28 2010-07-28 一种分布式并行数据库系统的数据分区方法

Publications (2)

Publication Number Publication Date
CN101916261A true CN101916261A (zh) 2010-12-15
CN101916261B CN101916261B (zh) 2013-07-17

Family

ID=43323773

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102396560A Active CN101916261B (zh) 2010-07-28 2010-07-28 一种分布式并行数据库系统的数据分区方法

Country Status (3)

Country Link
US (1) US20120109888A1 (zh)
CN (1) CN101916261B (zh)
WO (1) WO2012012968A1 (zh)

Cited By (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102043726A (zh) * 2010-12-29 2011-05-04 北京播思软件技术有限公司 一种大规模时序数据的存储管理方法
CN102662968A (zh) * 2012-03-09 2012-09-12 浪潮通信信息系统有限公司 一种对于Oracle大数据量存储的优化方法
CN103186651A (zh) * 2011-12-31 2013-07-03 中国移动通信集团公司 一种分布式关系数据库及其建立、查询方法和装置
CN103309902A (zh) * 2012-03-16 2013-09-18 多玩娱乐信息技术(北京)有限公司 一种社交网络中用户信息存储和查找的方法和装置
CN103384878A (zh) * 2011-02-25 2013-11-06 数创株式会社 分布式数据库系统和分布式数据库的数据结构
CN103412897A (zh) * 2013-07-25 2013-11-27 中国科学院软件研究所 一种基于分布式结构的并行数据处理方法
CN103488645A (zh) * 2012-06-13 2014-01-01 镇江华扬信息科技有限公司 一种用于物联网数据更新的结构设计方法
WO2014015492A1 (zh) * 2012-07-26 2014-01-30 华为技术有限公司 数据分布的方法、装置及系统
WO2014059927A1 (en) * 2012-10-16 2014-04-24 Huawei Technologies Co., Ltd. System and Method for Flexible Distributed Massively Parallel Processing (MPP)
CN103782293A (zh) * 2011-08-26 2014-05-07 惠普发展公司,有限责任合伙企业 用于数据分区的多维集群
WO2014067449A1 (en) * 2012-10-29 2014-05-08 Huawei Technologies Co., Ltd. System and method for flexible distributed massively parallel processing (mpp) database
CN103838787A (zh) * 2012-11-27 2014-06-04 阿里巴巴集团控股有限公司 一种对分布式数据仓库进行更新的方法和设备
US8799284B2 (en) 2012-11-30 2014-08-05 Futurewei Technologies, Inc. Method for automated scaling of a massive parallel processing (MPP) database
CN104077724A (zh) * 2013-03-28 2014-10-01 北京东方道迩信息技术股份有限公司 一种面向物联网综合应用的基础空间信息架构方法
WO2014154016A1 (zh) * 2013-03-29 2014-10-02 深圳市并行科技有限公司 并行数据库管理系统及设计方案
WO2015021828A1 (zh) * 2013-08-16 2015-02-19 华为技术有限公司 分布式数据库的数据存储方法和装置
CN104391948A (zh) * 2014-12-01 2015-03-04 广东电网有限责任公司清远供电局 数据仓库的数据标准化构建方法及系统
CN104794249A (zh) * 2015-05-15 2015-07-22 乐得科技有限公司 一种数据库的实现方法和设备
CN104871153A (zh) * 2012-10-29 2015-08-26 华为技术有限公司 用于灵活的分布式大规模并行处理(mpp)数据库的系统和方法
WO2015123809A1 (zh) * 2014-02-18 2015-08-27 华为技术有限公司 一种数据表的导入方法、数据管理器以及服务器
CN105517644A (zh) * 2014-03-05 2016-04-20 华为技术有限公司 一种数据分区方法和设备
CN105740365A (zh) * 2016-01-27 2016-07-06 北京掌阔移动传媒科技有限公司 一种数据仓库快速查询方法和装置
WO2016107497A1 (en) * 2014-12-31 2016-07-07 Huawei Technologies Co., Ltd. Method and apparatus for scalable sorting of data set
CN105874453A (zh) * 2013-12-30 2016-08-17 微软技术许可有限责任公司 为多承租者数据库提供一致的承租者体验
WO2016165525A1 (zh) * 2015-04-16 2016-10-20 华为技术有限公司 在跨分区数据库中查询数据的方法及跨分区查询装置
WO2016191995A1 (zh) * 2015-05-31 2016-12-08 华为技术有限公司 一种分布式数据库中关联表分区的方法和设备
CN103186651B (zh) * 2011-12-31 2016-12-14 中国移动通信集团公司 一种分布式关系数据库及其建立、查询方法和装置
CN107066495A (zh) * 2016-12-29 2017-08-18 北京瑞卓喜投科技发展有限公司 沿纵向拓展的区块链的生成方法及系统
CN107229635A (zh) * 2016-03-24 2017-10-03 华为技术有限公司 一种数据处理的方法、存储节点及协调节点
WO2018010527A1 (zh) * 2016-07-13 2018-01-18 腾讯科技(深圳)有限公司 数据处理方法、装置、系统及存储介质
US9875263B2 (en) 2014-10-21 2018-01-23 Microsoft Technology Licensing, Llc Composite partition functions
CN107735781A (zh) * 2015-01-14 2018-02-23 华为技术有限公司 存储查询结果的方法和装置、计算设备
CN108205571A (zh) * 2016-12-20 2018-06-26 航天信息股份有限公司 键值数据表的连接方法及装置
CN108482429A (zh) * 2018-03-09 2018-09-04 南京南瑞继保电气有限公司 一种轨道交通综合监控系统架构
CN109299191A (zh) * 2018-09-18 2019-02-01 新华三大数据技术有限公司 一种数据分布方法、装置、服务器及计算机存储介质
CN109388638A (zh) * 2012-10-29 2019-02-26 华为技术有限公司 用于分布式大规模并行处理数据库的方法及系统
CN109871415A (zh) * 2019-01-21 2019-06-11 武汉光谷信息技术股份有限公司 一种基于图数据库的用户画像构建方法、系统及存储介质
CN110019544A (zh) * 2017-09-30 2019-07-16 北京国双科技有限公司 数据查询方法及系统
CN110109951A (zh) * 2017-12-29 2019-08-09 华为软件技术有限公司 一种关联查询的方法、数据库应用系统及服务器
CN110168517A (zh) * 2016-12-15 2019-08-23 华为技术有限公司 用于自适应分区数据以加快分布式并行数据库系统中连接查询的系统和方法
US10574752B2 (en) 2014-01-26 2020-02-25 Huawei Technologies Co., Ltd. Distributed data storage method, apparatus, and system
WO2020042813A1 (zh) * 2018-08-31 2020-03-05 阿里巴巴集团控股有限公司 一种分布式数据连接处理方法、装置、设备及存储介质
CN111522641A (zh) * 2020-04-21 2020-08-11 北京嘀嘀无限科技发展有限公司 任务调度方法、装置、计算机设备和存储介质
CN112256698A (zh) * 2020-10-16 2021-01-22 美林数据技术股份有限公司 一种基于多哈希函数的表关系自动关联方法
CN112650738A (zh) * 2020-12-31 2021-04-13 广西中科曙光云计算有限公司 一种开放数据库的构建方法
CN112800085A (zh) * 2021-04-13 2021-05-14 成都四方伟业软件股份有限公司 一种基于布隆过滤器识别表间主外键字段的方法及装置
CN113468178A (zh) * 2021-07-07 2021-10-01 武汉达梦数据库股份有限公司 一种关联表的数据分区装载方法与装置
CN114595294A (zh) * 2022-03-11 2022-06-07 北京梦诚科技有限公司 一种数据仓库建模和抽取方法及系统
CN115617817A (zh) * 2022-12-14 2023-01-17 深圳迅策科技有限公司 一种基于全链路的全域资产报表生成方法

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130297788A1 (en) * 2011-03-30 2013-11-07 Hitachi, Ltd. Computer system and data management method
US8812564B2 (en) * 2011-12-20 2014-08-19 Sap Ag Parallel uniqueness checks for partitioned tables
US8996464B2 (en) * 2012-06-11 2015-03-31 Microsoft Technology Licensing, Llc Efficient partitioning techniques for massively distributed computation
US9507825B2 (en) * 2012-09-28 2016-11-29 Oracle International Corporation Techniques for partition pruning based on aggregated zone map information
US9430550B2 (en) 2012-09-28 2016-08-30 Oracle International Corporation Clustering a table in a relational database management system
US9311380B2 (en) * 2013-03-29 2016-04-12 International Business Machines Corporation Processing spatial joins using a mapreduce framework
US9501526B2 (en) * 2013-04-17 2016-11-22 Excalibur Ip, Llc Efficient database searching
US9390162B2 (en) * 2013-04-25 2016-07-12 International Business Machines Corporation Management of a database system
US10452632B1 (en) * 2013-06-29 2019-10-22 Teradata Us, Inc. Multi-input SQL-MR
CN103440362A (zh) * 2013-07-27 2013-12-11 国家电网公司 一种可扩展维度的输变电工程建设管理展示平台的建模方法
US9576039B2 (en) 2014-02-19 2017-02-21 Snowflake Computing Inc. Resource provisioning systems and methods
US10545917B2 (en) 2014-02-19 2020-01-28 Snowflake Inc. Multi-range and runtime pruning
US9454574B2 (en) 2014-03-28 2016-09-27 Sybase, Inc. Bloom filter costing estimation
US9491060B1 (en) * 2014-06-30 2016-11-08 EMC IP Holding Company LLC Integrated wireless sensor network (WSN) and massively parallel processing database management system (MPP DBMS)
US10289723B1 (en) * 2014-08-21 2019-05-14 Amazon Technologies, Inc. Distributed union all queries
US9922081B2 (en) 2015-06-11 2018-03-20 Microsoft Technology Licensing, Llc Bidirectional cross-filtering in analysis service systems
US10289707B2 (en) 2015-08-10 2019-05-14 International Business Machines Corporation Data skipping and compression through partitioning of data
CN106569731B (zh) * 2015-10-10 2020-08-04 阿里巴巴集团控股有限公司 极限存储方法、装置及设备
US11100073B2 (en) * 2015-11-12 2021-08-24 Verizon Media Inc. Method and system for data assignment in a distributed system
US10108632B2 (en) 2016-05-02 2018-10-23 Google Llc Splitting and moving ranges in a distributed system
US10437780B2 (en) 2016-07-14 2019-10-08 Snowflake Inc. Data pruning based on metadata
US20180095996A1 (en) 2016-10-03 2018-04-05 Ocient Llc Database system utilizing forced memory aligned access
KR101961562B1 (ko) * 2016-10-20 2019-03-22 영남대학교 산학협력단 조인 방법, 이를 실행시키는 컴퓨터 프로그램 및 기록매체
EP3555774B8 (en) 2016-12-14 2024-03-27 Ocient Inc. Efficient database management system utilizing silo and manifest
US10761745B1 (en) 2016-12-14 2020-09-01 Ocient Inc. System and method for managing parity within a database management system
US10747765B2 (en) 2017-05-30 2020-08-18 Ocient Inc. System and method for optimizing large database management systems with multiple optimizers
CN107329983B (zh) * 2017-06-01 2020-12-01 昆仑智汇数据科技(北京)有限公司 一种机器数据分布式存储、读取方法及系统
US11182125B2 (en) 2017-09-07 2021-11-23 Ocient Inc. Computing device sort function
US10585915B2 (en) 2017-10-25 2020-03-10 International Business Machines Corporation Database sharding
US11354310B2 (en) 2018-05-23 2022-06-07 Oracle International Corporation Dual purpose zone maps
US11157496B2 (en) 2018-06-01 2021-10-26 International Business Machines Corporation Predictive data distribution for parallel databases to optimize storage and query performance
US11163764B2 (en) 2018-06-01 2021-11-02 International Business Machines Corporation Predictive data distribution for parallel databases to optimize storage and query performance
US11249916B2 (en) 2018-10-15 2022-02-15 Ocient Holdings LLC Single producer single consumer buffering in database systems
US11880368B2 (en) 2018-10-15 2024-01-23 Ocient Holdings LLC Compressing data sets for storage in a database system
US11886436B2 (en) 2018-10-15 2024-01-30 Ocient Inc. Segmenting a partition of a data set based on a data storage coding scheme
US11256696B2 (en) 2018-10-15 2022-02-22 Ocient Holdings LLC Data set compression within a database system
US11709835B2 (en) 2018-10-15 2023-07-25 Ocient Holdings LLC Re-ordered processing of read requests
WO2020121359A1 (ja) * 2018-12-09 2020-06-18 浩平 海外 データベース・クエリ効率化のためのシステム、方法、および、プログラム
CN109901948B (zh) * 2019-02-18 2022-04-12 国家计算机网络与信息安全管理中心 无共享数据库集群异地双活容灾系统
FR3096799B1 (fr) * 2019-05-29 2021-11-05 Amadeus Agrégation et mise à jour d’objets de donnée hétérogènes
US11093500B2 (en) 2019-10-28 2021-08-17 Ocient Holdings LLC Enforcement of minimum query cost rules required for access to a database system
US11106679B2 (en) 2019-10-30 2021-08-31 Ocient Holdings LLC Enforcement of sets of query rules for access to data supplied by a plurality of data providers
US11609911B2 (en) 2019-12-19 2023-03-21 Ocient Holdings LLC Selecting a normalized form for conversion of a query expression
US11308090B2 (en) 2019-12-26 2022-04-19 Snowflake Inc. Pruning index to support semi-structured data types
US11372860B2 (en) 2019-12-26 2022-06-28 Snowflake Inc. Processing techniques for queries where predicate values are unknown until runtime
US11567939B2 (en) 2019-12-26 2023-01-31 Snowflake Inc. Lazy reassembling of semi-structured data
US10769150B1 (en) 2019-12-26 2020-09-08 Snowflake Inc. Pruning indexes to enhance database query processing
US11853364B2 (en) 2020-01-31 2023-12-26 Ocient Holdings LLC Level-based queries in a database system and methods for use therewith
US11061910B1 (en) 2020-01-31 2021-07-13 Ocient Holdings LLC Servicing concurrent queries via virtual segment recovery
US11238041B2 (en) 2020-03-25 2022-02-01 Ocient Holdings LLC Facilitating query executions via dynamic data block routing
US11599463B2 (en) 2020-03-25 2023-03-07 Ocient Holdings LLC Servicing queries during data ingress
US11580102B2 (en) 2020-04-02 2023-02-14 Ocient Holdings LLC Implementing linear algebra functions via decentralized execution of query operator flows
US11294916B2 (en) 2020-05-20 2022-04-05 Ocient Holdings LLC Facilitating query executions via multiple modes of resultant correctness
US11775529B2 (en) 2020-07-06 2023-10-03 Ocient Holdings LLC Recursive functionality in relational database systems
US11755589B2 (en) 2020-08-05 2023-09-12 Ocient Holdings LLC Delaying segment generation in database systems
US11880716B2 (en) 2020-08-05 2024-01-23 Ocient Holdings LLC Parallelized segment generation via key-based subdivision in database systems
US11321288B2 (en) 2020-08-05 2022-05-03 Ocient Holdings LLC Record deduplication in database systems
US11468099B2 (en) 2020-10-12 2022-10-11 Oracle International Corporation Automatic creation and maintenance of zone maps
US11822532B2 (en) 2020-10-14 2023-11-21 Ocient Holdings LLC Per-segment secondary indexing in database systems
US11507578B2 (en) 2020-10-19 2022-11-22 Ocient Holdings LLC Delaying exceptions in query execution
US11675757B2 (en) 2020-10-29 2023-06-13 Ocient Holdings LLC Maintaining row durability data in database systems
US11297123B1 (en) 2020-12-11 2022-04-05 Ocient Holdings LLC Fault-tolerant data stream processing
US11314743B1 (en) 2020-12-29 2022-04-26 Ocient Holdings LLC Storing records via multiple field-based storage mechanisms
US11645273B2 (en) 2021-05-28 2023-05-09 Ocient Holdings LLC Query execution utilizing probabilistic indexing
US11803544B2 (en) 2021-10-06 2023-10-31 Ocient Holdings LLC Missing data-based indexing in database systems
US11983172B2 (en) 2021-12-07 2024-05-14 Ocient Holdings LLC Generation of a predictive model for selection of batch sizes in performing data format conversion
US11880369B1 (en) 2022-11-21 2024-01-23 Snowflake Inc. Pruning data based on state of top K operator

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101120340A (zh) * 2004-02-21 2008-02-06 数据迅捷股份有限公司 超无共享并行数据库
US20080270363A1 (en) * 2007-01-26 2008-10-30 Herbert Dennis Hunt Cluster processing of a core information matrix
US20090006309A1 (en) * 2007-01-26 2009-01-01 Herbert Dennis Hunt Cluster processing of an aggregated dataset

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7739224B1 (en) * 1998-05-06 2010-06-15 Infor Global Solutions (Michigan), Inc. Method and system for creating a well-formed database using semantic definitions
US8671091B2 (en) * 2006-08-02 2014-03-11 Hewlett-Packard Development Company, L.P. Optimizing snowflake schema queries

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101120340A (zh) * 2004-02-21 2008-02-06 数据迅捷股份有限公司 超无共享并行数据库
US20080270363A1 (en) * 2007-01-26 2008-10-30 Herbert Dennis Hunt Cluster processing of a core information matrix
US20090006309A1 (en) * 2007-01-26 2009-01-01 Herbert Dennis Hunt Cluster processing of an aggregated dataset

Cited By (87)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102043726B (zh) * 2010-12-29 2012-08-15 北京播思软件技术有限公司 一种大规模时序数据的存储管理方法
CN102043726A (zh) * 2010-12-29 2011-05-04 北京播思软件技术有限公司 一种大规模时序数据的存储管理方法
CN103384878A (zh) * 2011-02-25 2013-11-06 数创株式会社 分布式数据库系统和分布式数据库的数据结构
CN103782293A (zh) * 2011-08-26 2014-05-07 惠普发展公司,有限责任合伙企业 用于数据分区的多维集群
CN103186651A (zh) * 2011-12-31 2013-07-03 中国移动通信集团公司 一种分布式关系数据库及其建立、查询方法和装置
CN103186651B (zh) * 2011-12-31 2016-12-14 中国移动通信集团公司 一种分布式关系数据库及其建立、查询方法和装置
CN102662968A (zh) * 2012-03-09 2012-09-12 浪潮通信信息系统有限公司 一种对于Oracle大数据量存储的优化方法
CN103309902A (zh) * 2012-03-16 2013-09-18 多玩娱乐信息技术(北京)有限公司 一种社交网络中用户信息存储和查找的方法和装置
CN103488645A (zh) * 2012-06-13 2014-01-01 镇江华扬信息科技有限公司 一种用于物联网数据更新的结构设计方法
WO2014015492A1 (zh) * 2012-07-26 2014-01-30 华为技术有限公司 数据分布的方法、装置及系统
CN103748578A (zh) * 2012-07-26 2014-04-23 华为技术有限公司 数据分布的方法、装置及系统
CN103748578B (zh) * 2012-07-26 2017-10-10 华为技术有限公司 数据分布的方法、装置及系统
WO2014059927A1 (en) * 2012-10-16 2014-04-24 Huawei Technologies Co., Ltd. System and Method for Flexible Distributed Massively Parallel Processing (MPP)
US9239741B2 (en) 2012-10-16 2016-01-19 Futurewei Technologies, Inc. System and method for flexible distributed massively parallel processing (MPP)
CN104903887A (zh) * 2012-10-16 2015-09-09 华为技术有限公司 灵活的分布式大规模并行处理(mpp)系统和方法
CN104903887B (zh) * 2012-10-16 2019-05-10 华为技术有限公司 灵活的分布式大规模并行处理(mpp)系统和方法
CN104871153A (zh) * 2012-10-29 2015-08-26 华为技术有限公司 用于灵活的分布式大规模并行处理(mpp)数据库的系统和方法
US9195701B2 (en) 2012-10-29 2015-11-24 Futurewei Technologies, Inc. System and method for flexible distributed massively parallel processing (MPP) database
CN109388638A (zh) * 2012-10-29 2019-02-26 华为技术有限公司 用于分布式大规模并行处理数据库的方法及系统
CN109388638B (zh) * 2012-10-29 2022-04-05 华为技术有限公司 用于分布式大规模并行处理数据库的方法及系统
CN104871153B8 (zh) * 2012-10-29 2019-02-01 华为技术有限公司 用于分布式大规模并行处理数据库的方法和系统
WO2014067449A1 (en) * 2012-10-29 2014-05-08 Huawei Technologies Co., Ltd. System and method for flexible distributed massively parallel processing (mpp) database
CN104871153B (zh) * 2012-10-29 2018-10-30 华为技术有限公司 用于分布式大规模并行处理数据库的方法和系统
CN103838787A (zh) * 2012-11-27 2014-06-04 阿里巴巴集团控股有限公司 一种对分布式数据仓库进行更新的方法和设备
CN103838787B (zh) * 2012-11-27 2018-07-10 阿里巴巴集团控股有限公司 一种对分布式数据仓库进行更新的方法和设备
US8799284B2 (en) 2012-11-30 2014-08-05 Futurewei Technologies, Inc. Method for automated scaling of a massive parallel processing (MPP) database
CN104077724A (zh) * 2013-03-28 2014-10-01 北京东方道迩信息技术股份有限公司 一种面向物联网综合应用的基础空间信息架构方法
WO2014154016A1 (zh) * 2013-03-29 2014-10-02 深圳市并行科技有限公司 并行数据库管理系统及设计方案
CN103412897B (zh) * 2013-07-25 2017-03-01 中国科学院软件研究所 一种基于分布式结构的并行数据处理方法
CN103412897A (zh) * 2013-07-25 2013-11-27 中国科学院软件研究所 一种基于分布式结构的并行数据处理方法
US11086833B2 (en) 2013-08-16 2021-08-10 Huawei Technologies Co., Ltd. Data storage method and apparatus for distributed database
CN104376025B (zh) * 2013-08-16 2017-10-10 华为技术有限公司 分布式数据库的数据存储方法和装置
CN104376025A (zh) * 2013-08-16 2015-02-25 华为技术有限公司 分布式数据库的数据存储方法和装置
WO2015021828A1 (zh) * 2013-08-16 2015-02-19 华为技术有限公司 分布式数据库的数据存储方法和装置
CN105874453B (zh) * 2013-12-30 2019-08-27 微软技术许可有限责任公司 为多承租者数据库提供一致的承租者体验
CN105874453A (zh) * 2013-12-30 2016-08-17 微软技术许可有限责任公司 为多承租者数据库提供一致的承租者体验
US10574752B2 (en) 2014-01-26 2020-02-25 Huawei Technologies Co., Ltd. Distributed data storage method, apparatus, and system
CN105264521B (zh) * 2014-02-18 2018-10-30 华为技术有限公司 一种数据表的导入方法、数据管理器以及服务器
WO2015123809A1 (zh) * 2014-02-18 2015-08-27 华为技术有限公司 一种数据表的导入方法、数据管理器以及服务器
CN105517644B (zh) * 2014-03-05 2020-04-21 华为技术有限公司 一种数据分区方法和设备
CN105517644A (zh) * 2014-03-05 2016-04-20 华为技术有限公司 一种数据分区方法和设备
US10360199B2 (en) 2014-10-21 2019-07-23 Microsoft Technology Licensing, Llc Partitioning and rebalancing data storage
US9875263B2 (en) 2014-10-21 2018-01-23 Microsoft Technology Licensing, Llc Composite partition functions
CN104391948B (zh) * 2014-12-01 2017-11-21 广东电网有限责任公司清远供电局 数据仓库的数据标准化构建方法及系统
CN104391948A (zh) * 2014-12-01 2015-03-04 广东电网有限责任公司清远供电局 数据仓库的数据标准化构建方法及系统
CN107209768A (zh) * 2014-12-31 2017-09-26 华为技术有限公司 用于数据集的可扩展排序的方法和设备
WO2016107497A1 (en) * 2014-12-31 2016-07-07 Huawei Technologies Co., Ltd. Method and apparatus for scalable sorting of data set
CN107735781B (zh) * 2015-01-14 2020-03-10 华为技术有限公司 存储查询结果的方法和装置、计算设备
CN107735781A (zh) * 2015-01-14 2018-02-23 华为技术有限公司 存储查询结果的方法和装置、计算设备
CN106156168B (zh) * 2015-04-16 2019-10-22 华为技术有限公司 在跨分区数据库中查询数据的方法及跨分区查询装置
WO2016165525A1 (zh) * 2015-04-16 2016-10-20 华为技术有限公司 在跨分区数据库中查询数据的方法及跨分区查询装置
CN106156168A (zh) * 2015-04-16 2016-11-23 华为技术有限公司 在跨分区数据库中查询数据的方法及跨分区查询装置
CN104794249A (zh) * 2015-05-15 2015-07-22 乐得科技有限公司 一种数据库的实现方法和设备
CN104794249B (zh) * 2015-05-15 2018-08-28 网易乐得科技有限公司 一种数据库的实现方法和设备
US10831737B2 (en) 2015-05-31 2020-11-10 Huawei Technologies Co., Ltd. Method and device for partitioning association table in distributed database
CN106415534A (zh) * 2015-05-31 2017-02-15 华为技术有限公司 一种分布式数据库中关联表分区的方法和设备
WO2016191995A1 (zh) * 2015-05-31 2016-12-08 华为技术有限公司 一种分布式数据库中关联表分区的方法和设备
CN106415534B (zh) * 2015-05-31 2019-09-20 华为技术有限公司 一种分布式数据库中关联表分区的方法和设备
CN105740365A (zh) * 2016-01-27 2016-07-06 北京掌阔移动传媒科技有限公司 一种数据仓库快速查询方法和装置
CN107229635A (zh) * 2016-03-24 2017-10-03 华为技术有限公司 一种数据处理的方法、存储节点及协调节点
CN107229635B (zh) * 2016-03-24 2020-06-02 华为技术有限公司 一种数据处理的方法、存储节点及协调节点
WO2018010527A1 (zh) * 2016-07-13 2018-01-18 腾讯科技(深圳)有限公司 数据处理方法、装置、系统及存储介质
US10915550B2 (en) 2016-07-13 2021-02-09 Tencent Technology (Shenzhen) Company Limited Data processing method, apparatus, system, and storage medium
CN110168517A (zh) * 2016-12-15 2019-08-23 华为技术有限公司 用于自适应分区数据以加快分布式并行数据库系统中连接查询的系统和方法
CN108205571A (zh) * 2016-12-20 2018-06-26 航天信息股份有限公司 键值数据表的连接方法及装置
CN107066495B (zh) * 2016-12-29 2020-04-21 北京瑞卓喜投科技发展有限公司 沿纵向拓展的区块链的生成方法及系统
CN107066495A (zh) * 2016-12-29 2017-08-18 北京瑞卓喜投科技发展有限公司 沿纵向拓展的区块链的生成方法及系统
CN110019544A (zh) * 2017-09-30 2019-07-16 北京国双科技有限公司 数据查询方法及系统
CN110109951A (zh) * 2017-12-29 2019-08-09 华为软件技术有限公司 一种关联查询的方法、数据库应用系统及服务器
CN110109951B (zh) * 2017-12-29 2022-12-06 华为技术有限公司 一种关联查询的方法、数据库应用系统及服务器
CN108482429A (zh) * 2018-03-09 2018-09-04 南京南瑞继保电气有限公司 一种轨道交通综合监控系统架构
WO2020042813A1 (zh) * 2018-08-31 2020-03-05 阿里巴巴集团控股有限公司 一种分布式数据连接处理方法、装置、设备及存储介质
US11188535B2 (en) 2018-08-31 2021-11-30 Beijing Oceanbase Technology Co., Ltd. Distributed join operation processing method, apparatus, device, and storage medium
TWI716016B (zh) * 2018-08-31 2021-01-11 開曼群島商創新先進技術有限公司 分散式資料連接處理方法、裝置、設備及儲存媒體
CN109299191A (zh) * 2018-09-18 2019-02-01 新华三大数据技术有限公司 一种数据分布方法、装置、服务器及计算机存储介质
CN109871415A (zh) * 2019-01-21 2019-06-11 武汉光谷信息技术股份有限公司 一种基于图数据库的用户画像构建方法、系统及存储介质
CN111522641A (zh) * 2020-04-21 2020-08-11 北京嘀嘀无限科技发展有限公司 任务调度方法、装置、计算机设备和存储介质
CN112256698B (zh) * 2020-10-16 2023-09-05 美林数据技术股份有限公司 一种基于多哈希函数的表关系自动关联方法
CN112256698A (zh) * 2020-10-16 2021-01-22 美林数据技术股份有限公司 一种基于多哈希函数的表关系自动关联方法
CN112650738B (zh) * 2020-12-31 2021-09-21 广西中科曙光云计算有限公司 一种开放数据库的构建方法
CN112650738A (zh) * 2020-12-31 2021-04-13 广西中科曙光云计算有限公司 一种开放数据库的构建方法
CN112800085B (zh) * 2021-04-13 2021-09-14 成都四方伟业软件股份有限公司 一种基于布隆过滤器识别表间主外键字段的方法及装置
CN112800085A (zh) * 2021-04-13 2021-05-14 成都四方伟业软件股份有限公司 一种基于布隆过滤器识别表间主外键字段的方法及装置
CN113468178A (zh) * 2021-07-07 2021-10-01 武汉达梦数据库股份有限公司 一种关联表的数据分区装载方法与装置
CN113468178B (zh) * 2021-07-07 2022-07-29 武汉达梦数据库股份有限公司 一种关联表的数据分区装载方法与装置
CN114595294A (zh) * 2022-03-11 2022-06-07 北京梦诚科技有限公司 一种数据仓库建模和抽取方法及系统
CN115617817A (zh) * 2022-12-14 2023-01-17 深圳迅策科技有限公司 一种基于全链路的全域资产报表生成方法

Also Published As

Publication number Publication date
US20120109888A1 (en) 2012-05-03
CN101916261B (zh) 2013-07-17
WO2012012968A1 (zh) 2012-02-02

Similar Documents

Publication Publication Date Title
CN101916261B (zh) 一种分布式并行数据库系统的数据分区方法
US11461356B2 (en) Large scale unstructured database systems
US11537635B2 (en) Hadoop OLAP engine
US20210240735A1 (en) System and method for supporting large queries in a multidimensional database environment
US20230084389A1 (en) System and method for providing bottom-up aggregation in a multidimensional database environment
US9805079B2 (en) Executing constant time relational queries against structured and semi-structured data
US11042569B2 (en) System and method for load, aggregate and batch calculation in one scan in a multidimensional database environment
CN103299267B (zh) 用于执行多租户存储中的交叉存储连接的方法和系统
US8782075B2 (en) Query handling in databases with replicated data
CN108369587B (zh) 创建用于交换的表
US20130110873A1 (en) Method and system for data storage and management
CN103678520A (zh) 一种基于云计算的多维区间查询方法及其系统
US11200223B2 (en) System and method for dependency analysis in a multidimensional database environment
US9898501B2 (en) Method and system for performing transactional updates in a key-value store
US20160048572A1 (en) Building a Distributed Dwarf Cube using Mapreduce Technique
CN102890678A (zh) 一种基于格雷编码的分布式数据布局方法及查询方法
WO2015041731A1 (en) Interest-driven business intelligence systems including segment data
US11036709B2 (en) Single-level, multi-dimension, hash-based table partitioning
CN102495834A (zh) 基于内存映像的增量数据清洗方法
CN104731969A (zh) 分布式环境下海量数据连接聚集查询方法、装置和系统
CN113934713A (zh) 一种订单数据索引方法、系统、计算机设备以及存储介质
US10019472B2 (en) System and method for querying a distributed dwarf cube
CN110569310A (zh) 一种云计算环境下的关系大数据的管理方法
CN117216333A (zh) 基于图数据优化的深层多跳查询方法、装置、设备及介质
CN114254166A (zh) 联邦式图数据库架构

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: BEIJING BORQS SOFTWARE TECHNOLOGY CO., LTD. WUHAN

Effective date: 20131114

Owner name: BORQS COMMUNICATION TECHNOLOGY (BEIJING) CO., LTD.

Free format text: FORMER OWNER: BEIJING BORQS SOFTWARE TECHNOLOGY CO., LTD.

Effective date: 20131114

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100102 CHAOYANG, BEIJING TO: 100015 CHAOYANG, BEIJING

TR01 Transfer of patent right

Effective date of registration: 20131114

Address after: 100015, B23 building, A, Hengtong business garden, No. 10 Jiuxianqiao Road, Beijing, Chaoyang District

Patentee after: Borqs Beijing Ltd.

Patentee after: Beijing Borqs Software Technology Co., Ltd.

Patentee after: Wuhan Borqs Technology Co., Ltd.

Address before: 100102 D building, building 9, South Central Road, Chaoyang District, Wangjing, Beijing, Wangjing

Patentee before: Beijing Borqs Software Technology Co., Ltd.