CN103077183A - 一种分布式顺序表的数据导入方法及其系统 - Google Patents

一种分布式顺序表的数据导入方法及其系统 Download PDF

Info

Publication number
CN103077183A
CN103077183A CN2012105445445A CN201210544544A CN103077183A CN 103077183 A CN103077183 A CN 103077183A CN 2012105445445 A CN2012105445445 A CN 2012105445445A CN 201210544544 A CN201210544544 A CN 201210544544A CN 103077183 A CN103077183 A CN 103077183A
Authority
CN
China
Prior art keywords
key
value pair
burst
data
sequence list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012105445445A
Other languages
English (en)
Other versions
CN103077183B (zh
Inventor
刘佳
万浩
查礼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BUSINESS-INTELLIGENCE OF ORIENTAL NATIONS CORPORATION Ltd.
Original Assignee
BEIJING PEZY DATA TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING PEZY DATA TECHNOLOGY Co Ltd filed Critical BEIJING PEZY DATA TECHNOLOGY Co Ltd
Priority to CN201210544544.5A priority Critical patent/CN103077183B/zh
Publication of CN103077183A publication Critical patent/CN103077183A/zh
Application granted granted Critical
Publication of CN103077183B publication Critical patent/CN103077183B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种分布式顺序表的数据导入方法及其系统,方法包括:S1、使用Map函数将待导入数据转换为键值对;S2、将所述键值对按照键进行排序;S3、对排序后的键值对进行分片,分别将每个分片分配给一个Reduce函数;S4、各Reduce函数对各自分配的分片进行格式转换,将所述分片转换为所述分布式顺序表的底层数据存储文件要求的格式,将所述格式转换后的分片写入到底层数据存储文件中;S5、将所述底层数据存储文件加载到所述分布式顺序表中。本发明把待导入数据直接写入分布式顺序表的底层数据存储文件,能节省分片定位时间,加快导入速度。

Description

一种分布式顺序表的数据导入方法及其系统
技术领域
本发明涉及分布式信息处理技术领域,尤其涉及一种分布式顺序表的数据导入方法及其系统。
背景技术
随着网络应用数据量的不断增大,对数据存储系统的存取性能、存储开销和可靠性提出了更高的要求。分布式顺序表(Distributed Ordered Table简称DOT)是一种最适用于海量数据(TB到PB级)下的数据库系统。由于数据量过大,使用DOT提供的接口导入的时候,需要自上而下逐级寻找Region分片的位置,导致导入数据时间漫长,效率低下。
发明内容
本发明的主要目的是提供一种基于Map/Reduce分布式计算框架的分布式顺序表数据导入技术,能够满足对分布式顺序表的海量数据导入需求,极大地提高数据导入速度。
为达此目的,本发明采用以下技术方案:
一种分布式顺序表的数据导入方法,包括:
S1、使用Map函数将待导入数据转换为键值对;
S2、将所述键值对按照键进行排序;
S3、对排序后的键值对进行分片,分别将每个分片分配给一个Reduce函数;
S4、各Reduce函数对各自分配的分片进行格式转换,将所述分片转换为所述分布式顺序表的底层数据存储文件要求的格式,将所述格式转换后的分片写入到底层数据存储文件中;
S5、将所述底层数据存储文件加载到所述分布式顺序表中。
进一步地,在步骤S1之前还包括:对原始数据进行抽样分析;在步骤S3中依据所述抽样分析结果对排序后的键值对进行分片。
进一步地,所述步骤S2之后还包括:将具有相同键的键值对进行合并。
根据本发明的同一构思,本发明还提供了一种分布式顺序表的数据导入系统,包括:
键值对转换模块,用于使用Map函数将待导入数据转换为键值对;
排序模块,用于将所述键值对转换模块生成的键值对按照键进行排序;
分片模块,用于将经过排序模块排序后的键值对进行分片,分别将每个分片分配给一个Reduce函数;
格式转换与存储模块,用于使用各Reduce函数对各自分配的分片进行格式转换,将所述分片转换为所述分布式顺序表的底层数据存储文件要求的格式,将所述格式转换后的分片写入到底层数据存储文件中;
数据加载模块,用于将所述格式转换与存储模块存储的底层数据存储文件加载到所述分布式顺序表中。
进一步地,还包括抽样分析模块,用于在使用键值对转换模块进行键值对转换之前,对原始数据进行抽样分析,将所述抽样分析结果用于排序分片模块中的分片处理。
进一步地,还包括键值对合并模块,所述键值对经过所述排序模块排序后,用于将具有相同键的键值对进行合并。
本发明的有益技术效果是:本发明基于Map/Reduce分布式计算框架进行数据快速导入,把导入数据直接写入分布式顺序表的底层数据存储文件,从而节省了Region分片的定位时间,提高了导入速度。
附图说明
图1是本发明具体实施例一所述的分布式顺序表的数据导入方法流程图;
图2是本发明具体实施例一所述的分布式顺序表的数据导入示意图;
图3是本发明具体实施例二所述的分布式顺序表的数据导入方法流程图;
图4是本发明具体实施例三所述的分布式顺序表的数据导入系统结构框图;
图5是本发明具体实施例四所述的分布式顺序表的数据导入系统结构框图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
实施例一
图1是本发明实施例一所述的分布式顺序表的数据导入方法流程图,如图1所示,分布式顺序表的数据导入方法包括:
步骤S101、使用Map函数将待导入数据转换为键值对;
各键值对中,键为分布式顺序表的主键,值为该键所对应的数据内容;待导入数据可以是任意形式的数据,例如文本串、二进制序列等。Map函数接收待导入数据后将其转换为若干个键值对<key,value>输出,key表示键,value为值,表示上述键key所对应的数据内容。
步骤S102、将键值对按照键进行排序;
将步骤S101中产生的所有键值对<key,value>按照键key进行排序,这样保证键值对的全局有序,使得在后续步骤写入数据存储文件时可以高速地顺序方式写入。
步骤S103、将键值对进行分片;
按照预先设定的分片方法,将所述键值对将键划分为多个分片,将每个分片分配给一个Reduce函数进行导入处理。
将经过步骤S2排序后的键值对划分为多个分片,每个分片以起止键为边界限定了包含至少一个key的集合。划分之后将每个分片的键值对分配给一个Reduce函数。
步骤S104、对各分片进行格式转换,写入底层存储文件;
各Reduce函数将各自接收的已经按键key排序的键值对<key,value>转换为所述分布式顺序表的底层数据存储文件所要求的数据格式,并写入到底层数据存储文件中。
步骤S105、将底层存储文件写入分布式顺序表。
通过HBase提供的数据加载工具,可以将生成的数据文件加载到HBase的表中。
至此,该分布式顺序表就可以提供对已导入数据的访问。
图2是本发明具体实施例一所述的分布式顺序表的数据导入示意图,如图2所示,本实施施例以将五个待导入数据,即源数据,包括:源数据1、源数据2……源数据5,分配给三个Map函数将源数据转化为键值对的形式,对所有的键值对按键进行排序,排序之后将所述键值对进行分片,例如分成两个分片,将这两个分片分别分配给两个Reduce函数,每个Reduce函数对所分配的分片进行格式转换,写入底层存储文件,例如输出文件1和输出文件2。将输出文件1和输出文件2写入分布式顺序表。
通过上述方法将原始数据直接高速地并行写入分布式顺序表的底层数据存储文件,能极大地提高数据导入的效率。
实施例二
为了进一步提高数据导入速度,可以对实施例一作进一步的改进:包括:将每个Reduce函数的输入键值对排序之后进行合并操作;对原始数据进行抽样分析。图3是本实施例所述的分布式顺序表的数据导入方法流程图,如图3所示,进一步改进后的分布式顺序表的数据导入方法包括:
步骤S301、对待导入数据进行抽样分析;
为了使步骤S305中能够均衡地对键进行分片,以及使最后写入的各数据存储文件之间能获得一个比较均衡的负载,在将待导入数据转化为键值对之前还可以进一步包括:使用一个抽样函数对原始数据进行抽样分析,通过以上方式可以为后续各步骤提供一个均衡的分片区间参考,例如,在步骤S305中,依据所述抽样分析结果将所述键值对进行均匀地分片,进一步保证了系统能够稳定高效地运行。
步骤S302、使用Map函数将待导入数据转换为键值对;
与实施例一步骤S101相同,在此不作赘述。
步骤S303、将键值对按照键值进行排序;
与实施例一步骤S102相同,在此不作赘述。
步骤S304、将具有相同键值的健值对进行合并;
将具有相同键的键值对进行合并,作为一个新的键值对。例如,发送给每个Reduce函数Reduce的键值对<key,value>按键key进行排序之后,若其中部分键值对<key,value>具有相同的键key,则可以进一步将这些具有相同键的键值对进行合并,生成一个新的键值对。通过键值对的合并减少了Reduce函数需要处理的键值对的数量,提高了Reduce函数的处理效率,在数据量很大时通过上述合并操作能取得非常显著的效果。
步骤S305、依据抽样分样结果将键值对进行分片;
与实施例一步骤S103相同,在此不作赘述。
步骤S306、对各分片进行格式转换,将分片写入底层存储文件
与实施例一步骤S104相同,在此不作赘述。
步骤S307、将底层存储文件写入分布式顺序表。
与实施例一步骤S105相同,在此不作赘述。
实施例三
图4是本实施例所述的分布式顺序表的数据导入系统结构框图,如图4所示,本实施例所述的分布式顺序表的数据导入系统包括:
键值对转换模块401,用于使用Map函数将待导入数据转换为键值对;
各键值对中,键为分布式顺序表的主键,值为该键所对应的数据内容;待导入数据可以是任意形式的数据,例如文本串、二进制序列等。Map函数接收待导入数据后将其转换为若干个键值对<key,value>输出,key表示键,value为值,表示上述键key所对应的数据内容。
排序模块402,用于将所述键值对转换模块生成的键值对按照键进行排序;
将键值对转换模块401中产生的所有键值对<key,value>按照键key进行排序,这样保证键值对的全局有序,使得在后续步骤写入数据存储文件时可以高速地顺序方式写入。
分片模块403,用于将经过排序模块排序后的键值对进行分片,分别将每个分片分配给一个Reduce函数;
按照预先设定的分片方法,将所述键值对将键划分为多个分片,将每个分片分配给一个Reduce函数进行导入处理。
将经过排序模块402排序后的键值对划分为多个分片,每个分片以起止键为边界限定了包含至少一个key的集合。划分之后将每个分片的键值对分配给一个Reduce函数。
格式转换与存储模块404,用于使用各Reduce函数对各自分配的分片进行格式转换,将所述分片转换为所述分布式顺序表的底层数据存储文件要求的格式,将所述格式转换后的分片写入到底层数据存储文件中;
用于使用各Reduce函数将各自接收的已经按键key排序的键值对<key,value>转换为所述分布式顺序表的底层数据存储文件所要求的数据格式,并写入到底层数据存储文件中。
数据加载模块405,用于将所述格式转换与存储模块存储的底层数据存储文件加载到所述分布式顺序表中。
实施例四
为了进一步提高数据导入速度,可以对实施例三作进一步的改进,包括:增加键值对合并模块用于将每个Reduce函数的输入键值对排序之后进行合并操作;增加抽样分析模块用于对原始数据进行抽样分析。图5是本发明具体实施例四所述的分布式顺序表的数据导入系统结构框图,如图5所示,进一步改进后的分布式顺序表的数据导入系统包括:
括抽样分析模块501,用于在使用键值对转换模块进行键值对转换之前,对原始数据进行抽样分析,将所述抽样分析结果用于排序分片模块中的分片处理;
为了使分片模块505中能够均衡地对键进行分片,以及使最后写入的各数据存储文件之间能获得一个比较均衡的负载,在将待导入数据转化为键值对之前还可以进一步包括:通过抽样分析模块501,使用一个抽样函数对原始数据进行抽样分析,通过以上方式可以为后续各步骤提供一个均衡的分片区间参考,例如,在分片模块505中,用于依据所述抽样分析结果将所述键值对进行均匀地分片,进一步保证了系统能够稳定高效地运行。
键值对转换模块502,用于使用Map函数将待导入数据转换为键值对;
与实施例三所述的键值对转换模块401相同,在此不作赘述。
排序模块503,用于将所述键值对转换模块生成的键值对按照键进行排序;
与实施例三所述排序模块402相同,在此不作赘述。
键值对合并模块504,所述键值对经过所述排序模块排序后,用于将具有相同键的键值对进行合并。
用于将具有相同键的键值对进行合并,作为一个新的键值对。例如,发送给每个Reduce函数Reduce的键值对<key,value>按键key进行排序之后,若其中部分键值对<key,value>具有相同的键key,则可以进一步将这些具有相同键的键值对进行合并,生成一个新的键值对。
通过键值对的合并减少了Reduce函数需要处理的键值对的数量,提高了Reduce函数的处理效率,在数据量很大时通过上述合并操作能取得非常显著的效果。
分片模块505,用于将经过排序模块排序后的键值对进行分片,分别将每个分片分配给一个Reduce函数;
与实施例三所述分片模块403相同,在此不作赘述。
格式转换与存储模块506,用于使用各Reduce函数对各自分配的分片进行格式转换,将所述分片转换为所述分布式顺序表的底层数据存储文件要求的格式,将所述格式转换后的分片写入到底层数据存储文件中;
与实施例三所述步骤格式转换与存储模块404相同,在此不作赘述。
数据加载模块507,用于将所述格式转换与存储模块存储的底层数据存储文件加载到所述分布式顺序表中。
与实施例三所述步数据加载模块405相同,在此不作赘述。
本发明采用Hadoop v0.20.2和HBase v0.90.2作为代码基础,采用Java语言实现,通过MapReduce提供全局排序功能,实现数据读入、映射、全局排序以及最终写入到数据文件中。本发明能够满足对分布式顺序表的海量数据导入需求,极大地提高数据导入速度。
以上实施例提供的技术方案中的全部或部分内容可以通过软件编程实现,其软件程序存储在可读取的存储介质中,存储介质例如:计算机中的硬盘、光盘或软盘。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种分布式顺序表的数据导入方法,其特征在于,包括:
S1、使用Map函数将待导入数据转换为键值对;
S2、将所述键值对按照键进行排序;
S3、对排序后的键值对进行分片,分别将每个分片分配给一个Reduce函数;
S4、各Reduce函数对各自分配的分片进行格式转换,将所述分片转换为所述分布式顺序表的底层数据存储文件要求的格式,将所述格式转换后的分片写入到底层数据存储文件中;
S5、将所述底层数据存储文件加载到所述分布式顺序表中。
2.如权利要求1所述的分布式顺序表的数据导入方法,其特征在于,在步骤S1之前还包括:对原始数据进行抽样分析;在步骤S3中依据所述抽样分析结果对排序后的键值对进行分片。
3.如权利要求1或2所述的分布式顺序表的数据导入方法,其特征在于,所述步骤S2之后还包括:将具有相同键的键值对进行合并。
4.一种分布式顺序表的数据导入系统,其特征在于,包括:
键值对转换模块,用于使用Map函数将待导入数据转换为键值对;
排序模块,用于将所述键值对转换模块生成的键值对按照键进行排序;
分片模块,用于将经过排序模块排序后的键值对进行分片,分别将每个分片分配给一个Reduce函数;
格式转换与存储模块,用于使用各Reduce函数对各自分配的分片进行格式转换,将所述分片转换为所述分布式顺序表的底层数据存储文件要求的格式,将所述格式转换后的分片写入到底层数据存储文件中;
数据加载模块,用于将所述格式转换与存储模块存储的底层数据存储文件加载到所述分布式顺序表中。
5.如权利要求4所述的分布式顺序表的数据导入系统,其特征在于,还包括抽样分析模块,用于在使用键值对转换模块进行键值对转换之前,对原始数据进行抽样分析,将所述抽样分析结果用于排序分片模块中的分片处理。
6.如权利要求4或5所述的分布式顺序表的数据导入系统,其特征在于,还包括键值对合并模块,所述键值对经过所述排序模块排序后,用于将具有相同键的键值对进行合并。
CN201210544544.5A 2012-12-14 2012-12-14 一种分布式顺序表的数据导入方法及其系统 Active CN103077183B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210544544.5A CN103077183B (zh) 2012-12-14 2012-12-14 一种分布式顺序表的数据导入方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210544544.5A CN103077183B (zh) 2012-12-14 2012-12-14 一种分布式顺序表的数据导入方法及其系统

Publications (2)

Publication Number Publication Date
CN103077183A true CN103077183A (zh) 2013-05-01
CN103077183B CN103077183B (zh) 2017-11-17

Family

ID=48153713

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210544544.5A Active CN103077183B (zh) 2012-12-14 2012-12-14 一种分布式顺序表的数据导入方法及其系统

Country Status (1)

Country Link
CN (1) CN103077183B (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294799A (zh) * 2013-05-27 2013-09-11 北京大学 一种数据并行批量导入只读查询系统的方法及系统
CN103605740A (zh) * 2013-11-19 2014-02-26 北京国双科技有限公司 数据导入处理方法和装置
CN104239529A (zh) * 2014-09-19 2014-12-24 浪潮(北京)电子信息产业有限公司 防止Hive数据倾斜的方法和装置
CN104361139A (zh) * 2014-12-10 2015-02-18 用友软件股份有限公司 数据导入装置和方法
CN105430078A (zh) * 2015-11-17 2016-03-23 浪潮(北京)电子信息产业有限公司 一种海量数据的分布式存储方法
CN105718561A (zh) * 2016-01-20 2016-06-29 中国科学院计算技术研究所 一种特定分布式数据存储文件结构去冗余构造方法及系统
WO2016169237A1 (zh) * 2015-04-23 2016-10-27 中兴通讯股份有限公司 数据处理方法及装置
CN106227803A (zh) * 2016-07-21 2016-12-14 浪潮电子信息产业股份有限公司 一种基于Hbase的海量数据导入方法及装置
CN106294589A (zh) * 2016-07-28 2017-01-04 中国联合网络通信集团有限公司 基于MapReduce的多表数据处理方法及系统
WO2017028514A1 (zh) * 2015-08-18 2017-02-23 华为技术有限公司 一种数据存储、读取方法及装置
CN107679237A (zh) * 2017-10-26 2018-02-09 杨晓艳 一种分布式数据库管理系统、方法及装置
CN109447274A (zh) * 2017-08-30 2019-03-08 第四范式(北京)技术有限公司 用于执行机器学习的分布式系统及其方法
CN109471863A (zh) * 2018-11-12 2019-03-15 北京懿医云科技有限公司 基于分布式数据库的信息查询方法及装置、电子设备
CN109684324A (zh) * 2017-10-18 2019-04-26 阿里巴巴集团控股有限公司 一种数据处理方法及其相关产品
CN111597187A (zh) * 2017-08-30 2020-08-28 第四范式(北京)技术有限公司 用于执行机器学习的分布式系统及其方法
CN112540985A (zh) * 2020-12-07 2021-03-23 江苏赛融科技股份有限公司 基于分布式计算框架的全局排序输出系统及其方法
WO2021109777A1 (zh) * 2019-12-03 2021-06-10 中兴通讯股份有限公司 一种数据文件的导入方法及装置
CN113609090A (zh) * 2021-08-06 2021-11-05 杭州网易云音乐科技有限公司 数据存储方法及装置、计算机可读存储介质、电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101452441A (zh) * 2008-12-05 2009-06-10 山东浪潮齐鲁软件产业股份有限公司 一种电子表格通用数据解析导入方法
CN101799810A (zh) * 2009-02-06 2010-08-11 中国移动通信集团公司 一种关联规则挖掘方法及其系统
CN102426609A (zh) * 2011-12-28 2012-04-25 厦门市美亚柏科信息股份有限公司 一种基于MapReduce编程架构的索引生成方法和装置
US20120182891A1 (en) * 2011-01-19 2012-07-19 Youngseok Lee Packet analysis system and method using hadoop based parallel computation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101452441A (zh) * 2008-12-05 2009-06-10 山东浪潮齐鲁软件产业股份有限公司 一种电子表格通用数据解析导入方法
CN101799810A (zh) * 2009-02-06 2010-08-11 中国移动通信集团公司 一种关联规则挖掘方法及其系统
US20120182891A1 (en) * 2011-01-19 2012-07-19 Youngseok Lee Packet analysis system and method using hadoop based parallel computation
CN102426609A (zh) * 2011-12-28 2012-04-25 厦门市美亚柏科信息股份有限公司 一种基于MapReduce编程架构的索引生成方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
亢丽芸等: "MapReduce原理及其主要实现平台分析", 《现代图书情报技术》 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294799B (zh) * 2013-05-27 2016-12-28 北京大学 一种数据并行批量导入只读查询系统的方法及系统
CN103294799A (zh) * 2013-05-27 2013-09-11 北京大学 一种数据并行批量导入只读查询系统的方法及系统
CN103605740A (zh) * 2013-11-19 2014-02-26 北京国双科技有限公司 数据导入处理方法和装置
CN103605740B (zh) * 2013-11-19 2016-10-05 北京国双科技有限公司 数据导入处理方法和装置
CN104239529A (zh) * 2014-09-19 2014-12-24 浪潮(北京)电子信息产业有限公司 防止Hive数据倾斜的方法和装置
CN104361139A (zh) * 2014-12-10 2015-02-18 用友软件股份有限公司 数据导入装置和方法
CN104361139B (zh) * 2014-12-10 2019-04-16 用友网络科技股份有限公司 数据导入装置和方法
WO2016169237A1 (zh) * 2015-04-23 2016-10-27 中兴通讯股份有限公司 数据处理方法及装置
CN106156209A (zh) * 2015-04-23 2016-11-23 中兴通讯股份有限公司 数据处理方法及装置
WO2017028514A1 (zh) * 2015-08-18 2017-02-23 华为技术有限公司 一种数据存储、读取方法及装置
CN105430078B (zh) * 2015-11-17 2019-03-15 浪潮(北京)电子信息产业有限公司 一种海量数据的分布式存储方法
CN105430078A (zh) * 2015-11-17 2016-03-23 浪潮(北京)电子信息产业有限公司 一种海量数据的分布式存储方法
CN105718561A (zh) * 2016-01-20 2016-06-29 中国科学院计算技术研究所 一种特定分布式数据存储文件结构去冗余构造方法及系统
CN106227803A (zh) * 2016-07-21 2016-12-14 浪潮电子信息产业股份有限公司 一种基于Hbase的海量数据导入方法及装置
CN106294589A (zh) * 2016-07-28 2017-01-04 中国联合网络通信集团有限公司 基于MapReduce的多表数据处理方法及系统
CN111597187B (zh) * 2017-08-30 2023-09-01 第四范式(北京)技术有限公司 用于执行机器学习的分布式系统及其方法
CN109447274A (zh) * 2017-08-30 2019-03-08 第四范式(北京)技术有限公司 用于执行机器学习的分布式系统及其方法
CN111597187A (zh) * 2017-08-30 2020-08-28 第四范式(北京)技术有限公司 用于执行机器学习的分布式系统及其方法
CN109684324A (zh) * 2017-10-18 2019-04-26 阿里巴巴集团控股有限公司 一种数据处理方法及其相关产品
CN109684324B (zh) * 2017-10-18 2023-05-05 阿里巴巴集团控股有限公司 一种数据处理方法及其相关产品
CN107679237A (zh) * 2017-10-26 2018-02-09 杨晓艳 一种分布式数据库管理系统、方法及装置
CN109471863A (zh) * 2018-11-12 2019-03-15 北京懿医云科技有限公司 基于分布式数据库的信息查询方法及装置、电子设备
CN109471863B (zh) * 2018-11-12 2021-07-20 北京懿医云科技有限公司 基于分布式数据库的信息查询方法及装置、电子设备
WO2021109777A1 (zh) * 2019-12-03 2021-06-10 中兴通讯股份有限公司 一种数据文件的导入方法及装置
CN112540985A (zh) * 2020-12-07 2021-03-23 江苏赛融科技股份有限公司 基于分布式计算框架的全局排序输出系统及其方法
CN112540985B (zh) * 2020-12-07 2023-09-26 江苏赛融科技股份有限公司 基于分布式计算框架的全局排序输出系统及其方法
CN113609090A (zh) * 2021-08-06 2021-11-05 杭州网易云音乐科技有限公司 数据存储方法及装置、计算机可读存储介质、电子设备

Also Published As

Publication number Publication date
CN103077183B (zh) 2017-11-17

Similar Documents

Publication Publication Date Title
CN103077183A (zh) 一种分布式顺序表的数据导入方法及其系统
CN101339538B (zh) 使用页结构的数据树存储方法、系统和计算机程序产品
US8843502B2 (en) Sorting a dataset of incrementally received data
CN101661391B (zh) 一种对象序列化方法、对象反序列化方法、装置及系统
CN105793822B (zh) 动态混洗重新配置
CN103927338A (zh) 日志信息入库处理方法和装置
CN103345484A (zh) 基于动态域的报表处理系统及方法
CN103440246A (zh) 用于MapReduce的中间结果数据排序方法及系统
CN102043789A (zh) 一种更新数据表的方法和装置
CN104111936A (zh) 数据查询方法和系统
CN103020255A (zh) 分级存储方法和装置
CN101826109A (zh) 一种大容量文件分割方法、装置及系统
CN102999601A (zh) 一种文件排序的方法及多媒体终端
CN102591787A (zh) Java卡的数据处理方法及装置
CN103995827A (zh) MapReduce计算框架中的高性能排序方法
CN105450656A (zh) 一种app数据配置方法、装置、服务器和配置系统
CN104573112A (zh) Oltp集群数据库中页面查询方法及数据处理节点
CN101710322A (zh) 一种信息关联的方法和系统
CN103064991A (zh) 一种海量数据聚类方法
KR20130097972A (ko) 하드웨어 가속화를 통한 대규모 데이터의 분산 처리 장치 및 방법
CN104156316A (zh) 一种Hadoop集群批处理作业的方法及系统
CN101650732B (zh) 一种对象管理系统中的对象分组方法及装置
CN102184286A (zh) 自动生成仪表回路图的方法
CN103809947A (zh) 一种开发需求的自动发布方法和系统
CN113254106B (zh) 基于Flink的任务执行方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
ASS Succession or assignment of patent right

Owner name: BEIJING PEZY CHUANGZHI DATA TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: BEIJING PEZY TIANJI DATA TECHNOLOGY CO., LTD.

Effective date: 20130603

C41 Transfer of patent application or patent right or utility model
C53 Correction of patent of invention or patent application
CB03 Change of inventor or designer information

Inventor after: He Xiaofeng

Inventor before: Liu Jia

Inventor before: Wan Hao

Inventor before: Cha Li

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: LIU JIA WAN HAO CHA LI TO: HE XIAOFENG

Free format text: CORRECT: ADDRESS; FROM: 100083 HAIDIAN, BEIJING TO: 100180 HAIDIAN, BEIJING

TA01 Transfer of patent application right

Effective date of registration: 20130603

Address after: 100180, No. 28, Fu Cheng Road, 9, Beijing, Haidian District, 4-906

Applicant after: Beijing Puze Powerise Data Technology Co Ltd

Address before: 100083. 4-906, 9, 4-908, 28 Fu Cheng Road, Beijing, Haidian District

Applicant before: Beijing Pezy Data Technology Co., Ltd.

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200421

Address after: 100102 Beijing Chaoyang District Chuangda Road 1 Courtyard 1 Building 7 Floor 101

Patentee after: BUSINESS-INTELLIGENCE OF ORIENTAL NATIONS CORPORATION Ltd.

Address before: 100180, No. 28, Fu Cheng Road, 9, Beijing, Haidian District, 4-906

Patentee before: Beijing Puze Powerise Data Technology Co.,Ltd.