CN106446168A - 一种面向分布式数据仓库的高效加载客户端实现方法 - Google Patents

一种面向分布式数据仓库的高效加载客户端实现方法 Download PDF

Info

Publication number
CN106446168A
CN106446168A CN201610849787.8A CN201610849787A CN106446168A CN 106446168 A CN106446168 A CN 106446168A CN 201610849787 A CN201610849787 A CN 201610849787A CN 106446168 A CN106446168 A CN 106446168A
Authority
CN
China
Prior art keywords
data
module
distributed
warehouse
loader
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610849787.8A
Other languages
English (en)
Other versions
CN106446168B (zh
Inventor
王宇
徐晓燕
周渊
刘利宏
刘庆良
郑彩娟
黄成�
王振宇
李斌斌
周游
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING SCISTOR TECHNOLOGY Co Ltd
National Computer Network and Information Security Management Center
Original Assignee
BEIJING SCISTOR TECHNOLOGY Co Ltd
National Computer Network and Information Security Management Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING SCISTOR TECHNOLOGY Co Ltd, National Computer Network and Information Security Management Center filed Critical BEIJING SCISTOR TECHNOLOGY Co Ltd
Priority to CN201610849787.8A priority Critical patent/CN106446168B/zh
Publication of CN106446168A publication Critical patent/CN106446168A/zh
Application granted granted Critical
Publication of CN106446168B publication Critical patent/CN106446168B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种面向分布式数据仓库的高效加载客户端实现方法,属于信息处理领域;具体为:首先,初始化系统启动参数;加载器管理模块为每个线程各申请一个加载器;每个线程各创建一个数据解析模块,对客户端数据进行解析并传输给加载器;每个加载器分别调用数据校验模块进行检验;然后,将检验后的字段数据缓存到数据缓存模块,进行管理并传输给数据传输模块;通过分布式节点监听模块获取每个分布式数据仓库的监听状态,并发送给数据传输模块;最后,数据传输模块将收到的缓存数据发送给健康的分布式数据仓库。本发明提升了整个分布式数据仓库的使用效率和数据加载效率,符合目前的应用需求,具有广阔的应用前景。

Description

一种面向分布式数据仓库的高效加载客户端实现方法
技术领域
本发明属于信息处理领域,具体是一种面向分布式数据仓库的高效加载客户端实现方法。
背景技术
随着计算机技术的不断发展和信息化程度的不断提高,人们对分布式存储的使用越来越多;与目前常见的集中式存储技术不同,分布式存储技术并不是将数据存储在某个或多个特定的节点上,而是通过网络使用企业中的每台机器上的磁盘空间,并将分散的存储资源构成一个虚拟的存储设备,数据分散的存储在企业的各个角落。
数据在分布式环境下的加载效率,在很大程度上影响着整个集群的效率;为了提高数据加载效率,优化整个集群使用,且降低成本,迫切需要更好的,更快捷的加载方式。
随着信息化水平的不断提高,信息数据量越来越大,由于信息数据加载过慢而引起的重视和关注越来越多,人们迫切的需要快速得到某些数据集的结果,因此能够快速的把需要用到的数据导入分布式数据仓库成为目前急需的方法。但是目前海量的数据导入时间阻挡了高速信息时代发展的步伐。
发明内容
本发明针对现有分布式数据仓库加载效率慢的问题,提供了一种面向分布式数据仓库的高效加载客户端实现方法,不但能解决多数据表同时加载,多数据仓库节点负载均衡,而且能够在使用少量内存的情况下发挥最高的加载速率,有效降低了加载时间,促进大数据体系发展的不断完善。
具体步骤如下:
步骤一、对某个含有1个客户端和N个服务端的系统,初始化系统启动参数;
系统启动参数包括:同时运行加载器的数量,指定被加载数据的位置,数据仓库节点列表和服务端指定数据加载的N个具体表名。
步骤二、加载器管理模块根据主线程创建加载器并初始化,每个线程各申请一个加载器;
创建加载器的数量为初始化参数中需要同时运行加载器的数量。
步骤三、每个线程各创建一个数据解析模块,对被加载的客户端数据进行解析,按行切分为字段数据,传输给该线程申请的加载器;
具体步骤如下:
步骤301、根据被加载数据的指定位置,将客户端的数据加载到数据文件目录r中;
步骤302、数据解析模块读取客户端被加载的数据文件目录r;
步骤303、从当前目录r中依次获取当前文件f的行数据;
步骤304、按指定分隔符将当前行数据d切分为字段v;并将字段v传输给该线程中的加载器;
步骤305、重复读取当前文件f的下一行数据,直至将当前文件f的所有数据都传输给加载器;
步骤306、重复读取目录r中的下一个文件,返回步骤303,直至该目录r中所有文件读取完成。
步骤四、每个加载器收到字段数据后,分别调用数据校验模块进行检验;
数据校验模块根据初始化时的N个指定表名,向分布的各数据仓库节点申请每个指定表的结构信息,等待用以校验加载数据的格式是否正确。
具体步骤为:
步骤401:数据校验模块根据服务端的N个指定表名创建N个类型校验器;
步骤402:将每个加载器的字段数据,按服务端预定的N个指定表名分别进入N个类型校验器;
步骤403:分别判断每个字段数据的类型校验是否成功,如果成功,说明该字段数据符合服务端预定的指定表类型,则进入步骤404,否则返回调用者错误信息,结束。
步骤404:根据服务端N个指定表名,对字段数据进行格式化补全,并转化格式类型;
步骤五、每个加载器将检验后的字段数据,缓存到数据缓存模块进行管理并传输给数据传输模块;
首先,数据缓存模块根据分布式数据仓库数量和缓存数量建立内存矩阵;每个内存矩阵分别对应一个分布式数据仓库,预申请的内存长度保存在内存矩阵中。然后,加载器根据指定表名,将检验后的字段数据放入到对应的内存矩阵中,并标记缓存数量;最后,判断各内存矩阵的缓存数量是否达到上限,如果是,将检验后的字段数据进行序列化,并传输给数据传输模块,否则,继续将检验后的字段数据放入到对应的内存矩阵中;
步骤六、分布式节点监听模块获取每个分布式数据仓库的监听状态,并发送给数据传输模块等待查阅;
分布式节点监听模块启动监听服务器,并等待分布式数据仓库的连接;当某分布式数据仓库启动后,向监听服务器进行注册,监听服务器获取该分布式数据仓库的状态信息,从而分布式节点监听模块获取所有N个分布式数据仓库的健康状态,并保存在内存中,等待数据传输模块查阅;
步骤七、数据传输模块收到缓存数据后,查阅健康的分布式数据仓库并发送数据,实现负载均衡和链路冗余的功能。
数据传输模块根据收到的缓存数据,按预定发送地址发送数据给分布式数据仓库;并判断是否发送成功,如果发送成功,记录发送日志后,执行结束。否则,向分布式节点监听模块重新申请健康的分布式数据仓库节点重新发送。
发送地址是在缓存数据的多个字段中,根据表结构指定某一个字段用来计算分区值,根据分区值的不同选择不同的分布式数据仓库,从而预定该分布式数据仓库的发送地址。
本发明的优点在于:
1)、一种面向分布式数据仓库的高效加载客户端实现方法,提升了整个分布式数据仓库的使用效率和数据加载效率,符合目前的应用需求,具有广阔的应用前景。
2)、一种面向分布式数据仓库的高效加载客户端实现方法,对加载过程中的数据进行进一步的类型验证,并且根据数据长度进行内存使用的调整,从而减少内存的使用,提高加载效率。
3)、一种面向分布式数据仓库的高效加载客户端实现方法,可以快速的将指定的数据文件按照分布式数据仓库的特点进行分散式数据传输,可以支持多线程、多任务、多数据表、多节点的分布式快速加载。
4)、一种面向分布式数据仓库的高效加载客户端实现方法,可以支持多节点之间的负载均衡、链路冗余,有效解决了加载过程中可能出现的连接崩溃问题。
5)、一种面向分布式数据仓库的高效加载客户端实现方法,对数据内容的缓存管理,用于降低数据序列化的压力,以及减少频繁的数据发送请求,使整个发送环节和内存的整体占用情况处于可调控状态。
6)、一种面向分布式数据仓库的高效加载客户端实现方法,可以实时监听分布式节点的健康情况,根据节点的不同状态控制数据传输模块将数据发送到健康的节点。
附图说明
图1为本发明面向分布式数据仓库的数据加载流程及数据结构示意图;
图2为本发明一种面向分布式数据仓库的高效加载客户端实现方法流程图;
图3为本发明数据解析模块解析的方法流程图;
图4为本发明数据校验模块校验的方法流程图;
图5为本发明加载器管理模块的流程图;
图6为本发明数据缓存模块缓存的方法图;
图7为本发明分布式节点监听模块的原理图;
图8为本发明数据传输模块的原理图。
具体实施方式
下面将结合附图对本发明作进一步的详细说明。
本发明涉及一种多任务、多数据表、多数据仓库节点并在占用最小内存的情况下,达到最高加载速率的分布式快速加载方法,面向分布式数据仓库加载过程的数据结构示意图,如图1所示,从图中可以看出,整个数据加载过程中的数据处理流程,包括字段结构和数据包结构。其中在字段结构中存放了字段内容属性、总数据量长度和内存描述,内存的使用根据字段类型的变化而改变,从而减少内存使用并提高拷贝效率;给出了支持多线程多表加载的组织结构,由数据解析模块将需要加载的数据进行解析后,整理为有效的结构字段,通过加载器发往下个模块,完成数据梳理业务保证后面处理流程的顺畅。对加载器的管理,通过创建不同的加载器,可以支持多个线程操作,实现对多个数据表同时进行加载操作。数据由数据校验模块校验后提交到数据缓存模块中,当数据达到一定阀值会进入序列化流程,数据被序列化之后作为数据包提交给数据传输模块;数据包包括:目标IP,端口,SN标示符和消息类型;数据传输模块会根据分布式数据仓库节点的状态选择合适的数据仓库发送数据,实现负载均衡和链路冗余的功能。
如图2所示,具体步骤如下:
步骤一、对某个含有1个客户端和N个服务端的系统,启动初始化系统参数;
系统参数包括:同时运行加载器的数量,指定被加载数据的位置,数据仓库节点列表和服务端指定数据加载的N个具体表名。
系统还包括:数据解析模块;加载器管理模块;数据校验模块;数据缓存模块;分布式节点监听模块和数据传输模块。
步骤二、加载器管理模块根据主线程创建加载器并初始化,每个线程各申请一个加载器。
加载器管理模块根据主线程,初始化创建不同的加载器,支持多个线程同时操作;创建加载器的数量为初始化参数中需要同时运行加载器的数量,由硬件设备的物理性能决定。
如图5所示,加载器管理模块根据请求内容划分为两个服务:获取加载器和提交数据到加载器;
获取加载器具体为:首先判断加载器数量是否超过上限,如果是,直接退出结束;否则,初始化加载器,从分布式节点监听模块获取可用的数据仓库节点数,并根据可用节点数预算使用内存,然后生成数据缓存模块,加载器创建成功。
提交数据到加载器具体为:首先,判断数据校验模块进行类型的校验是否合适,如果是,根据数据内容计算分区值,保存分区值用于与数据仓库节点进行连接,然后将数据交给数据缓存模块;否则,结束。
步骤三、每个线程各创建一个数据解析模块,对客户端被加载的数据进行解析,按行切分为字段数据,传输给该线程申请的加载器;
数据解析模块申请获取一个加载器用于加载数据;数据解析模块解析文件时,需要预先申请内存用于放置解析出来的一行数据,这一行数据再交给数据校验模块,数据校验模块根据数据的真实长度,再申请合适的内存装下该行数据,交给数据缓存模块。
如图3所示,具体步骤如下:
步骤301、根据被加载数据的指定位置,将客户端要加载的数据导入到数据文件目录r中;
步骤302、数据解析模块读取客户端被加载的数据文件目录r;
步骤303、从当前目录r中依次获取当前文件f的行数据;
步骤304、按指定分隔符将当前行数据d切分为字段v;并将字段v传输给该线程中的加载器;
步骤305、重复读取当前文件f的下一行数据,直至将当前文件f的所有数据都传输给加载器;
步骤306、重复读取目录r中的下一个文件,返回步骤303,直至该目录r中所有文件读取完成。
步骤四、每个加载器收到字段数据后,分别调用数据校验模块进行检验并传输给数据缓存模块;
数据校验模块的流程是将加载器提交的字段数据进行校验,如果类型符合的字段,则拷贝到由数据缓存模块提供的内存中,是一个内存移动的过程。
数据校验模块存有初始化的数据仓库节点列表,并与N个分布式数据仓库相连接,每个分布式数据仓库各有一个用于存储数据的结构,形成各自的表结构,对应N个具体表名;数据校验模块获取初始化时指定的N个表名,获取N个数据结构信息,并利用每个表结构,用来校验对比收到的加载数据格式和结构是否满足存储结构的要求,并将校验正确的数据传给数据缓存模块。
如图4所示,具体为:
步骤401:首先数据校验模块根据服务端的N个指定表名创建N个类型校验器;
步骤402:将每个加载器的字段数据,按服务端预定的N个指定表名分别进入N个类型校验器;
步骤403:分别判断每个字段数据的类型校验是否成功,如果成功,说明该字段数据符合服务端预定的指定表类型,则进入步骤404,否则返回调用者错误信息,结束。
步骤404:根据服务端N个指定表名,对字段数据进行格式化补全,并转化格式类型;
使用数据校验模块校验数据类型是否合法,并根据数据内容计算特定分区值,用于选择分布式数据仓库节点,不同的数据可以分配到不同的数据仓库节点,实现负载均衡。
步骤五、每个加载器将检验后的字段数据,调用数据缓存模块进行缓存管理并传给数据传输模块。
数据缓存模块申请内存用于放置转化格式类型后的检验数据;随加载器管理模块而启动,根据分布式数据仓库节点总数预算内存使用量,用于创建数据缓存模块,数据缓存模块根据分布式数据仓库的总数确定自己的缓存数量,根据缓存总数量而预估内存使用量,申请适量的内存,然后交由加载器使用,在数据类型判断过程中如果内存不够重新申请,最后数据量达到阀值后将数据交给数据传输模块,成功发送结束,内存可以继续使用,这样就减少了内存申请的频繁度,数据缓存模块用于降低数据序列化的压力,以及减少频繁的数据发送请求,使整个发送环节和内存的整体占用情况处于可调控状态。
首先,初始化数据缓存模块,并创建容器,等接收到需要缓存的检验数据后,将检验数据放入与指定表名对应的容器中,并标记缓存数量;在缓存数量达到上限值时将数据进行序列化,并传给数据传输模块。
分布式数据仓库缓存数量是数据缓存模块根据可用的分布式数据仓库总量确定;比如加载器只分配了1G内存,然后分布式数据仓库节点有4个,针对每个节点的数据缓存只有256M,这样缓存模块最多缓存256M就必须将数据发给分布式数据仓库节点。
序列化是将结构化数据进行一定规则的二进制编码,通过网络传输后按该规则重新反序列化,得到原始的结构化数据。
如图6所示,数据缓存模块的具体步骤如下:
步骤501、根据分布式仓库数据节点总数以及缓存总数量建立内存矩阵;
每个内存矩阵分别对应每一个分布式数据仓库节点,预申请的内存长度保存在内存矩阵中;
步骤502、加载器开始申请内存,用于在数据校验流程中内存拷贝;
步骤503、从分布式节点监听模块中获取一个健康节点序号对应内存矩阵中一点;
步骤504、根据健康节点序号将数据分类缓存;
步骤505、根据节点序号判断对应节点缓存量是否达到上限,如果达到上限则进入步骤506,否则执行结束;
步骤506:将该节点缓存数据进行序列化,并提交到数据传输模块,执行结束;
应该注意到并理解,数据缓存模块中的内存并没有被频繁的释放和重新申请,这样有效提高了整个处理流程的效率。
步骤六、分布式节点监听模块获取每个分布式数据仓库的监听状态,并发送给数据传输模块等待查阅;
如图7所示,具体为:分布式节点监听模块启动监听服务器,并启动分布式数据仓库的连接;当某分布式数据仓库启动后,向监听服务器进行注册,监听服务器获取该分布式数据仓库的状态信息,从而分布式节点监听模块获取所有N个分布式数据仓库的健康状态,并保存在内存中,等待数据传输模块查阅;
加载器申请获取各节点信息;判断当前是否有节点a可以用,如果没有节点可以用,则重新获取所有节点状态信息,如果有,判断节点a状态是否正常,如果不正常,重新申请另一个节点。如果正常,将节点a交给加载器使用,执行完毕。
监听服务器是一个不断循环监听其他节点的服务;
步骤七、数据传输模块收到缓存数据后,查阅健康的分布式数据仓库并发送数据,实现负载均衡和链路冗余的功能。
分布式节点监听模块创建监听状态,并保存在内存中,实时监听N个分布式数据仓库的健康情况,并发送给数据传输模块等待数据传输模块查阅;数据传输模块根据收到的缓存数据,按预定发送地址发送给数据仓库节点;并判断是否发送成功,如果发送成功,记录发送日志后,执行结束。否则,向分布式节点监听模块重新申请健康的数据仓库节点重新发送。
如图8所示,具体步骤如下:
步骤701:首先与分布式数据仓库各节点建立连接,准备工作完成;
步骤702:收到由数据缓存模块提交的数据,并按预定发送地址进行发送;
步骤703:判断是否发送成功,如果发送成功后记录发送日后,执行结束;否则,进入步骤704;
步骤704:向分布式节点监听模块重新申请健康的节点,并重新发送数据。
本发明分别建立多个加载器并集中管理,采用数据缓存模块对内存进行可伸缩重复利用,避免频繁的申请和释放内存提高内存使用效率,并且具有集群节点监听模型可以及时的在健康和非健康节点之间快速切换,有效提高了发送成功率,具有很强的实用性,应用范围和应用前景。

Claims (7)

1.一种面向分布式数据仓库的高效加载客户端实现方法,其特征在于:具体步骤如下:
步骤一、对某个含有1个客户端和N个服务端的系统,初始化系统启动参数;
系统启动参数包括:同时运行加载器的数量,指定被加载数据的位置,数据仓库节点列表和服务端指定数据加载的N个具体表名;
步骤二、加载器管理模块根据主线程创建加载器并初始化,每个线程各申请一个加载器;
步骤三、每个线程各创建一个数据解析模块,对被加载的客户端数据进行解析,按行切分为字段数据,传输给该线程申请的加载器;
步骤四、每个加载器收到字段数据后,分别调用数据校验模块进行检验;
数据校验模块根据初始化时的N个指定表名,向分布的各数据仓库节点申请每个指定表的结构信息,等待用以校验加载数据的格式是否正确;
步骤五、每个加载器将检验后的字段数据,缓存到数据缓存模块进行管理并传输给数据传输模块;
步骤六、分布式节点监听模块获取每个分布式数据仓库的监听状态,并发送给数据传输模块等待查阅;
步骤七、数据传输模块收到缓存数据后,查阅健康的分布式数据仓库并发送数据,实现负载均衡和链路冗余的功能。
2.如权利要求1所述的一种面向分布式数据仓库的高效加载客户端实现方法,其特征在于:所述步骤二中创建加载器的数量为初始化参数中需要同时运行加载器的数量。
3.如权利要求1所述的一种面向分布式数据仓库的高效加载客户端实现方法,其特征在于:所述步骤三具体为:
步骤301、根据被加载数据的指定位置,将客户端的数据加载到数据文件目录r中;
步骤302、数据解析模块读取客户端被加载的数据文件目录r;
步骤303、从当前目录r中依次获取当前文件f的行数据;
步骤304、按指定分隔符将当前行数据d切分为字段v;并将字段v传输给该线程中的加载器;
步骤305、重复读取当前文件f的下一行数据,直至将当前文件f的所有数据都传输给加载器;
步骤306、重复读取目录r中的下一个文件,返回步骤303,直至该目录r中所有文件读取完成。
4.如权利要求1所述的一种面向分布式数据仓库的高效加载客户端实现方法,其特征在于:所述步骤四具体为:
步骤401:数据校验模块根据服务端的N个指定表名创建N个类型校验器;
步骤402:将每个加载器的字段数据,按服务端预定的N个指定表名分别进入N个类型校验器;
步骤403:分别判断每个字段数据的类型校验是否成功,如果成功,说明该字段数据符合服务端预定的指定表类型,则进入步骤404,否则返回调用者错误信息,结束。
步骤404:根据服务端N个指定表名,对字段数据进行格式化补全,并转化格式类型。
5.如权利要求1所述的一种面向分布式数据仓库的高效加载客户端实现方法,其特征在于:所述步骤五具体为:首先,数据缓存模块根据分布式数据仓库数量和缓存数量建立内存矩阵;每个内存矩阵分别对应一个分布式数据仓库,预申请的内存长度保存在内存矩阵中;然后,加载器根据指定表名,将检验后的字段数据放入到对应的内存矩阵中,并标记缓存数量;最后,判断各内存矩阵的缓存数量是否达到上限,如果是,将检验后的字段数据进行序列化,并传输给数据传输模块,否则,继续将检验后的字段数据放入到对应的内存矩阵中。
6.如权利要求1所述的一种面向分布式数据仓库的高效加载客户端实现方法,其特征在于:所述步骤六具体为:分布式节点监听模块启动监听服务器,并等待分布式数据仓库的连接;当某分布式数据仓库启动后,向监听服务器进行注册,监听服务器获取该分布式数据仓库的状态信息,从而分布式节点监听模块获取所有N个分布式数据仓库的健康状态,并保存在内存中,等待数据传输模块查阅。
7.如权利要求1所述的一种面向分布式数据仓库的高效加载客户端实现方法,其特征在于:所述步骤七具体为:
数据传输模块根据收到的缓存数据,按预定发送地址发送数据给分布式数据仓库;并判断是否发送成功,如果发送成功,记录发送日志后,执行结束;否则,向分布式节点监听模块重新申请健康的分布式数据仓库节点重新发送。
CN201610849787.8A 2016-09-26 2016-09-26 一种面向分布式数据仓库的加载客户端实现方法 Active CN106446168B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610849787.8A CN106446168B (zh) 2016-09-26 2016-09-26 一种面向分布式数据仓库的加载客户端实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610849787.8A CN106446168B (zh) 2016-09-26 2016-09-26 一种面向分布式数据仓库的加载客户端实现方法

Publications (2)

Publication Number Publication Date
CN106446168A true CN106446168A (zh) 2017-02-22
CN106446168B CN106446168B (zh) 2019-11-01

Family

ID=58170397

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610849787.8A Active CN106446168B (zh) 2016-09-26 2016-09-26 一种面向分布式数据仓库的加载客户端实现方法

Country Status (1)

Country Link
CN (1) CN106446168B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107247770A (zh) * 2017-06-05 2017-10-13 广东亿迅科技有限公司 基于zookeeper的全局序列生成方法及装置
CN107908672A (zh) * 2017-10-24 2018-04-13 深圳前海微众银行股份有限公司 基于Hadoop平台的应用报表实现方法、设备及存储介质
CN109649440A (zh) * 2019-01-23 2019-04-19 中南民族大学 一种面向列车接近预警系统的数据采集方法和系统
CN110069483A (zh) * 2017-08-17 2019-07-30 阿里巴巴集团控股有限公司 装载数据到分布式数据仓库的方法、节点和系统
CN111736989A (zh) * 2020-06-05 2020-10-02 南京邮电大学 多模式分布式集群gpu指标检测方法及系统
CN112527497A (zh) * 2020-12-02 2021-03-19 武汉育知联信息科技有限公司 一种序列化多线程数据处理系统
CN112882770A (zh) * 2021-03-04 2021-06-01 中国航空工业集团公司西安航空计算技术研究所 一种分布式处理系统数据加载升级框架及方法
CN117112104A (zh) * 2023-08-24 2023-11-24 浙江远算科技有限公司 基于远程桌面网关的本地存储映射方法、设备和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101582090A (zh) * 2009-07-07 2009-11-18 北京黑米世纪信息技术有限公司 一种基于web分析的分布式处理方法和系统
CN102214236A (zh) * 2011-06-30 2011-10-12 北京新媒传信科技有限公司 一种海量数据处理方法和系统
CN102467570A (zh) * 2010-11-17 2012-05-23 日电(中国)有限公司 用于分布式数据仓库的连接查询系统和方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101582090A (zh) * 2009-07-07 2009-11-18 北京黑米世纪信息技术有限公司 一种基于web分析的分布式处理方法和系统
CN102467570A (zh) * 2010-11-17 2012-05-23 日电(中国)有限公司 用于分布式数据仓库的连接查询系统和方法
CN102214236A (zh) * 2011-06-30 2011-10-12 北京新媒传信科技有限公司 一种海量数据处理方法和系统

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107247770A (zh) * 2017-06-05 2017-10-13 广东亿迅科技有限公司 基于zookeeper的全局序列生成方法及装置
CN110069483B (zh) * 2017-08-17 2023-04-28 阿里巴巴集团控股有限公司 装载数据到分布式数据仓库的方法、节点和系统
CN110069483A (zh) * 2017-08-17 2019-07-30 阿里巴巴集团控股有限公司 装载数据到分布式数据仓库的方法、节点和系统
CN107908672A (zh) * 2017-10-24 2018-04-13 深圳前海微众银行股份有限公司 基于Hadoop平台的应用报表实现方法、设备及存储介质
CN109649440A (zh) * 2019-01-23 2019-04-19 中南民族大学 一种面向列车接近预警系统的数据采集方法和系统
CN109649440B (zh) * 2019-01-23 2019-11-22 中南民族大学 一种面向列车接近预警系统的数据采集方法和系统
CN111736989A (zh) * 2020-06-05 2020-10-02 南京邮电大学 多模式分布式集群gpu指标检测方法及系统
CN111736989B (zh) * 2020-06-05 2022-10-14 南京邮电大学 多模式分布式集群gpu指标检测方法及系统
CN112527497A (zh) * 2020-12-02 2021-03-19 武汉育知联信息科技有限公司 一种序列化多线程数据处理系统
CN112527497B (zh) * 2020-12-02 2024-02-13 武汉育知联信息科技有限公司 一种序列化多线程数据处理系统
CN112882770A (zh) * 2021-03-04 2021-06-01 中国航空工业集团公司西安航空计算技术研究所 一种分布式处理系统数据加载升级框架及方法
CN112882770B (zh) * 2021-03-04 2024-01-12 中国航空工业集团公司西安航空计算技术研究所 一种分布式处理系统数据加载升级框架及方法
CN117112104A (zh) * 2023-08-24 2023-11-24 浙江远算科技有限公司 基于远程桌面网关的本地存储映射方法、设备和介质
CN117112104B (zh) * 2023-08-24 2024-03-29 浙江远算科技有限公司 基于远程桌面网关的本地存储映射方法、设备和介质

Also Published As

Publication number Publication date
CN106446168B (zh) 2019-11-01

Similar Documents

Publication Publication Date Title
CN106446168A (zh) 一种面向分布式数据仓库的高效加载客户端实现方法
EP3669526B1 (en) Managing subscriptions for event notifications
CN101325561B (zh) 一种处理电子邮件的方法、装置及系统
CN102202102B (zh) 基于云计算架构的网络服务聚合系统及其聚合方法
US8200628B2 (en) Multi-tenancy data storage and access method and apparatus
CN104202423B (zh) 一种通过软件架构扩展缓存的系统
CN103338252B (zh) 一种分布式数据库并发存储虚拟请求机制的实现方法
CN113839977B (zh) 消息推送方法、装置、计算机设备及存储介质
WO2021190087A1 (zh) 任务执行方法、装置、系统和服务器
CN105025053A (zh) 基于云存储技术的分布式文件的上传方法及其系统
US11743333B2 (en) Tiered queuing system
CN102355426A (zh) 实现离线文件传输的方法和系统
US20130346537A1 (en) Storage optimization technology
US20100011364A1 (en) Data Storage in Distributed Systems
CN106453576B (zh) 一种基于混合云平台的交互方法、系统及调度中心
CN102104617A (zh) 一种网站运营系统存储海量图片数据的方法
CN111935227A (zh) 通过浏览器上传文件的方法、浏览器和电子设备
CN104144202B (zh) Hadoop分布式文件系统的访问方法、系统和装置
CN105681426B (zh) 异构系统
CN108900627B (zh) 一种网络请求方法、终端装置及存储介质
CN112346871A (zh) 一种请求处理方法及微服务系统
CN108519987A (zh) 一种数据持久化方法和装置
CN106940712A (zh) 序列生成方法与设备
CN104731660A (zh) 数据分配方法、装置和系统
CN106570011A (zh) 一种分布式爬虫url种子分发方法、调度节点及抓取节点

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant