CN107132992A - 一种海量数据的处理方法及其装置 - Google Patents

一种海量数据的处理方法及其装置 Download PDF

Info

Publication number
CN107132992A
CN107132992A CN201610108996.7A CN201610108996A CN107132992A CN 107132992 A CN107132992 A CN 107132992A CN 201610108996 A CN201610108996 A CN 201610108996A CN 107132992 A CN107132992 A CN 107132992A
Authority
CN
China
Prior art keywords
data
business
processing
information
demand
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610108996.7A
Other languages
English (en)
Other versions
CN107132992B (zh
Inventor
叶国俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201610108996.7A priority Critical patent/CN107132992B/zh
Publication of CN107132992A publication Critical patent/CN107132992A/zh
Application granted granted Critical
Publication of CN107132992B publication Critical patent/CN107132992B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0608Saving storage space on storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0652Erasing, e.g. deleting, data cleaning, moving of data to a wastebasket
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种海量数据的处理方法及其装置,应用于服务器端,所述方法包括:接收各业务的数据需求,以及各业务对所述数据的不同调度要求信息;根据针对所述数据需求预设的合并策略及其调度要求信息,对所述各业务的数据需求进行合并打包,形成数据需求指令集;推送所述数据需求指令集至各系统,以获得与所述指令集对应的数据;存储各系统发送的数据,并调度所述数据进行对应的业务处理。本申请能够优化海量数据的处理过程,节约了计算资源和存储资源。

Description

一种海量数据的处理方法及其装置
技术领域
本申请涉及互联网技术领域,尤其涉及一种海量数据的处理方法及其装置。
背景技术
随着互联网技术的发展,在支持各类业务需求的情况下,通常需要对海量数据的进行重复利用和网络资源的合理优化。
由于网站的流量上升,每天产生的数据到了PB级别,需要处理这些数据的存储和计算资源是相当可观的。而且如果没有对数据做统一管理,各个业务都需要对这PB级别的数据进行复制、过滤、转储,造成了计算资源、存储资源的浪费。
假设:1PB数据需要100台计算机器和100台存储机器,则
A业务(比如风控)如需要分析这1PB数据,则需要200台以内的机器;
B业务(比如营销1)如需要分析这1PB数据,则需要200台以内的机器;
C业务(比如营销2)如需要分析这1PB数据,则需要200台以内的机器;
D业务(比如离线)如需要分析这1PB数据,则需要200台以内的机器。
实际这类场景很多,每个业务需要数据的时候都从源头取数据,当业务越来越多的时候,比如接了100个业务,就需要2万台机器。
因此,如何优化海量数据的处理过程成为亟需解决的技术问题。
发明内容
有鉴于此,本申请提供一种海量数据的处理方法及其装置,其能够优化海量数据的处理过程,节约了计算资源和存储资源。
本申请提供一种海量数据的处理方法,应用于服务器端,所述方法包括:
接收各业务处理的数据需求,以及所述数据需求的调度要求信息;
根据针对所述数据需求预设的合并策略及其调度要求信息,对所述各业务的数据需求进行合并打包,形成数据需求指令集;
推送所述数据需求指令集至各系统,以获得与所述指令集对应的数据;
存储各系统发送的数据,并调度所述数据进行对应的业务处理。
在本申请一具体实施例中,所述数据的调度要求信息包括:优先级信息、延时处理信息以及灾备处理信息。
在本申请一具体实施例中,所述合并规则为:
如所述数据需求需要立即处理,或者所述数据需求为高保证,则所述优先级信息和所述灾备处理信息归并后的处理级别为高,所述延时处理信息取最小值。
在本申请一具体实施例中,所述根据针对所述数据需求预设的合并策略及其调度要求信息,对所述各业务的数据需求进行合并打包,形成数据需求指令集之前还包括:
约定各系统数据的数据格式。
在本申请一具体实施例中,所述推送所述数据需求指令集至各系统,以获得与所述指令集对应的数据还包括:
根据集群处理能力,按照所述数据的等级,接收各系统传输的所述数据。
在本申请一具体实施例中,所述推送所述数据需求指令集至各系统,获得与所述指令集对应的数据还包括:
根据服务器端的集群处理能力,分配各通道数据传输的资源开销比例,以保证各业务处理的运行。
在本申请一具体实施例中,所述存储各系统发送的数据,并调度所述数据进行对应的业务处理包括:
存储各系统发送的数据;
查询所存储数据的索引值,获取对应的数据并进行业务处理;
若全部业务处理完成,则将索引值标记为可删除,根据所述标记对索引空间和数据空间进行安全释放。
本申请提供一种海量数据的处理装置,应用于服务器端,所述方法包括:
接收模块,用于接收各业务处理的数据需求,以及所述数据需求的调度要求信息;
注册模块,用于根据针对所述数据需求预设的合并策略及其调度要求信息,对所述各业务的数据需求进行合并打包,形成数据需求指令集;
发送模块,用于推送所述数据需求指令集至各系统,以获得与所述指令集对应的数据;
调度模块,用于存储各系统发送的数据,并调度所述数据进行对应的业务处理。
在本申请一具体实施例中,所述数据的调度要求信息包括:优先级信息、延时处理信息以及灾备处理信息。
在本申请一具体实施例中,所述合并规则为:
如所述数据需求需要立即处理,或者所述数据需求为高保证,则所述优先级信息和所述灾备处理信息归并后的处理级别为高,所述延时处理信息取最小值。
在本申请一具体实施例中,注册模块还用于约定各系统数据的数据格式。
在本申请一具体实施例中,所述发送模块还用于根据集群处理能力,按照所述数据的等级,接收各系统传输的所述数据。
在本申请一具体实施例中,所述发送模块还用于根据服务器端的集群处理能力,分配各通道数据传输的资源开销比例,保证各业务处理的运行。
在本申请一具体实施例中,所述调度模块包括:
存储单元,用于存储各系统发送的数据;
查询单元,用于查询所存储数据的索引值,获取对应的数据并进行业务处理;
回收单元,用于若全部业务处理完成,则将索引值标记为可删除,根据所述标记对索引空间和数据空间进行安全释放。
由以上技术方案可见,本申请接收各业务处理的数据需求及其调度要求信息,并根据针对所述数据需求预设的合并策略及其调度要求信息,对各数据需求进行合并打包,形成数据需求指令集。从而,根据所述数据需求指令集获得与所述指令集对应的数据,并调度所述数据进行对应的业务处理。本申请能够优化海量数据的处理过程,节约了计算资源和存储资源。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是本申请所应用分布式服务器的硬件结构图;
图2是本申请一种海量数据的处理方法的流程图;
图3是本申请一种海量数据的处理方法中步骤S4的流程图;
图4是本申请一种海量数据的处理装置的结构图;
图5是本申请一种海量数据的处理装置中调度模块的结构图。
具体实施方式
本申请接收各业务处理的数据需求及其调度要求信息,并根据针对所述数据需求预设的合并策略及其调度要求信息,对各数据需求进行合并打包,形成数据需求指令集。从而,根据所述数据需求指令集获得与所述指令集对应的数据,并调度所述数据进行对应的业务处理。本申请能够优化海量数据的处理过程,节约了计算资源和存储资源。
当然,实施本申请的任一技术方案必不一定需要同时达到以上所述的所有优点。
为了使本领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本申请保护的范围。
本申请提供一种海量数据的处理方法,应用于分布式服务器,参看图1,分布式服务器1的硬件结构包括控制器11、存储器12以及其他硬件13。
参看图2,本申请所述方法2包括:
S1、接收各业务处理的数据需求,以及所述数据需求的调度要求信息。
所述数据的调度要求信息包括:优先级信息、延时处理信息以及灾备处理信息。
具体地,优先级信息:
对应位为1,则表示立即处理,对应位为0,则表示延时处理。
延时处理信息:
0档,1档,2档,3档,4档,5档。这些档位对应不同的延时时间。需要说明的是,如果是0档,就表示无延时。
灾备处理:
对应位为1,表示高保证,对应位为0,表示允许丢弃。
在本申请一具体实现中,接收业务1、业务2、业务3、业务4的数据需求,以及所述数据需求的调度要求信息。
业务1,需要立即处理且无延时且高保证,需要系统1的data11数据和系统2的data21数据。
业务2,需要立即处理且无延时且允许丢弃,需要系统2的data22数据和系统3的data32数据。
业务3,需要延时处理且2s延时且高保证,需要系统1的data11数据和系统2的data22数据。
业务4,需要延时处理且3s延时且允许丢弃,需要系统1的data12数据、系统2的data23数据和系统3的data33数据。
上面描述的整理表格表一所述。
表一:
具体地,为了保证各业务对各系统的数据的理解是相同的,所以需要有元数据中心来约定各系统数据的数据格式。
S2、根据针对所述数据需求预设的合并策略及其调度要求信息,对所述各业务的数据需求进行合并打包,形成数据需求指令集。
所述合并规则为:
如所述数据需求需要立即处理,或者所述数据需求为高保证,则所述优先级信息和所述灾备处理信息归并后的处理级别为高,所述延时处理信息取最小值。
具体的,根据表一所述优先级信息和所述灾备处理信息,所述约定合并规则为所述优先级信息和所述灾备处理信息取逻辑或计算,所述延时处理信息取最小值。
具体地,将步骤S1中的数据需求进行合并打包,如表二所示。
表二:
S3、推送所述数据需求指令集至各系统,以获得与所述指令集对应的数据。
具体地,所述系统嵌入客户端软件,在系统启动时或者接收到所述服务器发送的数据需求指令集,在系统内部进行计算与数据收集,将与所述指令集对应的数据发送至所述服务器。
具体地,对于系统1表二中的Data11数据(1,0档,1),收集到一条就立即往服务器传输一条。对于系统1表二中的Data12数据(0,3档,0),收集到一条会先暂存,等到阀值(时间、容量、数量等)到达3档,再往服务端上传数据。
对于系统2表二中的Data21数据、Data22数据(1,0档,1),收集到一条就立即往服务器传输一条。对于系统2表二中的Data23数据(0,3档,0),收集到一条会先暂存,等到阀值(时间、容量、数量等)到达3档,再往服务端上传数据。
对于系统3表二中的Data32数据(1,0档,0),收集到一条就立即往服务器传输一条。对于系统2表二中的Data33数据(0,3档,0),收集到一条会先暂存,等到阀值(时间、容量、数量等)到达3档,再往服务端上传数据。
对于系统客户端立即往服务器传输的数据,通过前几次数据传输和服务端调度,可以算出一个最优传输路径,然后生成一个令牌给系统的客户端,形成客户端和服务端的高速通道,以获得最小的延时。
系统客户端启动的时候会根据自身的CPU、磁盘、操作系统的位数,算出本地缓存的限值。当即将超过本地缓存的限值时,客户端申请服务器端的快速通道资源令牌,通过服务器端的快速通道将超过本地缓存的数据存储到额外的存储器中。服务器端的快速通道用于紧急数据的处理。
为了保证业务处理得到精准的数据,可在所述客户端和服务器端接收数据时进行数据预处理。数据预处理包括:运算、排序、归并操作。比如,某业务是实时统计各类支付渠道使用银行卡进行支付时,各银行支付的总额。如果每笔交易都发到服务端通过流式计算对每秒百万级的数据进行过滤、统计,需要一个较大的集群支持。如果在客户端做预处理,比如,对本机的银行卡交易做过滤、1秒内汇总,则可以节约大量的服务器计算资源。
具体地,服务器端根据其集群处理能力,按照所述数据的等级,接收各系统传输的所述数据。即,优先级信息和延时处理信息高级别,灾备处理信息高保证的数据低延时处理;优先级信息和延时处理信息低级别,灾备处理信息低保证的数据高延时处理。
根据服务器端的集群处理能力,分配各通道数据传输的资源开销比例,保证各业务处理的运行。
服务器端会根据集群能力预先分配经各通道接收客户端所发送数据的资源开销比例,保证各业务处理的正常运行。
具体地,各通道包括:立即处理、延时处理、快速通道,预先分配器资源开销的比例,比如(50%,40%,10%)。在上线过程中,保证业务处理单元在可控范围内运行。所述资源分配在集群运行期会被自动优化。
服务器端的灾备策略先对可以延时处理的通道做降级,然后对即时处理可以丢弃数据做降级,最后对快速通道入口做降级。
服务端会对数据通道资源监控,通过一定的算法调整通道资源。
所述算法主要功能是均衡通道资源,其原理与负载均衡算法类似,可以结合业务选择改进。比如:响应比优先算法、固定权重算法、加权最少连接算法。
S4、存储各系统发送的数据,并调度所述数据进行对应的业务处理。
在本申请另一具体实现中,参见图3,所述步骤S4包括:
S41、存储各系统发送的数据。
具体地,服务器端存储接收到的全部数据,为了灾备,存储3份全部数据。
S42、查询所存储数据的索引值,获取对应的数据并进行业务处理。
本申请数据索引流向一个环形数据流中,从所述环形流中接收到索引值,获取对应的数据并进行业务处理。
S43、若全部业务处理完成,则将索引值标记为可删除,根据所述标记对索引空间和数据空间进行安全释放。
本申请能够优化海量数据的处理过程,节约了计算资源和存储资源。
对应上述方法,本申请还提供一种海量数据的处理装置,应用于分布式服务器,参看图1,分布式服务器1的硬件结构包括控制器11、存储器12以及其他硬件13。
参看图4,本申请所述装置4包括:
接收模块41,用于接收各业务处理的数据需求,以及所述数据需求的调度要求信息。
注册模块42,用于根据针对所述数据需求预设的合并策略及其调度要求信息,对所述各业务的数据需求进行合并打包,形成数据需求指令集。
发送模块43,用于推送所述数据需求指令集至各系统,以获得与所述指令集对应的数据。
调度模块44,用于存储各系统发送的数据,并调度所述数据进行对应的业务处理。
所述数据的调度要求信息包括:优先级信息、延时处理信息以及灾备处理信息。
具体地,优先级信息:
对应位为1,则表示立即处理,对应位为0,则表示延时处理。
延时处理信息:
0档,1档,2档,3档,4档,5档。这些档位对应不同的延时时间。需要说明的是,如果是0档,就表示无延时。
灾备处理:
对应位为1,表示高保证,对应位为0,表示允许丢弃。
在本申请一具体实现中,接收业务1、业务2、业务3、业务4的数据需求,以及所述数据需求的调度要求信息。
业务1,需要立即处理且无延时且高保证,需要系统1的data11数据和系统2的data21数据。
业务2,需要立即处理且无延时且允许丢弃,需要系统2的data22数据和系统3的data32数据。
业务3,需要延时处理且2s延时且高保证,需要系统1的data11数据和系统2的data22数据。
业务4,需要延时处理且3s延时且允许丢弃,需要系统1的data12数据、系统2的data23数据和系统3的data33数据。
上面描述的整理表格表一所述。
表一:
具体地,为了保证各业务对各系统的数据的理解是相同的,所以需要有元数据中心来约定各系统数据的数据格式。
所述合并规则为:
如所述数据需求需要立即处理,或者所述数据需求为高保证,则所述优先级信息和所述灾备处理信息归并后的处理级别为高,所述延时处理信息取最小值。
具体的,根据表一所述优先级信息和所述灾备处理信息,所述约定合并规则为所述优先级信息和所述灾备处理信息取逻辑或计算,所述延时处理信息取最小值。
具体地,将接收模块41中的数据需求进行合并打包,如表二所示。
表二:
具体地,所述系统嵌入客户端软件,在系统启动时或者接收到所述服务器发送的数据需求指令集,在系统内部进行计算与数据收集,将与所述指令集对应的数据发送至所述服务器。
具体地,对于系统1表二中的Data11数据(1,0档,1),收集到一条就立即往服务器传输一条。对于系统1表二中的Data12数据(0,3档,0),收集到一条会先暂存,等到阀值(时间、容量、数量等)到达3档,再往服务端上传数据。
对于系统2表二中的Data21数据、Data22数据(1,0档,1),收集到一条就立即往服务器传输一条。对于系统2表二中的Data23数据(0,3档,0),收集到一条会先暂存,等到阀值(时间、容量、数量等)到达3档,再往服务端上传数据。
对于系统3表二中的Data32数据(1,0档,0),收集到一条就立即往服务器传输一条。对于系统2表二中的Data33数据(0,3档,0),收集到一条会先暂存,等到阀值(时间、容量、数量等)到达3档,再往服务端上传数据。
对于系统客户端立即往服务器传输的数据,通过前几次数据传输和服务端调度,可以算出一个最优传输路径,然后生成一个令牌给系统的客户端,形成客户端和服务端的高速通道,以获得最小的延时。
系统客户端启动的时候会根据自身的CPU、磁盘、操作系统的位数,算出本地缓存的限值。当即将超过本地缓存的限值时,客户端申请服务器端的快速通道资源令牌,通过服务器端的快速通道将超过本地缓存的数据存储到额外的存储器中。服务器端的快速通道用于紧急数据的处理。
为了保证业务处理得到精准的数据,可在所述客户端和服务器端接收数据时进行数据预处理。数据预处理包括:运算、排序、归并操作。比如,某业务是实时统计各类支付渠道使用银行卡进行支付时,各银行支付的总额。如果每笔交易都发到服务端通过流式计算对每秒百万级的数据进行过滤、统计,需要一个较大的集群支持。如果在客户端做预处理,比如,对本机的银行卡交易做过滤、1秒内汇总,则可以节约大量的服务器计算资源。
具体地,服务器端根据其集群处理能力,按照所述数据的等级,接收各系统传输的所述数据。即,优先级信息和延时处理信息高级别,灾备处理信息高保证的数据低延时处理;优先级信息和延时处理信息低级别,灾备处理信息低保证的数据高延时处理。
根据服务器端的集群处理能力,分配各通道数据传输的资源开销比例,保证各业务处理的运行。
服务器端会根据集群能力预先分配经各通道接收客户端所发送数据的资源开销比例,保证各业务处理的正常运行。
具体地,各通道包括:立即处理、延时处理、快速通道,预先分配器资源开销的比例,比如(50%,40%,10%)。在上线过程中,保证业务处理单元在可控范围内运行。所述资源分配在集群运行期会被自动优化。
服务器端的灾备策略先对可以延时处理的通道做降级,然后对即时处理可以丢弃数据做降级,最后对快速通道入口做降级。
服务端会对数据通道资源监控,通过一定的算法调整通道资源。
所述算法主要功能是均衡通道资源,其原理与负载均衡算法类似,可以结合业务选择改进。比如:响应比优先算法、固定权重算法、加权最少连接算法。
在本申请另一具体实现中,参见图5,所述调度模块44包括:
存储单元441,用于存储各系统发送的数据。
具体地,服务器端存储接收到的全部数据,为了灾备,存储3份全部数据。
查询单元442,用于查询所存储数据的索引值,获取对应的数据并进行业务处理。
本申请数据索引流向一个环形数据流中,从所述环形流中接收到索引值,获取对应的数据并进行业务处理。
回收单元443,用于若全部业务处理完成,则将索引值标记为可删除,根据所述标记对索引空间和数据空间进行安全释放。
本申请能够优化海量数据的处理过程,节约了计算资源和存储资源。
本申请的实施例所提供的装置可通过计算机程序实现。本领域技术人员应该能够理解,上述的单元以及模块划分方式仅是众多划分方式中的一种,如果划分为其他单元或模块或不划分块,只要信息对象的具有上述功能,都应该在本申请的保护范围之内。
本领域的技术人员应明白,本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (14)

1.一种海量数据的处理方法,应用于服务器端,其特征在于,所述方法包括:
接收各业务的数据需求,以及各业务对所述数据的不同调度要求信息;
根据针对所述数据需求预设的合并策略及其调度要求信息,对所述各业务的数据需求进行合并打包,形成数据需求指令集;
推送所述数据需求指令集至各系统,以获得与所述指令集对应的数据;
存储各系统发送的数据,并调度所述数据进行对应的业务处理。
2.根据权利要求1所述的方法,其特征在于,所述数据需求的调度要求信息包括:优先级信息、延时处理信息以及灾备处理信息。
3.根据权利要求2所述的方法,其特征在于,所述合并规则为:
如所述数据需求需要立即处理,或者所述数据需求为高保证,则所述优先级信息和所述灾备处理信息归并后的处理级别为高,所述延时处理信息取最小值。
4.根据权利要求1所述的方法,其特征在于,所述根据针对所述数据需求预设的合并策略及其调度要求信息,对所述各业务的数据需求进行合并打包,形成数据需求指令集之前还包括:
约定各系统数据的数据格式。
5.根据权利要求1所述的方法,其特征在于,所述推送所述数据需求指令集至各系统,以获得与所述指令集对应的数据还包括:
根据集群处理能力,按照所述数据的等级,接收各系统传输的所述数据。
6.根据权利要求1所述的方法,其特征在于,所述推送所述数据需求指令集至各系统,获得与所述指令集对应的数据还包括:
根据服务器端的集群处理能力,分配各通道数据传输的资源开销比例,以保证各业务处理的运行。
7.根据权利要求1所述的方法,其特征在于,所述存储各系统发送的数据,并调度所述数据进行对应的业务处理包括:
存储各系统发送的数据;
查询所存储数据的索引值,获取对应的数据并进行业务处理;
若全部业务处理完成,则将索引值标记为可删除,根据所述标记对索引空间和数据空间进行安全释放。
8.一种海量数据的处理装置,应用于服务器端,其特征在于,所述方法包括:
接收模块,用于接收各业务处理的数据需求,以及所述数据需求的调度要求信息;
注册模块,用于根据针对所述数据需求预设的合并策略及其调度要求信息,对各业务的数据需求进行合并打包,形成数据需求指令集;
发送模块,用于推送所述数据需求指令集至各系统,获得与所述指令集对应的数据;
调度模块,用于存储各系统发送的数据,并调度所述数据进行对应的业务处理。
9.根据权利要求8所述的装置,其特征在于,所述数据的调度要求信息包括:优先级信息、延时处理信息以及灾备处理信息。
10.根据权利要求2所述的装置,其特征在于,所述合并规则为:
如所述数据需求需要立即处理,或者所述数据需求为高保证,则所述优先级信息和所述灾备处理信息归并后的处理级别为高,所述延时处理信息取最小值。
11.根据权利要求8所述的装置,其特征在于,注册模块还用于约定各系统数据的数据格式。
12.根据权利要求8所述的装置,其特征在于,所述发送模块还用于根据集群处理能力,按照所述数据的等级,接收各系统传输的所述数据。
13.根据权利要求8所述的装置,其特征在于,所述发送模块还用于根据服务器端的集群处理能力,分配各通道数据传输的资源开销比例,以保证各业务处理的运行。
14.根据权利要求8所述的装置,其特征在于,所述调度模块包括:
存储单元,用于存储各系统发送的数据;
查询单元,用于查询所存储数据的索引值,以获取对应的数据并进行业务处理;
回收单元,用于若全部业务处理完成,则将索引值标记为可删除,根据所述标记对索引空间和数据空间进行安全释放。
CN201610108996.7A 2016-02-26 2016-02-26 一种海量数据的处理方法及其装置 Active CN107132992B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610108996.7A CN107132992B (zh) 2016-02-26 2016-02-26 一种海量数据的处理方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610108996.7A CN107132992B (zh) 2016-02-26 2016-02-26 一种海量数据的处理方法及其装置

Publications (2)

Publication Number Publication Date
CN107132992A true CN107132992A (zh) 2017-09-05
CN107132992B CN107132992B (zh) 2020-12-15

Family

ID=59721349

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610108996.7A Active CN107132992B (zh) 2016-02-26 2016-02-26 一种海量数据的处理方法及其装置

Country Status (1)

Country Link
CN (1) CN107132992B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109960613A (zh) * 2019-03-11 2019-07-02 中国银联股份有限公司 一种数据批处理的方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101251861A (zh) * 2008-03-18 2008-08-27 北京锐安科技有限公司 一种海量数据加载和查询的方法
CN101833568A (zh) * 2010-04-01 2010-09-15 武汉大学 Web数据管理系统
CN102013996A (zh) * 2010-11-23 2011-04-13 中兴通讯股份有限公司 数据采集管理方法、采集管理系统及电信网络管理系统
US20110222415A1 (en) * 2010-03-15 2011-09-15 Fujitsu Limited Method and system for implementing link adaptation based on mobility
US20120101623A1 (en) * 2010-10-22 2012-04-26 Best Wise International Computing Co., Ltd. Encryption Method of Digital Data, Decryption Method of Encrypted Digital Data, Manufacturing System of Storage Apparatus and Manufacturing Method Thereof
CN103020227A (zh) * 2012-12-13 2013-04-03 中国银行股份有限公司 计算机设备中的数据处理方法和系统
CN103699441A (zh) * 2013-12-05 2014-04-02 深圳先进技术研究院 基于任务粒度的MapReduce报表任务执行方法
US20150169251A1 (en) * 2013-12-12 2015-06-18 Cirrus Data Solutions, Inc. SYSTEMS, APPARATUS, AND METHODS FOR TRANSMITTING DATA AND INSTRUCTIONS USING AN iSCSI COMMAND

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101251861A (zh) * 2008-03-18 2008-08-27 北京锐安科技有限公司 一种海量数据加载和查询的方法
US20110222415A1 (en) * 2010-03-15 2011-09-15 Fujitsu Limited Method and system for implementing link adaptation based on mobility
CN101833568A (zh) * 2010-04-01 2010-09-15 武汉大学 Web数据管理系统
US20120101623A1 (en) * 2010-10-22 2012-04-26 Best Wise International Computing Co., Ltd. Encryption Method of Digital Data, Decryption Method of Encrypted Digital Data, Manufacturing System of Storage Apparatus and Manufacturing Method Thereof
CN102013996A (zh) * 2010-11-23 2011-04-13 中兴通讯股份有限公司 数据采集管理方法、采集管理系统及电信网络管理系统
CN103020227A (zh) * 2012-12-13 2013-04-03 中国银行股份有限公司 计算机设备中的数据处理方法和系统
CN103699441A (zh) * 2013-12-05 2014-04-02 深圳先进技术研究院 基于任务粒度的MapReduce报表任务执行方法
US20150169251A1 (en) * 2013-12-12 2015-06-18 Cirrus Data Solutions, Inc. SYSTEMS, APPARATUS, AND METHODS FOR TRANSMITTING DATA AND INSTRUCTIONS USING AN iSCSI COMMAND

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
翁祖泉等: "基于物联网海量数据处理的数据库技术分析与研究", 《物联网技术》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109960613A (zh) * 2019-03-11 2019-07-02 中国银联股份有限公司 一种数据批处理的方法及装置
CN109960613B (zh) * 2019-03-11 2023-05-12 中国银联股份有限公司 一种数据批处理的方法及装置

Also Published As

Publication number Publication date
CN107132992B (zh) 2020-12-15

Similar Documents

Publication Publication Date Title
CN110727512B (zh) 集群资源调度方法、装置、设备及储存介质
CA2897338C (en) Data stream splitting for low-latency data access
CN102469033B (zh) 一种消息订阅系统以及消息发送方法
CN108989238A (zh) 一种分配业务带宽的方法以及相关设备
JP5121936B2 (ja) リソース割り当て装置及びリソース割り当てプログラム及び記録媒体及びリソース割り当て方法
CN103473121A (zh) 一种基于云计算平台的海量图片并行处理方法
CN107621973A (zh) 一种跨集群的任务调度方法及装置
CN106815254A (zh) 一种数据处理方法和装置
CN111880939A (zh) 容器动态迁移方法、装置及电子设备
CN108270805B (zh) 用于数据处理的资源分配方法及装置
CN105589750A (zh) 一种cpu资源调度方法和服务器
CN105843687A (zh) 一种任务资源的量化方法和装置
CN111813573B (zh) 管理平台与机器人软件的通信方法及其相关设备
CN106713396A (zh) 服务器调度方法和系统
CN103503412A (zh) 用于调度资源的方法及装置
CN112306661A (zh) 任务调度方法、装置、电子设备及可读存储介质
CN103270520A (zh) 基于重要性类的数据管理
CN110221914B (zh) 文件处理方法及装置
CN102156722A (zh) 一种大批量数据处理系统及方法
CN109347982A (zh) 一种数据中心的调度方法及装置
CN107132992A (zh) 一种海量数据的处理方法及其装置
CN107395446A (zh) 日志实时处理系统
CN116402318A (zh) 面向配电网的多级算力资源分配方法、装置及网络架构
CN107704320B (zh) 一种分布式系统的任务分配方法及系统
CN116095074A (zh) 资源分配方法、装置、相关设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200928

Address after: 27 Hospital Road, George Town, Grand Cayman ky1-9008

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: 27 Hospital Road, George Town, Grand Cayman ky1-9008

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200928

Address after: 27 Hospital Road, George Town, Grand Cayman ky1-9008

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

GR01 Patent grant
GR01 Patent grant