CN107357639A - 一种分布式处理系统、数据处理的方法及设备 - Google Patents

一种分布式处理系统、数据处理的方法及设备 Download PDF

Info

Publication number
CN107357639A
CN107357639A CN201610303417.4A CN201610303417A CN107357639A CN 107357639 A CN107357639 A CN 107357639A CN 201610303417 A CN201610303417 A CN 201610303417A CN 107357639 A CN107357639 A CN 107357639A
Authority
CN
China
Prior art keywords
performance data
node
calculate node
pending
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610303417.4A
Other languages
English (en)
Other versions
CN107357639B (zh
Inventor
马靖波
裴泽良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Tencent Cloud Computing Beijing Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610303417.4A priority Critical patent/CN107357639B/zh
Priority to KR1020187032480A priority patent/KR102126320B1/ko
Priority to EP17795491.4A priority patent/EP3457278B1/en
Priority to PCT/CN2017/083171 priority patent/WO2017193873A1/zh
Publication of CN107357639A publication Critical patent/CN107357639A/zh
Priority to US15/962,653 priority patent/US10432455B2/en
Application granted granted Critical
Publication of CN107357639B publication Critical patent/CN107357639B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/465Distributed object oriented systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/10Network architectures or network communication protocols for network security for controlling access to devices or network resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • H04L67/63Routing a service request depending on the request content or context
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/20Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
    • H04W4/21Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel for social networking applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/20Network architectures or network communication protocols for network security for managing network security; network security policies in general

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种分布式处理系统、数据处理的方法及设备。分布式处理系统包括控制节点、第一计算节点和第二计算节点,控制节点获取待处理特性数据的类型和特性标识,类型用于标识待处理特性数据的归属计算节点,归属计算节点为第一计算节点或第二计算节点;控制节点根据特性标识,确定进程索引信息,控制节点根据进程索引信息,向归属计算节点的处理进程调度待处理特性数据的数据索引信息或者待处理特性数据,数据索引信息用于归属计算节点获取待处理特性数据,以使归属计算节点处理待处理特性数据。本发明实施例提供的一种分布式处理系统、数据处理的方法及设备,通过分布式的处理方式完成特性数据的计算,从而缩短了处理时间。

Description

一种分布式处理系统、数据处理的方法及设备
技术领域
本发明涉及计算机技术领域,具体涉及一种分布式处理系统、数据处理的方法及设备。
背景技术
维度是指监控对象的某一个属性,可以是地区、机房、运营商,也可以是接口和错误码等。
特性是指一种或者多种维度的组合所对应的某个指标。
特性树主要是指根据业务需求,把监控粒度较小的监控对象按照不同的规则逐层汇聚成粒度较大的监控对象的过程中,由所有参与的监控对象和关系所组成的一张有向图。
特性树的计算主要是指一分钟内把特性树的下层特性数据按不同的方式,例如:求和、求平均或求商等逐层汇聚成上层特性数据的处理过程。
现有技术下,针对特性数据的处理过程主要是通过单台机器预先负责把所有特性数据生成一颗颗的特性树,然后再以特性树为单位进行计算,该方案面临处理时间长、单机性能有限和特性更新速度缓慢等问题。
发明内容
为了解决现有技术特性树的处理方案中,处理时间长而且单机性能有限的问题,本发明实施例提供一种分布式处理系统、数据处理的方法及设备,通过分布式的处理方式,不需要构建特性树,就可以完成特性数据的计算,从而缩短了处理时间,而且不需要将特性树放在一个单机上进行处理,克服了单机性能有限的问题。
本发明第一方面提供一种分布式处理系统,包括:控制节点、第一计算节点和第二计算节点,所述第一计算节点用于处理终端上报的特性数据和所述控制节点分配的特性数据,所述第二计算节点用于处理所述第一计算节点产生的特性数据和所述控制节点分配的特性数据;
所述控制节点获取待处理特性数据的类型和特性标识,所述类型用于标识所述待处理特性数据的归属计算节点,所述归属计算节点为所述第一计算节点或所述第二计算节点;
所述控制节点根据所述特性标识,确定进程索引信息,所述进程索引信息用于指示所述待处理特性数据在所述归属计算节点上所属的处理进程;
所述控制节点根据所述进程索引信息,向所述归属计算节点的所述处理进程调度所述待处理特性数据的数据索引信息或者所述待处理特性数据,所述数据索引信息用于所述归属计算节点获取所述待处理特性数据;
所述归属计算节点处理所述待处理特性数据,得到处理后的特性数据。
本发明第二方面提供一种数据处理的方法,所述方法应用于分布式处理系统,所述分布式处理系统包括控制节点、第一计算节点和第二计算节点,所述第一计算节点用于处理终端上报的特性数据和所述控制节点分配的特性数据,所述第二计算节点用于处理所述第一计算节点产生的特性数据和所述控制节点分配的特性数据,所述方法包括:
所述控制节点获取待处理特性数据的类型和特性标识,所述类型用于标识所述待处理特性数据的归属计算节点,所述归属计算节点为所述第一计算节点或所述第二计算节点;
所述控制节点根据所述特性标识,确定进程索引信息,所述进程索引信息用于指示所述待处理特性数据在所述归属计算节点上所属的处理进程;
所述控制节点根据所述进程索引信息,向所述归属计算节点的所述处理进程调度所述待处理特性数据的数据索引信息或者所述待处理特性数据,所述数据索引信息用于所述归属计算节点获取所述待处理特性数据,以使所述归属计算节点处理所述待处理特性数据。
本发明第三方面提供一种控制节点设备,所述控制节点设备应用于分布式处理系统,所述分布式处理系统还包括第一计算节点和第二计算节点,所述第一计算节点用于处理终端上报的特性数据和所述控制节点分配的特性数据,所述第二计算节点用于处理所述第一计算节点产生的特性数据和所述控制节点分配的特性数据;所述控制节点设备包括:
获取单元,用于获取待处理特性数据的类型和特性标识,所述类型用于标识所述待处理特性数据的归属计算节点,所述归属计算节点为所述第一计算节点或所述第二计算节点;
确定单元,用于根据所述获取单元获取的所述特性标识,确定进程索引信息,所述进程索引信息用于指示所述待处理特性数据在所述归属计算节点上所属的处理进程;
调度单元,用于根据所述进程索引信息,向所述归属计算节点的所述处理进程调度所述待处理特性数据的数据索引信息或者所述待处理特性数据,所述数据索引信息用于所述归属计算节点获取所述待处理特性数据,以使所述归属计算节点处理所述待处理特性数据。
与现有技术特性树的处理方案中,处理时间长而且单机性能有限的问题相比,本发明实施例提供一种分布式处理系统、数据处理的方法及设备,通过分布式的处理方式,不需要构建特性树,就可以完成特性数据的计算,从而缩短了处理时间,而且不需要将特性树放在一个单机上进行处理,克服了单机性能有限的问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中分布式处理系统的一实施例示意图;
图2是本发明实施例中数据存储结构示意图;
图3是本发明实施例中数据处理的方法的一实施例示意图;
图4是本发明实施例中控制节点设备的一实施例示意图;
图5是本发明实施例中控制节点设备的另一实施例示意图。
具体实施方式
本发明实施例提供一种分布式处理系统、数据处理的方法及设备,通过分布式的处理方式,不需要构建特性树,就可以完成特性数据的计算,从而缩短了处理时间,而且不需要将特性树放在一个单机上进行处理,克服了单机性能有限的问题。以下分别进行详细说明。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
首先介绍几个涉及到本申请中的技术术语:
维度:是指监控对象的某一个属性,可以是地区、机房、运营商,也可以是接口、错误码等。
特性:是指一种或者多种维度的组合所对应的某个指标,监控系统的数据组织方式,是一个集特性值、特性信息于一体的监控对象,特性值一般是每天1440个点的集合。
单机特性:系统最细粒度的监控对象,标识单台机器上报的某个特性数据。
简单特性:多台机器上报的同一个特性(单机特性)按指定规则复合的数据。
复合特性:多个简单特性或复合特性按指定规则复合的数据。
配置更新系统:一种支持海量数据的存储和拉取、支持对有订阅请求的模块实时的发送数据更新通知的分布式协作系统。
参阅图1,本发明实施例提供的分布式处理系统包括:控制节点、第一计算节点和第二计算节点,第一计算节点和第二计算节点都可以有多个,第一计算节点用于处理终端上报的特性数据和所述控制节点分配的特性数据,第二计算节点用于处理所述第一计算节点产生的特性数据和所述控制节点分配的特性数据;也就是说,终端上报的特性数据相当于单机特性数据,直接由第一计算节点进行处理,处理后可以得到简单特性数据,第二计算节点还可以将该简单特性数据传输给第二计算节点进行处理,第二计算节点处理该简单特性数据后得到复合特性数据。第二计算节点可以订阅第一计算节点的内容,这样,第一计算节点计算得到简单特性数据后,就会将简单特性数据传递给相应的第二计算节点。
控制节点是本申请分布式处理系统控制中心,可以在配置更新节点处有特性更新时,及时获知到更新的特性信息,更新的特性信息可以包括待处理特性数据的类型和特性标识,类型用于标识所述待处理特性数据的归属计算节点,也就是说,本申请中在控制节点处特性数据可以分为简单特性数据和复合特性数据两种,若类型指示待处理特性数据属于简单特性数据,则可以确定由第一计算节点处理该待处理特性数据,若类型指示待处理特性数据属于复合特性数据,则可以确定由第二计算节点处理该待处理特性数据。实际上,每个第一计算节点和第二计算节点上都运行有多个特性处理进程,每个进程所处理的特性数据可以是不同的,因此,可以根据待处理特性数据的特性标识,确定进程索引信息。根据待处理特性数据的特性标识,确定进程索引信息的过程可以是特性标识与进程索引信息之间有一个对应关系,由该对应关系确定待处理特性数据的特性标识所对应的进程索引信息,也可以是采用一致性哈希算法,由待处理特性数据的特性标识计算出该特性标识所对应的进程索引信息。进程索引信息用于指示所述待处理特性数据在所述归属计算节点上所属的处理进程。根据进程索引信息可以确定数据索引信息或者待处理特性数据的路由信息,也就是应该将数据索引信息或者待处理特性数据调度到哪个进程上。
控制节点根据所述进程索引信息,向所述归属计算节点的所述处理进程调度所述待处理特性数据的数据索引信息或者所述待处理特性数据,所述数据索引信息用于所述归属计算节点获取所述待处理特性数据。
归属计算节点处理所述待处理特性数据,得到处理后的特性数据。
其中,控制节点在所述配置更新节点中的特性数据发生更新时,从所述配置更新节点获取待处理特性数据的类型和特性标识。
也可以是,控制节点在获取到所述第一计算节点或所述第二计算节点中的进程出现异常时,获取发生异常的进程上所处理的特性数据的类型和特性标识作为所述待处理特性数据的类型和特性标识。从这两段的描述分析权3引权1是不是有问题(引用关系不对)
实际上,本申请分布式处理系统的主要原理是把系统中的所有特性按照简单和复合分类,控制节点中配置有待处理特性数据的分发规则,分发规则也就是如何确定特性数据的进程的过程。例如:系统中的特性主要分成两类,简单特性(单机特性属于简单特性的子集)和复合特性,简单特性直接依赖用户上报数据进行计算,复合特性直接依赖简单特性或复合特性进行计算。
首先,根据特性类型会确定待处理特性数据属于那种类型的计算节点,第一计算节点或第二计算节点。
然后,通过求解分发函数F就可以得到特性标识对应路由表的进程索引信息。求解过程可以是:x1=F1(X1),…,xn=Fn(Xn),其中X1…Xn表示特性标识,通过分发函数F求解得到进程索引信息x1…xn。
根据特性标识对应路由表的进程索引信息,查找对应的路由信息r1=R1(x1),r2=R2(x2),...rn=Rn(xn),最后根据得到的路由信息实时的把特性调度到相应计算节点的相应进程上。
控制节点确定待处理特性数据应调度到的进程后,会将该待处理特性数据的数据索引信息或者该待处理特性数据调度到相应的进程进行计算。
第二计算节点每分钟都向第一计算节点或者第二计算节点订阅自身计算需要的特性,当用户上报数据到达第一计算节点时,第一计算节点在计算完后,会根据第二计算节点的订阅情况主动推送数据到相应的第二计算节点,当第二计算节点中用于计算每个复合特性需要的简单特性数据或者复合特性数据都到达后,即开始计算复合特性数据,每分钟按此进行重复计算,当特性增加时,只需扩容机器即可。
第一计算节点对特性数据的计算过程属于简单特性计算,第二计算节点对特性数据的计算过程属于复合特性计算。
1)简单特性计算:S([Sx1,Sx2,...Sxn])=>[S1,S2,...Sn],S为简单特性计算函数,即求出每个简单特性一段时间的特性值。
2)复合计算:
C([S1,S2,...Sn])=>[C1,C2,...Cn]或者C([C1,C2,...Cn])=>[C1`,C2`,...Cn`]
C为复合特性计算函数,将多个简单特性值或复合特性值实时汇聚为当前复合特性值。
为了便于理解,下面举例对上述过程进行说明:
以特性数据为微信—朋友圈—请求数为例,若要统计微信—朋友圈—请求数,可以先统计每个国家,每个省份的移动用户中微信—朋友圈—请求数,联通用户中微信—朋友圈—请求数,电信用户中微信—朋友圈—请求数,这些特性数据属于简单特性数据,只要做加和运算即可得到,以广东移动用户—微信—朋友圈—请求数为例进行说明,可以是:将移动用户中发送朋友圈请求的用户数量调度到第一计算节点的一个进程上进行统计,同理,可以通过另外两个进程统计出广东联通用户--微信—朋友圈—请求数,广东电信用户--微信—朋友圈—请求数,当然还可以通过其他进程计算出其他省份的上述数值,然后将这些简单特性数据,送入第二计算节点中计算国内省份----微信—朋友圈—请求数的相应进程上,就可以计算出国内的数据,海外特性数据的处理办法同上,最终就可以确定出全球----微信—朋友圈—请求数。
本申请中,特性数据处理后,还需要进行相应的存储。本申请所提出的存储格式采用value结构,value结构是版本号+bitmap标识+动态数据内容。具体格式可以参阅图2进行理解。
如图2所示,0字节ver表示版本号,例如:1.0,后60个字节中,第1至60字节是bitmap标识位,从第61字节开始,每4个比特表示1分钟的数据。bitmap标识位具体见表1,一个value可以存储两小时的数据。
表1:bitmap标识位结构说明
从表1可以看出,只有特性数据大于0时,才会存储真实数据大小,数据实际有多少个字节,则存储多少字节,例如:32可以用一个字节表示,则存储一个字节。
另外,本申请中采用ANM的压缩算法,还可以提高压缩效率,表2是三种压缩算法的各项指标对比。
表2:压缩效率对比
压缩方式 数据量(B) 压缩时间(S) 解压时间(S) 压缩率(%)
ANM 166125*1440*8 3.113 2.157 83.5
snappy 166125*1440*8 7.724 2.798 82
zlib 166125*1440*8 69.356 8.122 92
从表2中可以看出,本申请中采用的ANM压缩算法,在压缩相同的数据量的情况下,ANM压缩算法的压缩时间最短,解压时间最短,压缩效率相对于zlib方式的69.356的压缩时间,相对高出很多。
表2中的ANM、snappy和zlib是三种数据压缩算法。
图1中的配置更新节点:主要提供海量数据的快速拉取、订阅和通知,控制节点在配置更新节点订阅更新通知,当上亿数据有任何改动的时候,配置更新节点都能在秒级以内通知到控制节点;当控制节点推送到第一计算节点和第二计算节点的只有数据索引信息时,具体的特性数据需要到配置更新节点实时拉取。
控制节点:控制节点是整个实时计算的控制中心,负责推送全量数据索引信息或者部分更新的特性数据到指定的计算节点,推送的路由可以采用一致性哈希算法,确定对应的计算进程,当第一计算节点和第二计算节点有异常时,控制节点在30S感知,并把出现异常的进程上的特性数据均衡分发到其它的进程,保证数据在1分钟内恢复。
第一计算节点:
第一计算节点主要负责把单机特性合成简单特性,由特性数据驱动计算,并且接受第二计算节点的订阅请求,当简单特性数据计算完成并且有复合计算节点,也就是第二计算节点订阅时,会及时把数据推送到指定的第二计算节点。
另外也有保证数据安全的策略,目前简单和单机特性数据采用两份保存,第一计算节点和结果数据缓存节点各保存一份,具体哪个进程保存,根据路由算法进行指定,当第一计算节点异常重启或者扩容时,系统会主动到对应结果数据存储节点获取历史数据,特性数据以2小时为一个数据结构进行压缩存储,因此两小时内的数据必须完整,从而保证数据的完整性。
当进程、网络或机器异常触发模块的容灾机制时,其它进程会均衡分摊异常进程的计算任务,由控制节点推送数据索引信息,计算节点主动到配置系统获取数据,该过程在一分钟内完成。
第二计算节点:
第二计算节点主要负责复合特性的计算,由时间驱动计算,每分钟计算一轮,并且接受第二计算节点自身的订阅请求,当复合特性数据计算完成并且有其它的第二计算节点订阅时,会及时把特性数据推送到指定的第二计算节点。
另外也有保证数据安全的策略,同第一计算节点的数据容灾策略相同。
第二计算节点的容灾机制也同第一计算节点的容灾机制相同,可以参照第一计算节点的相应部分进行理解。
存储节点中可以包括用于缓存的存储节点:
用于缓存的存储节点主要负责对数据的缓存最新4小时数据、外部接口对数据拉取和数据落地存储。
数据安全策略,该用于缓存的存储节点负责保存第一计算节点、第二计算节点的计算结果,当计算节点异常时,可以提供2小时数据给计算节点,当自身异常重启或者扩容时,计算节点会主动推送相关数据到该存储节点,确保每份数据都有两份存储。
外部所有数据的使用都从该存储获取,当历史数据不存在时,将主动从存储设备重新拉取数据并缓存。
由于系统数据量较大,对存储设备的写入要求较高,因此该模块会利用数据缓存的能力,缓慢的落地数据,既减少了存储设备接入层的压力,同时也对存储设备异常具备一定的容灾能力。
本申请中采用化整为零的方法,将以特性树为单位的计算方式改进为单个节点的计算方式,突破了建树受单机性能限制的瓶颈。通过配置更新实时分配有更新的特性到指定计算节点的方式,解决了由于上亿级特性量导致生效时间过长的问题。通过按照特性类型分类进行计算,解耦了不同类型特性之间的耦合关系,避免了相互影响。
参阅图3,本发明实施例提供的数据处理的方法的一实施例包括:
101、控制节点获取待处理特性数据的类型和特性标识,所述类型用于标识所述待处理特性数据的归属计算节点,所述归属计算节点为所述第一计算节点或所述第二计算节点,其中,所述控制节点应用于分布式处理系统,所述分布式处理系统还包括控制节点所述第一计算节点用于处理终端上报的特性数据和所述控制节点分配的特性数据,所述第二计算节点用于处理所述第一计算节点产生的特性数据和所述控制节点分配的特性数据。
102、所述控制节点根据所述特性标识,确定进程索引信息,所述进程索引信息用于指示所述待处理特性数据在所述归属计算节点上所属的处理进程。
103、所述控制节点根据所述进程索引信息,向所述归属计算节点的所述处理进程调度所述待处理特性数据的数据索引信息或者所述待处理特性数据,所述数据索引信息用于所述归属计算节点获取所述待处理特性数据,以使所述归属计算节点处理所述待处理特性数据。
与现有技术特性树的处理方案中,处理时间长而且单机性能有限的问题相比,本发明实施例提供的数据处理的方法,通过分布式的处理方式,不需要构建特性树,就可以完成特性数据的计算,从而缩短了处理时间,而且不需要将特性树放在一个单机上进行处理,克服了单机性能有限的问题。
可选地,所述分布式处理系统还包括配置更新节点;
所述控制节点获取待处理特性数据的类型和特性标识,可以包括:
所述控制节点在所述配置更新节点中的特性数据发生更新时,从所述配置更新节点获取待处理特性数据的类型和特性标识。
可选地,所述控制节点获取待处理特性数据的类型和特性标识,包括:
所述控制节点在获取到所述第一计算节点或所述第二计算节点中的进程出现异常时,获取发生异常的进程上所处理的特性数据的类型和特性标识作为所述待处理特性数据的类型和特性标识。
可选地,所述控制节点根据所述特性标识,确定进程索引信息,包括:
所述控制节点根据特性标识与进程索引信息之间的对应关系,确定所述特性标识所对应的所述进程索引信息。
本申请中,数据处理的方法可以参阅分布式处理系统的相应部分进行理解,本处不再重复赘述。
参阅图4,本发明实施例提供的控制节点设备20应用于分布式处理系统,所述分布式处理系统还包括第一计算节点和第二计算节点,所述第一计算节点用于处理终端上报的特性数据和所述控制节点分配的特性数据,所述第二计算节点用于处理所述第一计算节点产生的特性数据和所述控制节点分配的特性数据;所述控制节点设备包括:
获取单元201,用于获取待处理特性数据的类型和特性标识,所述类型用于标识所述待处理特性数据的归属计算节点,所述归属计算节点为所述第一计算节点或所述第二计算节点;
确定单元202,用于根据所述获取单元201获取的所述特性标识,确定进程索引信息,所述进程索引信息用于指示所述待处理特性数据在所述归属计算节点上所属的处理进程;
调度单元203,用于根据所述确定单元202确定的所述进程索引信息,向所述归属计算节点的所述处理进程调度所述待处理特性数据的数据索引信息或者所述待处理特性数据,所述数据索引信息用于所述归属计算节点获取所述待处理特性数据,以使所述归属计算节点处理所述待处理特性数据。
与现有技术特性树的处理方案中,处理时间长而且单机性能有限的问题相比,本发明实施例提供的控制节点设备,通过分布式的处理方式,不需要构建特性树,就可以完成特性数据的计算,从而缩短了处理时间,而且不需要将特性树放在一个单机上进行处理,克服了单机性能有限的问题。
可选地,所述分布式处理系统还包括配置更新节点;
所述获取单元201,用于在所述配置更新节点中的特性数据发生更新时,从所述配置更新节点获取待处理特性数据的类型和特性标识。
可选地,所述获取单元201,用于在获取到所述第一计算节点或所述第二计算节点中的进程出现异常时,获取发生异常的进程上所处理的特性数据的类型和特性标识作为所述待处理特性数据的类型和特性标识。
可选地,所述确定单元202,用于根据特性标识与进程索引信息之间的对应关系,确定所述特性标识所对应的所述进程索引信息。
本申请中,控制节点设备可以参阅分布式处理系统中控制节点的相应部分进行理解,本处不再重复赘述。
图5是本发明实施例提供的控制节点设备30的结构示意图。控制节点设备30应用于分布式处理系统,所述分布式处理系统还包括第一计算节点和第二计算节点,所述第一计算节点用于处理终端上报的特性数据和所述控制节点分配的特性数据,所述第二计算节点用于处理所述第一计算节点产生的特性数据和所述控制节点分配的特性数据;所述控制节点设备30包括处理器310、存储器350和输入/输出设备330,输入/输出设备330可以包括鼠标、键盘、触摸屏和显示器,存储器350可以包括只读存储器和随机存取存储器,并向处理器310提供操作指令和数据。存储器350的一部分还可以包括非易失性随机存取存储器(NVRAM)。
在一些实施方式中,存储器350存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:
在本发明实施例中,通过调用存储器350存储的操作指令(该操作指令可存储在操作系统中),
获取待处理特性数据的类型和特性标识,所述类型用于标识所述待处理特性数据的归属计算节点,所述归属计算节点为所述第一计算节点或所述第二计算节点;
根据所述特性标识,确定进程索引信息,所述进程索引信息用于指示所述待处理特性数据在所述归属计算节点上所属的处理进程;
根据所述进程索引信息,向所述归属计算节点的所述处理进程调度所述待处理特性数据的数据索引信息或者所述待处理特性数据,所述数据索引信息用于所述归属计算节点获取所述待处理特性数据,以使所述归属计算节点处理所述待处理特性数据。
与现有技术特性树的处理方案中,处理时间长而且单机性能有限的问题相比,本发明实施例提供的控制节点设备,通过分布式的处理方式,不需要构建特性树,就可以完成特性数据的计算,从而缩短了处理时间,而且不需要将特性树放在一个单机上进行处理,克服了单机性能有限的问题。
处理器310控制控制节点设备30的操作,处理器310还可以称为CPU(CentralProcessing Unit,中央处理单元)。存储器350可以包括只读存储器和随机存取存储器,并向处理器310提供指令和数据。存储器350的一部分还可以包括非易失性随机存取存储器(NVRAM)。具体的应用中控制节点设备30的各个组件通过总线系统320耦合在一起,其中总线系统320除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线系统320。
上述本发明实施例揭示的方法可以应用于处理器310中,或者由处理器310实现。处理器310可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器310中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器310可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器350,处理器310读取存储器350中的信息,结合其硬件完成上述方法的步骤。
可选地,所述分布式处理系统还包括配置更新节点;所述处理器310用于在所述配置更新节点中的特性数据发生更新时,从所述配置更新节点获取待处理特性数据的类型和特性标识。
可选地,所述处理器310用于在获取到所述第一计算节点或所述第二计算节点中的进程出现异常时,获取发生异常的进程上所处理的特性数据的类型和特性标识作为所述待处理特性数据的类型和特性标识。
可选地,所述处理器310用于根据特性标识与进程索引信息之间的对应关系,确定所述特性标识所对应的所述进程索引信息。
以上的控制节点设备30可以参阅分布式处理系统中控制节点的相应部分进行理解,本处不再重复赘述。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上对本发明实施例所提供的种分布式处理系统、数据处理的方法及设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (13)

1.一种分布式处理系统,其特征在于,包括:控制节点、第一计算节点和第二计算节点,所述第一计算节点用于处理终端上报的特性数据和所述控制节点分配的特性数据,所述第二计算节点用于处理所述第一计算节点产生的特性数据和所述控制节点分配的特性数据;
所述控制节点获取待处理特性数据的类型和特性标识,所述类型用于标识所述待处理特性数据的归属计算节点,所述归属计算节点为所述第一计算节点或所述第二计算节点;
所述控制节点根据所述特性标识,确定进程索引信息,所述进程索引信息用于指示所述待处理特性数据在所述归属计算节点上所属的处理进程;
所述控制节点根据所述进程索引信息,向所述归属计算节点的所述处理进程调度所述待处理特性数据的数据索引信息或者所述待处理特性数据,所述数据索引信息用于所述归属计算节点获取所述待处理特性数据;
所述归属计算节点处理所述待处理特性数据,得到处理后的特性数据。
2.根据权利要求1所述的分布式处理系统,其特征在于,所述分布式处理系统还包括配置更新节点;
所述控制节点获取待处理特性数据的类型和特性标识,包括:
所述控制节点在所述配置更新节点中的特性数据发生更新时,从所述配置更新节点获取待处理特性数据的类型和特性标识。
3.根据权利要求1所述的分布式处理系统,其特征在于,所述控制节点获取待处理特性数据的类型和特性标识,包括:
所述控制节点在获取到所述第一计算节点或所述第二计算节点中的进程出现异常时,获取发生异常的进程上所处理的特性数据的类型和特性标识作为所述待处理特性数据的类型和特性标识。
4.根据权利要求1-3任一所述的分布式处理系统,其特征在于,所述控制节点根据所述特性标识,确定进程索引信息,包括:
所述控制节点根据特性标识与进程索引信息之间的对应关系,确定所述特性标识所对应的所述进程索引信息。
5.根据权利要求1-3任一所述的分布式处理系统,其特征在于,所述分布式处理系统还包括存储节点,
所述归属计算节点按照版本号、比特位信息和数据内容的结构存储所述处理后的特性数据。
6.一种数据处理的方法,其特征在于,所述方法应用于分布式处理系统,所述分布式处理系统包括控制节点、第一计算节点和第二计算节点,所述第一计算节点用于处理终端上报的特性数据和所述控制节点分配的特性数据,所述第二计算节点用于处理所述第一计算节点产生的特性数据和所述控制节点分配的特性数据,所述方法包括:
所述控制节点获取待处理特性数据的类型和特性标识,所述类型用于标识所述待处理特性数据的归属计算节点,所述归属计算节点为所述第一计算节点或所述第二计算节点;
所述控制节点根据所述特性标识,确定进程索引信息,所述进程索引信息用于指示所述待处理特性数据在所述归属计算节点上所属的处理进程;
所述控制节点根据所述进程索引信息,向所述归属计算节点的所述处理进程调度所述待处理特性数据的数据索引信息或者所述待处理特性数据,所述数据索引信息用于所述归属计算节点获取所述待处理特性数据,以使所述归属计算节点处理所述待处理特性数据。
7.根据权利要求6所述的方法,其特征在于,所述分布式处理系统还包括配置更新节点;
所述控制节点获取待处理特性数据的类型和特性标识,包括:
所述控制节点在所述配置更新节点中的特性数据发生更新时,从所述配置更新节点获取待处理特性数据的类型和特性标识。
8.根据权利要求6所述的方法,其特征在于,所述控制节点获取待处理特性数据的类型和特性标识,包括:
所述控制节点在获取到所述第一计算节点或所述第二计算节点中的进程出现异常时,获取发生异常的进程上所处理的特性数据的类型和特性标识作为所述待处理特性数据的类型和特性标识。
9.根据权利要求6-8任一所述的方法,其特征在于,所述控制节点根据所述特性标识,确定进程索引信息,包括:
所述控制节点根据特性标识与进程索引信息之间的对应关系,确定所述特性标识所对应的所述进程索引信息。
10.一种控制节点设备,其特征在于,所述控制节点设备应用于分布式处理系统,所述分布式处理系统还包括第一计算节点和第二计算节点,所述第一计算节点用于处理终端上报的特性数据和所述控制节点分配的特性数据,所述第二计算节点用于处理所述第一计算节点产生的特性数据和所述控制节点分配的特性数据;所述控制节点设备包括:
获取单元,用于获取待处理特性数据的类型和特性标识,所述类型用于标识所述待处理特性数据的归属计算节点,所述归属计算节点为所述第一计算节点或所述第二计算节点;
确定单元,用于根据所述获取单元获取的所述特性标识,确定进程索引信息,所述进程索引信息用于指示所述待处理特性数据在所述归属计算节点上所属的处理进程;
调度单元,用于根据所述确定单元确定的所述进程索引信息,向所述归属计算节点的所述处理进程调度所述待处理特性数据的数据索引信息或者所述待处理特性数据,所述数据索引信息用于所述归属计算节点获取所述待处理特性数据,以使所述归属计算节点处理所述待处理特性数据。
11.根据权利要求10所述的控制节点设备,其特征在于,所述分布式处理系统还包括配置更新节点;
所述获取单元,用于在所述配置更新节点中的特性数据发生更新时,从所述配置更新节点获取待处理特性数据的类型和特性标识。
12.根据权利要求10所述的控制节点设备,其特征在于,
所述获取单元,用于在获取到所述第一计算节点或所述第二计算节点中的进程出现异常时,获取发生异常的进程上所处理的特性数据的类型和特性标识作为所述待处理特性数据的类型和特性标识。
13.根据权利要求10-12任一所述的控制节点设备,其特征在于,
所述确定单元,用于根据特性标识与进程索引信息之间的对应关系,确定所述特性标识所对应的所述进程索引信息。
CN201610303417.4A 2016-05-09 2016-05-09 一种分布式处理系统、数据处理的方法及设备 Active CN107357639B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201610303417.4A CN107357639B (zh) 2016-05-09 2016-05-09 一种分布式处理系统、数据处理的方法及设备
KR1020187032480A KR102126320B1 (ko) 2016-05-09 2017-05-05 분산 처리 시스템, 데이터 처리 방법 및 제어 노드 장치
EP17795491.4A EP3457278B1 (en) 2016-05-09 2017-05-05 Distributed processing system, data processing method, and control node apparatus
PCT/CN2017/083171 WO2017193873A1 (zh) 2016-05-09 2017-05-05 一种分布式处理系统、数据处理的方法及控制节点设备
US15/962,653 US10432455B2 (en) 2016-05-09 2018-04-25 Distributed processing system, data processing method, and control node device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610303417.4A CN107357639B (zh) 2016-05-09 2016-05-09 一种分布式处理系统、数据处理的方法及设备

Publications (2)

Publication Number Publication Date
CN107357639A true CN107357639A (zh) 2017-11-17
CN107357639B CN107357639B (zh) 2019-09-17

Family

ID=60266320

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610303417.4A Active CN107357639B (zh) 2016-05-09 2016-05-09 一种分布式处理系统、数据处理的方法及设备

Country Status (5)

Country Link
US (1) US10432455B2 (zh)
EP (1) EP3457278B1 (zh)
KR (1) KR102126320B1 (zh)
CN (1) CN107357639B (zh)
WO (1) WO2017193873A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111090514A (zh) * 2018-10-24 2020-05-01 阿里巴巴集团控股有限公司 一种分配计算能力的方法及系统
CN113435462A (zh) * 2021-07-16 2021-09-24 北京百度网讯科技有限公司 定位方法、装置、电子设备和介质
CN113946294A (zh) * 2021-10-29 2022-01-18 蜂巢科技(南通)有限公司 一种分布式储存系统及其数据处理方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101936942B1 (ko) * 2017-08-28 2019-04-09 에스케이텔레콤 주식회사 분산형 컴퓨팅 가속화 플랫폼 장치 및 분산형 컴퓨팅 가속화 플랫폼 운영 방법
CN109542338B (zh) * 2018-10-19 2022-02-18 郑州云海信息技术有限公司 一种实现分布式存储系统中节点信息一致性方法及装置
WO2020113405A1 (en) * 2018-12-04 2020-06-11 Telefonaktiebolaget Lm Ericsson (Publ) Configuration updates of service functions in service-based network architecture
CN112104706B (zh) * 2020-08-24 2022-12-20 中国银联股份有限公司 分布式系统中模型发布方法、装置、设备、存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063330A (zh) * 2011-01-05 2011-05-18 北京航空航天大学 一种大规模并行程序性能数据采集方法
CN102360310A (zh) * 2011-09-28 2012-02-22 中国电子科技集团公司第二十八研究所 一种分布式系统环境下的多任务进程监视方法和监视系统
CN102904919A (zh) * 2011-07-29 2013-01-30 国际商业机器公司 流处理方法和实现流处理的分布式系统
CN103455633A (zh) * 2013-09-24 2013-12-18 浪潮齐鲁软件产业有限公司 一种海量网络发票明细数据分布式分析方法
CN103973803A (zh) * 2014-05-19 2014-08-06 英华达(上海)科技有限公司 云端资源分配系统、方法及内储程序的电脑可读取记录媒体
CN104077188A (zh) * 2013-03-29 2014-10-01 西门子公司 一种用于任务调度的方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003030164A (ja) * 2001-07-11 2003-01-31 Hitachi Ltd 計算機システムおよび計算ノード
KR100932813B1 (ko) * 2002-10-01 2009-12-21 엘지전자 주식회사 동일 유형의 홈 네트웍 기기를 위치별로 구분 및 표시하는장치
JP5104489B2 (ja) * 2008-04-03 2012-12-19 日本電気株式会社 分散イベント検出システム、分散イベント検出方法、及び分散イベント検出用プログラム
JP5254497B2 (ja) * 2010-07-21 2013-08-07 エンパイア テクノロジー ディベロップメント エルエルシー 信頼されないコンピューティングノードによって実行された作業の検証

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063330A (zh) * 2011-01-05 2011-05-18 北京航空航天大学 一种大规模并行程序性能数据采集方法
CN102904919A (zh) * 2011-07-29 2013-01-30 国际商业机器公司 流处理方法和实现流处理的分布式系统
CN102360310A (zh) * 2011-09-28 2012-02-22 中国电子科技集团公司第二十八研究所 一种分布式系统环境下的多任务进程监视方法和监视系统
CN104077188A (zh) * 2013-03-29 2014-10-01 西门子公司 一种用于任务调度的方法和装置
CN103455633A (zh) * 2013-09-24 2013-12-18 浪潮齐鲁软件产业有限公司 一种海量网络发票明细数据分布式分析方法
CN103973803A (zh) * 2014-05-19 2014-08-06 英华达(上海)科技有限公司 云端资源分配系统、方法及内储程序的电脑可读取记录媒体

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111090514A (zh) * 2018-10-24 2020-05-01 阿里巴巴集团控股有限公司 一种分配计算能力的方法及系统
CN111090514B (zh) * 2018-10-24 2023-06-20 阿里巴巴集团控股有限公司 一种分配计算能力的方法及系统
CN113435462A (zh) * 2021-07-16 2021-09-24 北京百度网讯科技有限公司 定位方法、装置、电子设备和介质
CN113435462B (zh) * 2021-07-16 2022-06-28 北京百度网讯科技有限公司 定位方法、装置、电子设备和介质
CN113946294A (zh) * 2021-10-29 2022-01-18 蜂巢科技(南通)有限公司 一种分布式储存系统及其数据处理方法

Also Published As

Publication number Publication date
WO2017193873A1 (zh) 2017-11-16
US10432455B2 (en) 2019-10-01
KR20180134956A (ko) 2018-12-19
EP3457278B1 (en) 2021-06-30
US20180241623A1 (en) 2018-08-23
CN107357639B (zh) 2019-09-17
KR102126320B1 (ko) 2020-06-24
EP3457278A4 (en) 2020-01-22
EP3457278A1 (en) 2019-03-20

Similar Documents

Publication Publication Date Title
CN107357639A (zh) 一种分布式处理系统、数据处理的方法及设备
US20170187398A1 (en) Accelerated galois field coding for storage systems
CN107395665A (zh) 一种区块链业务受理及业务共识方法及装置
CN101110087B (zh) 用于管理医疗图像数据的方法以及数据网络
US8424010B2 (en) Shared resource management
CN105426413B (zh) 一种编码方法及装置
CN104255011B (zh) 云计算安全数据存储
CN110309336A (zh) 图像检索方法、装置、系统、服务器以及存储介质
Kim et al. SELCOM: Selective compression scheme for lightweight nodes in blockchain system
CN108595268A (zh) 一种基于MapReduce的数据分配方法、装置及计算机可读存储介质
CN107301091A (zh) 资源分配方法和装置
CN107562905A (zh) 数据的管理方法、服务器及计算机可读存储介质
CN108268344A (zh) 一种数据处理方法和装置
CN108898468A (zh) 信息异步处理方法、装置、计算机设备及存储介质
CN105204782B (zh) 一种实现数据存储的方法及装置
EP3963853B1 (en) Optimizing storage and retrieval of compressed data
CN107291746B (zh) 一种存储和读取数据的方法及设备
CN108694333A (zh) 用户信息处理方法及装置
CN108874314A (zh) 一种独立冗余磁盘阵列的重构方法及装置
CN108763517A (zh) 一种删除元数据的方法以及相关设备
CN107908713A (zh) 一种基于Redis集群的分布式动态杜鹃过滤系统及其过滤方法
CN107391541A (zh) 一种实时数据合并方法和装置
CN112947858B (zh) 一种raid 5校验值的更新方法、装置和介质
CN105939218A (zh) 网络流量的统计方法及装置
CN103544292B (zh) 基于HASH表的Diameter消息处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20231222

Address after: 518000 Tencent Building, No. 1 High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province, 35 Floors

Patentee after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

Patentee after: TENCENT CLOUD COMPUTING (BEIJING) Co.,Ltd.

Address before: 2, 518000, East 403 room, SEG science and Technology Park, Zhenxing Road, Shenzhen, Guangdong, Futian District

Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

TR01 Transfer of patent right