CN115499338A - 数据处理方法、设备、介质及云网络观测系统 - Google Patents

数据处理方法、设备、介质及云网络观测系统 Download PDF

Info

Publication number
CN115499338A
CN115499338A CN202211427630.8A CN202211427630A CN115499338A CN 115499338 A CN115499338 A CN 115499338A CN 202211427630 A CN202211427630 A CN 202211427630A CN 115499338 A CN115499338 A CN 115499338A
Authority
CN
China
Prior art keywords
data
information
address information
target data
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211427630.8A
Other languages
English (en)
Other versions
CN115499338B (zh
Inventor
吕彪
韩泽鋆
祝顺民
肖雄
潘涌
钮骏凯
杨帅
芮藤长
史洋洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Cloud Computing Ltd
Original Assignee
Alibaba Cloud Computing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Cloud Computing Ltd filed Critical Alibaba Cloud Computing Ltd
Priority to CN202211427630.8A priority Critical patent/CN115499338B/zh
Publication of CN115499338A publication Critical patent/CN115499338A/zh
Application granted granted Critical
Publication of CN115499338B publication Critical patent/CN115499338B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0681Configuration of triggering conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/02Capturing of monitoring data
    • H04L43/022Capturing of monitoring data by sampling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • H04L43/045Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提出一种数据处理方法、设备、介质及云网络观测系统。该方法包括:确定第一目标数据中的地址信息与预定地址信息之间的差异信息;基于该差异信息,得到第一目标数据中的地址信息的编码;基于该编码,在数据包中记录第一目标数据;第一目标数据为云网络中的时序数据中的数据。采用本申请实施例,可以压缩网络中存储和传输的数据量。

Description

数据处理方法、设备、介质及云网络观测系统
技术领域
本申请涉及云计算领域,尤其涉及一种数据处理方法、设备、介质及云网络观测系统。
背景技术
随着云网络的智能化能力提升以及云计算技术的成熟普及,云网络的可观测性变得越来越重要,主流的云计算厂商通常通过采集云网络的时序数据来观测云网络的网络状态,随着云网络的不断扩展,云网络中的实例设备越来越多,需要采集的时序数据也随之增多,因此,时序数据的传输量以及存储量也越来越大,为网络增加了大量的负载和成本。如何压缩网络中时序数据的数据量成为热点问题。
发明内容
本申请实施例提供一种数据处理方法、设备、介质及云网络观测系统,以解决相关技术存在的问题,技术方案如下:
第一方面,本申请实施例提供了一种数据处理方法,应用于云网络观测系统中的数据采集系统,该方法包括:
确定第一目标数据中的地址信息与预定地址信息之间的差异信息;第一目标数据为云网络中的时序数据中的数据;
基于差异信息,得到第一目标数据中的地址信息的编码;
基于编码,在数据包中记录第一目标数据。
第二方面,本申请实施例提供了一种数据处理方法,应用于云网络观测系统中的数据处理系统,该方法包括:
在数据包中读取第一目标数据的编码;第一目标数据为云网络中的时序数据中的数据;
基于编码,确定第一目标数据中的地址信息与预定地址信息之间的差异信息;
基于差异信息以及预定地址信息,确定第一目标数据的地址信息。
第三方面,本申请实施例还提供了一种云网络观测系统,包括:
数据采集系统,用于采集云网络中的时序数据,通过本申请实施例第一方面提供的方法将时序数据处理成数据包,存储或传输数据包;
数据处理系统,用于通过本申请实施例第二方面提供的方法对数据包进行处理,得到时序数据,并对时序数据进行计算、存储或传输;
服务系统,用于展示基于时序数据计算出的可视化数据。
第四方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,处理器在执行计算机程序时实现本申请任一实施例提供的方法。
第五方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现本申请任一实施例提供的方法。
本申请实施例的技术方案中,针对来自云网络的目标数据的地址信息,基于其与预定地址信息之间的差异信息得到编码,并基于该编码对数据进行记录。由于网络中的地址信息往往具有相关性例如具有公共部分,因此,利用这种编码方式记录数据,可以大幅减少重复信息的记录,从而有效压缩网络中存储或传输的数据量。本申请实施例的技术方案可应用于云网络观测系统,基于上述编码方式高效地进行时序数据的记录和传输,有利于提高对云网络的观测效率。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本申请进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本申请公开的一些实施方式,而不应将其视为是对本申请范围的限制。
图1为本申请实施例的一个示例性的应用场景的示意图。
图2为根据本申请一实施例的数据处理方法的流程图。
图3为根据本申请另一实施例的数据处理方法的流程图。
图4为本申请实施例的一个应用示例的示意图。
图5为上述应用示例中的数据包的示意图。
图6为根据本申请一实施例的数据处理装置的结构框图。
图7为根据本申请另一实施例的数据处理装置的结构框图。
图8为根据本申请一实施例的电子设备的结构框图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本申请的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
为了更清楚地展示本申请实施例中提供的数据处理方法,以下对本申请实施例的应用场景进行说明。图1示出了一个示例性的应用场景的示意图。该应用场景为云网络观测系统对云网络的网络状态进行观测的场景,在云网络观测系统中部署有数据采集系统、数据处理系统和服务系统。
如图1所示的数据采集系统可以包括一个或多个部署有数据采集软件模块的服务器,数据采集系统可基于该数据采集软件模块采集云网络中的数据,例如按照一定的频率(如每秒、每毫秒)周期性地采集数据,形成时序数据,在形成时序数据后,可以将时序数据处理为一个或多个数据包,以数据包的形式进行存储或传输。其中,时序数据是指时间序列数据,时间序列数据是同一指标按时间顺序记录的数据列,即时间序列数据包含依序排列的一个或多个指标数据。这里,指标可以包括云网络中需要监测的各种网络参数,例如BPS(Bits Per Second,比特率)、时延、丢包率、链接数等。时序数据可以来自于不同的VPC(Virtual Private Cloud,虚拟私有云),例如图1中的VPC1、VPC2和VPC3。
如图1所示的数据处理系统可以包括一个或多个部署有分布式的软件模块的服务器,当采集到的时序数据的数量较多时,在后续的访问过程可能出现访问的热点较为聚集的问题,可以通过该分布式的软件模块中的各个软件模块分别接收时序数据并对时序数据进行计算、存储或传输,以供后续访问的多个数据通道,避免访问热点聚集。其中,数据处理系统还可以部署数据分发软件模块和分布式的应用软件模块,可基于数据分发软件模块对采集到的时序数据进行分发,例如分发至分布式的应用,数据处理系统对时序数据的计算可以包括对时序数据中指标数据的变化趋势的计算、预测未来某一时间段的指标数据的计算等。
如图1所示的服务系统可以包括一个或多个可展示用户界面的终端设备,例如计算机、手机等,可通过用户界面展示基于时序数据计算得到的可视化数据,该可视化数据可以包括时序数据、时序数据中某一指标数据的变化趋势、未来某一时间段的指标数据的预测结果等至少一类数据,在该预测结果异常时,例如预测出的第二天晚上8点的BPS过高或相对于前一天晚上8点的BPS变化过大时,服务系统还可以发出告警,告警的形式可以是多样的,例如展示特定图像、发出特定的声音等,用户可基于服务系统的展示和告警对云网络进行相应的管控。
本申请实施例的技术方案,可以用于将上述时序数据处理为待存储或传输的数据包,在此过程中可以压缩时序数据的数据量。为了能够更加详尽地了解本申请实施例的特点与技术内容,下面结合附图对本申请实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本申请实施例。
图2示出根据本申请一实施例的数据处理方法的流程图。该数据处理方法可选地可以应用于上述数据采集系统,但不仅限于此。如图2所示,该数据处理方法可以包括:
S210:确定第一目标数据中的地址信息与预定地址信息之间的差异信息;
S220:基于该差异信息,得到第一目标数据中的地址信息的编码;
S230:基于该编码,在数据包中记录第一目标数据。
在本申请实施例中,第一目标数据可以指采集到的待记录在数据包中的数据。示例性地,第一目标数据可以为云网络的时序数据中的数据,例如可以是云网络的时序数据中的任意一个或多个数据。在第一目标数据包括一个数据的情况下,可通过上述步骤S210至S230对该数据中的地址信息进行处理。在第一目标数据包括多个数据的情况下,每个数据均可通过上述步骤S210至S230进行处理,即第一目标数据中的多个数据可以并行进行上述步骤S210至S230的处理。
在一些应用场景中,云网络的时序数据中的数据为指标数据,则第一目标数据中可以包括指标值的属性信息以及该指标值。其中,属性信息可以包括采集指标值的时间信息、网络实例的标识信息等。这里,网络实例可以指云网络中的节点,例如用于提供特定的一种或多种服务的虚拟计算环境。
在一些示例中,数据采集系统可以采集特定的一个VPC中的各网络实例的时序数据,则上述网络实例的标识信息可以包括地址信息例如IP(Internet Protocol,网际互联协议)地址。在另一些示例中,数据采集系统可以采集多个VPC中的各网络实例的时序数据,则上述网络实例的标识可以包括地址信息、网络实例所在的VPC的标识、网络实例的区域的标识等。
举例而言,数据采集系统在同一时刻可以采集到不同VPC中的网络实例的时序数据,该时序数据示例如下:
Figure 556483DEST_PATH_IMAGE001
表1
表1所示的时序数据包括多行信息,每行信息为一个指标数据,即第一目标数据可以为其中一行信息。可以看到,第一目标数据中,可以包括地址信息(IP)、区域的标识、VPC的标识、时间信息和指标值(BPS),且可以采用KV(Key-Value,键值对)的形式表征各类信息。表1中数据仅作为示例,在一些实施例中,数据采集系统采集到的第一目标数据还可以包括时延、丢包率、链接数等。
本申请实施例主要通过对第一目标数据中的地址信息进行编码,实现对第一目标数据的压缩。具体地,可以预先确定预定地址信息。其中,预定地址信息可以与时序数据中的多个地址信息相关。示例性地,预定地址信息可以为包含该多个地址信息的公共部分的地址信息;或者,在采用数值表示地址信息的情况下,该预定地址信息可以为多个地址信息中的最小值。例如,以表1所示的时序数据为例,该预定地址信息可以为192.168.0.0或192.168.1.100。
在本申请实施例中,上述步骤S210中确定的差异信息可以用于表征第一目标数据中的地址信息与预定地址信息之间的差异。示例性地,该差异信息可以包括第一目标数据中的地址信息中除上述公共部分以外的其他部分;例如,预定地址信息为192.168.0.0,第一目标数据中的地址信息为192.168.1.100,则差异信息可以为1.100。或者,在采用数值表示地址信息的情况下,该差异信息可以包括第一目标数据的地址信息与预定地址信息之间的差值;例如,预定地址信息采用整型数据表示为3232235876,第一目标数据中的地址信息采用整型数据表示为3232235881,该差异信息可以为5。
示例性地,在本申请实施例中,基于该差异信息得到的编码,可以是该差异信息本身,也可以是对该差异信息进行处理后得到的信息。也就是说,在上述步骤S220中,可以将该差异信息作为第一目标数据中的地址信息的编码,也可以采用预定的编码方式对该差异信息进行处理,得到第一目标数据中的地址信息的编码。
示例性地,在本申请实施例中的数据包,用于记录或者说承载第一目标数据。可选地,该数据包可以用于记录时序数据中的部分或全部数据。也就是说,数据包为用于传输或存储上述数据的载体。示例性地,数据包中可以包括数据包信息(例如包头信息)、元信息、负载、校验信息等。其中,数据包信息用于描述该数据包的各类属性,例如在传输过程中指示该数据包的源地址、目标地址等。元信息可以用于承载解析数据包所需的各类信息。负载可以用于承载上述数据。校验信息可以用于校验数据包的完整性。
可选地,上述步骤S230中,基于该编码在数据包中记录第一目标数据,可以包括:在数据包中添加第一目标数据的记录信息,该记录信息包括该编码。示例性地,可以在数据包中的负载中添加该记录信息。该记录信息还可以包括第一目标数据中的其他信息或其他信息的编码,例如包括指标值或指标值的编码。
可以理解,由于该差异信息不携带与预定地址信息相关的一些公共信息,因此,基于该差异信息得到的编码,能够减少编码中携带的公共信息或者说重复信息,从而降低编码的数据量。基于该编码在数据包中记录第一目标数据,可以降低记录的信息的数据量。也就是说,由于网络中的地址信息往往具有相关性例如具有公共部分,因此,利用这种编码方式记录数据,可以大幅减少重复信息的记录,从而有效压缩网络中存储和传输的数据量。
在一种示例性的实施方式中,示例性地,上述步骤S210可以包括:对第一目标数据中的地址信息进行数据转换,得到第一整型数据;基于第一整型数据与预定地址信息对应的整型数据之间的差值,得到差异信息。
示例性地,上述数据转换可以包括从文本格式到整型格式的转换。相应地,第一整型数据可以为采用整型格式表示的第一目标数据中的地址信息。预定地址信息对应的整型数据也可以为采用整型格式表示的预定地址信息。
举例而言,IP地址的默认存储格式为X.X.X.X的字符串,可以将该字符串转换为32 位的整型数据。例如,对预定地址信息192.168.1.100进行计算:
Figure 258860DEST_PATH_IMAGE002
Figure 948468DEST_PATH_IMAGE003
,即预定地址信息 对应的整型数据为3232235876。对第一目标数据中的地址信息192.168.1.105进行计算:
Figure 128913DEST_PATH_IMAGE004
,即第一整型数据 为3232235881。相应地,第一整型数据与预定地址信息对应的整型数据之间的差值为5。
可选地,可以直接将该差值作为差异信息,也可以对该差值进行预定的转换处理或编码,得到该差异信息。由于整型格式为数值型格式,因此,采用整型格式计算差值,可以准确表征上述差异信息。
实际应用中,可以在计算差值之前,基于文本格式的预定地址信息进行数据转换,得到对应的整型数据,也可以直接采用整型数据表示预定地址信息,无需在计算差值之前进行数据转换。例如,可以基于表1中的各地址信息的公共部分确定预定地址信息为文本格式的192.168.0.0,然后对其进行数据转换,得到对应的整型数据。又例如,可以将表1中的各地址信息分别进行整型转换,得到多个整型数据,取其中的最小值(IP地址192.168.1.100所对应的整型数据3232235876)作为预定地址信息。
在一种示例性的实施方式中,数据处理方法还可以包括:在时序数据中确定包含相同的属性信息的多个目标数据,该多个目标数据包括第一目标数据。其中,多个目标数据均基于数据包进行记录,也就是说,数据包中可以包括与该多个目标数据分别对应的多个记录信息。
上述步骤可以在步骤S210之前执行。示例性地,可以对多个目标数据进行遍历,将遍历到的数据作为第一目标数据。也就是说,可以对每个目标数据均进行如步骤S210至S230的处理,以利用同一数据包记录上述多个目标数据。
根据上述方式,可以将具有相同的属性信息的多个目标数据记录在同一数据包中,该方式有利于减少相同的属性信息的重复记录。例如,数据包包括元信息以及与多个目标数据分别对应的多个记录信息;记录信息用于记录对应的目标数据,元信息用于记录属性信息。即数据包中的元信息可以包含该属性信息,则各目标数据的记录信息可以不包含该属性信息,从而避免了相同信息的重复记录,进一步压缩了数据量。其中,各目标数据的记录信息可以记录在数据包的负载中。
可选地,上述相同的属性信息可以包括一个或多个属性信息。以下提供两种示例。
示例1:
上述属性信息可以包括时间信息。以表1所示的时序数据为例,其中包含具有相同的时间信息1650885780的多个数据,则在数据包中的负载中记录上述多个目标数据时,可以无需记录时间信息,只记录如下表2所示的信息:
Figure 587576DEST_PATH_IMAGE005
表2
示例2:
上述属性信息可以包括VPC的标识。可选地,还可以包括时间信息。例如可以在表2的基础上,进一步提取VPC的标识均为VPC1的数据,则上述多个目标数据示例如下:
IP=192.168.1.100 区域=区域A VPC=VPC1 时间=1650885780 BPS=53.35
IP=192.168.1.105 区域=区域A VPC =VPC1 时间=1650885780 BPS=0.017
表3
在数据包的负载中记录上述多个目标数据时,可以无需记录时间信息和VPC的标识,只记录如下表4所示的信息:
Figure 195275DEST_PATH_IMAGE006
表4
如前述说明,预定地址信息可以与时序数据中的多个地址信息相关。进一步地,作为可选的实施方式,预定地址信息可以是基于上述具有相同的属性信息的多个目标数据中的多个地址信息确定的。例如,预定地址信息可以是多个目标数据中的多个地址信息的最小值。也就是说,在确定多个目标数据之后,上述方法还可以包括:基于多个目标数据中的多个地址信息,确定预定地址信息。
如前述说明,由于地址信息往往具有相关性,因此,基于差异信息对地址信息进行编码,可以压缩数据量。而具有相同的属性信息的多个地址信息,例如同一VPC的多个目标数据中的多个地址信息具有更强的相关性,因此,基于多个目标数据中的多个地址信息确定预定地址信息,可以进一步压缩数据量。
举例而言,在VPC的数量较多的情况下,IP范围也更广,例如为0.0.0.0至255.255.255.255。相应地,将IP地址转换为整型数据后,IP地址之间的最大差值为4294967295,需要32比特(bit)进行存储。而同一VPC中的IP都在特定的CIDR(ClasslessInter-Domain Routing,无类别域间路由)网段内,例如都具备公共掩码,且掩码至少设置8位,例如192.X.X.X。因此,同一VPC内网络实例IP范围为192.0.0.0至192.255.255.255,转换为整型数据后,IP地址之间的最大差值为16777216,只需24bit存储。如此,不仅可以在数据包中避免重复记录相同的VPC标识,还可以进一步压缩地址信息的编码,从而实现数据量的大幅压缩。
可选地,数据包中的元信息还可以记录该预定地址信息,以便于准确地根据预定地址信息解析数据包中的编码。
与上述方法相应地,本申请另一实施例还提供一种数据处理方法,用以对数据包进行解析。该方法可以应用于图1所示的数据处理系统,也可以应用于云网络观测系统中的其他节点。图3示出了根据该实施例的数据处理方法的流程图。如图3所示,该方法可以包括:
S310:在数据包中读取第一目标数据的编码;
S320:基于编码,确定第一目标数据中的地址信息与预定地址信息之间的差异信息;
S330:基于差异信息以及预定地址信息,确定第一目标数据的地址信息。
示例性地,数据包中可以包括与多个目标数据分别对应的记录信息,因此,可以从第一目标数据的记录信息中读取该编码,进而基于该编码得到上述差异信息,例如该编码即为差异信息,或者采用与预定的编码方式对应的解码方式对该编码进行处理,得到差异信息。第一目标数据为云网络中的时序数据中的数据,具体可参照前面对于第一目标数据的介绍。
示例性地,可以在数据包的元信息中读取预定地址信息,以基于差异信息与预定地址信息确定第一目标数据的地址信息。
示例性地,可以在数据包的元信息中读取多个目标数据所具有的相同的属性信息,从而得到第一目标数据中的该属性信息,例如时间信息和/或VPC的标识。
上述方法中的各信息的其他技术细节,可以参考前述实施例实现,在此不一一进行赘述。
为了更清楚地呈现本申请的技术思路,下面提供一个具体的应用示例。图4示出了该应用示例的示意图。如图4所示,在该应用示例中,数据处理方法包括以下步骤S1至步骤S5。
S1:云网络实例时序数据获取
在该步骤中,数据采集触达,获取同一时刻不同VPC上网络实例的BPS指标数据。该数据可以如下所示,采用KV形式表示BPS指标数据:
Figure 372179DEST_PATH_IMAGE007
表5
S2:公共KV提取
在该步骤中,针对同一批数据中Key(键)和Value(值)都相同的字段进行提取,例如表5中各数据的时间信息完全相同,因此提取时间=1650885780 为公共属性,每行数据不再需要单独存储该KV值。则需要记录的数据如表6所示:
Figure 90736DEST_PATH_IMAGE008
表6
S3:Key值字典编码
时序数据中的Key值例如表6中的IP、区域、VPC均为string格式存储发送,可以按顺序为这些Key值进行数字编码,以利用int格式替代string格式进行编码压缩。例如,各key值与对应的编码之间的映射关系(也可以称为字典信息)如下:
IP=0,区域=1,VPC=2,BPS=4,以此类推。
相应地,表6中的数据可以压缩如下:
Figure 669485DEST_PATH_IMAGE009
表7
S4:对IP地址进行编码
在时序数据中存在VPC和IP属性时,可以对IP地址进行差分编码。
具体地,首先针对IPV4属性,将格式为X.X.X.X的IP地址字符串转化为32位的整型数据进行压缩编码,如将192.168.1.100转换为3232235876。
然后,可以选择以下两种方式之一对IP地址进行差分编码。
方式一:
根据IP数值对表7中的数据进行排序,记录最小值,计算每个数据的IP地址与最小值之间的差值,并记录差值。如下表所示:
Figure 448085DEST_PATH_IMAGE010
表8
方式二:
将时序数据按照VPC进行分组,各组数据分别进行处理。具体地,根据IP数值对不同VPC分组内的数据分别进行排序,记录各VPC分组中的IP地址的最小值(相当于上述预定地址信息),并计算每个数据的IP地址与最小值之间的差值,并记录差值。其中,每行数据不再需要单独存储该VPC标识,如下表所示:
Figure 112284DEST_PATH_IMAGE011
表9
S5:对IP以外的其他Value值例如区域的Value值、VPC标识的Value值进行字典编码。各Value值与对应的编码之间的映射关系(也可以称为字典信息)如下:
区域A=1,区域B=2,VPC1=1,VPC2=2,以此类推。
以表9中VPC1的数据为例,记录的信息如下表:
Figure 228008DEST_PATH_IMAGE012
表10
最终这些信息可以在数据包中以图5所示的格式进行传输和存储。如图5所示,数据包中的元信息(Meta)可以用于记录公共信息,例如各数据共同的时间信息、VPC标识以及IP地址最小值。元信息还可以用于记录Key字典和Value字典,例如上述映射关系。数据包中的负载信息用于记录上述各个数据,例如表10中的两行数据。数据包中还可以包含校验码,用于对数据包进行校验。
可以看到,本申请实施例的方法,针对目标数据的地址信息,基于其与预定地址信息之间的差异信息得到编码,并基于该编码对数据进行记录。由于网络中的地址信息往往具有相关性例如具有公共部分,因此,利用这种编码方式记录数据,可以大幅减少重复信息的记录,从而有效压缩网络中存储和传输的数据量。
与本申请实施例提供的方法的应用场景以及方法相对应地,本申请实施例还提供一种数据处理装置600。参考图6,该装置600可以包括:
差异确定模块610,用于确定第一目标数据中的地址信息与预定地址信息之间的差异信息;编码确定模块620,用于基于差异信息,得到第一目标数据中的地址信息的编码;记录模块630,用于基于编码,在数据包中记录第一目标数据。第一目标数据为云网络中的时序数据中的数据。
示例性地,差异确定模块610,具体可以包括:
数据转换单元,用于对第一目标数据中的地址信息进行数据转换,得到第一整型数据;差值处理单元,用于基于第一整型数据与预定地址信息对应的整型数据之间的差值,得到差异信息。
示例性地,该装置600还可以包括:数据确定模块,用于在时序数据中确定包含相同的属性信息的多个目标数据;其中,多个目标数据包括第一目标数据,多个目标数据均基于数据包进行记录。
属性信息包括虚拟私有云VPC的标识。
示例性地,数据包包括元信息以及与多个目标数据分别对应的多个记录信息;记录信息用于记录对应的目标数据,元信息用于记录属性信息。
示例性地,元信息还用于记录预定地址信息。
示例性地,预定地址信息是基于多个目标数据中的多个地址信息确定的。
本申请实施例还提供一种数据处理装置700,参考图7,该装置700可以包括:
读取模块710,用于在数据包中读取第一目标数据的编码;差异解析模块720,用于基于编码,确定第一目标数据中的地址信息与预定地址信息之间的差异信息;解码模块730,用于基于差异信息以及预定地址信息,确定第一目标数据的地址信息。第一目标数据为云网络中的时序数据中的数据。
本申请实施例各装置中的各模块的功能可以参见上述方法中的对应描述,并具备相应的有益效果,在此不再赘述。
本申请实施例还提供了一种用于实现上述方法的电子设备。图8示出根据本申请实施例的电子设备的结构框图。如图8所示,该电子设备包括:存储器810和处理器820,存储器810内存储有可在处理器820上运行的计算机程序。处理器820执行该计算机程序时实现上述实施例中的数据处理方法。存储器810和处理器820的数量可以为一个或多个。
该电子设备还包括:
通信接口830,用于与外界设备进行通信,进行数据交互传输。
如果存储器810、处理器820和通信接口830独立实现,则存储器810、处理器820和通信接口830可以通过总线相互连接并完成相互间的通信。该总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral ComponentInterconnect ,PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture ,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器810、处理器820及通信接口830集成在一块芯片上,则存储器810、处理器820及通信接口830可以通过内部接口完成相互间的通信。
本申请实施例还提供一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现本申请任一实施例中提供的方法。
本申请实施例还提供一种计算机程序产品,其包括计算机程序,该计算机程序在被处理器执行时实现本申请任一实施例中提供的方法。
本申请实施例还提供了一种芯片,该芯片包括,包括处理器,用于从存储器中调用并运行存储器中存储的指令,使得安装有芯片的通信设备执行本申请实施例提供的方法。
本申请实施例还提供了一种芯片,包括:输入接口、输出接口、处理器和存储器,输入接口、输出接口、处理器以及存储器之间通过内部连接通路相连,处理器用于执行存储器中的代码,当代码被执行时,处理器用于执行申请实施例提供的方法。
应理解的是,上述处理器可以是中央处理器(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。值得说明的是,处理器可以是支持进阶精简指令集机器(Advanced RISC Machines,ARM)架构的处理器。
进一步地,可选的,上述存储器可以包括只读存储器和随机存取存储器,还可以包括非易失性随机存取存储器。该存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以包括只读存储器(Read-onlyMemory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以包括随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用。例如,静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic Random Access Memory ,DRAM) 、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(EnhancedSDRAM,ESDRAM)、同步连接动态随机存取存储器(Sync Link DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DR RAM)。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包括于本申请的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分。并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。
应理解的是,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。上述实施例方法的全部或部分步骤是可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。该存储介质可以是只读存储器,磁盘或光盘等。
以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (11)

1.一种数据处理方法,应用于云网络观测系统中的数据采集系统,所述方法包括:
确定第一目标数据中的地址信息与预定地址信息之间的差异信息;所述第一目标数据为云网络中的时序数据中的数据;
基于所述差异信息,得到所述第一目标数据中的地址信息的编码;
基于所述编码,在数据包中记录所述第一目标数据。
2.根据权利要求1所述的方法,其中,所述确定第一目标数据中的地址信息与预定地址信息之间的差异信息,包括:
对所述第一目标数据中的地址信息进行数据转换,得到第一整型数据;
基于所述第一整型数据与所述预定地址信息对应的整型数据之间的差值,得到所述差异信息。
3.根据权利要求1或2所述的方法,其中,所述方法还包括:
在时序数据中确定包含相同的属性信息的多个目标数据;其中,所述多个目标数据包括所述第一目标数据,所述多个目标数据均基于所述数据包进行记录。
4.根据权利要求3所述的方法,其中,所述属性信息包括虚拟私有云VPC的标识。
5.根据权利要求3所述的方法,其中,所述预定地址信息是基于所述多个目标数据中的多个地址信息确定的。
6.根据权利要求3所述的方法,其中,所述数据包包括元信息以及与所述多个目标数据分别对应的多个记录信息;所述记录信息用于记录对应的目标数据,所述元信息用于记录所述属性信息。
7.根据权利要求6所述的方法,其中,所述元信息还用于记录所述预定地址信息。
8.一种数据处理方法,应用于云网络观测系统中的数据处理系统,所述数据处理方法包括:
在数据包中读取第一目标数据的编码;所述第一目标数据为云网络中的时序数据中的数据;
基于所述编码,确定所述第一目标数据中的地址信息与预定地址信息之间的差异信息;
基于所述差异信息以及所述预定地址信息,确定所述第一目标数据的地址信息。
9.一种云网络观测系统,包括:
数据采集系统,用于采集云网络中的时序数据,通过权利要求1-7中任一项所述的方法将所述时序数据处理成数据包,存储或传输所述数据包;
数据处理系统,用于通过权利要求8所述的方法对所述数据包进行处理,得到所述时序数据,并对所述时序数据进行计算、存储或传输;
服务系统,用于展示基于所述时序数据计算出的可视化数据。
10.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器在执行所述计算机程序时实现权利要求1-8中任一项所述的方法。
11.一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-8中任一项所述的方法。
CN202211427630.8A 2022-11-15 2022-11-15 数据处理方法、设备、介质及云网络观测系统 Active CN115499338B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211427630.8A CN115499338B (zh) 2022-11-15 2022-11-15 数据处理方法、设备、介质及云网络观测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211427630.8A CN115499338B (zh) 2022-11-15 2022-11-15 数据处理方法、设备、介质及云网络观测系统

Publications (2)

Publication Number Publication Date
CN115499338A true CN115499338A (zh) 2022-12-20
CN115499338B CN115499338B (zh) 2023-09-29

Family

ID=85115717

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211427630.8A Active CN115499338B (zh) 2022-11-15 2022-11-15 数据处理方法、设备、介质及云网络观测系统

Country Status (1)

Country Link
CN (1) CN115499338B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030033430A1 (en) * 2001-07-20 2003-02-13 Lau Chi Leung IP flow discovery for IP probe auto-configuration and SLA monitoring
JP2003244111A (ja) * 2002-02-15 2003-08-29 Nippon Telegr & Teleph Corp <Ntt> 信号送受信方法、この方法を実施する装置、プログラム
CN104618361A (zh) * 2015-01-22 2015-05-13 中国科学院计算技术研究所 一种网络流数据重排序方法
US20170161605A1 (en) * 2015-12-07 2017-06-08 International Business Machines Corporation Space-efficient dynamic addressing in very large sparse networks
WO2020006912A1 (zh) * 2018-07-05 2020-01-09 平安科技(深圳)有限公司 网络传输质量分析方法、装置、计算机设备和存储介质
CN111327720A (zh) * 2020-02-21 2020-06-23 北京百度网讯科技有限公司 一种网络地址转换方法、装置、网关设备及存储介质
CN111897604A (zh) * 2020-07-30 2020-11-06 北京百度网讯科技有限公司 服务调用的调用数据处理方法及装置
CN112422448A (zh) * 2020-08-21 2021-02-26 苏州浪潮智能科技有限公司 Fpga加速卡网络数据传输方法及相关组件
CN112738297A (zh) * 2021-04-01 2021-04-30 北京达佳互联信息技术有限公司 Ip地址定位数据获取方法、装置、服务器及存储介质
CN113242181A (zh) * 2021-01-18 2021-08-10 网络通信与安全紫金山实验室 基于ESP封装和压缩IP在overlay层实现源路由的报文及发送方法
US11252126B1 (en) * 2019-03-28 2022-02-15 Amazon Technologies, Inc. Domain name resolution in environment with interconnected virtual private clouds
CN115225572A (zh) * 2022-07-13 2022-10-21 阿里巴巴(中国)有限公司 路由信息的处理方法、装置、电子设备和存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030033430A1 (en) * 2001-07-20 2003-02-13 Lau Chi Leung IP flow discovery for IP probe auto-configuration and SLA monitoring
JP2003244111A (ja) * 2002-02-15 2003-08-29 Nippon Telegr & Teleph Corp <Ntt> 信号送受信方法、この方法を実施する装置、プログラム
CN104618361A (zh) * 2015-01-22 2015-05-13 中国科学院计算技术研究所 一种网络流数据重排序方法
US20170161605A1 (en) * 2015-12-07 2017-06-08 International Business Machines Corporation Space-efficient dynamic addressing in very large sparse networks
WO2020006912A1 (zh) * 2018-07-05 2020-01-09 平安科技(深圳)有限公司 网络传输质量分析方法、装置、计算机设备和存储介质
US11252126B1 (en) * 2019-03-28 2022-02-15 Amazon Technologies, Inc. Domain name resolution in environment with interconnected virtual private clouds
CN111327720A (zh) * 2020-02-21 2020-06-23 北京百度网讯科技有限公司 一种网络地址转换方法、装置、网关设备及存储介质
CN111897604A (zh) * 2020-07-30 2020-11-06 北京百度网讯科技有限公司 服务调用的调用数据处理方法及装置
CN112422448A (zh) * 2020-08-21 2021-02-26 苏州浪潮智能科技有限公司 Fpga加速卡网络数据传输方法及相关组件
CN113242181A (zh) * 2021-01-18 2021-08-10 网络通信与安全紫金山实验室 基于ESP封装和压缩IP在overlay层实现源路由的报文及发送方法
CN112738297A (zh) * 2021-04-01 2021-04-30 北京达佳互联信息技术有限公司 Ip地址定位数据获取方法、装置、服务器及存储介质
CN115225572A (zh) * 2022-07-13 2022-10-21 阿里巴巴(中国)有限公司 路由信息的处理方法、装置、电子设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周权;周敏;肖德琴;唐屹;: "一种安全有效的无线网络消息传输方案", 计算机系统应用, no. 04 *

Also Published As

Publication number Publication date
CN115499338B (zh) 2023-09-29

Similar Documents

Publication Publication Date Title
US11095451B2 (en) Optimal data storage configuration in a blockchain
CN107295036B (zh) 一种数据发送方法及数据合并设备
CN111563109B (zh) 基数统计方法、装置、系统、设备和计算机可读存储介质
CN106027595A (zh) 用于cdn节点的访问日志处理方法及系统
CN112434039A (zh) 数据的存储方法、装置、存储介质以及电子装置
CN110198251B (zh) 一种获得客户端地址的方法及装置
CN106685429B (zh) 整数压缩方法及装置
CN112632129A (zh) 一种码流数据管理方法、装置及存储介质
CN114528231A (zh) 一种数据动态存储方法、装置、电子设备及存储介质
CN111563199A (zh) 一种数据处理方法及装置
CN107276912B (zh) 存储器、报文处理方法及分布式存储系统
CN112165505B (zh) 去中心化的数据处理方法、电子装置和存储介质
CN113326064A (zh) 划分业务逻辑模块的方法、电子设备及存储介质
CN115499338B (zh) 数据处理方法、设备、介质及云网络观测系统
CN114071448B (zh) 一种数据传输方法、相关网络节点和存储介质
CN111768196B (zh) 一种交易信息确认方法及装置
CN108650249A (zh) Poc攻击检测方法、装置、计算机设备和存储介质
CN111625502A (zh) 数据读取方法及装置、存储介质、电子装置
CN117540071B (zh) 一种针对查找引擎的属性表项的配置方法和装置
US11924097B2 (en) Traffic monitoring device, method and program
CN114726893B (zh) 可支持多种底层承载协议的物联网应用层接入方法和系统
CN111506658B (zh) 数据处理方法、装置、第一设备及存储介质
CN111865832B (zh) 一种资源分配的方法、终端、服务器及存储介质
EP4064633A1 (en) Data compression method and apparatus, network device, and storage medium
CN114726891A (zh) 一种基于物联网的视频传输上报方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant