CN112527782B - 一种数据处理的方法和装置 - Google Patents

一种数据处理的方法和装置 Download PDF

Info

Publication number
CN112527782B
CN112527782B CN201910888146.7A CN201910888146A CN112527782B CN 112527782 B CN112527782 B CN 112527782B CN 201910888146 A CN201910888146 A CN 201910888146A CN 112527782 B CN112527782 B CN 112527782B
Authority
CN
China
Prior art keywords
data
time
delay
processing
acquisition time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910888146.7A
Other languages
English (en)
Other versions
CN112527782A (zh
Inventor
何红呈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Zhenshi Information Technology Co Ltd
Original Assignee
Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Zhenshi Information Technology Co Ltd filed Critical Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority to CN201910888146.7A priority Critical patent/CN112527782B/zh
Publication of CN112527782A publication Critical patent/CN112527782A/zh
Application granted granted Critical
Publication of CN112527782B publication Critical patent/CN112527782B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种数据处理的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:将采集的数据放入堆底,并按照采集时间进行堆内数据排序;从堆顶取出数据并获取数据的采集时间;判断数据的采集时间与当前时间的时间差是否满足延时处理条件;若满足,则判断数据的采集时间是否位于最新的已处理数据的采集时间之前;若否,则对数据进行处理。该实施方式能够在尽量保证实时性的基础上,提高数据处理的准确性,降低数据丢弃率,并可根据实时网络状况动态调整延迟处理时间,用户体验好。

Description

一种数据处理的方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据处理的方法和装置。
背景技术
伴随着大数据时代的来临,对数据处理的要求也越来越高,很多系统在对数据处理时对数据有较高的顺序要求。若数据无法按照顺序到达,则会导致数据处理异常,会造成系统无法正常运行。
其中一个应用场景例如是:物联网IOT(The Internet of Things)平台在根据采集的车辆数据判断是否需要进行超速报警,或者根据采集的温度数据进行温度报警等情况下,都对数据的顺序有很高的要求。然而,在IOT平台接入车辆上报的数据时,由于终端批量上报、网络延时,后台服务器为了处理性能进行了异步化等等原因,导致原本按照时间顺序采集的数据到最终处理的时候却变成了无序的数据,但是对于车辆的监控比如超速报警、冷链车温度报警等,其判断告警依赖于上一条数据上报的车辆数据状态,需要数据有序才能进行处理。
为了保证系统的正常运行,需要对无序数据进行处理。现有的对无序数据进行处理时的做法是记录上一次处理的数据的采集时间,若当前接到的数据的采集时间在上一次处理的数据的采集时间之前就丢弃,不进行处理。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
现有的丢弃延迟到达数据的处理方法,虽然保证了数据的实时处理,但由于数据处理依赖于相邻上报的数据,故而会造成报警延迟、报警信息不准确、漏报警等一系列问题。
发明内容
有鉴于此,本发明实施例提供一种数据处理的方法和装置,能够在尽量保证实时性的基础上,提高数据处理的准确性,降低数据丢弃率,并可根据实时网络状况动态调整延迟处理时间,用户体验好。
为实现上述目的,根据本发明实施例的一个方面,提供了一种数据处理的方法。
一种数据处理的方法,包括:将采集的数据放入堆底,并按照采集时间进行堆内数据排序;从堆顶取出数据并获取所述数据的采集时间;判断所述数据的采集时间与当前时间的时间差是否满足延时处理条件;若满足,则判断所述数据的采集时间是否位于最新的已处理数据的采集时间之前;若否,则对所述数据进行处理。
可选地,判断所述数据的采集时间与当前时间的时间差是否满足延时处理条件包括:将所述数据的采集时间与当前时间的时间差的绝对值作为所述数据的延迟时间;判断所述数据的延迟时间是否大于当前的延迟处理时间。
可选地,还包括:若所述数据的采集时间位于最新的已处理数据的采集时间之前,则将所述数据丢弃,并且更新所述延迟处理时间,其中,所述延迟处理时间根据所述当前时间和所述数据的采集时间的时间差计算得到。
可选地,所述延迟处理时间是通过以下方式计算得到的:将所述当前时间和所述数据的采集时间的时间差的绝对值作为所述数据的延迟时间RTT;通过对RTT和过去一段时间总的延迟时间SRTT进行加权运算,以对SRTT进行平滑处理;通过加权移动平均法计算平滑处理后的SRTT与RTT的偏差DevRTT;根据所述平滑处理后的SRTT和DevRTT计算延迟处理时间。
可选地,还包括:若计算得到的延迟处理时间大于预设的延迟处理时间上限值,则将所述上限值作为所述延迟处理时间。
根据本发明实施例的另一方面,提供了一种数据处理的装置。
一种数据处理的装置,包括:数据排序模块,用于将采集的数据放入堆底,并按照采集时间进行堆内数据排序;数据获取模块,用于从堆顶取出数据并获取所述数据的采集时间;延时判断模块,用于判断所述数据的采集时间与当前时间的时间差是否满足延时处理条件;时间判断模块,用于若满足,则判断所述数据的采集时间是否位于最新的已处理数据的采集时间之前;数据处理模块,用于若否,则对所述数据进行处理。
可选地,所述延时判断模块还用于:将所述数据的采集时间与当前时间的时间差的绝对值作为所述数据的延迟时间;判断所述数据的延迟时间是否大于当前的延迟处理时间。
可选地,还包括延时更新模块,用于:若所述数据的采集时间位于最新的已处理数据的采集时间之前,则将所述数据丢弃,并且更新所述延迟处理时间,其中,所述延迟处理时间根据所述当前时间和所述数据的采集时间的时间差计算得到。
可选地,所述延迟处理时间是通过以下方式计算得到的:将所述当前时间和所述数据的采集时间的时间差的绝对值作为所述数据的延迟时间RTT;通过对RTT和过去一段时间总的延迟时间SRTT进行加权运算,以对SRTT进行平滑处理;通过加权移动平均法计算平滑处理后的SRTT与RTT的偏差DevRTT;根据所述平滑处理后的SRTT和DevRTT计算延迟处理时间。
可选地,还包括延时处理模块,用于:若计算得到的延迟处理时间大于预设的延迟处理时间上限值,则将所述上限值作为所述延迟处理时间。
根据本发明实施例的又一方面,提供了一种数据处理的电子设备。
一种数据处理的电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例所提供的数据处理的方法。
根据本发明实施例的再一方面,提供了一种计算机可读介质。
一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例所提供的数据处理的方法。
上述发明中的一个实施例具有如下优点或有益效果:通过将采集的数据放入堆底,并按照采集时间进行堆内数据排序;然后从堆顶取出数据并获取数据的采集时间;然后判断数据的采集时间与当前时间的时间差是否满足延时处理条件;若满足,则判断数据的采集时间是否位于最新的已处理数据的采集时间之前;若否,则对数据进行处理,实现了基于缓存堆进行数据的缓存和排序处理,通过设置延时处理条件以对数据进行延时处理,可以在尽量减少实时性损耗的情况下尽可能地保证数据处理结果的准确性,降低数据丢弃率,充分利用数据信息。本发明通过缓存堆、动态设置的延时处理条件,动态规划无序数据流处理,在尽量保证实时性的基础上,提高数据处理的准确性,降低数据丢弃率,并可根据实时网络状况动态调整延迟处理时间,用户体验好。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的数据处理的方法的主要步骤示意图;
图2是本发明实施例的进行数据排序的实现原理示意图;
图3是本发明一个实施例的进行数据处理的实现流程示意图;
图4是根据本发明实施例的数据处理的装置的主要模块示意图;
图5是本发明实施例可以应用于其中的示例性系统架构图;
图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
为了解决现有技术中存在的在对无序数据进行处理时出现的简单丢弃延迟数据而造成的报警延迟、报警信息不准确、漏报警等一系列问题,本发明提供了一种数据处理的方法和装置,通过数据结构堆来进行数据缓存及排序处理,然后根据延迟处理条件和数据的采集时间来判断是否对数据进行处理,可以在尽可能减少数据处理延时的情况下,解决大量丢弃无序数据的问题,使数据尽可能多的发挥作用。
图1是根据本发明实施例的数据处理的方法的主要步骤示意图。如图1所示,本发明实施例的数据处理的方法主要包括如下的步骤S101至步骤S105。
步骤S101:将采集的数据放入堆底,并按照采集时间进行堆内数据排序。
堆(Heap)是计算机科学中一类特殊的数据结构的统称,堆通常是一个可以被看作一棵完全二叉树的数组对象。在本发明的实施例中,堆用于进行数据缓存及排序,因此又叫作数据缓存堆。数据缓存堆采用的是堆排序的思想,堆排序是指利用堆积树这种数据结构所设计的一种排序算法,它是选择排序的一种,可以利用数组的特点快速定位指定索引的元素,是完全二叉树。
堆排序是将数据看成是完全二叉树、根据完全二叉树的特性来进行排序的一种算法,它有两个特性:1、最大堆要求节点元素都要不小于其左右子节点,那么处于最大堆的根节点的元素一定是这个堆中的最大值;2、最小堆要求节点元素都不大于其左右子节点,那么处于最小堆的根节点的元素一定是这个堆中的最小值。
堆底指的就是堆的最后一层的最左边的空闲没有节点的位置。一个新的元素放入堆底之后,只需比较它与它父节点的大小,根据大小决定是否要互换,如果需要进行互换,则互换之后再向上比较父节点,直至根节点。于是,要找到一组元素的最大值最多只需比较n(n为堆的层数)次,比较次数远小于元素数量,所以对于一组元素取最大值和最小值的时候堆排序的效率很高。
根据本发明的实施例,通过数据缓存堆的最小堆特性,即可在排序操作后,将数据采集时间最早的数据放置在堆顶。并通过从堆顶取出数据并进行处理来实现数据的时间有序化处理。
图2是本发明实施例的进行数据排序的实现原理示意图。如图2所示,在进行数据处理之前,会先对采集的数据进行接收、汇总等,然后发送至处理端。由于网络延迟、异步处理等多种因素,会出现对于采集端按照时间顺序依次采集的有序数据1、2、3、4、5,当接收层通过异步传输将数据发送给处理端时,处理端接收到数据的顺序可能会变成2、3、4、1、5。而处理端在进行数据处理时,需要按照数据采集的时间顺序来按序处理。因此,需要在处理端进行一次数据排序。
在本发明的实施例中,通过在服务端为每个采集设备的处理端设置一个数据缓存堆,处理端在进行数据处理前,每次当接收到接收层发送过来的数据时,即将数据放入堆底,并按照采集时间进行一次堆内数据排序,从而将采集时间最早的数据放置到堆顶,方便之后的数据处理。
步骤S102:从堆顶取出数据并获取数据的采集时间。处理端每次进行数据处理时,即可从堆顶取出当前数据缓存堆中采集时间最早的数据,并进行后续的判断处理。
步骤S103:判断数据的采集时间与当前时间的时间差是否满足延时处理条件。
根据本发明实施例的技术方案,延时处理条件例如是设置一个延迟处理时间,并将数据的采集时间与当前时间的时间差与该延迟处理时间进行比较,以确定是否满足延时处理条件。
具体地,步骤S103在判断数据的采集时间与当前时间的时间差是否满足延时处理条件时,具体可以按照以下步骤来执行:
将数据的采集时间与当前时间的时间差的绝对值作为该数据的延迟时间;
判断该数据的延迟时间是否大于当前的延迟处理时间。
本领域技术人员应当知道,在进行数据处理时,由于网络延迟或者异步传输等的缘故,数据的实时性和准确性是相互矛盾的。因为数据不按序到达的特性,如果强调数据处理的实时性,那么必然需要丢弃乱序的数据;如果要求数据处理的准确性,那么先到达的采集时间较晚的数据必然要等待后到达的采集时间较早的数据,那么必然会造成数据处理不够实时。而本发明中,设置延迟处理时间就是为了在二者间做一个平衡,先到达的数据等待一小段时间,这样可以在实时性没有损耗太多的情况下尽可能地保证数据的准确性。
根据本发明的实施例,每次从堆顶取出一条数据后,首先计算该数据的采集时间与当前时间的时间差的绝对值,并将其作为该数据的延迟时间RTT,然后进行RTT与当前的延迟处理时间RTO的大小比较,若RTT大于RTO,则对该数据进行后续判断处理,并将该数据从缓存堆中移除;若RTT小于或等于RTO,则暂不进行处理。此时,处理端可以通过周期性地从堆顶取出数据并判断是否满足RTT大于RTO,从而来获取要进行进一步处理的数据。
根据本发明的另外的实施例,当RTT等于RTO时,也可以将数据进行进一步处理。仅在RTT小于RTO时,才暂不进行处理。根据本发明的技术方案,临界值的处理方式可根据需要灵活设定,并不局限于本发明实施例中所列举出的情况。
步骤S104:若满足,则判断数据的采集时间是否位于最新的已处理数据的采集时间之前。
在本发明的实施例中,服务器的处理端每处理一条数据,就会使用该数据的采集时间来更新最新的已处理数据的采集时间。也就是说,最新的已处理数据的采集时间是随着已处理数据的采集时间来动态更新的。
当处理端从堆顶获取到一条数据后,若该数据的延迟时间已满足步骤S103中的延迟处理条件,则可通过将该数据的采集时间与服务器中保存的最新的已处理数据的采集时间进行比较,来确定该数据是否为乱序或过期的数据。
步骤S105:若否,则对数据进行处理。即:若数据的采集时间不是位于最新的已处理数据的采集时间之前,则说明该数据不是乱序或过期的数据,则对该数据进行处理。否则,若数据的采集时间位于最新的已处理数据的采集时间之前,则说明该数据是乱序或过期的数据,将数据丢弃。具体场景例如是:有先后采集的两条数据1和2,数据2到达了服务器,根据算法数据2会等待一小段时间(即:延迟处理时间)后才会被处理,可是这段时间内数据1仍然没有到达,为了数据处理的实时性数据2不会再等下去,服务器对它进行了处理。这之后,数据1到达了服务器,此时就出现了当前数据1的采集时间在最新的已处理数据2的采集时间之前的情况。此时,数据1即为乱序或过期的数据,应将其丢弃。
根据本发明实施例的技术方案,通过延时丢弃的方式来对数据进行处理,可以在实时性没有损耗太多的情况下尽可能地保证数据的准确性。而延时丢弃的关键在于延迟处理时间RTO的设置,若RTO过大,则会造成数据处理不及时,影响处理的实时性,若RTO过小,则数据乱序就会比较严重,造成丢弃数据过多。因此,本发明的RTO采用动态计算的方法得到,在每次丢弃数据时,会重新计算延迟处理时间并更新当前的延迟处理时间。延迟处理时间RTO是根据当前时间和数据的采集时间的时间差动态计算的,如果当前的网络环境不好,数据到达服务器的延时较长,当前时间和采集时间的时间差就会比较大,根据本发明的RTO的计算方法,动态的延迟处理时间也会变大以适应较差的网络环境。
根据本发明的一个实施例,延迟处理时间是通过以下方式计算得到的:
将当前时间和数据的采集时间的时间差的绝对值作为该数据的延迟时间RTT;
通过对RTT和过去一段时间总的延迟时间SRTT进行加权运算,以对SRTT进行平滑处理;
通过加权移动平均法计算平滑处理后的SRTT与RTT的偏差DevRTT;
根据平滑处理后的SRTT和DevRTT计算延迟处理时间。
具体地,首先获取数据的延迟时间RTT和过去一段时间(具体时间长度可根据应用场景的需要灵活设定,例如:5分钟)总的延迟时间SRTT;然后通过对RTT和SRTT进行加权运算来对SRTT进行平滑处理。由于当前数据的RTT在一定程度上影响了SRTT的取值,且通过对RTT和SRTT做加权运算来对SRTT进行平滑处理可以避免偶发性的高延迟及RTT偶发性偏高对SRTT的影响过大,因此,需要对SRTT进行平滑处理。本发明的实施例中对SRTT进行平滑处理的公式如下:
SRTT=SRTT+α(RTT–SRTT);
其中,α为权重值,在Linux环境下α取值例如为0.125。
之后,即可通过加权移动平均法计算平滑处理后的SRTT与RTT的偏差DevRTT(Deviation RTT,即RTT偏差),具体公式如下:
DevRTT=(1-β)*DevRTT+β*(|RTT-SRTT|);
其中,β为权重值,在Linux环境下β取值例如为0.25。
最后,根据平滑处理后的SRTT和DevRTT计算延迟处理时间RTO,具体公式如下:
其中,μ和为权重值,在Linux环境下μ取值例如为1,/>取值例如为4。
其中,上述的各个权重值α、β、μ和的具体取值,可根据应用需要进行设定,也可是通过多次试验后得到效果最好时对应的权重值,等等。其具体的求解方式,本发明不作限定。
另外,为了防止由于某时间段网络波动导致RTT过大,由此计算出的RTO过大,影响实时性,故可根据实际情况设置一个RTO上限值RTOmax,若计算得到的延迟处理时间RTO大于预设的延迟处理时间上限值RTOmax,则将该上限值RTOmax作为延迟处理时间。例如:软件的用户对于时间延迟有一定的容忍度,那么就需要设置延迟处理时间RTO的上限值,因为超过这个上限值用户会无法接受,所以在任何情况下都不能超过这个上限值。因此,若计算得到的延迟处理时间大于预设的延迟处理时间上限值,则将该上限值作为延迟处理时间。如此,即可在保证用户体验的前提下动态设置延迟处理时间。
图3是本发明一个实施例的进行数据处理的实现流程示意图。如图3所示,本发明实施例的处理流程主要包括如下步骤:
步骤S301:处理端在接收到采集的数据后,将采集的数据放入堆底,并按照采集时间进行排序,然后执行步骤S302;
步骤S302:从堆顶取出数据并获取数据的采集时间,然后执行步骤S303;
步骤S303:判断数据的延迟时间是否满足延时处理条件,其中,数据的延迟时间即为数据的采集时间与当前时间的时间差的绝对值,并且,当数据的延迟时间大于当前的延迟处理时间时即判定为满足延时处理条件。若满足,则执行步骤S304;否则,执行步骤S307;
步骤S304:判断数据的采集时间是否在最新的已处理数据的采集时间之前,若是,则执行步骤S305;否则,执行步骤S306;
步骤S305:丢弃该数据,并重新计算延迟处理时间,然后执行步骤S308;
步骤S306:处理该数据,并使用该数据的采集时间来更新最新的已处理数据的采集时间,然后执行步骤S308;
步骤S307:暂不对该数据进行处理,然后执行步骤S308;
步骤S308:结束。
图4是根据本发明实施例的数据处理的装置的主要模块示意图。如图4所示,本发明实施例的数据处理的装置400主要包括数据排序模块401、数据获取模块402、延时判断模块403、时间判断模块404和数据处理模块405。
数据排序模块401,用于将采集的数据放入堆底,并按照采集时间进行堆内数据排序;
数据获取模块402,用于从堆顶取出数据并获取数据的采集时间;
延时判断模块403,用于判断数据的采集时间与当前时间的时间差是否满足延时处理条件;
时间判断模块404,用于若满足,则判断数据的采集时间是否位于最新的已处理数据的采集时间之前;
数据处理模块405,用于若否,则对数据进行处理。
根据本发明的一个实施例,延时判断模块403还可以用于:
将数据的采集时间与当前时间的时间差的绝对值作为数据的延迟时间;
判断数据的延迟时间是否大于当前的延迟处理时间。
根据本发明的另一个实施例,数据处理的装置400还可以包括延时更新模块(图中未示出),用于:
若数据的采集时间位于最新的已处理数据的采集时间之前,则将数据丢弃,并且更新延迟处理时间,其中,延迟处理时间根据当前时间和数据的采集时间的时间差计算得到。
根据本发明的又一个实施例,延迟处理时间是通过以下方式计算得到的:
将当前时间和数据的采集时间的时间差的绝对值作为数据的延迟时间RTT;
通过对RTT和过去一段时间总的延迟时间SRTT进行加权运算,以对SRTT进行平滑处理;
通过加权移动平均法计算平滑处理后的SRTT与RTT的偏差DevRTT;
根据平滑处理后的SRTT和DevRTT计算延迟处理时间。
根据本发明的再一个实施例,数据处理的装置400还可以包括延时处理模块(图中未示出),用于:
若计算得到的延迟处理时间大于预设的延迟处理时间上限值,则将该上限值作为延迟处理时间。
根据本发明实施例的技术方案,通过将采集的数据放入堆底,并按照采集时间进行堆内数据排序;然后从堆顶取出数据并获取数据的采集时间;然后判断数据的采集时间与当前时间的时间差是否满足延时处理条件;若满足,则判断数据的采集时间是否位于最新的已处理数据的采集时间之前;若否,则对数据进行处理,实现了基于缓存堆进行数据的缓存和排序处理,通过设置延时处理条件以对数据进行延时处理,可以在尽量减少实时性损耗的情况下尽可能地保证数据处理结果的准确性,降低数据丢弃率,充分利用数据信息。本发明通过缓存堆、动态设置的延时处理条件,动态规划无序数据流处理,在尽量保证实时性的基础上,提高数据处理的准确性,降低数据丢弃率,并可根据实时网络状况动态调整延迟处理时间,用户体验好。
图5示出了可以应用本发明实施例的数据处理的方法或数据处理的装置的示例性系统架构500。
如图5所示,系统架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的数据处理的方法一般由服务器505执行,相应地,数据处理的装置一般设置于服务器505中。
应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图6,其示出了适于用来实现本发明实施例的终端设备或服务器的计算机系统600的结构示意图。图6示出的终端设备或服务器仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括数据排序模块、数据获取模块、延时判断模块、时间判断模块和数据处理模块。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定,例如,数据排序模块还可以被描述为“用于将采集的数据放入堆底,并按照采集时间进行堆内数据排序的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:将采集的数据放入堆底,并按照采集时间进行堆内数据排序;从堆顶取出数据并获取所述数据的采集时间;判断所述数据的采集时间与当前时间的时间差是否满足延时处理条件;若满足,则判断所述数据的采集时间是否位于最新的已处理数据的采集时间之前;若否,则对所述数据进行处理。
根据本发明实施例的技术方案,通过将采集的数据放入堆底,并按照采集时间进行堆内数据排序;然后从堆顶取出数据并获取数据的采集时间;然后判断数据的采集时间与当前时间的时间差是否满足延时处理条件;若满足,则判断数据的采集时间是否位于最新的已处理数据的采集时间之前;若否,则对数据进行处理,实现了基于缓存堆进行数据的缓存和排序处理,通过设置延时处理条件以对数据进行延时处理,可以在尽量减少实时性损耗的情况下尽可能地保证数据处理结果的准确性,降低数据丢弃率,充分利用数据信息。本发明通过缓存堆、动态设置的延时处理条件,动态规划无序数据流处理,在尽量保证实时性的基础上,提高数据处理的准确性,降低数据丢弃率,并可根据实时网络状况动态调整延迟处理时间,用户体验好。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (6)

1.一种数据处理的方法,其特征在于,包括:
将采集的数据放入堆底,并按照采集时间进行堆内数据排序;
从堆顶取出数据并获取所述数据的采集时间;
判断所述数据的采集时间与当前时间的时间差是否满足延时处理条件,包括:将所述数据的采集时间与当前时间的时间差的绝对值作为所述数据的延迟时间;判断所述数据的延迟时间是否大于当前的延迟处理时间;
若满足,则判断所述数据的采集时间是否位于最新的已处理数据的采集时间之前;
若所述数据的采集时间不位于最新的已处理数据的采集时间之前,则对所述数据进行处理;
若所述数据的采集时间位于最新的已处理数据的采集时间之前,则将所述数据丢弃,并且更新所述延迟处理时间,其中,所述延迟处理时间根据所述当前时间和所述数据的采集时间的时间差计算得到;所述延迟处理时间是通过以下方式计算得到的:将所述当前时间和所述数据的采集时间的时间差的绝对值作为所述数据的延迟时间RTT;通过对RTT和过去一段时间总的延迟时间SRTT进行加权运算,以对SRTT进行平滑处理;通过加权移动平均法计算平滑处理后的SRTT与RTT的偏差DevRTT;根据所述平滑处理后的SRTT和DevRTT计算延迟处理时间。
2.根据权利要求1所述的方法,其特征在于,还包括:
若计算得到的延迟处理时间大于预设的延迟处理时间上限值,则将所述上限值作为所述延迟处理时间。
3.一种数据处理的装置,其特征在于,包括:
数据排序模块,用于将采集的数据放入堆底,并按照采集时间进行堆内数据排序;
数据获取模块,用于从堆顶取出数据并获取所述数据的采集时间;
延时判断模块,用于判断所述数据的采集时间与当前时间的时间差是否满足延时处理条件;所述延时判断模块还用于:将所述数据的采集时间与当前时间的时间差的绝对值作为所述数据的延迟时间;判断所述数据的延迟时间是否大于当前的延迟处理时间;
时间判断模块,用于若满足,则判断所述数据的采集时间是否位于最新的已处理数据的采集时间之前;
数据处理模块,用于若所述数据的采集时间不位于最新的已处理数据的采集时间之前,则对所述数据进行处理;
延时更新模块,用于:若所述数据的采集时间位于最新的已处理数据的采集时间之前,则将所述数据丢弃,并且更新所述延迟处理时间,其中,所述延迟处理时间根据所述当前时间和所述数据的采集时间的时间差计算得到;所述延迟处理时间是通过以下方式计算得到的:将所述当前时间和所述数据的采集时间的时间差的绝对值作为所述数据的延迟时间RTT;通过对RTT和过去一段时间总的延迟时间SRTT进行加权运算,以对SRTT进行平滑处理;通过加权移动平均法计算平滑处理后的SRTT与RTT的偏差DevRTT;根据所述平滑处理后的SRTT和DevRTT计算延迟处理时间。
4.根据权利要求3所述的装置,其特征在于,还包括延时处理模块,用于:
若计算得到的延迟处理时间大于预设的延迟处理时间上限值,则将所述上限值作为所述延迟处理时间。
5.一种数据处理的电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-2中任一所述的方法。
6.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-2中任一所述的方法。
CN201910888146.7A 2019-09-19 2019-09-19 一种数据处理的方法和装置 Active CN112527782B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910888146.7A CN112527782B (zh) 2019-09-19 2019-09-19 一种数据处理的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910888146.7A CN112527782B (zh) 2019-09-19 2019-09-19 一种数据处理的方法和装置

Publications (2)

Publication Number Publication Date
CN112527782A CN112527782A (zh) 2021-03-19
CN112527782B true CN112527782B (zh) 2023-09-22

Family

ID=74974263

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910888146.7A Active CN112527782B (zh) 2019-09-19 2019-09-19 一种数据处理的方法和装置

Country Status (1)

Country Link
CN (1) CN112527782B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001352316A (ja) * 2000-04-07 2001-12-21 Ntt Docomo Inc データ伝送において発生する遅延ジッタを吸収する装置および方法
CN101076989A (zh) * 2004-10-13 2007-11-21 高通股份有限公司 基于估计延迟的去抖动缓冲器调整
CN103023813A (zh) * 2011-10-25 2013-04-03 斯凯普公司 抖动缓冲器
CN103069835A (zh) * 2010-08-12 2013-04-24 索尼公司 信息处理装置和方法、以及程序
CN104080115A (zh) * 2013-03-28 2014-10-01 中国移动通信集团公司 一种时间同步性能监测方法、装置及系统
CN108495177A (zh) * 2018-03-30 2018-09-04 北京三体云联科技有限公司 一种音频变速处理方法及装置
CN108966028A (zh) * 2018-08-17 2018-12-07 上海悠络客电子科技股份有限公司 一种基于网络状况动态调节播放速度的防抖动方法
CN109379620A (zh) * 2018-11-28 2019-02-22 广州四三九九信息科技有限公司 音视频缓冲方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004039186B4 (de) * 2004-08-12 2010-07-01 Infineon Technologies Ag Verfahren und Vorrichtung zur Kompensation von Laufzeitschwankungen von Datenpaketen

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001352316A (ja) * 2000-04-07 2001-12-21 Ntt Docomo Inc データ伝送において発生する遅延ジッタを吸収する装置および方法
CN101076989A (zh) * 2004-10-13 2007-11-21 高通股份有限公司 基于估计延迟的去抖动缓冲器调整
CN103069835A (zh) * 2010-08-12 2013-04-24 索尼公司 信息处理装置和方法、以及程序
CN103023813A (zh) * 2011-10-25 2013-04-03 斯凯普公司 抖动缓冲器
CN104080115A (zh) * 2013-03-28 2014-10-01 中国移动通信集团公司 一种时间同步性能监测方法、装置及系统
CN108495177A (zh) * 2018-03-30 2018-09-04 北京三体云联科技有限公司 一种音频变速处理方法及装置
CN108966028A (zh) * 2018-08-17 2018-12-07 上海悠络客电子科技股份有限公司 一种基于网络状况动态调节播放速度的防抖动方法
CN109379620A (zh) * 2018-11-28 2019-02-22 广州四三九九信息科技有限公司 音视频缓冲方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种实时可靠多播协议延迟性能分析;杨瑞娟;黄美荣;柳健;;电子学报(01);93-96 *
多媒体流在网络中的同步算法;卢寅, 常征;淮海工学院学报(02);25-28 *

Also Published As

Publication number Publication date
CN112527782A (zh) 2021-03-19

Similar Documents

Publication Publication Date Title
US7698417B2 (en) Optimized performance counter monitoring
CN107729570B (zh) 用于服务器的数据迁移方法和装置
CN110650209A (zh) 实现负载均衡的方法和装置
CN113722055A (zh) 数据处理方法、装置、电子设备和计算机可读介质
CN113722106A (zh) 一种内存管理的方法和装置
CN113760991A (zh) 数据操作方法、装置、电子设备和计算机可读介质
CN110766348A (zh) 一种组合拣货任务的方法和装置
CN109977139B (zh) 基于类结构化查询语句的数据处理方法和装置
CN112527782B (zh) 一种数据处理的方法和装置
CN113742057A (zh) 一种任务执行方法和装置
CN115438007A (zh) 一种文件合并方法、装置、电子设备及介质
CN115543416A (zh) 一种配置更新方法、装置、电子设备及存储介质
CN113726885B (zh) 一种流量配额的调整方法和装置
CN113590322A (zh) 一种数据处理方法和装置
CN112866179B (zh) 限流方法和限流装置
CN112749204B (zh) 一种读取数据的方法和装置
CN113138943B (zh) 一种处理请求的方法和装置
CN113760178A (zh) 缓存数据处理方法、装置、电子设备和计算机可读介质
CN113722113A (zh) 一种流量统计的方法和装置
CN113626175A (zh) 数据处理的方法和装置
CN112711545B (zh) 一种基于数组链表式队列结构的数据存取方法
CN114553894B (zh) 数据同步方法、装置、系统及存储介质
CN113760493B (zh) 一种作业调度方法和装置
CN113779019B (zh) 一种基于环形链表的限流方法和装置
CN110019671B (zh) 一种处理实时消息的方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant