CN114327991A - 数据处理方法、装置、电子设备及存储介质 - Google Patents
数据处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114327991A CN114327991A CN202111682338.6A CN202111682338A CN114327991A CN 114327991 A CN114327991 A CN 114327991A CN 202111682338 A CN202111682338 A CN 202111682338A CN 114327991 A CN114327991 A CN 114327991A
- Authority
- CN
- China
- Prior art keywords
- data
- abnormal
- type
- normal
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本申请提供一种数据处理方法、装置、电子设备及存储介质,通过配置的异常数据判断引擎确定正常数据和异常数据,将正常数据加入到正常数据表中进行后续处理,而将异常数据存入与异常类型对应的异常数据表中,并通过不同的异常数据表分别对不同异常类型的异常数据进行存储,实现对数据中异常数据精准、有效的分类监测和管理,保证了后续对数据进行处理的准确性。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种数据处理方法、装置、电子设备及存储介质。
背景技术
随着电子技术的不断发展,人们日常生活中使用电脑、服务器等电子设备所需要处理的数据数量越来越多,根据所处理的数据所实现的功能也越来越丰富。
现有技术中,由于数据来源方提供的数据值存在误差、数据格式不符合规则,或者数据传输延迟等因素的影响,作为数据处理方的电子设备所接收到的数据可能不够精确,影响后续的处理。
因此,在电子设备处理数据的过程中,如何保证能够更为准确地对待处理的数据流中的正常数据和异常数据分别进行处理,是本领域需要解决的技术问题。
发明内容
本申请提供一种数据处理方法、装置、电子设备及存储介质,以对待处理的数据流中的正常数据和异常数据分别进行处理。
本申请第一方面提供一种数据处理方法,包括:获取待处理的数据流,所述数据流中包括多条数据;确定所述多条数据中的正常数据和异常数据,以及所述异常数据的异常类型;将所述正常数据存入正常数据表,并按照所述数据流的预设处理规则,对所述正常数据表中的正常数据进行处理;将所述异常数据存入与所述异常类型对应的异常数据表,并通过显示页面展示每个异常类型的异常数据表的信息。
在本申请第一方面一实施例中,所述确定所述多条数据中的正常数据和异常数据,以及所述异常数据的异常类型,包括:根据所述数据流中数据的至少一个异常类型,以及每个异常类型的异常判断规则,配置异常数据判断引擎;通过所述异常数据判断引擎,确定所述多条数据中的正常数据和异常数据,以及所述异常数据的异常类型。
在本申请第一方面一实施例中,还包括:使用水位线引擎对所述数据流中的数据进行处理;其中,所述水位线引擎处理数据时,为所述数据流中的每条数据设置不同的等待时间,在处理完一条数据后,在下一条数据的等待时间内没有接收到该数据时并不处理所述数据流中的其他数据,在所述下一条数据的等待时间之后再处理其他数据。
在本申请第一方面一实施例中,所述异常数据判断引擎基于Flink编写的Kafka消费程序实现;所述异常数据判断引擎通过状态存储ValueStated单元存储所述异常判断规则。
在本申请第一方面一实施例中,所述异常类型包括以下的一项或多项:数据格式异常、数据值异常、数据频率异常和数据延迟异常。
在本申请第一方面一实施例中,所述异常数据表的信息,包括以下的一项或多项:异常数据表中异常数据的数量、所述数据流中该异常类型的异常数据的比例,以及异常类型的修复方式。
在本申请第一方面一实施例中,所述确定所述异常数据的异常类型,包括:通过所述异常数据判断引擎,确定所述异常数据的标签,所述标签用于指示所述异常类型;所述将所述异常数据存入与所述异常类型对应的异常数据表之前,还包括:根据所述异常数据的标签确定所述异常数据的异常类型。
本申请第二方面提供一种数据处理装置,可用于执行如本申请第一方面提供的数据处理方法,该装置包括:获取模块,用于获取待处理的数据流,所述数据流中包括多条数据;判断模块,用于确定所述多条数据中的正常数据和异常数据,以及所述异常数据的异常类型;正常数据处理模块,用于将所述正常数据存入正常数据表,并按照所述数据流的预设处理规则,对所述正常数据表中的正常数据进行处理;异常数据处理模块,用于将所述异常数据存入与所述异常类型对应的异常数据表,并通过显示页面展示每个异常类型的异常数据表的信息。
本申请第三方面提供一种电子设备,包括:处理器及存储器;其中,存储器中存储有计算机程序,当处理器执行计算器程序时,处理器可用于执行如本申请第一方面任一项所述的数据处理方法。
本申请第四方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被执行时可用于执行如本申请第一方面任一项所述的数据处理方法。
综上,本申请提供的数据处理方法、装置、电子设备及存储介质,通过配置的异常数据判断引擎确定正常数据和异常数据,将正常数据加入到正常数据表中进行后续处理,而将异常数据存入与异常类型对应的异常数据表中,并通过不同的异常数据表分别对不同异常类型的异常数据进行存储,实现对数据中异常数据精准、有效的分类监测和管理,保证了后续对数据进行处理的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的数据处理方法一实施例的流程示意图;
图2为本申请提供的数据处理方法另一实施例的流程示意图;
图3为本申请提供的数据处理方法又一实施例的流程示意图;
图4为water mark引擎处理数据的原理示意图;
图5为本申请提供的数据处理装置一实施例的结构示意图;
图6为本申请提供的电子设备一实施例的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请应用在数据处理的场景中,服务器等设备可用于对获取的数据进行处理。在一些具体的实现中,Kafka是一种高吞吐量、持久性、分布式的发布订阅的消息队列系统,当处理的数据是高精度定位数据时,服务器可以基于Kafka以数据流的形式对高精度定位数据进行处理。而由于数据来源方提供的数据值存在误差、数据格式不符合规则,或者数据传输延迟等因素的影响,作为数据处理方的服务器,所接收到的数据可能不够精确,影响服务器后续的消费数据、处理数据和存储数据等处理的准确性,导致后续数据处理的异常发生。
因此,本申请还提供一种数据处理方法,通过配置的异常数据判断引擎确定正常数据和异常数据,并将异常数据存入与异常类型对应的异常数据表中,实现对数据中正常数据和异常数据精准、有效的分类监测和管理,保证了后续对数据进行处理的准确性。下面以具体地实施例对本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1为本申请提供的数据处理方法一实施例的流程示意图,如图1所示,本实施例提供的数据处理方法包括:
S101:获取待处理的数据流。
在一些实施例中,本实施例提供的数据处理方法的执行主体可以是任意对数据进行处理的电子设备,例如电脑、服务器、工作站等,本申请实施例中以电子设备作为执行主体对数据处理方法进行说明,而非对执行主体进行的限定。
则电子设备对数据进行处理之前,首先通过S101获取待处理的数据。其中,当本实施例应用在Kafka等系统中,电子设备所获取的数据为流式数据,该流式数据流中包括多条数据,例如,多条数据可以是多条高精度定位数据等,电子设备通过从Kafka中消费的方式,获取待处理的数据流,数据流中包括多条高精度定位数据。
S102:确定S101中所获取的多条数据中的正常数据和异常数据,以及确定异常数据的异常类型。
其中,电子设备获取到多条数据后,并不立即对数据进行处理,而是在S102中对数据是否异常进行判断,从而确定出数据流的多条数据中的正常数据和异常数据,以在后续可以对正常数据和异常数据分别进行处理。
在一些实施例中,本申请实施例提供的异常数据的异常类型包括以下的一项或多项:数据格式异常、数据值(Value)异常、数据频率异常和数据延迟异常等。
在一些实施例中,本实施例提供的电子设备可以使用基于Flink编写的Kafka消费程序的形式,提前配置异常数据判断引擎。随后电子设备即可通过所配置的异常数据判断引擎,分别对数据流中的每条数据进行异常判断,最终确定出数据流的多条数据中的正常数据和异常数据,以及异常数据的异常类型。
在一种具体的实现方式中,电子设备还可以基于Flink的状态存储ValueStated单元存储异常判断规则,使得异常数据判断引擎可以将待判断的数据与ValueStated单元中存储的异常判断规则进行对照的方式,确定待判断的数据为正常数据或者异常数据。因此,为了对异常数据判断引擎进行配置,电子设备的操作人员可以提前输入数据流中数据的至少一个异常类型,以及每个异常类型的异常判断规则,使电子设备将这些异常类型及判断规则存入ValueStated单元中。
进一步地,当通过异常数据判断引擎判断数据为异常数据后,引擎判断数据还根据与异常判断规则的对照结果确定异常数据的异常类型,并在异常数据中加入指示异常类型的标签“Tag”,相当于对异常数据进行了标识。使得后续在处理该数据时,即可根据标签确定该数据为异常数据以及确定异常数据的数据类型,从而根据异常数据的异常类型,对异常类型不同的异常数据进行不同的操作。
S103:将S102中判断的正常数据加入到正常数据表中,并按照数据流的预设处理规则,对正常数据表中的正常数据进行处理。
S104:将S102中判断的异常数据加入到异常数据表中。特别地,本申请实施例中提供多个异常数据表,每个异常数据表可用于分别存储一个异常类型对应的异常数据。则在S104中,电子设备在存储异常数据之前,可以根据异常数据的标签确定该异常数据的异常类型,随后再将异常数据存入与异常类型对应的异常数据表中。在具体的实现方式中,电子设备可以具体通过数据输出(sink)的方式,将异常数据存入数据表中。
示例性地,当异常数据的异常类型包括:数据格式异常、数据值异常、数据频率异常和数据延迟异常,则电子设备中可以设置四个异常数据表分别存储上述四种异常数据,其对应关系记为,异常数据表1-存储格式异常的异常数据,异常数据表2-存储值异常的异常数据,异常数据表3-存储频率异常的异常数据,异常数据表4-存储延迟异常的异常数据等。则当电子设备确定待存储的异常数据的异常类型为存储格式异常时,即可将该异常数据存入异常数据表1中,以此类推。
在一些实施例中,电子设备还可以通过显示页面,对每个异常类型的异常数据表的信息进行展示。其中,所展示的信息包括以下的一项或多项:异常数据表中异常数据的数量、该类型的异常数据在多条数据中的比例、异常数据的异常类型,以及异常类型的修复方式等。
在一些实施例中,电子设备所进行的展示可以在对整个数据流中的多条数据全部处理完后,通过显示页面展示所有多条数据中异常数据表的信息,实现将对数据进行的整体的统计与分析展示给电子设备的操作人员;或者,电子设备还可以在处理数据流中多条数据的同时,在显示页面上实时展示所有异常类型的信息,从而将实时的异常信息展示给操作人员,使操作人员能够实现对正在处理的数据流进行的监测和管理。
在一些实施例中,电子设备还可也根据每个异常类型,在显示页面上展示修复该类型异常的方式和建议,从而更有效地提示电子设备的操作人员当前发生的异常一级修复方式,提高对异常数据的处理效率。
综上,本实施例提供的数据处理方法,通过配置的异常数据判断引擎确定正常数据和异常数据,将正常数据加入到正常数据表中进行后续处理,而将异常数据存入与异常类型对应的异常数据表中,在后续处理中并不对异常数据进行处理。同时,异常数据表中分别对不同异常类型的异常数据进行存储,实现对数据中异常数据精准、有效的分类监测和管理,保证了后续对数据进行处理的准确性。
图2为本申请提供的数据处理方法另一实施例的流程示意图,如图2所示的数据处理方法示出了图1所示的数据处理方法一种具体的实现方式,如图2所示,作为执行主体的电子设备通过Kafka获取高精度定位数据后,首先可以通过Flink connector Kafka等方式对待处理的数据进行解析,得到数据的headers、timestamp等信息。随后,电子设备根据异常类型以及每个异常类型的异常判断规则,配置异常数据判断引擎。并通过所配置的异常数据判断引擎,判断数据是否异常,并将正常数据通过sink的方式加入到正常数据表中,进行后续的处理。将异常数据根据其异常类型,通过sink的方式加入对应的异常数据表中。
在一些实施例中,将异常数据判断引擎所判断的异常数据记为一级异常数据,随后根据一级异常数据的标签确定其异常类型,并通过分流的方式存储到不同的异常数据表中,每个异常数据表中存储的一种异常类型的异常数据称为二级异常数据。在图2所示的示例中,异常数据表及其对应的异常类型包括:异常数据表1-存储格式异常的异常数据,异常数据表2-存储值异常的异常数据,异常数据表3-存储频率异常的异常数据,异常数据表4-存储延迟异常的异常数据。图中以上述异常类型作为示例,可以理解的是在实际应用中还可以包括其他异常,并且对异常类型和异常数据表的总数量n不做限定。因此,通过本实施例提供的数据处理方法,能够对异常数据进行了二级异常数据的分流处理,从而更好地实现对数据中异常数据精准、有效的分类监测和管理,保证了后续对数据进行处理的准确性。
图3为本申请提供的数据处理方法又一实施例的流程示意图,如图3所示的数据处理方法示出了图1所示的数据处理方法中,对异常数据判断引擎进行配置,以及使用该引擎对数据是否异常判断的一种具体的实现方式,如图3所示,为了能够对获取的待处理的数据流中的异常数据进行统计与分析,可以通过Flink编写kafka消费程序,并根据数据流中每一条数据的具体内容,与Value Stated中存储的异常判断规则确定数据是否为异常数据,具体可以通过Flink的状态存储ValueStated来存储一些特定判断标准需要多条数据对比得出结论时需要保存的历史数据。从而在这个过程中,可以向异常数据判断引擎中封装编写对应的判断规则引擎,来实现可修改外部配置文件动态控制修改判断依据对应列、具体判断时间戳数值、判断指标正常范围等异常判断规则。最终,将异常数据判断引擎处理后的正常数据加入到正常数据表中,将异常数据根据其异常类型加入到不同的异常数据表中。
在一些实施例中,如图3所示的方法中,当电子设备根据异常数据判断引擎确定正常数据和异常数据后,还可以向异常数据判断引擎更新当前正常数据和异常数据的数量等信息,使得异常数据判断引擎能够对正常数据、异常数据的出现频率等涉及历史数据的异常类型进行判断。
进一步地,本申请实施例还提供一种数据处理方法,可应用于电子设备对数据流中的多条数据进行处理。具体地,作为执行主体的电子设备在处理数据流中的多条数据时,使用水位线(water mark)引擎对多条数据进行处理。其中,水位线引擎处理数据时,为数据流中的每条数据设置不同的等待时间,在处理完一条数据后,在下一条数据的等待时间内没有接收到该数据时并不处理数据流中的其他数据,在下一条数据的等待时间之后再处理其他数据。具体地,电子设备在处理数据时,除了数据本身异常之外,还存在与数据传递时间相关的异常数据,电子设备使用理想状态设置的时间窗口处理这些异常数据时,可能出现处理过程中的异常情况,因此需要对这种异常数据进行单独的处理。
在一些实施例中,water mark是一种用于表示与处理数据的动作的时间相关联的输入完整性的概念,对于一个处理时间为X的动作,water mark是指已经得到该数据之前所有的数据,因此,当water mark提供的窗口结束时,可以认为小于water mark的数据都已经进入窗口,可以对窗口内的数据进行处理,并通过下一个窗口的water mark继续接收后续的数据。
图4为water mark引擎处理数据的原理示意图,如图4所示,当电子设备在处理数据流时,所获取的数据流中的多条数据按照图4中的顺序进行排列时,可以看出,多条数据的顺序发生了变化,电子设备需要为不同的数据提供不同的等待时间,才能够保证对所有数据进行有效的处理。例如,电子设备为其中的序号为1-4的数据设置等待时间W1,则在W1之前,将接收到的数据4和3加入到等待时间W1对应的窗口中,直到接收到该序号为1的数据后,等待时间W1的窗口结束,认为W1内的需要为1-4的数据都已经接收到完毕,因此可以将等待时间W1对应的窗口中的数据进行后续处理。并继续在下一个等待时间W2对应的窗口中等待接收数据5-7,以此类推。因此,使用water mark引擎处理数据时,可以为不同的数据提供不同的等待时间,使得电子设备在等待时间对应的窗口结束时,已经接收到该数据之前的所有数据,从而保证了电子设备能够更加准确、有效地对因数据传递时间异常造成的异常数据进行处理。
在前述各实施例中,对本申请实施例提供的数据处理方法进行了介绍,而为了实现上述本申请实施例提供的数据处理方法中的各功能,作为执行主体的电子设备可以包括硬件结构和/或软件模块,以硬件结构、软件模块、或硬件结构加软件模块的形式来实现上述各功能。上述各功能中的某个功能以硬件结构、软件模块、还是硬件结构加软件模块的方式来执行,取决于技术方案的特定应用和设计约束条件。
例如,图5为本申请提供的数据处理装置一实施例的结构示意图,如图5所示的数据处理装置包括:获取模块1001、判断模块1002、正常数据处理模块1003和异常数据处理模块1004。其中,获取模块1001用于获取待处理的数据流,数据流中包括多条数据;判断模块1002用于确定多条数据中的正常数据和异常数据,以及异常数据的异常类型;正常数据处理模块1003用于将正常数据存入正常数据表,并按照数据流的预设处理规则,对正常数据表中的正常数据进行处理;异常数据处理模块1004用于将异常数据存入与异常类型对应的异常数据表,并通过显示页面展示每个异常类型的异常数据表的信息。又例如,数据处理装置100还可以包括水位线引擎处理模块,用于对数据流中的数据进行处理等,数据处理装置中的各模块分别执行的上述步骤的具体原理及实现方式,可参考本申请前述实施例中的数据处理方法中的描述,不再赘述。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(application specific integrated circuit,ASIC),或,一个或多个微处理器(digital signal processor,DSP),或,一个或者多个现场可编程门阵列(field programmable gate array,FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(centralprocessing unit,CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,SOC)的形式实现。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘solidstate disk(SSD))等。
图6为本申请提供的电子设备一实施例的结构示意图,如图6所示的本申提供的电子设备200,包括:处理器2001以及存储器2002;其中,存储器2002中存储有计算机程序,当处理器2001执行计算机程序时,处理器2001可用于执行如本申请前述实施例中任一的数据处理方法。此外,处理器2001可以通过通信接口2003获取数据流等,图6中的各单元之间均可以通过总线连接。
本申请还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被执行时可用于执行如本申请前述实施例中任一的数据处理方法。
本申请实施例还提供一种运行指令的芯片,所述芯片用于执行如本申请前述任一实施例的数据处理方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (10)
1.一种数据处理方法,其特征在于,包括:
获取待处理的数据流,所述数据流中包括多条数据;
确定所述多条数据中的正常数据和异常数据,以及所述异常数据的异常类型;
将所述正常数据存入正常数据表,并按照所述数据流的预设处理规则,对所述正常数据表中的正常数据进行处理;
将所述异常数据存入与所述异常类型对应的异常数据表,并通过显示页面展示每个异常类型的异常数据表的信息。
2.根据权利要求1所述的方法,其特征在于,所述确定所述多条数据中的正常数据和异常数据,以及所述异常数据的异常类型,包括:
根据所述数据流中数据的至少一个异常类型,以及每个异常类型的异常判断规则,配置异常数据判断引擎;
通过所述异常数据判断引擎,确定所述多条数据中的正常数据和异常数据,以及所述异常数据的异常类型。
3.根据权利要求1或2所述的方法,其特征在于,还包括:
使用水位线引擎对所述数据流中的数据进行处理;其中,所述水位线引擎处理数据时,为所述数据流中的每条数据设置不同的等待时间,在处理完一条数据后,在下一条数据的等待时间内没有接收到该数据时并不处理所述数据流中的其他数据,在所述下一条数据的等待时间之后再处理其他数据。
4.根据权利要求2所述的方法,其特征在于,
所述异常数据判断引擎基于Flink编写的Kafka消费程序实现;
所述异常数据判断引擎通过状态存储ValueStated单元存储所述异常判断规则。
5.根据权利要求3所述的方法,其特征在于,所述异常类型包括以下的一项或多项:
数据格式异常、数据值异常、数据频率异常和数据延迟异常。
6.根据权利要求3所述的方法,其特征在于,所述异常数据表的信息,包括以下的一项或多项:
异常数据表中异常数据的数量、所述数据流中该异常类型的异常数据的比例,以及异常类型的修复方式。
7.根据权利要求2所述的方法,其特征在于,
所述确定所述异常数据的异常类型,包括:通过所述异常数据判断引擎,确定所述异常数据的标签,所述标签用于指示所述异常类型;
所述将所述异常数据存入与所述异常类型对应的异常数据表之前,还包括:根据所述异常数据的标签确定所述异常数据的异常类型。
8.一种数据处理装置,其特征在于,包括:
获取模块,用于获取待处理的数据流,所述数据流中包括多条数据;
判断模块,用于确定所述多条数据中的正常数据和异常数据,以及所述异常数据的异常类型;
正常数据处理模块,用于将所述正常数据存入正常数据表,并按照所述数据流的预设处理规则,对所述正常数据表中的正常数据进行处理;
异常数据处理模块,用于将所述异常数据存入与所述异常类型对应的异常数据表,并通过显示页面展示每个异常类型的异常数据表的信息。
9.一种电子设备,其特征在于,包括:处理器及存储器;其中,存储器中存储有计算机程序,当处理器执行计算器程序时,处理器可用于执行如权利要求1-7任一项所述的数据处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被执行时可用于执行如权利要求1-7任一项所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111682338.6A CN114327991A (zh) | 2021-12-29 | 2021-12-29 | 数据处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111682338.6A CN114327991A (zh) | 2021-12-29 | 2021-12-29 | 数据处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114327991A true CN114327991A (zh) | 2022-04-12 |
Family
ID=81022801
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111682338.6A Pending CN114327991A (zh) | 2021-12-29 | 2021-12-29 | 数据处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114327991A (zh) |
-
2021
- 2021-12-29 CN CN202111682338.6A patent/CN114327991A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108683562B (zh) | 异常检测定位方法、装置、计算机设备及存储介质 | |
CN111104421A (zh) | 一种基于数据接口标准配置的数据查询方法及装置 | |
CN110647447B (zh) | 用于分布式系统的异常实例检测方法、装置、设备和介质 | |
CN109739700B (zh) | 一种接口测试方法和装置 | |
CN114844768A (zh) | 信息分析方法、装置及电子设备 | |
CN111651595A (zh) | 一种异常日志处理方法及装置 | |
CN112181522A (zh) | 数据处理的方法、装置以及电子设备 | |
CN109684309A (zh) | 一种数据质量评测方法及装置、计算机设备和存储介质 | |
CN112035286A (zh) | 故障原因的确定方法及装置、存储介质、电子装置 | |
CN117149894A (zh) | 一种调用链路的展示方法、装置、电子设备及存储介质 | |
CN112087320A (zh) | 一种异常定位方法、装置、电子设备和可读存储介质 | |
CN114327991A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN116303013A (zh) | 源码分析方法、装置、电子设备及存储介质 | |
CN116126719A (zh) | 接口测试方法、装置、电子设备及存储介质 | |
CN116430207A (zh) | 芯片的pat参数确定方法、装置、电子设备及存储介质 | |
CN111884932B (zh) | 一种链路确定方法、装置、设备和计算机可读存储介质 | |
CN115643172A (zh) | 一种异常检测方法、装置、终端设备及存储介质 | |
CN115202946A (zh) | 自动化测试方法、装置、设备、存储介质及程序产品 | |
CN114513334A (zh) | 风险管理方法和风险管理装置 | |
CN110008291B (zh) | 数据预警方法、装置、存储介质及电子设备 | |
CN115372752A (zh) | 故障检测方法、装置、电子设备以及存储介质 | |
US20200267054A1 (en) | Determining the importance of network devices based on discovered topology, managed endpoints, and activity | |
CN113572628A (zh) | 数据关联方法、装置、计算设备及计算机存储介质 | |
WO2023103627A1 (zh) | 网络巡检的方法、装置、电子设备和存储介质 | |
CN115858325B (zh) | 一种项目日志的调整方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |