CN113094241A - 一种实时程序准确性的确定方法、装置、设备及存储介质 - Google Patents

一种实时程序准确性的确定方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113094241A
CN113094241A CN202110496745.1A CN202110496745A CN113094241A CN 113094241 A CN113094241 A CN 113094241A CN 202110496745 A CN202110496745 A CN 202110496745A CN 113094241 A CN113094241 A CN 113094241A
Authority
CN
China
Prior art keywords
data
real
time
current
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110496745.1A
Other languages
English (en)
Other versions
CN113094241B (zh
Inventor
张一�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Zhenshi Information Technology Co Ltd
Original Assignee
Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Zhenshi Information Technology Co Ltd filed Critical Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority to CN202110496745.1A priority Critical patent/CN113094241B/zh
Publication of CN113094241A publication Critical patent/CN113094241A/zh
Application granted granted Critical
Publication of CN113094241B publication Critical patent/CN113094241B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/43Checking; Contextual analysis
    • G06F8/433Dependency analysis; Data or control flow analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例公开了一种实时程序准确性的确定方法、装置、设备及存储介质。该方法包括:获取基于准确性待确定的实时程序在对目标指标的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据、及流式计算后得到的当前时间点上的当前流式数据;获取基于准确性已确定的离线程序在对目标指标的离线数据进行批量计算后得到的历史时间点上的历史批量数据、及基于实时程序对目标指标的第二实时数据进行流式计算后得到的历史时间点上的历史流式数据;根据当前批量数据和当前流式数据的当前比较结果、以及历史批量数据和历史流式数据的历史比较结果,确定实时程序在针对目标指标进行流式计算时的准确性,其可以自动确定实时程序的准确性。

Description

一种实时程序准确性的确定方法、装置、设备及存储介质
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种实时程序准确性的确定方法、装置、设备及存储介质。
背景技术
实时指标数据(即某个指标的实时数据)的准确性一直是各大企业部门的核心诉求,如快递单量的实时数据有助于物流企业的运营分析、某高速路口的通行车辆的实时数据有助于交管部门的交通管制等等。
为了自动获取到实时指标数据,可以实现实时指标数据的自动实时统计的实时程序被相继开发,据此,开发出来的实时程序是否能够准确地统计出实时指标数据至关重要。目前常见的实时程序准确性的确定方案是数据使用人员在使用实时指标数据过程中通过判断是否存在异常数据来确定实时程序的准确性。
在实现本发明的过程中,发明人发现现有技术中存在以下技术问题:现有实时程序准确性的确定方案需要大量的人工干预,其很可能存在确定的准确度和效率较低的问题。
发明内容
本发明实施例提供了一种实时程序准确性的确定方法、装置、设备及存储介质,解决了实时程序准确性确定的准确度和效率较低的问题。
第一方面,本发明实施例提供了一种实时程序准确性的确定方法,可包括:
获取基于准确性待确定的实时程序在对目标指标的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据、及流式计算后得到的当前时间点上的当前流式数据;
获取基于准确性已确定的离线程序在对目标指标的离线数据进行批量计算后得到的历史时间点上的历史批量数据、及基于实时程序对目标指标的第二实时数据进行流式计算后得到的历史时间点上的历史流式数据;
根据当前批量数据和当前流式数据的当前比较结果、及历史批量数据和历史流式数据的历史比较结果,确定实时程序在针对目标指标进行流式计算时的准确性。
第二方面,本发明实施例还提供了一种实时程序准确性的确定装置,可以包括:
当前数据获取模块,用于获取基于准确性待确定的实时程序在对目标指标的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据、及流式计算后得到的当前时间点上的当前流式数据;
历史数据获取模块,用于获取基于准确性已确定的离线程序在对目标指标的离线数据进行批量计算后得到的历史时间点上的历史批量数据、及基于实时程序对目标指标的第二实时数据进行流式计算后得到的历史时间点上的历史流式数据;
实时程序准确性的确定模块,用于根据当前批量数据和当前流式数据的当前比较结果、以及历史批量数据和历史流式数据的历史比较结果,确定实时程序在针对目标指标进行流式计算时的准确性。
第三方面,本发明实施例还提供了一种实时程序准确性的确定设备,可以包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现本发明任意实施例所提供的实时程序准确性的确定方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本发明任意实施例所提供的实时程序准确性的确定方法。
本发明实施例的技术方案,由于基于准确性待确定的实时程序对目标指标的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据、及流式计算后得到的当前时间点上的当前流式数据间的当前比较结果可以反映出实时程序针对目标指标进行流式计算时的代码逻辑的准确性,并且基于准确性已确定的离线程序在对目标指标的离线数据进行批量计算后得到的历史时间点上的历史批量数据、及基于实时程序对目标指标的第二实时数据进行流式计算后得到的历史时间点上的历史流式数据间的历史比较结果可以反映出实时程序针对目标指标进行流式计算时的业务逻辑的准确性,据此,可以根据获取到的当前批量数据和当前流式数据确定出的当前比较结果、以及根据获取到的历史批量数据和历史流式数据确定出的历史比较结果,确定实时程序针对目标指标进行流式计算时的准确性。上述技术方案,可以从业务逻辑和代码逻辑这两个维度上自动确定实时程序在针对目标指标进行流式计算时的准确性,由此达到了实时程序准确性的高效且高精度的自动确定的效果。
附图说明
图1是本发明实施例一中的一种实时程序准确性的确定方法的流程图;
图2是本发明实施例一中的一种实时程序准确性的确定方法中可选示例的示意图;
图3是本发明实施例二中的一种实时程序准确性的确定方法的流程图;
图4是本发明实施例二中的一种实时程序准确性的确定方法中可选示例的示意图;
图5是本发明实施例三中的一种实时程序准确性的确定方法的流程图;
图6是本发明实施例三中的一种实时程序准确性的确定方法中可选示例的示意图;
图7是本发明实施例四中的一种实时程序准确性的确定装置的结构框图;
图8是本发明实施例五中的一种实时程序准确性的确定设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一中提供的一种实时程序准确性的确定方法的流程图。本实施例可适用于自动确定实时程序进行流式计算时的准确性的情况,尤其适用于从业务逻辑和代码逻辑这两个维度自动确定实时程序进行流式计算时的准确性的情况。该方法可以由本发明实施例提供的实时程序准确性的确定装置来执行,该装置可以由软件和/或硬件的方式实现,且该装置可以集成在实时程序准确性的确定设备上,该设备可以是各种用户终端或服务器。
参见图1,本发明实施例的方法具体包括如下步骤:
S110、获取基于准确性待确定的实时程序在对目标指标的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据、及流式计算后得到的当前时间点上的当前流式数据。
其中,目标指标可以是基于实时程序能够实现该目标指标的实时数据或是基于离线程序能够实现该目标指标的离线数据的自动统计的指标,该实时数据可以是从实时数据源中获取到的具有实时性的第一实时数据或是第二实时数据,第一实时数据和第二实时数据可以是相同或是不同的实时数据,在此未做具体限定;该离线数据可以是从离线数据源中获取到的未具有实时性的数据;实时程序可以是已开发的但对于目标指标的实时数据的统计准确性暂未确定的应用程序,而离线程序可以是已开发的且对于目标指标的离线数据的统计准确性已确定的应用程序,如可以计算每天的快递单量的应用程序。
当前时间点可以是当前批量数据和当前流式数据被计算得到的时间点,即当前批量数据和当前流式数据可以是同时被计算得到的数据。在实际应用中,可选的,当前时间点可以是当天(即T天)的某个时间点。批量计算(batch computing)和流式计算(streamcomputing)是大数据的两种数据计算模型,该批量计算可以是对统一收集到的各第一实时数据进行批量处理的数据计算模型,流式计算可以是对数据流进行实时处理的数据计算模型,该数据流可以理解为在时间分布和数量上无限的一系列动态数据(即第一实时数据)的集合体。
当前批量数据可以是基于实时程序对各第一实时数据进行批量计算后得到的当前时间点上的数据,具体的批量计算过程可以根据实际的应用场景确定,示例性的,假设当前时间点是当天的N时,批量计算可以是从各第一实时数据中确定出从当天的M时到N时内的第一实时数据,并将这些确定出的第一实时数据的数据数量作为当前批量数据,即可以每间隔M-N小时进行一次批量计算得到一个当前批量数据。当前流式数据可以是基于实时程序对各第一实时数据进行流式计算后得到的当前时间点上的数据,具体的流式计算过程与批量计算过程有关,继续以上文中的批量计算的例子为例,此时的流式计算可以是根据实时程序对当天的N时的流式计算结果和当天的M时的流式计算结果确定当前流式数据。需要说明的是,批量计算可以基于spark、flink等数据计算平台实现,流式计算也可以基于spark、flink等等数据计算平台实现,这两种数据计算模型采用的数据计算平台可以相同或是不同,这是因为数据计算平台只是一个工具,这两种数据计算模型的具体实现过程取决于在数据计算平台上编写的代码逻辑。
需要强调的是,上述步骤设置的意义在于,其是对同一份的第一实时数据分别进行流式计算和批量计算,二者的业务逻辑(即计算逻辑)完全相同并且代码逻辑较为相似,但流式计算的代码逻辑的复杂度大于批量计算,这是因为:判断事务时可能需要对至少两个事务判断因素进行判断,该事务判断因素可以是与事务判断有关的因素,示例性的,以快递单量为例,其在事务判断因素A>0并且事务判断因素B>0时才能确定某个实时数据是快递单量的实时数据,由于该至少两个事务判断因素可能来源于不同的数据源,那么它们的到来顺序是难以保证的,而只有该至少两个事务判断因素均到来后才能进行计算。因此,在流式计算的代码逻辑中通常包括与缓存有关的代码逻辑,复杂度较高的代码逻辑意味着其准确性难以保证;相应的,在批量计算中,当拉取时间越长,该至少两个事务判断因素均已到来的可能性越大,因此在批量计算的代码逻辑中无需包括与该缓存有关的代码逻辑,复杂度较低的代码逻辑意味着其准确性能够得以保证。因此,后续可以将基于批量计算得到的当前批量数据作为标准来验证基于流式计算得到的当前流式数据的准确性,由此验证出了实时程序进行流式计算时的代码逻辑的准确性。
S120、获取基于准确性已确定的离线程序在对目标指标的离线数据进行批量计算后得到的历史时间点上的历史批量数据、及基于实时程序对目标指标的第二实时数据进行流式计算后得到的历史时间点上的历史流式数据。
其中,历史时间点可以是历史流式数据被计算得到的时间点,实际应用中,可选的,历史时间点可以是当天之前的某天的某个时间点,如当天的前一天(即T-1天)的某个时间点。历史批量数据可以是基于离线程序在对目标指标的离线数据进行批量计算之后得到的历史时间点上的数据,批量计算的具体过程可以根据实际的应用场景确定,示例性的,假设历史时间点是当天的前一天的24时,批量计算可以是从各离线数据中确定出从当天的前一天的0时到24时内的离线数据,并将这些确定出的离线数据的数据数量作为历史批量数据,换言之可以每间隔1天进行一次批量计算得到一个历史批量数据。历史流式数据可以包括基于实时程序对目标指标的各第二实时数据进行流式计算后得到的历史时间点上的数据,具体的流式计算过程与批量计算过程有关,如以上文中的批量计算的例子为例,此时的流式计算可以根据实时程序对当天的前一天的0时的流式计算结果和当天的前一天的24时的流式计算结果确定历史流式数据。
需要说明的是,虽然第二实时数据和离线数据的数据来源不同,而且数据计算模型也不同,但是二者均是基于同一业务逻辑进行计算的,因此由此得到的历史批量数据和历史流式数据多是基本一致的,其中业务口径可以是由业务人员预先设置的进行事务判断时的规则,如上文中举例的A>0且B>0的实时数据是快递单量的实时数据。另外,上述步骤设置的意义在于,由于离线程序是对完整且已落库的离线数据进行批量计算,其可以使用多个兜底时间为很多业务逻辑进行兜底,因此离线程序可以最大程度地满足业务人员对于目前复杂的业务逻辑的要求,即基于离线程序批量计算得到的历史批量数据在业务逻辑上的准确性非常高,其可以作为基于实时程序流式计算得到的历史流式数据的准确性的验证标准,即后续可以将基于离线程序批量计算得到的历史批量数据作为标准验证基于实时程序流式计算得到的历史流式数据的准确性,由此验证出了实时程序进行流式计算时的业务逻辑的准确性。
S130、根据当前批量数据和当前流式数据的当前比较结果、及历史批量数据和历史流式数据的历史比较结果,确定实时程序在针对目标指标进行流式计算时的准确性。
其中,正如上文所述,当前批量数据和当前流式数据的当前比较结果可以反映出实时程序针对目标指标进行流式计算时代码逻辑的准确性,且历史批量数据和历史流式数据的历史比较结果可以反映出实时程序针对目标指标进行流式计算时业务逻辑的准确性,因此根据这两个比较结果可以从代码逻辑和业务逻辑这两个维度上确定实时程序在针对目标指标进行流式计算时的准确性。
本发明实施例的技术方案,由于基于准确性待确定的实时程序对目标指标的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据、及流式计算后得到的当前时间点上的当前流式数据间的当前比较结果可以反映出实时程序针对目标指标进行流式计算时的代码逻辑的准确性,并且基于准确性已确定的离线程序在对目标指标的离线数据进行批量计算后得到的历史时间点上的历史批量数据、及基于实时程序对目标指标的第二实时数据进行流式计算后得到的历史时间点上的历史流式数据间的历史比较结果可以反映出实时程序针对目标指标进行流式计算时的业务逻辑的准确性,据此,可以根据获取到的当前批量数据和当前流式数据确定出的当前比较结果、以及根据获取到的历史批量数据和历史流式数据确定出的历史比较结果,确定实时程序针对目标指标进行流式计算时的准确性。上述技术方案,可以从业务逻辑和代码逻辑这两个维度上自动确定实时程序在针对目标指标进行流式计算时的准确性,由此达到了实时程序准确性的高效且高精度的自动确定的效果。
为了更好地理解上述步骤的具体实现过程,下面继续以快递单量为例,对本实施例的实时程序准确性的确定方法进行示例性的说明。示例性的,参见图2,从上游实时数据源中获取实时数据,分别基于实时程序中的flink流式计算得到每秒的快递单量的实时数据、以及基于实时程序中的flink批量计算得到每小时的快递单量的离线总数(即当前批量数据),进而,根据该每秒的快递单量的实时数据得到当天(即T天)的每小时的快递单量的实时总数(即当前流式数据)、及当天的前一天(即T-1天)的快递单量的离线总数(即历史流式数据);从上游离线数据源中获取离线数据,基于离线程序中的spark批量计算得到T-1天的快递单量的离线总数(即历史批量数据)。将当前批量数据和当前流式数据、以及历史批量数据和历史流式数据分别进行比对,若两个比对结果均相同或是相似,则认为实时程序针对快递单量的流式计算结果准确;否则认为实时程序针对快递单量的流式计算结果不准确,此时可以对上游实时数据源和上游离线数据源中的快递单量进行核对,并将存在差异的快递单量落入ClickHouse中,其中ClickHouse可以是一个面向联机分析处理(OnlineAnalytical Processing,OLAP)的开源的面向列式存储的数据库管理系统(DatabaseManagement System,DBMS),可以简称为CK,进而还可以提供图像化页面将从ClickHouse中获取到的存在差异的快递单量进行展示,并且提供筛选查询分析等功能。上述技术方案,主要包含了对实时、离线T-1天的全量数据的核对(即历史批量数据和历史流式数的核对)和T天的批流数据的核对(当前批量数据和当前流式数据的核对)这两部分,其可以通过这两部分的核对结果确定实时程序在业务逻辑和代码逻辑方面是否存在问题,由此提高了快递单量统计的准确性。
实施例二
图3是本发明实施例二中提供的一种实时程序准确性的确定方法的流程图。本实施例以上述各技术方案为基础进行优化。在本实施例中,可选的,根据当前批量数据和当前流式数据的当前比较结果、及历史批量数据和历史流式数据的历史比较结果,确定实时程序在针对目标指标进行流式计算时的准确性,可以包括:判断当前批量数据和当前流式数据间的当前数据差值是否在第一预设差值范围内、及历史批量数据和历史流式数据间的历史数据差值是否在第二预设差值范围内,根据判断结果确定实时程序在针对目标指标进行流式计算时的准确性。其中,与上述各实施例相同或相应的术语的解释在此不再赘述。
参见图3,本实施例的方法具体可以包括如下步骤:
S210、获取基于准确性待确定的实时程序在对目标指标的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据、及流式计算后得到的当前时间点上的当前流式数据。
S220、获取基于准确性已确定的离线程序在对目标指标的离线数据进行批量计算后得到的历史时间点上的历史批量数据、及基于实时程序对目标指标的第二实时数据进行流式计算后得到的历史时间点上的历史流式数据。
S230、判断当前批量数据和当前流式数据间的当前数据差值是否在第一预设差值范围内、及历史批量数据和历史流式数据间的历史数据差值是否在第二预设差值范围内,根据判断结果确定实时程序在针对目标指标进行流式计算时的准确性。
其中,在实际应用中,即使实时程序针对目标指标进行流式计算是准确的,这也难以保证当前批量数据和当前流式数据、及历史批量数据和历史流式数据均完全一致。据此,为了提高实时程序准确性确定的可实现性,可以先计算出当前批量数据和当前流式数据间的当前数据差值、及历史批量数据和历史流式数据间的历史数据差值,再根据当前数据差值是否在第一预设差值范围内、及历史数据差值是否在第二预设差值范围内来确定实时程序在针对目标指标进行流式计算时的准确性。可以理解的是,第一预设差值范围和第二预设差值范围可以是相同的差值范围,也可以是不同的差值范围,在此未做具体限定。
本发明实施例的技术方案,由于当实时程序针对目标指标进行流式计算是准确的情况下,当前批量数据和当前流式数据、以及历史批量数据和历史流式数据也不一定能够完全一致,据此可以通过判断当前批量数据和当前流式数据间的当前数据差值是否在第一预设差值范围内、及历史批量数据和历史流式数据间的历史数据差值是否在第二预设差值范围内来确定实时程序针对目标指标进行流式计算时的准确性,由此提高了实时程序准确性确定的可实现性的效果。
在此基础上,一种可选的技术方案,根据判断结果确定实时程序在针对目标指标进行流式计算时的准确性,可以包括:如果判断结果包括当前数据差值在第一预设差值范围内并且历史数据差值在第二预设差值范围内,则确定实时程序针对目标指标进行流式计算时的流式计算结果准确;和/或,如果判断结果包括当前数据差值未在第一预设差值范围内和/或历史数据差值未在第二预设差值范围内,则确定实时程序针对目标指标计算出的流式计算结果不准确。
其中,如果当前数据差值在第一预设差值范围内,这说明实时程序在针对目标指标进行流式计算时计算出的当前流式数据准确,进而说明实时程序针对目标指标进行流式计算时的代码逻辑准确;相应的,如果历史数据差值在第二预设差值范围内,这说明实时程序针对目标指标进行流式计算时计算出的历史流式数据准确,进而说明实时程序针对目标指标进行流式计算时的业务逻辑是准确的。据此,如果当前数据差值在第一预设差值范围内并且历史数据差值在第二预设差值范围内,则确定实时程序在针对目标指标进行流式计算时的流式计算结果准确。换言之,如果当前数据差值在第一预设差值范围内和历史数据差值在第二预设差值范围内中的任一个不成立,则说明实时程序针对目标指标计算出的流式计算结果不准确。上述技术方案,通过判断实时程序在针对目标指标进行流式计算时计算出的当前流式数据和历史流式数据是否准确来推断出实时程序针对目标指标进行流式计算时的准确性,由此实现了实时程序准确性的精准且简单确定的效果。
在此基础上,一种可选的技术方案,历史批量数据包括根据历史时间点对应的历史时间段内的各离线数据得到的,历史流式数据包括根据历史时间段内的各第二实时数据得到的,历史数据差值未在第二预设差值范围内,上述实时程序准确性的确定方法,还可包括:将在历史时间段内的各离线数据和各第二实时数据按照预设时间间隔分别进行划分,将划分为同一份的各离线数据和各第二实时数据进行一一比对,并将比对结果不一致的离线数据和第二实时数据存储到差异数据源中。其中,历史时间段可以是与历史时间点对应的过去的某时间段,比如以历史时间点为结束时间点且历史时间段的整个时间跨度为预设时间跨度的历史时间段,示例性的,假设历史时间点为当天的前一天的24时,预设时间跨度为1天,则历史时间段可以是当天的前一天整天。从离线数据源中获取到的离线数据可能包括来源于历史时间段内的离线数据、来源于在历史时间段以外的时间段内的离线数据等等,上述技术方案中的历史批量数据可以是基于离线程序对目标指标在历史时间段内的离线数据进行批量计算后得到;历史流式数据的情况类似,在此不再赘述。当历史数据差值未在第二预设差值范围内时,这说明实时程序针对目标指标进行流式计算的流式计算结果不准确。在此基础上,为了进一步确定历史时间段内的哪些第二实时数据不准确,并且考虑到历史时间段内的第二实时数据的数据量比较大,据此可以将在历史时间段内的各离线数据和各按照预设时间间隔分别进行划分,并将划分到同一份的各离线数据和各第二实时数据进行一一比对,由此保证了数据比对的可实现性。进而,将比对结果不一致的离线数据和第二实时数据存储到差异数据源中,这有助于后续对这些存在差异的离线数据和第二实时数据进行分析。继续以上述例子为例,示例性的,将当天的前一天整天的离线数据和第二实时数据按照每小时进行划分,得到24份的离线数据和第二实时数据;进而,针对每小时内的各离线数据和各第二实时数据,将它们进行一一比对,并将比对出的存在差异的离线数据和第二实时数据落入Clickhouse中。
在此基础上,一种可选的技术方案,上述实时程序准确性的确定方法,还可以包括:在监测到差异数据查询事件时,在差异数据源中查询与差异数据查询事件对应的存在差异的离线数据和第二实时数据;将存在差异的离线数据和第二实时数据进行展示。其中,差异数据查询事件可以是由某触发对象触发的用于查询存在差异的离线数据和第二实时数据的事件,该触发对象可以是用户、差异数据查询系统等等,在此未做具体限定。在监测到该差异数据查询事件时,可以在差异数据源中查询与该差异数据查询事件对应的存在差异的离线数据和第二实时数据,进而可以将查询出的存在差异的离线数据和第二实时数据进行展示。换言之,可以预先设置与该差异数据源对应的对外接口,以便可以基于该对外接口进行差异数据(即存在差异的离线数据和第二实时数据)的查询。
为了更好地理解上述步骤的具体实现过程,下面继续以快递单量为例,对本实施例的实时程序准确性的确定方法进行示例性的说明。示例性的,将基于实时程序统计出的T-1天的快递单量的实时总数和基于离线程序统计出的T-1天的快递单量的离线总数进行全量的对比,结合到快递单量的实际应用场景,离线数据可以使用多个兜底时间获取T-1天的快递单量的离线总数,这就可以避免因为某个业务环节的配运流程缺失而导致无法获取到揽收时间,进而无法统计到相应的快递单量的情况出现,因此可以将T-1天的快递单量的离线总数作为标准来校验T-1天的快递单量的实时总数是否正确。具体的,参见图4,
1)从Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)中取出T-1天的快递单量的离线总数。
2)从ClickHouse中取出T-1天的快递单量的实时总数。
3)将两个总数进行对比,若二者一致,这说明快递单量的实时总数准确,进而说明实时程序的业务逻辑准确,由此达到了实时数据的线上监控的效果。
4)若二者不一致,这说明实时程序的计算逻辑和业务人员设置的业务口径有差异,这是因为快递单量的离线数据和实时数据都是在业务口径下加工出来。下一步开始进行快递单量的明细对比。
5)在明细对比时,考虑到如果将数据量较大的离线数据和实时数据均拉倒内存中,这会对实时程序准确性的确定设备带来较大的计算压力。为此,可以将离线数据和实时数据按照小时划分为24份,由此缩小了每次对比的数据量。
6)将对比出的存在差异的明细下的离线数据和实时数据落入到Clickhouse,由此得到了具体的哪条实时数据存在问题。
7)提供查询明细的对外接口供其余系统调用。
实施例三
图5是本发明实施例三中提供的一种实时程序准确性的确定方法的流程图。本实施例以上述各技术方案为基础进行优化。在本实施例中,可选的,获取基于准确性待确定的实时程序在对目标指标的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据、及流式计算后得到的当前时间点上的当前流式数据,具体可包括:在监测到实时程序准确性确定事件时,确定实时程序准确性确定事件对应的当前时间点、以及与当前时间点对应的当前时间段;获取基于准确性待确定的实时程序对目标指标在当前时间段内的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据、以及流式计算后得到的当前时间点上的当前流式数据。其中,与上述各实施例相同或相应的术语的解释在此不再赘述。
参见图5,本实施例的方法具体可以包括如下步骤:
S310、在监测到实时程序准确性确定事件时,确定实时程序准确性确定事件对应的当前时间点、以及与当前时间点对应的当前时间段。
其中,实时程序准确性确定事件可以是由某触发对象触发的用于确定实时程序针对目标指标进行流式计算时的准确性的事件,该触发对象可以是用户、实时程序准确性的确定设备等等,比如实时程序准确性的确定设备可以在到达预先设置的时间点时自动触发该实时程序准确性确定事件,此时到达的时间点可以理解为当前时间点。当前时间段可以是与该当前时间点对应的当天的某个时间段,比如以当前时间点为结束时间点且当前时间段的整个时间跨度为预设时间跨度的当前时间段,示例性的,假设当前时间点为当天的12时,预设时间跨度为1小时,则当前时间段可以是当天的11-12时。
S320、获取基于准确性待确定的实时程序对目标指标在当前时间段内的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据、以及流式计算后得到的当前时间点上的当前流式数据。
其中,当前批量数据可以是在对目标指标在当前时间段内的第一实时数据进行批量计算后得到的数据,而当前流式数据可以是在对目标指标在当前时间段内的第一实时数据进行流式计算后得到的数据。由此,在后续步骤中,当前批量数据和当前流式数据比对的意义在于,这一比对是对当天的某个当前时间段内的数据进行比对,由此可以及时确定该当前时间段内的第一实时数据是否准确,由此保证了实时程序准确性确定的及时性,也达到了对实时程序的针对目标指标的流式计算错误的及时预警的效果。
S330、获取基于准确性已确定的离线程序在对目标指标的离线数据进行批量计算后得到的历史时间点上的历史批量数据、及基于实时程序对目标指标的第二实时数据进行流式计算后得到的历史时间点上的历史流式数据。
S340、根据当前批量数据和当前流式数据的当前比较结果、及历史批量数据和历史流式数据的历史比较结果,确定实时程序在针对目标指标进行流式计算时的准确性。
本发明实施例的技术方案,通过确定与监测到的实时程序准确性确定事件对应的当前时间点、以及与当前时间点对应的当前时间段,可以获取基于准确性待确定的实时程序对目标指标在当前时间段内的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据、以及流式计算后得到的当前时间点上的当前流式数据,由此,后续对当前批量数据和当前流式数据进行比对时,可以及时确定该当前时间段内的第一实时数据是否准确,由此保证了实时程序准确性确定的及时性,进而达到了对实时程序的针对目标指标的流式计算错误的及时预警的效果。
在此基础上,一种可选的技术方案,获取基于准确性待确定的实时程序对目标指标在当前时间段内的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据,可包括:获取目标指标在当前时间段内的第一实时数据,其中与第一实时数据关联的各事务判断因素的因素获取时间点均位于当前时间段内;基于准确性待确定的实时程序对第一实时数据进行批量计算,并根据实时程序的批量计算结果得到当前时间点上的当前批量数据。其中,实际应用中可能涉及到需要对至少两个事务判断因素进行判断后才能进行数据统计的情况,比如上文举例的A>0且B>0时才能确定某个实时数据是快递单量的实时数据,因此在当前时间段内的第一实时数据可以是与其关联的各事务判断因素的因素获取时间点均位于当前时间段内的实时数据,该因素获取时间点可以是获取到该事务判断因素的时间点,这样的第一实时数据是能够在第一时间段内被捕捉到的实时数据,由此提高了后续的当前批量数据计算的准确性。
为了更好地理解上述步骤的具体实现过程,下面继续以快递单量为例,对本实施例的实时程序准确性的确定方法进行示例性的说明。示例性的,对当天某个小时(即当前时间段)内的同一份实时数据分别进行流式计算和批量计算,这两种数据计算模型对于数据时效性的要求不一致,流式计算可以根据一天内的消息进行数据更新,而批量计算可以将某个窗口的数据进行快照保存。需要说明的是,若快递配送过程中出现问题,其会导致流式计算出的当前流式数据存在问题,因此通过对比流式计算出的某个时间点(即当前时间点)上的当前流式数据和批量计算出的该时间点上的快照数据(即当前批量数据),可以在一定程度上反映出快递配送过程中存在的问题。具体的,参见图6:
1)对从上游实时数据源中获取的实时数据同时进行流式计算和批量计算,分别得到每小时内的快递单量的实时数据和离线总数。可选的,在批量计算的代码逻辑中可以包括与水位线有关的处理逻辑,其可以将因为一些特殊原因而导致本来应该在A时间段到来结果在晚于A时间段的B时间段才到来的数据被统计到A时间段,由此保证了批量计算的准确性。
2)在批量计算中,其可以每个小时进行一次快递单量的离线总数的快照。可选的,即便某个运单的某些状态更新在一小时后抵达,快照数据也不会更新。
3)将统计出的两份总数都写入Clickhouse中。
4)在每天结束时,对比一天中在24个快照节点上流式计算出的当前流式数据和批量计算出的快照数据(即当前批量数据)。
5)若对比结果存在差异,获取存在差异的快递单量,分析造成差异的原因。
实施例四
图7为本发明实施例四提供的实时程序准确性的确定装置的结构框图,该装置用于执行上述任意实施例所提供的实时程序准确性的确定方法。该装置与上述各实施例的实时程序准确性的确定方法属于同一个发明构思,在实时程序准确性的确定装置的实施例中未详尽描述的细节内容,可以参考上述实时程序准确性的确定方法的实施例。参见图7,该装置具体可以包括:当前数据获取模块410、历史数据获取模块420和实时程序准确性的确定模块430。
其中,当前数据获取模块410,用于获取基于准确性待确定的实时程序在对目标指标的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据、及流式计算后得到的当前时间点上的当前流式数据;
历史数据获取模块420,用于获取基于准确性已确定的离线程序在对目标指标的离线数据进行批量计算后得到的历史时间点上的历史批量数据、及基于实时程序对目标指标的第二实时数据进行流式计算后得到的历史时间点上的历史流式数据;
实时程序准确性的确定模块430,用于根据当前批量数据和当前流式数据的当前比较结果、及历史批量数据和历史流式数据的历史比较结果,确定实时程序在针对目标指标进行流式计算时的准确性。
可选的,实时程序准确性的确定模块430,具体可以包括:
实时程序准确性的确定子模块,用于判断当前批量数据和当前流式数据间的当前数据差值是否在第一预设差值范围内、及历史批量数据和历史流式数据间的历史数据差值是否在第二预设差值范围内,根据判断结果确定实时程序在针对目标指标进行流式计算时的准确性。
在此基础上,可选的,实时程序准确性的确定子模块,具体可以包括:
实时程序准确性的确定单元,用于如果判断结果包括当前数据差值在第一预设差值范围内并且历史数据差值在第二预设差值范围内,则确定实时程序针对目标指标进行流式计算时的流式计算结果准确;和/或,
如果判断结果包括当前数据差值未在第一预设差值范围内和/或历史数据差值未在第二预设差值范围内,则确定实时程序针对目标指标计算出的流式计算结果不准确。
在此基础上,可选的,历史批量数据包括根据历史时间点对应的历史时间段内的各离线数据得到的,历史流式数据包括根据历史时间段内的各第二实时数据得到的,历史数据差值未在第二预设差值范围内;
上述实时程序准确性的确定装置,还可以包括:差异数据存储模块,用于将在历史时间段内的各离线数据和各第二实时数据按照预设时间间隔分别进行划分,将划分为同一份的各离线数据和各第二实时数据进行一一比对,并将比对结果不一致的离线数据和第二实时数据存储到差异数据源中。
可选的,在上述装置的基础上,该装置还可以包括:
差异数据查询模块,用于在监测到差异数据查询事件时,在差异数据源中查询与差异数据查询事件对应的存在差异的离线数据和第二实时数据;
差异数据展示模块,用于将存在差异的离线数据和第二实时数据进行展示。
可选的,当前数据获取模块410,可以包括:
当前时间确定单元,用于在监测到实时程序准确性确定事件时,确定实时程序准确性确定事件对应的当前时间点、以及与当前时间点对应的当前时间段;
当前数据获取单元,用于获取基于准确性待确定的实时程序对目标指标在当前时间段内的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据、以及流式计算后得到的当前时间点上的当前流式数据。
在此基础上,可选的,当前数据获取单元,可以包括:
第一实时数据获取子单元,用于获取目标指标在当前时间段内的第一实时数据,其中,与第一实时数据关联的各事务判断因素的因素获取时间点均位于当前时间段内;
当前批量数据获取子单元,用于基于准确性待确定的实时程序对第一实时数据进行批量计算,并根据实时程序的批量计算结果得到当前时间点上的当前批量数据。
本发明实施例四所提供的实时程序准确性的确定装置,通过当前数据获取模块、历史数据获取模块和实时程序准确性的确定模块的相互配合,由于基于准确性待确定的实时程序对目标指标的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据、及流式计算后得到的当前时间点上的当前流式数据间的当前比较结果可以反映出实时程序针对目标指标进行流式计算时的代码逻辑的准确性,并且基于准确性已确定的离线程序在对目标指标的离线数据进行批量计算后得到的历史时间点上的历史批量数据、及基于实时程序对目标指标的第二实时数据进行流式计算后得到的历史时间点上的历史流式数据间的历史比较结果可以反映出实时程序针对目标指标进行流式计算时的业务逻辑的准确性,据此,可以根据获取到的当前批量数据和当前流式数据确定出的当前比较结果、及根据获取到的历史批量数据和历史流式数据确定出的历史比较结果,确定实时程序针对目标指标进行流式计算时的准确性。上述装置,可以从业务逻辑和代码逻辑这两个维度上自动确定实时程序在针对目标指标进行流式计算时的准确性,由此达到了实时程序准确性的高效且高精度的自动确定的效果。
本发明实施例所提供的实时程序准确性的确定装置可执行本发明任意实施例所提供的实时程序准确性的确定方法,具备执行方法相应的功能模块和有益效果。
值得注意的是,上述实时程序准确性的确定装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
实施例五
图8为本发明实施例五提供的一种实时程序准确性的确定的结构示意图,如图8所示,该设备包括存储器510、处理器520、输入装置530和输出装置540。设备中的处理器520的数量可以是一个或多个,图8中以一个处理器520为例;设备中的存储器510、处理器520、输入装置530和输出装置540可以通过总线或其它方式连接,图8中以通过总线550连接为例。
存储器510作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的实时程序准确性的确定方法对应的程序指令/模块(例如,实时程序准确性的确定装置中的当前数据获取模块410、历史数据获取模块420和实时程序准确性的确定模块430)。处理器520通过运行存储在存储器510中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的实时程序准确性的确定方法。
存储器510可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器510可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器510可进一步包括相对于处理器520远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置530可用于接收输入的数字或字符信息,以及产生与装置的用户设置以及功能控制有关的键信号输入。输出装置540可包括显示屏等显示设备。
实施例六
本发明实施例六提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种实时程序准确性的确定方法,该方法包括:
获取基于准确性待确定的实时程序在对目标指标的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据、及流式计算后得到的当前时间点上的当前流式数据;
获取基于准确性已确定的离线程序在对目标指标的离线数据进行批量计算后得到的历史时间点上的历史批量数据、及基于实时程序对目标指标的第二实时数据进行流式计算后得到的历史时间点上的历史流式数据;
根据当前批量数据和当前流式数据的当前比较结果、及历史批量数据和历史流式数据的历史比较结果,确定实时程序在针对目标指标进行流式计算时的准确性。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的实时程序准确性的确定方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。依据这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种实时程序准确性的确定方法,其特征在于,包括:
获取基于准确性待确定的实时程序在对目标指标的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据、及流式计算后得到的所述当前时间点上的当前流式数据;
获取基于准确性已确定的离线程序在对所述目标指标的离线数据进行批量计算后得到的历史时间点上的历史批量数据、及基于所述实时程序对所述目标指标的第二实时数据进行流式计算后得到的所述历史时间点上的历史流式数据;
根据所述当前批量数据和所述当前流式数据的当前比较结果、及所述历史批量数据和所述历史流式数据的历史比较结果,确定所述实时程序在针对所述目标指标进行流式计算时的准确性。
2.根据权利要求1所述的方法,其特征在于,所述根据所述当前批量数据和所述当前流式数据的当前比较结果、及所述历史批量数据和所述历史流式数据的历史比较结果,确定所述实时程序在针对所述目标指标进行流式计算时的准确性,包括:
判断所述当前批量数据和所述当前流式数据间的当前数据差值是否在第一预设差值范围内、及所述历史批量数据和所述历史流式数据间的历史数据差值是否在第二预设差值范围内,根据判断结果确定所述实时程序在针对所述目标指标进行流式计算时的准确性。
3.根据权利要求2所述的方法,其特征在于,所述根据判断结果确定所述实时程序在针对所述目标指标进行流式计算时的准确性,包括:
如果所述判断结果包括所述当前数据差值在所述第一预设差值范围内并且所述历史数据差值在所述第二预设差值范围内,则确定所述实时程序针对所述目标指标进行流式计算时的流式计算结果准确;和/或,
如果所述判断结果包括所述当前数据差值未在所述第一预设差值范围内和/或所述历史数据差值未在所述第二预设差值范围内,则确定所述实时程序针对所述目标指标计算出的所述流式计算结果不准确。
4.根据权利要求3所述的方法,其特征在于,所述历史批量数据包括根据所述历史时间点对应的历史时间段内的各所述离线数据得到的,所述历史流式数据包括根据所述历史时间段内的各所述第二实时数据得到的,所述历史数据差值未在所述第二预设差值范围内,所述方法还包括:
将在所述历史时间段内的各所述离线数据和各所述第二实时数据按照预设时间间隔分别进行划分,将划分为同一份的各所述离线数据和各所述第二实时数据进行一一比对,并将比对结果不一致的所述离线数据和所述第二实时数据存储到差异数据源中。
5.根据权利要求4所述的方法,其特征在于,还包括:
在监测到差异数据查询事件时,在所述差异数据源中查询与所述差异数据查询事件对应的存在差异的所述离线数据和所述第二实时数据;
将所述存在差异的所述离线数据和所述第二实时数据进行展示。
6.根据权利要求1所述的方法,其特征在于,所述获取基于准确性待确定的实时程序在对目标指标的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据、及流式计算后得到的所述当前时间点上的当前流式数据,包括:
在监测到实时程序准确性确定事件时,确定所述实时程序准确性确定事件对应的当前时间点、以及与所述当前时间点对应的当前时间段;
获取基于准确性待确定的实时程序对目标指标在所述当前时间段内的第一实时数据分别进行批量计算后得到的所述当前时间点上的当前批量数据、以及流式计算后得到的所述当前时间点上的当前流式数据。
7.根据权利要求6所述的方法,其特征在于,所述获取基于准确性待确定的实时程序对目标指标在所述当前时间段内的第一实时数据分别进行批量计算后得到的所述当前时间点上的当前批量数据,包括:
获取目标指标在所述当前时间段内的第一实时数据,其中与所述第一实时数据关联的各事务判断因素的因素获取时间点均位于所述当前时间段内;
基于准确性待确定的实时程序对所述第一实时数据进行批量计算,并根据所述实时程序的批量计算结果得到所述当前时间点上的当前批量数据。
8.一种实时程序准确性的确定装置,其特征在于,包括:
当前数据获取模块,用于获取基于准确性待确定的实时程序在对目标指标的第一实时数据分别进行批量计算后得到的当前时间点上的当前批量数据、及流式计算后得到的所述当前时间点上的当前流式数据;
历史数据获取模块,用于获取基于准确性已确定的离线程序在对所述目标指标的离线数据进行批量计算后得到的历史时间点上的历史批量数据、及基于所述实时程序对所述目标指标的第二实时数据进行流式计算后得到的所述历史时间点上的历史流式数据;
实时程序准确性的确定模块,用于根据所述当前批量数据和所述当前流式数据的当前比较结果、以及所述历史批量数据和所述历史流式数据的历史比较结果,确定所述实时程序在针对所述目标指标进行流式计算时的准确性。
9.一种实时程序准确性的确定设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的实时程序准确性的确定方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一所述的实时程序准确性的确定方法。
CN202110496745.1A 2021-05-07 2021-05-07 一种实时程序准确性的确定方法、装置、设备及存储介质 Active CN113094241B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110496745.1A CN113094241B (zh) 2021-05-07 2021-05-07 一种实时程序准确性的确定方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110496745.1A CN113094241B (zh) 2021-05-07 2021-05-07 一种实时程序准确性的确定方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113094241A true CN113094241A (zh) 2021-07-09
CN113094241B CN113094241B (zh) 2023-09-05

Family

ID=76681664

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110496745.1A Active CN113094241B (zh) 2021-05-07 2021-05-07 一种实时程序准确性的确定方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113094241B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113779092A (zh) * 2021-09-17 2021-12-10 平安科技(深圳)有限公司 基于数据仓库的实时数据展示方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180189399A1 (en) * 2016-12-29 2018-07-05 Google Inc. Systems and methods for identifying and characterizing signals contained in a data stream
CN111124650A (zh) * 2019-12-26 2020-05-08 中国建设银行股份有限公司 一种流式数据处理方法及装置
CN112148779A (zh) * 2019-06-28 2020-12-29 京东数字科技控股有限公司 确定业务指标的方法、装置及存储介质
CN112445583A (zh) * 2019-08-28 2021-03-05 北京沃东天骏信息技术有限公司 任务管理方法、任务管理系统、电子设备、存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180189399A1 (en) * 2016-12-29 2018-07-05 Google Inc. Systems and methods for identifying and characterizing signals contained in a data stream
CN112148779A (zh) * 2019-06-28 2020-12-29 京东数字科技控股有限公司 确定业务指标的方法、装置及存储介质
CN112445583A (zh) * 2019-08-28 2021-03-05 北京沃东天骏信息技术有限公司 任务管理方法、任务管理系统、电子设备、存储介质
CN111124650A (zh) * 2019-12-26 2020-05-08 中国建设银行股份有限公司 一种流式数据处理方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
葛新;杨东;王毅;王文庆;刘超飞;王智微;刘轶;: "面向电力企业的实时/历史数据库系统研究与开发", 热力发电, no. 04, pages 97 - 100 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113779092A (zh) * 2021-09-17 2021-12-10 平安科技(深圳)有限公司 基于数据仓库的实时数据展示方法、装置、设备及介质
CN113779092B (zh) * 2021-09-17 2024-03-01 平安科技(深圳)有限公司 基于数据仓库的实时数据展示方法、装置、设备及介质

Also Published As

Publication number Publication date
CN113094241B (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
CN110471821B (zh) 异常变更检测方法、服务器及计算机可读存储介质
CN112445854B (zh) 多源业务数据实时处理方法、装置、终端及存储介质
CN110647447B (zh) 用于分布式系统的异常实例检测方法、装置、设备和介质
CN108647357B (zh) 数据查询的方法及装置
CN108492150B (zh) 实体热度的确定方法及系统
KR101989330B1 (ko) 데이터 처리 애플리케이션의 검사
CN110569166A (zh) 异常检测方法、装置、电子设备及介质
CN112445875A (zh) 数据关联及检验方法、装置、电子设备及存储介质
CN114416703A (zh) 数据完整性自动监控方法、装置、设备及介质
WO2024067358A1 (zh) 仓库管理系统的效率分析方法、系统及计算机设备
CN112148779A (zh) 确定业务指标的方法、装置及存储介质
CN110262951A (zh) 一种业务秒级监控方法及系统、存储介质及客户端
CN113094241A (zh) 一种实时程序准确性的确定方法、装置、设备及存储介质
CN113138906A (zh) 一种调用链数据采集方法、装置、设备及存储介质
CN111523921A (zh) 漏斗分析方法、分析设备、电子设备及可读存储介质
CN114884813B (zh) 一种网络架构确定方法、装置、电子设备及存储介质
CN115168509A (zh) 风控数据的处理方法及装置、存储介质、计算机设备
CN114490406A (zh) 测试覆盖项管理方法、装置、设备及介质
CN110990401B (zh) 一种酒店搜索方法及系统
CN114048231A (zh) 数据处理方法、装置及计算机程序产品
CN109829016B (zh) 一种数据同步方法及装置
CN112565227A (zh) 异常任务的检测方法和装置
CN111984636B (zh) 数据建模方法和装置、设备及存储介质
CN116610724B (zh) 一种日志数据追踪方法、装置、电子设备和存储介质
CN116089499A (zh) 基于kafka数据量的数据统计方法、装置及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant