CN110309848A - 离线数据与流式数据实时融合计算的方法 - Google Patents
离线数据与流式数据实时融合计算的方法 Download PDFInfo
- Publication number
- CN110309848A CN110309848A CN201910380072.6A CN201910380072A CN110309848A CN 110309848 A CN110309848 A CN 110309848A CN 201910380072 A CN201910380072 A CN 201910380072A CN 110309848 A CN110309848 A CN 110309848A
- Authority
- CN
- China
- Prior art keywords
- data
- real
- time
- offline
- streaming
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 230000004927 fusion Effects 0.000 title claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 54
- 238000004364 calculation method Methods 0.000 claims description 66
- 230000008569 process Effects 0.000 claims description 38
- 238000005516 engineering process Methods 0.000 abstract description 4
- 230000006399 behavior Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000004220 aggregation Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000012954 risk control Methods 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种离线数据与流式数据实时融合计算的方法,属于计算机大数据处理技术领域,其首先确认结果数据的计算逻辑,整理需要的输入数据,根据计算结果过程中所有输入的数据的属性、特性的计算逻辑按实时性进行分类,分为两类。一类数据是代表历史的统计结果的离线型数据,另一类是实时性高的实时输入数据。这两部分输入数据经过聚合、计算、统计的才得出最后的实时统计结果。本发明在数据处理过程中,通过对数据进行分类,用适当的计算模式进行计算,兼顾数据的实时性以及数据的计算效率,使得结果数据可以更高效迅速的展现出来。
Description
技术领域
本发明涉及计算机大数据处理技术领域,具体而言,涉及一种离线数据与流式数据实时融合计算的方法。
背景技术
随着移动互联网技术的发展,目前大数据处理技术按照计算模式可以划分为离线计算和流式计算两种形态。离线计算会先完成数据的抽取、转换、加载的过程,然后在提供查询。这样的方式看起来虽然合理,但是因为全量数据的抽取、转换、加载过程需要一定的时间,无法满足实时应用场景的某些问题。因此有了流式计算的解决方案,流式计算的特点在于处理无边界并且有实时性,适合高并发和大规模的实时处理场景。但流式计算并不擅长处理历史数据,在处理大批量历史数据时,吞吐量和计算效率远不如离线计算。
因此,在长期的研发当中,现在技术的存在的问题在于,离线计算无法满足数据实时性的需求,流式计算在大批量历史数据的计算场景下处理效率低。在基于历史数据得出实时计算结果的场景下,两者都无法提供满足业务需求的高效数据处理方案。
本发明提供一种数据离线处理和流式处理结合的方法,用于兼顾数据的实时性和处理效率,使得结果数据可以更高效迅速的计算出来。
发明内容
本发明的目的在于提供一种离线数据与流式数据实时融合计算的方法,能够解决上述提到的至少一个技术问题。具体方案如下:
根据本发明的具体实施方式,第一方面,离线数据与流式数据实时融合计算的方法,其特征在于,包括:
S1、首先确认结果数据的计算逻辑,整理需要的输入数据;
S2、本发明根据计算结果过程中所有输入的数据的属性、特性、计算逻辑按实时性进行分类;
S3、根据S2中的数据分类,进行处理;
S4,当遇到离线型数据与实时输入数据需要关联时,采用流式处理的方式,在流式过程处理中去关联离线处理完成的离线型数据的计算结果,用此方法得到一个新的实时输入数据,它是实时输入数据与离线型结果关联的结果数据;
S5、用S3,S4步骤中的方式处理完计算过程中所有的输入,即得到最终的计算结果。
根据本发明的具体实施方式,第二方面,本发明提供一种离线数据与流式数据实时融合计算的方法,对所述S3、S4步骤中的流式处理方式与实时输入数据与离线型结构的过程包括如下内容,
101到104和103到106这两个过程是单纯的离线计算,102到105这个过程是单纯的流式计算。即上述流程描述中S3步骤中描述的计算过程;所述S3、S4步骤中的流式处理方式与实时输入数据与离线型结构的过程包括如下内容,104和105到107的过程,以及107和106到108的过程,是离线型数据和实时输入数据关联的过程;所述108为步骤S5中最终得到的计算结果。
根据权利要求本发明的具体实施方式,第三方面,本发明提供了一种离线数据与流式数据实时融合计算的方法,该方法还包括所述步骤S2中根据计算结果过程中所有输入的数据的属性、特定的计算逻辑实时性进行分类,该分类为两类,一类数据是代表历史的统计结果的离线型数据,一类是实时性高的实时输入数据;所述离线型数据和实时输入数据经过聚合、计算、统计后得到最后的实时统计结果;所述处理单纯的离线型数据和实时输入数据,对离线型的数据用离线处理的方式进行处理,对实时输入数据,用流式计算的方式;所述步骤S1中所述的结果数据包括计算过程中的中间结果,中间结果包括上一步的输出、下一步的输入;所述步骤S4中离线型数据和实时数据的关联关系,包括两种,一种是同一种计算逻辑划分下的两份数据,是离线型数据和实时输入数据的加和;另一种是业务逻辑上的关联关系;所述业务逻辑上的关联关系需要先计算好离线型数据,然后在流式处理实时数据时,取出计算好的离线型数据结果,进行关联。
根据本发明的具体实施方式,第四方面,本发明提供一种离线数据与流式数据实时融合计算方法的介质,其上存储有计算机程序,所述程序被处理器执行时实现如上任一项所述的对文档中的内容进行编辑的方法。
根据本发明的具体实施方式,第五方面,本发明提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上任一项所述的对文档中的内容进行编辑的方法。
本发明实施例的上述方案与现有技术相比,至少具有以下有益效果:
本发明将数据处理过程中的输入数据进行分类,对离线型数据和实时输入数据分别处理,在满足业务实时性需求的同时,将数据处理的效率最大化。兼顾数据的实时性和处理效率,使得结果数据可以更高效迅速的计算出来。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了根据本发明实施例的一种离线数据与流式数据实时融合计算的方法流程图;
图2示出了根据本发明实施例的一种离线数据与流式数据实时融合计算的方法中步骤S3至S5中数据处理方法与结果的流程示意图;
图3示出了根据本发明的实施例的电子设备连接结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述……,但这些……不应限于这些术语。这些术语仅用来将……区分开。例如,在不脱离本发明实施例范围的情况下,第一……也可以被称为第二……,类似地,第二……也可以被称为第一……。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者装置中还存在另外的相同要素。
下面结合附图详细说明本发明的可选实施例。
实施例1
S1,首先确认结果数据的计算逻辑,整理需要的输入数据。
这包括计算过程中的中间结果,因为他们既是上一步的输出,也会作为下一步的输入。
最后没有作为输入的数据即为改计算逻辑的最终结果数据。
将计算过程中所有的输入数据整理出来后,将用于下一步骤的分类。
S2,本发明根据计算结果过程中所有输入的数据的属性、特性和计算逻辑进行分类,分为两类。一类数据是历史的统计结果的离线型数据,另一类是实时性高的实时输入数据。这两部分输入数据经过聚合、计算、统计的才得出最后的实时统计结果。
其中数据分类的过程中遵循如下的原则。
判断一个输入的数据属于离线型数据或实时输入数据,主要判断该数据通过离线统计是否会影响实时性数据计算的结果。
例如统计当月的实时收入,那么今天之前每天的收入数据都属于离线型数据,而今天的数据属于实时输入数据。因为今天之前每天收入的加和是固定的,不会随着今天的数据而改变。他们两者的加和为最终的结果数据也就是当月的实时收入。
按如上规则完成分类后,最终得到一份输入数据分类的列表。
S3,根据S2中的数据分类,处理单纯的离线型数据和实时输入数据,对离线型的数据用离线处理的方式进行处理,对实时输入数据,用流式计算的方式进行处理。
所谓的单纯,即离线型数据和实时输入数据没有相互关联的场景,这样的场景按照各自对应处理流程处理。
本步骤中处理的数据多为上游的数据,简单的说在两种类型数据没有关联关系时,按各自的处理流程正常处理即可。
如当月的实时收入数据可以分为,当天的收入数据以及当天之前这个月每天的收入数据。
其中当天的收入数据是实时输入数据,使用流式处理方式处理得到当天的收入。当天之前这个月每天的收入数据是离线型数据,使用离线处理方式处理得到不含当天的当月总收入。
S4,当遇到离线型数据与实时输入数据需要关联时,采用流式处理的方式,在流式过程处理中去关联离线处理完成的离线型数据的计算结果,用此方法得到一个新的实时输入数据,它是实时输入数据与离线型结果关联的结果数据,用于下一步的计算中。
这里说的离线型数据和实时数据的关联关系,有两种。
一种是同一种计算逻辑划分下的两份数据,就像之前说的当月收入数据,是离线型数据和实时输入数据的加和。
另一种是业务逻辑上的关联关系,例如在某些风险控制场景下,根据某个用户最近90天的行为数据判断当天的该用户的行为是否存在风险。这里的最近90天的行为数据是离线型数据,当天的该用户行为是实时型输入数据。
这里在关联处理的过程中,先计算好离线型数据。然后在流式处理实时型数据时,取出计算好的离线型数据结果,进行关联。
例如当月收入例子中,先计算好当天之前的收入总和,得到一个离线的结果,在流式处理当天收入数据时,只需要取出并加上当天之前的收入总和就能得到当月的实时总收入。
再如风险控制的例子中,先计算好所有用户最近90天的行为数据结果,这是所有用户行为的一个离线型数据结果集。在流式处理当天用户行为时,取出当前处理的用户的最近90天的行为数据结果与当前用户行为进行关联计算,就可以得到用户本次行为是否存在风险的结果。
综上所述,当遇到离线型数据与实时输入数据需要关联时,首先计算好离线型数据的结果,然后在处理实时输入数据时去管理计算好的离线结果即可。
S5,用S3,S4步骤中的方式处理完计算过程中所有的输入,即得到最终的计算结果。
本实施例提供一种电子设备,该设备用于执行一种离线数据与流式数据实时融合计算的方法,所述电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:确认数据结果的计算逻辑并且整理所需要的输入数据,上述的输入数据可以包括计算过程的的和中间结果,并且处理器能够按照数据的属性、特性和计算逻辑来实现对上述数据的分类,并且根据数据的分类来实现对后续数据处理方式的选择,以及如何实现上述离线处理的数据和实时输入的数据并且输出相应的计算结果。
实施例2
本公开实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的一种离线数据与流式数据实时融合计算的方法。
实施例3
下面参考图3,其示出了适于用来实现本公开实施例的电子设备400的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图3示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图3所示,电子设备400可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有电子设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备400与其他设备进行无线或有线通信以交换数据。虽然图3示出了具有各种装置的电子设备400,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从ROM 402被安装。在该计算机程序被处理装置401执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取至少两个网际协议地址;向节点评价设备发送包括所述至少两个网际协议地址的节点评价请求,其中,所述节点评价设备从所述至少两个网际协议地址中,选取网际协议地址并返回;接收所述节点评价设备返回的网际协议地址;其中,所获取的网际协议地址指示内容分发网络中的边缘节点。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收包括至少两个网际协议地址的节点评价请求;从所述至少两个网际协议地址中,选取网际协议地址;返回选取出的网际协议地址;其中,接收到的网际协议地址指示内容分发网络中的边缘节点。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
也就是说,在本申请所述的离线型数据、实时输入的数据可以长期存储于ROM中或者暂时存储于RAM中,上述两种存储方式中的数据可以通过输入设备进行输入或者通过处理器获取对应的中间数据等。在存储器ROM上还存储有用于执行上述流程的指令或者指令集,该指令或者指令集以可执行的软件程序或者封装的、嵌入的软件程序,通过处理器调用来实现调用与运算。
本申请所述的实时输入的数据,可以是通过输入输出设备实时录入的数据,也可以是通过局域网、广域网或者运营商提供的互联网,通过有线方式、无线方式等连接来实现的远程录入、存储等获取的数据,上述两种实时输入的数据采用流式计算进行处理,以通过聚合、计算、统计来获取与离线型数据的整合。
虽然本申请提供的是一种基于极限数据与流式数据实时融合计算的方法,但是本领域的技术人员在上述方法的基础上,可以通过选择现有的编程语言,如Java、VB、C、C++等,对上述方法的处理流程以编码封装的方式来实现可执行文件的编写,也可以将上述方法、可执行文件以非嵌入式、嵌入式的方法与电子设备进行简单的组合或组合,以实现上述两种数据的处理,上述领域均应当视为是对本申请所述的方法的延伸,均应当位于本申请保护范围之内。
Claims (10)
1.一种离线数据与流式数据实时融合计算的方法,其特征在于,包括:
S1、首先确认结果数据的计算逻辑,整理需要的输入数据;
S2、本发明根据计算结果过程中所有输入的数据的属性、特性、计算逻辑按实时性进行分类;
S3、根据S2中的数据分类,进行处理;
S4,当遇到离线型数据与实时输入数据需要关联时,采用流式处理的方式,在流式过程处理中去关联离线处理完成的离线型数据的计算结果,用此方法得到一个新的实时输入数据,所述新的实时输入数据是实时输入数据与离线型结果关联的结果数据;
S5、用S3,S4步骤中的方式处理完计算过程中所有的输入,即得到最终的计算结果。
2.根据权利要求1所述的离线数据与流式数据实时融合计算的方法,其特征在于,所述S3、S4步骤中的流式处理方式与实时输入数据与离线型结构的过程包括如下内容,
101到104和103到106这两个过程是单纯的离线计算,102到105这个过程是单纯的流式计算,即上述流程描述中S3步骤中描述的计算过程。
3.根据权利要求2所述的离线数据与流式数据实时融合计算的方法,其特征在于,所述S3、S4步骤中的流式处理方式与实时输入数据与离线型结构的过程包括如下内容,104和105到107的过程,以及107和106到108的过程,是离线型数据和实时输入数据关联的过程。
4.根据权利要求3所述的离线数据与流式数据实时融合计算的方法,其特征在于,所述108为步骤S5中最终得到的计算结果。
5.根据权利要求1所述的离线数据与流式数据实时融合计算的方法,其特征在于,所述步骤S2中根据计算结果过程中所有输入的数据的属性、特定的计算逻辑实时性进行分类,该分类为两类,一类数据是代表历史的统计结果的离线型数据,一类是实时性高的实时输入数据。
6.根据权利要求5所述的离线数据与流式数据实时融合计算的方法,其特征在于,所述离线型数据和实时输入数据经过聚合、计算、统计后得到最后的实时统计结果。
7.根据权利要求6所述的离线数据与流式数据实时融合计算的方法,其特征在于,所述处理单纯的离线型数据和实时输入数据,对离线型的数据用离线处理的方式进行处理,对实时输入数据,用流式计算的方式。
8.根据权利要求1所述的离线数据与流式数据实时融合计算的方法,其特征在于,所述步骤S1中所述的结果数据包括计算过程中的中间结果,中间结果包括上一步的输出、下一步的输入。
9.根据权利要求1所述的离线数据与流式数据实时融合计算的方法,其特征在于,所述步骤S4中离线型数据和实时数据的关联关系,包括两种,一种是同一种计算逻辑划分下的两份数据,是离线型数据和实时输入数据的加和;另一种是业务逻辑上的关联关系。
10.根据权利要求9所述的离线数据与流式数据实时融合计算的方法,其特征在于,所述业务逻辑上的关联关系需要先计算好离线型数据,然后在流式处理实时数据时,取出计算好的离线型数据结果,进行关联。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910380072.6A CN110309848A (zh) | 2019-05-08 | 2019-05-08 | 离线数据与流式数据实时融合计算的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910380072.6A CN110309848A (zh) | 2019-05-08 | 2019-05-08 | 离线数据与流式数据实时融合计算的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110309848A true CN110309848A (zh) | 2019-10-08 |
Family
ID=68074568
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910380072.6A Pending CN110309848A (zh) | 2019-05-08 | 2019-05-08 | 离线数据与流式数据实时融合计算的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110309848A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112800091A (zh) * | 2021-01-26 | 2021-05-14 | 北京明略软件系统有限公司 | 一种流批一体式计算控制系统及方法 |
CN112862009A (zh) * | 2021-03-29 | 2021-05-28 | 中信银行股份有限公司 | 一种基于流式计算的实时反欺诈数据处理方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2898390A1 (en) * | 2005-04-20 | 2006-10-20 | Timothy J. Nohara | Low-cost, high-performance radar networks |
CN108733688A (zh) * | 2017-04-18 | 2018-11-02 | 北京京东尚科信息技术有限公司 | 数据分析的方法、装置 |
CN108874982A (zh) * | 2018-06-11 | 2018-11-23 | 华南理工大学 | 一种基于Spark大数据框架离线实时处理数据的方法 |
CN109635264A (zh) * | 2018-11-29 | 2019-04-16 | 上海哔哩哔哩科技有限公司 | 游戏业务数据自动化统计方法、系统和存储介质 |
-
2019
- 2019-05-08 CN CN201910380072.6A patent/CN110309848A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2898390A1 (en) * | 2005-04-20 | 2006-10-20 | Timothy J. Nohara | Low-cost, high-performance radar networks |
CN108733688A (zh) * | 2017-04-18 | 2018-11-02 | 北京京东尚科信息技术有限公司 | 数据分析的方法、装置 |
CN108874982A (zh) * | 2018-06-11 | 2018-11-23 | 华南理工大学 | 一种基于Spark大数据框架离线实时处理数据的方法 |
CN109635264A (zh) * | 2018-11-29 | 2019-04-16 | 上海哔哩哔哩科技有限公司 | 游戏业务数据自动化统计方法、系统和存储介质 |
Non-Patent Citations (2)
Title |
---|
刘妍: "基于实时计算和离线挖掘的多手段数据融合系统的设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
董杰: "支持批量计算与流式计算的大数据系统研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112800091A (zh) * | 2021-01-26 | 2021-05-14 | 北京明略软件系统有限公司 | 一种流批一体式计算控制系统及方法 |
CN112800091B (zh) * | 2021-01-26 | 2024-06-11 | 北京明略软件系统有限公司 | 一种流批一体式计算控制系统及方法 |
CN112862009A (zh) * | 2021-03-29 | 2021-05-28 | 中信银行股份有限公司 | 一种基于流式计算的实时反欺诈数据处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110874440B (zh) | 一种信息推送及其模型训练的方法、装置及电子设备 | |
CN110865898B (zh) | 崩溃调用栈聚合的方法、装置、介质和设备 | |
CN113157439B (zh) | 一种资源统计方法、装置及终端 | |
CN110390493B (zh) | 任务管理方法、装置、存储介质及电子设备 | |
CN111738316B (zh) | 零样本学习的图像分类方法、装置及电子设备 | |
CN112069406B (zh) | 基于区块链离线支付的信息推送方法及云服务推送平台 | |
CN110008345A (zh) | 平台服务商行业数据聚合分析方法、装置、介质和设备 | |
CN109933610A (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
CN110309848A (zh) | 离线数据与流式数据实时融合计算的方法 | |
CN116700907B (zh) | 服务调用需求文档存储方法、装置、电子设备和可读介质 | |
CN112214665A (zh) | 内容展示方法、装置、电子设备及计算机可读存储介质 | |
CN110673908A (zh) | 一种界面生成方法、装置、介质和电子设备 | |
CN112613955A (zh) | 订单处理方法、装置、电子设备及存储介质 | |
CN113760178A (zh) | 缓存数据处理方法、装置、电子设备和计算机可读介质 | |
CN111738311A (zh) | 面向多任务的特征提取方法、装置及电子设备 | |
CN109857472A (zh) | 面向有屏设备的交互方法及装置 | |
CN111241368A (zh) | 数据处理方法、装置、介质和设备 | |
CN110704679A (zh) | 视频分类方法、装置及电子设备 | |
CN114374738B (zh) | 信息推送方法、装置、存储介质及电子设备 | |
CN116541421B (zh) | 地址查询信息生成方法、装置、电子设备与计算机介质 | |
CN114613355B (zh) | 视频处理方法、装置、可读介质及电子设备 | |
CN112199187B (zh) | 内容展示方法、装置、电子设备及计算机可读存储介质 | |
CN116820539B (zh) | 一种基于互联网的系统软件运行维护系统及方法 | |
CN114997120B (zh) | 文档标签的生成方法、装置、终端和存储介质 | |
CN116307998B (zh) | 电力设备材料运输方法、装置、电子设备和计算机介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191008 |
|
RJ01 | Rejection of invention patent application after publication |