CN109086370A - 一种互联网数据流处理系统 - Google Patents

一种互联网数据流处理系统 Download PDF

Info

Publication number
CN109086370A
CN109086370A CN201810804366.2A CN201810804366A CN109086370A CN 109086370 A CN109086370 A CN 109086370A CN 201810804366 A CN201810804366 A CN 201810804366A CN 109086370 A CN109086370 A CN 109086370A
Authority
CN
China
Prior art keywords
data
window
rewritable
unit
chain type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810804366.2A
Other languages
English (en)
Inventor
杨林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Anxing Star Network Technology Co Ltd
Original Assignee
Guangzhou Anxing Star Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Anxing Star Network Technology Co Ltd filed Critical Guangzhou Anxing Star Network Technology Co Ltd
Priority to CN201810804366.2A priority Critical patent/CN109086370A/zh
Publication of CN109086370A publication Critical patent/CN109086370A/zh
Pending legal-status Critical Current

Links

Abstract

本发明提供一种互联网数据流处理系统,包括采样单元、预处理单元、处理单元、预测单元和链式可重写窗口,采样单元对网络中的数据流定时采样,形成时间序列流数据,预处理单元对时间序列流数据进行分割,形成N个子数据集,用链式可重写窗口去扫描子数据集,处理单元利用Online‑HHT方法对链式可重写窗口中的当前时间序列流数据进行分析,得出若干个本征模型函数IMF分量,预测单元预先构造并训练好预测用的RBF网络结构,把处理单元得出的每一个IMF分量输入网络进行预测,生成数据流的未来趋势结果,并对结果合并,得到最后的预测结果;该互联网数据流处理系统在链式可重写窗口的基础上,将Online‑HHT和RBF网络结构融合,组合实现时间序列数据流的在线趋势预测。

Description

一种互联网数据流处理系统
技术领域
本发明涉及一种互联网数据流处理系统,其包括采样单元、预处理单元、处理单元、预测单元和链式可重写窗口。
背景技术
在信息处理技术、互联网技术和通信技术的飞速发展进步过程中,军事和民用的各个领域不断实时产生大量的数量,例如网络交换数据的流、环境监测与报告数据的实时流、卫星通讯传输的实时数据等,一般数据库的数据是静态数据,而这些数据都是动态实时的信息流,称为数据流。数据流中蕴含着丰富的知识和规律,研究各个领域的数据流,从中发现信息知识合规律,可以提高科学评判和决策,从而知道和产生更大的未来价值。
时间序列数据是数据流的一种形态,而目前的数据流处理系统,还不能对时间序列数据流执行在线自适应的预测。
发明内容
针对上述现有技术所存在的问题,本发明的目的是提供一种互联网数据流处理系统。
为达到上述目的,本发明所采用的技术方案是:
一种互联网数据流处理系统,包括采样单元、预处理单元、处理单元、预测单元和链式可重写窗口,所述采样单元对网络中的数据流定时采样,形成时间序列流数据,所述预处理单元对时间序列流数据进行分割,形成数据数量一致的N个子数据集,所述处理单元用所述链式可重写窗口去扫描子数据集,利用Online-HHT方法对链式可重写窗口中的当前时间序列流数据进行分析,处理完一个子数据集再加载新的子数据集,得出若干个本征模型函数IMF分量,所述预测单元预先构造并训练好预测用的RBF网络结构,把处理单元得出的每一个IMF分量输入网络进行预测,生成数据流的未来趋势结果,并对结果合并,得到最后的预测结果。
作为优选,所述链式可重写窗口在新旧数据的流入流出时,不对全部数据进行移动,将新数据重写到旧数据的位置。
作为优选,所述处理单元利用Online-HHT方法对链式可重写窗口中的当前时间序列流数据进行分析,包括步骤a和步骤b,其中,
步骤a:将链式可重写窗口中的当前时间序列流数据根据具体应用分段,每段数据长度相同。
步骤b:对每段数据分别用HHT方法进行分析,每一段在分解得到第一个IMF分量后,停下不再进行筛选,所有分段分解产生的相应IMF分量进行连接合成,得到联合IMF分量,同时把所有各段的剩余部分也连接合并,生成数据的联合剩余量,然后对生成的联合IMF分量进一步做EMD的分解,得到分解后的新数据分量和数据剩余量,把这一次获得的剩余量再合到联合剩余量上,连续对合并后的联合剩余上述处理流程,得到新的IMF分量和新的剩余量,一直到获得的联合剩余量比设定的阈值要小,这时候剩余量就成了单调函数不能呢再分解出本征模函数,筛选终止为止。
本发明的有益效果是:本发明的互联网数据流处理系统在链式可重写窗口的基础上,将Online-HHT和RBF网络结构融合,组合实现时间序列数据流的在线趋势预测。
一、本发明的处理单元利用Online-HHT方法对链式可重写窗口中的当前时间序列流数据进行分析,能够对将来趋势在线自适应预测,同时及时地识别数据流中与当前数据不一致的元素。
二、本发明采用链式可重写窗口,在实际中可以不用移动数据或者窗口,对当前窗口的数据循环重写,更新新旧数据,加快数据处理。
下面结合附图和实施例对本发明作进一步说明。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的实施例中一种互联网数据流处理系统的处理流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面以具体实施例详细阐述本发明更多的技术细节。
如图1所示,本实施例的互联网数据流处理系统,包括采样单元、预处理单元、处理单元、预测单元和链式可重写窗口,
采样单元对网络中的数据流定时采样,形成时间序列流数据。
预处理单元对时间序列流数据进行分割,形成数据数量一致的N个子数据集,用链式可重写窗口去扫描子数据集。
处理单元利用Online-HHT方法对链式可重写窗口中的当前时间序列流数据进行分析,处理完一个子数据集再加载新的子数据集,得出若干个本征模型函数IMF分量,其包括步骤a和步骤b,具体如下,步骤a:将链式可重写窗口中的当前时间序列流数据根据具体应用分段,每段数据长度相同。步骤b:对每段数据分别用HHT方法进行分析,每一段在分解得到第一个IMF分量后,停下不再进行筛选,所有分段分解产生的相应IMF分量进行连接合成,得到联合IMF分量,同时把所有各段的剩余部分也连接合并,生成数据的联合剩余量,然后对生成的联合IMF分量进一步做EMD的分解,得到分解后的新数据分量和数据剩余量,把这一次获得的剩余量再合到联合剩余量上,连续对合并后的联合剩余上述处理流程,得到新的IMF分量和新的剩余量,一直到获得的联合剩余量比设定的阈值要小,这时候剩余量就成了单调函数不能呢再分解出本征模函数,筛选终止为止。利用Online-HHT方法对链式可重写窗口中的当前时间序列流数据进行分析,能够对将来趋势在线自适应预测,同时及时地识别数据流中与当前数据不一致的元素。
预测单元预先构造并训练好预测用的RBF网络结构,把处理单元得出的每一个IMF分量输入网络进行预测,生成数据流的未来趋势结果,并对结果合并,得到最后的预测结果。
链式可重写窗口在新旧数据的流入流出时,不对全部数据进行移动,将新数据重写到旧数据的位置,即在实际中可以不用移动数据或者窗口,对当前窗口的数据循环重写,更新新旧数据,加快数据处理。
本实施例的互联网数据流处理系统在链式可重写窗口的基础上,将Online-HHT和RBF网络结构融合,组合实现时间序列数据流的在线趋势预测。
尽管本发明是参照具体实施例来描述,但这种描述并不意味着对本发明构成限制。参照本发明的描述,所公开的实施例的其他变化,对于本领域技术人员都是可以预料的,这样的变化应属于所属权利要求所限定的范围内。

Claims (3)

1.一种互联网数据流处理系统,其特征在于,包括采样单元、预处理单元、处理单元、预测单元和链式可重写窗口,所述采样单元对网络中的数据流定时采样,形成时间序列流数据,所述预处理单元对时间序列流数据进行分割,形成数据数量一致的N个子数据集,用所述链式可重写窗口去扫描子数据集,所述处理单元利用Online-HHT方法对链式可重写窗口中的当前时间序列流数据进行分析,处理完一个子数据集再加载新的子数据集,得出若干个本征模型函数IMF分量,所述预测单元预先构造并训练好预测用的RBF网络结构,把处理单元得出的每一个IMF分量输入网络进行预测,生成数据流的未来趋势结果,并对结果合并,得到最后的预测结果。
2.根据权利要求1所述的互联网数据流处理系统,其特征在于,所述链式可重写窗口在新旧数据的流入流出时,不对全部数据进行移动,将新数据重写到旧数据的位置。
3.根据权利要求1所述的互联网数据流处理系统,其特征在于,所述处理单元利用Online-HHT方法对链式可重写窗口中的当前时间序列流数据进行分析,包括步骤a和步骤b,其中,
步骤a:将链式可重写窗口中的当前时间序列流数据根据具体应用分段,每段数据长度相同。
步骤b:对每段数据分别用HHT方法进行分析,每一段在分解得到第一个IMF分量后,停下不再进行筛选,所有分段分解产生的相应IMF分量进行连接合成,得到联合IMF分量,同时把所有各段的剩余部分也连接合并,生成数据的联合剩余量,然后对生成的联合IMF分量进一步做EMD的分解,得到分解后的新数据分量和数据剩余量,把这一次获得的剩余量再合到联合剩余量上,连续对合并后的联合剩余上述处理流程,得到新的IMF分量和新的剩余量,一直到获得的联合剩余量比设定的阈值要小,这时候剩余量就成了单调函数不能呢再分解出本征模函数,筛选终止为止。
CN201810804366.2A 2018-07-20 2018-07-20 一种互联网数据流处理系统 Pending CN109086370A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810804366.2A CN109086370A (zh) 2018-07-20 2018-07-20 一种互联网数据流处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810804366.2A CN109086370A (zh) 2018-07-20 2018-07-20 一种互联网数据流处理系统

Publications (1)

Publication Number Publication Date
CN109086370A true CN109086370A (zh) 2018-12-25

Family

ID=64838415

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810804366.2A Pending CN109086370A (zh) 2018-07-20 2018-07-20 一种互联网数据流处理系统

Country Status (1)

Country Link
CN (1) CN109086370A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111242366A (zh) * 2020-01-08 2020-06-05 广东技术师范大学 一种可用于实时处理信号的emd方法、装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279679A (zh) * 2013-06-09 2013-09-04 浪潮电子信息产业股份有限公司 一种基于链式可重写窗口的数据流在线预测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279679A (zh) * 2013-06-09 2013-09-04 浪潮电子信息产业股份有限公司 一种基于链式可重写窗口的数据流在线预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王尤慧: "Online-HHT方法在时间序列数据流预测中的应用研究", 《中国优秀硕士学位论文全文数据库 信息科技辑(月刊)》, no. 07, pages 140 - 534 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111242366A (zh) * 2020-01-08 2020-06-05 广东技术师范大学 一种可用于实时处理信号的emd方法、装置
CN111242366B (zh) * 2020-01-08 2023-10-31 广东技术师范大学 一种可用于实时处理信号的emd方法、装置

Similar Documents

Publication Publication Date Title
CN110175580B (zh) 一种基于时序因果卷积网络的视频行为识别方法
Perarnau et al. Invertible conditional gans for image editing
EP3620990A1 (en) Capturing network dynamics using dynamic graph representation learning
US20200042825A1 (en) Neural network orchestration
CN113487088A (zh) 基于动态时空图卷积注意力模型的交通预测方法及装置
Hren et al. Optimistic planning of deterministic systems
CN111369299A (zh) 识别的方法、装置、设备及计算机可读存储介质
CN106372132A (zh) 基于人工智能的查询意图预测方法和装置
CN108647691A (zh) 一种基于点击特征预测的图像分类方法
US10334202B1 (en) Ambient audio generation based on visual information
Suresh Kumar et al. A pragmatic ensemble learning approach for effective software effort estimation
CN114169645A (zh) 一种智能电网短期负荷预测方法
CN109409307A (zh) 一种基于时空上下文分析的在线视频行为检测系统及其方法
US20200042864A1 (en) Neural network orchestration
CN113723279A (zh) 边缘计算环境中基于时空间优化的多目标跟踪加速方法
Schlegel et al. An empirical study of explainable AI techniques on deep learning models for time series tasks
CN109086370A (zh) 一种互联网数据流处理系统
Iannelli et al. Applying machine learning to end-to-end slice SLA decomposition
CN107291992B (zh) 一种适用沙漠地区电子装备综合环境试验仿真系统及方法
CN115883424B (zh) 一种高速骨干网间流量数据预测方法及系统
CN109063050A (zh) 一种数据库日志分析预警方法与装置
CN113239975A (zh) 一种基于神经网络的目标检测方法和装置
CN110390041B (zh) 在线学习方法及装置、计算机可读存储介质
Bahari et al. Feed-forwards meet recurrent networks in vehicle trajectory prediction
CN115409541A (zh) 基于数据血缘的卷烟品牌数据处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination