CN109086370A - 一种互联网数据流处理系统 - Google Patents
一种互联网数据流处理系统 Download PDFInfo
- Publication number
- CN109086370A CN109086370A CN201810804366.2A CN201810804366A CN109086370A CN 109086370 A CN109086370 A CN 109086370A CN 201810804366 A CN201810804366 A CN 201810804366A CN 109086370 A CN109086370 A CN 109086370A
- Authority
- CN
- China
- Prior art keywords
- data
- window
- rewritable
- unit
- chain type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
本发明提供一种互联网数据流处理系统,包括采样单元、预处理单元、处理单元、预测单元和链式可重写窗口,采样单元对网络中的数据流定时采样,形成时间序列流数据,预处理单元对时间序列流数据进行分割,形成N个子数据集,用链式可重写窗口去扫描子数据集,处理单元利用Online‑HHT方法对链式可重写窗口中的当前时间序列流数据进行分析,得出若干个本征模型函数IMF分量,预测单元预先构造并训练好预测用的RBF网络结构,把处理单元得出的每一个IMF分量输入网络进行预测,生成数据流的未来趋势结果,并对结果合并,得到最后的预测结果;该互联网数据流处理系统在链式可重写窗口的基础上,将Online‑HHT和RBF网络结构融合,组合实现时间序列数据流的在线趋势预测。
Description
技术领域
本发明涉及一种互联网数据流处理系统,其包括采样单元、预处理单元、处理单元、预测单元和链式可重写窗口。
背景技术
在信息处理技术、互联网技术和通信技术的飞速发展进步过程中,军事和民用的各个领域不断实时产生大量的数量,例如网络交换数据的流、环境监测与报告数据的实时流、卫星通讯传输的实时数据等,一般数据库的数据是静态数据,而这些数据都是动态实时的信息流,称为数据流。数据流中蕴含着丰富的知识和规律,研究各个领域的数据流,从中发现信息知识合规律,可以提高科学评判和决策,从而知道和产生更大的未来价值。
时间序列数据是数据流的一种形态,而目前的数据流处理系统,还不能对时间序列数据流执行在线自适应的预测。
发明内容
针对上述现有技术所存在的问题,本发明的目的是提供一种互联网数据流处理系统。
为达到上述目的,本发明所采用的技术方案是:
一种互联网数据流处理系统,包括采样单元、预处理单元、处理单元、预测单元和链式可重写窗口,所述采样单元对网络中的数据流定时采样,形成时间序列流数据,所述预处理单元对时间序列流数据进行分割,形成数据数量一致的N个子数据集,所述处理单元用所述链式可重写窗口去扫描子数据集,利用Online-HHT方法对链式可重写窗口中的当前时间序列流数据进行分析,处理完一个子数据集再加载新的子数据集,得出若干个本征模型函数IMF分量,所述预测单元预先构造并训练好预测用的RBF网络结构,把处理单元得出的每一个IMF分量输入网络进行预测,生成数据流的未来趋势结果,并对结果合并,得到最后的预测结果。
作为优选,所述链式可重写窗口在新旧数据的流入流出时,不对全部数据进行移动,将新数据重写到旧数据的位置。
作为优选,所述处理单元利用Online-HHT方法对链式可重写窗口中的当前时间序列流数据进行分析,包括步骤a和步骤b,其中,
步骤a:将链式可重写窗口中的当前时间序列流数据根据具体应用分段,每段数据长度相同。
步骤b:对每段数据分别用HHT方法进行分析,每一段在分解得到第一个IMF分量后,停下不再进行筛选,所有分段分解产生的相应IMF分量进行连接合成,得到联合IMF分量,同时把所有各段的剩余部分也连接合并,生成数据的联合剩余量,然后对生成的联合IMF分量进一步做EMD的分解,得到分解后的新数据分量和数据剩余量,把这一次获得的剩余量再合到联合剩余量上,连续对合并后的联合剩余上述处理流程,得到新的IMF分量和新的剩余量,一直到获得的联合剩余量比设定的阈值要小,这时候剩余量就成了单调函数不能呢再分解出本征模函数,筛选终止为止。
本发明的有益效果是:本发明的互联网数据流处理系统在链式可重写窗口的基础上,将Online-HHT和RBF网络结构融合,组合实现时间序列数据流的在线趋势预测。
一、本发明的处理单元利用Online-HHT方法对链式可重写窗口中的当前时间序列流数据进行分析,能够对将来趋势在线自适应预测,同时及时地识别数据流中与当前数据不一致的元素。
二、本发明采用链式可重写窗口,在实际中可以不用移动数据或者窗口,对当前窗口的数据循环重写,更新新旧数据,加快数据处理。
下面结合附图和实施例对本发明作进一步说明。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的实施例中一种互联网数据流处理系统的处理流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面以具体实施例详细阐述本发明更多的技术细节。
如图1所示,本实施例的互联网数据流处理系统,包括采样单元、预处理单元、处理单元、预测单元和链式可重写窗口,
采样单元对网络中的数据流定时采样,形成时间序列流数据。
预处理单元对时间序列流数据进行分割,形成数据数量一致的N个子数据集,用链式可重写窗口去扫描子数据集。
处理单元利用Online-HHT方法对链式可重写窗口中的当前时间序列流数据进行分析,处理完一个子数据集再加载新的子数据集,得出若干个本征模型函数IMF分量,其包括步骤a和步骤b,具体如下,步骤a:将链式可重写窗口中的当前时间序列流数据根据具体应用分段,每段数据长度相同。步骤b:对每段数据分别用HHT方法进行分析,每一段在分解得到第一个IMF分量后,停下不再进行筛选,所有分段分解产生的相应IMF分量进行连接合成,得到联合IMF分量,同时把所有各段的剩余部分也连接合并,生成数据的联合剩余量,然后对生成的联合IMF分量进一步做EMD的分解,得到分解后的新数据分量和数据剩余量,把这一次获得的剩余量再合到联合剩余量上,连续对合并后的联合剩余上述处理流程,得到新的IMF分量和新的剩余量,一直到获得的联合剩余量比设定的阈值要小,这时候剩余量就成了单调函数不能呢再分解出本征模函数,筛选终止为止。利用Online-HHT方法对链式可重写窗口中的当前时间序列流数据进行分析,能够对将来趋势在线自适应预测,同时及时地识别数据流中与当前数据不一致的元素。
预测单元预先构造并训练好预测用的RBF网络结构,把处理单元得出的每一个IMF分量输入网络进行预测,生成数据流的未来趋势结果,并对结果合并,得到最后的预测结果。
链式可重写窗口在新旧数据的流入流出时,不对全部数据进行移动,将新数据重写到旧数据的位置,即在实际中可以不用移动数据或者窗口,对当前窗口的数据循环重写,更新新旧数据,加快数据处理。
本实施例的互联网数据流处理系统在链式可重写窗口的基础上,将Online-HHT和RBF网络结构融合,组合实现时间序列数据流的在线趋势预测。
尽管本发明是参照具体实施例来描述,但这种描述并不意味着对本发明构成限制。参照本发明的描述,所公开的实施例的其他变化,对于本领域技术人员都是可以预料的,这样的变化应属于所属权利要求所限定的范围内。
Claims (3)
1.一种互联网数据流处理系统,其特征在于,包括采样单元、预处理单元、处理单元、预测单元和链式可重写窗口,所述采样单元对网络中的数据流定时采样,形成时间序列流数据,所述预处理单元对时间序列流数据进行分割,形成数据数量一致的N个子数据集,用所述链式可重写窗口去扫描子数据集,所述处理单元利用Online-HHT方法对链式可重写窗口中的当前时间序列流数据进行分析,处理完一个子数据集再加载新的子数据集,得出若干个本征模型函数IMF分量,所述预测单元预先构造并训练好预测用的RBF网络结构,把处理单元得出的每一个IMF分量输入网络进行预测,生成数据流的未来趋势结果,并对结果合并,得到最后的预测结果。
2.根据权利要求1所述的互联网数据流处理系统,其特征在于,所述链式可重写窗口在新旧数据的流入流出时,不对全部数据进行移动,将新数据重写到旧数据的位置。
3.根据权利要求1所述的互联网数据流处理系统,其特征在于,所述处理单元利用Online-HHT方法对链式可重写窗口中的当前时间序列流数据进行分析,包括步骤a和步骤b,其中,
步骤a:将链式可重写窗口中的当前时间序列流数据根据具体应用分段,每段数据长度相同。
步骤b:对每段数据分别用HHT方法进行分析,每一段在分解得到第一个IMF分量后,停下不再进行筛选,所有分段分解产生的相应IMF分量进行连接合成,得到联合IMF分量,同时把所有各段的剩余部分也连接合并,生成数据的联合剩余量,然后对生成的联合IMF分量进一步做EMD的分解,得到分解后的新数据分量和数据剩余量,把这一次获得的剩余量再合到联合剩余量上,连续对合并后的联合剩余上述处理流程,得到新的IMF分量和新的剩余量,一直到获得的联合剩余量比设定的阈值要小,这时候剩余量就成了单调函数不能呢再分解出本征模函数,筛选终止为止。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810804366.2A CN109086370A (zh) | 2018-07-20 | 2018-07-20 | 一种互联网数据流处理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810804366.2A CN109086370A (zh) | 2018-07-20 | 2018-07-20 | 一种互联网数据流处理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109086370A true CN109086370A (zh) | 2018-12-25 |
Family
ID=64838415
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810804366.2A Pending CN109086370A (zh) | 2018-07-20 | 2018-07-20 | 一种互联网数据流处理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109086370A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111242366A (zh) * | 2020-01-08 | 2020-06-05 | 广东技术师范大学 | 一种可用于实时处理信号的emd方法、装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103279679A (zh) * | 2013-06-09 | 2013-09-04 | 浪潮电子信息产业股份有限公司 | 一种基于链式可重写窗口的数据流在线预测方法 |
-
2018
- 2018-07-20 CN CN201810804366.2A patent/CN109086370A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103279679A (zh) * | 2013-06-09 | 2013-09-04 | 浪潮电子信息产业股份有限公司 | 一种基于链式可重写窗口的数据流在线预测方法 |
Non-Patent Citations (1)
Title |
---|
王尤慧: "Online-HHT方法在时间序列数据流预测中的应用研究", 《中国优秀硕士学位论文全文数据库 信息科技辑(月刊)》, no. 07, pages 140 - 534 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111242366A (zh) * | 2020-01-08 | 2020-06-05 | 广东技术师范大学 | 一种可用于实时处理信号的emd方法、装置 |
CN111242366B (zh) * | 2020-01-08 | 2023-10-31 | 广东技术师范大学 | 一种可用于实时处理信号的emd方法、装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110175580B (zh) | 一种基于时序因果卷积网络的视频行为识别方法 | |
Perarnau et al. | Invertible conditional gans for image editing | |
EP3620990A1 (en) | Capturing network dynamics using dynamic graph representation learning | |
US20200042825A1 (en) | Neural network orchestration | |
CN113487088A (zh) | 基于动态时空图卷积注意力模型的交通预测方法及装置 | |
Hren et al. | Optimistic planning of deterministic systems | |
CN111369299A (zh) | 识别的方法、装置、设备及计算机可读存储介质 | |
CN106372132A (zh) | 基于人工智能的查询意图预测方法和装置 | |
CN108647691A (zh) | 一种基于点击特征预测的图像分类方法 | |
US10334202B1 (en) | Ambient audio generation based on visual information | |
Suresh Kumar et al. | A pragmatic ensemble learning approach for effective software effort estimation | |
CN114169645A (zh) | 一种智能电网短期负荷预测方法 | |
CN109409307A (zh) | 一种基于时空上下文分析的在线视频行为检测系统及其方法 | |
US20200042864A1 (en) | Neural network orchestration | |
CN113723279A (zh) | 边缘计算环境中基于时空间优化的多目标跟踪加速方法 | |
Schlegel et al. | An empirical study of explainable AI techniques on deep learning models for time series tasks | |
CN109086370A (zh) | 一种互联网数据流处理系统 | |
Iannelli et al. | Applying machine learning to end-to-end slice SLA decomposition | |
CN107291992B (zh) | 一种适用沙漠地区电子装备综合环境试验仿真系统及方法 | |
CN115883424B (zh) | 一种高速骨干网间流量数据预测方法及系统 | |
CN109063050A (zh) | 一种数据库日志分析预警方法与装置 | |
CN113239975A (zh) | 一种基于神经网络的目标检测方法和装置 | |
CN110390041B (zh) | 在线学习方法及装置、计算机可读存储介质 | |
Bahari et al. | Feed-forwards meet recurrent networks in vehicle trajectory prediction | |
CN115409541A (zh) | 基于数据血缘的卷烟品牌数据处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |