CN108302329B - 一种露点数据异常检测方法 - Google Patents
一种露点数据异常检测方法 Download PDFInfo
- Publication number
- CN108302329B CN108302329B CN201810073596.6A CN201810073596A CN108302329B CN 108302329 B CN108302329 B CN 108302329B CN 201810073596 A CN201810073596 A CN 201810073596A CN 108302329 B CN108302329 B CN 108302329B
- Authority
- CN
- China
- Prior art keywords
- data
- sample
- dew point
- time
- window
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F17—STORING OR DISTRIBUTING GASES OR LIQUIDS
- F17D—PIPE-LINE SYSTEMS; PIPE-LINES
- F17D5/00—Protection or supervision of installations
- F17D5/005—Protection or supervision of installations of gas pipelines, e.g. alarm
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Abstract
本发明公开了一种露点数据异常检测方法,主要是利用机器学习方法实现对露点数据的异常检测,通过滑动窗口模型处理时序数据,并构建异常识别模型和异常来源判断模型。根据异常识别模型发现异常数据,再利用异常来源判断模型判断发生异常的原因,及时推送异常消息。本发明大大提高了管道运输的安全性,减少人力、物力的消耗。
Description
技术领域
本发明涉及一种露点数据异常检测方法,适用于传感器网络数据的实时异常监测。
背景技术
我国石油业和天然气业正处于蓬勃发展阶段,其运输的安全问题也备受关注。当前,管道输送天然气是最经济和有效的输送方式。但是,天然气在采集和运输过程中都会混杂一定的水汽,当管道输送天然气的含水量超过一定值时,可能会带来下列危害:
(1)、在天然气管道输送中,如果水含量高,可能会造成液态水在管道中集聚,在一定的温度、压力条件下,液态水和烃类等其他物质将一起生成水化物,增加输气阻力,降低输气能力,严重时会堵塞阀门和管道,影响正常供气。
(2)、天然气中含有硫化氢、二氧化碳等酸性气体时,液态水的存在会加速酸性组分对管壁和阀件的腐蚀,减少管道的使用寿命。
现有的测量天然气管道露点的方式可分为在线式和便携式。在线式露点仪一般安装在管道的某个节点持续测量露点并保存数据,而便携式露点仪,需要时由人工携带现场测量。但无论是在线式还是便携式测量,获取露点参数都需要人工到本地测量。效率低下,成本高昂。因此,需要一个可行的检测方法来提高管道运输的运输效率,减少人力,物力。
发明内容
本发明的目的在于提供一种露点数据异常检测方法,能实时监测运输管道露点变化,利用物联网技术代替人工操作,大大减少运输过程的人力、物力,提高管道运输的安全性。
为了达成上述目的,本发明采用以下的技术方案:
一种露点数据异常检测方法,其特征在于包括多个露点传感器、传感网络以及服务终端,将露点传感器部署在管道内,采集实时露点数据经由传感网络反馈到服务终端,以进行异常数据检测,包括如下步骤:
步骤1、通过部署在管道内的露点传感器,实时采集管道内的实时露点数据,并由传感网络发送到服务终端;
步骤2、对传输到服务终端的实时露点数据进行数据处理;
步骤2.1、对实时露点数据建立时间滑动窗口模型
通过滑动窗口模型对露点数据进行处理,该露点数据依照采集时间形成序列数据;
为该序列数据维护一个大小为k的窗口,保存最新的k个数据,当新数据到来时,最早的数据将过期,窗口将保存最新的数据并去除最早的数据;
假设当前窗口数据为{r(t1),r(t2),…,r(tp)},当新数据r(tp+1)到达且为正常数据时,窗口变动,将窗口中的数据更新为{r(t2),r(t3),…,r(tp+1)},后续的数据以此类推;
步骤2.2、对滑动窗口数据构建异常识别模型
采用中位数构造枢轴量,设X1,X2,…,Xn是来自均匀分布的总体X~U(a,b)的独立同分布样本,设med为样本X1,X2,…,Xn的中位数:
在方差δ2未知的情况下采用样本方差S2来计算中位数的置信区间:
其中n为样本数,Xi为每个样本值,为样本的平均值,即可得到
易验证T为关于μ的枢轴量,对于预置的α,令
即得到置信度为1-α的置信区间
步骤2.3、建立异常来源判断模型
采用AdaBoot建立异常来源判断模型,设样本集X={(x1,y1),(x2,y2),…,(xn,yn)},其中x表示样本,y表示样本标识,初始化样本权重:
首先在训练数据上训练一个弱分类器并计算错误率,再在同一数据集上再次训练弱分类器,第二次训练中将会重新调整样本权重,第一次分对的样本的权重降低,分错的样本的权重提高,错误率的定义为:
其中|C|为所有样本数目,|E|为未正确分类的样本数目;
权重α计算公式为:
其中ε为错误率,计算出α后更新样本权重D:
如果某个样本被正确分类,那样本权重更新为
如果样本被错分,那样本权重更新为
计算出样本权重D后,AdaBoost开始下一轮的迭代,直到训练错误率为0或者弱分类器的数目达到指定值,训练结束后得到一个事件模型的强分类器,当采集的露点值满足这个强分类器就说明检测到事件,否则检测到其他的异常;
步骤3、异常检测;
步骤3.1、异常数据识别;
滑动窗口维持k个正常数据,用窗口中的k个正常值和置信度α计算得到一个置信区间[lcl,ucl],如果r(t)不满足(11)式,那么该露点数据可能为异常数据:
lcl≤r(t)≤ucl (11)
其中ucl,lcl分别为置信区间的上下限,r(t)为t时刻采样值,当r(t)满足(11)时更新窗口的数据;
此外,当露点传感器发生故障时,可能在连续的采样时刻内产生相同的读数,即
r(t)=r(t-1) (12)
步骤3.2、异常来源验证
当某个露点传感器t时刻采集的露点数据r(t)的值不在置信区间[lcl,ucl]内或r(t)=r(t-1)时就认为发生了异常;为确定异常来源,将该露点数据r(t)代入步骤2.3建立的AdaBoost异常来源判断模型中,以此判断发生事件还是其他的异常,将判断结果及时推送,达到实时报警。
本发明主要是利用机器学习方法实现对露点数据的异常检测,通过滑动窗口模型处理时序数据,并构建异常识别模型和异常来源判断模型。根据异常识别模型发现异常数据,再利用异常来源判断模型判断发生异常的原因,及时推送异常消息。本发明大大提高了管道运输的安全性,减少人力、物力的消耗。
附图说明
图1为本发明硬件连接示意图。
图2为本发明的流程图。
以下结合附图和具体实施例对本发明作进一步详述。
具体实施方式
如图1所示,本发明一种露点数据异常检测方法在以下硬件载体上实现的:具有高质量的露点传感器、传感网络以及控制终端。将露点传感器部署在管道内,采集露点值并反馈到控制终端,以进行异常数据检测。
如图2所示,一种露点数据异常检测方法,其特征在于包括多个露点传感器、传感网络以及服务终端,将露点传感器部署在管道内,采集实时露点数据经由传感网络反馈到服务终端,以进行异常数据检测,包括如下步骤:
步骤1、通过部署在管道内的露点传感器,实时采集管道内的实时露点数据,并由传感网络发送到服务终端;
步骤2、对传输到服务终端的实时露点数据进行数据处理;
步骤2.1、对实时露点数据建立时间滑动窗口模型
通过滑动窗口模型对露点数据进行处理,该露点数据依照采集时间形成序列数据;
为该序列数据维护一个大小为k的窗口,保存最新的k个数据,当新数据到来时,最早的数据将过期,窗口将保存最新的数据并去除最早的数据;
假设当前窗口数据为{r(t1),r(t2),…,r(tp)},当新数据r(tp+1)到达且为正常数据时,窗口变动,将窗口中的数据更新为{r(t2),r(t3),…,r(tp+1)},后续的数据以此类推;
步骤2.2、对滑动窗口数据构建异常识别模型
采用中位数构造枢轴量,设X1,X2,…,Xn是来自均匀分布的总体X~U(a,b)的独立同分布样本,设med为样本X1,X2,…,Xn的中位数:
在方差δ2未知的情况下采用样本方差S2来计算中位数的置信区间:
其中n为样本数,Xi为每个样本值,为样本的平均值,即可得到
易验证T为关于μ的枢轴量,对于预置的α,令
即得到置信度为1-α的置信区间
步骤2.3、建立异常来源判断模型
采用AdaBoot建立异常来源判断模型,设样本集X={(x1,y1),(x2,y2),…,(xn,yn)},其中x表示样本,y表示样本标识,初始化样本权重:
首先在训练数据上训练一个弱分类器并计算错误率,再在同一数据集上再次训练弱分类器,第二次训练中将会重新调整样本权重,第一次分对的样本的权重降低,分错的样本的权重提高,错误率的定义为:
其中|C|为所有样本数目,|E|为未正确分类的样本数目;
权重α计算公式为:
其中ε为错误率,计算出α后更新样本权重D:
如果某个样本被正确分类,那样本权重更新为
如果样本被错分,那样本权重更新为
计算出样本权重D后,AdaBoost开始下一轮的迭代,直到训练错误率为0或者弱分类器的数目达到指定值,训练结束后得到一个事件模型的强分类器,当采集的露点值满足这个强分类器就说明检测到事件,否则检测到其他的异常;
步骤3、异常检测;
步骤3.1、异常数据识别;
滑动窗口维持k个正常数据,用窗口中的k个正常值和置信度α计算得到一个置信区间[lcl,ucl],如果r(t)不满足(11)式,那么该露点数据可能为异常数据:
lcl≤r(t)≤ucl (11)
其中ucl,lcl分别为置信区间的上下限,r(t)为t时刻采样值,当r(t)满足(11)时更新窗口的数据;
此外,当露点传感器发生故障时,可能在连续的采样时刻内产生相同的读数,即
r(t)=r(t-1) (12)
步骤3.2、异常来源验证
当某个露点传感器t时刻采集的露点数据r(t)的值不在置信区间[lcl,ucl]内或r(t)=r(t-1)时就认为发生了异常;
为确定异常来源,将该露点数据r(t)代入步骤2.3建立的AdaBoost异常来源判断模型中,以此判断发生事件还是其他的异常,将判断结果及时推送,达到实时报警。
以上所述,仅是本发明较佳实施例而已,并非对本发明的技术范围作任何限制,故凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (1)
1.一种露点数据异常检测方法,其特征在于包括多个露点传感器、传感网络以及服务终端,将露点传感器部署在管道内,采集实时露点数据经由传感网络反馈到服务终端,以进行异常数据检测,包括如下步骤:
步骤1、通过部署在管道内的露点传感器,实时采集管道内的实时露点数据,并由传感网络发送到服务终端;
步骤2、对传输到服务终端的实时露点数据进行数据处理;
步骤2.1、对实时露点数据建立时间滑动窗口模型
通过滑动窗口模型对露点数据进行处理,该露点数据依照采集时间形成序列数据;
为该序列数据维护一个大小为k的窗口,保存最新的k个数据,当新数据到来时,最早的数据将过期,窗口将保存最新的数据并去除最早的数据;
假设当前窗口数据为{r(t1),r(t2),…,r(tp)},当新数据r(tp+1)到达且为正常数据时,窗口变动,将窗口中的数据更新为{r(t2),r(t3),…,r(tp+1)},后续的数据以此类推;
步骤2.2、对滑动窗口数据构建异常识别模型
采用中位数构造枢轴量,设X1,X2,…,Xn是来自均匀分布的总体X~U(a,b)的独立同分布样本,设med为样本X1,X2,…,Xn的中位数:
在方差δ2未知的情况下采用样本方差S2来计算中位数的置信区间:
其中n为样本数,Xi为每个样本值,为样本的平均值,即可得到
易验证T为关于μ的枢轴量,对于预置的α,令
即得到置信度为1-α的置信区间
步骤2.3、建立异常来源判断模型
采用AdaBoot建立异常来源判断模型,设样本集X={(x1,y1),(x2,y2),…,(xn,yn)},其中x表示样本,y表示样本标识,初始化样本权重:
首先在训练数据上训练一个弱分类器并计算错误率,再在同一数据集上再次训练弱分类器,第二次训练中将会重新调整样本权重,第一次分对的样本的权重降低,分错的样本的权重提高,错误率的定义为:
其中|C|为所有样本数目,|E|为未正确分类的样本数目;
权重α计算公式为:
其中ε为错误率,计算出α后更新样本权重D:
如果某个样本被正确分类,那样本权重更新为
如果样本被错分,那样本权重更新为
计算出样本权重D后,AdaBoost开始下一轮的迭代,直到训练错误率为0或者弱分类器的数目达到指定值,训练结束后得到一个事件模型的强分类器,当采集的露点值满足这个强分类器就说明检测到事件,否则检测到其他的异常;
步骤3、异常检测;
步骤3.1、异常数据识别;
滑动窗口维持k个正常数据,用窗口中的k个正常值和置信度α计算得到一个置信区间[lcl,ucl],如果r(t)不满足(11)式,那么该露点数据可能为异常数据:
lcl≤r(t)≤ucl (11)
其中ucl,lcl分别为置信区间的上下限,r(t)为t时刻采样值,当r(t)满足(11)式时更新窗口的数据;
此外,当露点传感器发生故障时,可能在连续的采样时刻内产生相同的读数,即
r(t)=r(t-1) (12)
步骤3.2、异常来源验证
当某个露点传感器t时刻采集的露点数据r(t)的值不在置信区间[lcl,ucl]内或r(t)=r(t-1)时就认为发生了异常;
为确定异常来源,将该露点数据r(t)代入步骤2.3建立的AdaBoost异常来源判断模型中,以此判断发生事件还是其他的异常,将判断结果及时推送,达到实时报警。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810073596.6A CN108302329B (zh) | 2018-01-25 | 2018-01-25 | 一种露点数据异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810073596.6A CN108302329B (zh) | 2018-01-25 | 2018-01-25 | 一种露点数据异常检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108302329A CN108302329A (zh) | 2018-07-20 |
CN108302329B true CN108302329B (zh) | 2019-08-16 |
Family
ID=62866444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810073596.6A Expired - Fee Related CN108302329B (zh) | 2018-01-25 | 2018-01-25 | 一种露点数据异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108302329B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109753500B (zh) * | 2018-12-21 | 2021-02-02 | 广东电网有限责任公司广州供电局 | 刀闸状态异常数据识别方法、装置和计算机设备 |
CN110907833B (zh) * | 2019-10-16 | 2021-01-29 | 北京理工大学 | 一种基于滑动窗口的动力电池故障诊断方法 |
CN111256943A (zh) * | 2020-02-14 | 2020-06-09 | 湖南长海现代实验室设备有限公司 | 一种实验室通风异常检测方法与系统 |
CN111967616B (zh) * | 2020-08-18 | 2024-04-23 | 深延科技(北京)有限公司 | 自动时间序列回归方法和装置 |
CN113051828B (zh) * | 2021-03-30 | 2022-09-02 | 重庆大学 | 一种工艺参数驱动的天然气水露点在线预测方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3933168B2 (ja) * | 2005-03-01 | 2007-06-20 | 松下電器産業株式会社 | ガス遮断装置 |
DE102010043482B4 (de) * | 2010-11-05 | 2012-05-24 | Siemens Aktiengesellschaft | Leckageerkennung und Leckageortung in Versorgungsnetzen |
CN102612065B (zh) * | 2012-03-19 | 2014-05-28 | 中国地质大学(武汉) | 无线传感器网络监控异常事件的快速容错检测方法 |
CN106018545B (zh) * | 2016-06-29 | 2019-05-14 | 东北大学 | 一种基于Adaboost-RBF协同的管道缺陷漏磁反演方法 |
CN106481989B (zh) * | 2016-12-01 | 2019-06-25 | 山东省科学院激光研究所 | 管道泄漏检测方法及装置 |
-
2018
- 2018-01-25 CN CN201810073596.6A patent/CN108302329B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN108302329A (zh) | 2018-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108302329B (zh) | 一种露点数据异常检测方法 | |
JP6872077B2 (ja) | 水道管の漏水検知方法 | |
CN105549563B (zh) | 水质监测系统的远程质控方法及装置 | |
CN116625438A (zh) | 燃气管网安全在线监测系统及其方法 | |
EP3087445A1 (en) | Systems and methods for event detection and diagnosis | |
CN114047719A (zh) | 一种农村生活污水处理设施远程监测评估系统与运行方法 | |
CN110441241B (zh) | 一种光声光谱多组分气体分析仪器的性能评价装置及方法 | |
CN112487708A (zh) | 一种基于集成学习的电阻点焊质量预测方法 | |
CN109034140A (zh) | 基于深度学习结构的工业控制网络信号异常检测方法 | |
CN106290763B (zh) | 一种污水处理运行参数趋势分析方法及系统 | |
CN115876258B (zh) | 基于多源数据的畜禽养殖环境异常监测及报警系统 | |
CN111289697A (zh) | Cems运行状态监控与数据作假识别方法及系统 | |
CN109543743A (zh) | 一种基于重建预测残差的制冷机组多传感器故障诊断方法 | |
CN110276385A (zh) | 基于相似性的机械部件剩余使用寿命预测方法 | |
CN107844067A (zh) | 一种水电站闸门在线状态监测控制方法及监测系统 | |
CN109613109A (zh) | 一种管道漏磁检测数据自动分析系统 | |
CN110514366B (zh) | 一种小样本条件下管道微弱泄漏检测方法 | |
CN112686838B (zh) | 船舶锚链闪光焊接系统的快速检测装置及检测方法 | |
CN110502389A (zh) | 一种服务器异常监控方法、系统、装置及存储介质 | |
CN101789091A (zh) | 视频清晰度自动识别系统及其方法 | |
CN110736888A (zh) | 一种用户用电行为异常的监测方法 | |
CN107449875B (zh) | 一种有机废物处理设施恶臭气体检测设备 | |
CN115931246A (zh) | 一种氢冷发电机的气密性检测与故障处理系统及方法 | |
CN113707240B (zh) | 基于半监督非线性变分贝叶斯混合模型的成分参数鲁棒软测量方法 | |
CN112633900A (zh) | 基于机器学习的工业物联网数据验证方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190816 Termination date: 20210125 |