CN111406213B - 对水的连续体中的异常的改进的检测和表征 - Google Patents

对水的连续体中的异常的改进的检测和表征 Download PDF

Info

Publication number
CN111406213B
CN111406213B CN201880076770.0A CN201880076770A CN111406213B CN 111406213 B CN111406213 B CN 111406213B CN 201880076770 A CN201880076770 A CN 201880076770A CN 111406213 B CN111406213 B CN 111406213B
Authority
CN
China
Prior art keywords
time window
anomaly
measurements
change
anomalies
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880076770.0A
Other languages
English (en)
Other versions
CN111406213A (zh
Inventor
Z·多康
G·屈松内奥
G·费伊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suez International SAS
Original Assignee
Degremont SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Degremont SA filed Critical Degremont SA
Priority claimed from PCT/EP2018/076187 external-priority patent/WO2019063648A1/fr
Publication of CN111406213A publication Critical patent/CN111406213A/zh
Application granted granted Critical
Publication of CN111406213B publication Critical patent/CN111406213B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/18Water
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/33Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using ultraviolet light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/02Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating impedance
    • G01N27/04Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating impedance by investigating resistance
    • G01N27/06Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating impedance by investigating resistance of a liquid

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Software Systems (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

本发明涉及一种用于检测并表征水连续体中的异常的设备。该设备被配置为基于位于水连续体中的传感器来接收物理量的测量。此后,将测量进行变换,并由异常检测器执行对异常的检测,该异常检测器利用由相同传感器产生的经变换的值进行训练。与检测并行地,预先定义的规则使得表征可能的异常成为可能。因此,可以特别地针对水连续体优化异常检测,同时利用预先定义的规则进行的表征允许设备在不需要特别地已经在该水连续体中检测到每个异常的情况下进行操作。

Description

对水的连续体中的异常的改进的检测和表征
技术领域
本发明涉及在水分配网络或自然空间中的水管理领域。更具体地,本发明涉及对影响水质的异常的检测。
背景技术
水分配网络可能受到影响水质的若干异常的影响。例如,水可能由水回流或连接错误而有意或无意地引入的各种污染物污染、由规律地沉淀在管道中并突然恢复到悬浮的物质的颗粒污染、由与网络的组成材料的反应污染或在细菌再生长现象期间由细菌污染。为了防止可能由污染或更一般地由可能引起用户不适的水质下降(颜色、味道、气味等的改变)而引起的有害影响,应尽可能快且准确地检测并表征影响水质的任何事件。改变水的质量的问题也可能在系统、天然水道或水域(例如,湖泊、池塘或河流或天然水道和水域的集合)中发生。例如,这些系统可能受到意外污染或藻类异常生长的影响,从而显著地破坏这些系统的状态并阻止其使用(饮用水、沐浴水……)。
在某些情况下,对这种异常的检测被证明是必不可少的,以便采取校正动作来校正异常。可以通过监视水中的物理参数的集合来检测水生系统中发生的各种异常。例如,诸如氯的浓度之类的参数的异常低的值或针对浊度的异常高的值可以使得检测异常成为可能。
然而,由于多种原因,这种任务可能有时被证明是困难的。在一方面,对异常的检测要求部署传感器,以得到有关水的物理化学参数的精确信息。在另一方面,有时可能难以基于传感器测量来将由于网络的恰当操作所要求的各种水力操作而引起的水的物理参数的正常变化与表明异常的异常值区分开。特别地,每个系统的特定配置可以为该物理参数赋予特定的值。例如,取决于饮用水分配网络是位于设施或加氯点附近还是位于具有长停留时间的遥远区域,饮用水分配网络内的氯浓度可以显著不同。经处理的水的质量也可以根据全年可用的资源的各种类型以或多或少规律的方式变化。然后,能够检测是否遇到了未指定的混合物是必要的。
为了提出对影响水分配网络的异常的更精确的检测,申请人已经提交了公开号为WO 2016/012972的专利。专利WO 2016/012972公开了一种用于检测分配网络中的异常的方法,该方法特别适合于饮用水分配网络,包括从分配网络上的一个或多个传感器获取测量,形成传感器测量的时间序列,从传感器测量提取操作特性,形成操作特性的向量,以及在向量与先前构造的向量显著不同时检测异常。
该方法允许对水分配网络上的异常的精确且高效的检测,因为对异常的检测是通过将向量与由同一个水分配网络上的相同传感器产生的经变换的向量进行比较来执行的。这使得获得完全适合于所研究的水分配网络特性的检测成为可能。例如,在包括各种资源的水生系统中,通常将看到具有不同成分(导电性、温度、pH……)的水在消耗点处交替。在这样的系统中,如果出现与这些参数的常规组合显著不同的组合(其反映水的新混合物),则可能会检测到异常。此外,对于各种类型的事件和测量,可以定义该方法的敏感度。
然而,在完全展现异常的操作表征之前,该方法可能要求很长的训练时间。实际上,基于该方法对特定类型的异常的检测和标识将要求表示该异常的若干向量已经被构造并标记,并且因此该异常已经在该水生系统中反复发生。因此,这种方法直到足够长的持续时间(可能长达若干年)之后使得所寻求的所有异常已经在所研究的水生系统中反复发生才能完全高效地检测给定水生系统中的异常。
因此,需要对水分配网络中的异常的检测,从而使得以精确的方式检测并表征影响水质的事件成为可能,该检测能够迅速地检测并表征在几乎没有历史数据的新的水生系统中所设想的异常的集合。
发明内容
为此,本发明描述了一种能够检测并表征水连续体中的异常的设备,包括:分别到水连续体中的至少一个物理量的至少一个传感器的至少一个通信链路;处理器,其被配置为:通过至少一个通信链路从至少一个传感器接收测量;生成测量的多个时间窗口;对于所述多个时间窗口中的每个时间窗口:获得通过在时间窗口期间的测量的至少一个变换所变换的值的集合;将异常检测器应用于经变换的值的集合以便检测时间窗口的正常状态或异常状态,基于由将至少一个变换应用于至少一个传感器的先前测量的时间窗口产生的经变换的值的集合,所述异常检测器被参数化;根据展现异常状态的时间窗口的数量来检测水连续体中的异常;对测量执行用于检测物理量中的至少一个的变化的预先定义的检测规则的集合;在水连续体中的异常被检测到时,如果物理量的子集的量中的至少一个的变化被检测到,则将与该子集的变化相关联的异常类型指派给该异常。
这允许对水连续体中的异常的高效的检测。实际上,通过学习由相同水连续体中的相同传感器产生的测量来使检测器参数化。因此,基于考虑水连续体的独特性的测量来使异常检测器参数化,由此允许对异常情况的发生的优化的检测。
一旦异常被检测到,就基于预先定义的规则来对异常分型。这使得一旦已经检测到异常就基于一般规则来标识异常是什么类型成为可能。因此,即使利用在至少一个传感器处的测量在水连续体中尚未检测到异常,这也使得标识该异常的类型成为可能。
因此,即使在水连续体中尚未检测到异常,本发明的设备也使得同时获得基于水连续体特定的参数化对异常情况发生的精确检测以及获得基于对各种异常的影响的全局知识对异常的一般分型成为可能。
有利地,在时间窗口期间的测量的变换中的一个是将测量变换为表示测量在时间窗口内的可变性的值。
这使得检测由水连续体中的物理量的快速变化所表明的异常成为可能。例如,浊度的快速变化可以表示颗粒的移动。因此,将测量变换为表示浊度的测量在时间窗口内的可变性的值可以使得获得经变换的值成为可能,从而允许对这种类型的异常的检测。
有利地,通过从时间窗口期间的每个测量减去至少包括所述时间窗口的滑动时间窗口期间的所述测量的中值来执行将测量变换为表示测量在时间窗口内的可变性的值。
这使得避免在时间窗口期间的测量的缓慢变化(例如,以天为单位)成为可能。除了以可靠的方式提供表示时间窗口内的测量的可变性的经变换的值之外,该变换还展现了这样的优点:易于实现并且要求受限制的计算功率以便执行。
有利地,变换仅保留与变化的预先定义的方向相对应的测量。
这允许对由在给定方向上的测量的快速变化所表明的异常的更高效的检测。例如,颗粒的移动可以由浊度的快速增加来表明。因此,仅保留与浊度的增加相对应的测量可以使得以更确定的方式辨别该异常成为可能。
有利地,在时间窗口期间的测量的变换中的一个包括在时间窗口期间的斜率测试(slope test)。
这使得检测受到物理量的缓慢趋势影响的异常成为可能。例如,在饮用水网络中,可能与氯浓度的缓慢降低耦合的细菌数量的缓慢增加可以表示细菌生长异常的出现的风险。警告操作人员关于这种类型的持续现象是有利的,使得对这些现象进行跟踪并可能对其进行校正。在自然水生系统中,叶绿素-a在数天内增加(这导致溶解氧首先增加并且然后逐渐减少)可以表示藻类生长现象的出现。这些异常冒着危害水生生物和系统的使用的风险,并且因此必须加以预见。在时间窗口期间的斜率测试有利地使得检测诸如此类的缓慢变化并因此检测可能的潜在异常成为可能。
有利地,斜率测试是Mann-Kendall趋势测试。
Mann-Kendall测试允许对有效斜率的高效检测。
有利地,传感器中的至少两个传感器是在水连续体的两个点处的同一个物理量的传感器,并且在时间窗口期间的测量的变换中的一个包括在两个传感器的测量之间的时间差异。
这使得检测由连续体的各个点之间的物理量的异常演变表明的异常成为可能。
有利地,经变换的值的集合是向量,并且异常检测器是一类支持向量机。
这允许对时间窗口的异常状态的特别高效的检测。实际上,一类支持向量机使得以特别高效的方式对正常向量或异常向量的集合中的向量进行分类成为可能。此外,一类支持向量机可以由预期为异常的向量的比例进行参数化。因此,借助于该比例,可以容易地对异常检测器进行参数化,以检测更多或更少的异常时间窗口,并帮助操作人员根据其可用的资源来使补充分析和干预优先化。
有利地,通过在时间窗口期间的测量的至少两个变换来获得经变换的值的集合,并且异常检测器被配置为基于经变换的值的集合来确定时间窗口的正常状态或异常状态。
这允许异常检测器基于值的集合来检测经变换的值的集合在哪一点处与先前收集的集合不同,并因此检测在由不同的物理量和/或传感器产生的经变换的值之间的可能的链路。该解决方案在水分配网络中特别有效。实际上,这使得检测若干物理量和/或在水分配网络的若干点处的异常同时变化成为可能。
有利地,通过在时间窗口期间的测量的至少两个变换来获得经变换的值的集合,并且异常检测器被配置为:检测通过在时间窗口期间的测量的所述至少两个变换分别变换的值的至少两个子集的正常状态或异常状态;基于子集的所述正常状态或异常状态的组合来检测时间窗口的正常状态或异常状态。
这使得初始地检测由变换中的每一个产生的值(例如,每个物理量和/或传感器的值)的正常状态或异常状态成为可能。根据每个子集的正常状态或异常状态来定义经变换的值的集合的正常状态或异常状态。这使得以更精确的方式考虑每个物理量和/或每个传感器的测量成为可能。该解决方案在自然环境中特别高效。实际上,在自然环境中的传感器更容易产生误报:物理量的值的可变性在该处更大,并且因为自然水更多携带有悬浮物质,所以传感器容易经历例如由于污垢而引起的缓慢漂移。因此,在自然环境中的传感器更容易出现故障和/或产生嘈杂的测量。对由每个变换(以及因此由每个传感器)产生的测量执行异常检测并且然后仅在至少两个子集展现出异常值时检测异常窗口使得仅在由至少两个传感器产生的测量展现异常时检测异常成为可能。
有利地,处理器被配置为计算物理量的变化的强度,并且预先定义的表征规则的集合包括用于如果物理量在测量期间的变化的强度大于正常变化的阈值则检测到所述物理量的变化的预先定义的检测规则。
这使得高效地检测物理量的变化成为可能。
有利地,处理器被配置为根据子集的物理量的变化的强度将关键性指示符指派给异常。
这使得自动地确定异常的严重性并因此采取最适当的校正措施成为可能。
有利地,仅在物理量的变化符合变化的方向时,对物理量的变化的检测才检测到变化。
这使得在异常与变化的给定方向(增加或减少)相关的情况下,仅在物理量沿定义的方向变化时才保持物理量的变化成为可能。
有利地,处理器被配置为:如果异常被检测到,则将以下类型中的至少一种指派给异常:在包括以下各项的子集的物理量的变化的情况下为“细菌生长”类型:氯浓度降低,温度增加,总有机碳含量增加,波长为254nm的紫外线光的吸收率增加,细菌数量增加;在包括导电性、pH、温度的子集的物理量的变化的情况下为“水混合物”类型;在包括以下各项的子集的物理量的变化的情况下为“有色水”类型:氯浓度,pH,颜色增加,浊度增加,波长为254nm的紫外线光的吸收率增加;在包括浊度和颗粒的子集中的物理量的异常增加的情况下为超速。
这些示例允许对上面提到的类型的异常的可靠的检测。
有利地,处理器被配置为:如果用于检测物理量中的至少一个的变化的预先定义的检测规则的输出不允许将类型指派给异常,则将未知类型指派给该异常。
这使得在所有情况下生成与类型相关联的异常成为可能。
有利地,设备包括接口,该接口用于向操作者显示异常及其类型。
这允许操作者查看异常,并提供与校正操作有关的准备。
有利地,接口被配置为从操作者接收与异常相关的标签;值的时间窗口以及与异常相关的标签被添加到训练数据中。
这使得校正对异常的可能不正确的检测并且改进用于对异常的检测的自动学习机的训练成为可能。
本发明还描述了一种用于检测并表征水连续体中的异常的方法,包括:接收由水连续体中的多个物理量的多个传感器产生的多个物理量的测量;生成测量的多个时间窗口;对于所述多个时间窗口中的每个窗口:获得通过在时间窗口期间的测量的至少一个变换所变换的值的集合;检测时间窗口的正常状态或异常状态,基于由将至少一个变换应用于至少一个传感器的先前测量的时间窗口产生的经变换的值的集合,所述检测被参数化;根据展现异常状态的时间窗口的数量来检测水连续体中的异常;执行用于检测物理量中的至少一个的变化的预先定义的检测规则的集合;在水连续体中的异常被检测到时,如果物理量的子集的量中的至少一个的变化被检测到,则将与该子集的变化相关联的异常类型指派给该异常。
本发明还描述了一种计算机程序产品,包括被记录在由计算机可读的介质上的程序代码指令,该计算机包括用于对水连续体中的异常的检测的处理器,所述计算机程序包括由计算机可读以用于以下操作的编程单元:接收由水连续体中的多个物理量的多个传感器产生的多个物理量的测量;生成测量的多个时间窗口;对于所述多个时间窗口中的每个窗口:获得通过在时间窗口期间的测量的至少一个变换所变换的值的集合;将异常检测器应用于经变换的值的集合以便检测时间窗口的正常状态或异常状态,基于由将至少一个变换应用于至少一个传感器的先前测量的时间窗口产生的经变换的值的集合,所述异常检测器被参数化;根据展现异常状态的时间窗口的数量来检测水连续体中的异常;执行用于检测物理量中的至少一个的变化的预先定义的检测规则的集合;在水连续体中的异常被检测到时,如果物理量的子集的量中的至少一个的变化被检测到,则将与该子集的变化相关联的异常类型指派给该异常。
附图说明
通过阅读通过示例的方式给出的并关于所附附图的以下非限制性的详细描述,其他特性将变得显而易见,在附图中:
-图1表示根据本发明的实现方式的模式的集合的旨在检测水分配网络中的异常的示例性探头;
-图2表示根据本发明的实现方式的模式的集合的用于检测水连续体中的异常的示例性设备;
-图3表示在本发明的实现方式的模式下变换物理量的测量的示例;
-图4表示在饮用水分配网络中检测异常时间窗口的示例;
-图5表示在自然环境中的水中检测异常时间窗口的示例;
-图6a和图6b表示在本发明的实现方式的模式的集合中的水分配网络上的事件的组合的两个示例;
-图7表示用于在本发明的实现方式的模式的集合中向操作者呈现在水分配网络中正在发生的事件的接口;
-图8表示根据本发明的实现方式的模式的集合的用于检测并表征水连续体中的异常的示例性方法。
具体实施方式
在随后的描述中,主要通过与对饮用水分配网络中的异常的检测相关的示例来说明根据本发明的过程。然而,本发明不限于这些示例,并且基于至少两个传感器的测量,本发明可以应用于对与水的质量相关的事件的任何检测。
图1表示根据本发明的实施例的集合的旨在检测水分配网络中的异常的示例性探头。
探头100旨在检测水分配网络中的异常。可以将探头放置在水分配网络的任何位置处,例如,在饮用水生产设施的出口处、在贮水池出口处、在消耗点处或在任何其他点处。
探头100例如通过传感器电缆120的集合连接到水分配网络的管道130,或者直接连接(插入)到网络并且供应有电力110或通过电池供电。
探头100可以包括水分配网络的物理量的一个或多个传感器。例如,探头100可以包括一个或多个传感器,这些传感器选自氯浓度、温度、TOC(代表总有机碳)、UV 254(水对波长为254nm的紫外线的吸收率)、导电性、pH、颜色、浊度、颗粒数量、细菌数量、溶解氧、叶绿素a的传感器或可以表征水的物理量的任何传感器。
因此,在本发明的实施例的集合中,探头100使得执行表示在水分配网络的一点处的水的质量的参数的集合的测量成为可能。
在本发明的实施例的集合中,探头100包括通信单元,以便发送嵌入式传感器的测量。例如,探头可以包括与服务器的有线或无线电连接,以便将测量分发到被配置为检测水分配网络中的异常的服务器。因此,探头100可以以组合的方式通过远程读取、通过分发水消耗数据和传感器的测量来耦合到智能水消耗传感器从而分发消耗数据。
在本发明的实施例的集合中,探头包括处理器,该处理器被配置为基于传感器的测量来检测并表征水分配网络中的异常。
下文将给出由处理器对异常的检测和表征的示例,如参考以下附图描述的用于检测并表征异常的技术可适用于嵌入在探头100中的处理器。
尽管探头100表示水分配网络中的示例性探头,但是这种探头也可以部署在自然环境中的水中,例如,部署在湖泊、池塘、河流或任何其他水生系统中,以及可选地在各种深度处。
图2表示用于检测水连续体中的异常的示例性设备。
网络210是水分配网络,其配备有至少一个物理量的至少一个传感器211、212。例如,传感器211、212可以包括一个或多个传感器,这些传感器选自氯浓度、温度、TOC、UV254、导电性、pH、颜色、浊度、颗粒数量、细菌数量、溶解氧、叶绿素a的传感器或可以表征水的物理量的任何传感器。传感器211、212可以是单独的传感器或者是位于多传感器探头内的传感器(例如,图1中表示的探头100)。
尽管图2表示了水分配网络中的传感器,但是本发明还可适用于自然环境中(例如,湖泊、池塘、河流中或更一般地在水生系统中)的水传感器。传感器可以位于水分配网络或自然环境的相同位置中或分散在水分配网络或自然环境的若干位置处。然而,传感器必须位于相同的水连续体中,即,如果传感器不位于相同位置中,则它们必须位于同一个水生系统或彼此连通的水生系统中,以这种方式,当存在若干传感器时,可以对这些传感器的测量进行交叉检查,以检测并表征在同一个水连续体中的异常。如果传感器位于同一个水分配网络中、位于湖泊或河流的两个点处、位于湖泊以及流入或流出该湖泊的支流河流或外排河流中或更一般地位于同一个水连续体的两个点处,则满足该条件。因此,术语“水连续体”可以同样很好地表示自然环境中的水分配网络或水生系统。
设备200使得检测并表征水连续体(例如,水分配网络210)中的异常成为可能。为此,该设备200包括处理器240以及与传感器211、212的至少一个链路221和222。在本发明的实施例的集合中,可以由用于获取测量的系统(例如,SCADA(监督控制和数据获取)平台)执行与传感器211、212的通信。在本发明的实施例的集合中,通信链路221、222是与接收机220的无线电连接。通信链路的许多其他实现方式是可能的。例如,传感器220、221可以将值分发给集中器,该集中器由无线电连接或蜂窝电话连接来链接到设备200中的调制解调器。通信链路的某些部分可以包括有线连接。本领域技术人员可以毫不费力地为给定的用例定义相关的通信链路,例如,通过选择在水管理分配网络领域中公知的通信连接中的一个。根据本发明的各种实施例,设备200可以属于各种类型的经计算机化的设备。例如,设备200可以是个人计算机、工作站、服务器、数字平板计算机或任何其他合适的设备。
系统200还包括存储介质230。在图2中表示的示例中,存储介质位于设备200中。在本发明的其他实施例中,存储介质可以位于经计算机化的设备的外部。例如,这可能需要由经计算机化的设备可通过请求访问的共享硬盘或远程数据库。
在图2中表示的示例中,存储介质包括水连续体中的异常的检测器的参数231、测量的数据库232。参数231使得对水连续体中的异常的检测器进行参数化成为可能。如将在下文中更详细地描述的,基于先前测量的变换来获得参数。例如,参数231可以是先前变换的测量的向量,或者是借助于先前变换的测量的向量获得的自动学习引擎配置。测量的数据库232用于存储源自传感器211、212的测量。测量尤其包括由一个或多个传感器211、212测量的物理量的值,以及具有测量的日期/时间的时间戳。存储介质230可以例如是硬盘、固态读取器、闪速存储器或任何其他已知的存储类型。在其他实施例中,参数231和/或测量的数据库232可以存储在经计算机化的设备200内部或外部的各种存储介质上。
设备200还可以包括输入/输出250的集合,例如,屏幕、键盘或路由器。
设备200包括处理器240。各种类型的处理器在本发明的框架内是可用的:处理器可以例如是微处理器、微控制器或数字信号处理器(DSP)。处理器不限于任何处理器类型或架构,并且可以被配置为通过加载可执行代码元素来执行操作。处理器同样可以同样很好地位于包括至少一个传感器的探头中或者位于个人计算机或远程服务器中。
处理器被配置为从至少一个传感器211、212接收测量。在图2的示例中,处理器被配置为从测量的数据库232读取测量。然而,处理器240也可以以某种其他方式接收测量,例如,通过直接从传感器接收测量并将其存储在本地工作存储器中。
处理器240还被配置为生成测量的多个时间窗口。根据本发明的各种实施例,时间窗口可以是连续的时间窗口或重叠的连续窗口。
窗口的若干种持续时间是可能的。例如,时间窗口的持续时间可以是5min、15min、1h、6h、12h或24h。
可以在窗口内以规律的间隔对测量进行采样。例如,传感器的整个集合可以以相同的频率采样,并且因此同时产生测量。在其他情况下,采样频率可以是可变的。例如,某些传感器可以每5分钟进行采样,而其他传感器则每15分钟进行采样。然后,可以借助于数据插值来使时间步长一致。因此,通过考虑以最小的可用获取持续时间的规律的时间步长来使测量同步化。这使得对所有传感器具有相同的时间步长、以最高的获取频率进行采样成为可能。
处理器被配置为针对每个时间窗口获得通过在时间窗口期间的测量的至少一个变换242所变换的值的集合。
至少一个变换242使得获得经变换的值成为可能,该经变换的值的某些属性可以是异常的特性。
例如,变换242可以包括对长趋势(典型地为每天或每周的趋势)的删除,以便仅保留物理量的测量的快速变化,即,变换242将测量变换为表示测量在时间窗口内的可变性的值:经变换的值越高,则快速变化对时间窗口的影响就越大,并且测量越分散。例如,在窗口期间的测量的变换中的一个可以包括对物理量的测量的快速变化的过滤,例如,相对于每天的趋势对几个小时的量级的过滤,这等效于高通滤波器。这种变换使得仅保留物理量的测量的快速变化并因此检测与该量的异常快速变化相关的异常成为可能。例如,可以借助于浊度的异常快速变化来检测沉积物的移动。
可以通过从时间窗口期间的每个测量减去该时间窗口期间的或更长的时间窗口期间的所述测量的中值来执行将测量变换为表示测量在时间窗口内的可变性的值。这允许高效的高通过滤,同时保留每个测量给出的信息。通过替代方案的方式,高通过滤也可以通过其他手段来执行。例如,高通过滤可以通过从时间窗口期间的每个测量减去该时间窗口期间的所述测量的平均值或通过执行频率变换来执行。
变换还可以仅保留与变化的预先定义的方向相对应的测量。例如,在浊度测量的情况下,将可能仅保留可能由沉积物的移动引起的突然的增加。在氯浓度的测量的情况下,将可能仅保留能够表征细菌数量或有机物质的比例的增加的表示氯浓度的降低的测量。因此,仅保留与浊度的增加相对应的测量可以使得以更确定的方式辨别该异常成为可能。在先前提到的其中通过从时间窗口期间的每个测量减去该时间窗口期间的所述测量的中值来执行对快速变化的过滤的情况下,这可以例如通过在减法之后保留以下各项来执行:
-如果变化的受欢迎方向是增加,则仅保留正值或零值;
-如果变化的受欢迎方向是减少,则仅保留负值或零值。
变换还可以包括在时间窗口期间应用斜率测试。这使得检测时间窗口期间的缓慢变化成为可能。某些异常可以生成某些物理量的缓慢变化。例如,在饮用水网络中,可能与氯浓度的缓慢降低耦合的细菌数量的缓慢增加可以表示细菌生长异常的出现的风险。警告操作人员关于这种类型的持续现象是有利的,使得对这些现象进行跟踪并可能对其进行校正。在自然水生系统中,叶绿素-a在数天内增加(这导致溶解氧首先增加并且然后逐渐减少)可以表示藻类生长现象的出现。这些异常冒着危害水生生物和系统的使用的风险,并且因此必须加以预见。
时间窗口的大小可以被适应为适合于在进行中的现象的估计出的持续时间。例如,可以通过在连续5天的时间窗口期间比较每天的测量的中值来执行斜率测试。斜率测试可以例如是特别可靠的Mann-Kendall趋势测试。斜率系数可以例如借助于Theil-Sen估计器来估计。
上文提到的变换被应用于由单个传感器产生的物理量的测量的时间窗口。然而,本发明不限于这些示例。例如,本领域技术人员可以定义变换,从而使得在由两个不同的传感器产生的同一个物理量的测量之间建立链路成为可能,以便获得表示水连续体中的物理量的演变的经变换的值。例如,溶解氧的两个传感器可以位于河流的上游和下游,并且由两个传感器产生的测量的联合变换使得获得表征河流中的溶解氧的演变的经变换的值成为可能。
例如,传感器中的至少两个传感器可以是在水连续体的两个不同点处的同一个物理量的传感器,并且在时间窗口期间的测量的变换中的一个可以包括在两个传感器的测量之间的时间差异。
在许多情况下,连续体中的水的流动定义了连续体各个点处的物理量之间的时间相关性。例如,如果水连续体是河流,并且如果两个导电性传感器中的一个位于另一传感器的下游,则由下游传感器产生的测量将通过与水行进上游传感器与下游传感器之间的距离所花费的平均时间相对应的时间差异与上游传感器的测量相关。
可以基于历史数据,通过对先前的测量执行两个传感器的测量之间的交叉相关性、通过执行相关性重要性测试以及通过选择最高的峰值,来估计在连续体的两个点处的同一个物理量的两个传感器的测量之间的最优时间偏移。
当测量的变换包括根据在连续体的两个不同点处的同一个物理量的两个传感器的测量之间的最优时间偏移来影响时间差异时,如果流动正常,并且如果两个传感器之间没有发生影响被测物理量的事件,则经变换的值将为低。
相反,高值可以表示:
-对连续体中的水的流动的修改,这意味着水行进两个传感器之间的空间所花费的时间变得与先前计算出的最优时间偏移不同,然后根据该偏移,物理量的测量不再相关;
-或者在两个传感器之间发生的影响物理量的事件。
因此,这样的变换不仅使得基于网络中分布的测量来检测异常成为可能,而且还使得提供关于可能的异常的位置信息成为可能。
因此,定义的一个或多个变换使得获得特性变换值(也称为“特征”)成为可能,从而使得检测异常成为可能。根据本发明的各种实施例,可以在同一个时间窗口期间将各种变换应用于各种物理量的测量。也可以对同一个物理量应用多个变换。因此,本领域技术人员可以知道与水连续体中潜在的异常相关联的特性,定义最适合于可用的测量类型以及所寻求的异常的变换。
从在各种时间窗口期间变换的值的结构保持相同的时刻开始,经变换的值的集合可以采取多种形式,以便允许标识异常集合。将变换以类似的方式应用于当前向量的数据和过去的向量是必要的,以用作用于对异常的检测的训练数据。
例如,可以以向量的形式获得经变换的值的集合。如果应用单个变换,则向量可以仅包括在时间窗口期间对各种参数进行变换的值。向量还可以包含在时间窗口期间变换的连续测量。如果应用了若干变换,则可以将每个变换完成时的经变换的值级联以便形成单个向量。
在本发明的实施例的集合中,处理器被配置为使经变换的值的集合归一化,以便检测同类的值上的异常。例如,处理器可以被配置为计算在时间窗口期间变换的值的标准偏差,并将该窗口的所有值除以该标准偏差。处理器还可以被配置为删除奇异极值,其目的是为了计算用于归一化的特征以及统计指示符(标准偏差、平均值、中值)。为此,若干实施例是可能的。例如,处理器可以被配置为计算窗口期间的值的平均值和标准偏差,并删除比平均值大预先定义的倍数的标准偏差的值,和/或删除比平均值低该相同的预先定义的倍数的值,例如,比平均值加标准偏差的三倍更大的值,或者比平均值减标准偏差的三倍更小的值。另一选项包括删除时间窗口期间的给定百分比(例如,5%)的最高和/或最低的经变换的值。
当通过级联由若干变换产生的经变换的值来获得经变换的值的集合时,可以对从每个变换产生的值单独地执行值的归一化。即使应用的变换和初始测量的幅度非常不同,这也使得获得同类的经变换的值的集合成为可能。然后,不存在在学习空间中固有地主导其他参数的参数。
在本发明的实施例的集合中,经变换的值的集合还可以包括可能对经测量的物理量有影响的连接性数据。例如,这些数据可以包括气象数据,例如,湿度测定测量、空气温度的测量、日照的测量、总降雨或在执行测量时没有降雨的连续天数的测量。这些参数特别影响天然水生系统的水质。关于总降雨的数据例如经由阈值被用于从对异常的检测中移除与阴雨天气的时间相对应的时间步长。
图3表示在本发明的实施例中的物理量的测量的变换的示例。
曲线310表示氯浓度的测量的时间窗口。横轴以5分钟时间步长的数量为单位表示经过的时间。纵轴以ppm(百万分之一)为单位表示测量的强度。
第一变换步骤包括计算时间窗口期间的测量的中值以及从测量减去该中值,以便获得变换的第一级别320。然后,经变换的值表示测量的快速变化。
第二变换步骤包括仅保留负值(因此表示氯浓度的降低)。因此,经变换的值330使得评估氯浓度的快速降低的级别成为可能。由于氯浓度的过度降低可能由细菌生长现象导致,因此这些经变换的值可以用于检测该异常。
该变换仅通过示例的方式给出了根据本发明的变换。本领域技术人员将能够容易地根据所寻求的异常的类型来定义最合适的变换,例如,通过在时间窗口期间仅保留快速变化或缓慢变化,以及仅保留给定物理量的增加或减少。
返回图2,处理器还被配置为将异常检测器243应用于经变换的值的集合以便检测时间窗口的正常状态或异常状态,所述异常检测器基于经变换的值的集合进行参数化,这些经变换的值的集合是由将至少一个变换应用于至少一个传感器的先前测量的时间窗口产生的。
异常检测器可以采取各种形式。例如,异常检测器可以是处理器指令的集合、软件模块或借助于先前对异常的检测被配置的自动学习模块。异常检测器被配置为针对时间窗口检测值的集合是否表示时间窗口的异常状态。为此,利用由至少一个传感器211、212的先前测量的时间窗口处的至少一个变换242产生的先前经变换的值的集合来对异常检测器进行参数化。因此,利用表示水连续体的经变换的值来训练异常检测器,由此允许非常适合于所研究的水连续体的对异常的检测。尽管异常检测器随着学习数据量的增加而改进,但是可以迅速地实施针对由相同传感器产生的数据的仅指示正常状态或异常状态的检测器。特别地,一旦经变换的值与学习库的经变换的值显著不同,这种检测器就可以检测到异常。在另一方面,该检测器既不要求先前已经遇到所有异常,也不要求这些异常已经被标记。因此,一旦几个经变换的测量是可用的,异常检测器就可以非常迅速地操作。
对窗口的异常状态的检测可以例如由异常检测器通过这样的操作执行:将例如0到1之间的分数指派给窗口的经变换的值的集合,从而指示该集合在哪一点处与先前的经变换的值的集合不同;以及在分数大于预先定义的阈值时确定窗口状态为异常。如果经变换的值形成经变换的值的与先前收集的值最不同的给定百分比的一部分,则还可以检测时间窗口的异常状态。
异常检测器的许多实施例是可能的。特别地,异常检测器可以是机器学习算法,其基于先前获得的经变换的值以自动的方式学习表示时间窗口的正常状态或异常状态的经变换的值。
在本发明的实施例的集合中,经变换的值的集合是向量,并且异常检测器是一类支持向量机(一类SVM)。这种类型的异常检测器允许对时间窗口的异常状态的特别高效的检测。实际上,一类支持向量机使得以特别高效的方式表示在正常向量与异常向量(与正常向量相距太远)之间的边界成为可能,以便确定在向量与先前研究的向量之间的差异的级别。此外,一类支持向量机借助于预期为异常的向量的比例进行参数化。一类支持向量机类型的异常检测器展现了提供将数据高效地分类到正常状态或异常状态的优点。此外,该异常检测器可以利用有限的训练数据量非常迅速地实施。
因此,可以利用可变的异常向量比率(例如,在1/100到1/10000之间)对一类支持向量机进行参数化(即,利用1/100到1/10000之间的经变换的值的异常集合的比例,然后一类支持向量机自动地适应其异常集合的定义,以便达到异常值的该比率)。可以在任何时候调整该比率,以检测异常的更多或更少数量的数据集。
在本发明的实施例的集合中,通过在时间窗口期间的测量的至少两个变换来获得经变换的值的集合。例如,当通过变换若干物理量的测量和/或由若干传感器产生的测量获得经变换的值的集合时,就是这种情况。例如,如果经变换的值的集合包括由导电性测量的变换、pH测量的变换和温度测量的变换产生的值,则可以获得这种配置。
在这些情况下,问题可能起因于用于检测该经变换的值的集合上的异常的最合适的方法。
在本发明的实施例的集合中,异常检测器被配置为基于经变换的值的集合来确定时间窗口的正常状态或异常状态。
这允许异常检测器基于由不同的物理量和/或传感器产生的经变换的值的集合来检测该集合在哪一点处与先前收集的集合不同,并因此检测在由不同的物理量和/或传感器产生的经变换的值之间的可能的链路。该解决方案在水分配网络中特别有效。实际上,该解决方案使得在同一时间检测单个参数上的显著变化或不那么显著但同时应用于若干参数的变化成为可能。因此,检测可以以特别精确的方式突出影响若干参数的现象。在饮用水网络的情况下,信号的可变性通常被更好地控制,因为它是由于规律的业务操作所引起的。此外,传感器处于饮用水的更清洁的环境中。这些传感器通常经历较少的漂移。
在本发明的实施例的集合中,通过在时间窗口期间的测量的至少两个变换来获得经变换的值的集合,并且异常检测器被配置为:
-检测通过在时间窗口期间的测量的所述至少两个变换分别变换的值的至少两个子集的正常状态或异常状态;
-基于子集的所述正常状态或异常状态的组合来检测时间窗口的正常状态或异常状态。
各种子集典型地对应于在时间窗口期间由每个传感器和/或每个物理量产生的测量的子集。例如,如果时间窗口包括由单个传感器产生的导电性测量以及由两个不同的传感器产生的浊度测量,则可以将测量的整个集合分为三个子集:一个导电性测量的子集,以及两个浊度测量的子集(其对应于由两个传感器中的每一个产生的测量)。
还可以根据不同的规则来定义子集。例如,子集可以对应于同一个多传感器探头的测量,或者对应于由在若干不同点处的多个传感器产生的同一个物理量的测量。
这使得初始地检测由变换中的每一个(例如,每个物理量和/或传感器)产生的值的正常状态或异常状态成为可能。根据每个子集的正常状态或异常状态来定义经变换的值的集合的正常状态或异常状态。这使得以可区分的方式考虑每个物理量和/或每个传感器的测量成为可能。该解决方案在自然环境中特别高效。实际上,在自然环境中的测量容易导致每个参数的更大的可变性,以及容易导致由于介质的敌对性而引起的传感器更频繁的故障或漂移。因此,争取确保参数同时地或以随时间的推移稍微偏移的方式展现异常值以便减少错误警报是有必要的。
在其中借助于机器学习算法(例如,一类支持向量机)执行对异常的检测的本发明的实施例中,可以针对子集中的每一个执行单独的学习:各种变换被应用于用于学习的先前测量的时间窗口中的每一个,以便针对这些窗口中的每一个获得对应的经变换的值的子集。然后针对每个子集对这样获得的训练数据单独地执行学习。通过消除与传感器缺陷或经测量的参数的较高的自然可变性相关的错误警报中的一些,这允许对传感器和/或物理量的异常情况的更准确的检测。
子集的正常状态或异常状态的组合可以以各种方式来完成。例如,如果子集中的至少一个具有异常状态,则可以检测到时间窗口的异常状态。这使得在至少一个传感器或物理量的经变换的测量为异常时检测异常成为可能。这还可以仅在所有子集都展现异常状态时或者在至少给定数量的子集(例如,三个子集中的至少两个子集)展现异常状态时才检测时间窗口的异常状态。在自然环境中,即使在时间平滑之后,当在单个传感器上单独进行检测时,也不会生成异常(考虑到先前的时间步长以融合之前稍微发生的潜在异常)。
图4表示在饮用水分配网络中检测异常时间窗口的示例。
曲线410、420、430、440、450、460、470和480分别表示氯浓度411、贮水池的水位421、流速431、导电性441、温度451、TOC 461、浊度471和UV 254 481的8个传感器的测量的演变。
可以基于各种传感器(例如,传感器211、212)来获得这些测量。
在这里,测量是在1月26日到2月1日之间的一周期间执行的。通过24h的滑动窗口对测量进行变换以便检测异常窗口。在该示例中,该测量遵循正态分布直到2月1日。该正态分布表示日复一日的用于填充贮水池的两个水源的混合。此后,填充贮水池的问题导致质量的异常,这在相同时间窗口期间的许多参数上是可见的:氯浓度突然降低412、贮水池中的水位上升然后又下降422、水流速在24h内保持为零432、水的导电性骤降442、温度大幅增加452、TOC(有机碳总浓度)降低462、浊度增加472、UV 254的吸收率减少482。
在时间窗口期间的这些测量的各种变换使得突出该窗口期间的测量不遵循其常规的方案,并因此检测由若干异常时间步长组成的异常时间窗口成为可能。
这些曲线仅通过示例的方式给出,并且本领域技术人员将能够根据所寻求的异常的类型和/或可用的传感器来检测物理量的另一集合上的异常时间窗口。
图5表示在自然环境中的水中检测异常时间窗口的示例。
图5表示由同一个探头的传感器的集合产生的测量,包括:
-导电性测量510;
-氧气溶解量的测量520;
-pH测量530。
还使用连接性数据(在该实例中为从气象数据中恢复的没有降雨的连续天数540)。
通过取6h的时段期间的导电性、溶解氧量和pH的中值,对测量进行变换以便获得经变换的值511、521、531。
通过6h的时间窗口来执行对异常的检测:每6h对时间窗口进行分析。异常检测器应用于每个时间窗口。在该示例中,首先在每个物理量上检测变化,并且如果至少两个物理量展现出具有少于4个时间窗口的差异的变化,则检测窗口的异常状态。这使得在传感器有缺陷时避免检测异常窗口成为可能。
在这里,测量是从11月27日到1月5日执行的。测量在11月和12月是相对规律的,特别是在移除与降雨相对应的时间步长(反转的蓝色曲线)时;在1月初,参数的变化发生,这可能反映了产品丢弃到环境中所引起的污染,并且这由导电性的增加512和溶解氧量的减少522表明。这些异常由异常高的变化表明,这使得在时间窗口期间检测这些物理量中的每一个的异常成为可能。
曲线550表示在6h的每个时间窗口期间的异常的强度的评估。在该示例中,仅在先前检测到异常的情况下,通过这样的方式来计算异常的强度:从先前计算出的经变换的值减去每个物理量的可用数据的历史期间的测量的总中值,乘以100并除以该相同的总中值以便使这些差异归一化。然后,计算各种物理量的最大值,以便产生图形上表示的指示符。因此,值0对应于不存在异常。然而,这仅是通过示例的方式给出的,并且可以使用评估异常的关键性的其他方式,该异常的关键性是由同一个时间窗口内的值之间的或相对于数据历史之间的显著差异表明的。可以观察到,异常检测器在11月和12月没有检测到任何异常窗口,并且然后在1月初检测到很大比例的异常窗口。
这些曲线仅通过示例的方式给出,并且本领域技术人员将能够根据所寻求的异常的类型和/或可用的传感器来检测物理量的另一集合上的异常时间窗口。
返回图2,处理器240还被配置为根据展现异常状态的时间窗口的数量来检测244水连续体中的异常。
在本发明的实施例的集合中,一旦时间窗口展现出异常状态,就在水连续体中检测到异常。
在本发明的实施例的集合中,为了限制在将单个时间窗口标识为异常时的错误警报的数量,仅在若干时间窗口展现异常状态时才检测到水连续体中的异常。例如,如果预先定义的数量的连续的窗口(例如,2个、3个、4个、10个等)展现异常状态,则可以检测到异常。另一选项包括在多个连续的时间窗口期间,如果大于给定阈值的百分比的连续的窗口展现异常状态则检测到异常。例如,如果在10个连续时间窗口中,至少有75%的时间窗口展现异常状态,则可以在水连续体中检测到异常。这使得仅在异常状态被证实时才生成警报成为可能。为了防止警报发出得太晚,所使用的时间窗口可以是滑动窗口。例如,每小时可以生成测量的6h的窗口(因此,时间窗口包括与先前窗口共同的5h的测量)。因此,这使得仅在异常被证实时才检测异常(因为异常在若干时间窗口上被突出)、使用长的时间窗口以及避免对异常的检测中的太大延迟同时成为可能。
处理器240还被配置为对测量执行245用于检测物理量中的至少一个的变化的预先定义的检测规则的集合,并且在检测到异常时,如果物理量的子集的量中的至少一个的变化被检测到,则将与该子集的变化相关联的异常类型指派246给该异常。
这些规则使得表征水连续体中的异常(如果有的话)成为可能。可以使用对应于已知类型的异常的预定的规则。例如,本领域技术人员已知水源的改变由水的导电性、pH和温度的修改来表明。因此,可以与异常检测并行地执行用于异常表征的预先定义的规则:因此,如果已经检测到异常,并且如果已经观察到水的导电性、pH和温度的并行修改,则可以推断出该异常是水源的改变。
对异常的检测和表征的组合特别高效。实际上:
-通过将测量的经变换的值与由同一个水连续体上的相同传感器产生的先前测量所产生的经变换的值进行比较来执行检测,由此使得基于统计事件来获得特别适合于水连续体的异常情况检测成为可能。此外,如上文所指示的,这种检测可以利用有限的训练数据来迅速地实施。
-表征可以基于一般规则,因为在所有水连续体上,同一种类型的异常由相同物理量的变化表明。因此,对异常的表征或分型可以基于可适用于所有水生系统的预先定义的规则来执行,而无需特别地针对水连续体或传感器进行参数化。
因此,根据本发明的设备使得以适合于所研究的环境的特性的可靠方式检测水连续体中的异常并确定其类型成为可能,而无需在水连续体中已经观察到可能的异常中的每一个。因此,根据本发明的设备可以在几乎没有由传感器211、212产生的先前观察的情况下非常迅速地操作。当更大量的训练数据的集合可用并且已经标记了足够数量的异常时,如果检测由此改进,则异常检测器可以由直接检测异常的类型的异常检测器来代替。
根据本发明的各种实施例,用于检测物理量的变化的规则可以与对异常的检测并行地执行,或者仅在已经检测到异常时执行。
可以例如通过这样的操作来执行对物理量的变化的检测:计算物理量的变化的强度,并且然后通过将该强度与阈值进行比较,如果变化的强度大于该阈值,则检测到该变化。这种变化的强度可以以各种方式来计算。例如,可以借助于针对物理量在先前计算出的经变换的值来计算变化强度,例如,可能已经基于斜率测试和斜率的计算来计算出缓慢变化的强度,并且可以通过将移动的95%分位数应用于表示快速变化的值(例如,将每个测量的差异应用于时间窗口期间的中值)来计算快速变化的强度。因此,可以计算出表示快速变化的值的绝对值的平均值。如果该平均值大于阈值(阈值在这里对应于表示由历史数据产生的先前时间窗口的集合上的快速变化的值的绝对值的平均值的最低95%和最高5%之间的限制),则检测到物理量的变化。在这里,平均值可以用其他特性值(例如,表示快速变化的值的绝对值的总和)代替。可以基于历史数据,通过将中值加上3个标准偏差计算出阈值。然后,这表示了数据分布的高值。然而,这些规则仅通过示例的方式给出,并且本领域技术人员将能够实现任何类型的合适规则,从而使得使用由至少一个变换242计算出的经变换的值或以其他方式来检测物理量的特别高的变化成为可能。
根据本发明的各种实施例,可以针对物理量的全部或一些计算变化的强度。
对于某些物理量,仅对于变化的给定方向,可以认为变化是显著的或有问题的。例如,氯浓度的降低可以被认为是有问题的,而氯浓度的增加将不被认为是有问题的。在本发明的实施例的集合中,仅在物理量在测量期间的变化的方向符合变化方向时,才保留某些物理量的变化。
在本发明的实施例的集合中,物理量的变化的强度也使得确定异常的关键性成为可能。因此,可以根据与异常相关联的子集的物理量的变化的强度将关键性分数指派给异常。根据先前计算出的各种参数的强度来计算该分数。仅针对关键参数,将这些强度与数据历史中的在先前的时间窗口期间计算出的强度进行比较。然后使这些强度相对于在每个参数上观察到的鲁棒最大值来进行归一化,并且然后取最大值,以便将关键性确定为0到1之间的数字。
本领域技术人员可以根据可用的传感器以及与所寻求的异常的类型相关联的物理量来提供用于将类型指派给异常的多种指派规则。
例如,下表提供了可以根据物理量的异常变化指派的异常的类型的一些示例:
这些可能性仅通过示例的方式给出,并且本领域技术人员可以针对每个异常选择物理量,这些物理量的变化允许其被更好地表征。因此,本发明使得表征大量的不同的异常成为可能。
根据本发明的各种实施例,如果相关联的物理量的全部或一些变化,则可以检测一种类型的异常。在上表的示例中,如果三个量(导电性、pH、温度)具有异常变化,或者如果三个量中的至少两个量变化,则可以利用类型“水混合物”来表征异常。
在本发明的实施例的集合中,一旦已经检测到异常,就可以经由接口250将该异常显示给操作者。接口250可以显著地显示异常的类型、检测到该异常的位置以及异常的关键性(如果相关的话)。
可以将检测到的异常与其他信息源(例如,客户投诉)进行交叉检查,以便确认或拒绝该异常。
因此,操作者可以采取异常所必要的所有措施。在本发明的实施例的集合中,操作者还可以使异常生效或使其失效,即,在验证之后指示对异常的检测是否合理。当异常检测器是自动学习机时,这使得采用更可靠的训练数据并因此改进异常检测性能成为可能。
在本发明的实施例的集合中,检测到的异常可以生成事件。根据由水分配网络的各个部分或各个传感器产生的测量,可以生成各种事件。这些事件也可以彼此组合,水分配网络的本地事件的组合能够被解释为全局事件。如果在多个传感器上检测到类似事件,则可以将所覆盖的区域显示给用户,使得用户采取与其有关的适当措施。如果在设施出口处和网络的其余部分上在同一时间检测到现象,则可以推断出异常与水处理设施相关,并且可以生成适当的事件。因此,在该级别而不是网络级别进行调查是有必要的。
图6a和图6b表示在本发明的实现方式的模式的集合中的水分配网络上的事件的组合的两个示例。
在这两个示例中,饮用水分配网络620位于水处理设施610的下游。若干事件生成器基于对异常的检测,例如,在关于图2的示例中表示的事件。第一事件生成器630基于在饮用水生产设施的出口处执行的测量来检测可能的异常。
在图6a的示例中,基于在网络的三个不同点处的物理量的测量来并行地执行三个事件生成器631a、632、633。因此,组合的事件可以作为整体组合成网络的事件。例如,水混合物应该在同一个区域的若干点上可见。
在图6b的示例中,考虑到在饮用水生产设施的出口处发生的事件630,事件检测器631a已经被修改为事件检测器631b。因此,当由事件检测器631b所使用的测量检测到异常时,异常或事件的类型的表征将取决于事件检测630。例如,生产的改变应该不能够在网络的传感器上生成,因为已经在设施出口处检测到该改变。
这些示例证明了本发明检测水分配网络中的异常或事件的能力,同时考虑了在网络的各个点之间的交互,以便检测更全局的异常。
然而,本发明不限于这些示例,并且例如参考图6a和图6b所描述的事件的组合可以例如应用于对自然环境中的异常的检测。
图7表示用于向操作者呈现在水分配网络中正在发生的事件的接口。
接口700被配置为向操作者呈现由根据本发明的设备在水分配网络中检测到的异常。在该示例中,异常在扇区710上被检测到,并且在地图上被定位。异常的类型由各种象形图表示。在该示例中,象形图分别表示以下的测量的点的位置:氯浓度720、721、722和723,pH 730和731,温度740,水对UV的吸收率750,TOC 760,多参数探头760和现场分接点770。
该示例证明了本发明以清晰的方式向操作者直观地显示在水分配网络中正在发生的各种异常的能力。然而,本发明不限于该示例,并且可以使用其他类型的表示。以同样的方式,该表示可以用于自然环境中的水。
图8表示根据本发明的实现方式的模式的集合的用于检测并表征水连续体中的异常的示例性方法800。
方法800包括接收810由水连续体中的多个物理量的多个传感器产生的多个物理量的测量。
方法800还包括生成820测量的多个时间窗口。
方法800还包括,对于所述多个时间窗口中的每个窗口:
-获得通过在时间窗口期间的测量的至少一个变换830所变换的值的集合;
-检测840时间窗口的正常状态或异常状态,基于由将至少一个变换应用于至少一个传感器的先前测量的时间窗口产生的经变换的值的集合,所述检测被参数化。
在本发明的实施例的集合中,变换830中的至少一个是将测量变换为表示测量在时间窗口内的可变性的值。
在本发明的实施例的集合中,通过从时间窗口期间的每个测量减去滑动时间窗口期间的所述测量的中值来执行将测量变换为表示测量在时间窗口内的可变性的值。
在本发明的实施例的集合中,变换仅保留与变化的预先定义的方向相对应的测量。
在本发明的实施例的集合中,变换830中的至少一个包括在时间窗口期间的斜率测试。
在本发明的实施例的集合中,斜率测试是Mann-Kendall趋势测试。
在本发明的实施例的集合中,传感器中的至少两个传感器是在水连续体的两个点处的同一个物理量的传感器,并且在时间窗口期间的测量的变换中的一个包括在两个传感器的测量之间的时间差异。
在本发明的实施例的集合中,经变换的值的集合是向量,并且异常检测器是一类支持向量机。
在本发明的实施例的集合中,通过在时间窗口期间的测量的至少两个变换来获得经变换的值的集合,并且对异常的检测基于经变换的值的集合来确定时间窗口的正常状态或异常状态。
在本发明的实施例的集合中,通过在时间窗口期间的测量的至少两个变换来获得经变换的值的集合,并且对异常的检测:
-检测通过在时间窗口期间的测量的所述至少两个变换分别变换的值的至少两个子集的正常状态或异常状态;
-基于子集的所述正常状态或异常状态的组合来检测时间窗口的正常状态或异常状态。
方法800还包括根据展现异常状态的时间窗口的数量来检测850水连续体中的异常。
方法800还包括执行用于检测物理量中的至少一个的变化的预先定义的检测规则的集合。
在本发明的实施例的集合中,方法800包括计算物理量的变化的强度,并且预先定义的表征规则的集合包括用于如果物理量在测量期间的变化的强度大于正常变化的阈值则检测到所述物理量的变化的预先定义的检测规则。
在本发明的实施例的集合中,仅在物理量的变化符合变化的方向时,对物理量的变化的检测才检测到变化。
方法800最终包括:在异常被检测到时,如果物理量的子集的量中的至少一个的变化被检测到,则将与该子集的变化相关联的异常类型指派870给该异常。
在本发明的实施例的集合中,方法800包括根据子集的物理量的变化的强度将关键性指示符指派给异常。
在本发明的实施例的集合中,方法800包括:如果异常被检测到,则将以下类型中的至少一种指派给异常:
-在包括以下各项的子集的物理量的变化的情况下为“细菌生长”类型:
氯浓度降低,温度增加,总有机碳含量增加,波长为254nm的紫外线光的吸收率增加,细菌数量增加;
-在包括导电性、pH、温度的子集的物理量的变化的情况下为“水混合物”类型;
-在包括以下各项的子集的物理量的变化的情况下为“有色水”类型:
氯浓度,pH,颜色增加,浊度增加,波长为254nm的紫外线光的吸收率增加;
-在包括浊度和颗粒的子集中的物理量的异常增加的情况下为超速。
在本发明的实施例的集合中,方法800包括:如果用于检测物理量中的至少一个的变化的预先定义的检测规则的输出不允许将类型指派给异常,则将未知类型指派给该异常。
在本发明的实施例的集合中,方法800包括使用接口向操作者显示异常及其类型的步骤。
在本发明的实施例的集合中,方法800包括:
-使用接口从操作者接收与异常相关的标签;
-将值的时间窗口以及与异常相关的标签添加到训练数据中。
因此,方法800使得检测水连续体中的各种类型的异常并为这些异常指派类型成为可能。参考图2至图7描述的所有实施例均可适用于方法800。
上文的示例证明了本发明检测与水质相关的事件或异常的能力。然而,这些示例仅通过示例的方式给出,并且在任何情况下均不限制在下文权利要求书中限定的本发明的范围。

Claims (18)

1.一种能够检测并表征水连续体中的异常的设备(100、200),包括:
-分别到所述水连续体中的至少一个物理量的至少一个传感器(211、212)的至少一个通信链路(221、222);
-处理器(240),其被配置为:
-通过所述至少一个通信链路从所述至少一个传感器接收测量;
-生成所述测量的多个时间窗口;
-对于所述多个时间窗口中的每个时间窗口:
-获得通过在所述时间窗口期间的所述测量的至少一个变换(242)所变换的值的集合;
-将异常检测器(243)应用于经变换的值的集合以便检测所述时间窗口的正常状态或异常状态,基于由将所述至少一个变换应用于所述至少一个传感器的先前测量的时间窗口产生的经变换的值的集合,所述异常检测器被参数化;
-根据展现异常状态的时间窗口的数量来检测(244)所述水连续体中的异常;
-对所述测量执行(245)用于检测所述物理量中的至少一个的变化的预先定义的检测规则的集合;
-在所述水连续体中的异常被检测到时,如果所述物理量的预先定义的子集的量中的至少一个的变化被检测到,则将与所述子集的变化相关联的异常类型指派(246)给所述异常。
2.根据权利要求1所述的设备,其中,在时间窗口期间的所述测量的所述变换中的一个是将所述测量变换为表示所述测量在所述时间窗口内的可变性的值。
3.根据权利要求2所述的设备,其中,通过从所述时间窗口期间的每个测量减去至少包括所述时间窗口的滑动时间窗口期间的所述测量的中值来执行将所述测量变换为表示所述测量在所述时间窗口内的所述可变性的值。
4.根据权利要求1-3中的一项所述的设备,其中,所述变换仅保留与变化的预先定义的方向相对应的测量。
5.根据权利要求1所述的设备,其中,在时间窗口期间的所述测量的所述变换中的一个包括在所述时间窗口期间的斜率测试。
6.根据权利要求1所述的设备,其中,所述传感器中的至少两个传感器是在所述水连续体的两个点处的同一个物理量的传感器,并且在时间窗口期间的所述测量的所述变换中的一个包括在所述两个传感器的所述测量之间的时间差异。
7.根据权利要求1-3中的一项所述的设备,其中,所述经变换的值的集合是向量,并且所述异常检测器是一类支持向量机。
8.根据权利要求1-3中的一项所述的设备,其中,通过在所述时间窗口期间的所述测量的至少两个变换来获得所述经变换的值的集合,并且所述异常检测器被配置为基于所述经变换的值的集合来确定所述时间窗口的正常状态或异常状态。
9.根据权利要求1-3中的一项所述的设备,其中,通过在所述时间窗口期间的所述测量的至少两个变换来获得所述经变换的值的集合,并且所述异常检测器被配置为:
-检测通过在所述时间窗口期间的所述测量的所述至少两个变换分别变换的值的至少两个子集的正常状态或异常状态;
-基于所述子集的所述正常状态或所述异常状态的组合来检测所述时间窗口的正常状态或异常状态。
10.根据权利要求1-3中的一项所述的设备,其中,所述处理器被配置为计算所述物理量的变化的强度,并且预先定义的表征规则的集合包括用于如果物理量在所述测量期间的所述变化的强度大于正常变化的阈值则检测到所述物理量的变化的预先定义的检测规则。
11.根据权利要求10所述的设备,其中,所述处理器被配置为根据所述子集的所述物理量的所述变化的强度将关键性指示符指派给所述异常。
12.根据权利要求1-3中的一项所述的设备,其中,仅在所述物理量的所述变化符合变化的方向时,对所述物理量的所述变化的所述检测才检测到变化。
13.根据权利要求1-3中的一项所述的设备,其中,所述处理器被配置为如果异常被检测到,则将以下类型中的至少一种指派给所述异常:
-在包括以下各项的子集的物理量的变化的情况下为“细菌生长”类型:氯浓度降低,温度增加,总有机碳含量增加,波长为254nm的紫外线光的吸收率增加,细菌数量增加;
-在包括导电性、pH、温度的子集的物理量的变化的情况下为“水混合物”类型;
-在包括以下各项的子集的所述物理量的变化的情况下为“有色水”类型:氯浓度,pH,颜色增加,浊度增加,波长为254nm的紫外线光的吸收率增加;
-在包括浊度和颗粒的子集中的物理量的异常增加的情况下为超速。
14.根据权利要求1-3中的一项所述的设备,其中,所述处理器被配置为:如果用于检测所述物理量中的至少一个的变化的预先定义的检测规则的输出不允许将类型指派给异常,则将未知类型指派给该异常。
15.根据权利要求1-3中的一项所述的设备,包括接口(250),所述接口用于向操作者显示所述异常及其类型。
16.根据权利要求15所述的设备,其中:
-所述接口被配置为从所述操作者接收与所述异常相关的标签;
-值的时间窗口以及与所述异常相关的所述标签被添加到训练数据中。
17.一种用于检测并表征水连续体中的异常的方法(800),包括:
-接收(810)由所述水连续体中的多个物理量的多个传感器产生的所述多个物理量的测量;
-生成(820)测量的多个时间窗口;
-对于所述多个时间窗口中的每个窗口:
-获得通过在所述时间窗口期间的所述测量的至少一个变换(830)所变换的值的集合;
-检测(840)所述时间窗口的正常状态或异常状态,基于由将所述至少一个变换应用于所述至少一个传感器的先前测量的时间窗口产生的经变换的值的集合,所述检测被参数化;
-根据展现异常状态的时间窗口的数量来检测(850)所述水连续体中的异常;
-执行(860)用于检测所述物理量中的至少一个的变化的预先定义的检测规则的集合;
-在所述水连续体中的异常被检测到时,如果所述物理量的预先定义的子集的量中的至少一个的变化被检测到,则将与所述子集的变化相关联的异常类型指派(870)给所述异常。
18.一种计算机可读介质,其上存储有指令,所述指令在由处理器执行时,使得所述处理器执行包括以下的操作:
-接收由水连续体中的多个物理量的多个传感器产生的所述多个物理量的测量;
-生成测量的多个时间窗口;
-对于所述多个时间窗口中的每个窗口:
-获得通过在所述时间窗口期间的所述测量的至少一个变换所变换的值的集合;
-将异常检测器应用于经变换的值的集合以便检测所述时间窗口的正常状态或异常状态,基于由将所述至少一个变换应用于所述至少一个传感器的先前测量的时间窗口产生的经变换的值的集合,所述异常检测器被参数化;
-根据展现异常状态的时间窗口的数量来检测所述水连续体中的异常;
-执行用于检测所述物理量中的至少一个的变化的预先定义的检测规则的集合;
-在所述水连续体中的异常被检测到时,如果所述物理量的预先定义的子集的量中的至少一个的变化被检测到,则将与所述子集的变化相关联的异常类型指派给所述异常。
CN201880076770.0A 2017-09-29 2018-09-26 对水的连续体中的异常的改进的检测和表征 Active CN111406213B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762565722P 2017-09-29 2017-09-29
US62/565,722 2017-09-29
FR1763286 2017-12-27
FR1763286A FR3071920B1 (fr) 2017-09-29 2017-12-27 Detection et caracterisation ameliorees d'anomalies dans un continuum d'eau
PCT/EP2018/076187 WO2019063648A1 (fr) 2017-09-29 2018-09-26 Detection et caracterisation ameliorees d'anomalies dans un continuum d'eau

Publications (2)

Publication Number Publication Date
CN111406213A CN111406213A (zh) 2020-07-10
CN111406213B true CN111406213B (zh) 2023-09-05

Family

ID=61599429

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880076770.0A Active CN111406213B (zh) 2017-09-29 2018-09-26 对水的连续体中的异常的改进的检测和表征

Country Status (8)

Country Link
US (1) US11680937B2 (zh)
EP (1) EP3688458B1 (zh)
CN (1) CN111406213B (zh)
AU (1) AU2018338684B2 (zh)
CL (1) CL2020000761A1 (zh)
ES (1) ES2938861T3 (zh)
FR (1) FR3071920B1 (zh)
PT (1) PT3688458T (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3083553B1 (fr) 2018-07-09 2023-05-19 Suez Groupe Placement ameliore de capteurs de parametres physico-chimiques dans un fluide
US11212303B1 (en) * 2018-12-28 2021-12-28 Snap Inc. Detecting anomalous resources and events in social data
CA3128957A1 (en) * 2019-03-04 2020-03-03 Bhaskar Bhattacharyya Near real-time detection and classification of machine anomalies using machine learning and artificial intelligence
CN112597425B (zh) * 2020-12-23 2023-04-11 深圳市宏电技术股份有限公司 流速测量数据中异常数据的检测方法、装置、设备及介质
CN117408440B (zh) * 2023-12-15 2024-03-08 湖南蒙拓环境科技有限公司 基于多维传感器的河道排污口污水智能处理方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103718546A (zh) * 2011-07-29 2014-04-09 松下电器产业株式会社 用于通过检测异常来改善站点运营的系统和方法
EP3112960A1 (en) * 2015-06-29 2017-01-04 SUEZ Groupe Combined method for detecting anomalies in a water distribution system
CN106796157A (zh) * 2014-07-25 2017-05-31 苏伊士集团 检测配送网络、特别是饮用水配送网络中的异常的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1581880B1 (en) * 2003-01-07 2018-10-10 Hach Company Classification of deviations in a process
US7866204B2 (en) * 2007-01-31 2011-01-11 The United States Of America As Represented By The Administrator Of The United States Environmental Protection Agency Adaptive real-time contaminant detection and early warning for drinking water distribution systems

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103718546A (zh) * 2011-07-29 2014-04-09 松下电器产业株式会社 用于通过检测异常来改善站点运营的系统和方法
CN106796157A (zh) * 2014-07-25 2017-05-31 苏伊士集团 检测配送网络、特别是饮用水配送网络中的异常的方法
EP3112960A1 (en) * 2015-06-29 2017-01-04 SUEZ Groupe Combined method for detecting anomalies in a water distribution system

Also Published As

Publication number Publication date
ES2938861T3 (es) 2023-04-17
EP3688458A1 (fr) 2020-08-05
PT3688458T (pt) 2023-02-27
FR3071920B1 (fr) 2020-11-06
AU2018338684A1 (en) 2020-04-16
AU2018338684B2 (en) 2023-12-07
US11680937B2 (en) 2023-06-20
EP3688458B1 (fr) 2023-01-25
US20200264151A1 (en) 2020-08-20
CN111406213A (zh) 2020-07-10
FR3071920A1 (fr) 2019-04-05
CL2020000761A1 (es) 2020-11-06

Similar Documents

Publication Publication Date Title
CN111406213B (zh) 对水的连续体中的异常的改进的检测和表征
US20220169533A1 (en) System and a method for comprehensive monitoring, analysis and maintenance of water and equipment in swimming pools
Carstea et al. Continuous fluorescence excitation–emission matrix monitoring of river organic matter
Branisavljević et al. Improved real-time data anomaly detection using context classification
Booker Spatial and temporal patterns in the frequency of events exceeding three times the median flow (FRE3) across New Zealand
Maere et al. Membrane bioreactor fouling behaviour assessment through principal component analysis and fuzzy clustering
JP2019153045A (ja) データ処理装置及びデータ処理方法
Upton et al. Rapid gravity filtration operational performance assessment and diagnosis for preventative maintenance from on-line data
O'Donnell et al. Resistance and resilience of stream metabolism to high flow disturbances
Abdul Wahid et al. Forecasting water quality using seasonal ARIMA model by integrating in-situ measurements and remote sensing techniques in Krishnagiri reservoir, India
Johnson et al. Establishing reference conditions and setting class boundaries
Morello et al. Quality Control (QC) procedures for Australia’s National Reference Station’s sensor data—Comparing semi-autonomous systems to an expert oceanographer
WO2019063648A1 (fr) Detection et caracterisation ameliorees d'anomalies dans un continuum d'eau
Valentin et al. An hybrid neural network based system for optimization of coagulant dosing in a water treatment plant
JP2011253489A (ja) プラント運転監視装置およびシステムならびにプログラム
CN117109665B (zh) 一种河流生态环境数据在线监测方法及系统
Smits et al. Estimating missing values in time series
Ravbar et al. Monitoring the quantitative status and quality of karst water sources
Thompson et al. Drought, disturbance and river resilience in the southern Murray–Darling Basin, Australia
Meador Nutrient Enrichment and Fish Nutrient Tolerance: Assessing Biologically Relevant Nutrient Criteria 1
RU2814957C2 (ru) Способ обнаружения аномалий в установке для обработки воды
Mudliar et al. Machine learning model to predict potential fishing zone
Tett Monitoring for Adaptive Management of Aquaculture
Wahid et al. Corrected Proof
CN118378137A (zh) 排水管网故障确定方法、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230627

Address after: Paris France

Applicant after: DEGREMONT

Address before: Paris France

Applicant before: SUEZ GROUPE

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant