CN113556768B - 传感器数据异常检测方法和系统 - Google Patents
传感器数据异常检测方法和系统 Download PDFInfo
- Publication number
- CN113556768B CN113556768B CN202110706407.6A CN202110706407A CN113556768B CN 113556768 B CN113556768 B CN 113556768B CN 202110706407 A CN202110706407 A CN 202110706407A CN 113556768 B CN113556768 B CN 113556768B
- Authority
- CN
- China
- Prior art keywords
- data
- gateway
- sensing data
- sensor
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/04—Arrangements for maintaining operational condition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/30—Services specially adapted for particular environments, situations or purposes
- H04W4/38—Services specially adapted for particular environments, situations or purposes for collecting sensor information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/70—Services for machine-to-machine communication [M2M] or machine type communication [MTC]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Telephonic Communication Services (AREA)
- Selective Calling Equipment (AREA)
Abstract
本发明提供了一种传感器数据异常检测方法和系统,包括一个节点内的多个传感器、通信模块、数据处理模块、第一网关和服务器,包括:传感器获取第一预设时间段内的传感数据;数据处理模块判断传感数据是否正常;若传感数据正常,则传感器将传感数据通过通信模块发送至第一网关;第一网关根据接收到的节点内的所有传感数据,和预设置的分类器,判断接收到的节点内的所有传感数据是否发生异常;若第一网关接收到的节点内的所有传感数据没有发生异常,则第一网关将接收到的节点内的所有传感数据发送至MQTT服务器。能够从传感器侧和第一网关侧准确检测出传感数据是否发生异常,提高服务和信息反馈的实时性,降低系统的数据传输量和服务器的负载。
Description
技术领域
本发明属于物联网技术领域,尤其涉及一种传感器数据异常检测方法和系统。
背景技术
随着物联网技术飞速发展,以传感器为基础的监测网络被广泛应用于各种环境监测和控制当中,如大棚监控、森林监测、安防监测等。
当前物联网监测体系中,所有的传感器数据都被直接传输到MQTT(MessageQueuing Telemetry Transport,消息队列遥测传输)服务器,通过存在云上的算法对对传感器采集的数据进行分析,由服务器进行异常数据的检测,然而系统中大量的数据上传和处理给MQTT服务器的带宽负载、实时性反馈、计算能力等方面带来了严峻考验。
发明内容
有鉴于此,本发明提供了一种传感器数据异常检测方法和系统,能够提高系统的数据处理效率。
本发明实施例的第一方面提供了一种传感器异常数据检测方法,该方法应用于一种传感器数据异常检测系统,该系统包括一个节点内的多个传感器、所述节点的通信模块、所述节点的数据处理模块、第一网关和消息队列遥测传输MQTT服务器,所述第一网关与所述节点内的多个传感器通过所述通信模块进行通信,且所述第一网关与MQTT服务器通信,该方法包括:
针对所述多个传感器中的任一传感器,所述传感器获取第一预设时间段内的传感数据;
所述数据处理模块判断所述传感数据是否正常;
若所述传感数据正常,则所述传感器将所述传感数据通过所述通信模块发送至所述第一网关;
所述第一网关根据接收到的所述节点内的所有传感数据,和预设置的分类器,判断接收到的所述节点内的所有传感数据是否发生异常;
若所述第一网关接收到的所述节点内的所有传感数据没有发生异常,则所述第一网关将接收到的所述节点内的所有传感数据发送至所述MQTT服务器。
本发明实施例的第二方面提供了一种传感器数据异常检测系统,该系统包括一个节点内的多个传感器、所述节点的通信模块、所述节点的数据处理模块、第一网关和消息队列遥测传输MQTT服务器,所述第一网关与所述节点内的多个传感器通过所述通信模块进行通信,且所述第一网关与MQTT服务器通信,该系统用于实现如上第一方面所述方法的步骤。
本发明实施例提供一种传感器数据异常检测方法和系统,通过在MQTT服务器和传感器之间设置第一网关,使得第一网关位于系统的中间层,相比于MQTT服务器更加贴近物联网终端设备,第一网关能够向终端设备提供本地服务,提高服务及信息反馈的实时性,降低由于终端设备与MQTT服务器的远程交互所带来的时间延时,提高系统的数据处理效率,降低系统整体的数据传输量。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的传感器数据异常检测方法的应用场景图;
图2是本发明实施例提供的传感器数据异常检测方法的实现流程图;
图3是本发明实施例提供的另一种传感器数据异常检测方法的实现流程图;
图4是本发明实施例提供的另一种传感器数据异常检测方法的实现流程图;
图5是本发明实施例提供的一种概率潜在语义分析模型PLSA示意图;
图6是本发明实施例提供的终端、网关或服务器的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图通过具体实施例来进行说明。
当前物联网监测体系中,所有传感器数据都被传输到MQTT(Message QueuingTelemetry Transport,消息队列遥测传输)服务器,由服务器进行数据是否异常的判别,大量数据的上传及计算对服务器的带宽负载和计算能力带来的严重的考验,并且降低了服务器反馈的实时性。
针对这一问题,本申请提供了一种网关,并构建了一种新的传感器数据异常检测系统。图1为本发明实现传感器数据异常检测方法的应用场景图,并示出了本申请所提出的传感器数据异常检测系统,结合图1,该系统包括MQTT服务器,网关、传感器、通信模块和数据处理模块,其中,多个传感器组成一个节点,如图1中所示的节点1、节点2……节点n。一个节点中的所有传感器通过该节点所对应的通信模块与网关进行通信,一个节点中的数据处理模块用于处理该节点中所有传感器的数据,并可以用于该节点内所有其他的需要进行计算和控制的工作。可选的,该数据处理模块可以为一个单片机。一个节点中的传感器可以将传感数据统一的发送至该节点预设置的通信模块,由该通信模块将传感数据发送至该节点对应的网关。
为使实施例的表述更加清楚,在本发明实施例中,仅以服务器、网关、一个节点内的通信模块、数据处理模块和多个传感器作为一个系统进行说明。在实际应用中,节点的数量是海量的,一个网关与多个节点进行通信及数据的处理、传输,本发明实施例对此不再赘述。
基于上述传感器数据异常检测系统,本发明实施例提供一种传感器数据异常检测方法,结合图2,该方法包括:
S101,针对多个传感器中的任一传感器,传感器获取第一预设时间段内的传感数据。
在物联网监测系统中,传感器节点,如图1所示的节点1、节点2……节点n,是整个系统的基础。在监测区域,大量的传感器节点被随机或有组织地投放出去,用以实时感知并采集环境数据。每一个节点都嵌入了温度、湿度、光照强度以及二氧化碳浓度等多个传感器,用以监测环境并实时检测。
在本发明实施例中,以一个传感器节点为例,该节点内的传感器获取同一预设时间段,即第一预设时间段的传感数据。
S102,数据处理模块判断传感数据是否正常。
在大规模物联网监测系统中,数据异常时常发生。造成数据异常的原因有多种,如监测环境中的突发事件和传感器自身的异常。无论是何种原因,数据异常都直接关联环境以及物联网系统自身的安全。因此,需要及时、准确地对数据异常进行检测。
可选的,节点的数据处理模块通过如下方式判断传感数据是否正常:若所述传感数据中存在大于第一预设值的数据,或所述传感数据中存在小于第二预设值的数据,则所述传感数据异常。需要说明的是,任意两个不同类型的传感器,或者任意两个同类型但位于不同环境的传感器,其第一预设值和第二预设值都是针对单个传感器的类型、所处环境等因素单独设置的。
本步骤是对传感器数据是否异常的初步判断,例如,一个固定环境中的温度传感器,若其正常温度不会超过45摄氏度,最低温度不会低于零下20摄氏度,则第一预设值可以设置为45摄氏度,第二预设值可以设置为-20摄氏度。
可选的,另一种判断传感器数据异常的方法是:若所述传感数据中存在第一数据,所述第一数据的值与第二数据的值的比值大于等于第三预设值或小于等于第四预设值,则所述传感器数据异常,其中,所述第二数据为所述传感器采集的所述第一数据的前一个数据。
传感器在第一预设时间段采集一组数据,在这组传感数据中,第二数据为第一数据的前一个数据,若第一数据与第二数据的比值大于等于第三预设值,如第三预设值为110%,或第一数据与第二数据的比值小于等于第四预设值,如第四预设值为90%,则判断第一数据异常,对应的,判断该传感器的数据异常。
需要说明的是,任意两个不同类型的传感器,或者任意两个同类型但位于不同环境的传感器,其第三预设值和第四预设值都是针对单个传感器的类型、所处环境等因素单独设置的。
进一步的,若数据处理模块检测到传感数据发生异常,则通过所述通信模块和所述第一网关,向所述服务器上报异常告警信息,以使得对应的工作人员对该传感器及该传感器所处的环境进行及时的检测。
通过本步骤,从传感器侧降低了系统的数据传输量。降低了对链路负载和服务器负载的要求。
S103,若传感数据正常,则传感器将传感数据通过通信模块发送至第一网关。
在本发明实施例中,第一网关为图1所示的系统中的任一网关。
若数据处理模块检测到传感数据异常,则不向第一网关发送自身的传感数据,而只上报异常告警信息,从而降低了系统的数据传输量。
可选,在本申请中,每个节点所对应的通信模块为超长距低功耗数据传输技术LoRa通信模块,第一网关为LoRaWAN网关。
在众多物联网通信技术中,以太网由于需要额外的布线而难以实现对现有系统的改造,WiFi、ZigBee的无线传输距离较短,通常300米以下,不适合大范围内的大规模应用。因此现有技术大多采用移动数据(4G、NB-IoT等)的方式传输数据,在每一个线路监控节点处安装移动数据模块,将采集的数据直接上传云服务器。然而,现有技术存在以下不足之处:
1)数据流量卡的使用成本较高,尤其是大量线路监控单元的长期使用,会造成大量的运行开支;
2)偏远地区或某些特定区域的移动数据信号覆盖不佳,对物联网系统的铺设和推广带来困难;
3)不同地区尤其是不同国家的移动数据网络制式不同,经常需要针对性开发,不利于标准化的生产和维护。
针对目前采用移动数据流量的物联网系统所存在的不足,本申请提出了基于LoRa无线技术的数据传输解决方案。可选的,在线路监控节点中采用LoRa模块替代移动数据通信模块,实现数据的双向传输。同时,采用LoRaWAN网关,实现与一定区域内的所有节点通信模块的通信,并通过以太网、WiFi或移动数据流量等方式,将这些节点所采集的数据上传至MQTT服务器。采用LoRa技术具有以下优点:
1)无需为每一个节点的通信模块支付流量费用,而且LoRaWAN网关可以采用以太网、WiFi等方式向服务器上传数据,从而节约了大量数据流量费用;
2)传输距离远,理论传输距离可达10km,即使在楼宇、工厂等环境下,考虑信号因阻隔而衰减,也可达到1km,满足覆盖范围需求;而在偏远地区或某些特定区域,通过针对性设计,能满足远距离信号传输的需求;
3)功耗非常低,不会对通信模块的电源模块带来压力;也可以使用通用电池,更换电池周期可达半年以上;
4)不存在制式不兼容的问题。
鉴于LoRa无线技术的上述优点,可以解决物联网系统中使用成本、覆盖范围和制式兼容的问题。
S104,第一网关根据接收到的节点内的所有传感数据,和预设置的分类器,判断接收到的节点内的所有传感数据是否发生异常。
可选的,在第一网关预设置分类器,对接收到的一个节点发送的数据进行分类,判断第一节点发送的数据是否发生异常。
此时,网关判断的目的主要是避免数据传输过程中造成的数据丢失、数据失真的问题。
若网关检测到数据异常,则网关不将该节点的数据上传至MQTT服务器,仅将异常报告发送至服务器,降低了系统数据传输量。
S105,若第一网关接收到的节点内的所有传感数据没有发生异常,则第一网关将接收到的节点内的所有传感数据发送至MQTT服务器。
若第一网关接收到的节点内的所有传感数据没有发生异常,则第一网关将接收到的节点内的所有传感数据发送至MQTT服务器,由服务器对传感数据进行存储和进一步的分析。
本发明实施例提供了一种传感器异常数据检测方法,应用于一种本申请所提出的传感器数据异常检测系统中,由于将第一网关设置于系统的中间层,相比于MQTT服务器更加贴近物联网终端设备,因此,第一网关能够向终端设备提供本地服务,提高服务及信息反馈的实时性,降低由于终端设备与MQTT服务器的远程交互所带来的时间延时。
进一步的,第一网关是分布式、负载均衡的,能够提供数据的初步处理,分流MQTT服务器的计算任务,降低上传至MQTT服务器的数据量,从而达到减轻主干链路带宽负载的目的。
可选的,如图1所示,举例来说,网关1为第一网关,网关2为第二网关,本发明实施例提供的传感器数据异常检测方法还包括:
将第二网关设置为第一网关的备份网关;
若第二网关检测到第一网关发生故障,则第二网关代替第一网关执行第一网关在传感器异常检测系统中的任务;
或者,若第一网关的数据处理量达到第一网关数据处理能力的预设阈值,且第二网关的数据处理量没有达到第二网关数据处理能力的预设阈值,则第二网关代替第一网关执行第一网关在传感器异常检测系统中的任务,直至第一网关的数据处理量低于第一网关数据处理能力的预设阈值。
即,将第一网关和第二网关设置为互相备份的关系,当一个网关故障或处理能力达到上限时,实现两个网关之间的负载均衡,提高系统的整体性能。
进一步的,本发明实施例提供的方法还包括:
第一网关与服务器建立心跳连接,若第一网关检测到与服务器断开连接,则第一网关向服务器发送重新建立连接请求,以使得第一网关与服务器重新建立连接。
通过这种方法,保证网关和服务器之间通信的顺畅。
图3示出了本发明实施例提供的另一种传感器数据异常检测方法的实现流程图,详述如下:
S201,服务器根据第二预设时间段的传感数据,对预设词袋模型进行训练,得到分类器。
在本发明实施例中,基于词袋模型构建分类器。词袋模型是一种人工神经网络模型,用以捕捉和利用环境监测数据自身的空间相关性。之所以采用词袋模型,主要是考虑所监测环境的复杂性,采集的数据虽然具有较强的规律性但可能呈现非简单的线性相关性。词袋模型作为一种神经网络,有能力处理复杂的数据模型,既能够对线性相关的数据进行建模分析,也能够应对非线性相关的数据进行建模分析。
词袋作为一种用于特征提取的人工神经网络模型,模参数的训练具有较高的复杂度,网关难以提供相应的计算能力以及复杂计算所带来的资源消耗,因此,模型的训练过程被部署在MQTT服务器侧进行。
S202,服务器将分类器发送至第一网关。
服务器将分类器训练完成后,将分类器及其相关参数发送至第一网关。
可选的,在系统进入初始化状态时,服务器开始分类器的训练过程,训练完成后将分类器发送至网关,后续系统的正常工作状态时,由网关通过分类器进行节点传感数据是否异常的判定,充分利用了系统中海量网关的计算能力,降低了服务器的负载。进一步的,网关只向服务器发送正常的传感数据,降低了传输链路的负载。
进一步的,结合图4,本发明实施例还提供了一种传感器数据异常检测方法,该方法用于描述服务器对分类器进行训练的过程,该方法包括:
S301,获取M个预设传感器在第二预设时间段的传感数据,其中,M个预设传感器的对应V个传感器类型。
M个预设传感器属于V个类型,例如,传感器的类型可以为温度传感器、湿度传感器、光照传感器等。
S302,根据M个预设传感器在第二预设时间段的传感数据,建立训练集。
M个预设传感器在第二预设时间段的传感数据构成训练集。
S303,通过预设算法对训练集中的数据进行聚类,对每个聚类中心定义一个时空词,获得代码本,其中,每个主题词对应一种传感器类型,每个主题词对应所述代码本中的至少一个时空词。
概率潜在语义模型pLSA(probabilistic Latent Semantic Analysis,概率隐语义分析)适用于容量为V的词汇表,为了学习词汇表中的时空词,假定在训练数据集中,描述符集合对应所有检测到的传感器时空数据。
可选的,可以利用k-means算法和欧氏距离作为聚类尺度来生成代码本。每个聚类的中心定义一个时空词。这样每个传感器检测到的值被划分到唯一的类成员,因而每个传感器类型可以从代码本中找到一个时空词的集合与之对应,每个主题词对应一种传感器类别。
S304,通过概率潜在语义模型PLSA获取训练集中每一组传感数据所对应的时空词。
概率潜在语义模型PLSA是基于双模式和共现的数据分析方法延伸的经典统计学方法。LSA是以共现表(矩阵w,d)的奇异值分解形式实现的,而PLSA是基于派生自LCM的混合矩阵分解,属于概率图模型中的生成模型。
PLSA模型的参数使用最大期望值来进行无监督的学习,挖掘文档集中的主题信息,可以从底层的特征中提取出具有语义的特征。
假设有M(j=1,…,M)数据序列包含词汇表V(1,…,V)个时空词。数据的集合可以表示为V×M的共生表其中m(wi,dj)表示在数据dj出现时空wi的数量,一个潜在的主题变量zk与在数据dj中出现时空词wi相联系。每个主题词对应的一种传感器的类别,如温湿度、照度等传感器。
联合概率P(wi,dj,zk)的图模型由图5表示。在本申请中,d代表数据序列,z是传感器类别、w是时空词。模型的参数使用最大期望值来进行无监督数的学习。
P(dj,wi)=P(dj)P(wi|dj) 式(1)
观察值(dj,wi)假定是独立的,可以忽略主题词zk来获取条件概率P(wi|dj)。
其中P(zk|dj)的概率是主题词zk发生在数据dj中,P(wi|zk)是时空词wi划分为传感器zk的概率。现在有V个主题词。这个模型对每个数据序列作为V个行为种类的凸组合,即通过表面凸组合或行为概率P(wi|zk)得到指定时空词分布P(wi|dj)。使用权重特定因子P(zk|dj)来表示特定的数据。每数据流作为传感器类别建模,由混合柱状图组成特殊数据的柱状图对应传感器种类。然后找到能适应模型直方图P(wi|zk)和混合系数P(zk|dj)来确定传感器种类。为了确定出现在数据中时空词最大可能性概率模型,对目标函数使用最大期望值算法来得到参数的最大相似度估计值:
S305,利用词袋模型对训练集进行学习,得到分类器,分类器的分类结果为数据正常或异常。
从训练序列获得指定传感器类别主题词分布P(w|z),给定一段新数据,这段未被理解的数据通过P(w|z)投射到简单的平面。接着找出混合系数P(zk|dtest),它是位于经验分布和之间的KL收敛。使用最大期望值算法找到最终的答案。分类结果就是通过选择行为分类来最好的解释观察值:
需要说明的是,在物联网监测系统中,异常问题主要是指传感器数据的异常,即在时域或空间域中具有高度规律性的传感器数据中出现不符合规律的数据。造成数据异常的原因有多种,既可能是监测区域的突发事件如森林火灾,也可能是传感器节点自身的异常如硬件模块损坏、节点电量偏低以及无线通信过程中的干扰等。
本发明实施例提供了一种传感器数据异常检测方法,结合PLSA模型和词袋模型判断节点的传感器数据是否异常,提高了判断效率和准确性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
结合图1,本发明实施例还提供了一种传感器数据异常检测系统,该系统包括一个节点内的多个传感器、节点的通信模块、节点的数据处理模块、第一网关和消息队列遥测传输MQTT服务器,第一网关与节点内的多个传感器通过通信模块进行通信,且第一网关与MQTT服务器通信,该系统用于:
针对多个传感器中的任一传感器,传感器获取第一预设时间段内的传感数据;
数据处理模块判断传感数据是否正常;
若传感数据正常,则传感器将传感数据通过通信模块发送至第一网关;
第一网关根据接收到的节点内的所有传感数据,和预设置的分类器,判断接收到的节点内的所有传感数据是否发生异常;
若第一网关接收到的节点内的所有传感数据没有发生异常,则第一网关将接收到的节点内的所有传感数据发送至MQTT服务器。
可选的,该系统中的通信模块为超长距低功耗数据传输技术LoRa通信模块,第一网关为LoRaWAN网关。
可选的,该系统还用于:
若传感数据中存在大于第一预设值的数据,或传感数据中存在小于第二预设值的数据,则传感数据异常;
或,若所述传感数据中存在第一数据,所述第一数据的值与第二数据的值的比值大于等于第三预设值或小于等于第四预设值,则所述传感器数据异常,其中,所述第二数据为所述传感器采集的所述第一数据的前一个数据。
可选的,该系统还用于:
服务器根据第二预设时间段的传感数据,对预设词袋模型进行训练,得到分类器;
服务器将分类器发送至第一网关。
可选的,该系统中的服务器还用于:
获取M个预设传感器在第二预设时间段的传感数据,其中,M个预设传感器的对应V个传感器类型;
根据M个预设传感器在第二预设时间段的传感数据,建立训练集;
通过预设算法对训练集中的数据进行聚类,对每个聚类中心定义一个时空词,获得代码本,其中,每个主题词对应一种传感器类型,每个主题词对应代码本中的至少一个时空词;
通过概率潜在语义模型PLSA获取训练集中每一组传感数据所对应的时空词;
利用词袋模型对训练集进行学习,得到分类器,分类器的分类结果为数据正常或异常。
可选的,该系统还包括第二网关,该系统还用于:
将第二网关设置为第一网关的备份网关;
若第二网关检测到第一网关发生故障,则第二网关代替第一网关执行第一网关在传感器异常检测系统中的任务;
或者,若第一网关的数据处理量达到第一网关数据处理能力的预设阈值,且第二网关的数据处理量没有达到第二网关数据处理能力的预设阈值,则第二网关代替第一网关执行第一网关在传感器异常检测系统中的任务,直至第一网关的数据处理量低于第一网关数据处理能力的预设阈值。
可选的,还系统还用于:
第一网关与服务器建立心跳连接,若第一网关检测到与服务器断开连接,则第一网关向服务器发送重新建立连接请求,以使得第一网关与服务器重新建立连接。
本发明实施例提供了一种传感器数据异常检测系统,由于将第一网关设置于系统的中间层,相比于MQTT服务器更加贴近物联网终端设备,因此,第一网关能够向终端设备提供本地服务,提高服务及信息反馈的实时性,降低由于终端设备与MQTT服务器的远程交互所带来的时间延时。
图6是本发明实施例提供的网关或者服务器中的任一种的示意图。如图6所示,该实施例的终端6包括:处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机程序62。所述处理器60执行所述计算机程序62时实现上述各个传感器数据异常检测方法实施例中的步骤,例如图2所示的步骤101至步骤105。
示例性的,所述计算机程序62可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器61中,并由所述处理器60执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序62在所述终端6中的执行过程。
所述终端6可包括,但不仅限于,处理器60、存储器61。本领域技术人员可以理解,图6仅仅是终端6的示例,并不构成对终端6的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端还可以包括输入输出设备、网络接入设备、总线等。
所称处理器60可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器61可以是所述终端6的内部存储单元,例如终端6的硬盘或内存。所述存储器61也可以是所述终端6的外部存储设备,例如所述终端6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器61还可以既包括所述终端6的内部存储单元也包括外部存储设备。所述存储器61用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个传感器数据异常检测方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种传感器数据异常检测方法,其特征在于,该方法应用于一种传感器数据异常检测系统,该系统包括一个节点内的多个传感器、所述节点的通信模块、所述节点的数据处理模块、第一网关和消息队列遥测传输MQTT服务器,所述第一网关与所述节点内的多个传感器通过所述通信模块进行通信,且所述第一网关与MQTT服务器通信,将第一网关设置于系统的中间层,相比于MQTT服务器更加贴近物联网终端设备,所述第一网关向终端设备提供本地服务,该方法包括:
针对所述多个传感器中的任一传感器,所述传感器获取第一预设时间段内的传感数据;
所述数据处理模块判断所述传感数据是否正常;
若传感数据异常,则不向所述第一网关发送自身的传感数据,只上报异常告警信息;
若所述传感数据正常,则所述传感器将所述传感数据通过所述通信模块发送至所述第一网关;
所述第一网关根据接收到的所述节点内的所有传感数据,和预设置的分类器,判断接收到的所述节点内的所有传感数据是否发生异常;
若所述第一网关接收到的所述节点内的所有传感数据没有发生异常,则所述第一网关将接收到的所述节点内的所有传感数据发送至所述MQTT服务器。
2.根据权利要求1所述的方法,其特征在于,该方法还包括:所述通信模块为超长距低功耗数据传输技术LoRa通信模块,所述第一网关为LoRaWAN网关。
3.根据权利要求1所述的方法,其特征在于,所述数据处理模块判断所述传感数据是否正常包括:
若所述传感数据中存在大于第一预设值的数据,或所述传感数据中存在小于第二预设值的数据,则所述传感数据异常;
或,若所述传感数据中存在第一数据,所述第一数据的值与第二数据的值的比值大于等于第三预设值或小于等于第四预设值,则所述传感器数据异常,其中,所述第二数据为所述传感器采集的所述第一数据的前一个数据。
4.根据权利要求1所述的方法,其特征在于,该方法还包括:
所述服务器根据第二预设时间段的传感数据,对预设词袋模型进行训练,得到所述分类器;
所述服务器将所述分类器发送至所述第一网关。
5.根据权利要求4所述的方法,其特征在于,所述服务器根据第二预设时间段的传感数据,对预设词袋模型进行训练,得到所述分类器包括:
获取M个预设传感器在第二预设时间段的传感数据,其中,M个预设传感器的对应V个传感器类型;
根据所述M个预设传感器在所述第二预设时间段的传感数据,建立训练集;
通过预设算法对所述训练集中的数据进行聚类,对每个聚类中心定义一个时空词,获得代码本,其中,每个主题词对应一种传感器类型,每个主题词对应所述代码本中的至少一个时空词;
通过概率潜在语义模型PLSA获取所述训练集中每一组传感数据所对应的时空词;
利用词袋模型对所述训练集进行学习,得到所述分类器,所述分类器的分类结果为数据正常或异常。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述传感器数据异常检测系统还包括第二网关,该方法还包括:
将所述第二网关设置为所述第一网关的备份网关;
若所述第二网关检测到所述第一网关发生故障,则所述第二网关代替所述第一网关执行所述第一网关在所述传感器异常检测系统中的任务;
或者,若所述第一网关的数据处理量达到所述第一网关数据处理能力的预设阈值,且所述第二网关的数据处理量没有达到所述第二网关数据处理能力的预设阈值,则所述第二网关代替所述第一网关执行所述第一网关在所述传感器异常检测系统中的任务,直至所述第一网关的数据处理量低于所述第一网关数据处理能力的预设阈值。
7.根据权利要求1至5任一项所述的方法,其特征在于,该方法还包括:
所述第一网关与所述服务器建立心跳连接,若所述第一网关检测到与所述服务器断开连接,则所述第一网关向所述服务器发送重新建立连接请求,以使得所述第一网关与所述服务器重新建立连接。
8.一种传感器数据异常检测系统,其特征在于,该系统包括一个节点内的多个传感器、所述节点的通信模块、所述节点的数据处理模块、第一网关和消息队列遥测传输MQTT服务器,所述第一网关与所述节点内的多个传感器通过所述通信模块进行通信,将第一网关设置于系统的中间层,相比于MQTT服务器更加贴近物联网终端设备,所述第一网关向终端设备提供本地服务,且所述第一网关与MQTT服务器通信,该系统用于:
针对所述多个传感器中的任一传感器,所述传感器获取第一预设时间段内的传感数据;
所述数据处理模块判断所述传感数据是否正常;
若传感数据异常,则不向所述第一网关发送自身的传感数据,只上报异常告警信息;
若所述传感数据正常,则所述传感器将所述传感数据通过所述通信模块发送至所述第一网关;
所述第一网关根据接收到的所述节点内的所有传感数据,和预设置的分类器,判断接收到的所述节点内的所有传感数据是否发生异常;
若所述第一网关接收到的所述节点内的所有传感数据没有发生异常,则所述第一网关将接收到的所述节点内的所有传感数据发送至所述MQTT服务器。
9.根据权利要求8所述的系统,其特征在于,该系统中的所述通信模块为超长距低功耗数据传输技术LoRa通信模块,所述第一网关为LoRaWAN网关。
10.根据权利要求8所述的系统,其特征在于,该系统中的数据处理模块用于:
若所述传感数据中存在大于第一预设值的数据,或所述传感数据中存在小于第二预设值的数据,则所述传感数据异常;
或,若所述传感数据中存在第一数据,所述第一数据的值与第二数据的值的比值大于等于第三预设值或小于等于第四预设值,则所述传感器数据异常,其中,所述第二数据为所述传感器采集的所述第一数据的前一个数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110706407.6A CN113556768B (zh) | 2021-06-24 | 2021-06-24 | 传感器数据异常检测方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110706407.6A CN113556768B (zh) | 2021-06-24 | 2021-06-24 | 传感器数据异常检测方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113556768A CN113556768A (zh) | 2021-10-26 |
CN113556768B true CN113556768B (zh) | 2023-04-18 |
Family
ID=78130920
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110706407.6A Active CN113556768B (zh) | 2021-06-24 | 2021-06-24 | 传感器数据异常检测方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113556768B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114338284A (zh) * | 2021-12-24 | 2022-04-12 | 深圳尊悦智能科技有限公司 | 物联网5g智能网关 |
CN115601944B (zh) * | 2022-10-20 | 2024-03-12 | 浙江瑞邦科特检测有限公司 | 具有高准确度的数据监控方法 |
CN115801789B (zh) * | 2023-02-08 | 2023-04-25 | 安徽朋德信息科技有限公司 | 一种物联网数据汇聚系统及方法 |
CN116990203B (zh) * | 2023-09-26 | 2023-12-15 | 天宇利水信息技术成都有限公司 | 基于声光信号融合的水沙通量同步在线监测方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105101277A (zh) * | 2015-09-01 | 2015-11-25 | 中国联合网络通信集团有限公司 | 一种判断监测区域及传感节点异常的方法、装置和系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003333584A (ja) * | 2002-05-16 | 2003-11-21 | Fujitsu Ltd | 監視システム |
CN105450540A (zh) * | 2015-12-14 | 2016-03-30 | 福建星网锐捷网络有限公司 | 一种负载均衡方法、装置及dhcp服务器 |
CN106650617A (zh) * | 2016-11-10 | 2017-05-10 | 江苏新通达电子科技股份有限公司 | 一种基于概率潜在语义分析的行人异常识别方法 |
CN110411554B (zh) * | 2018-04-27 | 2022-04-29 | 华为技术有限公司 | 一种电机设备检测方法、装置及系统 |
CN109459938A (zh) * | 2018-12-13 | 2019-03-12 | 珠海迈科智能科技股份有限公司 | 一种基于ZigBee的安防集控系统 |
CN111526056A (zh) * | 2020-04-28 | 2020-08-11 | 汇智道晟(舟山)科技有限公司 | 一种物联网数据传输方法、网关及物联网系统 |
CN112379214A (zh) * | 2020-10-27 | 2021-02-19 | 广东电网有限责任公司广州供电局 | 一种电网故障的检测方法和装置 |
-
2021
- 2021-06-24 CN CN202110706407.6A patent/CN113556768B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105101277A (zh) * | 2015-09-01 | 2015-11-25 | 中国联合网络通信集团有限公司 | 一种判断监测区域及传感节点异常的方法、装置和系统 |
Non-Patent Citations (1)
Title |
---|
李娜 ; 陈福 ; 朱建明 ; 黄勇峰 ; 张艳梅 ; .MQTT数据交换协议的分析与优化.网络空间安全.2019,(第09期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN113556768A (zh) | 2021-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113556768B (zh) | 传感器数据异常检测方法和系统 | |
CN103246265B (zh) | 机电设备检测维护方法 | |
KR102695216B1 (ko) | 스마트 공장의 데이터 취합 및 모니터링 시스템 | |
CN109657003A (zh) | 一种将硬件数据直接接入大数据平台的方法 | |
CN104883278A (zh) | 一种利用机器学习对网络设备进行分类的方法 | |
WO2020134361A1 (zh) | 变电站二次设备状态评估方法、系统及设备 | |
CN102568053A (zh) | 综合车辆故障检测系统的车载端及其数据处理方法 | |
US20220414526A1 (en) | Intelligent fault detection system | |
CN112684301B (zh) | 一种电网故障的检测方法和装置 | |
Meenakshi et al. | Wireless Sensor Networks for Disaster Management and Emergency Response using SVM Classifier | |
CN113313280B (zh) | 云平台的巡检方法、电子设备及非易失性存储介质 | |
CN104820414A (zh) | 一种高压电力无线网络监控与报警定位系统 | |
CN107579858A (zh) | 云主机的告警方法及装置、通信系统 | |
CN207408770U (zh) | 通用物联网集中监控系统 | |
TW202306347A (zh) | 基站運行的健康管理方法、裝置及計算機可讀存儲介質 | |
CN114186969A (zh) | 基于数字孪生的智慧园区故障预警平台 | |
CN110148290A (zh) | 智能感知矿山安全生产预警与防控监管信息化大数据系统 | |
CN106195247B (zh) | 一种基于大数据管理模式的变速器控制系统 | |
CN105447518A (zh) | 一种基于K-means遥测数据判读系统 | |
Kong et al. | Sensor anomaly detection in the industrial internet of things based on edge computing | |
CN110646030A (zh) | 一种用于人防设备维护的监测方法及系统 | |
CN106292610B (zh) | 智能家居控制系统 | |
Chu et al. | The research of Wireless Edge Computing Gateway with Anomaly Detection | |
CN203120069U (zh) | 一种视频质量检测装置及系统 | |
CN114372500A (zh) | 一种基于大数据的智能工厂控制系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |