CN111858111A - 数据分析的方法、设备和计算机程序产品 - Google Patents

数据分析的方法、设备和计算机程序产品 Download PDF

Info

Publication number
CN111858111A
CN111858111A CN201910340141.0A CN201910340141A CN111858111A CN 111858111 A CN111858111 A CN 111858111A CN 201910340141 A CN201910340141 A CN 201910340141A CN 111858111 A CN111858111 A CN 111858111A
Authority
CN
China
Prior art keywords
data
sensor
target
determining
sensors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910340141.0A
Other languages
English (en)
Inventor
林蓁蓁
吴鹏飞
陈思
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EMC Corp
Original Assignee
EMC IP Holding Co LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EMC IP Holding Co LLC filed Critical EMC IP Holding Co LLC
Priority to CN201910340141.0A priority Critical patent/CN111858111A/zh
Priority to US16/536,599 priority patent/US11494282B2/en
Publication of CN111858111A publication Critical patent/CN111858111A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/251Fusion techniques of input or preprocessed data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • H04L67/125Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks involving control of end-device applications over a network

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)

Abstract

本公开的实施例涉及数据分析的方法、设备和计算机程序产品。该方法包括:响应于在第一时刻从目标传感器接收目标数据,基于与目标传感器相邻的临近传感器的位置信息和从临近传感器接收到最新数据的第二时刻,确定一个或多个参考传感器;基于从一个或多个参考传感器获取的历史传感器数据,确定一个或多个参考传感器在第一时刻的参考估计数据;基于参考估计数据,确定目标传感器在第一时刻的目标估计数据;以及基于目标数据和目标估计数据,检测目标数据的异常。通过这样的方式,可以高效且准确的检测传感器数据的异常。

Description

数据分析的方法、设备和计算机程序产品
技术领域
本公开的实施例涉及计算机领域,并且更具体地,涉及数据分析的方法、设备和计算机程序产品。
背景技术
近年来,随着计算机技术的发展,物联网已经越来越多地应用到人们生活中的各个方面。物联网技术中的一个核心是对于传感器(例如,温度传感器、位置传感器、图像传感器等)所获得的数据的分析,这些传感器数据可以有利地帮助人们进行预警或者预测等。然而,这样的传感器数据往往是海量的。因而,如何高效地对物联网中的海量传感器数据进行分析已经成为当前的一个关注焦点。
发明内容
本公开的实施例提供一种用于数据分析的方案。
根据本公开的第一方面,提出了一种用于数据分析的方法。该方法包括:响应于在第一时刻从目标传感器接收目标数据,基于与目标传感器相邻的临近传感器的位置信息和从临近传感器接收到最新数据的第二时刻,确定一个或多个参考传感器;基于从一个或多个参考传感器获取的历史传感器数据,确定一个或多个参考传感器在第一时刻的参考估计数据;基于参考估计数据,确定目标传感器在第一时刻的目标估计数据;以及基于目标数据和目标估计数据,检测目标数据的异常。
根据本公开的第二方面,提出了一种用于数据分析的设备。该设备包括:至少一个处理单元;至少一个存储器,该至少一个存储器被耦合到该至少一个处理单元并且存储用于由该至少一个处理单元执行的指令,该指令当由该至少一个处理单元执行时,使得该设备执行动作,该动作包括:响应于在第一时刻从目标传感器接收目标数据,基于与目标传感器相邻的临近传感器的位置信息和从临近传感器接收到最新数据的第二时刻,确定一个或多个参考传感器;基于从一个或多个参考传感器获取的历史传感器数据,确定一个或多个参考传感器在第一时刻的参考估计数据;基于参考估计数据,确定目标传感器在第一时刻的目标估计数据;以及基于目标数据和目标估计数据,检测目标数据的异常。
在本公开的第三方面,提供了一种计算机程序产品。该计算机程序产品被存储在非瞬态计算机存储介质中并且包括机器可执行指令,该机器可执行指令在设备中运行时使该设备执行根据本公开的第一方面所描述的方法的任意步骤。
提供发明内容部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或必要特征,也无意限制本公开的范围。
附图说明
通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。
图1图示了本公开实施例可以在其中被实施的环境的示意图;
图2图示了根据本公开实施例的数据分析的过程的流程图;
图3图示了根据本公开实施例的确定参考传感器的示意图;
图4图示了根据本公开实施例的确定参考传感器的过程的流程图;
图5图示了根据本公开实施例的确定目标估计数据的过程的流程图;以及
图6图示了可以用来实施本公开内容的实施例的示例设备的示意性框图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
在一个全连接的物联网系统中,可能存在大量的传感器。对这些传感器产生的海量传感器数据的处理需要强大的计算能力,单纯地依靠云计算设备的计算可能不足以满足计算能力的需求。一些传统的方案通过在云计算设备与传感器之间设立了边缘计算设备,并通过边缘计算设备承担一部分的计算任务,例如,数据预处理、异常数据检测等。
图1示出了本公开实施例可以在其中被实施的环境100的示意图。如图1所示,环境100包括计算设备115、一个或多个传感器105-1、105-2、105-3、105-4…105-N(单独地或统一称为传感器105)和云端计算设备120。在一些实施例中,计算设备115可以是边缘服务器,其被配置为从一个或多个传感器105接收传感器数据110-1、110-2、110-3、110-4…110-N(单独地或统一称为传感器数据110),并进行数据预处理、异常数据监测等操作。经处理后的数据可以被发送到云端计算设备120以进一步处理。应当理解,图1中所示的传感器的数目仅是示意性的,而不应当被理解为对本申请方案的限制。可以采用任何合适的数目的传感器。
在一些传统的方案中,计算设备115(例如,边缘服务器)通常利用机器学习等方法来检测从一个或多个传感器105处接收的传感器数据110的异常。这样的计算方法往往需要大量的计算量,因此难以满足实时检测数据异常的需求。然而,在物联网技术中,快速且高效地检测传感器数据异常已经变得越来越重要。例如,在利用速度传感器检测车辆运行状态的场景中,快速地检测异常速度以预测可能的车祸是一项非常重要的应用。
根据本公开的实施例,提供了一种数据分析的方案。在该方案中,当在第一时刻从目标传感器接收目标数据时,可以基于与目标传感器相邻的临近传感器的位置信息和从临近传感器接收到最新数据的第二时刻来确定一个或多个参考传感器。随后,可以进一步基于从一个或多个参考传感器获取的历史传感器数据来确定一个或多个参考传感器在第一时刻的参考估计数据。该参考估计数据可以用于确定目标传感器在第一时刻的目标估计数据,并且根据目标数据和目标估计数据来检测目标数据的异常。通过利用目标传感器周围的参考传感器的历史传感器数据来确定目标传感器的数据是否发生异常,本公开的实施例既能够减少确定数据异常所需的计算量,还能够更为准确地确定数据异常。
下文将参考图2至图4来描述根据本公开实施例的数据分析的过程。图2示出了根据本公开的一些实施例的数据分析的过程200的流程图。过程200可以由图1中的计算设备115(例如,边缘服务器)来实现。为了方便讨论,以下将结合图1来描述检测来自目标传感器105-1的传感器数据110-1的异常的过程200。
在框202,响应于在第一时刻从目标传感器105-1接收目标数据110-1,计算设备115基于与目标传感器105-1相邻的临近传感器的位置信息和从临近传感器接收到最新数据的第二时刻来确定一个或多个参考传感器。以下将结合图3和图4来描述框202的过程,图3示出了根据本公开实施例的确定参考传感器的示意图300。如图3所示,图3示出了目标传感器105-1和一个或多个临近传感器105-2、105-3和105-4在空间中的示例分布,其中临近传感器105-2、105-3和105-4可以指其位置与目标传感器105-1的位置之间的距离小于预定距离阈值的传感器。
在一些实施例中,计算设备115可以基于环境110中所包括的一个或多个传感器105的位置信息来确定与目标传感器105-1相邻的临近传感器105-2、105-3和105-4。例如,一个或多个传感器105的位置信息可以被预先地存储在预定的存储设备中,计算设备115可以从存储设备中读取相关联的位置信息来确定一个多个临近传感器105-2、105-3和105-4。作为另一示例,一个或多个传感器105的位置信息也可以被包含在发送到计算设备115的传感器数据110中,计算设备115可以从传感器数据110中提取相关联的位置信息,以确定一个多个临近传感器105-2、105-3和105-4。
备选地,用于指示目标传感器105-1的一个或多个临近传感器的信息(例如,传感器的标识信息)可以被预先地存储在预定的存储设备中,计算设备105可以从存储设备中读取该信息以确定一个或多个临近传感器105-2、105-3和105-4。基于这样的方式,可以进一步减少确定临近传感器所需要的计算量。在该实施例中,一个或多个临近传感器105-2、105-3和105-4到目标传感器105-1的距离也可以预先地被存储。
在运行过程中,计算设备115在第一时刻(为了方便描述,表述为T1)从目标传感器105-1接收目标数据110-1,并分别在时刻T2、T3和T4(为了方便描述,称为第二时刻)从临近传感器105-2、105-3和105-4接收到了最新的传感器数据110-2、110-3和110-4。在一些实施例中,时间信息T1、T2、T3和/或T4可以被包含在被传输到计算设备115的传感器数据110中。在一些实施例中,计算设备115也可以记录接收到传感器数据110的对应时间(T1、T2、T3和/或T4),并将其存储在预定的存储设备中。
在获取一个或多个临近传感器105-2、105-3和105-4的位置信息(例如,空间坐标和/或到目标传感器105的绝对距离)以及相应的第二时刻信息T2、T3和T4后,计算设备115可以从一个活多个临近传感器105-2、105-3和105-4中确定一个或多个参考传感器,以用于确定目标数据110-1是否异常。在一个示例中,计算设备115可以将临近传感器105-2、105-3和105-4到目标传感器105-1的距离与预定的距离阈值进行比较,并将第二时刻T2、T3和T4与第一时刻T1之间的时间差与预定的时间阈值进行比较。计算设备115可以选取距离小于预定的距离阈值、且时间差小于时间阈值的临近传感器来作为参考传感器。应当理解,距离阈值和时间阈值的设置可以基于传感器的类型而适应性地设置。例如,对于采样周期比较长的传感器,时间阈值可以相对的较大;而对于采样周期比较短的传感器,时间与之可以相应地被设置为更小的值。通过这样的方式,计算设备115可以确定出既与目标传感器105-1空间上接近,又与获取目标数据110-1的时刻T1时间上接近的参考传感器。
在另一实施例中,还可以基于距离与时间差的加权来确定一个或多个参考传感器。具体地,以下将结合图4来详细描述根据本公开实施例的确定参考传感器的过程202的流程图。
如图4所示,在框402,计算设备115确定临近传感器105-2、105-3和105-4到目标传感器105-1的距离。如上文所描述的,计算设备115可以从存储设备中获取被预先地存储的距离信息,或者,计算设备115也可以基于位置信息来确定对应的距离。
在框404,计算设备115确定第二时刻T2、T3和T4与第一时刻T1的时间差。如上文所描述的,指示第二时刻T2、T3和T4的信息可以被存储在预定的存储设备中,计算设备110可以在接收到目标数据110-1的第一时刻T1从存储设备中读取指示第二时刻T2、T3和T4的信息。
在框406,计算设备115基于距离和时间差的加权和来确定一个或多个参考传感器。具体地,计算设备115可以分别为距离和时间差设置相应的加权系数。应当理解,加权系数可以基于传感器的类型而被适应性地设置。这样的加权系数还可以根据实际使用而被人工地修正或调整,以确定能够更为准确地确定目标数据110-1的异常的参考传感器。
例如,在图3的示例中,临近传感器105-2、105-3和105-4到目标传感器105-1的距离分别为D1、D2和D3,而第二时刻T2、T3和T4与第一时刻T1的时间差分为t1、t2和t3,其中预先设定规定距离权重为α,而时间差的权重为β。计算设备115可以进一步将距离与时间差的加权和与预定的阈值进行比较,并选择加权和小于阈值的临近传感器作为参考传感器。基于这样的方式,计算设备115可以确定在时间与空间上均与目标传感器105-1相似的传感器。例如,图3中的临近传感器105-3与目标传感器105-1的距离D2为最小,但其时间差t2较大,这样的传感器可能并不适合用于后续预测目标传感器的值,因为从其获得历史传感器数据可能不具有参考价值。类似地,图3中的临近传感器105-4与目标传感器105-1时间差t3最小,但其距离D3较远,这样的传感器可能并不适合用于后续预测目标传感器的值,因为从其获得历史传感器数据可能不能够准确地表征目标传感器105-1。
进一步地,为了保证目标传感器105-1的参考传感器的分布较为平均,在一些实施例中,计算设备115可以首先确定位于目标传感器的不同方向的多组临近传感器。以图3作为示例,计算设备115可以以目标传感器105的位置作为坐标系的原点,并将相邻的临近传感器按照象限分成8组临近传感器。
计算设备115还可以基于上文所描述的确定参考传感器的方法来从多组临近传感器中的每一组临近传感器中选择至多预定数目的参考传感器。例如,可以规定每组临近传感器中至多选择2个参考传感器。作为示例,当通过框406在一组临近传感器中有多个满足阈值条件时,计算设备115可以选择加权和排名前2的临近传感器作为参考传感器。基于这样的方式,在保证参考传感器在空间上分布较为均匀的同时,又可以避免参考传感器选择过多而带来的过大计算量。
继续参考图2,在框204,计算设备115基于从一个或多个参考传感器获取的历史传感器数据来确定一个或多个参考传感器在第一时刻的参考估计数据。继续以图3作为示例,例如,计算设备115可以确定参考传感器为传感器105-2和传感器105-3。在一些实施例中,与参考传感器105-2和105-3相关联的历史传感器数据可以被预先地存储,例如被存储在如1所示的历史传感器数据存储设备125中。
在一些示例中,历史传感器数据可以包括一段时间(例如,一个月)内从参考传感器105-2和105-3所接收的所有传感器数据。进一步地,计算设备105可以例如从历史传感器数据存储设备125中读取历史传感器数据,并可以例如基于在该时间段内的一天中与第一时刻T1相对应的时刻处的历史传感器数据来确定参考估计数据。例如,第一时刻T1为3月2日的12:00,计算设备115可以例如从参考传感器105-2和105-3在3月1日的12:00附近的历史传感器数据作为参考估计数据。作为另一示例,计算设备115可以例如获取3月2日前一周在12:00附近的历史传感器数据,并求平均值,以作为参考估计数据。
在另一个示例中,计算设备115可以将历史传感器数据中的至少一项和第二时刻输入到预测模型以确定参考估计数据,其中预测模型基于历史传感器数据和与历史传感器数据相关联的接收时刻而被训练。应当理解,可以采用本领域公知的模型训练技术来构建基于历史传感器数据来预测未来某一时刻的传感器数据的模型,在此不再详细描述。
在又一个示例中,计算设备115还可以利用卡尔曼滤波器以基于历史传感器数据来确定参考估计数据。具体地,计算设备115可以利用卡尔曼滤波器来建立针对参考传感器105-2和105-3的传感器数据随时间变化的更新方程,计算设备115可以利用该更新方程以及在第二时刻所获得的传感器数据来预测第一时刻的参考估计数据。基于这样的方式,计算设备115不用存储针对参考传感器105-2和105-3的任何历史传感器数据,因为这样的历史传感器数据将被体现为卡尔曼滤波器中的更新方程,从而极大地减少了需要存储的数据量。
继续参考图2,在框206,计算设备115基于参考估计数据来确定目标传感器在第一时刻的目标估计数据。继续图3的示例,例如,在确定了参考传感器105-2和105-3在第一时刻的参考估计数据后,计算设备115可以进一步基于参考传感器数据来预测目标传感器105-1在第一时刻的目标估计数据。例如,可以简单地将参考估计数据的平均值以作为目标估计数据。
在一些实施例中,计算设备115还可以进一步考虑距离对于预测目标估计数据的影响。以下将结合图5来描述框206的具体过程,图5图示了根据本公开实施例的确定目标估计数据的过程206的流程图。
如图5所示,在框502,计算设备115基于一个或多个参考传感器中第一参考传感器到目标传感器的第一距离,确定与第一传感器相关联的第一权重。在框504,计算设备115基于一个或多个参考传感器中第二参考传感器到目标传感器的第二距离,确定与第二传感器相关联的第二权。在一些实施例中,与参考传感器相关联的权重可以被确定距离的倒数与全部倒数和的比。例如,在仅有第一参考传感器和第二参考传感器的示例中,第一权重可以被表示为(1/第一距离)/((1/第一距离)+(1/第二距离)),而第二权重可以被表示为(1/第二距离)/((1/第一距离)+(1/第二距离))。应当理解,这样的权重设置方式仅是示意性的,还可以采用本领域任何适当的权重设置方法。
在框506,计算设备115基于第一参考传感器的第一参考估计数据和针对第二参考传感器的第二参考估计数据的加权和来确定目标估计数据。具体地,在仅有第一参考传感器和第二参考传感器的示例中,目标估计数据可以被确定为(第一参考估计数据*第一权重+第二参考估计数据*第二权重)。基于这样的方式,计算设备115可以进一步地考虑到各个参考传感器到目标传感器105-1的距离,从而提高对于目标估计数据的预测准确度。
在又一实施例中,计算设备115可以采用例如线性拟合等技术来基于参考传感器的参考估计数据来确定目标传感器105-1的目标估计数据。例如,以传感器为温度传感器作为示例,可以建立传感器位置与传感器温度读数之间的线性拟合,并基于该线性拟合和目标温度传感器的位置来确定目标温度传感器的估计读数。
继续参考图2,在框208,计算设备115基于目标数据和目标估计数据来检测目标数据110-1的异常。在一些实施例中,计算设备115可以将目标数据110-1与所确定的目标估计数据进行比较。响应于目标数据110-1和目标估计数据的差异大于预定的差异阈值,计算设备115可以确定目标数据110-1存在异常。
在又一实施例中,计算设备115还可以利用机器学习模型来处理目标数据110-1和目标估计数据,以检测目标数据110-1的异常,其中机器学习模型基于历史的传感器数据、传感器估计数据和传感器数据是否异常而被训练。例如,在使用过程中,计算设备115可以存储所获得的目标估计数据、目标数据110-1以及经人工标注的是否异常的指示,这样的数据可以用于训练机器学习模型以使得经训练的机器学习模型具有从目标数据110-1和目标估计数据中预测是否目标估计数据110-1是否异常的能力。基于这样的方式,随着处理所积累的历史数据越来越多,机器学习模型将越来越准确,从而能够获得更为准确的异常数据检测结果。
附加地,在确定了目标数据110-1存在异常后,计算设备115可以提供关于目标数据110-1的异常的指示。例如,在利用温度传感器检测环境温度的示例中,当基于周围的临近传感器所确定的预测数据指示当前的温度数据异常时,计算设备115可以提供关于该异常的告警,以使得工程人员可以确认该温度传感器是否存在故障,或者是否存在被数据入侵(例如,篡改数据)的风险。
备选地,在确定了目标数据110-1存在异常后,计算设备115可以过滤掉目标数据110-1,而不再处理该目标数据,例如,不再向云计算设备120发送该目标数据110-1。基于这样的方式,异常的无效数据可以被有效地排除,从而减少了计算量。
根据本公开的方案,可以利用与目标传感器在空间与时间上临近的传感器的数据来预测目标传感器的估计值,从而确定目标传感器的目标数据是否异常。基于这样的方式,可以提高了预测目标传感器数据的速度与准确性,从而能够更为高效且准确地判定目标传感器的数据是否异常,大大减少了确定数据异常所需的计算量。
图6示出了可以用来实施本公开内容的实施例的示例设备600的示意性框图。例如,如图1所示的计算设备120可以由设备600来实施。如图所示,设备600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的计算机程序指令或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序指令,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
上文所描述的各个过程和处理,例如方法200,可由处理单元601执行。例如,在一些实施例中,方法200可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序被加载到RAM 603并由CPU 601执行时,可以执行上文描述的方法200的一个或多个动作。
本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施方式,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施方式。在不偏离所说明的各实施方式的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施方式的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施方式。

Claims (19)

1.一种数据分析的方法,包括:
响应于在第一时刻从目标传感器接收目标数据,基于与所述目标传感器相邻的临近传感器的位置信息和从所述临近传感器接收到最新数据的第二时刻,确定一个或多个参考传感器;
基于从所述一个或多个参考传感器获取的历史传感器数据,确定所述一个或多个参考传感器在所述第一时刻的参考估计数据;
基于所述参考估计数据,确定所述目标传感器在所述第一时刻的目标估计数据;以及
基于所述目标数据和所述目标估计数据,检测所述目标数据的异常。
2.根据权利要求1所述的方法,其中确定所述一个或多个参考传感器包括:
确定所述临近传感器到所述目标传感器的距离;
确定所述第二时刻与所述第一时刻的时间差;以及
基于所述距离和所述时间差的加权和,确定所述一个或多个参考传感器。
3.根据权利要求1所述的方法,其中确定所述一个或多个参考传感器包括:
确定位于所述目标传感器的不同方向的多组临近传感器;以及
从所述多组临近传感器中的每一组临近传感器中选择至多预定数目的参考传感器。
4.根据权利要求1所述的方法,其中确定所述参考估计数据包括:
利用卡尔曼滤波器以基于所述历史传感器数据来确定所述参考估计数据。
5.根据权利要求1所述的方法,其中确定所述参考估计数据包括:
将所述历史传感器数据中的至少一项和所述第二时刻输入到预测模型以确定所述参考估计数据,其中所述预测模型基于所述历史传感器数据和与所述历史传感器数据相关联的接收时刻而被训练。
6.根据权利要求1所述的方法,其中确定所述目标估计数据包括:
基于所述一个或多个参考传感器中第一参考传感器到所述目标传感器的第一距离,确定与所述第一传感器相关联的第一权重;
基于所述一个或多个参考传感器中第二参考传感器到所述目标传感器的第二距离,确定与所述第二传感器相关联的第二权重;以及
基于所述第一参考传感器的第一参考估计数据和针对所述第二参考传感器的第二参考估计数据的加权和来确定所述目标估计数据。
7.根据权利要求1所述的方法,其中检测所述目标数据的所述异常包括:
响应于所述目标数据和所述目标估计数据的差异大于预定的差异阈值,确定所述目标数据存在异常。
8.根据权利要求1所述的方法,其中检测所述目标数据的所述异常包括:
利用机器学习模型来处理所述目标数据和所述目标估计数据,以检测所述目标数据的异常,其中所述机器学习模型基于历史的传感器数据、传感器估计数据和传感器数据是否异常而被训练。
9.根据权利要求1所述的方法,还包括:
响应于确定所述目标数据存在所述异常,提供关于所述异常的指示。
10.一种用于数据分析的设备,包括:
至少一个处理单元;
至少一个存储器,所述至少一个存储器被耦合到所述至少一个处理单元并且存储用于由所述至少一个处理单元执行的指令,所述指令当由所述至少一个处理单元执行时,使得所述设备执行动作,所述动作包括:
响应于在第一时刻从目标传感器接收目标数据,基于与所述目标传感器相邻的临近传感器的位置信息和从所述临近传感器接收到最新数据的第二时刻,确定一个或多个参考传感器;
基于从所述一个或多个参考传感器获取的历史传感器数据,确定所述一个或多个参考传感器在所述第一时刻的参考估计数据;
基于所述参考估计数据,确定所述目标传感器在所述第一时刻的目标估计数据;以及
基于所述目标数据和所述目标估计数据,检测所述目标数据的异常。
11.根据权利要求10所述的设备,其中确定所述一个或多个参考传感器包括:
确定所述临近传感器到所述目标传感器的距离;
确定所述第二时刻与所述第一时刻的时间差;以及
基于所述距离和所述时间差的加权和,确定所述一个或多个参考传感器。
12.根据权利要求10所述的设备,其中确定所述一个或多个参考传感器包括:
确定位于所述目标传感器的不同方向的多组临近传感器;以及
从所述多组临近传感器中的每一组临近传感器中选择至多预定数目的参考传感器。
13.根据权利要求10所述的设备,其中确定所述参考估计数据包括:
利用卡尔曼滤波器以基于所述历史传感器数据来确定所述参考估计数据。
14.根据权利要求10所述的设备,其中确定所述参考估计数据包括:
将所述历史传感器数据中的至少一项和所述第二时刻输入到预测模型以确定所述参考估计数据,其中所述预测模型基于所述历史传感器数据和与所述历史传感器数据相关联的接收时刻而被训练。
15.根据权利要求10所述的设备,其中确定所述目标估计数据包括:
基于所述一个或多个参考传感器中第一参考传感器到所述目标传感器的第一距离,确定与所述第一传感器相关联的第一权重;
基于所述一个或多个参考传感器中第二参考传感器到所述目标传感器的第二距离,确定与所述第二传感器相关联的第二权重;以及
基于所述第一参考传感器的第一参考估计数据和针对所述第二参考传感器的第二参考估计数据的加权和来确定所述目标估计数据。
16.根据权利要求10所述的设备,其中检测所述目标数据的所述异常包括:
响应于所述目标数据和所述目标估计数据的差异大于预定的差异阈值,确定所述目标数据存在异常。
17.根据权利要求10所述的设备,其中检测所述目标数据的所述异常包括:
利用机器学习模型来处理所述目标数据和所述目标估计数据,以检测所述目标数据的异常,其中所述机器学习模型基于历史的传感器数据、传感器估计数据和传感器数据是否异常而被训练。
18.根据权利要求10所述的设备,所述动作还包括:
响应于确定所述目标数据存在所述异常,提供关于所述异常的指示。
19.一种计算机程序产品,所述计算机程序产品被存储在非瞬态计算机存储介质中并且包括机器可执行指令,所述机器可执行指令在设备中运行时使所述设备执行根据权利要求1至9中的任一项所述的方法。
CN201910340141.0A 2019-04-25 2019-04-25 数据分析的方法、设备和计算机程序产品 Pending CN111858111A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910340141.0A CN111858111A (zh) 2019-04-25 2019-04-25 数据分析的方法、设备和计算机程序产品
US16/536,599 US11494282B2 (en) 2019-04-25 2019-08-09 Method, device and computer program product for sensor data analysis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910340141.0A CN111858111A (zh) 2019-04-25 2019-04-25 数据分析的方法、设备和计算机程序产品

Publications (1)

Publication Number Publication Date
CN111858111A true CN111858111A (zh) 2020-10-30

Family

ID=72916549

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910340141.0A Pending CN111858111A (zh) 2019-04-25 2019-04-25 数据分析的方法、设备和计算机程序产品

Country Status (2)

Country Link
US (1) US11494282B2 (zh)
CN (1) CN111858111A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743769A (zh) * 2021-08-30 2021-12-03 广东电网有限责任公司 数据安全检测方法、装置、电子设备及存储介质
CN114088128A (zh) * 2021-11-22 2022-02-25 中国联合网络通信集团有限公司 一种传感器确定方法、装置、存储介质及设备
CN114577399A (zh) * 2022-01-18 2022-06-03 潍柴动力股份有限公司 发动机漏气检测方法及检测装置
CN115388931A (zh) * 2022-10-27 2022-11-25 河北省科学院应用数学研究所 传感器异常数据的可信监测方法、监测终端及存储介质
CN115457756A (zh) * 2021-06-09 2022-12-09 中移系统集成有限公司 传感器校准的方法及装置
CN116456458A (zh) * 2023-01-12 2023-07-18 广州世炬网络科技有限公司 基于设备传感器辅助定位方法及装置
CN117313019A (zh) * 2023-11-29 2023-12-29 广州汇通国信科技有限公司 一种基于深度强化学习的数据异常检测方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112486384B (zh) * 2020-11-27 2022-12-20 万翼科技有限公司 审图处理方法及相关装置
CN114581966A (zh) 2020-11-30 2022-06-03 伊姆西Ip控股有限责任公司 用于信息处理的方法、电子设备和计算机程序产品
TWI777317B (zh) * 2020-11-30 2022-09-11 智慧貼紙股份有限公司 多點量測系統及其方法
CN113569920B (zh) * 2021-07-06 2024-05-31 上海顿飞信息科技有限公司 基于自动编码的第二近邻异常检测方法
CN116502197A (zh) 2022-01-19 2023-07-28 戴尔产品有限公司 计算机实现的方法、设备和计算机程序产品
CN117952142B (zh) * 2024-03-14 2024-06-11 辽宁艾特斯智能交通技术有限公司 Cpc卡片数量检测装置及cpc卡片数量的检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268422A (zh) * 2014-10-10 2015-01-07 浪潮集团有限公司 一种采用最近邻算法的超声波距离传感器阵列误差修正方法
CN105978848A (zh) * 2015-12-04 2016-09-28 乐视致新电子科技(天津)有限公司 一种收集传感器数据的处理方法和装置
CN108369551A (zh) * 2015-11-19 2018-08-03 西门子股份公司 多个相关传感器的异常检测

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7873673B2 (en) * 2007-03-02 2011-01-18 Samsung Electronics Co., Ltd. Method and system for data aggregation in a sensor network
WO2016036612A1 (en) * 2014-09-04 2016-03-10 Pcms Holdings, Inc. System and methods for sensor node localization and sensor network organization based on contextual event detection
JP2018174448A (ja) * 2017-03-31 2018-11-08 富士通株式会社 通信装置、データ取得システム、データ取得制御方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268422A (zh) * 2014-10-10 2015-01-07 浪潮集团有限公司 一种采用最近邻算法的超声波距离传感器阵列误差修正方法
CN108369551A (zh) * 2015-11-19 2018-08-03 西门子股份公司 多个相关传感器的异常检测
CN105978848A (zh) * 2015-12-04 2016-09-28 乐视致新电子科技(天津)有限公司 一种收集传感器数据的处理方法和装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115457756A (zh) * 2021-06-09 2022-12-09 中移系统集成有限公司 传感器校准的方法及装置
CN113743769A (zh) * 2021-08-30 2021-12-03 广东电网有限责任公司 数据安全检测方法、装置、电子设备及存储介质
CN114088128A (zh) * 2021-11-22 2022-02-25 中国联合网络通信集团有限公司 一种传感器确定方法、装置、存储介质及设备
CN114088128B (zh) * 2021-11-22 2023-11-17 中国联合网络通信集团有限公司 一种传感器确定方法、装置、存储介质及设备
CN114577399A (zh) * 2022-01-18 2022-06-03 潍柴动力股份有限公司 发动机漏气检测方法及检测装置
CN115388931A (zh) * 2022-10-27 2022-11-25 河北省科学院应用数学研究所 传感器异常数据的可信监测方法、监测终端及存储介质
CN115388931B (zh) * 2022-10-27 2023-02-03 河北省科学院应用数学研究所 传感器异常数据的可信监测方法、监测终端及存储介质
CN116456458A (zh) * 2023-01-12 2023-07-18 广州世炬网络科技有限公司 基于设备传感器辅助定位方法及装置
CN116456458B (zh) * 2023-01-12 2024-05-03 广东世炬网络科技股份有限公司 基于设备传感器辅助定位方法及装置
CN117313019A (zh) * 2023-11-29 2023-12-29 广州汇通国信科技有限公司 一种基于深度强化学习的数据异常检测方法
CN117313019B (zh) * 2023-11-29 2024-03-22 广州汇通国信科技有限公司 一种基于深度强化学习的数据异常检测方法

Also Published As

Publication number Publication date
US11494282B2 (en) 2022-11-08
US20200342272A1 (en) 2020-10-29

Similar Documents

Publication Publication Date Title
CN111858111A (zh) 数据分析的方法、设备和计算机程序产品
CN111046027B (zh) 时间序列数据的缺失值填充方法和装置
CN110197288B (zh) 故障影响下设备的剩余使用寿命预测方法
US9286735B1 (en) Generating cumulative wear-based indicators for vehicular components
CN111626219B (zh) 轨迹预测模型生成方法、装置、可读存储介质及电子设备
US9704382B2 (en) Method for calculating error rate of alarm
WO2017087440A1 (en) Anomaly fusion on temporal casuality graphs
CN109416408B (zh) 震中距估计装置、震中距估计方法以及计算机可读记录介质
Zhang et al. Adaptive fault diagnosis and fault-tolerant control of MIMO nonlinear uncertain systems
CN113865587A (zh) 用于监控现场设备的方法、电子设备和计算机程序产品
US20200117553A1 (en) Method, apparatus, and computer-readable storage medium having instructions for cancelling a redundancy of two or more redundant modules
US20140188778A1 (en) Computer-Implemented System for Detecting Anomaly Conditions in a Fleet of Assets and Method of Using the Same
CN111459692B (zh) 用于预测驱动器故障的方法、设备和计算机程序产品
CN113379813A (zh) 深度估计模型的训练方法、装置、电子设备及存储介质
KR102038703B1 (ko) 동적 전이 앙상블 모형을 통한 실시간 다변량 시계열 예측방법 및 그 시스템
Zhou et al. Fault detection of a sandwich system with dead-zone based on robust observer
US10733537B2 (en) Ensemble based labeling
CN110542414B (zh) 无人飞行器的导航模块管理方法与装置
Ding et al. Observer-based monitoring of distributed networked control systems
US20240153059A1 (en) Method and system for anomaly detection using multimodal knowledge graph
CN111814331B (zh) 复杂情况下多变点的设备剩余使用寿命预测方法
KR101538758B1 (ko) 정보 통신 시스템에서의 장애 예측 장치 및 방법
WO2018198267A1 (ja) 因果関係学習方法、プログラム、装置および異常分析システム
CN110442142B (zh) 速度数据处理方法、装置、电子设备及计算机可读介质
US20220188401A1 (en) Anomaly detection apparatus, anomaly detection method, and non-transitory storage medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination