CN113486926B - 一种自动化码头设备异常检测系统 - Google Patents

一种自动化码头设备异常检测系统 Download PDF

Info

Publication number
CN113486926B
CN113486926B CN202110636004.9A CN202110636004A CN113486926B CN 113486926 B CN113486926 B CN 113486926B CN 202110636004 A CN202110636004 A CN 202110636004A CN 113486926 B CN113486926 B CN 113486926B
Authority
CN
China
Prior art keywords
feature
equipment
feature subset
subset
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110636004.9A
Other languages
English (en)
Other versions
CN113486926A (zh
Inventor
向阳
陈建廷
邹鹰
凌强
杨靖培
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Shanghai International Port Group Co Ltd
Original Assignee
Tongji University
Shanghai International Port Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University, Shanghai International Port Group Co Ltd filed Critical Tongji University
Priority to CN202110636004.9A priority Critical patent/CN113486926B/zh
Publication of CN113486926A publication Critical patent/CN113486926A/zh
Application granted granted Critical
Publication of CN113486926B publication Critical patent/CN113486926B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2115Selection of the most significant subset of features by evaluating different subsets according to an optimisation criterion, e.g. class separability, forward selection or backward elimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Alarm Systems (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明提出一种自动化码头设备异常检测系统。包括设备数据采集模块、设备特征选择模块、设备异常检测分析模块,其中:所述设备数据采集模块,布设于码头设备,用于积累和形成目标设备的异常检测数据集D;所述设备特征选择模块,从设备数据采集模块选定的大量候选特征中进一步选择,生成待验证的候选设备特征子集si;所述设备异常检测分析模块,基于设备数据采集模型形成的目标设备异常检测数据集D和设备特征选择模块生成的设备特征子集si,训练预定义的异常检测模型M,并通过验证模型效果,对设备特征子集si作出评价。更快地为异常检测目标找到合适的设备特征,提高异常检测的准确率。

Description

一种自动化码头设备异常检测系统
技术领域
本发明涉及设备异常检测,应用于自动化码头,具体为一种具有特征选择能力的自动化码头设备异常检测系统。
背景技术
在超大型自动化集装箱码头中,大量的自动化机械设备暴露在露天岸边环境下,极易受到各种原因的侵蚀破坏,导致设备瘫痪,影响码头生产。所以,为了保证码头生产的安全可靠运行,及时响应设备可能出现的各种问题。自动化码头在装卸设备上配置了大量的传感器,实时把控设备的运行状态。这些不同设备、不同类型、不同尺度的传感器采集数据汇聚到码头运维系统中,用于预测可能发生的故障,以及诊断故障类型等。随着设备传感器越来越多,设备状态大数据的特征维度也越来越多。同时,异常检测系统的监控目标也呈多元化,针对不同的监控目标,选择合适的设备状态数据设计相应的模型,成为自动化码头运维管理中的关键任务。
传统的设备异常检测及分析模型的特征选择,大多依靠专家知识选择相关数据。在大数据技术和物联网技术的推动下,网络通信和数据存储的成本越来越低,能够获取到的设备数据维度、种类越来越多。总体上,这些数据中蕴含的信息价值越来越多,但这些数据中存在大量的冗余及关联信息,导致数据的价值密度呈降低趋势。传统地以专家经验为指导,人工选择高价值数据的方式已经难以适用于当前的生产环境,所以利用机器针对不同的异常检测对象或目标,自主地选择合适的设备状态数据已成为主流方向。
目前,针对大数据的数据特征选择方法主要分为过滤式与封装式两类。过滤式方法的特点是与数据挖掘算法无关,依据设定的评价标准判断候选数据特征的重要程度,从而选择合适的特征子集。封装式方法的特点是将拟定的数据挖掘算法作为黑箱模型,以算法效果最优为目标,搜索合适的特征子集。二者相比,封装式方法在结果上具有优势,在其所选择的特征子集上建立的数据挖掘模型具有更优的效果,对异常检测系统而言,准确的结果至关重要。但是封装式方法需要从海量的特征组合中进行搜索,且对每个搜索结果都需要建立并评估数据挖掘算法,时间开销巨大,所以搜索效率已经成为影响封装式特征选择方法的核心因素。因此,如何在有限的搜索过程中找到高质量的特征子集是特征选择过程中急需解决的关键问题。
发明内容
针对自动化码头设备异常检测系统在建立分析模型时,面对大量设备状态信息难以选择合适的相关特征的问题,封装式特征选择方法具有更佳的特征选择效果和异常检测准确率,但存在着在高维特征空间搜索效率低下的问题,本发明提出一种具有特征选择能力的自动化码头设备异常检测系统,能够减少封装式特征选择方法对低质量特征子集的搜索次数,更快地为异常检测目标找到合适的设备特征,提高异常检测的准确率。
技术方案
一种自动化码头设备异常检测系统包括设备数据采集模块、设备特征选择模块、设备异常检测分析模块,其中:所述设备数据采集模块,布设于码头设备,用于积累和形成目标设备的异常检测数据集D;所述设备特征选择模块,从设备数据采集模块选定的大量候选特征中进一步选择,生成待验证的候选设备特征子集si;所述设备异常检测分析模块,基于设备数据采集模型形成的目标设备异常检测数据集D和设备特征选择模块生成的设备特征子集si,训练预定义的异常检测模型M,并通过验证模型效果,对设备特征子集si作出评价。
进一步地,所述设备数据采集模块,在确定异常检测的目标设备或部件后,结合专家经验,从所有码头设备传感器数据源中,发掘可能于目标设备或部件相关的设备状态候选特征,候选特征的数量为l。在确定设备状态候选特征后,从数据源中积累一定数量的异常检测样本数据,形成目标设备的异常检测数据集D。每个异常检测样本d∈D包含1个l维的设备状态输入特征x和1个表示设备是否异常的输出标签y。将数据集D根据一定比例划分为训练集T和验证集V。
进一步地,所述设备特征选择模块,包含历史特征子集池P和特征子集优劣比较模型G。
历史特征子集池P用于存储经由设备异常检测分析模块验证的特征子集si和对应的评价结果fi,即P={(s1,f1),(s2,f2),…(sk,fk)}。其中,特征子集si由向量si∈{-1,1}l表示,其中l表示l个候选设备状态特征,若特征子集si的第j个元素[si]j=1表示其对应的码头设备特征j(1£j£l)属于特征子集si,否则不属于。历史特征子集池P的初始状态为空集。
特征子集优劣比较模型G由多层感知机形式的神经网络模型实现,期望其具有估计比较任意两个特征子集之间优劣的能力,即期望模型G拟合的函数关系为g(sa,sb)=I(fa>fb),其中I(.)为指示函数。构建模型G依赖于历史特征子集池P中的特征子集。构建完成的模型G将被用于产生新的候选特征子集。
特征子集优劣比较模型G的输入为两个特征子集(sa,sb),作为评估比较特征子集优劣的对象。在输入到神经网络输入层之前,需对两个特征子集进行预处理:将两个输入特征子集(sa,sb)相加,并乘以随机变量
Figure BDA0003105211290000031
表达式为
Figure BDA0003105211290000032
再将所述的两个特征子集向量(sa,sb)相减,并乘以随机变量
Figure BDA0003105211290000033
表达式为
Figure BDA0003105211290000034
之后将向量vs和vd首尾拼接成向量v作为神经网络模型G的输入层。模型G的隐藏层数和节点数人为设定,主要取决于设备状态候选特征数量l。模型G的输出层节点数为1,若输出层的结果大于阈值,则表明模型G认为特征子集sa的质量高于特征子集sb的质量,反之,则表明模型G认为特征子集sa的质量低于特征子集sb的质量。
所述特征子集优劣比较模型G的构建:1)检查历史特征子集池P中的特征子集数量,每当历史特征子集池P中更新一定数量的特征子集后,则重新构建特征子集优劣模型G;2)将历史特征子集池P中的特征子集两两组合构造训练样本集U,每个训练样本包括两个输入特征子集(sa,sb)和一个样本标签q。若特征子集sa的评价结果fa大于特征子集sb的评价结果fb,则所述样本标签q为1,否者为0;3)初始化多层感知器G的隐藏层参数。根据训练样本集U,经由预处理过程后,输入到神经网络G,以hingeloss函数为损失函数(为一种已有函数),结合梯度下降法训练神经网络模型G至收敛,使神经网络模型G具有比较两个特征子集优劣的能力,即近似地拟合目标函数关系g(sa,sb)=I(fa>fb)。
所述特征子集优劣比较模型G用于生成新的特征子集:1)从历史特征子集池P中选择top-k评价结果的特征子集,表示为
Figure BDA0003105211290000035
2)构造一个变量s′表示待求解的新特征子集,将变量s′与
Figure BDA0003105211290000036
以不同顺序组合,形成
Figure BDA0003105211290000037
Figure BDA0003105211290000038
可作为特征子集优劣比较模型G的输入,并期望新特征子集s′的质量比
Figure BDA0003105211290000039
的质量更优,即以
Figure BDA00031052112900000310
为输入时,期望特征子集优劣比较模型G输出为
Figure BDA00031052112900000311
说明模型G认为特征子集s′的质量优于特征子集
Figure BDA00031052112900000312
的质量;以
Figure BDA00031052112900000313
为输入时,期望特征子集优劣比较模型G输出为
Figure BDA00031052112900000314
说明模型G认为特征子集
Figure BDA00031052112900000315
的质量低于特征子集s′的质量。基于上述期望,利用特征子集优劣评估模型G拟合的函数关系g(sa,sb)以及集合
Figure BDA00031052112900000316
我们期望新特征子集s′的质量比任意
Figure BDA00031052112900000317
的质量都更优,即形成以s′为求解变量的方程组
Figure BDA00031052112900000318
3)利用梯度下降法求解变量s′。其具体过程:从所述top-k适应度的特征子集
Figure BDA00031052112900000319
中任意选择特征子集
Figure BDA00031052112900000320
并随机地增加或删除部分特征,作为变量s的初始化值。固定神经网络模型G的参数,以hingeloss函数为损失函数(为一种已有函数),利用梯度下降法训练变量s′,使变量s′满足方程组或收敛。这意味着神经网络模型G判断此时的特征子集s′比集合
Figure BDA0003105211290000041
中的任意特征子集具有更高的质量,变量s′可作为一个新的待验证的特征子集。4)考虑到神经网络的梯度下降过程具有并行性,可同时产生多个新的特征子集。即同时构造n个s′和对应的方程组,产生n个新的待评估的特征子集S={s1,s2,…sn}。
在初始条件下,由于历史特征子集池P为空,无法构建特征子集优劣模型G,进而无法利用模型G产生新的特征子集。所以在此情况下,设备特征选择模块随机生成n个新的待评估的特征子集S={s1,s2,…sn}。
所述设备异常检测分析模块,根据设备状态特征选择模块生成的特征子集si∈S,处理设备数据采集模型形成的设备异常检测数据集D,包括训练集T和验证集V,过滤掉不属于特征子集si中的特征,得到特征选择后的训练集Tsi和验证集Vsi
利用特征选择后的训练集Tsi训练预定义的异常检测模型M。其中的异常检测模型M可选地采用支持向量机、K近邻、决策树、随机森林、梯度提升树等机器学习模型或深度学习模型等。在特征选择后的验证集Vsi上,评价训练后的异常检测模型M,将评价结果作为特征子集si的评价结果fi。可选的评价指标包括但不限于:准确率、精准率、召回率、f1值、ROC曲线面积、特征选择比例等。评价指标选择和设计要求为评价结果的值越大,说明特征子集的质量越高。
设备异常检测分析模块将每一个评价过的特征子集si和对应的适应度fi保存到特征子集池P中,即P=P∪{(si,fi)}。
当设备异常检测分析模块已将所有由设备状态特征选择模块产生的特征子集验证完毕后,判断是否仍需继续搜索更多特征子集。若继续搜索,则再由设备状态特征选择模块生成更多的新的待验证的特征子集。若结束搜索,则取历史特征子集池中最优的特征子集作为目标设备异常检测的设备状态特征进行分析建模。
具有特征选择能力的自动化码头设备异常检测系统,按如下运行:
S1:设备数据采集模块根据异常检测目标设备及部件,选择候选特征,收集并形成目标设备异常检测数据集D,输入到设备异常检测分析模块。
S2:设备特征选择模块随机生成n个待评估的设备特征子集S={s1,s2,…sn},输入到设备异常检测分析模块。
S3:设备异常检测分析模块根据目标设备检测数据D和设备特征子集si∈S,构造异常检测模型M,以模型M的验证集上效果作为特征子集的评价结果,保存在设备特征选择模块的历史特征子集池中。
S4:设备特征选择模块判断是否需要继续搜索特征子集,若继续则进入步骤S5,否则进入步骤S6。
S5:设备特征选择模块根据历史特征子集池中的特征子集构建特征子集优劣评估模型G,利用模型G生成新的n个待验证的特征子集S={s1,s2,…sn},再进入步骤S3。
S6:从历史特征子集池P中选择评价结果最优的特征子集,作为特征选择结果,输入到设备异常检测模块,实现对目标设备的异常检测分析。
以现有技术相比,本发明的有益效果为:
在自动化码头设备异常检测任务中,由于装卸设备传感器采集点众多,异常检测目标多样等特性,本发明提出采用机器为异常检测任务选择合适的设备状态特征,而不是完成依靠专家经验进行选择。本发明提出一种具有特征选择能力的自动化码头设备异常检测系统,采用封装式特征选择方法,可结合具体的异常检测目标,预定义异常检测数据挖掘模型,针对性地选择特征子集,更能选择出适合于异常检测目标的高价值特征,从而提高对码头设备异常检测的准确性,保障码头安全生产。
针对封装式特征选择方法搜索空间大,搜索代价高的问题,本发明在设备异常检测系统中实现的特征选择方法,根据已验证过的特征子集和评价结果,构建特征子集优劣 评估模型用于比较特征子集之间优劣,根据该模型拟合的函数关系构造用于求解候选特征 子集的方程组,再利用梯度下降法求解方程组得到新的特征子集。基于这种方式,充分利用历史经验,挖掘特征组合以及评价结果之间的知识,提高搜索特征子集的质量,从而以更少的搜索次数,在有限的资源条件下发掘更优的特征子集。
附图说明
图1示出了本发明系统逻辑框架图。
图2示出了本发明的特征子集优劣比较模型示意图。
图3示出了本发明实施例中构建特征子集优劣比较模型的流程图。
图4示出了本发明实施例中应用特征子集优劣比较模型产生新特征子集的流程图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
应用例
在超大型自动化集装箱码头中,大量的自动化机械设备暴露在露天岸边环境下,极易受到各种原因的侵蚀破坏,导致设备瘫痪,影响码头生产。所以为了保证码头生产的安全可靠运行,及时响应设备可能出现的各种问题。自动化码头在装卸设备上配置了大量的传感器,实时把控设备的运行状态。这些不同设备、不同类型、不同尺度的传感器采集数据汇聚到码头运维系统中,用于预测可能发生的故障,以及诊断故障类型等。随着设备传感器越来越多,设备状态大数据的特征维度也越来越多。同时,运维系统的监控目标也呈多元化,针对不同的监控目标,选择合适的设备状态数据设计相应的模型,成为自动化码头运维管理中的关键任务。
本发明实施例以自动化集装箱码头自动导引车(Automatic guided vehicle,AGV)为异常检测目标设备。
实施例涉及的自动化码头设备异常检测系统包括设备数据采集模块、设备特征选择模块、设备异常检测分析模块。
实施例中的设备数据采集模块,针对自动化集装箱码头自动化导引车的异常检测任务,根据专家知识选择的关联候选特征包括:前天线探测绝对坐标、后天线探测绝对坐标、前后天线中心坐标、车轮轴旋转速度、车轮轴旋转角度、AGV导航角、加速度、车头车尾的激光传感器、电控系统的电压、电流互感器、温度传感器、散热继电器、液压系统的压力传感器、温湿传感器等共250个传感器采集数据,作为250个候选设备特征,即l=250。从传感器数据源积累了包含200000个数据样本的AGV设备异常检测数据集D,每个异常检测样本d∈D包含250维的设备状态输入特征x和表示设备是否异常的输出标签y。将数据集D以4:1的比例划分训练集T和验证集V。
实施例中的设备特征选择模块,包含历史特征子集池P和特征子集优劣比较模型G。
历史特征子集池P用于存储经由设备异常检测分析模块验证的特征子集si和对应的评价结果fi,即P={(s1,f1),(s2,f2),…(su,fu)}。其中,特征子集si由向量si∈{-1,1}l表示,其中l=250对应250个与AGV异常检测关联的候选设备特征,若特征子集si的第j个元素[si]j=1表示其对应的设备状态特征
Figure BDA0003105211290000061
属于特征子集si,否则不属于。
历史特征子集池P的初始状态为空集。
特征子集优劣比较模型G由多层感知机形式的神经网络模型实现,期望其具有估计比较任意两个特征子集优劣的能力,即模型G拟合的函数关系为g(sa,sb)=I(fa>fb),其中I(.)为指示函数。构建模型G依赖于历史特征子集池P中的特征子集。构建完成的模型G将被用于产生新的候选特征子集。
如图2所示,特征子集优劣比较模型G的结构,包含1个预处理过程和1个多层感知 器模型。
预处理过程为:将两个输入特征子集相加sa+sb,表示两个输入特征子集中的相似程度,若第j个元素相加结果为[sa+sb]j=2,则说明两个特征子集都包含特征j,若第j个元素相加结果为[sa+sb]j=-2,则说明两个特征子集都不包含特征j,若第j个元素相加结果为[sa+sb]j=0,则说明只有一个特征子集包含特征j。相加结果乘以随机变量
Figure BDA0003105211290000071
将元素绝对值缩小。计算表达式为
Figure BDA0003105211290000072
与之类似的,将所述的两个特征子集向量相减,表示两个输入特征子集的差异程度,相减结果乘以随机变量
Figure BDA0003105211290000073
计算表达式为
Figure BDA0003105211290000074
最后将向量vs和vd首尾拼接成预处理向量v,作为多层感知器的输入。
多层感知器模型包含1个输入层l0、2个隐藏层l1和l2和1个输出层g,图2中的w1,w2和w3分别表示输入层l0、隐藏层l1和l2的训练参数。输入层的节点数等于预处理向量v的维度。隐藏层的节点数人为地分别设置为256和64,采用tanh激活函数。输出层的节点数为1,若输出层的结果大于阈值0.5,则表明模型G认为特征子集sa的质量高于特征子集sb的质量,反之,则表明模型G认为特征子集sa的质量低于特征子集sb的质量。
如图3所示,特征子集优劣比较模型G的构建方法为:
1)检查历史特征子集池P中的特征子集数量,每当历史特征子集池P中新增n=8个特征子集后,则重新构建特征子集优劣模型G;
2)将历史特征子集池P中的所有特征子集两两组合构造训练样本集U,每个训练样本包括两个输入特征子集(sa,sb)和一个样本标签q。其中作为输入的特征子集是搜索结果集合P中的任意两个特征子集,相应的样本标签为两个输入特征子集的评价结果,若输入特征子集sa的评价结果fa大于所述输入特征子集sb的评价结果fb,则样本标签q为1,否者为0。当历史特征子集池P中包括u个特征子集,则可以最多可构造u2个训练样本。
3)重新初始化多层感知器G的隐藏层参数。根据训练样本集U,经由预处理过程后,输入到神经网络G,以hingeloss函数为损失函数,采用梯度下降法训练神经网络模型G至收敛,使神经网络模型G具有比较两个特征子集优劣的能力。
如图4所示,应用特征子集优劣比较模型G生成新的特征子集的方法为:
1)将历史特征子集池P中的特征子集根据评价结果从高到低排序,从中选择top-k评价结果的特征子集集合,表示为
Figure BDA0003105211290000081
2)构造一个长度与特征子集向量相同的可训练向量
Figure BDA0003105211290000082
并从top-k特征子集集合
Figure BDA0003105211290000083
中任意选择特征子集
Figure BDA0003105211290000084
并随机地增加或删除特征,再乘以介于(0,1)的随机值,初始化可训练向量
Figure BDA0003105211290000085
3)计算表示待求解的目标特征子集的变量s′,计算表达式为
Figure BDA0003105211290000086
Figure BDA0003105211290000087
其中
Figure BDA0003105211290000088
stop_gradient(.)是反向梯度传播截断函数。
4)利用特征子集优劣评估模型G拟合的函数关系g(sa,sb),以目标特征子集的变量s′和top-k的特征子集集合
Figure BDA0003105211290000089
为输入,构造方程组
Figure BDA00031052112900000810
具体方法为:将变量s′与
Figure BDA00031052112900000811
以不同顺序组合形成
Figure BDA00031052112900000812
Figure BDA00031052112900000813
可作为特征子集优劣比较模型G的输入,并期望新特征子集s′的质量比
Figure BDA00031052112900000814
的质量更优,即以
Figure BDA00031052112900000815
为输入时,期望特征子集优劣比较模型G输出为
Figure BDA00031052112900000816
说明模型G认为特征子集s′的质量优于特征子集
Figure BDA00031052112900000817
的质量;以
Figure BDA00031052112900000818
为输入时,期望特征子集优劣比较模型G输出为
Figure BDA00031052112900000819
说明模型G认为特征子集
Figure BDA00031052112900000823
的质量低于特征子集s′的质量。基于上述期望,利用特征子集优劣评估模型G拟合的函数关系g(sa,sb)以及集合
Figure BDA00031052112900000820
期望新特征子集s′的质量比任意
Figure BDA00031052112900000821
的质量都更优,即形成以s′为求解变量的方程组
Figure BDA00031052112900000822
5)固定特征子集优劣评估模型G的参数,以hingeloss损失函数为损失函数,利用梯度下降法训练可训练向量
Figure BDA00031052112900000824
使对应的目标特征子集变量s′满足方程组或收敛,最终的向量s′将作为一个待评估的特征子集向量。
4)考虑到神经网络的梯度下降过程具有并行性,可同时产生多个新的特征子集。即同时构造n个s′和对应的方程组,产生n个新的待评估的特征子集S={s1,s2,…sn}。
在初始条件下,由于历史特征子集池P为空,无法构建特征子集优劣模型G,进而无法利用模型G产生新的特征子集。所以在此情况下,设备特征选择模块随机生成n个新的待评估的特征子集S={s1,s2,…sn}。
实施例中的设备异常检测分析模块,根据设备状态特征选择模块生成的特征子集si∈S,处理设备数据采集模型形成的设备异常检测数据集D,包括训练集T和验证集V,过滤掉不属于特征子集si中的特征,得到特征选择后的训练集Tsi和验证集Vsi
针对AGV设备异常检测分析,实施例采用XGboost作为数据挖掘模型M,采用F1score指标作为模型的评价指标。根据特征选择后的训练集Tsi训练XGboost模型M。在特征选择后的验证集Vsi评价训练后的模型M,将F1score指标结果作为特征子集si的评价结果fi。F1score的值越大,说明特征子集的质量越高。
设备异常检测分析模块重复地对所有特征子集si∈S进行验证,将特征子集si和评价结果fi保存到历史特征子集池P中,即P=P∪{(si,fi)}。
当设备异常检测分析模块已将所有由设备状态特征选择模块产生的特征子集验证完毕后,判断历史特征子集池P中的特征子集数是否超过了最大上限m=400,未达到上限则继续搜索,否则停止。若继续搜索,则再由设备状态特征选择模块更多新的特征子集。若结束搜索,则取历史特征子集池中最优的特征子集作为目标设备异常检测的设备状态特征进行分析建模。
运用上述具有特征选择能力的自动化码头设备异常检测系统执行如下步骤:
S1:设备数据采集模块以AGV设备异常检测为目标,选择候选特征,收集并形成AGV设备异常检测数据集D,输入到设备异常检测分析模块。
S2:设备特征选择模块随机生成n个待评估的设备特征子集S={s1,s2,…sn},输入到设备异常检测分析模块。
S3:设备异常检测分析模块根据AGV设备异常检测数据D和设备特征子集si∈S,构造XGboost异常检测模型M,以模型M在验证集上的F1score作为特征子集的评估结果,保存在设备特征选择模块的历史特征子集池中。
S4:设备特征选择模块判断历史特征子集池中是否已经积累了400个特征子集,若不足则进入步骤S5,否则进入步骤S6。
S5:设备特征选择模块根据历史特征子集池中的特征子集构建特征子集优劣评估模型G,根据模型G生成新的n个待验证的特征子集S={s1,s2,…sn},再进入步骤S3。
S6:从历史特征子集池P中选择评价结果最优的特征子集,作为特征选择结果,输入到设备异常检测模块,实现对AGV设备的异常检测分析。
在实验中,历史特征子集池P中包含400个特征子集和对应的评价结果,特征子集的评价结果(即XGboost模型在验证集上的F1score值)的区间范围为[0.8503,0.9353]。而不进行特征选择,直接利用250个设备状态特征训练XGboost模型,在验证集上的F1score值仅为0.9060。本实施例搜索到的最优特征子集训练的XGboost模型明显优于未进行特征选择XGboost。说明本实施例实现的具有特征选择能力的设备异常检测系统,能够优化AGV设备异常检测分析效果。
为了验证本实施例中的特征选择方法相比于其他特征选择方法具有更快的搜索效率,本实施例实现了基于遗传算法的封装式特征选择方法和基于粒子群算法的封装式特征选择方法进行对比实验。同样地搜索400个特征子集,每次迭代搜索验证8个特征子集,评价结果计算过程不变。不同方法搜索到的特征子集的评价结果如表1所示。结果表明本实施例的特征选择方法能够在有限的搜索次数中找到更优的特征子集。
表1不同封装式特征选择方法的最优适应度比较
封装式特征选择方法 最高评价结果 最低评价结果
基于遗传算法 0.9220 0.8503
基于粒子群算法 0.9290 0.8499
本实施例 0.9353 0.8503

Claims (9)

1.一种自动化码头设备异常检测系统,特征是,包括设备数据采集模块、设备特征选择模块、设备异常检测分析模块,其中:所述设备数据采集模块,布设于码头设备,用于积累和形成目标设备的异常检测数据集D;所述设备特征选择模块,从设备数据采集模块选定的大量候选特征中进一步选择,生成待验证的候选设备特征子集si;所述设备异常检测分析模块,基于设备数据采集模型形成的目标设备异常检测数据集D和设备特征选择模块生成的设备特征子集si,训练预定义的异常检测模型M,并通过验证模型效果,对设备特征子集si作出评价;
所述设备特征选择模块,包含历史特征子集池P和特征子集优劣比较模型G;
历史特征子集池P用于存储经由设备异常检测分析模块验证的特征子集si和对应的评价结果fi,即P={(s1,f1),(s2,f2),…(sk,fk)};其中,特征子集si由向量si∈{-1,1}l表示,其中l表示l个候选设备状态特征,若特征子集si的第j个元素[si]j=1表示其对应的码头设备特征属于特征子集si,否则不属于;历史特征子集池P的初始状态为空集;
特征子集优劣比较模型G由多层感知机形式的神经网络模型实现,期望其具有估计比较任意两个特征子集之间优劣的能力,其函数关系为g(sa,sb)=I(fa>fb),其中I(.)为指示函数;构建特征子集优劣比较模型G依赖于历史特征子集池P中的特征子集;构建完成的特征子集优劣比较模型G将被用于产生新的候选特征子集;
特征子集优劣比较模型G的输入为两个特征子集(sa,sb),作为评估比较特征子集优劣的对象;在输入到神经网络输入层之前,需对两个特征子集进行预处理:将两个输入特征子集(sa,sb)相加,并乘以随机变量
Figure FDA0003670057590000011
表达式为
Figure FDA0003670057590000012
Figure FDA0003670057590000013
再将所述的两个特征子集向量(sa,sb)相减,并乘以随机变量
Figure FDA0003670057590000014
表达式为
Figure FDA0003670057590000015
之后将向量vs和vd首尾拼接成向量v作为特征子集优劣比较模型G的输入层;特征子集优劣比较模型G的隐藏层数和节点数人为设定,取决于设备状态候选特征数量l;特征子集优劣比较模型G的输出层节点数为1,若输出层的结果大于阈值,则表明特征子集优劣比较模型G认为特征子集sa的质量高于特征子集sb的质量,反之,则表明特征子集优劣比较模型G认为特征子集sa的质量低于特征子集sb的质量。
2.如权利要求1所述的一种自动化码头设备异常检测系统,特征是,所述设备数据采集模块,在确定异常检测的目标设备或部件后,所有码头设备传感器数据源用于发掘目标设备或部件相关的设备状态候选特征,候选特征的数量为l;在确定设备状态候选特征后,从数据源中积累一定数量的异常检测样本数据,形成目标设备的异常检测数据集D;每个异常检测样本d∈D包含1个l维的设备状态输入特征x和1个表示设备是否异常的输出标签y;将数据集D根据一定比例划分为训练集T和验证集V。
3.如权利要求2所述的一种自动化码头设备异常检测系统,特征是,所述特征子集优劣比较模型G的构建:1)检查历史特征子集池P中的特征子集数量,每当历史特征子集池P中更新一定数量的特征子集后,则重新构建特征子集优劣模型G;2)将历史特征子集池P中的特征子集两两组合构造训练样本集U,每个训练样本包括两个输入特征子集(sa,sb)和一个样本标签q;若特征子集sa的评价结果fa大于特征子集sb的评价结果fb,则所述样本标签q为1,否者为0;3)初始化特征子集优劣比较模型G的隐藏层参数;根据训练样本集U,经由预处理过程后,输入到神经网络G,以hingeloss函数为损失函数,结合梯度下降法训练特征子集优劣比较模型G至收敛,使特征子集优劣比较模型G具有比较两个特征子集优劣的能力,即近似地拟合目标函数关系g(sa,sb)=I(fa>fb)。
4.如权利要求1所述的一种自动化码头设备异常检测系统,特征是,所述特征子集优劣比较模型G用于生成新的特征子集:1)从历史特征子集池P中选择top-k评价结果的特征子集,表示为
Figure FDA0003670057590000021
2)构造一个变量s′表示待求解的新特征子集,将变量s′与
Figure FDA0003670057590000022
以不同顺序组合,形成
Figure FDA0003670057590000023
Figure FDA0003670057590000024
可作为特征子集优劣比较模型G的输入,并期望新特征子集s′的质量比
Figure FDA0003670057590000025
的质量更优,即以
Figure FDA0003670057590000026
为输入时,期望特征子集优劣比较模型G输出为
Figure FDA0003670057590000027
Figure FDA0003670057590000028
说明特征子集优劣比较模型G认为特征子集s′的质量优于特征子集
Figure FDA0003670057590000029
的质量;以
Figure FDA00036700575900000210
为输入时,期望特征子集优劣比较模型G输出为
Figure FDA00036700575900000211
说明特征子集优劣比较模型G认为特征子集
Figure FDA00036700575900000212
的质量低于特征子集s′的质量;基于上述期望,利用特征子集优劣评估模型G拟合的函数关系g(sa,sb)以及集合
Figure FDA0003670057590000031
期望新特征子集s′的质量比任意
Figure FDA0003670057590000032
的质量都更优,即形成以s′为求解变量的方程组
Figure FDA0003670057590000033
3)利用梯度下降法求解变量s′。
5.如权利要求4所述的一种自动化码头设备异常检测系统,特征是,其具体过程:从所述top-k适应度的特征子集
Figure FDA0003670057590000034
中任意选择特征子集
Figure FDA0003670057590000035
并随机地增加或删除部分特征,作为变量s′的初始化值;固定特征子集优劣比较模型G的参数,以hingeloss函数为损失函数,利用梯度下降法训练变量s′,使变量s′满足方程组或收敛;变量s′可作为一个新的待验证的特征子集;4)同时构造n个s′和对应的方程组,产生n个新的待评估的特征子集S={s1,s2,…sn};
在初始条件下,设备特征选择模块随机生成n个新的待评估的特征子集S={s1,s2,…sn}。
6.如权利要求1所述的一种自动化码头设备异常检测系统,特征是,所述设备异常检测分析模块,根据设备状态特征选择模块生成的特征子集si∈S,处理设备数据采集模型形成的设备异常检测数据集D,包括训练集T和验证集V,过滤掉不属于特征子集si中的特征,得到特征选择后的训练集Tsi和验证集Vsi
7.如权利要求6所述的一种自动化码头设备异常检测系统,特征是,利用特征选择后的训练集Tsi训练预定义的异常检测模型M;在特征选择后的验证集Vsi上,评价训练后的异常检测模型M,将评价结果作为特征子集si的评价结果fi
8.如权利要求7所述的一种自动化码头设备异常检测系统,特征是,设备异常检测分析模块将每一个评价过的特征子集si和对应的适应度fi保存到特征子集池P中,即P=P∪{(si,fi)}。
9.如权利要求1至8任一所述的一种自动化码头设备异常检测系统,特征是,当设备异常检测分析模块已将所有由设备状态特征选择模块产生的特征子集验证完毕后,判断是否仍需继续搜索更多特征子集;若继续搜索,则再由设备状态特征选择模块生成更多的新的待验证的特征子集;若结束搜索,则取历史特征子集池中最优的特征子集作为目标设备异常检测的设备状态特征进行分析建模。
CN202110636004.9A 2021-06-08 2021-06-08 一种自动化码头设备异常检测系统 Active CN113486926B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110636004.9A CN113486926B (zh) 2021-06-08 2021-06-08 一种自动化码头设备异常检测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110636004.9A CN113486926B (zh) 2021-06-08 2021-06-08 一种自动化码头设备异常检测系统

Publications (2)

Publication Number Publication Date
CN113486926A CN113486926A (zh) 2021-10-08
CN113486926B true CN113486926B (zh) 2022-09-13

Family

ID=77934755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110636004.9A Active CN113486926B (zh) 2021-06-08 2021-06-08 一种自动化码头设备异常检测系统

Country Status (1)

Country Link
CN (1) CN113486926B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115453356B (zh) * 2022-09-06 2023-05-30 上海电力大学 一种动力设备运行状态监测分析方法、系统、终端及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106447202A (zh) * 2016-09-29 2017-02-22 国网山东省电力公司 基于数据挖掘和主成分分析的电力设备状态评估方法
CN106779069A (zh) * 2016-12-08 2017-05-31 国家电网公司 一种基于神经网络的异常用电检测方法
CN108764006A (zh) * 2018-02-05 2018-11-06 北京航空航天大学 一种基于深度强化学习的sar图像目标检测方法
CN111832603A (zh) * 2020-04-15 2020-10-27 北京嘀嘀无限科技发展有限公司 数据处理方法、装置、电子设备和计算机可读存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101783578B (zh) * 2010-02-03 2012-07-25 北京奥福瑞科技有限公司 高频开关电源智能在线检测优化管理控制方法及其装置
US11232344B2 (en) * 2017-10-31 2022-01-25 General Electric Company Multi-task feature selection neural networks
US11625610B2 (en) * 2019-03-12 2023-04-11 Samsung Electronics Co., Ltd Multiple-input multiple-output (MIMO) detector selection using neural network

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106447202A (zh) * 2016-09-29 2017-02-22 国网山东省电力公司 基于数据挖掘和主成分分析的电力设备状态评估方法
CN106779069A (zh) * 2016-12-08 2017-05-31 国家电网公司 一种基于神经网络的异常用电检测方法
CN108764006A (zh) * 2018-02-05 2018-11-06 北京航空航天大学 一种基于深度强化学习的sar图像目标检测方法
CN111832603A (zh) * 2020-04-15 2020-10-27 北京嘀嘀无限科技发展有限公司 数据处理方法、装置、电子设备和计算机可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Jianting Chen, Shuhan Yuan, Dongdong Lv, Yang Xiang.A novel self-learning feature selection approach based on feature attributions.《Expert Systems With Applications》.2021, *
周小程,马向玲.基于核函数分类的多维时序特征选择方法应用.《电光与控制》.2010, *

Also Published As

Publication number Publication date
CN113486926A (zh) 2021-10-08

Similar Documents

Publication Publication Date Title
CN109947086B (zh) 基于对抗学习的机械故障迁移诊断方法及系统
CN110321603B (zh) 一种用于航空发动机气路故障诊断的深度计算模型
CN111967486A (zh) 一种基于多传感器融合的复杂装备故障诊断方法
CN110231156B (zh) 基于时序特征的服务机器人运动系统故障诊断方法及装置
CN106482967B (zh) 一种代价敏感支持向量机机车车轮检测系统及方法
CN112557034B (zh) 一种基于pca_cnns的轴承故障诊断方法
KR20190126449A (ko) 기술 시스템을 제어하기 위한 방법 및 제어 디바이스
CN110245745A (zh) 基于集成双向循环神经网络的设备剩余使用寿命预测方法
CN114004155B (zh) 考虑电力系统拓扑结构特征的暂态稳定评估方法及装置
CN114861879A (zh) 一种基于天牛须算法优化Elman神经网络电主轴热误差建模方法
CN112504682A (zh) 基于粒子群优化算法的底盘发动机故障诊断方法及系统
CN113486926B (zh) 一种自动化码头设备异常检测系统
CN115618732A (zh) 核反应堆数字孪生关键参数自主优化数据反演方法
CN116186633A (zh) 一种基于小样本学习的用电异常诊断方法和系统
CN115859077A (zh) 一种变工况下多特征融合的电机小样本故障诊断方法
CN113592071B (zh) 设备故障识别模型训练、识别方法、系统、装置及介质
CN114863170A (zh) 一种基于深度学习的新能源车电池自燃预警方法及装置
CN113033898A (zh) 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统
CN113570007A (zh) 零件缺陷识别模型构建优化方法、装置、设备及存储介质
Li et al. A remaining useful life prediction method considering the dimension optimization and the iterative speed
Djelloul et al. Fault isolation in manufacturing systems based on learning algorithm and fuzzy rule selection
CN113111588B (zh) 一种燃气轮机nox排放浓度预测方法及装置
Derse et al. An anomaly detection study on automotive sensor data time series for vehicle applications
CN115423091A (zh) 一种条件对抗神经网络训练方法、场景生成方法和系统
Behera et al. GAN-based multi-task learning approach for prognostics and health management of IIoT

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant