CN113486926B

CN113486926B - 一种自动化码头设备异常检测系统

Info

Publication number: CN113486926B
Application number: CN202110636004.9A
Authority: CN
Inventors: 向阳; 陈建廷; 邹鹰; 凌强; 杨靖培
Original assignee: Tongji University; Shanghai International Port Group Co Ltd
Current assignee: Tongji University; Shanghai International Port Group Co Ltd
Priority date: 2021-06-08
Filing date: 2021-06-08
Publication date: 2022-09-13
Anticipated expiration: 2041-06-08
Also published as: CN113486926A

Abstract

本发明提出一种自动化码头设备异常检测系统。包括设备数据采集模块、设备特征选择模块、设备异常检测分析模块，其中：所述设备数据采集模块，布设于码头设备，用于积累和形成目标设备的异常检测数据集D；所述设备特征选择模块，从设备数据采集模块选定的大量候选特征中进一步选择，生成待验证的候选设备特征子集s_i；所述设备异常检测分析模块，基于设备数据采集模型形成的目标设备异常检测数据集D和设备特征选择模块生成的设备特征子集s_i，训练预定义的异常检测模型M，并通过验证模型效果，对设备特征子集s_i作出评价。更快地为异常检测目标找到合适的设备特征，提高异常检测的准确率。

Description

一种自动化码头设备异常检测系统

技术领域

本发明涉及设备异常检测，应用于自动化码头，具体为一种具有特征选择能力的自动化码头设备异常检测系统。

背景技术

在超大型自动化集装箱码头中，大量的自动化机械设备暴露在露天岸边环境下，极易受到各种原因的侵蚀破坏，导致设备瘫痪，影响码头生产。所以，为了保证码头生产的安全可靠运行，及时响应设备可能出现的各种问题。自动化码头在装卸设备上配置了大量的传感器，实时把控设备的运行状态。这些不同设备、不同类型、不同尺度的传感器采集数据汇聚到码头运维系统中，用于预测可能发生的故障，以及诊断故障类型等。随着设备传感器越来越多，设备状态大数据的特征维度也越来越多。同时，异常检测系统的监控目标也呈多元化，针对不同的监控目标，选择合适的设备状态数据设计相应的模型，成为自动化码头运维管理中的关键任务。

传统的设备异常检测及分析模型的特征选择，大多依靠专家知识选择相关数据。在大数据技术和物联网技术的推动下，网络通信和数据存储的成本越来越低，能够获取到的设备数据维度、种类越来越多。总体上，这些数据中蕴含的信息价值越来越多，但这些数据中存在大量的冗余及关联信息，导致数据的价值密度呈降低趋势。传统地以专家经验为指导，人工选择高价值数据的方式已经难以适用于当前的生产环境，所以利用机器针对不同的异常检测对象或目标，自主地选择合适的设备状态数据已成为主流方向。

目前，针对大数据的数据特征选择方法主要分为过滤式与封装式两类。过滤式方法的特点是与数据挖掘算法无关，依据设定的评价标准判断候选数据特征的重要程度，从而选择合适的特征子集。封装式方法的特点是将拟定的数据挖掘算法作为黑箱模型，以算法效果最优为目标，搜索合适的特征子集。二者相比，封装式方法在结果上具有优势，在其所选择的特征子集上建立的数据挖掘模型具有更优的效果，对异常检测系统而言，准确的结果至关重要。但是封装式方法需要从海量的特征组合中进行搜索，且对每个搜索结果都需要建立并评估数据挖掘算法，时间开销巨大，所以搜索效率已经成为影响封装式特征选择方法的核心因素。因此，如何在有限的搜索过程中找到高质量的特征子集是特征选择过程中急需解决的关键问题。

发明内容

针对自动化码头设备异常检测系统在建立分析模型时，面对大量设备状态信息难以选择合适的相关特征的问题，封装式特征选择方法具有更佳的特征选择效果和异常检测准确率，但存在着在高维特征空间搜索效率低下的问题，本发明提出一种具有特征选择能力的自动化码头设备异常检测系统，能够减少封装式特征选择方法对低质量特征子集的搜索次数，更快地为异常检测目标找到合适的设备特征，提高异常检测的准确率。

技术方案

一种自动化码头设备异常检测系统包括设备数据采集模块、设备特征选择模块、设备异常检测分析模块，其中：所述设备数据采集模块，布设于码头设备，用于积累和形成目标设备的异常检测数据集D；所述设备特征选择模块，从设备数据采集模块选定的大量候选特征中进一步选择，生成待验证的候选设备特征子集s_i；所述设备异常检测分析模块，基于设备数据采集模型形成的目标设备异常检测数据集D和设备特征选择模块生成的设备特征子集s_i，训练预定义的异常检测模型M，并通过验证模型效果，对设备特征子集s_i作出评价。

进一步地，所述设备数据采集模块，在确定异常检测的目标设备或部件后，结合专家经验，从所有码头设备传感器数据源中，发掘可能于目标设备或部件相关的设备状态候选特征，候选特征的数量为l。在确定设备状态候选特征后，从数据源中积累一定数量的异常检测样本数据，形成目标设备的异常检测数据集D。每个异常检测样本d∈D包含1个l维的设备状态输入特征x和1个表示设备是否异常的输出标签y。将数据集D根据一定比例划分为训练集T和验证集V。

进一步地，所述设备特征选择模块，包含历史特征子集池P和特征子集优劣比较模型G。

历史特征子集池P用于存储经由设备异常检测分析模块验证的特征子集s_i和对应的评价结果f_i，即P＝{(s₁,f₁),(s₂,f₂),…(s_k,f_k)}。其中，特征子集s_i由向量s_i∈{-1,1}^l表示,其中l表示l个候选设备状态特征，若特征子集s_i的第j个元素[s_i]_j＝1表示其对应的码头设备特征j(1￡j￡l)属于特征子集s_i，否则不属于。历史特征子集池P的初始状态为空集。

特征子集优劣比较模型G由多层感知机形式的神经网络模型实现，期望其具有估计比较任意两个特征子集之间优劣的能力，即期望模型G拟合的函数关系为g(s_a,s_b)＝I(f_a>f_b)，其中I(.)为指示函数。构建模型G依赖于历史特征子集池P中的特征子集。构建完成的模型G将被用于产生新的候选特征子集。

特征子集优劣比较模型G的输入为两个特征子集(s_a,s_b)，作为评估比较特征子集优劣的对象。在输入到神经网络输入层之前，需对两个特征子集进行预处理：将两个输入特征子集(s_a,s_b)相加，并乘以随机变量

表达式为

再将所述的两个特征子集向量(s_a,s_b)相减，并乘以随机变量

表达式为

之后将向量v_s和v_d首尾拼接成向量v作为神经网络模型G的输入层。模型G的隐藏层数和节点数人为设定，主要取决于设备状态候选特征数量l。模型G的输出层节点数为1，若输出层的结果大于阈值，则表明模型G认为特征子集s_a的质量高于特征子集s_b的质量，反之，则表明模型G认为特征子集s_a的质量低于特征子集s_b的质量。

所述特征子集优劣比较模型G的构建：1)检查历史特征子集池P中的特征子集数量，每当历史特征子集池P中更新一定数量的特征子集后，则重新构建特征子集优劣模型G；2)将历史特征子集池P中的特征子集两两组合构造训练样本集U，每个训练样本包括两个输入特征子集(s_a,s_b)和一个样本标签q。若特征子集s_a的评价结果f_a大于特征子集s_b的评价结果f_b，则所述样本标签q为1，否者为0；3)初始化多层感知器G的隐藏层参数。根据训练样本集U，经由预处理过程后，输入到神经网络G，以hingeloss函数为损失函数(为一种已有函数)，结合梯度下降法训练神经网络模型G至收敛，使神经网络模型G具有比较两个特征子集优劣的能力，即近似地拟合目标函数关系g(s_a,s_b)＝I(f_a>f_b)。

所述特征子集优劣比较模型G用于生成新的特征子集：1)从历史特征子集池P中选择top-k评价结果的特征子集，表示为

2)构造一个变量s′表示待求解的新特征子集，将变量s′与

以不同顺序组合，形成

和

可作为特征子集优劣比较模型G的输入，并期望新特征子集s′的质量比

的质量更优，即以

为输入时，期望特征子集优劣比较模型G输出为

说明模型G认为特征子集s′的质量优于特征子集

的质量；以

为输入时，期望特征子集优劣比较模型G输出为

说明模型G认为特征子集

的质量低于特征子集s′的质量。基于上述期望，利用特征子集优劣评估模型G拟合的函数关系g(s_a,s_b)以及集合

我们期望新特征子集s′的质量比任意

的质量都更优，即形成以s′为求解变量的方程组

3)利用梯度下降法求解变量s′。其具体过程：从所述top-k适应度的特征子集

中任意选择特征子集

并随机地增加或删除部分特征，作为变量s^′的初始化值。固定神经网络模型G的参数，以hingeloss函数为损失函数(为一种已有函数)，利用梯度下降法训练变量s′，使变量s′满足方程组或收敛。这意味着神经网络模型G判断此时的特征子集s′比集合

中的任意特征子集具有更高的质量，变量s′可作为一个新的待验证的特征子集。4)考虑到神经网络的梯度下降过程具有并行性，可同时产生多个新的特征子集。即同时构造n个s′和对应的方程组，产生n个新的待评估的特征子集S＝{s₁,s₂,…s_n}。

在初始条件下，由于历史特征子集池P为空，无法构建特征子集优劣模型G，进而无法利用模型G产生新的特征子集。所以在此情况下，设备特征选择模块随机生成n个新的待评估的特征子集S＝{s₁,s₂,…s_n}。

所述设备异常检测分析模块，根据设备状态特征选择模块生成的特征子集s_i∈S，处理设备数据采集模型形成的设备异常检测数据集D，包括训练集T和验证集V，过滤掉不属于特征子集s_i中的特征，得到特征选择后的训练集T_si和验证集V_si。

利用特征选择后的训练集T_si训练预定义的异常检测模型M。其中的异常检测模型M可选地采用支持向量机、K近邻、决策树、随机森林、梯度提升树等机器学习模型或深度学习模型等。在特征选择后的验证集V_si上，评价训练后的异常检测模型M，将评价结果作为特征子集s_i的评价结果f_i。可选的评价指标包括但不限于：准确率、精准率、召回率、f1值、ROC曲线面积、特征选择比例等。评价指标选择和设计要求为评价结果的值越大，说明特征子集的质量越高。

设备异常检测分析模块将每一个评价过的特征子集s_i和对应的适应度f_i保存到特征子集池P中，即P＝P∪{(s_i,f_i)}。

当设备异常检测分析模块已将所有由设备状态特征选择模块产生的特征子集验证完毕后，判断是否仍需继续搜索更多特征子集。若继续搜索，则再由设备状态特征选择模块生成更多的新的待验证的特征子集。若结束搜索，则取历史特征子集池中最优的特征子集作为目标设备异常检测的设备状态特征进行分析建模。

具有特征选择能力的自动化码头设备异常检测系统，按如下运行：

S1:设备数据采集模块根据异常检测目标设备及部件，选择候选特征，收集并形成目标设备异常检测数据集D，输入到设备异常检测分析模块。

S2:设备特征选择模块随机生成n个待评估的设备特征子集S＝{s₁,s₂,…s_n}，输入到设备异常检测分析模块。

S3:设备异常检测分析模块根据目标设备检测数据D和设备特征子集s_i∈S，构造异常检测模型M，以模型M的验证集上效果作为特征子集的评价结果，保存在设备特征选择模块的历史特征子集池中。

S4:设备特征选择模块判断是否需要继续搜索特征子集，若继续则进入步骤S5，否则进入步骤S6。

S5:设备特征选择模块根据历史特征子集池中的特征子集构建特征子集优劣评估模型G，利用模型G生成新的n个待验证的特征子集S＝{s₁,s₂,…s_n}，再进入步骤S3。

S6:从历史特征子集池P中选择评价结果最优的特征子集，作为特征选择结果，输入到设备异常检测模块，实现对目标设备的异常检测分析。

以现有技术相比，本发明的有益效果为：

在自动化码头设备异常检测任务中，由于装卸设备传感器采集点众多，异常检测目标多样等特性，本发明提出采用机器为异常检测任务选择合适的设备状态特征，而不是完成依靠专家经验进行选择。本发明提出一种具有特征选择能力的自动化码头设备异常检测系统，采用封装式特征选择方法，可结合具体的异常检测目标，预定义异常检测数据挖掘模型，针对性地选择特征子集，更能选择出适合于异常检测目标的高价值特征，从而提高对码头设备异常检测的准确性，保障码头安全生产。

针对封装式特征选择方法搜索空间大，搜索代价高的问题，本发明在设备异常检测系统中实现的特征选择方法，根据已验证过的特征子集和评价结果，构建特征子集优劣评估模型用于比较特征子集之间优劣，根据该模型拟合的函数关系构造用于求解候选特征子集的方程组，再利用梯度下降法求解方程组得到新的特征子集。基于这种方式，充分利用历史经验，挖掘特征组合以及评价结果之间的知识，提高搜索特征子集的质量，从而以更少的搜索次数，在有限的资源条件下发掘更优的特征子集。

附图说明

图1示出了本发明系统逻辑框架图。

图2示出了本发明的特征子集优劣比较模型示意图。

图3示出了本发明实施例中构建特征子集优劣比较模型的流程图。

图4示出了本发明实施例中应用特征子集优劣比较模型产生新特征子集的流程图。

具体实施方式

为使得本发明的发明目的、特征、优点能够更加的明显和易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

应用例

在超大型自动化集装箱码头中，大量的自动化机械设备暴露在露天岸边环境下，极易受到各种原因的侵蚀破坏，导致设备瘫痪，影响码头生产。所以为了保证码头生产的安全可靠运行，及时响应设备可能出现的各种问题。自动化码头在装卸设备上配置了大量的传感器，实时把控设备的运行状态。这些不同设备、不同类型、不同尺度的传感器采集数据汇聚到码头运维系统中，用于预测可能发生的故障，以及诊断故障类型等。随着设备传感器越来越多，设备状态大数据的特征维度也越来越多。同时，运维系统的监控目标也呈多元化，针对不同的监控目标，选择合适的设备状态数据设计相应的模型，成为自动化码头运维管理中的关键任务。

本发明实施例以自动化集装箱码头自动导引车(Automatic guided vehicle,AGV)为异常检测目标设备。

实施例涉及的自动化码头设备异常检测系统包括设备数据采集模块、设备特征选择模块、设备异常检测分析模块。

实施例中的设备数据采集模块，针对自动化集装箱码头自动化导引车的异常检测任务，根据专家知识选择的关联候选特征包括：前天线探测绝对坐标、后天线探测绝对坐标、前后天线中心坐标、车轮轴旋转速度、车轮轴旋转角度、AGV导航角、加速度、车头车尾的激光传感器、电控系统的电压、电流互感器、温度传感器、散热继电器、液压系统的压力传感器、温湿传感器等共250个传感器采集数据，作为250个候选设备特征，即l＝250。从传感器数据源积累了包含200000个数据样本的AGV设备异常检测数据集D，每个异常检测样本d∈D包含250维的设备状态输入特征x和表示设备是否异常的输出标签y。将数据集D以4:1的比例划分训练集T和验证集V。

实施例中的设备特征选择模块，包含历史特征子集池P和特征子集优劣比较模型G。

历史特征子集池P用于存储经由设备异常检测分析模块验证的特征子集s_i和对应的评价结果f_i，即P＝{(s₁,f₁),(s₂,f₂),…(s_u,f_u)}。其中，特征子集s_i由向量s_i∈{-1,1}^l表示,其中l＝250对应250个与AGV异常检测关联的候选设备特征，若特征子集s_i的第j个元素[s_i]_j＝1表示其对应的设备状态特征

属于特征子集s_i，否则不属于。

历史特征子集池P的初始状态为空集。

特征子集优劣比较模型G由多层感知机形式的神经网络模型实现，期望其具有估计比较任意两个特征子集优劣的能力，即模型G拟合的函数关系为g(s_a,s_b)＝I(f_a>f_b)，其中I(.)为指示函数。构建模型G依赖于历史特征子集池P中的特征子集。构建完成的模型G将被用于产生新的候选特征子集。

如图2所示，特征子集优劣比较模型G的结构，包含1个预处理过程和1个多层感知器模型。

预处理过程为：将两个输入特征子集相加s_a+s_b，表示两个输入特征子集中的相似程度，若第j个元素相加结果为[s_a+s_b]_j＝2，则说明两个特征子集都包含特征j，若第j个元素相加结果为[s_a+s_b]_j＝-2，则说明两个特征子集都不包含特征j，若第j个元素相加结果为[s_a+s_b]_j＝0，则说明只有一个特征子集包含特征j。相加结果乘以随机变量

将元素绝对值缩小。计算表达式为

与之类似的，将所述的两个特征子集向量相减，表示两个输入特征子集的差异程度，相减结果乘以随机变量

计算表达式为

最后将向量v_s和v_d首尾拼接成预处理向量v，作为多层感知器的输入。

多层感知器模型包含1个输入层l₀、2个隐藏层l₁和l₂和1个输出层g，图2中的w₁,w₂和w₃分别表示输入层l₀、隐藏层l₁和l₂的训练参数。输入层的节点数等于预处理向量v的维度。隐藏层的节点数人为地分别设置为256和64，采用tanh激活函数。输出层的节点数为1，若输出层的结果大于阈值0.5，则表明模型G认为特征子集s_a的质量高于特征子集s_b的质量，反之，则表明模型G认为特征子集s_a的质量低于特征子集s_b的质量。

如图3所示，特征子集优劣比较模型G的构建方法为：

1)检查历史特征子集池P中的特征子集数量，每当历史特征子集池P中新增n＝8个特征子集后，则重新构建特征子集优劣模型G；

2)将历史特征子集池P中的所有特征子集两两组合构造训练样本集U，每个训练样本包括两个输入特征子集(s_a,s_b)和一个样本标签q。其中作为输入的特征子集是搜索结果集合P中的任意两个特征子集，相应的样本标签为两个输入特征子集的评价结果，若输入特征子集s_a的评价结果f_a大于所述输入特征子集s_b的评价结果f_b，则样本标签q为1，否者为0。当历史特征子集池P中包括u个特征子集，则可以最多可构造u²个训练样本。

3)重新初始化多层感知器G的隐藏层参数。根据训练样本集U，经由预处理过程后，输入到神经网络G，以hingeloss函数为损失函数，采用梯度下降法训练神经网络模型G至收敛，使神经网络模型G具有比较两个特征子集优劣的能力。

如图4所示，应用特征子集优劣比较模型G生成新的特征子集的方法为：

1)将历史特征子集池P中的特征子集根据评价结果从高到低排序，从中选择top-k评价结果的特征子集集合，表示为

2)构造一个长度与特征子集向量相同的可训练向量

并从top-k特征子集集合

中任意选择特征子集

并随机地增加或删除特征，再乘以介于(0,1)的随机值，初始化可训练向量

3)计算表示待求解的目标特征子集的变量s′,计算表达式为

其中

stop_gradient(.)是反向梯度传播截断函数。

4)利用特征子集优劣评估模型G拟合的函数关系g(s_a,s_b)，以目标特征子集的变量s′和top-k的特征子集集合

为输入，构造方程组

具体方法为：将变量s′与

以不同顺序组合形成

和

的质量更优，即以

为输入时，期望特征子集优劣比较模型G输出为

说明模型G认为特征子集s′的质量优于特征子集

的质量；以

为输入时，期望特征子集优劣比较模型G输出为

说明模型G认为特征子集

期望新特征子集s′的质量比任意

的质量都更优，即形成以s′为求解变量的方程组

5)固定特征子集优劣评估模型G的参数，以hingeloss损失函数为损失函数，利用梯度下降法训练可训练向量

使对应的目标特征子集变量s′满足方程组或收敛，最终的向量s′将作为一个待评估的特征子集向量。

4)考虑到神经网络的梯度下降过程具有并行性，可同时产生多个新的特征子集。即同时构造n个s′和对应的方程组，产生n个新的待评估的特征子集S＝{s₁,s₂,…s_n}。

实施例中的设备异常检测分析模块，根据设备状态特征选择模块生成的特征子集s_i∈S，处理设备数据采集模型形成的设备异常检测数据集D，包括训练集T和验证集V，过滤掉不属于特征子集s_i中的特征，得到特征选择后的训练集T_si和验证集V_si。

针对AGV设备异常检测分析，实施例采用XGboost作为数据挖掘模型M，采用F1score指标作为模型的评价指标。根据特征选择后的训练集T_si训练XGboost模型M。在特征选择后的验证集V_si评价训练后的模型M，将F1score指标结果作为特征子集s_i的评价结果f_i。F1score的值越大，说明特征子集的质量越高。

设备异常检测分析模块重复地对所有特征子集s_i∈S进行验证，将特征子集si和评价结果f_i保存到历史特征子集池P中，即P＝P∪{(s_i,f_i)}。

当设备异常检测分析模块已将所有由设备状态特征选择模块产生的特征子集验证完毕后，判断历史特征子集池P中的特征子集数是否超过了最大上限m＝400，未达到上限则继续搜索，否则停止。若继续搜索，则再由设备状态特征选择模块更多新的特征子集。若结束搜索，则取历史特征子集池中最优的特征子集作为目标设备异常检测的设备状态特征进行分析建模。

运用上述具有特征选择能力的自动化码头设备异常检测系统执行如下步骤：

S1:设备数据采集模块以AGV设备异常检测为目标，选择候选特征，收集并形成AGV设备异常检测数据集D，输入到设备异常检测分析模块。

S3:设备异常检测分析模块根据AGV设备异常检测数据D和设备特征子集s_i∈S，构造XGboost异常检测模型M，以模型M在验证集上的F1score作为特征子集的评估结果，保存在设备特征选择模块的历史特征子集池中。

S4:设备特征选择模块判断历史特征子集池中是否已经积累了400个特征子集，若不足则进入步骤S5，否则进入步骤S6。

S5:设备特征选择模块根据历史特征子集池中的特征子集构建特征子集优劣评估模型G，根据模型G生成新的n个待验证的特征子集S＝{s₁,s₂,…s_n}，再进入步骤S3。

S6:从历史特征子集池P中选择评价结果最优的特征子集，作为特征选择结果，输入到设备异常检测模块，实现对AGV设备的异常检测分析。

在实验中，历史特征子集池P中包含400个特征子集和对应的评价结果，特征子集的评价结果(即XGboost模型在验证集上的F1score值)的区间范围为[0.8503,0.9353]。而不进行特征选择，直接利用250个设备状态特征训练XGboost模型，在验证集上的F1score值仅为0.9060。本实施例搜索到的最优特征子集训练的XGboost模型明显优于未进行特征选择XGboost。说明本实施例实现的具有特征选择能力的设备异常检测系统，能够优化AGV设备异常检测分析效果。

为了验证本实施例中的特征选择方法相比于其他特征选择方法具有更快的搜索效率，本实施例实现了基于遗传算法的封装式特征选择方法和基于粒子群算法的封装式特征选择方法进行对比实验。同样地搜索400个特征子集，每次迭代搜索验证8个特征子集，评价结果计算过程不变。不同方法搜索到的特征子集的评价结果如表1所示。结果表明本实施例的特征选择方法能够在有限的搜索次数中找到更优的特征子集。

表1不同封装式特征选择方法的最优适应度比较

封装式特征选择方法	最高评价结果	最低评价结果
			基于遗传算法	0.9220	0.8503
基于粒子群算法	0.9290	0.8499
			本实施例	0.9353	0.8503

Claims

1.一种自动化码头设备异常检测系统，特征是，包括设备数据采集模块、设备特征选择模块、设备异常检测分析模块，其中：所述设备数据采集模块，布设于码头设备，用于积累和形成目标设备的异常检测数据集D；所述设备特征选择模块，从设备数据采集模块选定的大量候选特征中进一步选择，生成待验证的候选设备特征子集s_i；所述设备异常检测分析模块，基于设备数据采集模型形成的目标设备异常检测数据集D和设备特征选择模块生成的设备特征子集s_i，训练预定义的异常检测模型M，并通过验证模型效果，对设备特征子集s_i作出评价；

所述设备特征选择模块，包含历史特征子集池P和特征子集优劣比较模型G；

历史特征子集池P用于存储经由设备异常检测分析模块验证的特征子集s_i和对应的评价结果f_i，即P＝{(s₁,f₁),(s₂,f₂),…(s_k,f_k)}；其中，特征子集s_i由向量s_i∈{-1,1}^l表示,其中l表示l个候选设备状态特征，若特征子集s_i的第j个元素[s_i]_j＝1表示其对应的码头设备特征属于特征子集s_i，否则不属于；历史特征子集池P的初始状态为空集；

特征子集优劣比较模型G由多层感知机形式的神经网络模型实现，期望其具有估计比较任意两个特征子集之间优劣的能力，其函数关系为g(s_a,s_b)＝I(f_a>f_b)，其中I(.)为指示函数；构建特征子集优劣比较模型G依赖于历史特征子集池P中的特征子集；构建完成的特征子集优劣比较模型G将被用于产生新的候选特征子集；

特征子集优劣比较模型G的输入为两个特征子集(s_a,s_b)，作为评估比较特征子集优劣的对象；在输入到神经网络输入层之前，需对两个特征子集进行预处理：将两个输入特征子集(s_a,s_b)相加，并乘以随机变量

表达式为

再将所述的两个特征子集向量(s_a,s_b)相减，并乘以随机变量

表达式为

之后将向量v_s和v_d首尾拼接成向量v作为特征子集优劣比较模型G的输入层；特征子集优劣比较模型G的隐藏层数和节点数人为设定，取决于设备状态候选特征数量l；特征子集优劣比较模型G的输出层节点数为1，若输出层的结果大于阈值，则表明特征子集优劣比较模型G认为特征子集s_a的质量高于特征子集s_b的质量，反之，则表明特征子集优劣比较模型G认为特征子集s_a的质量低于特征子集s_b的质量。

2.如权利要求1所述的一种自动化码头设备异常检测系统，特征是，所述设备数据采集模块，在确定异常检测的目标设备或部件后，所有码头设备传感器数据源用于发掘目标设备或部件相关的设备状态候选特征，候选特征的数量为l；在确定设备状态候选特征后，从数据源中积累一定数量的异常检测样本数据，形成目标设备的异常检测数据集D；每个异常检测样本d∈D包含1个l维的设备状态输入特征x和1个表示设备是否异常的输出标签y；将数据集D根据一定比例划分为训练集T和验证集V。

3.如权利要求2所述的一种自动化码头设备异常检测系统，特征是，所述特征子集优劣比较模型G的构建：1)检查历史特征子集池P中的特征子集数量，每当历史特征子集池P中更新一定数量的特征子集后，则重新构建特征子集优劣模型G；2)将历史特征子集池P中的特征子集两两组合构造训练样本集U，每个训练样本包括两个输入特征子集(s_a,s_b)和一个样本标签q；若特征子集s_a的评价结果f_a大于特征子集s_b的评价结果f_b，则所述样本标签q为1，否者为0；3)初始化特征子集优劣比较模型G的隐藏层参数；根据训练样本集U，经由预处理过程后，输入到神经网络G，以hingeloss函数为损失函数，结合梯度下降法训练特征子集优劣比较模型G至收敛，使特征子集优劣比较模型G具有比较两个特征子集优劣的能力，即近似地拟合目标函数关系g(s_a,s_b)＝I(f_a>f_b)。

4.如权利要求1所述的一种自动化码头设备异常检测系统，特征是，所述特征子集优劣比较模型G用于生成新的特征子集：1)从历史特征子集池P中选择top-k评价结果的特征子集，表示为

2)构造一个变量s′表示待求解的新特征子集，将变量s′与

以不同顺序组合，形成

和

的质量更优，即以

为输入时，期望特征子集优劣比较模型G输出为

说明特征子集优劣比较模型G认为特征子集s′的质量优于特征子集

的质量；以

为输入时，期望特征子集优劣比较模型G输出为

说明特征子集优劣比较模型G认为特征子集

的质量低于特征子集s′的质量；基于上述期望，利用特征子集优劣评估模型G拟合的函数关系g(s_a,s_b)以及集合

期望新特征子集s′的质量比任意

的质量都更优，即形成以s′为求解变量的方程组

3)利用梯度下降法求解变量s′。

5.如权利要求4所述的一种自动化码头设备异常检测系统，特征是，其具体过程：从所述top-k适应度的特征子集

中任意选择特征子集

并随机地增加或删除部分特征，作为变量s′的初始化值；固定特征子集优劣比较模型G的参数，以hingeloss函数为损失函数，利用梯度下降法训练变量s′，使变量s′满足方程组或收敛；变量s′可作为一个新的待验证的特征子集；4)同时构造n个s′和对应的方程组，产生n个新的待评估的特征子集S＝{s₁,s₂,…s_n}；

在初始条件下，设备特征选择模块随机生成n个新的待评估的特征子集S＝{s₁,s₂,…s_n}。

6.如权利要求1所述的一种自动化码头设备异常检测系统，特征是，所述设备异常检测分析模块，根据设备状态特征选择模块生成的特征子集s_i∈S，处理设备数据采集模型形成的设备异常检测数据集D，包括训练集T和验证集V，过滤掉不属于特征子集s_i中的特征，得到特征选择后的训练集T_si和验证集V_si。

7.如权利要求6所述的一种自动化码头设备异常检测系统，特征是，利用特征选择后的训练集T_si训练预定义的异常检测模型M；在特征选择后的验证集V_si上，评价训练后的异常检测模型M，将评价结果作为特征子集s_i的评价结果f_i。

8.如权利要求7所述的一种自动化码头设备异常检测系统，特征是，设备异常检测分析模块将每一个评价过的特征子集s_i和对应的适应度f_i保存到特征子集池P中，即P＝P∪{(s_i,f_i)}。

9.如权利要求1至8任一所述的一种自动化码头设备异常检测系统，特征是，当设备异常检测分析模块已将所有由设备状态特征选择模块产生的特征子集验证完毕后，判断是否仍需继续搜索更多特征子集；若继续搜索，则再由设备状态特征选择模块生成更多的新的待验证的特征子集；若结束搜索，则取历史特征子集池中最优的特征子集作为目标设备异常检测的设备状态特征进行分析建模。