CN110175247B

CN110175247B - 一种优化基于深度学习的异常检测模型的方法

Info

Publication number: CN110175247B
Application number: CN201910192345.4A
Authority: CN
Inventors: 张永军; 沈涛; 闫思宇; 文韩
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2019-03-13
Filing date: 2019-03-13
Publication date: 2021-06-08
Anticipated expiration: 2039-03-13
Also published as: CN110175247A

Abstract

本发明公开了一种优化基于深度学习的异常检测模型的方法，该方法主要包括：收集工业生产中产品的图像数据作为基础，形成原始样本集；构造一个深度卷积网络，并利用神经网络模型，预测生产中的图片样本；对预测样本进行标注，计算有效样本概率区间；将计算得到的有效样本输入样本库，进行模型训练迭代直至样本库类间平衡。本发明通过筛选预测样本中的有效样本，实现了样本库的类间平衡，优化模型泛化性能，预测效果提高明显。

Description

一种优化基于深度学习的异常检测模型的方法

技术领域

本发明涉及机器学习领域，特别是涉及一种基于深度学习的异常检测模型的迭代优化方法。

背景技术

随着科技的进步，工业产品设备日趋复杂和精密，系统组成环节和影响因素的增加以及运行环境和工况的复杂化，使得产品异常检测面临很大的挑战。深度学习模型在特征学习方面具有突出的优势，所学特征能更好地刻画数据的丰富信息，提高分类性能，已大量应用于异常检测。然而在实际的工业过程中，相对于正常工业过程而言，采集到的产品图像数据中瑕疵图像过少，将异常检测中大量的正常样本和少量瑕疵样本都加入样本库训练模型，会导致样本库类间数据量相差较大时，模型倾向于将样本判别为数据量大的样本，即可获得较低的损失，没有动力继续优化参数模型，泛化能力降低。

目前，针对样本库不平衡样本的处理手段主要分为两大类：数据层面和算法层面。数据层面通过数据重采样或者数据合成，利用已有样本生成正负平衡的样本。算法层面通过代价敏感学习算法，通过改变损失值和评价指标，使得分类器满足代价敏感的特性。这两种方法都是在固定的样本集上进行模型优化，适用于不能持续获取样本的情况，不能有效地扩充样本库数据量，优化效果有限。

在可持续获取样本的情况下，通常将模型检测后的正负样本再次加入样本库，扩充样本库数据，实现模型的优化。然而，这种方式并没有考虑到预测样本中类间的不平衡。这会使得样本库类间数据量相差继续加大，导致模型偏向预测为正常样本，泛化能力降低。如果将所有预测样本加入样本库再进行不平衡样本的处理，则会增加数据预处理的成本，需要反复进行人工的模型迭代和性能评估。

发明内容

为了解决在可持续获取样本的情况下，现有技术数据预处理成本较高，需要花费较多的工时和人工成本对样本库不平衡样本进行预处理的问题，本发明提出了一种基于深度学习异常检测模型的样本库扩充方法。该方法的流程如下：

步骤S1:收集工业生产中产品的图像数据，作为基础，形成原始样本集；

步骤S2:构造一个基于异常检测的深度卷积网络；

步骤S3:利用神经网络模型，预测生产中的图片样本；

步骤S4:对预测样本进行标注，计算有效样本概率区间；

步骤S5：判断是否满足样本库平衡条件；

步骤S6:如不满足，则根据计算的有效样本概率区间，将有效样本输入样本库，进行模型迭代，直至建好一个满足平衡条件的样本库；

本发明中提出有效样本概率区间公式如下：

其中，N_P为正样本数，N_N为负样本数，P为预测样本数，P_F为预测错误的样本数，σ为sigmoid函数，

β为自定义的超参数。

本发明的有益效果是：本发明采用深度学习异常检测模型判决阈值的调整，对判断概率区间位于模糊地带的样本加入训练集，剔除了预测样本集中的无效样本，解决样本库的类间不平衡问题，实现了模型泛化性能的优化。

附图说明

图1是基于深度学习异常检测模型的优化流程示意图；

具体实施方式

下面结合附图对本发明的较佳实施例进行详细阐述，以使本发明的优点和特征能更易于被本领域技术人员理解，从而对本发明的保护范围做出更为清楚明确的界定。

请参阅图1，本发明实施例包括：

一种基于深度学习异常检测模型的优化方法，运用深度学习构建模型，将模型检测过程运用到采集样本中，通过判定有效样本的概率区间，决定是否加入样本库；通过检测样本的召回率，和样本库的正负样本比调整异常检测模型判定有效样本的概率区间。

实施例一：初始模型训练

(1)基础样本准备：在工业生产中采集生产产品的图像数据，以1000张作为基础数量。

(2)训练模型：基于深度学习异常检测算法，训练异常检测模型。

实施例二：实时检测

(1)模型检测：在实时输入样本数据的同时，进行模型检测，输出样本的分类概率。

(2)计算有效样本概率区间：令原始数据集中，正样本数为N_P，负样本数为N_N，预测样本数为P，预测错误的样本数为P_F，σ为sigmoid函数，令有效样本的概率区间，即模型预测的模糊区间为：

其中参数

定义为0.5，参数β定义为0.5。式中影响因子有：原始数据集中正负样本的比例系数，当类间不平衡时，应加大判定负样本的区间；模型检测的准确率，当准确率变高，模糊区间范围减小；超参数，可以人为调整大小，以增大模型泛化能力。

(3)提取有效样本：将预测错误的样本和样本分类概率在模糊区间的样本提取出来，加入样本库。

实施例三：判断是否满足样本库平衡条件

(1)判断样本库是否满足需求：正负样本数量满足N_P<5*N_N。

(2)循环处理：当样本库未达到需求时，开启循环，对新的样本库进行模型训练，迭代优化异常检测模型。

Claims

1.一种优化基于深度学习的异常检测模型的方法，其特征在于，该方法包括以下步骤：

S1:收集工业生产中产品的图像数据，作为基础，形成原始样本集；

S2:构造一个基于异常检测的深度卷积网络；

S3:利用神经网络模型，预测生产中的图片样本；

S4:对预测样本进行标注，计算有效样本概率区间；

S5：判断是否满足样本库平衡条件；

S6:如不满足，则根据计算的有效样本概率区间，提取有效样本，加入样本库，进行模型迭代，直至建好一个满足平衡条件的样本库；

有效样本概率区间公式如下：

β为自定义的超参数。

2.根据权利要求1所述的方法，其特征在于：S5步骤中判断是否满足样本库平衡条件：正负样本数量满足N_P<5*N_N。

3.根据权利要求1所述的方法，其特征在于：S6步骤中将有效样本，即预测错误的样本和样本分类概率在模糊区间的样本提取出来，加入样本库。

4.根据权利要求1所述的方法，其特征在于：当样本库未满足样本库平衡条件时，在S2-S6步骤开启循环，在预测的不平衡样本集中筛选有效样本，实现样本库类间平衡。