CN112906813A

CN112906813A - 一种基于密度聚类和胶囊神经网络的浮选工况识别方法

Info

Publication number: CN112906813A
Application number: CN202110257189.2A
Authority: CN
Inventors: 岑丽辉; 胡健; 陈晓方; 谢永芳; 唐朝辉
Original assignee: Central South University
Current assignee: Central South University
Priority date: 2021-03-09
Filing date: 2021-03-09
Publication date: 2021-06-04

Abstract

本发明涉及泡沫浮选技术领域，具体涉及一种基于密度聚类和胶囊神经网络的浮选工况识别方法。具体包括：获取浮选工况的视频数据，将所述视频数据进行预处理获得图像样本集；将图像样本集采用预设的密度聚类方法进行去噪优化获得多个工况类别的训练样本和测试样本；构建胶囊神经网络，输入所述训练样本并采用动态路由算法和梯度下降算法进行训练优化获得浮选工况识别模型；将待测工况图像样本输入浮选工况识别模型进行工况识别获得待测工况图像样本的工况类别。该方法可以实现批量、准确快速标签，且训练数据量少，响应时间快，工况识别准确率高。

Description

一种基于密度聚类和胶囊神经网络的浮选工况识别方法

技术领域

本发明涉及泡沫浮选技术领域，具体涉及一种基于密度聚类和胶囊神经网络的浮选工况识别方法。

背景技术

泡沫浮选是金属冶炼中最主要的选矿方法之一,主要是依据不同矿物颗粒表面润湿性的不同来分离不同矿物。矿石在经过磨矿分离后，得到入选粒度和浓度较为适合的矿浆，再送入搅拌槽并添加药剂，不断地搅拌和充气形成大量气泡,使有用矿物颗粒黏附在气泡表面,其他矿物颗粒停留在矿浆底部中,从而实现矿物分离。浮选工况好坏反映最终的浮选性能指标，而在浮选过程中，浮选泡沫层中泡沫的颜色、尺寸、形状、稳定度、纹理，流速等表面视觉特征可密切反映浮选工况。由于泡沫浮选存在自身工艺流程长、内部机理不明确、影响因素多、涉及变量多且非线性强等问题,导致工艺指标不能在线检测；另外现场操作工人的轮换性和实际操作的主观性和随意性较大,对泡沫结构好与坏的判断没有统一的标准,这也导致了浮选工况识别的复杂性。虽然选矿厂通过离线化验分析能够得到精矿品位和尾矿品位，但是化验结果滞后生产数个小时,造成调节滞后的现象,影响了化验分析的及时性。因此,在线识别浮选槽的工况水平,对生产操作和过程的优化运行具有重要的意义。

随着机器视觉和深度学习技术的迅速发展,基于机器视觉和深度学习技术的浮选监控系统逐渐被应用到浮选过程中，以辅助现场工人判断工况信息。机器视觉技术利用各种数字图像处理技术，首先提取浮选泡沫尺寸、泡沫颜色信息、纹理特征以及表面泡沫层运动速度特征等,然后采用支持向量机、决策树、谱聚类等方法进行工况识别。在深度学习技术应用方面，卷积神经网络以其出色的深度特征提取能力和图像分类能力获得众多研究者关注，其深度特征的提取往往是高维，包括了不局限于泡沫尺寸、形状、颜色、纹理等人眼所能觉察的特征，目前许多研究者逐渐将卷积神经网络应用到浮选工况识别中。这些方法都取得了一定效果，但是，当前工况识别方法中有以下局限性：

传统机器视觉技术方面。1、泡沫特征的提取实际上是针对泡沫灰度图像的降维计算过程,在提取过程中难免存在信息丢失,难以获取本质的图像信息；2、人为自主选定的特征不一定是最好的工况表征，降低了工况识别模型的分类鲁棒性。

深度学习技术方面。1、数据集容量的问题。像卷积神经网络这类的深度学习模型，往往需要数十上百万的训练样本才能保证训练后的模型具有良好的泛化能力。但是在浮选现场，浮选工况一般比较良好且稳定，获得的中等、较差工况的数据一般较少，因此难以制作出大容量、类别分布均匀的训练样本；2、训练样本的标签准确性问题。训练样本一般是预处理后的视频帧，通常是将一段已判断为某一工况状态的视频，其每一帧都标签为对应工况等级。但是由于摄像机抖动、泡沫表面与摄像头的相对运动往往会产生有运动模糊的帧，而且因为泡沫层的不断运动，一段已判断为某一工况状态的视频经常会包含有品位落差、翻矿浆等帧图像。若以上情况下的帧图像得不到有效处理，将会使标签标记错误，难以有效提高深度模型预测准确率；3、信息丢失和可解释性问题。尽管深度卷积网络在泡沫分类方面表现出色，但训练数据需求大，可解释性不强，而且每个卷积核仅对一定区域进行逐步特征提取，丢失了位置和方向等空间特征分布信息。

发明内容

基于此，本发明针对现有工况识别方法的不足之处，通过充分利用现场采集到的泡沫视频，并对视频帧数据进行去噪优化，得到标签和真实工况准确对应的数据集，并设计了胶囊神经网络模型，胶囊神经网络具有参数少，数据集需求小，保留了卷积神经网络优点的情况下，还保留了位置和方向等空间特征分布信息，使得在较小样本规模的情况下，训练得到泡沫工况在线识别模型，训练得到泡沫工况在线识别模型，具有相应时间快，识别准确率高等优点。

本发明提供了基于密度聚类和胶囊神经网络的浮选工况识别方法，具体包括：

获取浮选工况的视频数据，将所述视频数据进行预处理获得图像样本集；

将所述图像样本集采用预设的密度聚类方法进行去噪优化获得多个工况类别的训练样本和测试样本；

构建胶囊神经网络，输入所述训练样本并采用动态路由算法和梯度下降算法进行训练优化获得浮选工况识别模型；

将待测工况图像样本输入所述浮选工况识别模型进行工况识别获得待测工况图像样本的工况类别。

进一步的，所述将所述视频数据进行预处理获得图像样本集步骤具体包括：

将所述视频数据的所有帧随机打乱，并随机选取多个视频帧组成图像样本集，获得多个图像样本集。

进一步的，所述将所述图像样本集采用预设的密度聚类方法进行去噪优化获得多个工况类别的训练样本和测试样本步骤具体包括：

获取图像样本集、邻域距离阈值和邻域样本数量阈值；

计算所述图像样本集中第一样本与其他样本之间的欧氏距离，并获得第一样本邻域数，当所述第一样本邻域数大于等于邻域样本数量阈值，则将所述第一样本置于核心对象集合中；并处理所述图像样本集中的其他图像样本，获得核心对象集合；

随机选取核心对象集合中的一个核心对象为第一核心对象，并计算第一核心对象邻域数，当所述第一核心对象邻域数大于等于邻域样本数量阈值，取第一核心对象邻域样本和核心样本对象的交集获取交集样本，将第一核心对象和交集样本组成队列；根据所述队列更新未访问核心样本集合，根据当前未访问过的核心样本集合和所述未访问核心样本集合生成聚类簇；

根据所述聚类簇获得样本集中的无噪声样本和噪声样本，即为多个工况类别的训练样本和测试样本。

所述图像间欧氏距离的计算公式为：

式中，(x_i1，x_i2)表示两个对象，N是像素总数。

进一步的，所述胶囊神经网络包括编码器和解码器；所述编码器包括输入层、卷积层、主胶囊层和数字胶囊层。

进一步的，所述卷积层包括CONV1 ReLU层，CONV2 ReLU层，CONV3ReLU层，在卷积过程采用ReLU激活函数进行激活。

进一步的，所述解码器将所述数字胶囊层处理后的图片采用三个全连接层进行重构，并以重构图片和原始图片的像素平方差的和作为重构损失函数。

进一步的，所述动态路由算法具体包括：

初始化所有l层的胶囊i至所有(l+1)层的胶囊j的先验概率b_ij＝0；并采用softmax函数

计算胶囊i连接至胶囊j的连接概率c_ij；

根据公式

计算(l+1)层的胶囊j的总输入，其中

W_ij表示转化矩阵；n_i表示输人向量；并根据公式

获得胶囊输出；

根据

对先验概率b_ij进行更新，经多次迭代后输出v_j。

有益效果：

本发明所述的基于密度聚类和胶囊神经网络的浮选工况识别方法通过基于欧氏距离的密度聚类方法对泡沫样本进行去噪样本处理，与人工标签的主观性强、错误标记较多相比，该方法可以实现批量、准确快速标签，通过减少错误标签，以提高模型工况识别准确率；并构建胶囊申请网络，采用动态路由算法进行训练工况识别模型，与传统卷积网络模型相比，所需训练数据量少，响应时间快，工况识别准确率也进一步提高。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基基于密度聚类和胶囊神经网络的浮选工况识别方法的流程图；

图2为本发明实施例提供的6类工况样本实例；

图3为本发明实施例提供的工况识别胶囊神经网络结构示意图；

图4为本发明实施例提供的解码器结构示意图；

图5为本发明实施例提供的神经胶囊工作原理图；

图6为本发明实施例提供的神经胶囊训练过程参数变化图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

在本发明实施例中，采集浮选过程的图像样本时，浮选泡沫受叶轮搅拌处于旋转运动状态，另外刮板在刮泡时对泡沫运动也会有影响，使得泡沫处于一种非匀速和非定向的运动状态中，导致泡沫层与摄像机之间距离发生变化，同时各种机器设备产生的振动也会影响摄像机本身，因此浮选现场监控系统获得的图像不可避免地存在一部分模糊度较高的图像，模糊图像直接影响到泡沫形态参数测量的准确性，产生大量的异常数据，进而影响到后续预测模型的准确性，另外就是泡沫表面局部品位落差。比如在一段低等品位泡沫视频中出现中等品位的情况，或者低等工况突然出现一张中等工况图像，将使得品位标注错误，造成深度模型训练过程中收敛困难，预测效果差。

如图1所示，在本发明实施例中，提出了基于密度聚类和胶囊神经网络的浮选工况识别方法的流程图，具体包括以下步骤：

步骤S101，获取浮选工况的视频数据，将所述视频数据进行预处理获得图像样本集。

在本发明实施例中，对于浮选工况的视频数据进行预处理，首先随机打乱所有帧图片，因为所有帧图像都是连续动态变化的，相邻两帧之间相关性极高，容易导致几乎所有样本密度相连；然后进行分批聚类：每批次50帧随机视频帧组成图像样本集，获得多个图像样本集，以尽可能是的每帧图像间高度独立。

步骤S102，将所述图像样本集采用预设的密度聚类方法进行去噪优化获得多个工况类别的训练样本。获取图像样本集、邻域距离阈值和邻域样本数量阈值；计算所述图像样本集中第一样本与其他样本之间的欧氏距离，并获得第一样本邻域数，当所述第一样本邻域数大于等于邻域样本数量阈值，则将所述第一样本置于核心对象集合中；并处理所述图像样本集中的其他图像样本，获得核心对象集合；随机选取核心对象集合中的一个核心对象为第一核心对象，并计算第一核心对象邻域数，当所述第一核心对象邻域数大于等于邻域样本数量阈值，取第一核心对象邻域样本和核心样本对象的交集获取交集样本，将第一核心对象和交集样本组成队列；根据所述队列更新未访问核心样本集合，根据当前未访问过的核心样本集合和所述未访问核心样本集合生成聚类簇；根据所述聚类簇获得样本集中的无噪声样本和噪声样本，即为多个工况类别的训练样本。

在本发明实施例中，所述密度聚类是按照一定的规则划分成若干个簇，把相似的样本聚在同一簇中，把不相似的样本分为不同的簇，并利用密度思想，将样本中的高密度区域(即泡沫品位相似分布稠密的区域)划分为簇，将簇看做是样本空间中被稀疏区域(噪声)分割开的稠密区域。通过剔除处于稀疏区域的样本，即运动模糊样本和异常品位落差样本。

在本发明实施例中，针对浮选泡沫样本进行去噪处理，将密度聚类算法只能够的边界对象视为落差样本(噪声)，对于样本集Db＝{x₁,x₂,...,x_n}，定义以下概念：

1)ε邻域：对于x_n∈D_b,其ε邻域包含数据集D_b中与x_n距离不大于ε的样本，即：N_ε(x_n)＝{x_n∈D_b|dist(x_n,x_m)≤ε}；

2)核心对象：若x_n的ε邻域至少包含MinPts个样本，即|N_ε(x_i)|≥MinPts，则x_n是一个核心对象；

3)噪声对象：若x_n的ε邻域内样本个数少于MinPts则视为噪声对象；

4)密度直达：若x_m位于x_n的ε邻域中，且x_n是核心对象，则称x_m由x_n密度直达；

5)密度可达：对x_n，x_m，若存在样本序列P₁，P₂......Pn，其中P₁＝x₁，Pn＝x_n且P_i+1由P_i密度直达，则称x_m由x_n密度可达

6)密度相连：对x_n，x_m，若存在x_k使得x_n与x_m均由x_k密度可达，则称x_n，x_m密度相连。

在本发明实施例中，将步骤S101中获得的图样样本集作为输入样本集D_b＝{x₁,x₂,...,x_n},其中b＝1,2,...m,m＝total(样本数量)/n,n取50。并输入邻域参数邻域距离阈值和邻域样本数量阈值，分别为(ε，MinPts)，初始化b＝1。

在本发明实施例中，聚类簇生成的具体过程包括：1)取出n个样本，初始化核心对象集合：

2)计算样本x_i与其他样本的欧氏距离；3)计算样本x_i的ε邻域N_∈(x_i)；4)若|N_ε(x_i)|≥MinPts，将样本x_i放到核心对象集合，即H＝H∪{x_i}；5)重复1到4步骤n次；6)生成非核心样本簇

(注：

)；7)初始化聚类簇数：j＝1；8)初始化未访问核心样本集合：W＝H；9)记录当前未访问过的核心样本集合W_un＝W；10)随机选择一个核心对象o∈H，初始化队列Q＝<o>；11)更新W，W＝W\{o}；12)取出队列Q的队首样本q；13)若|N_ε(q)|≥MinPts，令Ω＝N_e(q)∩W；14)将Ω中的样本加入队列Q；15)更新W，W＝W\Ω；16)若

跳转至第12步；17)j＝j+1,生成聚类簇C_bj＝W_un\W；18)更新H，H＝H\C_bj；19)若

跳转至9步；20)生成聚类簇C_b＝{C_b1,C_b2,...,C_bj}；21)b＝b+1，若b≤m,则跳转至第1步；22)最终获得样本集Samples＝SUM(MaxLen(C_b))，噪声集Noise＝D_b\Samples。在每一个样本子集得到的聚类簇C_b中，由于其中噪声样本属少数，MaxLen(C_b)表示该轮聚类结果中，样本数最多的簇，即无噪声准确样本。

图像间欧氏距离计算公式为：

式中，(x_i1，x_i2)表示两个对象，N是像素总数。

在本发明实施例中，本次训练样本类别为6类，如图2所示。A、B、C、D、E、F分别代表低等品位、中低品位、中等品位、中高品位、高等品位和异常工况(翻矿浆工况)样本各200张，其中A、B、C、D、E类工况可通过以上算法获得准确样本，F类工况的样本则从聚类算法中剔除的样本中获得。

步骤S103，构建胶囊神经网络，输入所述训练样本本并采用动态路由算法和梯度下降算法进行训练优化获得浮选工况识别模型。

在本发明实施例中，所述胶囊神经网络由编码器和解码器构成，本次设计的胶囊网络编码器结构部分如图3所示。所述编码器包括输入层、卷积层、主胶囊层和数字胶囊层。

在本发明实施例中，输入层即图像样本，采用224×224的RGB三通道图像，由于每个像素都带有有意义的信息，缩小图像可能导致信息丢失，因此采用尺寸较大图像是为了尽可能保留图像中的所有信息。在光照稳定的场景下，同一工况下，由工业摄像机拍摄的工况视频后打乱帧序列，每一训练样本均经以上密度聚类算法处理获得，并准确标签。

在本发明实施例中，卷积层包括CONV1 ReLU层，CONV2 ReLU层，CONV3 ReLU层，每层卷积核个数分别为64、128、256，填充大小均为[0,0,0,0]，采用ReLU激活函数，三次卷积后得到28×28×256的特征图。经过三次卷积，中间并无池化操作，避免了信息丢失的同时减少训练参数的量。

在本发明实施例中，对于主胶囊(Primary Caps)层，输入大小为28×28×256，卷积核大小为5×5，卷积步幅为1×1，通道数为32，填充大小[0,0,0,0]，采用Squash激活函数。该层也称主胶囊层，将卷积之后的特征进行重塑，得到28×28×32的8D向量，即神经胶囊。

在本发明实施例中，对于数字胶囊层(FrothCaps)层，输入大小为28×28×32×8，输出为4×16D的向量。该层是胶囊神经网络的全连接层，在该层中，由于要识别6类工况，所以该层有6个胶囊。由于是全连接层，每个胶囊都会接受前一层(即Primary Caps层)所有胶囊的输出，所以每两个胶囊之间的连接权重W为8×16的矩阵。FrothCaps层中每个胶囊的输出向量的范数表示该胶囊实体出现的概率，所以分类的时候计算输出向量L₂范数，哪一类工况的向量大，则说明表征该类工况的概率大。由于不同胶囊的L₂范数输出独立，因此胶囊网络同时具备识别多个分类的能力。

在本发明实施例中，胶囊神经网络的解码器结构如图4所示，该部分为图片重构环节，根据前面完成的实例化参数，重新构建输入的图片，由三个全连接层构成。重构图片部分使用损失函数利用L₂范数度量，即用重构图片和原始图片的平方差的和作为重构损失函数，得到总的损失函数TotalLoss如式2。

TotalLoss＝Encoderloss+αDecoderloss (2)

其中Encoderloss和Decoderloss分别为编码器和解码器的损失，在公式中选择α＝0.0001，目的是为了避免重构损失值主导编码器损失值，从而保持正则化效应。

在本发明实施例中，胶囊网络训练时采用动态路由算法，胶囊是一组神经元的集合，它的输出是一个多维向量，因此它可以用来表示实体的一些属性信息，其模长可以用来表示实体出现概率，模长属性信息，模长值越大，表示该实体存在可能性越大。若实体的特征位置发生变化，胶囊输出的向量对应的模长不会变化，只改变其方向，实现同变性。

胶囊网络允许多个分类同时存在，因此不能再使用传统交叉熵损失函数,而是采用了边缘损失的方式作为损失函数，间隔损失如公式(3)所示。式中：L_k为经过计算得到的间隔损失；T_k为第k分类的存在值，若存在则取1，否则取0；m⁺、m^-和λ分别取0.9、0.1、0.5。

L_k＝T_kmax(0,m⁺-||v_k||)²+λ(1-T_k)max(0,||v_k||-m^-)² (3)

在本发明实施例中，神经胶囊的工作原理如图5所示，可以简单概括为4个步骤，即矩阵转化、输人加权、加权求和、以及非线性变换。

图5中n_i为输人向量，第一步即将此向量与矩阵W_ij相乘得到向量N_j,做矩阵转化。n_i为输人层图片的低层特征,而W_ij包含低层特征和高层特征的空间关系以及其它重要关系，通过矩阵转化操作得到向量N_m，即高级特征。

式中

表示由低层特征i推出的高层特征j；W_ij表示转化矩阵；n_i表示输人向量。第一步如公式(4)所示，其中使用

表示图4中的N_j，高层特征有很多种，故向量N_j采用

的形式表示由低级特征i推出的高层特征j，

又称“预测胶囊”。

式中c_ij表示胶囊i连接至胶囊j的连接概率；b_ij表示胶囊i连接至胶囊j的先验概率。c_ij是由softmax函数计算获得的，softmax函数的结果是非负数，且每个独立的c_ij相加总和为1，因此c表示概率，softmax函数计算方法如公式(5)所示。

式中s_j表示l层胶囊的总输入。第二步对

进行输人加权，第三步进行加权求和,两步操作如公式(6)所示，即将

乘上耦合系数c_ij，再进行求和得到s_j，其中耦合系数c_ij通过动态路由方式更新，它决定了某一个低层胶囊送往哪个高级胶囊。

式中v_j表示l+1层的胶囊输出。第四步就是对s_j进行非线性变换得到v_j，采用激活函数如公式(7)所示，其中公式中第一部分的作用是压缩，如果s_j很长，第一项约等于1,反之如果s_j很短，第一项约等于0。第二部分的作用是将向量s_j单位化，因此第二项的长度为1。此步骤的主要功能就是控制v_j的长度不超过1,同时保持v_j和s_j同方向。经过此步骤，输出向量v_j的长度在0-1之间，因此可通过v_j的长度确定具有某个特征的概率。

在动态路由第一次迭代过程中，因b_ij都被初始化为0，耦合系数c_ij此时都相等，所以l层的胶囊i要传递给l+1层中的哪个高级胶囊j的概率是平等的。经过这四个工作步骤，最终以

的结果来更新b_ij。经过r次迭代后，输出v_j。

在本发明实施例中，所述动态路由算法过程具体包括：

1)对所有l层的胶囊i及所有(l+1)层的胶囊j，有b_ij＝0；

2)对所有l层的胶囊i，有c_ij＝softmax(b_ij)；

3)对所有l+1层的胶囊j，有

4)对所有l+1层的胶囊j，有v_j＝Squash(s_j)；

5)对所有在l层的胶囊i和l+1层的胶囊j，有

6)迭代步骤2至步骤5共r次，输出v_j。

通过上述路由动态算法更新两个胶囊直接的连接权重(权重和为1)，并采用梯度下降法优化更新胶囊之间的连接权值，经训练样本训练优化后获得浮选工况识别模型。

步骤S104，将待测工况图像样本输入所述浮选工况识别模型进行工况识别获得待测工况图像样本的工况类别。

本发明采用了基于密度聚类的浮选泡沫训练样本去噪方法，可以实现批量、准确快速标签，通过减少错误标签，以提高模型工况识别准确率；并构建了新的胶囊网络进行浮选泡沫工况识别模型的建立，采用动态路由算法和梯度下降算法进行模型训练和优化，其所需训练数据量少，响应时间快，工况识别准确率也进一步提高。

实施例

本发明的实验软件平台为Python3平台和谷歌开源平台TensorFlow，硬件平台为NVIDA GeForce RTX 2080Ti GPU和Intel酷睿i99700k CPU，数据集总数为1200，每个类别样本数均为200。训练时使用“k折交叉验证”，k取10，对模型进行训练时，其中1080张图像中用于训练，其余120张用于验证，采用Adam算法进行优化，然后在每个epoch，对训练集和验证集进行洗牌，避免训练数据被过度拟合，以产生一个稳定的的架构。

训练胶囊网络模型过程中，模型的总损失TotalLoss、训练准确率Train Accuracy和验证准确率ValidationAccuracy变化情况如图5，其中TotalLoss降至0.35左右，ValidationAccuracy达到97.33％。

本发明使用CNN经典轻型框架InceptionV3与该CapsNet结构在训练结果、训练样本量、样本尺寸、模型参数和相同CPU下的响应速度方面，Inception V3与Froth-CapsNet结构相比较见表1：

表1 InceptionV3与CapsNet相关性能比较

Inception V3模型是目前经典CNN框架中参数较少的，从表1可知，CapsNet与卷积网络模型相比，所需训练数据量少，响应时间快，工况类别识别准确率也有进一步提高。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

应该理解的是，虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

Claims

1.一种基于密度聚类和胶囊神经网络的浮选工况识别方法，其特征在于，具体包括：

2.根据权利要求1所述的基于密度聚类和胶囊神经网络的浮选工况识别方法，其特征在于，所述将所述视频数据进行预处理获得图像样本集步骤具体包括：

3.根据权利要求1所述的基于密度聚类和胶囊神经网络的浮选工况识别方法，其特征在于，所述将所述图像样本集采用预设的密度聚类方法进行去噪优化获得多个工况类别的训练样本和测试样本步骤具体包括：

获取图像样本集、邻域距离阈值和邻域样本数量阈值；

4.根据权利要求3所述的基于密度聚类和胶囊神经网络的浮选工况识别方法，其特征在于，所述图像间欧氏距离的计算公式为：

式中，(x_i1，x_i2)表示两个对象，N是像素总数。

5.根据权利要求1所述的基于密度聚类和胶囊神经网络的浮选工况识别方法，其特征在于，所述胶囊神经网络包括编码器和解码器；所述编码器包括输入层、卷积层、主胶囊层和数字胶囊层。

6.根据权利要求5所述的基于密度聚类和胶囊神经网络的浮选工况识别方法，其特征在于，所述卷积层包括CONV1 ReLU层，CONV2 ReLU层，CONV3 ReLU层，在卷积过程采用ReLU激活函数进行激活。

7.根据权利要求5所述的基于密度聚类和胶囊神经网络的浮选工况识别方法，其特征在于，所述解码器将所述数字胶囊层处理后的图片采用三个全连接层进行重构，并以重构图片和原始图片的像素平方差的和作为重构损失函数。

8.根据权利要求5所述的基于密度聚类和胶囊神经网络的浮选工况识别方法，其特征在于，所述动态路由算法具体包括：

计算胶囊i连接至胶囊j的连接概率c_ij；

根据公式

计算(l+1)层的胶囊j的总输入，其中

W_ij表示转化矩阵；n_i表示输人向量；并根据公式

获得胶囊输出；

根据

对先验概率b_ij进行更新，经多次迭代后输出v_j。