CN115937161A - 基于自适应阈值半监督的矿石分选方法和计算机存储介质 - Google Patents

基于自适应阈值半监督的矿石分选方法和计算机存储介质 Download PDF

Info

Publication number
CN115937161A
CN115937161A CN202211629189.1A CN202211629189A CN115937161A CN 115937161 A CN115937161 A CN 115937161A CN 202211629189 A CN202211629189 A CN 202211629189A CN 115937161 A CN115937161 A CN 115937161A
Authority
CN
China
Prior art keywords
prediction result
sample
ore
auxiliary
classification prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211629189.1A
Other languages
English (en)
Inventor
王杉
王龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Jiaotong University
Original Assignee
East China Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Jiaotong University filed Critical East China Jiaotong University
Priority to CN202211629189.1A priority Critical patent/CN115937161A/zh
Publication of CN115937161A publication Critical patent/CN115937161A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及基于自适应阈值半监督的矿石分选方法和计算机存储介质。该方法包括将标注矿石样本输入网络模型以获得第一预测结果,丢弃大于标注自适应阈值α的所述第一预测结果,将剩余所述第一预测结果与其所属的真实标签求交叉熵损失;处理未标注矿石样本并输入网络模型以获得第一预测输出结果和第二预测输出结果;基于所述第一预设输出结果和所述第二预测输出结果得到KL散度损失,将所述交叉熵损失和所述KL散度损失相加进行反向传播,以优化所述网络模型;训练所述网络模型,然后基于训练好的所述网络模型进行矿石分选。本发明通过自适应阈值调整训练策略,实现少量标注样本下的模型训练效果接近监督学习。

Description

基于自适应阈值半监督的矿石分选方法和计算机存储介质
技术领域
本发明涉及矿石分选领域,更具体地说,涉及一种基于自适应阈值半监督的矿石分选方法和计算机存储介质。
背景技术
在人工智能高速发展的背景下,目前的选矿设备制造企业,通常最新的X射线透视成像+人工智能识别的技术路线。而基于卷积神经网络的识别技术,是当今图像识别的主流方式之一,其可以有效提取矿石的特征,提高分选精度。但此类识别技术属于监督学习类型,需要依靠大量标注样本进行模型的训练、测试,因此在采样、标注工作的人力、时间成本会相应提高。而且对于X射线成像的矿石来讲,不仅矿源品味会发生波动,射线本身的衰减也会导致整个图像数据分布随着时间变化,迫使每次重新训练都需要对所有新的样本进行人工标注。
半监督学习的任务是使用有限的标注数据和大量的非标注数据训练模型,以获得更好的性能。目前存在于半监督学习中的关键问题是如何从无标签数据中充分的提取有效信息。当前流行的半监督学习方法通过固定的置信度阈值使模型只关注符合固定阈值要求的标注数据和非标注数据,而其他标注数据和非标注数据将被忽略,这不但不能对数据进行充分有效的学习,还会造成错误伪标签发生的概率较高。
发明内容
本发明要解决的技术问题在于,针对现有技术中的前述问题,提供一种基于自适应阈值半监督的矿石分选方法和计算机存储介质,通过利用网络模型提取图像特征,通过自适应阈值调整训练策略,实现少量标注样本下的模型训练效果接近监督学习,从而实现高精度、低成本、大批量的矿石分选。
本发明解决其技术问题所采用的技术方案是:构造一种自适应阈值半监督的矿石分选方法,包括:
S1、采集矿石样本并对部分所述矿石样本进行标注获得标注矿石样本和未标注矿石样本;
S2、将标注矿石样本输入网络模型以获得第一预测结果,将所述第一预测结果与标注自适应阈值进行比较,丢弃大于所述标注自适应阈值α的所述第一预测结果,将剩余所述第一预测结果与其所属的真实标签求交叉熵损失;
S3、处理所述未标注矿石样本以获得第一处理样本、第二处理样本、第三处理样本和第四处理样本,将所述第一处理样本和所述第二处理样本输入所述网络模型以获得第一预测输出结果,将所述第三处理样本和所述第四处理样本输入所述网络模型以获得第二预测输出结果;
S4、基于所述第一预设输出结果和所述第二预测输出结果得到KL散度损失,将所述交叉熵损失和所述KL散度损失相加进行反向传播,以优化所述网络模型;
S5、调整所述网络模型的超参数学习率、优化器方法并重复执行所述步骤S2-S4以训练所述网络模型,然后基于训练好的所述网络模型进行矿石分选。
在本发明所述的自适应阈值半监督的矿石分选方法中,在所述步骤S2中,所述标注自适应阈值α的取值范围如下:
Figure BDA0004002542100000031
其中i表示当前迭代次数,取值为正整数;α(i)表示所述标注自适应阈值α在第i次迭代后生成值;k表示第k次迭代后开始呈现正弦式上升;μmin表示所述标注自适应阈值的最小值;μmax表示所述标注自适应阈值的最大值;
所述交叉熵失
Figure BDA0004002542100000032
其中,N表示标注矿石样本的个数;x i表示第i个矿石样本;yi表示第i个样本的真实标签;P表示预测样本的最大类别概率。
在本发明所述的自适应阈值半监督的矿石分选方法中,所述步骤S3进一步包括:
S31、对所述未标注矿石样本进行弱增强和强增强以分别获得第一处理样本和第二处理样本,在所述第一处理样本和所述第二处理样本中分别引入梯度噪声以生成所述第三处理样本和所述第四处理样本;
S32、将所述第一处理样本和所述第二处理样本输入所述网络模型以获得分别对应主分类器和辅助分类器的第一主分类预测结果、第二主分类预测结果、第一辅助分类预测结果和第二辅助分类预测结果;
S33、将所述第三处理样本和所述第四处理样本输入所述网络模型以获得分别对应主分类器和辅助分类器的第三主分类预测结果、第四主分类预测结果、第三辅助分类预测结果和第四辅助分类预测结果。
在本发明所述的自适应阈值半监督的矿石分选方法中,在所述步骤31中,令所述未标注矿石样本U=[U1,U2,...,UN]∈RN*D,其中R表示实数集,N表示样本个数,D表示特征维度;将符合标准正太分布的随机噪声γ注入所述未标注矿石样本U中,然后经过所述网络模型的反向传播求出梯度噪声
Figure BDA0004002542100000041
其中Dkl为KL散度损失计算函数,i表示迭代次数,θ表示所述网络模型的权重,ui表示第i次迭代下的未标注矿石样本,γ表示正态分布的随机噪声;P(y|ui,θ)表示输入未标注矿石样本ui后得到输出类别为y的概率。
在本发明所述的自适应阈值半监督的矿石分选方法中,所述步骤S4进一步包括:
S41、将所述第三主分类预测结果和所述第三辅助分类预测结果与未标注自适应阈值β进行比较,将大于所述未标注自适应阈值β的所述第三主分类预测结果和所述第三辅助分类预测结果保留,其余丢弃;
S42、将所述步骤S41获得的所述第三主分类预测结果和所述第三辅助分类预测结果与所述第一主分类预测结果和第一辅助分类预测结果做KL散度损失以获得第一KL散度损失;
S43、将所述第四主分类预测结果和所述第四辅助分类预测结果与所述未标注自适应阈值β进行比较,将大于所述未标注自适应阈值β的所述第四主分类预测结果和所述第四辅助分类预测结果保留,其余丢弃;
S44、将所述步骤S43获得的所述第四主分类预测结果和所述第四辅助分类预测结果与所述第二主分类预测结果和第二辅助分类预测结果做KL散度损失以获得第二KL散度损失;
S45、将所述第一主分类预测结果和第一辅助分类预测结果与所述第二主分类预测结果和第二辅助分类预测结果做KL散度损失以获得第三KL散度损失。
在本发明所述的自适应阈值半监督的矿石分选方法中,在所述步骤S4中,所述未标注自适应阈值β满足
Figure BDA0004002542100000051
其中i表示迭代次数,c表示类别,τ为设定的固定阈值;
Figure BDA0004002542100000056
代表第i次迭代c类的伪标签个数,
Figure BDA0004002542100000052
Figure BDA0004002542100000053
为归一化结果
Figure BDA0004002542100000054
所述KL散度损失
Figure BDA0004002542100000055
N表示标注矿石样本的个数;ui表示第i次迭代下的未标注矿石样本;γ表示正态分布的随机噪声;d表示梯度噪声;P表示预测样本的最大类别概率。
在本发明所述的自适应阈值半监督的矿石分选方法中,所述网络模型包括ResNet-CA-AUX模型;
所述ResNet-CA-AUX模型包括第一主组件、两个第一ResNet-CA组件、两个第二ResNet-CA组件、两个第三ResNet-CA组件、两个第四ResNet-CA组件、第二主组件、主分类器、第一辅助组件、第二辅助组件、第三辅助组件和辅助分类器;
所述第一主组件依次连接所述两个第一ResNet-CA组件、所述两个第二ResNet-CA组件、所述两个第三ResNet-CA组件、所述两个第四ResNet-CA组件、所述第二主组件和所述主分类器;
所述第一辅助组件连接在第二ResNet-CA组件和第三ResNet-CA组件之间,并同时依次连接所述第二辅助组件、第三辅助组件和辅助分类器。
在本发明所述的自适应阈值半监督的矿石分选方法中,每个ResNet-CA组件包括第一池化层、第二池化层、合并卷积层、批量归一激活层、第一卷积层、第二卷积层、第一激活层和第二激活层,以及输出层,所述第一池化层和第二池化层分别接收输入残差,并依次连接所述合并卷积层和所述批量归一激活层,所述第一卷积层连接所述批量归一激活层和所述第一激活层,所述第二卷积层连接所述批量归一激活层和所述第二激活层,所述第一激活层和所述第二激活层连接所述输出层。
在本发明所述的自适应阈值半监督的矿石分选方法中,所述第一主组件包括卷积层、归一化网络层、激活函数层和池化层;所述第二主组件包括自适应平均池化层和全连接层;所述第一辅助组件包括自适应池化层;所述第二辅助组件包括卷积层、归一化网络层和激活函数层;所述第三辅助组件包括第一全连接层、激活函数层、失活层和第二全连接层。
本发明解决其技术问题采用的技术方案是,构造一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的自适应阈值半监督的矿石分选方法。
本发明的基于自适应阈值半监督的矿石分选方法和计算机存储介质,通过利用网络模型提取图像特征,通过自适应阈值调整训练策略,实现少量标注样本下的模型训练效果接近监督学习,从而实现高精度、低成本、大批量的矿石分选。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明的自适应阈值半监督的矿石分选方法的优选实施例的流程图;
图2A-2D是本发明的自适应阈值半监督的矿石分选方法采样的凡口铅锌矿的矿石图像数据;
图3示出了根据本发明的优选实施例的ResNet-CA-AUX模型的结构示意图;
图4是图3所示的ResNet-CA-AUX模型的ResNet-CA组件的结构示意图;
图5是根据本发明的优选实施例的标注自适应阈值与迭代次数的之间的关系示意图;
图6是根据本发明的优选实施例的在样本中引入梯度噪声的示意图;
图7是根据本发明的优选实施例的自适应阈值半监督的矿石分选方法的流程示意图;
图8示出了采用本发明的基于自适应阈值半监督的矿石分选方法与已知的其他矿石分选方法的准确率比较示意图;
图9示出了采用Grad-CAM技术对不同比例样本下的最优模型进行热力图显示。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1是本发明的自适应阈值半监督的矿石分选方法的优选实施例的流程图。如图1所示,在步骤S1中,采集矿石样本并对部分所述矿石样本进行标注获得标注矿石样本和未标注矿石样本。在本发明的优选实施例中,所述矿石样本是指矿石图像数据,如图2A-2D所示的凡口铅锌矿石图像数据。图2A-2B所示为精矿图像数据,图2C-2D所示为尾矿图像数据。当然,在本发明的其他优选实施例中,可以采用任何适合的矿石图像数据。在本发明的优选实施例中,可以对10%左右的所述矿石样本进行标注获得标注矿石样本和未标注矿石样本。当然,在本发明的其他优选实施例中,可与选择其他百分比的矿石样本进行标注。标注数量越多,工作量就越大。而在本发明中,可以基于矿石样本制作数据集,并将数据集为划分为训练集、测试集、验证集。其中训练集中仅10%的数据为标注样本,剩余都是未标注样本。测试集和验证集都是标注样本,用以测试验证最终的识别精度。
在步骤S2中,将标注矿石样本输入网络模型以获得第一预测结果,将所述第一预测结果与标注自适应阈值进行比较,丢弃大于所述标注自适应阈值α的所述第一预测结果,将剩余所述第一预测结果与其所属的真实标签求交叉熵损失。
在本发明的优选实施例中,所述标注自适应阈值α的取值范围如下:
Figure BDA0004002542100000081
其中i表示当前迭代次数,取值为正整数;α(i)表示所述标注自适应阈值α在第i次迭代后生成值。k表示第k次迭代后开始呈现正弦式上升。图5是根据本发明的优选实施例的标注自适应阈值与迭代次数的之间的关系示意图。如图5所示,在迭代次数i小于某个数值,例如51,标注自适应阈值α不变,为所述标注自适应阈值的最小值,例如为0.6。而在迭代次数大于51之后,所述标注自适应阈值α呈现正弦式上升,即为
Figure BDA0004002542100000091
而在迭代次数继续增加,例如增加到k=5100,之后,所述标注自适应阈值α接近所述标注自适应阈值的最大值,其优选取值为0.99。
所述交叉熵失
Figure BDA0004002542100000092
其中,N表示标注矿石样本的个数;x i表示第i个矿石样本;yi表示第i个样本的真实标签;P表示预测样本的最大类别概率,即Pi表示预设第i个样本的最大类别概率。
在此,通过利用自适应阈值,很好克服了半监督训练精度难以提高的问题,以10%的标注样本可以接近监督训练的效果,大大减少人工标签数据带来的人力和时间成本,提高现场分选效率。
在此,所述网络模型可以选择本领域中任何适合的神经网络模型,例如ResNet网络模型,例如ResNet-CA或者ResNet18网络模型。在本发明的进一步的优选实施例中,为了增加数据,并且提高网络模型的中间特征层的特征提取能力,本申请借用InceptionV3的辅助分类器思想,提出了改进的ResNet-CA网络模型,即ResNet-CA-AUX模型。
图3示出了根据本发明的优选实施例的ResNet-CA-AUX模型的结构示意图。如图3所示,所述ResNet-CA-AUX模型包括第一主组件100、两个第一ResNet-CA组件1、两个第二ResNet-CA组件2、两个第三ResNet-CA组件3、两个第四ResNet-CA组件4、第二主组件300、主分类器200、第一辅助组件400、第二辅助组件500、第三辅助组件600和辅助分类器700。如图3所示,所述第一主组件100依次连接所述两个第一ResNet-CA组件1、所述两个第二ResNet-CA组件2、所述两个第三ResNet-CA组件3、所述两个第四ResNet-CA组件4、所述第二主组件300和所述主分类器200。所述第一辅助组件400连接在第二ResNet-CA组件2和第三ResNet-CA组件3之间,并同时依次连接所述第二辅助组件500、第三辅助组件600和辅助分类器700。
进一步如图3所示,所述第一主组件100包括卷积层、归一化网络层、激活函数层和池化层,即Conv2d+Bn+Relu+Pool。所述第二主组件300包括自适应平均池化层和全连接层,即avg+fc。所述第一辅助组件包括自适应池化层AdaptAvgPool。所述第二辅助组件包括卷积层、归一化网络层和激活函数层,即Conv2d+Bn+Relu;所述第三辅助组件包括第一全连接层、激活函数层、失活层和第二全连接层,即Fc+Relu+Droupout+Fc。
图4是图3所示的第一-第四ResNet-CA组件1-4的结构示意图。不同的组件1-4之前的区别在于其参数设置的不同。如图4所示,每个ResNet-CA组件包括第一池化层11,即XAvgPool;第二池化层12,即Y AvgPool;合并卷积层13,即Concat+Conv2d,批量归一激活层14,即BatchNorm+Relu;第一卷积层15,即Conv2d;第二卷积层16,即Conv2d;第一激活层16,即Sigmoid以及第二激活层17,即Sigmoid。所述第一池化层11和第二池化层12分别接收输入残差,并依次连接所述合并卷积层13和所述批量归一激活层14,所述第一卷积层15连接所述批量归一激活层14和所述第一激活层16,所述第二卷积层连接所述批量归一激活层14和所述第二激活层18,所述第一激活层17和所述第二激活层18连接所述输出层。
通过采用图3-4所示的ResNet-CA-AUX模型,从同样的数据样本中可以提取中更多的中间层特征,增加数据的利用率,从而能够在后续训练过程中获得更加准确的训练结果。
在步骤S3中,处理所述未标注矿石样本以获得第一处理样本、第二处理样本、第三处理样本和第四处理样本,将所述第一处理样本和所述第二处理样本输入所述网络模型以获得第一预测输出结果,将所述第三处理样本和所述第四处理样本输入所述网络模型以获得第二预测输出结果。
在本发明的一个优选实施例中,对所述未标注矿石样本进行弱增强和强增强以分别获得第一处理样本和第二处理样本。优选地,可以将第一处理样本和第二处理样本处理成96×96像素。在所述第一处理样本和所述第二处理样本中分别引入梯度噪声以生成所述第三处理样本和所述第四处理样本。在所述第一处理样本和所述第二处理样本中分别引入梯度噪声可以增强网络模型的鲁棒性。图6是根据本发明的优选实施例的在样本中引入梯度噪声的示意图。具体地,令所述未标注矿石样本U=[U1,U2,...,UN]∈RN*D,其中R表示实数集,N表示样本个数,D表示特征维度。将符合标准正太分布的随机噪声γ注入所述未标注矿石样本U中,然后经过所述网络模型的反向传播求出梯度噪声
Figure BDA0004002542100000111
其中Dkl为KL散度损失计算函数,i表示迭代次数,θ表示所述网络模型的权重,ui表示第i次迭代下的未标注矿石样本,γ表示正态分布的随机噪声;P(y|ui,θ)表示输入未标注矿石样本ui后得到输出类别为y的概率,P(y|(ui+γ),θ)表示输入加入噪声后的输入未标注矿石样本ui后得到输出类别为y的概率。d表示梯度噪声的梯度。
在本发明的优选实施例中,所述网络模型为前述ResNet-CA-AUX模型。
在本发明的优选实施例中,可以选择如下KL散度损失计算函数:
Figure BDA0004002542100000121
其中,i表示迭代次数;N表示样本的个数;P、Q表示两个不同的概率分布系统;H(P,Q)表示P、Q两个概率系统的交叉熵;H(P)表示P系统的信息熵。将P(y|ui,θ)和P(y|(ui+γ),θ)作为两个不同的概率分布系统带入前述KL散度损失计算函数,获得Dkl(P(y|ui,θ),P(y|(ui+γ),θ))。
优选的,如图6所示,为了防止权重衰减,在加入噪声之前还可以进行L2正则化。进一步如图6所示,在随后将所述第一处理样本和所述第二处理样本输入所述网络模型以获得分别对应主分类器和辅助分类器的第一主分类预测结果、第二主分类预测结果、第一辅助分类预测结果和第二辅助分类预测结果;将所述第三处理样本和所述第四处理样本输入所述网络模型以获得分别对应主分类器和辅助分类器的第三主分类预测结果、第四主分类预测结果、第三辅助分类预测结果和第四辅助分类预测结果。然后针对第一主分类预测结果、第二主分类预测结果、第一辅助分类预测结果和第二辅助分类预测结果、第三主分类预测结果、第四主分类预测结果、第三辅助分类预测结果和第四辅助分类预测结果计算KL损失。
在步骤S4中,基于所述第一预设输出结果和所述第二预测输出结果得到KL散度损失,将所述交叉熵损失和所述KL散度损失相加进行反向传播,以优化所述网络模型。
在本发明的优选实施例中,如前所述,所述第一预设输出结果包括第一主分类预测结果、第二主分类预测结果、第一辅助分类预测结果和第二辅助分类预测结果;所述第二预设输出结果包括第三主分类预测结果、第四主分类预测结果、第三辅助分类预测结果和第四辅助分类预测结果。
在本发明的优选实施例中,先将所述第三主分类预测结果和所述第三辅助分类预测结果与未标注自适应阈值β进行比较,将大于所述未标注自适应阈值β的所述第三主分类预测结果和所述第三辅助分类预测结果保留,其余丢弃。然后将保留的所述第三主分类预测结果和所述第三辅助分类预测结果与所述第一主分类预测结果和第一辅助分类预测结果做KL散度损失以获得第一KL散度损失。
在本发明的优选实施例中,先将所述第四主分类预测结果和所述第四辅助分类预测结果与所述未标注自适应阈值β进行比较,将大于所述未标注自适应阈值β的所述第四主分类预测结果和所述第四辅助分类预测结果保留,其余丢弃。然后将保留的所述第四主分类预测结果和所述第四辅助分类预测结果与所述第二主分类预测结果和第二辅助分类预测结果做KL散度损失以获得第二KL散度损失。
在本发明的优选实施例中,将所述第一主分类预测结果和第一辅助分类预测结果与所述第二主分类预测结果和第二辅助分类预测结果做KL散度损失以获得第三KL散度损失。
在本发明的优选实施例中,前述第一KL散度损失、第二KL散度损失和第三KL散度损失可以同时计算或者按照任何适合的顺序进行计算,这些都落入本发明的保护范围。
在本发明的优选实施例中,所述未标注自适应阈值β满足
Figure BDA0004002542100000131
代表第i次迭代c类的伪标签个数,
Figure BDA0004002542100000132
Figure BDA0004002542100000133
为归一化结果
Figure BDA0004002542100000141
Figure BDA0004002542100000142
其中i表示迭代次数,c表示类别,τ为设定的固定阈值,其优选可以设为0.95。L表示条件函数,满足条件为1,不满足则为0。Pi(y|un,θ)表示在第i次迭代时,输入未标注矿石样本un,得到输出类别y的概率,θ表示所述网络模型的权重,例如前述ResNet-CA-AUX模型。
在本发明的优选实施例中,第一KL散度损失、第二KL散度损失和第三KL散度损失可以根据本领域中任何已知方案进行计算,例如
所述KL散度损
Figure BDA0004002542100000143
N表示标注矿石样本的个数;ui表示第i次迭代下的未标注矿石样本;γ表示正态分布的随机噪声;d表示梯度噪声;P表示预测样本的最大类别概率。
在步骤S5中,调整所述网络模型的超参数学习率、优化器方法并重复执行所述步骤S2-S4以训练所述网络模型,然后基于训练好的所述网络模型进行矿石分选。在本发明的一个优选实施例中,所有的网络模型、数据在Ubuntu18.04操作系统下运行,虚拟环境中使用PyTorch 1.12.0版本的深度学习框架,NVIDIA GeForce 3080Ti GPU进行训练,实验的数据来源于凡口铅锌矿。在此,基于本发明的教导和本领域中的公知常识,本领域人员知悉如何对网络模型进行训练,从而获得最优网络模型。例如,可以通过N次不断微调网络模型,即前述ResNet-CA-AUX模型的相关超参数,如学习率初始值、学习率变化方法、优化器种类,将训练集输入前述ResNet-CA-AUX模型,利用验证集寻找最优的N个ResNet-CA-AUX模型,最后利用测试集测试,得到分选效果最好的一个ResNet-CA-AUX模型。
本发明的自适应阈值半监督的矿石分选方法,通过利用网络模型提取图像特征,通过自适应阈值调整训练策略,实现少量标注样本下的模型训练效果接近监督学习,从而实现高精度、低成本、大批量的矿石分选。本发明的自适应阈值半监督的矿石分选方法,很好克服了半监督训练精度难以提高的问题,以10%的标注样本可以接近监督训练的效果,大大减少人工标签数据带来的人力和时间成本,提高现场分选效率。当矿源变化或射线衰减导致效果差,可直接跳过标注工作进行模型的迁移训练,实现用时少,精度高的效果,给企业和客户带来可观的效益和便利。进一步的,本发明的自适应阈值半监督的矿石分选方法从标注样本和未标注样本两个角度综合考虑,设置合理的两个动态阈值,大大减少了错误伪标签发生的概率。更进一步地,在数据增强上,引入梯度噪声来提高模型的鲁棒性,并对ResNet进行改进,提出改进的ResNet-CA网络,实现少量标注样本下的模型训练效果接近监督学习,在实际工业环境下,减少模型对标注样本的依赖,满足工业环境下矿石分选精度的要求。
图7是根据本发明的优选实施例的自适应阈值半监督的矿石分选方法的流程示意图。如图7所示,在采集矿石图像样本并对部分所述矿石图像样本进行标注获得标注矿石样本(即输入标注数据)和未标注矿石样本(即输入未标注数据)。对于输入标注数据和输出标注数据,其分为三支进行后续处理,具体如图7所示。
对于输入标注数据,其标注有真实标签。将标注矿石图像样本输入网络模型以获得第一预测结果,将所述第一预测结果与标注自适应阈值α进行比较,丢弃大于所述标注自适应阈值α的所述第一预测结果,将剩余所述第一预测结果与其所属的真实标签求交叉熵损失,即获得损失1。
对于输入标注数据,对其经过弱增强和强增强,得到第一处理样本Uw和第二处理样本Us,拼接处理之后,输入前述ResNet-CA-AUX模型得到主分类器和辅助分类器对应四个输出,在拼接分离处理后,获得第一主分类预测结果Uw_1、第二主分类预测结果Us_1、第一辅助分类预测结果Uw_1’和第二辅助分类预测结果Us_1’。
对第一处理样本Uw和第二处理样本Us引入梯度噪声,得到加入梯度噪声的弱增强样本(即第三处理样本)Uwn、加入梯度噪声的强增强样本(即第四处理样本)Usn,拼接处理之后,输入前述ResNet-CA-AUX模型得到主分类器和辅助分类器对应四个输出,在拼接分离处理后,获得第三主分类预测结Uwn_1、第四主分类预测结Usn_1、第三辅助分类预测结果Uwn_1’、第四辅助分类预测结果Usn_1’。
进一步如图7所示,对于引入梯度噪声后的分类结果,即第三主分类预测结Uwn_1、第四主分类预测结Usn_1、第三辅助分类预测结果Uwn_1’、第四辅助分类预测结果Usn_1’,分别经过未标注自适应阈值β进行选择,然后进入KL散度损失计算,而针对未引入梯度噪声的分类结果,即第一主分类预测结果Uw_1、第二主分类预测结果Us_1、第一辅助分类预测结果Uw_1’和第二辅助分类预测结果Us_1’,直接进行KL散度损失计算。即对引入梯度噪声前后的Uw_1和Uwn_1、Us_1’和Usn_1’做KL散度损失,得到损失2,对Us_1和Usn_1、Uw_1’和Uwn_1’做KL散度损失,得到损失3;对所述输出Uw_1和Us_1、Uw_1’和Us_1’做KL散度损失,得到损失4。将所有损失相加进行反向传播,优化所述网络模型。
具体的KL散度损失、交叉熵损失的计算,未标注自适应阈值β和标注自适应阈值α的取值可以参照前述实施例,在此不在累述了。
为了验证本发明的基于自适应阈值半监督的矿石分选方法的有益效果,选择2%、5%、10%的样本进行标注,并检测不同比例的标注样本的情况下,能够获得的准确率与全监督算法进行比较,获得表1所示比较结果:
表1
Figure BDA0004002542100000171
参照表1可知,无论是矿石识别准确率、废矿识别准确率还是平均识别准确率,针对10%的样本,采用本发明的基于自适应阈值半监督的矿石分选方法都与采用已知的全监督算法相当。因此本发明的自适应阈值半监督的矿石分选方法,很好克服了半监督训练精度难以提高的问题,以10%的标注样本可以接近监督训练的效果,大大减少人工标签数据带来的人力和时间成本,提高现场分选效率。
进一步地,我们在10%标注样本情况下,通过CA注意力机制、辅助分类器AUX、数据增强、梯度噪声、两个动态自适应阈值α和β、辅助分类器进行消融实验,证明了本发明的基于自适应阈值半监督的矿石分选方法的有效性和适用性。
表2本发明的基于自适应阈值半监督的矿石分选方法在10%标注样本下的消融实验
Figure BDA0004002542100000172
Figure BDA0004002542100000181
图8示出了采用本发明的基于自适应阈值半监督的矿石分选方法与已知的其他矿石分选方法的准确率比较示意图。如图8所示,当标注样本比例低至1%,所有算法的错误率出现大幅上升,其中效果最好的是FlexMatch方法。当标注样本比例为5%、10%,本发明的基于自适应阈值半监督的矿石分选方法的错误率最低,比MixMatch、FixMatch、Pi、MeanTeacher等方法的错误率下降了2%左右。
图9示出了采用Grad-CAM技术对不同比例样本下的采用本发明的基于自适应阈值半监督的矿石分选方法获得的最优网络模型进行热力图显示。其中(a)和(e)为输入所述最优网络模型前的矿石、废石图片。(b)到(d)和(f)到(h)显示的是不同比例的标注样本的最优网络模型的热力图显示。可以发现:1%标注模型的关注点大部分不在矿石区域内;5%标注模型关注点虽然大部分在矿石区域,但对于明显的矿斑关注度不够集中;10%的标注模型关注区域不仅在矿石上,且对于明显的矿斑赋予的关注度更多、更集中。因此,这进一步证明了,本发明的基于自适应阈值半监督的矿石分选方法可以更精确地进行矿石分选。
本发明还涉及一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序包含能够实现本发明方法的全部特征,当其安装到计算机系统中时,可以实现本发明的方法。本文件中的计算机程序所指的是:可以采用任何程序语言、代码或符号编写的一组指令的任何表达式,该指令组使系统具有信息处理能力,以直接实现特定功能,或在进行下述一个或两个步骤之后实现特定功能:a)转换成其它语言、编码或符号;b)以不同的格式再现。
虽然本发明是通过具体实施例进行说明的,本领域技术人员应当明白,在不脱离本发明范围的情况下,还可以对本发明进行各种变换及等同替代。另外,针对特定情形或材料,可以对本发明做各种修改,而不脱离本发明的范围。因此,本发明不局限于所公开的具体实施例,而应当包括落入本发明权利要求范围内的全部实施方式。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种自适应阈值半监督的矿石分选方法,其特征在于,包括:
S1、采集矿石样本并对部分所述矿石样本进行标注获得标注矿石样本和未标注矿石样本;
S2、将标注矿石样本输入网络模型以获得第一预测结果,将所述第一预测结果与标注自适应阈值进行比较,丢弃大于所述标注自适应阈值α的所述第一预测结果,将剩余所述第一预测结果与其所属的真实标签求交叉熵损失;
S3、处理所述未标注矿石样本以获得第一处理样本、第二处理样本、第三处理样本和第四处理样本,将所述第一处理样本和所述第二处理样本输入所述网络模型以获得第一预测输出结果,将所述第三处理样本和所述第四处理样本输入所述网络模型以获得第二预测输出结果;
S4、基于所述第一预设输出结果和所述第二预测输出结果得到KL散度损失,将所述交叉熵损失和所述KL散度损失相加进行反向传播,以优化所述网络模型;
S5、调整所述网络模型的超参数学习率、优化器方法并重复执行所述步骤S2-S4以训练所述网络模型,然后基于训练好的所述网络模型进行矿石分选。
2.根据权利要求1所述的自适应阈值半监督的矿石分选方法,其特征在于,在所述步骤S2中,所述标注自适应阈值α的取值范围如下:
Figure FDA0004002542090000011
其中i表示当前迭代次数,取值为正整数;α(i)表示所述标注自适应阈值α在第i次迭代后生成值;k表示第k次迭代后开始呈现正弦式上升;μmin表示所述标注自适应阈值的最小值;μmax表示所述标注自适应阈值的最大值;
所述交叉熵失
Figure FDA0004002542090000021
其中,N表示标注矿石样本的个数;xi表示第i个矿石样本;yi表示第i个样本的真实标签;P表示预测样本的最大类别概率。
3.根据权利要求1所述的自适应阈值半监督的矿石分选方法,其特征在于,所述步骤S3进一步包括:
S31、对所述未标注矿石样本进行弱增强和强增强以分别获得第一处理样本和第二处理样本,在所述第一处理样本和所述第二处理样本中分别引入梯度噪声以生成所述第三处理样本和所述第四处理样本;
S32、将所述第一处理样本和所述第二处理样本输入所述网络模型以获得分别对应主分类器和辅助分类器的第一主分类预测结果、第二主分类预测结果、第一辅助分类预测结果和第二辅助分类预测结果;
S33、将所述第三处理样本和所述第四处理样本输入所述网络模型以获得分别对应主分类器和辅助分类器的第三主分类预测结果、第四主分类预测结果、第三辅助分类预测结果和第四辅助分类预测结果。
4.根据权利要求3所述的自适应阈值半监督的矿石分选方法,其特征在于,在所述步骤31中,令所述未标注矿石样本U=[U1,U2,...,UN]∈RN*D,其中R表示实数集,N表示样本个数,D表示特征维度;将符合标准正太分布的随机噪声γ注入所述未标注矿石样本U中,然后经过所述网络模型的反向传播求出梯度噪声
Figure FDA0004002542090000031
其中Dkl为KL散度损失计算函数,i表示迭代次数,θ表示所述网络模型的权重,ui表示第i次迭代下的未标注矿石样本,γ表示正态分布的随机噪声;P(y|ui,θ)表示输入未标注矿石样本ui后得到输出类别为y的概率。
5.根据权利要求3所述的自适应阈值半监督的矿石分选方法,其特征在于,所述步骤S4进一步包括:
S41、将所述第三主分类预测结果和所述第三辅助分类预测结果与未标注自适应阈值β进行比较,将大于所述未标注自适应阈值β的所述第三主分类预测结果和所述第三辅助分类预测结果保留,其余丢弃;
S42、将所述步骤S41获得的所述第三主分类预测结果和所述第三辅助分类预测结果与所述第一主分类预测结果和第一辅助分类预测结果做KL散度损失以获得第一KL散度损失;
S43、将所述第四主分类预测结果和所述第四辅助分类预测结果与所述未标注自适应阈值β进行比较,将大于所述未标注自适应阈值β的所述第四主分类预测结果和所述第四辅助分类预测结果保留,其余丢弃;
S44、将所述步骤S43获得的所述第四主分类预测结果和所述第四辅助分类预测结果与所述第二主分类预测结果和第二辅助分类预测结果做KL散度损失以获得第二KL散度损失;
S45、将所述第一主分类预测结果和第一辅助分类预测结果与所述第二主分类预测结果和第二辅助分类预测结果做KL散度损失以获得第三KL散度损失。
6.根据权利要求5所述的自适应阈值半监督的矿石分选方法,其特征在于,在所述步骤S4中,所述未标注自适应阈值β满足
Figure FDA0004002542090000041
其中i表示迭代次数,c表示类别,τ为设定的固定阈值;
Figure FDA0004002542090000046
代表第i次迭代c类的伪标签个数,
Figure FDA0004002542090000042
Figure FDA0004002542090000043
为归一化结果
Figure FDA0004002542090000044
所述KL散度损失
Figure FDA0004002542090000045
N表示标注矿石样本的个数;ui表示第i次迭代下的未标注矿石样本;γ表示正态分布的随机噪声;d表示梯度噪声;P表示预测样本的最大类别概率。
7.根据权利要求1-6中任意一项所述的自适应阈值半监督的矿石分选方法,其特征在于,所述网络模型包括ResNet-CA-AUX模型;
所述ResNet-CA-AUX模型包括第一主组件、两个第一ResNet-CA组件、两个第二ResNet-CA组件、两个第三ResNet-CA组件、两个第四ResNet-CA组件、第二主组件、主分类器、第一辅助组件、第二辅助组件、第三辅助组件和辅助分类器;
所述第一主组件依次连接所述两个第一ResNet-CA组件、所述两个第二ResNet-CA组件、所述两个第三ResNet-CA组件、所述两个第四ResNet-CA组件、所述第二主组件和所述主分类器;
所述第一辅助组件连接在第二ResNet-CA组件和第三ResNet-CA组件之间,并同时依次连接所述第二辅助组件、第三辅助组件和辅助分类器。
8.根据权利要求7所述的自适应阈值半监督的矿石分选方法,其特征在于,每个ResNet-CA组件包括第一池化层、第二池化层、合并卷积层、批量归一激活层、第一卷积层、第二卷积层、第一激活层和第二激活层,以及输出层,所述第一池化层和第二池化层分别接收输入残差,并依次连接所述合并卷积层和所述批量归一激活层,所述第一卷积层连接所述批量归一激活层和所述第一激活层,所述第二卷积层连接所述批量归一激活层和所述第二激活层,所述第一激活层和所述第二激活层连接所述输出层。
9.根据权利要求7所述的自适应阈值半监督的矿石分选方法,其特征在于,所述第一主组件包括卷积层、归一化网络层、激活函数层和池化层;所述第二主组件包括自适应平均池化层和全连接层;所述第一辅助组件包括自适应池化层;所述第二辅助组件包括卷积层、归一化网络层和激活函数层;所述第三辅助组件包括第一全连接层、激活函数层、失活层和第二全连接层。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现根据权利要求1-9中任意一项权利要求所述的自适应阈值半监督的矿石分选方法。
CN202211629189.1A 2022-12-16 2022-12-16 基于自适应阈值半监督的矿石分选方法和计算机存储介质 Pending CN115937161A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211629189.1A CN115937161A (zh) 2022-12-16 2022-12-16 基于自适应阈值半监督的矿石分选方法和计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211629189.1A CN115937161A (zh) 2022-12-16 2022-12-16 基于自适应阈值半监督的矿石分选方法和计算机存储介质

Publications (1)

Publication Number Publication Date
CN115937161A true CN115937161A (zh) 2023-04-07

Family

ID=86653939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211629189.1A Pending CN115937161A (zh) 2022-12-16 2022-12-16 基于自适应阈值半监督的矿石分选方法和计算机存储介质

Country Status (1)

Country Link
CN (1) CN115937161A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116416479A (zh) * 2023-06-06 2023-07-11 江西理工大学南昌校区 基于深度卷积融合多尺度图像特征的矿物分类方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116416479A (zh) * 2023-06-06 2023-07-11 江西理工大学南昌校区 基于深度卷积融合多尺度图像特征的矿物分类方法
CN116416479B (zh) * 2023-06-06 2023-08-29 江西理工大学南昌校区 基于深度卷积融合多尺度图像特征的矿物分类方法

Similar Documents

Publication Publication Date Title
Gorriz et al. Cost-effective active learning for melanoma segmentation
CN108073941A (zh) 一种基于深度学习的图像语义生成方法
CN110033008A (zh) 一种基于模态变换与文本归纳的图像描述生成方法
CN111737511A (zh) 基于自适应局部概念嵌入的图像描述方法
CN112733768A (zh) 基于双向特征语言模型的自然场景文本识别方法及装置
CN107679501B (zh) 一种基于标签自提纯的深度学习方法
CN111626291B (zh) 一种图像视觉关系检测方法、系统及终端
CN112927266B (zh) 基于不确定性引导训练的弱监督时域动作定位方法及系统
US11948078B2 (en) Joint representation learning from images and text
CN111723852B (zh) 针对目标检测网络的鲁棒训练方法
CN114863091A (zh) 一种基于伪标签的目标检测训练方法
CN114419323A (zh) 基于跨模态学习与领域自适应rgbd图像语义分割方法
CN116152554A (zh) 基于知识引导的小样本图像识别系统
CN117974988B (zh) 一种轻量化目标检测方法、装置、计算机程序产品
CN115937161A (zh) 基于自适应阈值半监督的矿石分选方法和计算机存储介质
CN117437423A (zh) 基于sam协同学习和跨层特征聚合增强的弱监督医学图像分割方法及装置
Liu et al. Uncertain label correction via auxiliary action unit graphs for facial expression recognition
CN116977844A (zh) 一种轻量级水下目标实时检测方法
CN114299326A (zh) 一种基于转换网络与自监督的小样本分类方法
CN110647917B (zh) 一种模型复用方法与系统
CN113313700A (zh) 一种基于深度学习的x射线图像交互式分割方法
CN117671414A (zh) 一种基于部分卷积嵌入和聚集分发机制的目标检测方法
CN112348001A (zh) 表情识别模型的训练方法、识别方法、装置、设备及介质
CN116758005A (zh) 一种面向pet/ct医学图像的检测方法
CN116110047A (zh) 基于ocr-ner的结构化电子病历构建方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination