CN115394381B

CN115394381B - 一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置

Info

Publication number: CN115394381B
Application number: CN202211015507.5A
Authority: CN
Inventors: 李述; 杨佳; 杨志远; 李帅; 刘东戎
Original assignee: Harbin University of Science and Technology
Current assignee: Harbin University of Science and Technology
Priority date: 2022-08-24
Filing date: 2022-08-24
Publication date: 2023-08-22
Anticipated expiration: 2042-08-24
Also published as: CN115394381A

Abstract

本发明提供一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置，属于合金硬度预测领域。为解决现有技术对高熵合金硬度进行预测时往往因数据不足而进行数据扩充，其数据扩充方法无法保证生成数据的质量，不利于提高高熵合金的硬度预测准确度的问题。包括：步骤一、构建高熵合金物理特征与硬度的原始训练集；步骤二、构建GAN神经网络模型，对原始训练集特征进行扩充；步骤三、构建机器学习模型，将扩充特征数据集的特征生成标签，得到扩充训练集；步骤四、将扩充训练集与原始训练集构建合并训练集；步骤五、采用合并训练集对机器学习模型进行调参并训练，得到高熵合金硬度模型。通过本发明方法得到高熵合金硬度模型具有更高的准确性。

Description

一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置

技术领域

本发明涉及合金硬度预测技术领域，具体而言，涉及一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置。

背景技术

高熵合金(High-entropy alloys，简称HEA)是一种新型合金，通常含有五种或五种以上摩尔分数为5％-35％的合金元素。由于其复杂而独特的组成结构，HEA中存在四种“核心效应”：高熵效应、晶格畸变效应、缓慢扩散效应和“鸡尾酒”效应。这些效应将导致各种优异的物理和机械性能，例如良好的耐磨性、良好的磁性、优异的低温断裂韧性和高硬度等。由于HEA的巨大组成空间和复杂的内部结构，机器学习非常适合于成分设计，并取得了一些进展。对于要实现的机器学习模型(machine-learning models，简称ML)，数据的数量和质量越好，预测性能越强。但是由于高熵合金本身探索时间短，内部结构复杂，高熵合金的数据仍然比较少。可用数据的不足阻碍了高精度高熵合金硬度机器学习预测模型的构建。处理数据短缺问题的解决方案可分为三类。第一种是基于特征的，它通过扩展特征空间和选择最佳特征组合来提高ML模型的性能。但扩展相关物理特征需要专家的指导，通过对原始物理特征的简单算术运算生成特征缺乏明确的物理意义。第二种是迁移学习，它可以将从源域学习到的知识转移到目标域。然而，通常很难找到包含大量数据且接近目标域的合适源域。最后是数据扩充，它基于现有数据生成额外数据，例如过采样和合成少数过采样技术(SMOTE)。这是解决数据短缺的一种直接而很有潜力的方法，引起了许多研究人员的兴趣。然而，这些数据增强方法可能会改变数据的分布。Feng Yan等人提出了一种基于3sigma规则和余弦相似性的方法，该方法考虑了数据标签的分布，但忽略了特征的分布。因此，这些方法的性能往往不令人满意。

相反，生成对抗网络(GAN)是一种深度神经网络，可以有效地根据博弈论生成数据，并且可以使得生成的数据具有与真实数据相似的分布。到目前为止，GAN在材料科学中的应用主要是处理图像生成和分类问题。前者是一种无监督学习，通常由一般GAN求解；后者是一种具有离散标签的监督学习，可以由条件遗传算法(conditional GAN，CGAN)求解。对于具有连续标签的回归问题，GAN在材料科学方面的工作很少，多采用将特征和标签一起生成为生成样本，它将标签视为一个普通特征。因此，由GAN确定的特征和标签之间的关系是间接的、不令人满意的，并且不够准确；它可能会丢失一些标签信息，并进一步影响生成数据的质量。

发明内容

本发明要解决的技术问题是：

为了解决现有技术中在对高熵合金硬度进行预测时往往因数据不足而进行数据扩充，其数据扩充方法无法保证生成数据的质量，不利于提高高熵合金的硬度预测准确度的问题。

本发明为解决上述技术问题所采用的技术方案：

本发明一方面，提出了一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法，包括如下步骤：

步骤一、收集多个高熵合金的成分与硬度的数据，并由高熵合金所包含的元素成分和元素本身固有性质计算得出其多个物理特征，将这些物理特征数据用作原始数据集，并将这些数据随机划分为原始训练集和测试集；

步骤二、构建GAN神经网络模型，对原始训练集特征进行扩充；

将原始训练集中多个高熵合金物理特征作为输入特征；将输入特征代入构建的GAN神经网络模型，设置生成数据量，GAN模型内部的生成器G和鉴别器D将不断迭代训练；当训练得到的最优的鉴别器D无法区分真实特征和生成的特征时，GAN模型达到纳什均衡；在此情况下进行数据扩充，得到扩充特征数据集；

步骤三、构建机器学习模型，将扩充特征数据集的特征生成标签；

首先，对物理特征进行筛选，选择影响高熵合金硬度的最优特征组合；然后，采用原始训练集的最优特征组合对机器学习模型进行调参并训练；最后，将扩充特征数据集输入至训练后的机器学习模型，将特征生成对应的标签，得到扩充训练集；

步骤四、将扩充训练集与原始训练集分别选择最优特征组合后合并，构建合并训练集；

步骤五、将合并训练集输入至步骤三所述的机器学习模型算法中，对模型进行调参并训练，得到高熵合金硬度模型，并用测试集评估其性能；

步骤六、将待检测样本输入至得到的高熵合金硬度模型对其的硬度进行预测。

进一步地，步骤一中所述高熵合金为Al-Co-Cr-Cu-Fe-Ni体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe-体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe-Ni体系和Co-Cr-Cu-Fe体系。

进一步地，步骤一中所述物理特征包括：元素间原子半径差δr、元素间电负性差Δχ、价电子浓度VEC、混合焓ΔH、构型熵ΔS、元素间局部电负性失配D.χ、内聚能Ec、流动电子数-Ⅰe₁/a、流动电子数-Ⅱe₂/a和参数Ω、Λ、γ；

模量失配η、局部尺寸失配D.r、强化模型中的能量项A、Peierls-Nabarro因子F、平均电子功函数的六次方ω、剪切模量G、局部模量失配δG、剪切模量差D.G和晶格畸变能μ；

e₁/a表示不考虑元素d轨道电子的合金平均电子浓度，e₂/a表示将过渡金属元素的电子浓度值设置为0时的合金平均电子浓度；

Ω参数是和合金内元素平均熔点以及构型熵成正比，与混合焓的绝对值成反比的参数；Λ是和构型熵成正比，与合金原子尺寸差的平方成反比的参数；γ是和合金内包含的元素的平均半径以及最小、最大半径相关的参数。

进一步地，步骤二所述GAN神经网络模型结构包括：生成器共有1个输入层，3个隐藏层，1个输出层，其所包含的神经元个数分别为10，128，64，32，21；鉴别器共有1个输入层，2个隐藏层和1个输出层，其所包含的神经元个数分别为21，64，32，1；生成器和鉴别器的输出层分别采用tanh和sigmoid函数，隐藏层采用LeakyReLu；在每个隐藏层中使用批量归一化，在反向传播中使用TensorFlow中的AdamOptimizer进行参数调整；训练时通过交替更新每个子网络的可训练参数，以对抗方式联合训练生成器和鉴别器网络。

进一步地，步骤三中选择影响高熵合金硬度的最优特征组合包括：参数γ、价电子浓度VEC、流动电子数-Ie₁/a和构型熵ΔS。

进一步地，步骤三中所述机器学习模型为具有径向基核函数的支持向量机回归模型SVR-R。

进一步地，步骤三中所述支持向量机回归模型SVR-R的调参方法采用贝叶斯调参，其对应的优化目标为全部原始数据集中的平均十折交叉验证误差。

一种基于机器学习和两步法数据扩充的高熵合金硬度预测装置，该装置包括：

获取单元，用于收集多个高熵合金的成分与硬度的数据，并由高熵合金所包含的元素成分和元素本身固有性质计算得出其多个物理特征，将这些物理特征数据用作原始数据集，并将这些数据随机划分为原始训练集和测试集；

扩充单元，用于构建GAN神经网络模型，对原始训练集特征进行扩充；

标签生成单元，用于构建机器学习模型，将扩充特征数据集的特征生成标签；

合并训练集构建单元，用于将扩充训练集与原始训练集分别选择最优特征组合后合并，构建合并训练集；

机器学习模型训练单元，用于将合并训练集输入至标签生成单元所述的机器学习模型算法中，对模型进行调参并训练，得到高熵合金硬度模型，并用测试集评估其性能；

硬度检测单元，用于将待检测样本输入至得到的高熵合金硬度模型对其的硬度进行预测。

进一步地，获取单元所述高熵合金为Al-Co-Cr-Cu-Fe-Ni体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe-体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe-Ni体系和Co-Cr-Cu-Fe体系；所述物理特征包括：元素间原子半径差δr、元素间电负性差Δχ、价电子浓度VEC、混合焓ΔH、构型熵ΔS、元素间局部电负性失配D.χ、内聚能Ec、流动电子数-Ⅰe₁/a、流动电子数-Ⅱe₂/a和参数Ω、Λ、γ；

Ω参数是和合金内元素平均熔点以及构型熵成正比，与混合焓的绝对值成反比的参数；Λ是和构型熵成正比，与合金原子尺寸差的平方成反比的参数；γ是和合金内包含的元素的平均半径以及最小、最大半径相关的参数；

进一步地，扩充单元中所述GAN神经网络模型结构包括：生成器共有1个输入层，3个隐藏层，1个输出层，其所包含的神经元个数分别为10，128，64，32，21；鉴别器共有1个输入层，2个隐藏层和1个输出层，其所包含的神经元个数分别为21，64，32，1；生成器和鉴别器的输出层分别采用tanh和sigmoid函数，隐藏层采用LeakyReLu；在每个隐藏层中使用批量归一化，在反向传播中使用TensorFlow中的AdamOptimizer进行参数调整；训练时通过交替更新每个子网络的可训练参数，以对抗方式联合训练生成器和鉴别器网络；

标签生成单元中选择影响高熵合金硬度的最优特征组合包括：参数γ、价电子浓度VEC、流动电子数-Ie₁/a和构型熵ΔS；所述机器学习模型为具有径向基核函数的支持向量机回归模型SVR-R；所述支持向量机回归模型SVR-R的调参方法采用贝叶斯调参，其对应的优化目标为全部原始数据集中的平均十折交叉验证误差。

相较于现有技术，本发明的有益效果是：

本发明是一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置，采用了两步法对高熵合金数据进行数据扩充，即对数据的特征和标签进行连续分别生成，首先使用GAN生成数据的特征，可以保证生成数据和原始数据之间特征分布的一致性，确保生成数据和原始数据之间特征的相似性；然后采用原始训练数据训练ML模型，通过训练后的ML模型生成数据的标签。本发明方法根据标签与特征之间的本质关系生成标签，使生成的标签具有更高的准确性，保证了生成数据标签的质量。

通过本发明方法对高熵合金硬度进行预测，可有效解决由于现有的高熵合金数据较少，使预测测结果达不到满意效果的问题，并极大的提高了对高熵合金硬度预测准确性，具有较好的应用前景，为推进高熵合金的研究起到积极作用。

本发明方法具有普适性，针对其他材料性能预测回归问题中数据量不足的情况，均可通过本发明方法的思想进行数据扩充，以提高材料性能预测的准确性，为数据扩充提供了有效手段。

附图说明

图1为本发明实施例中一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法的示意性流程图；

图2为本发明实施例中的三种模型针对不同生成数据量进行预测的示意性结果对比图；

图3为本发明实施例中三种模型对7种高熵合金的硬度预测的示意性结果对比图；

图4为本发明实施例中一种基于机器学习和两步法数据扩充的高熵合金硬度预测装置的示意性结构图。

具体实施方式

在本发明的描述中，应当说明的是，在本发明的实施例中所提到的术语“第一”、“第二”、“第三”仅用于描述目的，并不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括一个或者多个该特征。

为使本发明的上述目的、特征和优点能够更为明显易懂，下面结合附图对本发明的具体实施例做详细的说明。

具体实施方式一：如图1所示，本实施方式提供一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法，包括如下步骤：

其中，所述高熵合金为Al-Co-Cr-Cu-Fe-Ni体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe-体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe-Ni体系和Co-Cr-Cu-Fe体系；

其中，高熵合金的物理特征具体为：元素间原子半径差δr、元素间电负性差Δχ、价电子浓度VEC、混合焓ΔH、构型熵ΔS、元素间局部电负性失配D.χ、内聚能Ec、流动电子数-Ⅰe₁/a、流动电子数-Ⅱe₂/a和参数Ω、Λ、γ；

其中，所述GAN神经网络模型为：生成器共有1个输入层，3个隐藏层，1个输出层，其所包含的神经元个数分别为10，128，64，32，21；鉴别器共有1个输入层，2个隐藏层和1个输出层，其所包含的神经元个数分别为21，64，32，1；生成器和鉴别器的输出层分别采用tanh和sigmoid函数，隐藏层采用LeakyReLu；在每个隐藏层中使用批量归一化，在反向传播中使用TensorFlow中的AdamOptimizer进行参数调整；训练时通过交替更新每个子网络的可训练参数，以对抗方式联合训练生成器和鉴别器网络；

GAN神经网络模型优化函数V(D,G)的计算公式为：

其中，E(f)是分布函数f的期望值，分布函数f代表公式中logD(x)和log(1_-D(G(z)))两分布函数，P_d(x)是真实特征的分布，P_z(z)是生成器G的模拟分布；

需要说明的是生成器G的输入是来自潜在空间的随机向量z，输出是生成的特征G(z)，其训练目标是不断提高生成特征与真实特征之间的相似性，直到无法通过鉴别器D进行区分，此时，生成的特征与真实特征的分布基本相同；鉴别器D的输入是真实特征x或生成的特征G(z)，输出的结果D(x)或D(G(z))是具有概率值的二元分类的判别结果，判断真假的阈值为0.5，其训练目标是区分真实特征与生成的特征；在训练过程中，GAN神经网络模型利用鉴别器D的判别结果计算损失函数，并通过反向传播更新生成器G和鉴别器D的网络权重；在对抗训练过程中，鉴别器D辨别真假特征的能力逐渐提高，同时为了欺骗鉴别器D，生成器G所生成的特征也逐渐接近真实特征，当训练得到的最优的鉴别器D无法区分真实特征和生成的特征时，GAN模型达到纳什均衡。最终GAN模型设置训练周期为700个，学习率为0.0003；

其中，选择影响高熵合金硬度的最优特征组合包括：参数γ、价电子浓度VEC、流动电子数-Ie₁/a和构型熵ΔS；

其中，所述机器学习模型为具有径向基核函数的支持向量机回归模型SVR-R；

其中，所述支持向量机回归模型SVR-R的调参方法采用贝叶斯调参，其对应的优化目标为全部原始数据集中的平均十折交叉验证误差；

步骤六、将待检测的高熵合金样本输入步骤五得到的最优机器学习模型对其的硬度进行预测。

实施例1

去图2所示，通过对比不同模型在不同生成数据量下的预测结果，进一步验证本发明方法的准确性。

根据本发明方法在不同生成数据量下构建高熵合金硬度预测模型(模型2)：

步骤一、本发明利用文献[1]中的205组Al-Co-Cr-Cu-Fe-Ni高熵合金成分与硬度的数据，并由高熵合金所包含的元素成分和元素本身固有性质计算得出其21个物理特征，将其随机划分为原始训练集(90％)和测试集(10％)；步骤二、构建所述的GAN神经网络模型，将原始训练集中高熵合金物理特征代入GAN神经网络模型，分别设置生成数据量为100、200、300、400和500进行数据扩充，得到不同数量的扩充特征数据集；步骤三、构建具有径向基核函数的支持向量机回归模型SVR-R；选择影响高熵合金硬度的最优特征组合为参数γ、价电子浓度VEC、流动电子数-Ⅰe₁/a和构型熵ΔS；采用原始训练集的最优特征组合对机器学习模型进行调参并训练；调参方法采用贝叶斯调参，其对应的优化目标为全部原始数据集中的平均十折交叉验证误差；将各扩充特征数据集分别输入至训练后的机器学习模型，将数据生成对应的标签，得到不同数量的扩充训练集；步骤四、将各扩充训练集分别与原始训练集分别选择最优特征组合后合并，构建合并训练集；步骤五、将各合并训练集对支持向量机回归模型SVR-R进行调参并训练，得到在100、200、300、400和500不同生成数据量下的高熵合金硬度模型(模型2)。

构建模型1的方法与模型2的构建方法不同点是进行数据扩充时采用目前常规的数据扩充方法，即将特征和标签同时代入GAN神经网络模型进行数据扩充，其他与模型2的构建方法相同，得到在100、200、300、400和500不同生成数据量下的高熵合金硬度模型(模型1)。

模型0为直接采用支持向量机回归模型SVR-R进行硬度预测。

将三种模型分别对测试集进行预测，结果如图2所示，采用均方根误差RMSE评估各模型预测效果，这里，

其中，f(x_i)表示第i个样本的预测值，y_i表示第i个样本的真实值，m为样本数。

得到的均方根误差均以平均值表示，平均值是通过重复预测过程十次的均方根误差计算均值得出的；

从图2的结果可以看出，本发明方法的模型2相较于模型1和模型0具有更低的误差，机器学习模型2表现出更佳的性能。说明采用本发明方法得到的模型具有更好的性能，结果明显优于现有的通过GAN直接进行数据扩充的方法得到的模型性能，更优于支持向量机回归模型SVR-R的性能。

同时可以看出，生成数据量也一定程度上影响预测结果，在生成数据量为400的情况下，机器学习模型2表现出最佳性能，因此选择生成数据量为400作为模型的最佳生成数据量。

实施例2

收集7个不同成分高熵合金样本，计算各高熵合金样本的最优特征组合物理特征，采用实施例1得到的三种模型分别对各高熵合金的硬度进行预测，结果如表1所示，预测硬度值和实验获得的硬度值之间的绝对差值如图3所示。从表1和图3可以看出，模型2相较于模型0和模型1，预测结果准确性更高，且模型2的结果中没有异常值，具有较好的稳定性。计算模型0、模型1和模型2针对7种高熵合金硬度预测的均方根误差分别为61.96、47.49和31.57。通过本实施例可以看出，在实际应用中本发明方法具有较高的预测精度和稳定性。

表1

实施例3

本实施例提供一种基于机器学习和两步法数据扩充的高熵合金硬度预测装置，如图4所示，该装置包括：

本实施例所述的一种基于机器学习和两步法数据扩充的高熵合金硬度预测装置的功能可以由前述一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法说明，因此本实施例未详述部分，可参见以上方法实施例，在此不再赘述。

虽然本发明公开披露如上，但本发明公开的保护范围并非仅限于此。本发明领域技术人员在不脱离本发明公开的精神和范围的前提下，可进行各种变更与修改，这些变更与修改均将落入本发明的保护范围。

本发明援引的文献如下：[1]Wen,C.,Zhang,Y.,Wang,C.X.et al.Machinelearning assisted design of high entropy alloys with desired property.ActaMater 170,109-117(2019).

Claims

1.一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法，其特征在于包括如下步骤：

所述GAN神经网络模型结构包括：生成器共有1个输入层，3个隐藏层，1个输出层，其所包含的神经元个数分别为10，128，64，32，21；鉴别器共有1个输入层，2个隐藏层和1个输出层，其所包含的神经元个数分别为21，64，32，1；生成器和鉴别器的输出层分别采用tanh和sigmoid函数，隐藏层采用LeakyReLu；在每个隐藏层中使用批量归一化，在反向传播中使用TensorFlow中的AdamOptimizer进行参数调整；训练时通过交替更新每个子网络的可训练参数，以对抗方式联合训练生成器和鉴别器网络；

选择影响高熵合金硬度的最优特征组合包括：参数γ、价电子浓度VEC、流动电子数-Ie₁/a和构型熵ΔS；

2.根据权利要求1所述的方法，其特征在于：步骤一中所述高熵合金为Al-Co-Cr-Cu-Fe-Ni体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe体系和Co-Cr-Cu-Fe体系。

3.根据权利要求1所述的方法，其特征在于：步骤一中所述物理特征包括：元素间原子半径差δr、元素间电负性差Δχ、价电子浓度VEC、混合焓ΔH、构型熵ΔS、元素间局部电负性失配D.χ、内聚能Ec、流动电子数-Ⅰe₁/a、流动电子数-Ⅱe₂/a和参数Ω、Λ、γ；

4.根据权利要求1所述的方法，其特征在于：步骤三中所述机器学习模型为具有径向基核函数的支持向量机回归模型SVR-R。

5.根据权利要求4所述的方法，其特征在于：步骤三中所述支持向量机回归模型SVR-R的调参方法采用贝叶斯调参，其对应的优化目标为全部原始数据集中的平均十折交叉验证误差。

6.一种基于机器学习和两步法数据扩充的高熵合金硬度预测装置，其特征在于该装置包括：

7.根据权利要求6所述的装置，其特征在于：获取单元所述高熵合金为Al-Co-Cr-Cu-Fe-Ni体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe体系和Co-Cr-Cu-Fe体系；所述物理特征包括：元素间原子半径差δr、元素间电负性差Δχ、价电子浓度VEC、混合焓ΔH、构型熵ΔS、元素间局部电负性失配D.χ、内聚能Ec、流动电子数-Ⅰe₁/a、流动电子数-Ⅱe₂/a和参数Ω、Λ、γ；

8.根据权利要求6所述的装置，其特征在于：

所述机器学习模型为具有径向基核函数的支持向量机回归模型SVR-R；所述支持向量机回归模型SVR-R的调参方法采用贝叶斯调参，其对应的优化目标为全部原始数据集中的平均十折交叉验证误差。