CN115394381B - 一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置 - Google Patents

一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置 Download PDF

Info

Publication number
CN115394381B
CN115394381B CN202211015507.5A CN202211015507A CN115394381B CN 115394381 B CN115394381 B CN 115394381B CN 202211015507 A CN202211015507 A CN 202211015507A CN 115394381 B CN115394381 B CN 115394381B
Authority
CN
China
Prior art keywords
model
entropy
hardness
training set
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211015507.5A
Other languages
English (en)
Other versions
CN115394381A (zh
Inventor
李述
杨佳
杨志远
李帅
刘东戎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin University of Science and Technology
Original Assignee
Harbin University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin University of Science and Technology filed Critical Harbin University of Science and Technology
Priority to CN202211015507.5A priority Critical patent/CN115394381B/zh
Publication of CN115394381A publication Critical patent/CN115394381A/zh
Application granted granted Critical
Publication of CN115394381B publication Critical patent/CN115394381B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C60/00Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Geometry (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置,属于合金硬度预测领域。为解决现有技术对高熵合金硬度进行预测时往往因数据不足而进行数据扩充,其数据扩充方法无法保证生成数据的质量,不利于提高高熵合金的硬度预测准确度的问题。包括:步骤一、构建高熵合金物理特征与硬度的原始训练集;步骤二、构建GAN神经网络模型,对原始训练集特征进行扩充;步骤三、构建机器学习模型,将扩充特征数据集的特征生成标签,得到扩充训练集;步骤四、将扩充训练集与原始训练集构建合并训练集;步骤五、采用合并训练集对机器学习模型进行调参并训练,得到高熵合金硬度模型。通过本发明方法得到高熵合金硬度模型具有更高的准确性。

Description

一种基于机器学习和两步法数据扩充的高熵合金硬度预测方 法及装置
技术领域
本发明涉及合金硬度预测技术领域,具体而言,涉及一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置。
背景技术
高熵合金(High-entropy alloys,简称HEA)是一种新型合金,通常含有五种或五种以上摩尔分数为5%-35%的合金元素。由于其复杂而独特的组成结构,HEA中存在四种“核心效应”:高熵效应、晶格畸变效应、缓慢扩散效应和“鸡尾酒”效应。这些效应将导致各种优异的物理和机械性能,例如良好的耐磨性、良好的磁性、优异的低温断裂韧性和高硬度等。由于HEA的巨大组成空间和复杂的内部结构,机器学习非常适合于成分设计,并取得了一些进展。对于要实现的机器学习模型(machine-learning models,简称ML),数据的数量和质量越好,预测性能越强。但是由于高熵合金本身探索时间短,内部结构复杂,高熵合金的数据仍然比较少。可用数据的不足阻碍了高精度高熵合金硬度机器学习预测模型的构建。处理数据短缺问题的解决方案可分为三类。第一种是基于特征的,它通过扩展特征空间和选择最佳特征组合来提高ML模型的性能。但扩展相关物理特征需要专家的指导,通过对原始物理特征的简单算术运算生成特征缺乏明确的物理意义。第二种是迁移学习,它可以将从源域学习到的知识转移到目标域。然而,通常很难找到包含大量数据且接近目标域的合适源域。最后是数据扩充,它基于现有数据生成额外数据,例如过采样和合成少数过采样技术(SMOTE)。这是解决数据短缺的一种直接而很有潜力的方法,引起了许多研究人员的兴趣。然而,这些数据增强方法可能会改变数据的分布。Feng Yan等人提出了一种基于3sigma规则和余弦相似性的方法,该方法考虑了数据标签的分布,但忽略了特征的分布。因此,这些方法的性能往往不令人满意。
相反,生成对抗网络(GAN)是一种深度神经网络,可以有效地根据博弈论生成数据,并且可以使得生成的数据具有与真实数据相似的分布。到目前为止,GAN在材料科学中的应用主要是处理图像生成和分类问题。前者是一种无监督学习,通常由一般GAN求解;后者是一种具有离散标签的监督学习,可以由条件遗传算法(conditional GAN,CGAN)求解。对于具有连续标签的回归问题,GAN在材料科学方面的工作很少,多采用将特征和标签一起生成为生成样本,它将标签视为一个普通特征。因此,由GAN确定的特征和标签之间的关系是间接的、不令人满意的,并且不够准确;它可能会丢失一些标签信息,并进一步影响生成数据的质量。
发明内容
本发明要解决的技术问题是:
为了解决现有技术中在对高熵合金硬度进行预测时往往因数据不足而进行数据扩充,其数据扩充方法无法保证生成数据的质量,不利于提高高熵合金的硬度预测准确度的问题。
本发明为解决上述技术问题所采用的技术方案:
本发明一方面,提出了一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法,包括如下步骤:
步骤一、收集多个高熵合金的成分与硬度的数据,并由高熵合金所包含的元素成分和元素本身固有性质计算得出其多个物理特征,将这些物理特征数据用作原始数据集,并将这些数据随机划分为原始训练集和测试集;
步骤二、构建GAN神经网络模型,对原始训练集特征进行扩充;
将原始训练集中多个高熵合金物理特征作为输入特征;将输入特征代入构建的GAN神经网络模型,设置生成数据量,GAN模型内部的生成器G和鉴别器D将不断迭代训练;当训练得到的最优的鉴别器D无法区分真实特征和生成的特征时,GAN模型达到纳什均衡;在此情况下进行数据扩充,得到扩充特征数据集;
步骤三、构建机器学习模型,将扩充特征数据集的特征生成标签;
首先,对物理特征进行筛选,选择影响高熵合金硬度的最优特征组合;然后,采用原始训练集的最优特征组合对机器学习模型进行调参并训练;最后,将扩充特征数据集输入至训练后的机器学习模型,将特征生成对应的标签,得到扩充训练集;
步骤四、将扩充训练集与原始训练集分别选择最优特征组合后合并,构建合并训练集;
步骤五、将合并训练集输入至步骤三所述的机器学习模型算法中,对模型进行调参并训练,得到高熵合金硬度模型,并用测试集评估其性能;
步骤六、将待检测样本输入至得到的高熵合金硬度模型对其的硬度进行预测。
进一步地,步骤一中所述高熵合金为Al-Co-Cr-Cu-Fe-Ni体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe-体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe-Ni体系和Co-Cr-Cu-Fe体系。
进一步地,步骤一中所述物理特征包括:元素间原子半径差δr、元素间电负性差Δχ、价电子浓度VEC、混合焓ΔH、构型熵ΔS、元素间局部电负性失配D.χ、内聚能Ec、流动电子数-Ⅰe1/a、流动电子数-Ⅱe2/a和参数Ω、Λ、γ;
模量失配η、局部尺寸失配D.r、强化模型中的能量项A、Peierls-Nabarro因子F、平均电子功函数的六次方ω、剪切模量G、局部模量失配δG、剪切模量差D.G和晶格畸变能μ;
e1/a表示不考虑元素d轨道电子的合金平均电子浓度,e2/a表示将过渡金属元素的电子浓度值设置为0时的合金平均电子浓度;
Ω参数是和合金内元素平均熔点以及构型熵成正比,与混合焓的绝对值成反比的参数;Λ是和构型熵成正比,与合金原子尺寸差的平方成反比的参数;γ是和合金内包含的元素的平均半径以及最小、最大半径相关的参数。
进一步地,步骤二所述GAN神经网络模型结构包括:生成器共有1个输入层,3个隐藏层,1个输出层,其所包含的神经元个数分别为10,128,64,32,21;鉴别器共有1个输入层,2个隐藏层和1个输出层,其所包含的神经元个数分别为21,64,32,1;生成器和鉴别器的输出层分别采用tanh和sigmoid函数,隐藏层采用LeakyReLu;在每个隐藏层中使用批量归一化,在反向传播中使用TensorFlow中的AdamOptimizer进行参数调整;训练时通过交替更新每个子网络的可训练参数,以对抗方式联合训练生成器和鉴别器网络。
进一步地,步骤三中选择影响高熵合金硬度的最优特征组合包括:参数γ、价电子浓度VEC、流动电子数-Ie1/a和构型熵ΔS。
进一步地,步骤三中所述机器学习模型为具有径向基核函数的支持向量机回归模型SVR-R。
进一步地,步骤三中所述支持向量机回归模型SVR-R的调参方法采用贝叶斯调参,其对应的优化目标为全部原始数据集中的平均十折交叉验证误差。
一种基于机器学习和两步法数据扩充的高熵合金硬度预测装置,该装置包括:
获取单元,用于收集多个高熵合金的成分与硬度的数据,并由高熵合金所包含的元素成分和元素本身固有性质计算得出其多个物理特征,将这些物理特征数据用作原始数据集,并将这些数据随机划分为原始训练集和测试集;
扩充单元,用于构建GAN神经网络模型,对原始训练集特征进行扩充;
将原始训练集中多个高熵合金物理特征作为输入特征;将输入特征代入构建的GAN神经网络模型,设置生成数据量,GAN模型内部的生成器G和鉴别器D将不断迭代训练;当训练得到的最优的鉴别器D无法区分真实特征和生成的特征时,GAN模型达到纳什均衡;在此情况下进行数据扩充,得到扩充特征数据集;
标签生成单元,用于构建机器学习模型,将扩充特征数据集的特征生成标签;
首先,对物理特征进行筛选,选择影响高熵合金硬度的最优特征组合;然后,采用原始训练集的最优特征组合对机器学习模型进行调参并训练;最后,将扩充特征数据集输入至训练后的机器学习模型,将特征生成对应的标签,得到扩充训练集;
合并训练集构建单元,用于将扩充训练集与原始训练集分别选择最优特征组合后合并,构建合并训练集;
机器学习模型训练单元,用于将合并训练集输入至标签生成单元所述的机器学习模型算法中,对模型进行调参并训练,得到高熵合金硬度模型,并用测试集评估其性能;
硬度检测单元,用于将待检测样本输入至得到的高熵合金硬度模型对其的硬度进行预测。
进一步地,获取单元所述高熵合金为Al-Co-Cr-Cu-Fe-Ni体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe-体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe-Ni体系和Co-Cr-Cu-Fe体系;所述物理特征包括:元素间原子半径差δr、元素间电负性差Δχ、价电子浓度VEC、混合焓ΔH、构型熵ΔS、元素间局部电负性失配D.χ、内聚能Ec、流动电子数-Ⅰe1/a、流动电子数-Ⅱe2/a和参数Ω、Λ、γ;
模量失配η、局部尺寸失配D.r、强化模型中的能量项A、Peierls-Nabarro因子F、平均电子功函数的六次方ω、剪切模量G、局部模量失配δG、剪切模量差D.G和晶格畸变能μ;
e1/a表示不考虑元素d轨道电子的合金平均电子浓度,e2/a表示将过渡金属元素的电子浓度值设置为0时的合金平均电子浓度;
Ω参数是和合金内元素平均熔点以及构型熵成正比,与混合焓的绝对值成反比的参数;Λ是和构型熵成正比,与合金原子尺寸差的平方成反比的参数;γ是和合金内包含的元素的平均半径以及最小、最大半径相关的参数;
进一步地,扩充单元中所述GAN神经网络模型结构包括:生成器共有1个输入层,3个隐藏层,1个输出层,其所包含的神经元个数分别为10,128,64,32,21;鉴别器共有1个输入层,2个隐藏层和1个输出层,其所包含的神经元个数分别为21,64,32,1;生成器和鉴别器的输出层分别采用tanh和sigmoid函数,隐藏层采用LeakyReLu;在每个隐藏层中使用批量归一化,在反向传播中使用TensorFlow中的AdamOptimizer进行参数调整;训练时通过交替更新每个子网络的可训练参数,以对抗方式联合训练生成器和鉴别器网络;
标签生成单元中选择影响高熵合金硬度的最优特征组合包括:参数γ、价电子浓度VEC、流动电子数-Ie1/a和构型熵ΔS;所述机器学习模型为具有径向基核函数的支持向量机回归模型SVR-R;所述支持向量机回归模型SVR-R的调参方法采用贝叶斯调参,其对应的优化目标为全部原始数据集中的平均十折交叉验证误差。
相较于现有技术,本发明的有益效果是:
本发明是一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置,采用了两步法对高熵合金数据进行数据扩充,即对数据的特征和标签进行连续分别生成,首先使用GAN生成数据的特征,可以保证生成数据和原始数据之间特征分布的一致性,确保生成数据和原始数据之间特征的相似性;然后采用原始训练数据训练ML模型,通过训练后的ML模型生成数据的标签。本发明方法根据标签与特征之间的本质关系生成标签,使生成的标签具有更高的准确性,保证了生成数据标签的质量。
通过本发明方法对高熵合金硬度进行预测,可有效解决由于现有的高熵合金数据较少,使预测测结果达不到满意效果的问题,并极大的提高了对高熵合金硬度预测准确性,具有较好的应用前景,为推进高熵合金的研究起到积极作用。
本发明方法具有普适性,针对其他材料性能预测回归问题中数据量不足的情况,均可通过本发明方法的思想进行数据扩充,以提高材料性能预测的准确性,为数据扩充提供了有效手段。
附图说明
图1为本发明实施例中一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法的示意性流程图;
图2为本发明实施例中的三种模型针对不同生成数据量进行预测的示意性结果对比图;
图3为本发明实施例中三种模型对7种高熵合金的硬度预测的示意性结果对比图;
图4为本发明实施例中一种基于机器学习和两步法数据扩充的高熵合金硬度预测装置的示意性结构图。
具体实施方式
在本发明的描述中,应当说明的是,在本发明的实施例中所提到的术语“第一”、“第二”、“第三”仅用于描述目的,并不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括一个或者多个该特征。
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
具体实施方式一:如图1所示,本实施方式提供一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法,包括如下步骤:
步骤一、收集多个高熵合金的成分与硬度的数据,并由高熵合金所包含的元素成分和元素本身固有性质计算得出其多个物理特征,将这些物理特征数据用作原始数据集,并将这些数据随机划分为原始训练集和测试集;
其中,所述高熵合金为Al-Co-Cr-Cu-Fe-Ni体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe-体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe-Ni体系和Co-Cr-Cu-Fe体系;
其中,高熵合金的物理特征具体为:元素间原子半径差δr、元素间电负性差Δχ、价电子浓度VEC、混合焓ΔH、构型熵ΔS、元素间局部电负性失配D.χ、内聚能Ec、流动电子数-Ⅰe1/a、流动电子数-Ⅱe2/a和参数Ω、Λ、γ;
模量失配η、局部尺寸失配D.r、强化模型中的能量项A、Peierls-Nabarro因子F、平均电子功函数的六次方ω、剪切模量G、局部模量失配δG、剪切模量差D.G和晶格畸变能μ;
e1/a表示不考虑元素d轨道电子的合金平均电子浓度,e2/a表示将过渡金属元素的电子浓度值设置为0时的合金平均电子浓度;
Ω参数是和合金内元素平均熔点以及构型熵成正比,与混合焓的绝对值成反比的参数;Λ是和构型熵成正比,与合金原子尺寸差的平方成反比的参数;γ是和合金内包含的元素的平均半径以及最小、最大半径相关的参数;
步骤二、构建GAN神经网络模型,对原始训练集特征进行扩充;
将原始训练集中多个高熵合金物理特征作为输入特征;将输入特征代入构建的GAN神经网络模型,设置生成数据量,GAN模型内部的生成器G和鉴别器D将不断迭代训练;当训练得到的最优的鉴别器D无法区分真实特征和生成的特征时,GAN模型达到纳什均衡;在此情况下进行数据扩充,得到扩充特征数据集;
其中,所述GAN神经网络模型为:生成器共有1个输入层,3个隐藏层,1个输出层,其所包含的神经元个数分别为10,128,64,32,21;鉴别器共有1个输入层,2个隐藏层和1个输出层,其所包含的神经元个数分别为21,64,32,1;生成器和鉴别器的输出层分别采用tanh和sigmoid函数,隐藏层采用LeakyReLu;在每个隐藏层中使用批量归一化,在反向传播中使用TensorFlow中的AdamOptimizer进行参数调整;训练时通过交替更新每个子网络的可训练参数,以对抗方式联合训练生成器和鉴别器网络;
GAN神经网络模型优化函数V(D,G)的计算公式为:
其中,E(f)是分布函数f的期望值,分布函数f代表公式中logD(x)和log(1-D(G(z)))两分布函数,Pd(x)是真实特征的分布,Pz(z)是生成器G的模拟分布;
需要说明的是生成器G的输入是来自潜在空间的随机向量z,输出是生成的特征G(z),其训练目标是不断提高生成特征与真实特征之间的相似性,直到无法通过鉴别器D进行区分,此时,生成的特征与真实特征的分布基本相同;鉴别器D的输入是真实特征x或生成的特征G(z),输出的结果D(x)或D(G(z))是具有概率值的二元分类的判别结果,判断真假的阈值为0.5,其训练目标是区分真实特征与生成的特征;在训练过程中,GAN神经网络模型利用鉴别器D的判别结果计算损失函数,并通过反向传播更新生成器G和鉴别器D的网络权重;在对抗训练过程中,鉴别器D辨别真假特征的能力逐渐提高,同时为了欺骗鉴别器D,生成器G所生成的特征也逐渐接近真实特征,当训练得到的最优的鉴别器D无法区分真实特征和生成的特征时,GAN模型达到纳什均衡。最终GAN模型设置训练周期为700个,学习率为0.0003;
步骤三、构建机器学习模型,将扩充特征数据集的特征生成标签;
首先,对物理特征进行筛选,选择影响高熵合金硬度的最优特征组合;然后,采用原始训练集的最优特征组合对机器学习模型进行调参并训练;最后,将扩充特征数据集输入至训练后的机器学习模型,将特征生成对应的标签,得到扩充训练集;
其中,选择影响高熵合金硬度的最优特征组合包括:参数γ、价电子浓度VEC、流动电子数-Ie1/a和构型熵ΔS;
其中,所述机器学习模型为具有径向基核函数的支持向量机回归模型SVR-R;
其中,所述支持向量机回归模型SVR-R的调参方法采用贝叶斯调参,其对应的优化目标为全部原始数据集中的平均十折交叉验证误差;
步骤四、将扩充训练集与原始训练集分别选择最优特征组合后合并,构建合并训练集;
步骤五、将合并训练集输入至步骤三所述的机器学习模型算法中,对模型进行调参并训练,得到高熵合金硬度模型,并用测试集评估其性能;
步骤六、将待检测的高熵合金样本输入步骤五得到的最优机器学习模型对其的硬度进行预测。
实施例1
去图2所示,通过对比不同模型在不同生成数据量下的预测结果,进一步验证本发明方法的准确性。
根据本发明方法在不同生成数据量下构建高熵合金硬度预测模型(模型2):
步骤一、本发明利用文献[1]中的205组Al-Co-Cr-Cu-Fe-Ni高熵合金成分与硬度的数据,并由高熵合金所包含的元素成分和元素本身固有性质计算得出其21个物理特征,将其随机划分为原始训练集(90%)和测试集(10%);步骤二、构建所述的GAN神经网络模型,将原始训练集中高熵合金物理特征代入GAN神经网络模型,分别设置生成数据量为100、200、300、400和500进行数据扩充,得到不同数量的扩充特征数据集;步骤三、构建具有径向基核函数的支持向量机回归模型SVR-R;选择影响高熵合金硬度的最优特征组合为参数γ、价电子浓度VEC、流动电子数-Ⅰe1/a和构型熵ΔS;采用原始训练集的最优特征组合对机器学习模型进行调参并训练;调参方法采用贝叶斯调参,其对应的优化目标为全部原始数据集中的平均十折交叉验证误差;将各扩充特征数据集分别输入至训练后的机器学习模型,将数据生成对应的标签,得到不同数量的扩充训练集;步骤四、将各扩充训练集分别与原始训练集分别选择最优特征组合后合并,构建合并训练集;步骤五、将各合并训练集对支持向量机回归模型SVR-R进行调参并训练,得到在100、200、300、400和500不同生成数据量下的高熵合金硬度模型(模型2)。
构建模型1的方法与模型2的构建方法不同点是进行数据扩充时采用目前常规的数据扩充方法,即将特征和标签同时代入GAN神经网络模型进行数据扩充,其他与模型2的构建方法相同,得到在100、200、300、400和500不同生成数据量下的高熵合金硬度模型(模型1)。
模型0为直接采用支持向量机回归模型SVR-R进行硬度预测。
将三种模型分别对测试集进行预测,结果如图2所示,采用均方根误差RMSE评估各模型预测效果,这里,
其中,f(xi)表示第i个样本的预测值,yi表示第i个样本的真实值,m为样本数。
得到的均方根误差均以平均值表示,平均值是通过重复预测过程十次的均方根误差计算均值得出的;
从图2的结果可以看出,本发明方法的模型2相较于模型1和模型0具有更低的误差,机器学习模型2表现出更佳的性能。说明采用本发明方法得到的模型具有更好的性能,结果明显优于现有的通过GAN直接进行数据扩充的方法得到的模型性能,更优于支持向量机回归模型SVR-R的性能。
同时可以看出,生成数据量也一定程度上影响预测结果,在生成数据量为400的情况下,机器学习模型2表现出最佳性能,因此选择生成数据量为400作为模型的最佳生成数据量。
实施例2
收集7个不同成分高熵合金样本,计算各高熵合金样本的最优特征组合物理特征,采用实施例1得到的三种模型分别对各高熵合金的硬度进行预测,结果如表1所示,预测硬度值和实验获得的硬度值之间的绝对差值如图3所示。从表1和图3可以看出,模型2相较于模型0和模型1,预测结果准确性更高,且模型2的结果中没有异常值,具有较好的稳定性。计算模型0、模型1和模型2针对7种高熵合金硬度预测的均方根误差分别为61.96、47.49和31.57。通过本实施例可以看出,在实际应用中本发明方法具有较高的预测精度和稳定性。
表1
实施例3
本实施例提供一种基于机器学习和两步法数据扩充的高熵合金硬度预测装置,如图4所示,该装置包括:
获取单元,用于收集多个高熵合金的成分与硬度的数据,并由高熵合金所包含的元素成分和元素本身固有性质计算得出其多个物理特征,将这些物理特征数据用作原始数据集,并将这些数据随机划分为原始训练集和测试集;
扩充单元,用于构建GAN神经网络模型,对原始训练集特征进行扩充;
将原始训练集中多个高熵合金物理特征作为输入特征;将输入特征代入构建的GAN神经网络模型,设置生成数据量,GAN模型内部的生成器G和鉴别器D将不断迭代训练;当训练得到的最优的鉴别器D无法区分真实特征和生成的特征时,GAN模型达到纳什均衡;在此情况下进行数据扩充,得到扩充特征数据集;
标签生成单元,用于构建机器学习模型,将扩充特征数据集的特征生成标签;
首先,对物理特征进行筛选,选择影响高熵合金硬度的最优特征组合;然后,采用原始训练集的最优特征组合对机器学习模型进行调参并训练;最后,将扩充特征数据集输入至训练后的机器学习模型,将特征生成对应的标签,得到扩充训练集;
合并训练集构建单元,用于将扩充训练集与原始训练集分别选择最优特征组合后合并,构建合并训练集;
机器学习模型训练单元,用于将合并训练集输入至标签生成单元所述的机器学习模型算法中,对模型进行调参并训练,得到高熵合金硬度模型,并用测试集评估其性能;
硬度检测单元,用于将待检测样本输入至得到的高熵合金硬度模型对其的硬度进行预测。
进一步地,获取单元所述高熵合金为Al-Co-Cr-Cu-Fe-Ni体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe-体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe-Ni体系和Co-Cr-Cu-Fe体系;所述物理特征包括:元素间原子半径差δr、元素间电负性差Δχ、价电子浓度VEC、混合焓ΔH、构型熵ΔS、元素间局部电负性失配D.χ、内聚能Ec、流动电子数-Ⅰe1/a、流动电子数-Ⅱe2/a和参数Ω、Λ、γ;
模量失配η、局部尺寸失配D.r、强化模型中的能量项A、Peierls-Nabarro因子F、平均电子功函数的六次方ω、剪切模量G、局部模量失配δG、剪切模量差D.G和晶格畸变能μ;
e1/a表示不考虑元素d轨道电子的合金平均电子浓度,e2/a表示将过渡金属元素的电子浓度值设置为0时的合金平均电子浓度;
Ω参数是和合金内元素平均熔点以及构型熵成正比,与混合焓的绝对值成反比的参数;Λ是和构型熵成正比,与合金原子尺寸差的平方成反比的参数;γ是和合金内包含的元素的平均半径以及最小、最大半径相关的参数;
进一步地,扩充单元中所述GAN神经网络模型结构包括:生成器共有1个输入层,3个隐藏层,1个输出层,其所包含的神经元个数分别为10,128,64,32,21;鉴别器共有1个输入层,2个隐藏层和1个输出层,其所包含的神经元个数分别为21,64,32,1;生成器和鉴别器的输出层分别采用tanh和sigmoid函数,隐藏层采用LeakyReLu;在每个隐藏层中使用批量归一化,在反向传播中使用TensorFlow中的AdamOptimizer进行参数调整;训练时通过交替更新每个子网络的可训练参数,以对抗方式联合训练生成器和鉴别器网络;
标签生成单元中选择影响高熵合金硬度的最优特征组合包括:参数γ、价电子浓度VEC、流动电子数-Ie1/a和构型熵ΔS;所述机器学习模型为具有径向基核函数的支持向量机回归模型SVR-R;所述支持向量机回归模型SVR-R的调参方法采用贝叶斯调参,其对应的优化目标为全部原始数据集中的平均十折交叉验证误差。
本实施例所述的一种基于机器学习和两步法数据扩充的高熵合金硬度预测装置的功能可以由前述一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法说明,因此本实施例未详述部分,可参见以上方法实施例,在此不再赘述。
虽然本发明公开披露如上,但本发明公开的保护范围并非仅限于此。本发明领域技术人员在不脱离本发明公开的精神和范围的前提下,可进行各种变更与修改,这些变更与修改均将落入本发明的保护范围。
本发明援引的文献如下:[1]Wen,C.,Zhang,Y.,Wang,C.X.et al.Machinelearning assisted design of high entropy alloys with desired property.ActaMater 170,109-117(2019).

Claims (8)

1.一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法,其特征在于包括如下步骤:
步骤一、收集多个高熵合金的成分与硬度的数据,并由高熵合金所包含的元素成分和元素本身固有性质计算得出其多个物理特征,将这些物理特征数据用作原始数据集,并将这些数据随机划分为原始训练集和测试集;
步骤二、构建GAN神经网络模型,对原始训练集特征进行扩充;
将原始训练集中多个高熵合金物理特征作为输入特征;将输入特征代入构建的GAN神经网络模型,设置生成数据量,GAN模型内部的生成器G和鉴别器D将不断迭代训练;当训练得到的最优的鉴别器D无法区分真实特征和生成的特征时,GAN模型达到纳什均衡;在此情况下进行数据扩充,得到扩充特征数据集;
所述GAN神经网络模型结构包括:生成器共有1个输入层,3个隐藏层,1个输出层,其所包含的神经元个数分别为10,128,64,32,21;鉴别器共有1个输入层,2个隐藏层和1个输出层,其所包含的神经元个数分别为21,64,32,1;生成器和鉴别器的输出层分别采用tanh和sigmoid函数,隐藏层采用LeakyReLu;在每个隐藏层中使用批量归一化,在反向传播中使用TensorFlow中的AdamOptimizer进行参数调整;训练时通过交替更新每个子网络的可训练参数,以对抗方式联合训练生成器和鉴别器网络;
步骤三、构建机器学习模型,将扩充特征数据集的特征生成标签;
首先,对物理特征进行筛选,选择影响高熵合金硬度的最优特征组合;然后,采用原始训练集的最优特征组合对机器学习模型进行调参并训练;最后,将扩充特征数据集输入至训练后的机器学习模型,将特征生成对应的标签,得到扩充训练集;
选择影响高熵合金硬度的最优特征组合包括:参数γ、价电子浓度VEC、流动电子数-Ie1/a和构型熵ΔS;
步骤四、将扩充训练集与原始训练集分别选择最优特征组合后合并,构建合并训练集;
步骤五、将合并训练集输入至步骤三所述的机器学习模型算法中,对模型进行调参并训练,得到高熵合金硬度模型,并用测试集评估其性能;
步骤六、将待检测样本输入至得到的高熵合金硬度模型对其的硬度进行预测。
2.根据权利要求1所述的方法,其特征在于:步骤一中所述高熵合金为Al-Co-Cr-Cu-Fe-Ni体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe体系和Co-Cr-Cu-Fe体系。
3.根据权利要求1所述的方法,其特征在于:步骤一中所述物理特征包括:元素间原子半径差δr、元素间电负性差Δχ、价电子浓度VEC、混合焓ΔH、构型熵ΔS、元素间局部电负性失配D.χ、内聚能Ec、流动电子数-Ⅰe1/a、流动电子数-Ⅱe2/a和参数Ω、Λ、γ;
模量失配η、局部尺寸失配D.r、强化模型中的能量项A、Peierls-Nabarro因子F、平均电子功函数的六次方ω、剪切模量G、局部模量失配δG、剪切模量差D.G和晶格畸变能μ;
e1/a表示不考虑元素d轨道电子的合金平均电子浓度,e2/a表示将过渡金属元素的电子浓度值设置为0时的合金平均电子浓度;
Ω参数是和合金内元素平均熔点以及构型熵成正比,与混合焓的绝对值成反比的参数;Λ是和构型熵成正比,与合金原子尺寸差的平方成反比的参数;γ是和合金内包含的元素的平均半径以及最小、最大半径相关的参数。
4.根据权利要求1所述的方法,其特征在于:步骤三中所述机器学习模型为具有径向基核函数的支持向量机回归模型SVR-R。
5.根据权利要求4所述的方法,其特征在于:步骤三中所述支持向量机回归模型SVR-R的调参方法采用贝叶斯调参,其对应的优化目标为全部原始数据集中的平均十折交叉验证误差。
6.一种基于机器学习和两步法数据扩充的高熵合金硬度预测装置,其特征在于该装置包括:
获取单元,用于收集多个高熵合金的成分与硬度的数据,并由高熵合金所包含的元素成分和元素本身固有性质计算得出其多个物理特征,将这些物理特征数据用作原始数据集,并将这些数据随机划分为原始训练集和测试集;
扩充单元,用于构建GAN神经网络模型,对原始训练集特征进行扩充;
将原始训练集中多个高熵合金物理特征作为输入特征;将输入特征代入构建的GAN神经网络模型,设置生成数据量,GAN模型内部的生成器G和鉴别器D将不断迭代训练;当训练得到的最优的鉴别器D无法区分真实特征和生成的特征时,GAN模型达到纳什均衡;在此情况下进行数据扩充,得到扩充特征数据集;
所述GAN神经网络模型结构包括:生成器共有1个输入层,3个隐藏层,1个输出层,其所包含的神经元个数分别为10,128,64,32,21;鉴别器共有1个输入层,2个隐藏层和1个输出层,其所包含的神经元个数分别为21,64,32,1;生成器和鉴别器的输出层分别采用tanh和sigmoid函数,隐藏层采用LeakyReLu;在每个隐藏层中使用批量归一化,在反向传播中使用TensorFlow中的AdamOptimizer进行参数调整;训练时通过交替更新每个子网络的可训练参数,以对抗方式联合训练生成器和鉴别器网络;
标签生成单元,用于构建机器学习模型,将扩充特征数据集的特征生成标签;
首先,对物理特征进行筛选,选择影响高熵合金硬度的最优特征组合;然后,采用原始训练集的最优特征组合对机器学习模型进行调参并训练;最后,将扩充特征数据集输入至训练后的机器学习模型,将特征生成对应的标签,得到扩充训练集;
选择影响高熵合金硬度的最优特征组合包括:参数γ、价电子浓度VEC、流动电子数-Ie1/a和构型熵ΔS;
合并训练集构建单元,用于将扩充训练集与原始训练集分别选择最优特征组合后合并,构建合并训练集;
机器学习模型训练单元,用于将合并训练集输入至标签生成单元所述的机器学习模型算法中,对模型进行调参并训练,得到高熵合金硬度模型,并用测试集评估其性能;
硬度检测单元,用于将待检测样本输入至得到的高熵合金硬度模型对其的硬度进行预测。
7.根据权利要求6所述的装置,其特征在于:获取单元所述高熵合金为Al-Co-Cr-Cu-Fe-Ni体系、Al-Co-Cr-Fe-Ni体系、Al-Co-Cr-Cu-Fe体系和Co-Cr-Cu-Fe体系;所述物理特征包括:元素间原子半径差δr、元素间电负性差Δχ、价电子浓度VEC、混合焓ΔH、构型熵ΔS、元素间局部电负性失配D.χ、内聚能Ec、流动电子数-Ⅰe1/a、流动电子数-Ⅱe2/a和参数Ω、Λ、γ;
模量失配η、局部尺寸失配D.r、强化模型中的能量项A、Peierls-Nabarro因子F、平均电子功函数的六次方ω、剪切模量G、局部模量失配δG、剪切模量差D.G和晶格畸变能μ;
e1/a表示不考虑元素d轨道电子的合金平均电子浓度,e2/a表示将过渡金属元素的电子浓度值设置为0时的合金平均电子浓度;
Ω参数是和合金内元素平均熔点以及构型熵成正比,与混合焓的绝对值成反比的参数;Λ是和构型熵成正比,与合金原子尺寸差的平方成反比的参数;γ是和合金内包含的元素的平均半径以及最小、最大半径相关的参数。
8.根据权利要求6所述的装置,其特征在于:
所述机器学习模型为具有径向基核函数的支持向量机回归模型SVR-R;所述支持向量机回归模型SVR-R的调参方法采用贝叶斯调参,其对应的优化目标为全部原始数据集中的平均十折交叉验证误差。
CN202211015507.5A 2022-08-24 2022-08-24 一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置 Active CN115394381B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211015507.5A CN115394381B (zh) 2022-08-24 2022-08-24 一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211015507.5A CN115394381B (zh) 2022-08-24 2022-08-24 一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置

Publications (2)

Publication Number Publication Date
CN115394381A CN115394381A (zh) 2022-11-25
CN115394381B true CN115394381B (zh) 2023-08-22

Family

ID=84119980

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211015507.5A Active CN115394381B (zh) 2022-08-24 2022-08-24 一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置

Country Status (1)

Country Link
CN (1) CN115394381B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116434880B (zh) * 2023-03-06 2023-09-08 哈尔滨理工大学 一种基于模糊自洽式聚类集成的高熵合金硬度预测方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109545290A (zh) * 2018-11-22 2019-03-29 南京航空航天大学 一种基于Voronoi分形技术的非晶合金自由体积检测方法
CN110070540A (zh) * 2019-04-28 2019-07-30 腾讯科技(深圳)有限公司 图像生成方法、装置、计算机设备及存储介质
CN112216356A (zh) * 2020-10-22 2021-01-12 哈尔滨理工大学 一种基于机器学习的高熵合金硬度预测方法
CN113970528A (zh) * 2021-09-06 2022-01-25 池明旻 基于完全约束最小二乘法的纺织品成分解混方法
CN114093440A (zh) * 2021-11-16 2022-02-25 昆明理工大学 一种基于深度学习预测高熵合金硬度的方法
CN114112982A (zh) * 2021-10-09 2022-03-01 池明旻 基于k-Shape的织物纤维成分定性方法
CN114842343A (zh) * 2022-05-17 2022-08-02 武汉理工大学 一种基于ViT的航空图像识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120296974A1 (en) * 1999-04-27 2012-11-22 Joseph Akwo Tabe Social network for media topics of information relating to the science of positivism

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109545290A (zh) * 2018-11-22 2019-03-29 南京航空航天大学 一种基于Voronoi分形技术的非晶合金自由体积检测方法
CN110070540A (zh) * 2019-04-28 2019-07-30 腾讯科技(深圳)有限公司 图像生成方法、装置、计算机设备及存储介质
CN112216356A (zh) * 2020-10-22 2021-01-12 哈尔滨理工大学 一种基于机器学习的高熵合金硬度预测方法
CN113970528A (zh) * 2021-09-06 2022-01-25 池明旻 基于完全约束最小二乘法的纺织品成分解混方法
CN114112982A (zh) * 2021-10-09 2022-03-01 池明旻 基于k-Shape的织物纤维成分定性方法
CN114093440A (zh) * 2021-11-16 2022-02-25 昆明理工大学 一种基于深度学习预测高熵合金硬度的方法
CN114842343A (zh) * 2022-05-17 2022-08-02 武汉理工大学 一种基于ViT的航空图像识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
鲁统伟 等.基于生成对抗网络的知识蒸馏数据增强.《计算机工程》.2022,第48卷(第4期),第70-80页. *

Also Published As

Publication number Publication date
CN115394381A (zh) 2022-11-25

Similar Documents

Publication Publication Date Title
Natarajan et al. Non-dominated sorting modified teaching–learning-based optimization for multi-objective machining of polytetrafluoroethylene (PTFE)
Song et al. Using grey relational analysis to predict software effort with small data sets
CN109143408B (zh) 基于mlp的动态区域联合短时降水预报方法
CN110987436B (zh) 基于激励机制的轴承故障诊断方法
CN112199862B (zh) 纳米粒子运移的预测方法、其影响因子分析方法及系统
CN115394381B (zh) 一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置
CN112765902B (zh) 一种基于TentFWA-GD的RBF神经网络的农村生活污水处理过程中COD浓度的软测量建模方法
CN116596095B (zh) 基于机器学习的碳排放量预测模型的训练方法及装置
CN114861879A (zh) 一种基于天牛须算法优化Elman神经网络电主轴热误差建模方法
Puchi-Cabrera et al. Machine learning aided nanoindentation: A review of the current state and future perspectives
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及系统
CN113203953B (zh) 基于改进型极限学习机的锂电池剩余使用寿命预测方法
Korovin et al. The application of evolutionary algorithms in the artificial neural network training process for the oilfield equipment malfunctions’ forecasting
CN111310974A (zh) 一种基于ga-elm的短期需水预测方法
CN116662893A (zh) 一种基于改进的樽海鞘算法优化svm的水质预测方法
CN115310355A (zh) 考虑多能耦合的综合能源系统多元负荷预测方法及系统
Van Beek et al. Scalable objective-driven batch sampling in simulation-based design for models with heteroscedastic noise
Spiliotis Time Series Forecasting with Statistical, Machine Learning, and Deep Learning Methods: Past, Present, and Future
CN111260077A (zh) 一种确定业务处理模型超参数的方法和装置
CN117095308B (zh) 一种基于遗传算法的全极化sar影像海面溢油检测方法
CN116780524B (zh) 一种基于lstm深度学习的工业企业短期负荷预测方法
CN109521176B (zh) 一种基于改进深度极限学习机的虚拟水质监测方法
Chen Brain Tumor Prediction with LSTM Method
M John et al. Predicting House Prices using Machine Learning and LightGBM.
Lee et al. Adaptive Neural Network Ensemble Using Frequency Distribution

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant