CN116364212A - 机器学习模型加速快离子导体材料的筛选优化方法和材料 - Google Patents

机器学习模型加速快离子导体材料的筛选优化方法和材料 Download PDF

Info

Publication number
CN116364212A
CN116364212A CN202111599893.2A CN202111599893A CN116364212A CN 116364212 A CN116364212 A CN 116364212A CN 202111599893 A CN202111599893 A CN 202111599893A CN 116364212 A CN116364212 A CN 116364212A
Authority
CN
China
Prior art keywords
model
screening
doping
derivative
ion migration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111599893.2A
Other languages
English (en)
Inventor
王宇琦
吴思远
邵伟
孙晓瑞
王强
肖睿娟
李泓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Physics of CAS
Samsung Electronics Co Ltd
Original Assignee
Institute of Physics of CAS
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Physics of CAS, Samsung Electronics Co Ltd filed Critical Institute of Physics of CAS
Priority to CN202111599893.2A priority Critical patent/CN116364212A/zh
Publication of CN116364212A publication Critical patent/CN116364212A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C60/00Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C10/00Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E60/00Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
    • Y02E60/10Energy storage using batteries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Crystals, And After-Treatments Of Crystals (AREA)

Abstract

本发明涉及一种机器学习模型加速快离子导体材料的筛选优化方法和材料,方法包括:将待筛选材料数据集输入离子迁移势垒模型,筛选出锂离子迁移势垒小于预设势垒数值的材料组成第一材料集合;待筛选材料数据集包括含有多个具有两种阴离子的化合物Li‑A‑O‑S;确定满足A元素可用性评价要求的第二材料集合,并从中选出锂离子迁移势垒最低的材料作为待优化材料;对待优化材料进行掺杂改性,得到不同掺杂量和掺杂位点分布的多个衍生结构;根据每个衍生结构对应的晶体能量和原子受力信息,对各个衍生结构进行结构弛豫,得到收敛后的对应每个掺杂量的一个衍生结构,再通过离子迁移势垒模型筛选出其中锂离子迁移势垒最小的衍生结构作为筛选优化输出结果。

Description

机器学习模型加速快离子导体材料的筛选优化方法和材料
技术领域
本发明涉及新能源材料数据挖掘领域,尤其涉及一种机器学习模型加速快离子导体材料的筛选优化方法和材料。
背景技术
当今世界,不但化石燃料和生物质能燃烧释放的气体严重污染空气,而且现代社会一系列环境破坏导致的全球变暖给我们敲响了警钟。基于以上种种忧虑,业内关注寻找一种对环境友好的新型能源取代化石燃料。
近年来业内在发展环境友好能源过程中取得了重要的进展,如风涡轮机、光热接收器、太阳能电池等,这对储能设备的发展提出了更高的要求。因此,二次电池可以长期稳定地存储可持续能源,并具有较长的循环寿命,符合环境友好的理念,成为了现代电化学发展的重要突破。而且全固态电池,因其相对于传统的液态电解质电池具有更高的化学稳定性、更高的功率密度和能量密度,已经作为下一代环境友好电池获得越来越多的关注,具有高离子电导率的无机固体电解质材料的探索是开发全固态电池的关键任务之一。
目前大多数被广泛使用的固态电解质材料都是通过实验手段发现的,然而巨大的候选材料空间加重了材料合成和性能测量的任务,令使用实验手段探究新型固态电解质材料举步维艰。除了实验手段之外,理论计算方法对于材料性质模拟的准确性逐渐提升,作为辅助手段成功预测了材料的许多性质,从而使材料筛选和设计成为可能。
基于高通量计算的快离子导体材料筛选涉及大量的计算任务,该筛选过程通常包含结构优化、能量计算、电荷分析和离子迁移势垒估计等步骤。其中第一步涉及在大量候选化合物或衍生结构中寻找平衡原子位置,由于需探索密集的材料结构空间,所以计算成本很高。最后一步涉及材料中的离子动力学性质研究,其中过渡态理论和分子动力学是主要的模拟方法,但是两者都是非常耗时的计算工具。因此时至今日,对于快离子导体材料的筛选优化,依然是需要花费大量成本且耗时耗力的一项工作。
发明内容
本发明实施例提供了一种机器学习模型加速快离子导体材料的筛选优化方法和材料。该方法通过筛选优化方法探索最佳掺杂方案,包括最佳掺杂比率和掺杂位点分布,获得具有更好的离子迁移性能的快离子导体材料。
第一方面,本发明实施例提供了一种机器学习模型加速快离子导体材料的筛选优化方法,所述筛选优化方法包括:
将待筛选材料数据集输入离子迁移势垒模型,筛选出锂离子迁移势垒小于预设势垒数值的材料组成第一材料集合;所述待筛选材料数据集包括含有多个具有两种阴离子的化合物Li-A-O-S,其中A为三价金属元素;
根据预先确定的A元素可用性评价参数,在所述第一材料集合中确定满足A元素可用性评价要求的第二材料集合;
在所述第二材料集合中选出锂离子迁移势垒最低的材料作为待优化材料;
基于预选的掺杂材料对所述待优化材料进行掺杂改性,得到不同掺杂量和掺杂位点分布的多个衍生结构;
根据每个衍生结构对应的晶体能量和原子受力信息,对不同掺杂量和掺杂位点分布的衍生结构进行结构弛豫,得到收敛后的对应每个掺杂量的一个衍生结构,作为第三材料集合;
将第三材料集合输入离子迁移势垒模型,筛选出锂离子迁移势垒最小的衍生结构作为筛选优化输出结果。
优选的,所述预设势垒数值具体为1.265eV。
优选的,所述A元素可用性评价参数通过对A元素的价格和丰度进行评价确定。
优选的,所述根据每个衍生结构对应的晶体能量和原子受力信息,对不同掺杂量和掺杂位点分布的衍生结构进行结构弛豫,得到收敛后的对应每个掺杂量的一个衍生结构具体包括:
确定每个衍生结构对应的晶体能量和原子受力信息;其中,所述原子受力信息包括所述衍生结构中每种元素的原子受力信息;
利用velocity-Verlet分子动力学算法更新衍生结构中的原子位置,根据所述晶体能量和原子受力信息确定每种掺杂量下最稳定的一种衍生结构。
进一步优选的,所述确定每个衍生结构对应的晶体能量和原子受力信息具体为:
根据晶体能量模型和原子受力模型确定每个衍生结构对应的晶体能量和原子受力信息;其中,所述原子受力模型用于分别确定所述衍生结构中每种元素的原子受力信息。
优选的,所述离子迁移势垒模型使用随机森林算法;所述离子迁移势垒模型的构建包括:
利用无机晶体数据库中获取所有含有特定阳离子Mn+的化合物构建基础数据集,其中Mn+包括:Ag+,Al3+,Ca2+,Li+,Mg2+,Na+,或Zn2+
基于键价理论计算所述Mn+的化合物的迁移势垒,选出势垒小于2eV的Mn+的化合物作为模型数据集;
利用Matminer程序包进行模型数据的特征提取,其中模型数据包括Mn+的化合物中的迁移离子、框架离子和全部离子;所述迁移离子为Mn+,所述框架离子为Mn+的化合物中除Mn +以外的离子;
基于提取到的特征,对所述离子迁移势垒模型进行模型训练。
优选的,所述预选的掺杂材料为Mg;
所述筛选出锂离子迁移势垒最小的衍生结构为Li1-2xMgxBiOS;x=0.1875;Li、Mg、Bi、O、S在化学式中计量比为10:3:16:16:16;晶胞参数
Figure BDA0003431366950000041
α=β=γ=90°,空间群为Pca21。
优选的,所述筛选优化方法用于快离子导体材料的优化筛选。
第二方面,本发明实施例提供了一种快锂离子导体材料,所述材料为Li1- 2xMgxBiOS;x<0.375;空间群为Pca21。
优选的,所述快锂离子导体材料,用于锂离子电池或锂金属电池中的固态电解质材料。
本发明机器学习模型加速快离子导体材料的筛选优化方法,是开发了一种加速的快离子导体材料筛选流程,利用机器学习模型,加速筛选流程中的耗时步骤,用于加速掺杂结构弛豫和迁移势垒估计,从而大大缩短材料筛选周期,且能够更为精确的实现快离子导体材料的筛选和优化。通过筛选优化方法探索最佳掺杂方案,包括最佳掺杂比率和掺杂位点分布,使得通过本发明筛选优化方法获得的快离子导体材料具有更好的离子迁移性能。
附图说明
下面通过附图和实施例,对本发明实施例的技术方案做进一步详细描述。
图1为本发明实施例提供的机器学习模型加速快离子导体材料的筛选优化方法流程图;
图2a为本发明实施例提出的离子迁移势垒模型预测性能示意图;
图2b为本发明实施例离子迁移势垒模型的重要描述因子;
图2c为本发明实施例离子迁移势垒模型的重要的描述因子的量化参数示意图;
图3为本发明实施例进行筛选优化所基于的原始材料数据集中的49种材料的锂离子迁移势垒;
图4a、4b为本发明实施例提出的预选的掺杂材料Li-Bi-O-S的晶体结构示意图;
图4c、4d为本发明实施例提出的预选的掺杂材料Li-Bi-O-S的锂离子迁移性能示意图;
图5a、5b为本发明实施例提出的晶体能量模型的预测性能示意图;
图6a-f为本发明实施例基于5种不同元素Li、Mg、Bi、O、S的原子受力模型的预测性能示意图;
图7a、7b为本发明实施例提出的Li1-2xMgxBiOS(x=0.1875)的晶体结构示意图;
图7c为本发明实施例提出的Li1-2xMgxBiOS(x=0.1875)的锂离子迁移性能示意图;
图8为本发明实施例提出的机器学习模型加速快离子导体材料的筛选优化方法过程示意图。
具体实施方式
下面通过附图和具体的实施例,对本发明进行进一步的说明,但应当理解为这些实施例仅仅是用于更详细说明之用,而不应理解为用以任何形式限制本发明,即并不意于限制本发明的保护范围。
本发明提出了一种机器学习模型加速快离子导体材料的筛选优化方法,用于加速快离子导体材料的筛选优化,主要方法步骤如图1所示,包括:
步骤110,将待筛选材料数据集输入离子迁移势垒模型,筛选出锂离子迁移势垒小于预设势垒数值的材料组成第一材料集合;
离子迁移势垒模型的构建和训练包括:
S1,利用无机晶体数据库中获取所有含有特定阳离子Mn+的化合物构建基础数据集,其中Mn+包括:Ag+,Al3+,Ca2+,Li+,Mg2+,Na+,或Zn2+
S2,基于键价理论计算所述Mn+的化合物的迁移势垒,选出势垒小于2eV的Mn+的化合物作为模型数据集;
其中化合物的离子迁移势垒用作模型输出的标签,本发明进行模型训练选出的迁移势垒小于2eV的化合物组成的模型数据集中共有3136个训练样本结构。
S3,利用Matminer程序包进行模型数据的特征提取,其中模型数据包括Mn+的化合物中的迁移离子、框架离子和全部离子;其中,迁移离子为Mn+,框架离子为Mn+的化合物中除Mn+以外的离子;
具体的,利用Matminer程序包进行模型数据的特征提取用作模型输入量的材料特征:基于成分和结构的材料基本性质,特征根据所关注的离子类型不同可以分成只关注迁移离子(即可以在结构中迁移的离子,这里指Mn+)、只关注除迁移离子外的框架离子(即结构中几乎不会发生迁移的离子,这里指除了Mn+之外的其他离子)、关注所有离子三类(即结构中所有离子)。所有特征提取都使用Matminer程序包,详细特征信息见表1。
Figure BDA0003431366950000061
表1
除了这些从材料化学式和结构文件提取的有关成分和结构的特征量,还可加入一些描述迁移离子的特征,包括迁移离子种类、迁移离子价态、迁移离子半径、迁移离子的电负性。在本发明具体实施中,最终对于每种材料都提取了296个特征。
S4,基于提取到的特征,对离子迁移势垒模型进行模型训练。
因为无机晶体数据库中的化合物其离子迁移势垒是确定已知的,因此可以根据已知的离子迁移势垒对模型训练输出结果进行训练收敛得到离子迁移势垒模型。
本发明的离子迁移势垒模型使用随机森林算法。算法的超参数设置见表2。
Figure BDA0003431366950000071
表2
通过训练得到的离子迁移势垒模型在测试集上的平均绝对误差为0.265eV。该误差小于常用的快离子导体材料的筛选条件1eV,所以该模型的预测结果可以用于快离子导体筛选。
模型预测的离子迁移势垒与键价理论计算的离子迁移势垒之间的关系如图2a所示。数据点大多分布在参照线(图中虚线)周围,说明模型的预测性能良好。随机森林算法是一种可解释的算法,可以自动给出模型中最重要的特征。图2b显示了模型最重要的十个特征。图2c给出了该十个最重要特征与离子迁移势垒之间的Spearman相关性,具有正相关参数的变量之间呈正相关,反之呈负相关。图中性质序号1-11依次代表:银元素含量分数、迁移离子平均键角、锂元素含量分数、迁移离子平均键长、p层价电子平均含量、迁移离子位点数目、迁移离子处于四面体配位环境下的序参量、能带中心、框架离子与周围离子之间距离偏移的平均值、杨氏模量、键价理论计算的离子迁移活化能。
通过训练出的离子迁移势垒模型对待筛选材料数据集进行材料筛选。其中,待筛选材料数据集包括含有多个具有两种阴离子的化合物Li-A-O-S,其中A为三价金属元素。
在本发明实施过程中,首先是基于He J等人在文章”Computational Discoveryof Stable Heteroanionic Oxychalcogenides ABXO(A,B=Metals;X=S,Se,and Te)andTheir Potential Applications”中通过元素替换得到的一系列虚拟结构,选出其中处于稳态和亚稳态的含锂离子的化合物ABXO(A是Li,B是三价金属元素;X=S,Se,Te),共有49种,其化学式见图3的横坐标。
为得到潜在的快锂离子导体材料,筛选条件预设势垒数值具体为1.265eV,在上述49种化合物中,纵坐标位于图3中虚线以下的材料均符合要求。
因为硫相对于硒和碲元素原子质量更小,含有氧硫离子的材料更具质量能量密度优势。本发明选择其中X=S的化合物组成待筛选材料数据集。
由此得到的待筛选材料数据集中包括9种Li-A-O-S,其化学式组成元素分别包括Li-Bi-O-S,Li-V-O-S,Li-Dy-O-S,Li-Sc-O-S,Li-Gr-O-S,Li-As-O-S,Li-Al-O-S,Li-Ga-O-s,Li-In-O-S。
步骤120,根据预先确定的A元素可用性评价参数,在第一材料集合中确定满足A元素可用性评价要求的第二材料集合;
具体的,A元素可用性评价参数通过对A元素的价格和丰度进行评价确定。
在具体实施中,对根据A元素的价格和丰度分别设定相应的基准参考数据,并以基准参考数据对不同A元素的价格和丰度分别进行量化评估。
在一个具体例子中,A元素可用性评价参数=α×(A元素的价格/基准参考价格数据)+β×(A元素的丰度/基准参考丰度数据)。α为价格因子,β为丰度因子,α、β、基准参考价格数据和基准参考丰度数据可根据经验数据或实验要求等进行设定。
通过本步骤可筛选掉其中价格昂贵和/或含量稀少的A元素。
在本方案实施中,Li-Dy-O-S、Li-As-O-S、Li-In-O-S、Li-Sc-O-S和Li-Ga-O-S被筛选掉。筛选之后剩下4种不同成分组成的材料组成第二材料集合:Li-Bi-O-S、Li-V-O-S、Li-Gr-O-S和Li-Al-O-S,其锂离子迁移势垒分别为1.171eV、1.214eV、1.177eV和1.175eV。
步骤130,在第二材料集合中选出锂离子迁移势垒最低的材料作为待优化材料;
选择上一步筛选得到的4个材料中锂离子迁移势垒最低的材料Li-Bi-O-S做进一步物性研究。
Li-Bi-O-S的晶体结构见图4a,4b,结构内连通区域代表键价理论计算的锂离子迁移路径。可以看到Li-Bi-O-S的锂离子在ac平面内二维传输。由图4c可知扩张弹性带理论计算的离子迁移势垒为0.047eV,说明Li-Bi-O-S中的锂离子迁移势垒确实很低。进一步进行第一性原理分子动力学模拟,如图4d所示,在1200K下模拟120ps后结构中发生的扩散事件很少,说明离子迁移性能不好,这是由于高的缺陷形成能。
步骤140,基于预选的掺杂材料对待优化材料进行掺杂改性,得到不同掺杂量和掺杂位点分布的多个衍生结构;
在本发明中预选的掺杂材料为二价Mg离子,主要是用来解决高缺陷导致的离子迁移性能差的问题,通过用二价镁离子替换Li-Bi-O-S中部分锂离子,对Li-Bi-O-S做掺杂改性,生成615个不同掺杂量和掺杂位点分布的衍生结构Li1-2xMgxBiOS(x=0.0625,0.125,0.1875,0.25,0.3125,0.375,0.4375),此时x=0对应的LiBiOS中共有64个原子。
如果是出于其他目的,或有特定的材料选择,也可选用不同的预选的掺杂材料对材料进行改性,本发明的方法也可适用于除Mg掺杂外的其他材料掺杂。
步骤150,根据每个衍生结构对应的晶体能量和原子受力信息,对不同掺杂量和掺杂位点分布的衍生结构进行结构弛豫,得到收敛后的对应每个掺杂量的一个衍生结构,作为第三材料集合;
具体的,确定每个衍生结构对应的晶体能量和原子受力信息;其中,原子受力信息包括衍生结构中每种元素的原子受力信息;进一步详细的,可以是根据晶体能量模型和原子受力模型确定每个衍生结构对应的晶体能量和原子受力信息;其中,原子受力模型用于分别确定衍生结构中每种元素的原子受力信息。
利用velocity-Verlet分子动力学算法更新衍生结构中的原子位置,根据晶体能量和原子受力信息确定每种掺杂量下最稳定的一种衍生结构。
本发明的晶体能量模型和原子受力模型训练采用66个不同掺杂量下随机生成的初始掺杂结构Li1-2xMgxBiOS(x=0,0.0625,0.125,0.1875,0.25,0.3125,0.375,0.4375),将该66个初始结构进行基于密度泛函理论的结构弛豫,并得到结构弛豫时的结构快照,共得到9858个结构作为训练样本数据集。
获取所有结构的晶体能量和原子受力信息分别作为两个模型的数据标签。共有9858个晶体能量数据。对于原子受力,每个结构中含有多个原子,且每个原子上具有x,y,z三个方向上的力分量的信息。在全部9858个结构中每隔10个选出一个结构,采集被选中结构中所有原子的受力信息,最终共得到58889个原子受力数据。上述数据用作模型输出量的材料标签。
采用两种基于结构中的原子局域环境的特征用作模型输入量的材料特征。
对于晶体能量模型,使用HimanenL等人在文章“DScribe:Library ofdescriptors for machine learning in materials science”中介绍的原子轨道平滑展开(SOAP)作为材料特征。SOAP可用于对原子结构中的局部环境进行编码,一个原子的原子结构被转化为原子密度场。在原子密度场函数中,球面谐波Ylm(θ,φ)中的最大角量子数lmax,径向基函数gn(r)中的最大级数nmax和截断半径rcut需人为规定。局域特征不能直接用于描述与整体相关的材料性质。因此,我们使用结构中所有原子的SOAP平均值作为晶体总能量模型的特征。使用参数设置
Figure BDA0003431366950000112
,lmax=5,nmax=5,每个结构生成了1950个特征。
对于原子受力模型,使用Botu V等人在文章“Machine Learning Force Fields:Construction,Validation,and Outlook”中介绍的AGNI作为材料特征。在AGNI中,原子i在k(k=x,y,z)方向上受到的局域环境影响由一个函数给出,该函数包含的需人为指定的参数有高斯函数宽度η和截断半径rcut。使用参数设置
Figure BDA0003431366950000113
,η范围从1.6到16,间隔为0.4,每个原子生成了540个特征。
晶体能量模型使用随机森林模型算法,原子受力模型使用岭回归算法,算法的超参数设置见表3和表4。
Figure BDA0003431366950000111
表3
由表3可知,晶体能量模型在测试集上的平均误差为1meV/atom,与基于密度泛函理论计算的能量精度相当。模型预测的能量与密度泛函理论计算的能量之间的关系如图5a所示,数据点大多分布在参照线(图中虚线)周围,说明模型的预测性能良好。图5b是预测能量与密度泛函计算能量之间误差的绝对值,模型的预测误差很小。
对于原子受力模型,根据所关注原子的元素种类不同,分开构建原子受力模型,因为体系中共含有五种不同元素锂、铋、氧、硫、镁,所以共构建了五个原子受力模型。
Figure BDA0003431366950000121
表4
由表4可知,原子受力模型在测试集上的平均误差为
Figure BDA0003431366950000122
Figure BDA0003431366950000123
模型预测的力与密度泛函理论计算的力之间的关系如图6a-e所示,数据点大多分布在参照线(图中虚线)周围,说明模型的预测性能良好。图6f是预测力与密度泛函计算力之间误差的绝对值,模型的预测误差很小。
在对初始掺杂结构进行结构弛豫时,用这两个机器学习模型分别预测晶体总能量和原子受力,每个弛豫步骤内都用一种改良的velocity-Verlet分子动力学(MDMin)方法来更新原子位置。弛豫所用的力收敛精度为
Figure BDA0003431366950000124
用该结构弛豫模型,对上述的615个不同掺杂量和掺杂位点分布的衍生结构Li1- 2xMgxBiOS(x=0.0625,0.125,0.1875,0.25,0.3125,0.375,0.4375)进行结构弛豫。根据预测的能量,筛选出每种掺杂量下最稳定的结构,7种掺杂量共得到7个结构。
Figure BDA0003431366950000131
表5
步骤160,将第三材料集合输入离子迁移势垒模型,筛选出锂离子迁移势垒最小的衍生结构作为筛选优化输出结果。
再次使用离子迁移势垒模型对上述步骤150获得的7个稳定结构中的锂离子迁移势垒进行预测,这7个结构的能量预测值见表5。其中,x=0.1875对应的结构中离子迁移势垒最低,认为这是最佳的掺杂方案,即为输出结果。
此外,可以看到x<0.375的衍生结构Li1-2xMgxBiOS对应的锂离子迁活化能都小于1.1eV,因此均有较好的实际应用前景。
最佳掺杂方案下的Li1-2xMgxBiOS(x=0.1875)晶体结构如图7a所示。对其进行第一性原理分子动力学模拟,如图7c所示为525K下模拟100ps时锂离子的均方位移。与未掺杂结构LiBiOS的结果(图4d)对比,Li1-2xMgxBiOS(x=0.1875)在更低温度和更短模拟时间内发生的迁移事件明显更多。说明掺杂之后锂离子迁移性能有明显提高。图7b所示为Li1-2xMgxBiOS(x=0.1875)中的一个锂离子的迁移路径,锂离子主要在ac平面内迁移,原始材料中的二维离子迁移特征被保留了下来。
本发明上述材料筛选优化出锂离子迁移势垒最小的衍生结构为Li1-2xMgxBiOS;x=0.1875;Li、Mg、Bi、O、S在化学式中计量比为10:3:16:16:16;晶胞参数
Figure BDA0003431366950000141
α=β=γ=90°,空间群为Pca21。
本发明提出的机器学习模型加速快离子导体材料的筛选优化方法,主要涉及的处理模块及其执行算法如图8所示,均在上述方法流程说明中已经进行了详述,在此不再赘述。
本发明通过将此筛选流程应用于从49种具有两种阴离子的化合物ABXO(A,B是Li和其他三价金属元素;X=S,Se,Te)中筛选快锂离子导体,并筛选出LiBiOS作为潜在的快离子导体材料。虽然LiBiOS表现出相对较低的迁移势垒值,但进一步分析表明,其高载流子形成能限制了离子传输。因此,我们在LiBiOS中用Mg2+替换部分的Li+,通过在结构中引入空位缺陷来降低载流子形成能,并利用加速的筛选流程探索最佳掺杂方案,包括最佳Li-Mg比率和掺杂位点分布,得到最佳掺杂方案Li1-2xMgxBiOS(x=0.1875),相对于未掺杂的结构具有更良好的离子迁移性能。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种机器学习模型加速快离子导体材料的筛选优化方法,其特征在于,所述筛选优化方法包括:
将待筛选材料数据集输入离子迁移势垒模型,筛选出锂离子迁移势垒小于预设势垒数值的材料组成第一材料集合;所述待筛选材料数据集包括含有多个具有两种阴离子的化合物Li-A-O-S,其中A为三价金属元素;
根据预先确定的A元素可用性评价参数,在所述第一材料集合中确定满足A元素可用性评价要求的第二材料集合;
在所述第二材料集合中选出锂离子迁移势垒最低的材料作为待优化材料;
基于预选的掺杂材料对所述待优化材料进行掺杂改性,得到不同掺杂量和掺杂位点分布的多个衍生结构;
根据每个衍生结构对应的晶体能量和原子受力信息,对不同掺杂量和掺杂位点分布的衍生结构进行结构弛豫,得到收敛后的对应每个掺杂量的一个衍生结构,作为第三材料集合;
将第三材料集合输入离子迁移势垒模型,筛选出锂离子迁移势垒最小的衍生结构作为筛选优化输出结果。
2.根据权利要求1所述的筛选优化方法,其特征在于,所述预设势垒数值具体为1.265eV。
3.根据权利要求1所述的筛选优化方法,其特征在于,所述A元素可用性评价参数通过对A元素的价格和丰度进行评价确定。
4.根据权利要求1所述的筛选优化方法,其特征在于,所述根据每个衍生结构对应的晶体能量和原子受力信息,对不同掺杂量和掺杂位点分布的衍生结构进行结构弛豫,得到收敛后的对应每个掺杂量的一个衍生结构具体包括:
确定每个衍生结构对应的晶体能量和原子受力信息;其中,所述原子受力信息包括所述衍生结构中每种元素的原子受力信息;
利用velocity-Verlet分子动力学算法更新衍生结构中的原子位置,根据所述晶体能量和原子受力信息确定每种掺杂量下最稳定的一种衍生结构。
5.根据权利要求4所述的筛选优化方法,其特征在于,所述确定每个衍生结构对应的晶体能量和原子受力信息具体为:
根据晶体能量模型和原子受力模型确定每个衍生结构对应的晶体能量和原子受力信息;其中,所述原子受力模型用于分别确定所述衍生结构中每种元素的原子受力信息。
6.根据权利要求1所述的筛选优化方法,其特征在于,所述离子迁移势垒模型使用随机森林算法;所述离子迁移势垒模型的构建包括:
利用无机晶体数据库中获取所有含有特定阳离子Mn+的化合物构建基础数据集,其中Mn+包括:Ag+,Al3+,Ca2+,Li+,Mg2+,Na+,或Zn2+
基于键价理论计算所述Mn+的化合物的迁移势垒,选出势垒小于2eV的Mn+的化合物作为模型数据集;
利用Matminer程序包进行模型数据的特征提取,其中模型数据包括Mn+的化合物中的迁移离子、框架离子和全部离子;所述迁移离子为Mn+,所述框架离子为Mn+的化合物中除Mn+以外的离子;
基于提取到的特征,对所述离子迁移势垒模型进行模型训练。
7.根据权利要求1所述的筛选优化方法,其特征在于,所述预选的掺杂材料为Mg;
所述筛选出锂离子迁移势垒最小的衍生结构为Li1-2xMgxBiOS;x=0.1875;Li、Mg、Bi、O、S在化学式中计量比为10:3:16:16:16;晶胞参数
Figure FDA0003431366940000021
α=β=γ=90°,空间群为Pca21。
8.根据权利要求1所述的筛选优化方法,其特征在于,所述筛选优化方法用于快离子导体材料的优化筛选。
9.一种快锂离子导体材料,其特征在于,所述材料为Li1-2xMgxBiOS;x<0.375;空间群为Pca21。
10.根据权利要求9所述的快锂离子导体材料,其特征在于,所述快锂离子导体材料,用于锂离子电池或锂金属电池中的固态电解质材料。
CN202111599893.2A 2021-12-24 2021-12-24 机器学习模型加速快离子导体材料的筛选优化方法和材料 Pending CN116364212A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111599893.2A CN116364212A (zh) 2021-12-24 2021-12-24 机器学习模型加速快离子导体材料的筛选优化方法和材料

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111599893.2A CN116364212A (zh) 2021-12-24 2021-12-24 机器学习模型加速快离子导体材料的筛选优化方法和材料

Publications (1)

Publication Number Publication Date
CN116364212A true CN116364212A (zh) 2023-06-30

Family

ID=86940348

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111599893.2A Pending CN116364212A (zh) 2021-12-24 2021-12-24 机器学习模型加速快离子导体材料的筛选优化方法和材料

Country Status (1)

Country Link
CN (1) CN116364212A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116564455A (zh) * 2023-07-05 2023-08-08 苏州浪潮智能科技有限公司 离子电池正极材料筛选方法、装置、电池、设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116564455A (zh) * 2023-07-05 2023-08-08 苏州浪潮智能科技有限公司 离子电池正极材料筛选方法、装置、电池、设备及介质
CN116564455B (zh) * 2023-07-05 2023-09-29 苏州浪潮智能科技有限公司 离子电池正极材料筛选方法、装置、电池、设备及介质

Similar Documents

Publication Publication Date Title
Jain et al. The materials project: Accelerating materials design through theory-driven data and tools
Wang et al. Applications of machine learning in perovskite materials
Baloch et al. Extending Shannon's ionic radii database using machine learning
US20090157369A1 (en) Fast and High-Throughput Search Engine for Materials for Lithium-Ion Batteries Using Quantum Simulations
CN109800898A (zh) 一种智能短期负荷预测方法及系统
Choudhary et al. Graph neural network predictions of metal organic framework CO2 adsorption properties
CN114493050A (zh) 多维度融合的新能源功率并联预测方法和装置
Amos et al. Projecting ozone hole recovery using an ensemble of chemistry–climate models weighted by model performance and independence
Rath et al. Discovery of direct band gap perovskites for light harvesting by using machine learning
CN116364212A (zh) 机器学习模型加速快离子导体材料的筛选优化方法和材料
Cheng et al. Spatio‐temporal hourly and daily ozone forecasting in China using a hybrid machine learning model: Autoencoder and generative adversarial networks
Gamboa-Rosales et al. Determining Technologies Trends and Evolution of Smart Building Technologies by Bibliometric Analysis from 1984 to 2020: Trends, research opportunities and future perspectives
Bouabdallaoui et al. Review of current artificial intelligence methods and metaheuristic algorithms for wind power prediction
Guan et al. Structure and dynamics of energy materials from machine learning simulations: A topical review
CN115600511B (zh) 电解质材料预测方法、装置和计算机设备
Guher et al. Determining of solar power by using machine learning methods in a specified region
Li Marine Environmental Monitoring Data Based on Information Visualization
Maksimenko et al. Construction of interatomic potentials of VW on the basis of CALPHAD data on the formation enthalpy
Wang et al. Deep learning-based gas-phase chemical kinetics kernel emulator: Application in a global air quality simulation case
van Belois KMC modelling of light induced halide segregation in perovskite solar cells
Rozon et al. Towards a Transparent and Dynamic Forecasting of Renewable Energy Technologies Capacity and Cost to 2050
Pueschel Optimization of an advanced multi-junction solar-cell design for space environments (AM0) using nearly orthogonal Latin hypercubes
Luo et al. Short-Term Photovoltaic Power Prediction Based on 3DCNN and CLSTM Hybrid Model
Hu et al. Interpretable machine learning predictions for efficient perovskite solar cell development
Cai et al. Discovery of all-inorganic lead-free perovskites with high photovoltaic performance via ensemble machine learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination