CN108319807B - 一种掺杂式能源材料的高通量计算筛选方法 - Google Patents

一种掺杂式能源材料的高通量计算筛选方法 Download PDF

Info

Publication number
CN108319807B
CN108319807B CN201810018412.6A CN201810018412A CN108319807B CN 108319807 B CN108319807 B CN 108319807B CN 201810018412 A CN201810018412 A CN 201810018412A CN 108319807 B CN108319807 B CN 108319807B
Authority
CN
China
Prior art keywords
calculation
doped
doping
information file
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810018412.6A
Other languages
English (en)
Other versions
CN108319807A (zh
Inventor
贾子熙
孟祥颖
陈彦霖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201810018412.6A priority Critical patent/CN108319807B/zh
Publication of CN108319807A publication Critical patent/CN108319807A/zh
Application granted granted Critical
Publication of CN108319807B publication Critical patent/CN108319807B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/90Programming languages; Computing architectures; Database systems; Data warehousing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于材料计算技术领域,提供一种掺杂式能源材料的高通量计算筛选方法,通过四个模块实现,具体为:通过本征材料结构提取模块获取本征材料的晶体结构信息文件,由掺杂结构构造模块对其进行处理,得到待掺杂的结构信息文件,再通过掺杂材料结构优化与性质计算模块读取结构信息文件,批量生成结构优化‑性质计算工作流并进行高通量计算,最后通过材料数据库导入模块将能量、电子性质等计算结果存储到专用数据库中。本发明能够高效的达到高通量计算筛选的目的,提高材料筛选工作效率,具有较强的通用性和扩展性。

Description

一种掺杂式能源材料的高通量计算筛选方法
技术领域
本发明属于材料计算技术领域,涉及一种掺杂式能源材料的高通量计算筛选方法。
背景技术
传统的材料研发以实验室研究为主,人们往往根据经验和直觉对目标材料进行设计和筛选,由此导致材料研发周期长、资金耗费大,严重制约新材料的研发效率。
随着计算机科学的发展和计算机运算能力的提高,材料的计算机模拟与设计成为了材料研究过程中重要的研究工具,常用方法包括第一性原理方法、分子动力学方法、蒙特卡罗方法、元胞自动机方法等。然而在当前的计算材料科学中,对于掺杂式能源材料的计算仍然处于比较初级的阶段。首先对于掺杂材料的结构构建操作,由于掺杂位置和掺杂元素是已确定的有限集,故研究者在针对同一本征材料构建掺杂结构时往往需要做大量的重复工作,效率十分低下。而在计算量较为庞大、计算任务数量较多时,研究者往往需要耗费大量时间对任务队列和计算状态进行人工检查,而如何解析计算输出,从几百行甚至上千行输出中提取所需要的信息则又是一个艰巨耗时的任务。
如何利用计算机科学技术将掺杂计算中各项要求整合并搭建通用的计算架构,成为了当前急需解决的问题,如果能够达成此目标,将会节省大量时间精力,大大加快掺杂式能源材料的研发速度。
发明内容
针对现有技术存在的问题,本发明基于AiiDA计算框架和QuantumEspresso计算插件,提供一种针对掺杂式能源材料的高通量计算筛选方法,由不同的功能模块分别解决了本征材料的结构提取、大批量掺杂替换元素、自动构建并监测工作流状态、计算结果的解析和存储等问题。
为了达到上述目的,本发明的技术方案为:
一种掺杂式能源材料的高通量计算筛选方法,该方法通过以下四个模块实现,四个模块分别为:本征材料结构提取模块、掺杂结构构造模块、掺杂材料结构优化与性质计算模块、材料数据库导入模块。四个模块之间的相互关系为:通过本征材料结构提取模块获取本征材料的晶体结构信息文件,由掺杂结构构造模块对其进行处理,得到待掺杂的结构信息文件,再通过掺杂材料结构优化与性质计算模块读取结构信息文件,批量生成结构优化——性质计算工作流并进行高通量计算,最后通过材料数据库导入模块将能量、电子性质等计算结果存储到专用数据库中。具体步骤如下:
为了更清晰地表明掺杂材料,本发明采用B(s:e)表示在位置s掺杂元素e的材料B,其中可能有多个s:e键值对。特别地,B0表示本征材料。
(1)材料本征结构提取模块:通过用户提供的材料筛选信息,从开源结构数据库中提取所需材料的本征结构文件;
首先与开源结构数据库交互,将待掺杂本征材料的化学计量数配比作为模块输入,在满足条件的本征材料集合中根据能量最低原则或所属空间群等特征筛选出所需本征材料结构信息B0,并将其以晶体结构信息文件的形式保存至指定本地位置。
(2)掺杂结构构造模块:转换材料本征结构为用户所指定的掺杂结构,并进一步转换为后台计算程序所要求的输入文件格式;
确定晶体结构信息文件中待掺杂的元素位置集合S和待掺杂的元素集合E,其中S={s1,s2...sm},E={e1,e2...en},m≥1,n≥1,根据掺杂位置,将晶体结构信息文件中待掺杂原子位置置空。读取并修改晶体结构文件,针对不同掺杂位置和不同掺杂元素,利用嵌套循环遍历位置集合S和元素集合E,批量生成m*n个掺杂材料结构B(sa:eb),其中a∈(1,m),b∈(1,n)。
(3)掺杂材料结构优化与性质计算模块:实时监控任务集合工作状态,根据工作流的流程设计,自动完成工作流中步骤之间的衔接;
解析结构优化步骤的输出与性质计算步骤的输入,构建工作流,并将掺杂材料结构信息B(sa:eb)作为工作流的输入,批量生成并提交工作流,并记录任务pk值。监控程序每隔一定时间检查当前计算状态,并更新pk值-计算状态键值对。计算状态可分为已正常结束、正在运行和非正常中止:
a.若计算正常结束,则利用正则表达式匹配提取当前计算结果,并自动转入工作流的下一步骤或转入计算队列中下一工作流;
b.若计算非正常中止,记录异常原因并转入计算队列中下一工作流;
c.若计算正在运行中,则维持当前状态不变。
每次完成检查,监控程序会暂时休眠,经过用户设定时间t后再次运行。
(4)材料数据库导入模块:根据不同任务状态解析输出,将用户所需信息保存到数据库中;
与后端Postgresql数据库交互,依次分析计算pk值-计算状态键值对:若状态为正常结束,则利用正则表达式提取计算输出并保存到后端数据库中;若状态为非正常结束,则将计算输出中的报错信息记录到工作日志中以便查询和修改调整。
本发明的有益效果为:本发明能够高效的达到高通量计算筛选的目的,提高材料筛选工作效率,具有较强的通用性和扩展性。
附图说明
图1为本发明实施方式的方法流程图。
具体实施方式
为使本发明的目的、技术方案以及优点更加清楚,以下结合附图及具体实例,对本发明做进一步详细说明。这些实施例仅仅是说明性的,而并非对于本发明的限制。
以本征材料Al2O3分别于两个位置做掺杂为例。前期准备:在计算集群上安装AiiDA计算平台并设置计算插件为QuantumEspresso,设置后端数据库为Postgresql,对平台进行测试以确保可以正常提交计算任务。
步骤一:运行材料本征结构提取模块,在提示输入化学式时输入“Al2O3”,查询结果默认按照能量最低原则排列,如图一所示。若要按照需求选取结构信息文件,可输入对应序号,再输入一个包括文件名的本地绝对路径,即可将结构信息文件保存至此处。实例中选择所属空间群的结构信息文件,包含了64个Al原子和96个O原子,其中需要对μ,ω两个O原子位置做独立替换式掺杂,掺杂元素集合设为{Sc,V},其中包含两个元素。
步骤二:运行掺杂结构构造模块,读取结构信息文件,记录μ,ω的位置信息,再于结构信息文件中将对应元素信息删除,由此得到了化学式为Al64O94的待掺杂结构,其中包含的空位为μ,ω.遍历元素位置集合{μ,ω}和待掺杂元素集合{Sc,V},每次只掺杂一个空位,另一个空位仍然用O补齐,则可以得到2*2个掺杂结构信息文件,分别为Al64O95(μ:Sc),Al64O95(μ:V),Al64O95(ω:Sc),Al64O95(ω:V)
步骤三:运行掺杂材料结构优化与性质计算模块,通过解析弛豫计算的标准输出,利用正则表达式提取优化后的晶胞结构信息,并将其设为自洽计算的初始结构,由此组成了弛豫——自洽工作流。将上一步骤中所得到的4个掺杂结构信息文件作为工作流输入的一部分,批量生成计算任务并提交计算任务队列。每个计算都会产生一个pk值,记录下pk值并由监控程序进行更新对应计算状态。提交任务后监控程序开始运行,每隔一段时间t则会检查当前计算状态,时间间隔t的默认值为100s。一旦监控程序发现计算状态变为"FINISHED"即正常结束,就会检查计算类型:若完成的是弛豫计算,则按照工作流流程自动运行下一步即自洽计算;若完成的是自洽计算,则通过检索计算属性来调取任务输出文件,并利用正则表达式去匹配任务输出并记录,实例中为自洽计算的能量值。若计算状态变为"FAILED"即非正常结束,监控程序将在日志中记录报错原因,并提交对应下一掺杂结构的工作流。若计算状态为"RUNNING",则维持当前状态不变。每次完成状态检查,监控程序都会暂时休眠,经过时间t后再次进行检查。
步骤四:运行材料数据库导入模块,当4个工作流全部计算完毕后,可以得到4个pk值——计算状态键值对,对其依次检查,通过检索计算属性来提取正常结束计算的输出结果,并将其保存到后端数据库中;如果计算状态为非正常结束,则将报错信息写入日志文件。

Claims (1)

1.一种掺杂式能源材料的高通量计算筛选方法,其特征在于,所述的高通量计算筛选方法通过本征材料结构提取模块、掺杂结构构造模块、掺杂材料结构优化与性质计算模块、材料数据库导入模块实现,具体步骤如下:
以下采用B(s:e)表示在位置s掺杂元素e的材料B,B0表示本征材料结构;
(1)通过本征材料结构提取模块获取本征材料的晶体结构信息文件;
与开源结构数据库交互,将待掺杂本征材料的化学计量数配比作为模块输入,在本征材料集合中根据能量最低原则或所属空间群等特征筛选出所需本征材料结构B0,并将其以晶体结构信息文件的形式保存至指定本地位置;
(2)掺杂结构构造模块处理步骤(1)得到的晶体结构信息文件,得到待掺杂的结构信息文件;
确定晶体结构信息文件中待掺杂的元素位置集合S和待掺杂的元素集合E,其中S={s1,s2...sm},E={e1,e2...en},m≥1,n≥1,掺杂方式为替换式掺杂,根据掺杂位置,修改B0中对应的元素位置信息,将晶体结构信息文件中待掺杂原子位置置空;读取并修改晶体结构文件,针对不同掺杂位置和不同掺杂元素,利用嵌套循环遍历位置集合S和元素集合E,批量生成m*n个掺杂材料结构B(sa:eb),其中a∈(1,m),b∈(1,n);
(3)通过掺杂材料结构优化与性质计算模块读取步骤(2)得到的结构信息文件,批量生成工作流并进行高通量计算;
解析结构优化步骤的输出与性质计算步骤的输入,构建工作流,并将掺杂材料结构B(sa:eb)作为工作流的输入,批量生成并提交工作流,并记录任务pk值;监控程序每隔一定时间检查当前计算状态,并更新pk值-计算状态键值对;计算状态可分为已正常结束、正在运行和非正常中止:
a.若计算正常结束,则利用正则表达式匹配提取当前计算结果,并自动转入工作流的下一步骤或转入计算队列中下一工作流;
b.若计算非正常中止,记录异常原因并转入计算队列中下一工作流;
c.若计算正在运行中,则维持当前状态不变;
每次完成检查,监控程序会暂时休眠,经过用户设定时间后再次运行;
(4)采用材料数据库导入模块将步骤(3)得到的结果存储到数据库中
与后端Postgresql数据库交互,依次分析计算pk值-计算状态键值对:若状态为正常结束,则利用正则表达式提取计算输出并保存到后端数据库中;若状态为非正常结束,则将计算输出中的报错信息记录到工作日志中用于查询和修改调整。
CN201810018412.6A 2018-01-05 2018-01-05 一种掺杂式能源材料的高通量计算筛选方法 Active CN108319807B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810018412.6A CN108319807B (zh) 2018-01-05 2018-01-05 一种掺杂式能源材料的高通量计算筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810018412.6A CN108319807B (zh) 2018-01-05 2018-01-05 一种掺杂式能源材料的高通量计算筛选方法

Publications (2)

Publication Number Publication Date
CN108319807A CN108319807A (zh) 2018-07-24
CN108319807B true CN108319807B (zh) 2019-12-17

Family

ID=62894068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810018412.6A Active CN108319807B (zh) 2018-01-05 2018-01-05 一种掺杂式能源材料的高通量计算筛选方法

Country Status (1)

Country Link
CN (1) CN108319807B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109545289B (zh) * 2018-09-25 2020-10-16 南京大学 一种基于分级警示结构高通量筛查内分泌干扰物的方法
CN112768013A (zh) * 2019-12-30 2021-05-07 北京航空航天大学 计算实验条件下二维材料表面吸附多样性的系统及方法
CN112908426B (zh) * 2021-02-10 2021-11-02 上海大学 一种基于高吸收率的二维过渡金属硫化物材料设计方法
CN113160904B (zh) * 2021-03-17 2022-04-15 北京航空航天大学 一种基于自动建模技术的表面性质的高通量计算方法
CN114329674B (zh) * 2021-12-31 2024-05-03 北京迈高材云科技有限公司 基于Quantum Espresso的云端高通量材料自动筛选方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101248222A (zh) * 2005-08-23 2008-08-20 开普敦大学 粒子半导体材料的掺杂
CN106372329A (zh) * 2016-08-31 2017-02-01 中国科学院计算机网络信息中心 材料基因工程高通量集成计算与数据管理的方法及系统
CN106521589A (zh) * 2016-11-22 2017-03-22 南昌大学 一种高通量制备镁合金块体样品的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140274764A1 (en) * 2013-03-15 2014-09-18 Pathway Genomics Corporation Method and system to predict response to treatments for mental disorders

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101248222A (zh) * 2005-08-23 2008-08-20 开普敦大学 粒子半导体材料的掺杂
CN106372329A (zh) * 2016-08-31 2017-02-01 中国科学院计算机网络信息中心 材料基因工程高通量集成计算与数据管理的方法及系统
CN106521589A (zh) * 2016-11-22 2017-03-22 南昌大学 一种高通量制备镁合金块体样品的方法

Also Published As

Publication number Publication date
CN108319807A (zh) 2018-07-24

Similar Documents

Publication Publication Date Title
CN108319807B (zh) 一种掺杂式能源材料的高通量计算筛选方法
US8219518B2 (en) Method and apparatus for modelling data exchange in a data flow of an extract, transform, and load (ETL) process
EP2572294B1 (en) System and method for sql performance assurance services
US7418453B2 (en) Updating a data warehouse schema based on changes in an observation model
WO2017183065A1 (ja) リレーショナルデータベースのチューニング装置及び方法
CN111190814B (zh) 软件测试用例的生成方法、装置、存储介质及终端
CN111178688A (zh) 电力技术监督数据的自助化分析方法、系统、存储介质及计算机设备
CN112200459B (zh) 一种配电网数据质量分析评价方法及系统
Dong Functional lock-in and the problem of design transformation
CN111489135A (zh) 一种稽核数据的分析管理系统及方法
CN114329674A (zh) 基于Quantum Espresso的云端高通量材料自动筛选方法和系统
KR101830936B1 (ko) 데이터베이스와 애플리케이션을 위한 웹기반 성능개선 시스템
WO2009016090A1 (en) A method and relative device for the management of technological recipe information to aid in defining process flows, in particular for the development and production of micro- and nanotechnology devices in cleanroom laboratories
EP4113418B1 (en) Non-linear planning model based production planning system, production planning method and computer-readable storage medium
CN107544895A (zh) Hadoop大数据平台测试系统及方法
CN113610225A (zh) 质量评估模型训练方法、装置、电子设备及存储介质
Samples et al. Parameter sweeps for exploring GP parameters
Bertolini et al. Test case generation using stochastic automata networks: Quantitative analysis
CN107273293B (zh) 大数据系统性能测试方法、装置及电子设备
CN103714066A (zh) 基于模板的数据库分析器
CN113553320B (zh) 数据质量监控方法及装置
CN117952564B (zh) 一种基于进度预测的排程模拟优化方法及系统
US11609807B2 (en) Computing task management and analysis system for molecular force field parameter building and operation method thereof
CN100517223C (zh) 用于确定实验设计信息的系统和方法
Yan Development and implementation of data management and analysis system for new power energy based on MVC

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant