CN112102887A - 多尺度集成可视化的高通量自动计算流程及数据智能系统 - Google Patents

多尺度集成可视化的高通量自动计算流程及数据智能系统 Download PDF

Info

Publication number
CN112102887A
CN112102887A CN202010907586.5A CN202010907586A CN112102887A CN 112102887 A CN112102887 A CN 112102887A CN 202010907586 A CN202010907586 A CN 202010907586A CN 112102887 A CN112102887 A CN 112102887A
Authority
CN
China
Prior art keywords
control
workflow
data
database
crystal structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010907586.5A
Other languages
English (en)
Other versions
CN112102887B (zh
Inventor
孙志梅
王冠杰
彭力宇
李开旗
祝令刚
缪奶华
周健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202010907586.5A priority Critical patent/CN112102887B/zh
Publication of CN112102887A publication Critical patent/CN112102887A/zh
Application granted granted Critical
Publication of CN112102887B publication Critical patent/CN112102887B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C10/00Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/80Data visualisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于材料基因工程、多尺度模拟和材料大数据领域,涉及一种多尺度集成可视化的高通量自动计算流程及数据智能系统,包括材料建模系统、科学计算系统、服务器配置系统、数据存储系统、数据分析系统和人工智能系统。本发明将材料复杂模型的自动构建方法、多种不同尺度的材料计算模拟方法、多类型的材料数据库、材料性能分析技术和基于人工智能的数据挖掘技术相结合,能够自动进行1000量级的材料高通量计算模拟;能够进行电子尺度、原子尺度、分子尺度和介观尺度等多个尺度的材料计算模拟并自动纠正计算过程中可能出现的错误;能够将所有计算的结构数据、中间元数据和结果数据存储在多种类型的材料数据库中方便用户查询和进行数据挖掘分析。

Description

多尺度集成可视化的高通量自动计算流程及数据智能系统
技术领域
本发明属于材料基因工程、多尺度模拟以及材料大数据领域,涉及一种多尺度集成可视化的高通量自动计算流程及数据智能系统(Artificial Learning and KnowledgeEnhanced Materials Informatics Engineering),简称ALKEMIE系统。
背景技术
在未知材料化学成分和性能关系的情况下,具有某种特殊功能的新材料往往是经过漫长的试错纠错而发现的。随着计算材料学的兴起以及计算能力和技术的飞速发展,传统理念正在发生改变。为加速新材料研发,结合材料大数据、第一性原理数据库、数据挖掘和机器学习等技术,发展适用于多尺度可视化的高通量自动流程材料集成计算方法及数据管理智能系统变得至关重要。
目前,常用的高通量计算流程框架,例如Anubhav Jain等人发表的The MaterialsProject:A materials genome approach to accelerating materials innovation[J](APL Mater.2013,1(1):011002)、Curtarolo S等人发表的AFLOW:An automaticframework for high-throughput materials discovery[J](Computational MaterialsScience.2012,58:218-26)、Pizzi G等人发表的AiiDA:automated interactiveinfrastructure and database for computational science[J](ComputationalMaterials Science.2016,111:218-30)以及Saal JE等人发表的Materials Design andDiscovery with High-Throughput Density Functional Theory:The Open QuantumMaterials Database(OQMD)[J](Jom.2013,65(11):1501-9)等,虽然已经建立了简单的计算流程和大量的材料数据库,但还存在如下问题:1)不具备多层次、多尺度计算模拟功能,只能进行单一尺度计算软件的模拟;2)不具备自动构建复杂晶体结构模型的功能;3)需要用户具有一定的专业基础知识、Linux命令行操作经验和基本的编程能力;4)不能够实现高通量自动运行,仍需要人工输入模型、配置参数及处理数据等繁琐复杂的流程;5)不具备多类型多用途的材料数据库;6)不具备自动数据检索、分析及可视化作图的功能;7)不具备人工智能数据挖掘功能;8)不具备可视化操作界面和自动化的操作流程等。
因此,亟需开发一套具有多尺度集成功能的可视化的高通量自动流程材料计算模拟方法及数据管理智能系统。
发明内容
为此,本发明设计了一种具有多尺度集成功能的可视化的高通量自动流程材料计算模拟方法及数据管理智能系统,其能够将材料自动建模、多种不同尺度的材料计算模拟方法、多类型的材料数据库、材料性能的分析技术和基于人工智能的数据挖掘技术等多种前沿方法相结合,能够自动进行1000量级材料的高通量计算模拟,能够进行电子尺度(第一性原理计算)、原子尺度(第一性原理分子动力学模拟)、分子尺度(经典分子动力学模拟)和介观尺度(热力学和动力学)等多个尺度的材料计算模拟,并将所有计算的结构数据,中间元数据和结果数据存储在多种类型的数据库中方便用户查询和进行数据挖掘分析。本发明主要包括如下内容:
1)根据晶体结构空间对称性,通过多种方式构建复杂的晶体结构,包括晶界结构、掺杂结构、间隙结构和异质结结构,并将其作为材料计算模拟输入文件,对整个构建过程进行可视化查看;
2)对多种方式构建输入的晶体结构进行高通量筛选,判断晶体结构的有效性和重复性,对有效晶体结构进行可视化查看;
3)解析汇总不同方式传入的有效晶体结构,并将大量有效的晶体结构归纳到适用于材料计算模拟的容器中等待计算,且对传入的数据进行可视化查看;
4)为容器中每个输入的晶体结构指定一个或多个高通量计算模拟任务,构建成多个高通量工作流,并对每个高通量工作流内部的计算步骤和计算细节进行可视化查看;
5)构建VASP第一性原理高通量工作流,进行电子尺度和原子尺度相关的材料计算模拟,并对每个工作流内部的计算步骤和计算细节进行可视化查看;
6)构建LAMMPS分子动力学高通量工作流,进行分子尺度相关的材料计算模拟,并对每个工作流内部的计算步骤和计算细节进行可视化查看;
7)构建OpenPhase相图模拟相关的高通量工作流,进行相图相场相关的材料计算模拟,并对每个工作流内部的计算步骤和计算细节进行可视化查看;
8)构建动态蒙特卡罗模拟(KMC)的高通量工作流,进行动力学相关的材料计算模拟,并对每个工作流内部的计算步骤和计算细节进行可视化查看;
9)构建吉布斯自由能(Gibbs)和居里温度(Tc)等高通量工作流,进行热力学相关的材料计算模拟,并对每个工作流内部的计算步骤和计算细节进行可视化查看;
10)将本地构建完成的高通量工作流提交到远程服务器中,并对远程服务器的配置状态进行可视化查看;
11)在本地为远程服务器指定计算节点,并对远程任务当前的工作状态及历史工作状态进行可视化查看;
12)基于人工智能机器学习方法,自动收集并修正第一性原理材料模拟任务产生的常见错误,进行相应的修正后继续运算;
13)为材料计算模拟构建多种类型的数据库,包含共享数据库和隐私数据库;
14)共享数据库方便科研人员交流共享数据,且共享数据都包含数据原创者的唯一标识;
15)隐私数据库包含任务子数据库、结构子数据库、性能子数据库和文件子数据库;
16)将每个晶体结构对应的高通量工作流保存在任务子数据库中,并对保存在任务子数据库中的高通量工作流进行可视化查看;
17)将所有的计算前的晶体结构和计算完成后的优化晶体结构数据保存在结构子数据库中,并对保存在结构子数据库中的晶体结构进行可视化查看;
18)将所有计算完成的数值类型的材料计算结果数据保存在性能子数据库中,并对保存在性能子数据库中的性能数据进行可视化查看;
19)将所有计算完成的大于10M的材料计算结果数据保存在文件子数据库中;
20)基于高通量计算完成的数据,快速查找数据库中材料的计算模拟优化结构和性能,并且将源数据以表格形式呈现出来;
21)基于查找出的材料的结构数据及性能数据进行统计学分析,通过散点图或分布图可视化展示;
22)针对本系统每一个实际的功能,通过“控件”的方式将可视化操作界面、每个功能所需的数据输入和输出、不同功能之间的数据传递,以及每个功能对应的后台实现方法相结合,来实现整个工作流程所有功能的可视化操作。
具体地,本发明提供了一种多尺度集成可视化的高通量自动计算流程及数据智能系统,包括如下子系统:材料建模系统、科学计算系统、服务器配置系统、数据存储系统、数据分析系统和人工智能系统;
所述材料建模系统包括晶体建模模块、高通量容器和高通量容器控件,所述晶体建模模块用于通过一种或多种方式构建初始晶体结构并将其传入所述高通量容器;所述高通量容器控件用于对传入的所有初始晶体结构进行高通量筛选,通过判断晶体结构的有效性和重复性,获得有效晶体结构;
所述科学计算系统包括VASP第一性原理高通量工作流模块、LAMMPS分子动力学高通量工作流模块、OpenPhase相图模拟高通量工作流模块、动力学相关高通量工作流模块和热力学高通量工作流模块;所述VASP第一性原理高通量工作流模块用于为有效晶体结构指定基于VASP软件的计算模拟任务,并基于所指定的计算模拟任务构建一个或多个高通量工作流;所述LAMMPS分子动力学高通量工作流模块用于为有效晶体结构指定基于LAMMPS软件的计算模拟任务,并基于所指定的计算模拟任务构建一个或多个高通量工作流;所述OpenPhase相图模拟高通量工作流模块用于为有效晶体结构指定基于OpenPhase软件的计算模拟任务,并基于所指定的计算模拟任务构建一个或多个高通量工作流;所述动力学相关高通量工作流模块用于为有效晶体结构指定基于KMC软件的计算模拟任务,并基于所指定的计算模拟任务构建一个或多个高通量工作流;所述热力学科学计算工作模块件用于为有效晶体结构指定基于Gibbs和Tc软件的计算模拟任务,并基于所指定的计算模拟任务构建一个或多个高通量工作流;
所述服务器配置系统包括服务器管理模块和服务器状态模块;所述服务器管理模块用于配置远程服务器参数、计算节点及运行状态,以及用于将所构建的一个或多个高通量工作流自动发送至所述数据存储系统;所述服务器状态模块用于为每个高通量工作流设定并分配远程服务器计算资源并启动远程工作;
所述数据存储系统包括共享数据库、隐私数据库和数据库控件;所述共享数据库用于多用户之间的数据共享;所述隐私数据库包括结构子数据库、任务子数据库、性能子数据库和文件子数据库,所述结构子数据库用于存储高通量工作流计算过程中涉及到的初始晶体结构和经过所述科学计算系统的高通量工作流模块优化后的晶体结构;所述任务子数据库用于存储高通量工作流计算过程中的计算流程及中间元数据;所述性能子数据库用于保存高通量工作流计算过程中的与材料基础性能相关的数值;所述文件子数据库用于存储高通量工作流计算过程中大于10M的数据文件;所述数据库控件用于为存储在所述任务子数据库中的每个高通量工作流添加所述远程服务器参数,以及用于存储高通量工作流的输入配置和计算过程流程图;
所述数据分析系统包括数据检索模块和数据分析及可视化模块;所述数据检索模块用于检索查询所述结构子数据库中的晶体结构信息、所述任务子数据库中的计算流程和所述性能子数据库中的与材料基础性能相关的数值,并传送至所述分析及可视化模块进行数据分析;所述数据分析及可视化模块用于对查询到的晶体结构信息、计算流程和与材料基础性能相关的数值进行统计学、散点图、分布图,能带图和态密度图分析,并可视化作图查看;
所述人工智能系统包括智能纠错模块和数据挖掘模块,所述智能纠错模块用于自动检测每个高通量工作流中当前计算模拟任务可能出现的报错情况,在最大纠正次数允许的范围内进行自动纠错,之后把纠错后的当前计算模拟任务自动提交到计算队列进行计算,并将所有纠错过程存储于所述任务子数据库和将纠错结果存储于所述性能子数据库;所述数据挖掘模块用于结合机器学习技术对晶体结构计算数据进行数据预处理、构建机器学习模型以及模型参数训练、数据挖掘和材料性能分析及预测。
优选地,所述晶体建模模块包括POSCAR控件、Builder控件、Two Doping控件、Multi POSCAR控件、Finder控件和Build Heterojunction控件中的一个或多个;
所述POSCAR控件用于导入单个初始晶体结构;
所述Builder控件用于构建晶界结构、空位结构和间隙结构;
所述Two Doping控件用于构建双掺杂或者共掺杂结构;
所述Multi POSCAR控件用于导入多个初始晶体结构;
所述Finder控件用于从所述结构子数据库导入所需的初始晶体结构;
所述Build Heterojunction控件用于构建异质结结构。
优选地,所述VASP第一性原理高通量工作流模块包括Optimize WF控件、VASPAIMD WF控件、BandsStructure Boltztrap WF控件、Convergence WF控件、Static WF控件、NoChgStatic WF控件、DOS WF控件、Bandstructure WF控件、HSE_bandstructure WF控件、Elastic-DFPT控件、DFPT-Elastic-Small-K控件、Elastic-tensor WF控件、Equation_state WF控件、NEB WF控件和Raman WF控件中的一个或多个;
所述Optimize WF控件用于为每个有效晶体结构添加第一性原理结构优化高通量工作流;
所述VASP AIMD WF控件用于为每个有效晶体结构添加第一性原理分子动力学高通量工作流;
所述BandsStructure Boltztrap WF控件用于为每个有效晶体结构添加基于Boltztrap软件的第一性原理电导率的高通量工作流;
所述Convergence WF控件用于为每个有效晶体结构添加第一性原理计算模拟过程中截断半径及K点密度收敛性测试的高通量工作流;
所述Static WF控件用于为每个有效晶体结构添加第一性原理静态高通量工作流;
所述NoChgStatic WF控件用于为每个有效晶体结构添加不包含电荷输出的第一性原理静态高通量工作流;
所述DOS WF控件用于为每个有效晶体结构添加第一性原理态密度高通量工作流;
所述Bandstructure WF控件用于为每个有效晶体结构添加第一性原理能带高通量工作流;
所述HSE_bandstructure WF控件用于为每个有效晶体结构添加基于HSE杂化泛函的第一性原理能带高通量工作流;
所述Elastic-DFPT控件用于为每个有效晶体结构添加基于密度泛函微扰理论的弹性常数高通量工作流;
所述DFPT-Elastic-Small-K控件用于为每个有效晶体结构添加基于密度泛函微扰理论的具有小的K点密度的弹性常数高通量工作流;
所述Elastic-tensor WF控件用于为每个有效晶体结构添加基于能量体积形变的第一性原理弹性常数高通量工作流;
所述Equation_state WF控件用于为每个有效晶体结构添加能量体积相关的第一性原理状态方程的高通量工作流;
所述NEB WF控件用于为每个有效晶体结构添加第一性原理相关的扩散路径、扩散势垒及扩散系数的高通量工作流;
所述Raman WF控件用于为每个有效晶体结构添加第一性原理拉曼光谱高通量工作流。
优选地,所述LAMMPS分子动力学高通量工作流模块包括Lammps relax控件、Diffuse workflow控件和Lammps MD workflow控件中的一个或多个;所述Lammps relax控件用于为每个有效晶体结构添加基于LAMMPS软件的结构优化高通量工作流;所述Diffuseworkflow控件用于为每个有效晶体结构添加基于LAMMPS软件的扩散系数、扩散路径的高通量工作流;所述Lammps MD workflow控件用于为每个有效晶体结构添加基于LAMMPS软件的分子动力学模拟高通量工作流;
所述OpenPhase相图模拟高通量工作流模块包括SingleGrain WF控件和NormalGrain WF控件中的一个或两个;所述SingleGrain WF控件用于为每个有效晶体结构添加单原子生长过程模拟的高通量工作流;所述NormalGrain WF控件用于为每个有效晶体结构添加多晶晶界生长过程模拟的高通量工作流;
所述动力学相关高通量工作流模块包括Lattice KMC控件和Honeycomb Lattice控件中的一个或两个;所述Lattice KMC控件用于为每个有效晶体结构添加基于单个晶格的KMC高通量工作流;所述Honeycomb Lattice控件用于为每个有效晶体结构添加基于Honeycomb的多个晶格的KMC高通量工作流;
所述热力学高通量工作流包括Gibbs控件和Tc WF控件中的一个或两个;所述Gibbs控件用于为每个有效晶体结构添加吉布斯自由能分析相关的高通量工作流;所述TcWF控件用于为每个有效晶体结构添加预测其居里温度的高通量工作流。
优选地,所述服务器管理模块包括Manage控件和Jobs控件中的一个或两个;
所述Manage控件用于将所构建的一个或多个高通量工作流自动发送至所述任务子数据库;所述Jobs控件用于配置远程服务器参数、远程服务器计算节点数量及远程服务器运行状态;
所述服务器状态模块包括Work State控件、Delete Workflow控件和WorkPriority控件中的一个或多个;
所述Work State控件用于查看远程服务器中高通量工作流的运行状态、可视化查看提交到远程服务器的每个晶体结构的信息、以及可视化查看高通量工作流中每个子任务的计算细节;所述Delete Workflow控件用于对高通量工作流进行删除操作;所述WorkPriority控件用于调整高通量工作流的计算顺序。
优选地,所述共享数据库中,每条共享数据都包含数据原创者的标签,所述数据原创者的标签定义为如下格式:
alkemie.date.classification/user defined label.number
字段alkemie为所述系统唯一标识,字段date为数据共享提交日期,字段classifcation为所述系统自动判别的该条共享数据的类型;后半部分由数据原创者自定义生成,其中,user defined label部分为由共享数据原创作者自定义的字符串,number为累加的数据索引。
优选地,所述结构子数据库中关键数据结构包括:neles,natoms,cell,rcell,energy,atom_ene,forces,atom_force,info,car_coord,dir_coord,subclass_Atom,is_optimized;
所述任务子数据库中关键数据结构包括:task_id,task_name,state,calculate_nodes,submit_time,completed_time,inputs,outputs,sub_tasks;
所述性能子数据库中关键数据结构包括:ID,Energy,Forces,Volume,BandGap,Charge,CONTCAR;
所述文件子数据库中关键数据结构包括:XDATCAR,PROCAR,DosData,BandData,VTK_fsData。
优选地,所述数据检索模块包括SearchEngine检索引擎和Analyzer控件中的一个或两个;
所述SearchEngine检索引擎用于将用户输入的检索信息转化为所述隐私数据库的子数据库能够识别的检索命令,并根据检索命令从多个子数据库中自动判别需要检索的子数据库类型,之后自动链接对应的子数据库,并根据检索命令查询数据;
所述Analyzer控件用于获取用户输入的数据检索信息和检索类别,并基于SearchEngine检索引擎检索查询所述隐私数据库的子数据库中的具体计算结果,最后以表格格式输出数据到所述数据分析及可视化模块。
优选地,所述数据分析及可视化模块包括Scatter Plot控件、Color控件、Distribution控件、VaspPlot控件、Save控件、Data Table、Viewer控件和GetElasticTensor控件中的一个或多个;
所述Scatter Plot控件用于任务号、能量、体积、带隙等任意两者之间的散点图分析;
所述Color控件用于数据分析中的颜色配置;
所述Distribution控件用于任务号、能量、体积、带隙等任意单个变量的分布图分析;
所述VaspPlot控件用于态密度及部分原子态密度分析和能带结构及部分原子能带结构分析;
所述Save控件用于将所述数据检索模块检索查询到的任意数据保存为Html格式的文件;
所述Data Table用于以Excel类似的形式,可视化查看所述数据检索模块检索查询到的任意数据;
所述Viewer控件用于可视化查看晶体结构的3维空间图像;
所述Get ElasticTensor控件用于查看所述性能子数据库中保存的与弹性模量矩阵相关的数据。
优选地,所述数据挖掘模块包括Xsf控件、Fingerprint控件、Generate控件、Train控件、TrainAccurcy Plot控件、Potential控件和PM Analyzer控件中的一个或多个;
所述Xsf控件用于将计算完成的晶体结构转换为包含原子能量和原子受力的XSF格式的数据文件;
所述Fingerprint控件用于载入机器学习数据生成过程中所需的数学方程的参数;
所述Generate控件用于将所述数学方程应用到所述XSF格式的数据文件中,产生适用于机器学习的初始数据;
所述Train控件用于构建机器学习模型以及模型训练过程中的超参数配置,并根据反向传播算法进行机器学习模型和超参数的训练;
所述TrainAccurcy Plot控件用于机器学习训练精度及收敛性的分析;
所述Potential控件用于将训练完成的机器学习模型保存为可以进行材料结构性能预测和大规模分子动力学模拟的势函数文件;
所述PM Analyzer控件用于机器学习预测过程的数据分析。
本发明的有益效果:
1)本发明可以实现多尺度集成模拟。通常需要多个软件来进行不同尺度的模拟,对用户专业知识要求较高。而通过本发明,用户只需要选择科学计算系统中的不同计算尺度模块就可以简单实现电子尺度、原子尺度、分子尺度和介观尺度等多个不同尺度的计算模拟;
2)本发明可以实现复杂的晶体结构模型构建,通过晶体建模模块用户可以快速构建不同取向不同类型的晶界结构以及掺杂、空位、间隙、异质结等常用的复杂晶体结构;
3)本发明通过工作流方式可以将晶体结构计算中繁琐的计算步骤简化,比如进行能带计算通常需要:结构驰豫-静态计算-能带计算三个步骤,而通过本发明,用户只需要点击能带计算对应的可视化控件即可完成该操作;
4)本发明可以实现1000量级以上的高通量自动计算,为材料高通量筛选和设计开发新材料提供了方法基础;
5)本发明的智能纠错模块可以自动管理计算任务的正确性,例如用户用传统的方法计算1000个任务,需要手动的查找每个任务是否计算正确,如果出错则需要修正,这是一个非常繁琐的任务,通常需要数周完成,而利用本发明的智能纠错功能,在数小时内就能完成自动纠错计算功能;
6)本发明的数据存储系统能够管理不同类型的大量材料数据,其中共享数据库方便科研人员交流数据,且共享数据都包含数据原创者的唯一标识;隐私数据将材料计算结果分类存储到任务子数据库、结构子数据库、性能子数据库和文件子数据库中,本发明的这种多类型的数据库存储模式极大地加快了用户数据检索查询的效率并为基于机器学习的数据挖掘奠定了数据基础。
7)本发明的数据分析系统及人工智能系统的数据挖掘模块能够快速检索大量的数据,对于1000个任务的态密度图和能带图,通常每个图需要耗费科研人员半天以上的时间,而通过本发明,1000个能带和态密度图的处理仅需要几个小时,并且对于大量模拟结果的统计和散点图分析也非常快捷。
8)本发明基于控件构建的自动化和可视化的操作界面使材料计算模拟变得更加简便,整个计算模拟过程的操作和控制更加高效可靠,极大地提升了用户的学习和使用效率。
9)本发明既适用于毫无计算模拟经验的初级用户及实验人员使用,也适用于经验丰富的计算模拟专家使用。
附图说明
图1为本发明实施例提供的多尺度集成可视化的高通量自动计算流程及数据智能系统的整体结构图;
图2为本发明实施例提供的多尺度集成可视化的高通量自动计算流程及数据智能系统的结构连接图;
图3为本发明实施例提供的多尺度集成可视化的高通量自动计算流程及数据智能系统的细节结构图。
具体实施方式
下面结合附图和实施例进一步描述本发明,应该理解,以下所述实施例旨在便于对本发明的理解,而对其不起任何限定作用。
如图1所示,本发明实施例提供的多尺度集成可视化的高通量自动计算流程及数据智能系统包括如下子系统:材料建模系统、科学计算系统、服务器配置系统、数据存储系统、数据分析系统和人工智能系统。其中,材料建模系统利用多种方式自动构建复杂的晶体结构模型,比如晶界、掺杂、间隙及异质结等模型;科学计算系统用于构建电子尺度、电子尺度、分子尺度和介观尺度等多个尺度的自动高通量工作流,减少了复杂工作流构建过程中手动繁琐的参数配置及解决任务依赖的过程;服务器配置系统用于远程服务器的配置、管理及状态查看;数据存储系统分为共享数据和隐私数据;数据分析系统用于材料计算数据的检索查询和可视化分析,此处的材料计算数据包括晶体结构,计算任务(工作流)细节以及材料性能数据;人工智能系统用于智能识别、判断和纠正材料计算模拟过程中的错误,和根据计算结果数据库结合机器学习进行数据挖掘。
对于每个子系统,本发明通过定义“控件”来实现子系统的每个具体的可视化和自动化功能。其中,每个控件均包含三部分:可视化的数据输入与输出、可视化的参数配置和与功能对应的实际后台运行算法。
特别地,材料建模系统包括晶体建模模块、高通量容器和高通量容器控件(HTProcessor)。在本实施例中,晶体建模模块包括POSCAR控件、Builder控件、Two Doping控件、Multi POSCAR控件、Finder控件和Build Heterojunction控件。其中,POSCAR控件用于导入单个晶体结构;Builder控件用于构建晶界结构、空位结构和间隙结构;Two Doping控件用于构建双掺杂或者共掺杂结构;Multi POSCAR控件用于导入多个晶体结构;Finder控件用于从材料结构数据库导入所需的晶体结构;Build Heterojunction控件用于构建异质结结构。将利用上述控件构建的初始晶体结构传入高通量容器,再利用HTProcessor控件对传入的所有初始晶体结构进行高通量筛选,通过判断晶体结构的有效性和重复性,获得有效晶体结构。
特别地,科学计算系统包括VASP第一性原理高通量工作流模块、LAMMPS分子动力学高通量工作流模块、OpenPhase相图模拟高通量工作流模块、动力学相关高通量工作流模块和热力学高通量工作流模块。
在本实施例中,VASP第一性原理高通量工作流模块包括结构优化高通量工作流(Optimize WF)控件、第一性原理分子动力学高通量工作流(VASP AIMD WF)控件、Boltztrap计算电导率高通量工作流(BandsStructure Boltztrap WF)控件、参数收敛性测试高通量工作流(Convergence WF)控件、静态高通量工作流(Static WF)控件、不包含电荷文件的静态高通量工作流(NoChgStatic WF)控件、态密度高通量工作流(DOS WF)控件、能带高通量工作流(Bandstructure WF)控件、HSE计算高精度能带结构高通量工作流(HSE_bandstructure WF)控件、基于DFPT的计算弹性常数高通量工作流(Elastic-DFPT)控件、基于DFPT的小K点的计算弹性常数高通量工作流(DFPT-Elastic-Small-K)控件、基于形状改变的计算弹性常数高通量工作流(Elastic-tensor WF)控件、状态方程高通量工作流(Equation_state WF控件)、NEB扩散高通量工作流(NEB WF)控件和拉曼光谱高通量工作流(Raman WF)控件。其中,Optimize WF控件用于为每个晶体结构添加第一性原理结构优化高通量工作流;VASP AIMD WF控件用于为每个晶体结构添加第一性原理分子动力学高通量工作流;BandsStructure Boltztrap WF控件用于为每个晶体结构添加基于Boltztrap软件的电导率计算的高通量工作流;Convergence WF控件用于为每个晶体结构添加计算模拟过程中截断半径及K点密度收敛性测试的高通量工作流;Static WF控件用于为每个晶体结构添加第一性原理静态高通量工作流;NoChgStatic WF控件用于为每个晶体结构添加不包含电荷输出的静态高通量工作流;DOS WF控件用于为每个晶体结构添加第一性原理态密度高通量工作流;Bandstructure WF控件用于为每个晶体结构添加第一性原理能带高通量工作流;HSE_bandstructure WF控件用于为每个晶体结构添加基于HSE杂化泛函的第一性原理能带高通量工作流;Elastic-DFPT控件用于为每个晶体结构添加基于密度泛函微扰理论的弹性常数高通量工作流;DFPT-Elastic-Small-K控件用于为每个晶体结构添加基于密度泛函微扰理论的具有小的K点密度的弹性常数高通量工作流;Elastic-tensor WF控件用于为每个晶体结构添加基于能量体积形变的弹性常数高通量工作流;Equation_state WF控件用于为每个晶体结构添加能量体积相关的状态方程的高通量工作流;NEB WF控件用于为每个晶体结构添加扩散路径、扩散势垒及扩散系数的高通量工作流;Raman WF控件用于为每个晶体结构添加第一性原理拉曼光谱高通量工作流。
在本实施例中,LAMMPS分子动力学高通量工作流模块包括Lammps relax控件,Diffuse workflow控件和Lammps MD workflow控件。其中,Lammps relax控件用于为每个晶体结构添加基于LAMMPS软件的结构优化高通量工作流;Diffuse workflow控件用于为每个晶体结构添加基于LAMMPS软件的扩散系数,扩散路径的高通量工作流;Lammps MDworkflow控件用于为每个晶体结构添加基于LAMMPS软件的分子动力学模拟高通量工作流。
在本实施例中,OpenPhase相图模拟高通量工作流模块包括SingleGrain WF控件和NormalGrain WF控件。其中,SingleGrain WF控件用于为每个输入结构添加单原子生长过程模拟的高通量工作流;NormalGrain WF控件用于为每个输入结构添加多晶晶界生长过程模拟的高通量工作流。
在本实施例中,动力学相关高通量工作流模块包括Lattice KMC控件和HoneycombLattice控件。其中,Lattice KMC控件用于为每个输入结构添加基于单个晶格的KMC高通量工作流;Honeycomb Lattice控件用于为每个输入结构添加基于Honeycomb的多个晶格的KMC高通量工作流。热力学高通量工作流包括Gibbs控件和Tc WF控件。其中,Gibbs控件用于为每个输入结构添加吉布斯自由能分析相关的高通量工作流;Tc WF控件用于为每个输入结构添加预测该结构居里温度的高通量工作流。
特别地,服务器配置系统包括服务器管理模块和服务器状态模块。在本实施例中,服务器管理模块包括Manage控件、Jobs控件。其中,Manage控件用于将所构建的一个或多个高通量工作流自动发送至所述任务子数据库;Jobs控件用于配置远程服务器参数、计算节点及运行状态。在本实施例中,服务器状态模块包括Work State控件、Delete Workflow控件和Work Priority控件。其中,Work State控件用于查看远程服务器中高通量工作流的运行状态、可视化查看提交到远程服务器的每个晶体结构的信息、以及可视化查看高通量工作流中每个子任务的计算细节;Delete Workflow控件用于对高通量工作流进行删除操作;Work Priority控件用于调整高通量工作流的计算顺序。
特别地,数据存储系统包括共享数据库、隐私数据库和数据库控件。优选地,共享数据库模块中的每条共享数据都包含数据原创者的标签,其中共享数据原创者标签定义为如下格式:“alkemie.date.classification/user defined label.number”,该格式被‘/’分为两部分,每部分被‘.’分为不同的字段;前半部分由本发明的ALKEMIE系统自动生成,其中‘alkemie’字段为该系统唯一标识,‘date’字段为数据共享提交日期,‘classification’字段为该系统自动判别的该共享数据的类型;后半部分由数据原创者自定义生成,其中‘user defined label’为20个字符以内的由共享数据原创作者自定义的字符串,‘number’为累加的数据索引。该格式中,‘date’字段和‘number’字段可以确保该共享数据的唯一性。
在本实施例中,隐私数据库分为结构子数据库、任务数据子库和结果子数据库三种类型。其中,结构子数据库用于存储原始输入的晶体结构数据和经过第一性原理计算VASP优化后的晶体结构数据,其中结构子数据库中关键数据结构包括:neles,natoms,cell,rcell,energy,atom_ene,forces,atom_force,info,car_coord,dir_coord,subclass_Atom,is_optimized等。任务子数据库用于存储计算过程中工作流细节及运行依赖,任务子数据库中关键数据结构包括:task_id,task_name,state,calculate_nodes,submit_time,completed_time,inputs,outputs,sub_tasks等。对于每一个实际的计算模拟任务,任务子数据库不仅保存了计算过程中的模拟数据,也保存了计算中硬件配置信息,比如远程服务器的节点信息、计算目录、使用的编译器和CPU信息。
结果子数据库又分为性能子数据库和文件子数据库,其中,性能子数据库用于保存材料计算过程中的材料基础性能相关的数值,包括能量,体积,原子受力,带隙,电荷,优化后的原子坐标,密度等,以方便人工智能系统的数据挖掘模块使用。性能数据库的关键数据结构包括:ID,Energy,Forces,Volume,BandGap,Charge,CONTCAR等。文件子数据库用于保存计算完成的大小超过10M的材料数据,文件数据库的关键数据结构包括:XDATCAR,PROCAR,DosData,BandData,VTK_fsData等。
数据库控件(Database)用于为存储在所述任务子数据库中的每个高通量工作流添加远程服务器参数,以及用于存储高通量工作流的输入配置、计算过程流程图。
特别地,数据分析系统包括数据检索模块和数据分析及可视化模块。在本实施例中,数据检索模块包括SearchEngine检索引擎和Analyzer控件,其中,SearchEngine检索引擎用于将用户输入的检索信息转化为隐私数据库中多个子数据库可以识别的检索命令,并根据检索命令从多个类型的子数据库中自动判别需要检索的子数据库类型,之后自动链接对应的子数据库,并根据检索命令查询数据;Analyzer控件用于获取用户输入的数据检索信息和检索类别,并基于SearchEngine检索引擎检索查询隐私数据库中多个子数据库中具体计算结果,最后以表格的格式输出数据到数据分析及可视化模块。
在本实施例中,数据分析及可视化模块包括Scatter Plot控件、Color控件、Distribution控件、VaspPlot控件、Save控件、Data Table、Viewer控件和GetElasticTensor控件。其中,Scatter Plot控件用于任务号、能量、体积、带隙等任意两者之间的散点图分析;Color控件用于数据分析中的颜色配置;Distribution控件用于任务号、能量、体积、带隙等任意单个变量的分布图分析;VaspPlot控件用于态密度及部分原子态密度分析和能带结构及部分原子能带结构分析;Save控件用于将数据检索模块检索查询到的任意数据保存为Html格式的文件;Data Table用于以Excel类似的形式,可视化查看数据检索模块检索查询到的任意数据;Viewer控件用于可视化查看晶体结构的3维空间图像;GetElasticTensor控件用于查看性能子数据库中保存的与弹性模量矩阵相关的数据。
特别地,人工智能系统包括智能纠错模块和数据挖掘模块。其中,智能纠错模块用于自动检测每个高通量工作流中当前计算模拟任务可能出现的报错情况,在最大纠正次数允许的范围内进行自动纠错,之后把纠错后的当前计算模拟任务自动提交到计算队列进行计算,并将所有纠错过程和结果存储于所述数据库。数据挖掘模块用于结合机器学习技术对晶体结构计算数据进行数据预处理、构建机器学习模型以及模型参数训练、数据挖掘和材料性能分析及预测。
在本实施例中,数据挖掘模块包括Xsf控件、Fingerprint控件、Generate控件、Train控件、TrainAccurcy Plot控件、Potential控件和PM Analyzer控件。其中,Xsf控件用于将计算完成的晶体结构转换为包含原子能量和原子受力的XSF格式的数据文件;Fingerprint控件用于载入机器学习数据生成过程中所需的数学方程的参数;Generate控件用于将数学方程应用到XSF格式的数据文件中,产生适用于机器学习的初始数据;Train控件用于载入机器学习模型以及模型训练过程中的超参数配置;TrainAccurcy Plot控件用于机器学习训练精度及收敛性的分析;Potential控件用于将训练完成的机器学习模型保存为可以进行材料结构性能预测和大规模分子动力学模拟的势函数文件;PM Analyzer控件用于机器学习预测过程的数据分析。
本发明通过上述子系统之间的动态线性链接可以实现可视化自动高通量计算,具体过程如下:
1)利用晶体建模模块支持多种构建复杂晶体结构的方式:
a)通过POSCAR控件输入单个晶体结构文件,其自动识别“*poscar*”文件格式的结构,其中每个晶体结构被解析为以下几部分:缩放系数(体积),晶格矢量vector,原子个数及坐标,通过公式(1)求解对应的倒易空间矢量。
Figure BDA0002662002790000171
其中,yicell表示晶体结构在倒易空间的晶格矢量;xcell表示晶体结构在直角坐标系中的晶格矢量。
b)通过MultiPOSCAR控件输入多个晶体结构文件,支持的文件格式包括CIF文件,XSF文件,XYZ文件,DATA文件(Lammps支持的格式)以及POSCAR文件,每一类晶体结构通过不同的解析器最终被解析为与a)相同的部分。
c)通过Builder控件构建空位结构、掺杂结构、间隙结构及晶界结构。
d)通过Finder控件在现有的18万条结构数据中查询目标晶体结构。
e)通过数据分析系统的分析模块中的Viewer控件的多个可视化窗口,以树状的形式添加结构信息至可视化界面,对于MultiPOSCAR控件,可以在可视化界面中选择对应标号展示对应信息。
2)利用HTProcessor,通过结构预处理算法,筛选有效晶体结构和重复晶体结构:
a)首先通过下式(2)判断晶体结构的有效性,其中,ytrue表示该晶体结构中是否为有效晶体结构,N表示晶体结构的原子个数,n表示遍历从1到N个原子,为每个原子运算fall函数,fall表示判断每个位点是否被完全占据的函数,occupy表示晶体结构中每个位点占据的比例(完全占据为1,否则为0-1之间的小数)。当ytrue的值与原子个数N相同则判定为晶体结构有效,否则判定为无效,删除对应的晶体结构。
Figure BDA0002662002790000181
b)根据每个有效晶体结构中原子个数、晶格矢量、倒易矢量及原子位置信息,筛选并去除重复的晶体结构。
3)将多种不同方式输入的晶体结构存储在高通量容器中,可在Data Table中查看相关信息。HTProcessor是连接晶体结构和第一性原理计算的关键控件,高通量容器中的所有晶体结构都会作为第一性原理材料计算模拟任务的结构输入参数,高通量容器的大小决定了高通量并行的性能和任务数量,本发明至少支持1000量级高通量计算。
4)为目前常用的材料计算模拟软件提供构建高通量工作流的方法,高通量工作流的作用是解决多个子任务间的顺序依赖、文件依赖等关系。通常这些任务是手动一步一步进行,而本发明构建的高通量工作流可以快速地为多个晶体结构指定某一个或多个高通量工作流。
a)本发明的第一性原理VASP高通量工作流至少包括Optimize WF控件、VASP AIMDWF控件、BandsStructure Boltztrap WF控件、Convergence WF控件、Static WF控件、NoChgStatic WF控件、DOS WF控件、Bandstructure WF控件、HSE_bandstructure WF控件、Elastic-DFPT控件、DFPT-Elastic-Small-K控件、Elastic-tensor WF控件、Equation_state WF控件、NEB WF控件和Raman WF控件。
b)本发明的LAMMPS分子动力学高通量工作流模块至少包括Lammps relax控件、Diffuse workflow控件和Lammps MD workflow控件。
c)本发明的OpenPhase相图模拟高通量工作流模块至少包括SingleGrain WF控件和NormalGrain WF控件。
d)本发明的动力学相关高通量工作流模块至少包括Lattice KMC控件和Honeycomb Lattice控件。
e)本发明的热力学高通量工作流模块至少包括Gibbs控件和Tc WF控件。
f)通过每个工作流控件的可视化窗口,查看高通量工作流中每个子任务的具体计算任务、计算参数配置以及多个任务的流程依赖。
5)配置远程服务器参数,将本地构建完成的多个高通量工作流传递到数据存储系统中远程服务器对应的任务子数据库中,并且可视化远程服务器的参数配置,其中配置参数包括:远程服务器地址(IP)、端口(Prot)、远程数据库名称、数据库中的数据集名称、用户名及密码。
6)配置远程服务器的计算节点及运行状态:
a)配置计算的节点数量Nodes,每个节点代表一个计算模拟任务的并行运算,配置的节点越多,高通量任务运行效率越高,但是节点数量不能超过每个用户的最高权限设置。在配置完远程服务器的计算节点数量之后,会将远程服务器中每个任务的运算状态返回本地,方便用户查看远程服务器中的任务参数细节及任务状态。
b)查看远程服务器多个计算模拟任务的工作状态,将工作状态分为9种状态:归档任务(ARCHIVED)、失败任务(FAILED)、无法完成任务(DISABLED)、暂停任务(STOPPED)、等待任务(WAITING)、暂存任务(PREPARED)、已完成任务(DONE)、已保存任务(SAVED)、正在运行任务(RUNNING)。
c)对每种工作状态的计算模拟任务个数做统计分析并通过WorkState控件可视化展示出来。
7)根据人工智能自动纠错算法,自动检测第一性原理VASP计算结果是否收敛,自动监测计算结果是否完整,自动收集产生的错误,根据错误提示修正该计算运行过程中参数,根据正确参数修改对应的高通量工作流,进行重新计算,最大试错次数为5次。
8)基于数据存储算法,配置任务子数据库,将计算过程中工作流细节及运行时依赖的服务器环境和软件配置存储在该任务子数据库中。通过WorkState控件可以可视化查看任务子数据库中的关键数据详情。对于每一个实际的计算模拟任务,任务子数据库不仅保存了计算过程中的模拟数据,也保存了计算中硬件配置信息,比如远程服务器的节点信息、计算位置、使用的编译器和CPU信息等。
9)基于数据存储算法,配置结构子数据库,将经过第一性原理VASP计算优化后的晶体结构数据保存在该子数据库中,通过WorkState控件可以可视化查看结构子数据库中的关键数据详情。
10)基于数据存储算法,配置结果子数据库,将第一性原理VASP计算完成的输出文件中的关键信息保存在该子数据库中,方便用户快速查找对应数据,结果子数据库具体又分为性能数据库和文件数据库。
11)数据分析系统提供数据检索模块和数据分析及可视化模块。
数据检索模块包括SearchEngine检索引擎和Analyzer控件,用户输入任何正则化语言格式的检索信息,检索引擎SearchEngine会检索到对应结果,Analyaer控件会将检索到的数据以Table表格的形式可视化展现出来,另外会以列表、数组或者字典的格式将数据传递给数据分析及可视化模块。
数据分析及可视化模块分为两类:
a)材料学性能相关的数据分析。可以自动同时绘制多个态密度图(DOS)和能带结构图(BAND),还可以绘制针对材料体系中某个原子或一类元素的部分态密度图(PDOS)图和部分能带(PBAND)图。
b)高通量任务相关的统计分析,可以自动绘制所有高通量任务任务号、优化后的结构能量、体积、带隙任意两者之间的关系,并通过散点图(ScatterPlot)和分布图(Distribution)展现出来。
12)每个子系统的可视化及自动化完成是通过本发明中定义的每个控件实现,为每个控件做如下定义:控件左侧接受数据传入,右侧将数据传出;控件左侧输入的数据经过控件处理后,从右侧输出接口通过实线连接传入下一相关控件,类似数据的流动,故称为数据流。在每个控件中设置了“Apply automatically”方法,选中该方法后数据会自动向下流动,未选中数据的传递会等待手动操作,该方法也是本发明高通量自动流程中实现自动化和手动化随时切换的基础思想。
下面结合图2,对本发明实施例的多尺度集成可视化的高通量自动计算流程及数据智能系统的使用方法做进一步说明,图2中每个圆形按钮均为一个具有具体功能的实际操作的控件,具体过程如下:
1)用户通过POSCAR控件导入单个晶体结构;通过Builder控件构建晶界、空位、间隙等晶体结构;通过Two Doping控件构建单个掺杂或者双掺杂的晶体结构;通过MultiPOSCAR控件导入多个晶体结构(支持的文件格式包括:CIF文件,XSF文件,XYZ文件,DATA文件);通过Finder控件从现有晶体结构数据库导入用户所需的晶体结构;通过BuildHeterojunction控件构建异质结结构;
其中,Finder控件可在现有的18万数据库中索引结构并可视化,具体地,选择进入Finder控件,左侧部分配置远程服务器ip地址、port端口、用户名和密码信息访问现有数据库;选择索引标准,依据化学式或元素种类等检索条件;也可输入具体的索引条件,点击搜索,在对应位置会显示所有检索结果,对于每一条检索结果,双击目标结果即可进行可视化查看;点击send可以传入高通量容器中进行高通量自动流程计算;
2)通过HT Preprocessor控件收集通过上述不同方式传入的晶体结构,并放在高通量容器中,之后通过HT Preprocessor控件中的结构算法筛选有效且不重复的晶体结构,等待被计算;
3)为高通量容器中的每个晶体结构指定具体的计算模拟任务,并通过OptimizeWF控件、VASP AIMD WF控件、BandsStructure Boltztrap WF控件、Convergence WF控件、Static WF控件、NoChgStatic WF控件、DOS WF控件、Bandstructure WF控件、HSE_bandstructure WF控件、Elastic-DFPT控件、DFPT-Elastic-Small-K控件、Elastic-tensorWF控件、Equation_state WF控件、NEB WF控件、Raman WF控件、Lammps relax控件,Diffuseworkflow控件、Lammps MD workflow控件、SingleGrain WF控件、NormalGrain WF控件、Lattice KMC控件、Honeycomb Lattice控件、Gibbs控件和Tc WF控件构建一个或多个高通量工作流,其中均采用默认计算参数配置;
4)为大量晶体结构配置完高通量工作流之后,所有工作流被汇总到本地Manage控件中,等待远程服务器响应;
5)通过Database控件为整个高通量工作流添加远程服务器配置;
6)通过Manage控件自动将本地高通量工作流发送到远程服务器中;
7)通过Jobs控件设定并分配远程服务器计算资源,并使远程工作开始运行;此时远程任务通过工作流的封装,每个工作流都具有了自动纠错功能,且会将所有的计算报错存储在任务子数据库中;
8)通过Work State控件查看远程服务器中工作流的运行状态,可以查看提交的任务数量、ID、状态等信息,控件左侧显示提交的每个工作流,包括任务名称、任务状态、任务ID、子任务(Fireworks)等;右侧上部分设置表示距任务创建已过去的时间,下部分设置工作流和子任务所对应的工作状态的数目;
9)通过Work State控件可视化查看每个提交到远程服务器的晶体结构信息,以及工作流中具体每个子任务的计算细节;
10)通过Delete Workflow控件,可以对工作流进行删除操作(输入Job Id,按Submit,即可删除工作流);通过Work Priority控件,可以调整工作流的计算顺序(输入JobId,输入Job priority(0-100,100为优先级最高),点击Submit即可调整工作流顺序)。
11)通过Analyzer控件基于SearchEngine检索引擎检索查询数据库中具体计算结果,并且:
将查询到的数据以Table形式传送到Scatter Plot控件中,进行任务号、能量、体积、带隙任意两者之间的散点图分析,Scatter Plot控件链接color控件可以进行数据分析中颜色配置;
将查询到的数据以Table形式传送到Distribution控件中,进行任务号,能量、体积、带隙任意单个变量的分布图分析;
将查询到的材料性能数据以字典形式传送到VaspPlot控件中,进行态密度以及部分原子态密度分析,以及能带结构以及部分原子能带结构分析;
将查询到的任意数据传送到Save控件中,保存成Html格式的数据;
将查询到的任意数据传送到Data Table中,以Excel类似的形式可视化查看数据数值;
12)通过Viewer控件可视化查看晶体结构的3维空间图像;
13)通过Get ElasticTensor控件查看性能子数据库中保存的弹性模量矩阵相关的数据;
14)通过Xsf控件从结构子数据库中读取需要进行数据挖掘的结构文件,并将其转化为XSF格式的数据;
15)通过Fingerprint控件载入机器学习数据生成过程中所需的数学方程的参数;
16)通过Generate控件将数学方程应用到XSF格式的数据文件中,产生适用于机器学习的初始数据;
17)通过Train控件设置机器学习模型以及模型训练过程中的超参数配置,并进行模型的训练;
18)通过TrainAccurcy Plot控件查看机器学习训练精度并进行模型收敛性的分析;
19)通过Potential控件将训练完成的机器学习模型保存为可以进行材料结构性能预测和大规模分子动力学模拟的势函数文件;
20)通过PM Analyzer控件调用训练好的机器学习模型进行模型预测过程中的数据分析。
图3为本发明实施例提供的ALKEMIE系统的细节结构图。如图所示,系统的结构图分为四层:用户层、界面层、内核层以及可扩展层。
用户可以基于目前主流的三大操作系统(Windows、Linux和MacOS)中的任意一个操作系统,通过用户认证证书(License)和用户登录的方式访问连接本发明ALKEMIE系统的界面层及对应服务。用户层主要用于解决不同用户不同操作系统的适配性问题。
界面层包括材料结构可视化模块、高通量工作流及流程可视化模块、远程服务器工作状态可视化模块、数据库数据及数据库结构可视化模块、数据分析可视化模块和人工智能可视化模块。界面层一方面可以连接用户登录的客户端,另一方面可以通过每一个可视化模块来操作对应的内核层的6个子系统中的子控件并实现对应的功能。每个子控件由可视化和操作逻辑两部分组成,其中可视化部分属于界面层,操作逻辑属于内核层。具体来说,用户通过结构可视化模块可以访问材料建模系统中所有子控件并实现每个子控件对应的功能;通过高通量工作流及流程可视化模块可以访问科学计算系统中所有子控件并实现每个子控件对应的功能;通过远程服务器工作状态可视化模块可以访问服务器配置系统中所有子控件并实现每个子控件对应的功能;通过数据库数据及数据库结构可视化模块可以访问数据存储系统中所有子控件并实现每个子控件对应的功能;通过数据分析可视化模块可以访问数据分析系统中所有子控件并实现每个子控件对应的功能;通过人工智能可视化模块可以访问人工智能系统中所有子控件并实现每个子控件对应的功能。
内核层包含上面所述的材料建模系统、科学计算系统、服务器配置系统、数据存储系统、数据分析系统和人工智能系统6个内核系统。内核层一方面通过界面接口实现同用户的可视化交流和操作,另一方面通过ALK-Lib接口实现每个内核系统对应功能的扩展。每个内核系统中对应的功能由每个子控件的操作逻辑代码实现。材料建模系统主要用于构建晶体结构模型,对应的功能主要分为3大类,包括本地晶体结构导入、从现有材料晶体数据库导入晶体结构、材料结构建模,包含的子控件及每个控件功能如上文所述。科学计算系统主要用于构建科学高通量工作流,分为构建多任务嵌套的高通量工作流和构建高通量工作流流程图两部分,包含的子控件及每个控件功能如上文所述。服务器配置系统主要用于远程服务器配置,分为计算任务队列配置,删除、添加和改变任务优先级,包含的子控件及每个控件功能如上文所述。数据存储系统主要用于存储计算过程中产生的所有数据,包含的子控件及每个控件功能如上文所示。数据分析系统主要用于材料计算数据可视化分析,分为数据分析和导入输出数据,包含的子控件及每个控件功能如上文所述。人工智能系统主要用于智能识别和判断错误,和根据计算结果结合机器学习进行数据挖掘,分为自动智能纠错和数据挖掘,包含的子控件及每个控件功能如上文所述。
可扩展层用于让用户根据固定的Lib接口添加自定义的功能,使整套系统更具有灵活性、可用性和可拓展性。可扩展层为每个内核系统都定义了可以自定义的Lib接口,本发明中每个内核系统的拓展功能或者技术如上文所述。本发明集成的建模方法包括:晶界、空位、掺杂、间隙,异质结和共掺杂;集成的结构数据包括:ICSD和COD数据库中对应的结构;集成的高通量工作流软件包括:VASP、PyGace、QE、LAMMPS和Gibbs;兼容的作业管理系统包括:PBS、SLURM、LSF;支持的数据库类型包括:MongoDB和MySQL;集成的数据可视化模块包括:Matplotlib和Seaborn;集成的人工智能框架包括:TensorFlow、PyTorch和Scikit-Learn。
应当理解,可扩展层中有很多是开源软件,本发明只用到了部分技术和部分内容,本领域技术人员可以根据需求进行删减。
对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以对本发明的实施例做出若干变型和改进,这些都属于本发明的保护范围。

Claims (10)

1.一种多尺度集成可视化的高通量自动计算流程及数据智能系统,其特征在于,包括如下子系统:材料建模系统、科学计算系统、服务器配置系统、数据存储系统、数据分析系统和人工智能系统;
所述材料建模系统包括晶体建模模块、高通量容器和高通量容器控件,所述晶体建模模块用于通过一种或多种方式构建初始晶体结构并将其传入所述高通量容器;所述高通量容器控件用于对传入的所有初始晶体结构进行高通量筛选,通过判断晶体结构的有效性和重复性,获得有效晶体结构;
所述科学计算系统包括VASP第一性原理高通量工作流模块、LAMMPS分子动力学高通量工作流模块、OpenPhase相图模拟高通量工作流模块、动力学相关高通量工作流模块和热力学高通量工作流模块;所述VASP第一性原理高通量工作流模块用于为有效晶体结构指定基于VASP软件的计算模拟任务,并基于所指定的计算模拟任务构建一个或多个高通量工作流;所述LAMMPS分子动力学高通量工作流模块用于为有效晶体结构指定基于LAMMPS软件的计算模拟任务,并基于所指定的计算模拟任务构建一个或多个高通量工作流;所述OpenPhase相图模拟高通量工作流模块用于为有效晶体结构指定基于OpenPhase软件的计算模拟任务,并基于所指定的计算模拟任务构建一个或多个高通量工作流;所述动力学相关高通量工作流模块用于为有效晶体结构指定基于KMC软件的计算模拟任务,并基于所指定的计算模拟任务构建一个或多个高通量工作流;所述热力学科学计算工作模块用于为有效晶体结构指定基于Gibbs和Tc软件的计算模拟任务,并基于所指定的计算模拟任务构建一个或多个高通量工作流;
所述服务器配置系统包括服务器管理模块和服务器状态模块;所述服务器管理模块用于配置远程服务器参数、计算节点及运行状态,以及用于将所构建的一个或多个高通量工作流自动发送至所述数据存储系统;所述服务器状态模块用于为每个高通量工作流设定并分配远程服务器计算资源并启动远程工作;
所述数据存储系统包括共享数据库、隐私数据库和数据库控件;所述共享数据库用于多用户之间的数据共享;所述隐私数据库包括结构子数据库、任务子数据库、性能子数据库和文件子数据库,所述结构子数据库用于存储高通量工作流计算过程中涉及到的初始晶体结构和经过所述科学计算系统的高通量工作流模块优化后的晶体结构;所述任务子数据库用于存储高通量工作流计算过程中的计算流程及中间元数据;所述性能子数据库用于保存高通量工作流计算过程中的与材料基础性能相关的数值;所述文件子数据库用于存储高通量工作流计算过程中大于10M的数据文件;所述数据库控件用于为存储在所述任务子数据库中的每个高通量工作流添加所述远程服务器参数,以及用于存储高通量工作流的输入配置和计算过程流程图;
所述数据分析系统包括数据检索模块和数据分析及可视化模块;所述数据检索模块用于检索查询所述结构子数据库中的晶体结构信息、所述任务子数据库中的计算流程和所述性能子数据库中的与材料基础性能相关的数值,并传送至所述分析及可视化模块进行数据分析;所述数据分析及可视化模块用于对查询到的晶体结构信息、计算流程和与材料基础性能相关的数值进行统计学、散点图、分布图,能带图和态密度图分析,并可视化作图查看;
所述人工智能系统包括智能纠错模块和数据挖掘模块,所述智能纠错模块用于自动检测每个高通量工作流中当前计算模拟任务可能出现的报错情况,在最大纠正次数允许的范围内进行自动纠错,之后把纠错后的当前计算模拟任务自动提交到计算队列进行计算,并将所有纠错过程存储于所述任务子数据库和将纠错结果存储于所述性能子数据库;所述数据挖掘模块用于结合机器学习技术对晶体结构计算数据进行数据预处理、构建机器学习模型以及模型参数训练、数据挖掘和材料性能分析及预测。
2.根据权利要求1所述的系统,其特征在于,所述晶体建模模块包括POSCAR控件、Builder控件、Two Doping控件、MultiPOSCAR控件、Finder控件和Build Heterojunction控件中的一个或多个;
所述POSCAR控件用于导入单个初始晶体结构;
所述Builder控件用于构建晶界结构、空位结构和间隙结构;
所述Two Doping控件用于构建双掺杂或者共掺杂结构;
所述Multi POSCAR控件用于导入多个初始晶体结构;
所述Finder控件用于从所述结构子数据库导入所需的初始晶体结构;
所述Build Heterojunction控件用于构建异质结结构。
3.根据权利要求1所述的系统,其特征在于,所述VASP第一性原理高通量工作流模块包括Optimize WF控件、VASP AIMD WF控件、BandsStructure Boltztrap WF控件、Convergence WF控件、Static WF控件、NoChgStatic WF控件、DOS WF控件、BandstructureWF控件、HSE_bandstructure WF控件、Elastic-DFPT控件、DFPT-Elastic-Small-K控件、Elastic-tensor WF控件、Equation_state WF控件、NEB WF控件和Raman WF控件中的一个或多个;
所述Optimize WF控件用于为每个有效晶体结构添加第一性原理结构优化高通量工作流;
所述VASP AIMD WF控件用于为每个有效晶体结构添加第一性原理分子动力学高通量工作流;
所述BandsStructure Boltztrap WF控件用于为每个有效晶体结构添加基于Boltztrap软件的第一性原理电导率计算的高通量工作流;
所述Convergence WF控件用于为每个有效晶体结构添加第一性原理计算模拟过程中截断半径及K点密度收敛性测试的高通量工作流;
所述Static WF控件用于为每个有效晶体结构添加第一性原理静态高通量工作流;
所述NoChgStatic WF控件用于为每个有效晶体结构添加不包含电荷输出的第一性原理静态高通量工作流;
所述DOS WF控件用于为每个有效晶体结构添加第一性原理态密度高通量工作流;
所述Bandstructure WF控件用于为每个有效晶体结构添加第一性原理能带高通量工作流;
所述HSE_bandstructure WF控件用于为每个有效晶体结构添加基于HSE杂化泛函的第一性原理能带高通量工作流;
所述Elastic-DFPT控件用于为每个有效晶体结构添加基于密度泛函微扰理论的弹性常数高通量工作流;
所述DFPT-Elastic-Small-K控件用于为每个有效晶体结构添加基于密度泛函微扰理论的具有小的K点密度的弹性常数高通量工作流;
所述Elastic-tensor WF控件用于为每个有效晶体结构添加基于能量体积形变的第一性原理弹性常数高通量工作流;
所述Equation_state WF控件用于为每个有效晶体结构添加能量体积相关的第一性原理状态方程的高通量工作流;
所述NEB WF控件用于为每个有效晶体结构添加第一性原理相关的扩散路径、扩散势垒及扩散系数的高通量工作流;
所述Raman WF控件用于为每个有效晶体结构添加第一性原理拉曼光谱高通量工作流。
4.根据权利要求1所述的系统,其特征在于,所述LAMMPS分子动力学高通量工作流模块包括Lammps relax控件、Diffuse workflow控件和Lammps MD workflow控件中的一个或多个;所述Lammps relax控件用于为每个有效晶体结构添加基于LAMMPS软件的结构优化高通量工作流;所述Diffuse workflow控件用于为每个有效晶体结构添加基于LAMMPS软件的扩散系数、扩散路径的高通量工作流;所述Lammps MD workflow控件用于为每个有效晶体结构添加基于LAMMPS软件的分子动力学模拟高通量工作流;
所述OpenPhase相图模拟高通量工作流模块包括SingleGrain WF控件和NormalGrainWF控件中的一个或两个;所述SingleGrain WF控件用于为每个有效晶体结构添加单原子生长过程模拟的高通量工作流;所述NormalGrain WF控件用于为每个有效晶体结构添加多晶晶界生长过程模拟的高通量工作流;
所述动力学相关高通量工作流模块包括Lattice KMC控件和Honeycomb Lattice控件中的一个或两个;所述Lattice KMC控件用于为每个有效晶体结构添加基于单个晶格的KMC高通量工作流;所述Honeycomb Lattice控件用于为每个有效晶体结构添加基于Honeycomb的多个晶格的KMC高通量工作流;
所述热力学高通量工作流包括Gibbs控件和Tc WF控件中的一个或两个;所述Gibbs控件用于为每个有效晶体结构添加吉布斯自由能分析相关的高通量工作流;所述Tc WF控件用于为每个有效晶体结构添加预测其居里温度的高通量工作流。
5.根据权利要求1所述的系统,其特征在于,所述服务器管理模块包括Manage控件和Jobs控件中的一个或两个;
所述Manage控件用于将所构建的一个或多个高通量工作流自动发送至所述任务子数据库;所述Jobs控件用于配置远程服务器参数、远程服务器计算节点数量及远程服务器运行状态;
所述服务器状态模块包括Work State控件、Delete Workflow控件和Work Priority控件中的一个或多个;
所述Work State控件用于查看远程服务器中高通量工作流的运行状态、可视化查看提交到远程服务器的每个晶体结构的信息、以及可视化查看高通量工作流中每个子任务的计算细节;所述Delete Workflow控件用于对高通量工作流进行删除操作;所述WorkPriority控件用于调整高通量工作流的计算顺序。
6.根据权利要求1所述的系统,其特征在于,所述共享数据库中,每条共享数据都包含数据原创者的标签,所述数据原创者的标签定义为如下格式:
alkemie.date.classification/user defined label.number
字段alkemie为所述系统唯一标识,字段date为数据共享提交日期,字段classification为所述系统自动判别的该条共享数据的类型;后半部分由数据原创者自定义生成,其中,user defined label部分为由共享数据原创作者自定义的字符串,number为累加的数据索引。
7.根据权利1所述的系统,其特征在于,所述结构子数据库中关键数据结构包括:neles,natoms,cell,rcell,energy,atom_ene,forces,atom_force,info,car_coord,dir_coord,subclass_Atom,is_optimized;
所述任务子数据库中关键数据结构包括:task_id,task_name,state,calculate_nodes,submit_time,completed_time,inputs,outputs,sub_tasks;
所述性能子数据库中关键数据结构包括:ID,Energy,Forces,Volume,BandGap,Charge,CONTCAR;
所述文件子数据库中关键数据结构包括:XDATCAR,PROCAR,DosData,BandData,VTK_fsData。
8.根据权利要求1所述的系统,其特征在于,所述数据检索模块包括SearchEngine检索引擎和Analyzer控件中的一个或两个;
所述SearchEngine检索引擎用于将用户输入的检索信息转化为所述隐私数据库的子数据库能够识别的检索命令,并根据检索命令从多个子数据库中自动判别需要检索的子数据库类型,之后自动链接对应的子数据库,并根据检索命令查询数据;
所述Analyzer控件用于获取用户输入的数据检索信息和检索类别,并基于SearchEngine检索引擎检索查询所述隐私数据库的子数据库中的具体计算结果,最后以表格格式输出数据到所述数据分析及可视化模块。
9.根据权利要求1所述的系统,其特征在于,所述数据分析及可视化模块包括ScatterPlot控件、Color控件、Distribution控件、VaspPlot控件、Save控件、Data Table、Viewer控件和Get ElasticTensor控件中的一个或多个;
所述Scatter Plot控件用于任务号、能量、体积、带隙等任意两者之间的散点图分析;
所述Color控件用于数据分析中的颜色配置;
所述Distribution控件用于任务号、能量、体积、带隙等任意单个变量的分布图分析;
所述VaspPlot控件用于态密度及部分原子态密度分析和能带结构及部分原子能带结构分析;
所述Save控件用于将所述数据检索模块检索查询到的任意数据保存为Html格式的文件;
所述Data Table用于以Excel类似的形式,可视化查看所述数据检索模块检索查询到的任意数据;
所述Viewer控件用于可视化查看晶体结构的3维空间图像;
所述Get ElasticTensor控件用于查看所述性能子数据库中保存的与弹性模量矩阵相关的数据。
10.根据权利要求1所述的系统,其特征在于,所述数据挖掘模块包括Xsf控件、Fingerprint控件、Generate控件、Train控件、TrainAccurcy Plot控件、Potential控件和PM Analyzer控件中的一个或多个;
所述Xsf控件用于将计算完成的晶体结构转换为包含原子能量和原子受力的XSF格式的数据文件;
所述Fingerprint控件用于载入机器学习数据生成过程中所需的数学方程的参数;
所述Generate控件用于将所述数学方程应用到所述XSF格式的数据文件中,产生适用于机器学习的初始数据;
所述Train控件用于构建机器学习模型以及模型训练过程中的超参数配置,并根据反向传播算法进行机器学习模型和超参数的训练;
所述TrainAccurcy Plot控件用于机器学习训练精度及收敛性的分析;
所述Potential控件用于将训练完成的机器学习模型保存为可以进行材料结构性能预测和大规模分子动力学模拟的势函数文件;
所述PM Analyzer控件用于机器学习预测过程的数据分析。
CN202010907586.5A 2020-09-02 2020-09-02 多尺度集成可视化的高通量自动计算流程及数据智能系统 Active CN112102887B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010907586.5A CN112102887B (zh) 2020-09-02 2020-09-02 多尺度集成可视化的高通量自动计算流程及数据智能系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010907586.5A CN112102887B (zh) 2020-09-02 2020-09-02 多尺度集成可视化的高通量自动计算流程及数据智能系统

Publications (2)

Publication Number Publication Date
CN112102887A true CN112102887A (zh) 2020-12-18
CN112102887B CN112102887B (zh) 2023-02-24

Family

ID=73757491

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010907586.5A Active CN112102887B (zh) 2020-09-02 2020-09-02 多尺度集成可视化的高通量自动计算流程及数据智能系统

Country Status (1)

Country Link
CN (1) CN112102887B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112685911A (zh) * 2021-01-12 2021-04-20 湖南大学 一种材料计算框架、方法、系统及计算机设备
CN112951334A (zh) * 2021-01-25 2021-06-11 西安交通大学 一种大型压力容器结构料集成计算系统的搭建方法
CN113723931A (zh) * 2021-09-09 2021-11-30 中国工程物理研究院计算机应用研究所 一种适用于多尺度高通量材料计算的工作流建模方法
CN113808685A (zh) * 2021-08-27 2021-12-17 西北工业大学深圳研究院 一种非中心对称超导拓扑电子材料的分析方法及系统
CN113836115A (zh) * 2021-09-28 2021-12-24 苏州浪潮智能科技有限公司 数据获取方法、装置、电子设备及可读存储介质
CN113838108A (zh) * 2021-09-29 2021-12-24 中国科学院长春光学精密机械与物理研究所 多尺度光谱tdicmos点线配准的电荷累积方向测试系统
CN113889201A (zh) * 2021-09-15 2022-01-04 成都材智科技有限公司 一种核电结构材料计算数据集成系统及方法
CN114048027A (zh) * 2021-10-21 2022-02-15 中国科学技术大学 一种应用于超算集群调度的作业运行参数优化方法
CN114065620A (zh) * 2021-11-11 2022-02-18 四川大学 基于像素图表征和cnn的可解释性分子动力学轨迹分析方法
CN114329674A (zh) * 2021-12-31 2022-04-12 北京迈高材云科技有限公司 基于Quantum Espresso的云端高通量材料自动筛选方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106372329A (zh) * 2016-08-31 2017-02-01 中国科学院计算机网络信息中心 材料基因工程高通量集成计算与数据管理的方法及系统
CN107273670A (zh) * 2017-05-31 2017-10-20 中国科学院计算机网络信息中心 一种高通量材料计算数据自动采集和加工方法及系统
CN107357971A (zh) * 2017-06-23 2017-11-17 中国科学院计算机网络信息中心 一种图形化及网络化的高通量第一性原理计算工作流系统
CN109858085A (zh) * 2018-12-26 2019-06-07 钢铁研究总院 一种金属材料热处理过程中的奥氏体化测定方法
CN109991387A (zh) * 2019-03-06 2019-07-09 华南理工大学 一种模拟γ-TiAl合金在非等温条件下的相场分析法
CN111538499A (zh) * 2020-04-24 2020-08-14 苏州浪潮智能科技有限公司 一种构建计算材料模拟平台的方法和设备
CN111599421A (zh) * 2020-05-11 2020-08-28 北京迈高材云科技有限公司 基于高通量材料计算的全自动声子谱计算方法及其系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106372329A (zh) * 2016-08-31 2017-02-01 中国科学院计算机网络信息中心 材料基因工程高通量集成计算与数据管理的方法及系统
CN107273670A (zh) * 2017-05-31 2017-10-20 中国科学院计算机网络信息中心 一种高通量材料计算数据自动采集和加工方法及系统
CN107357971A (zh) * 2017-06-23 2017-11-17 中国科学院计算机网络信息中心 一种图形化及网络化的高通量第一性原理计算工作流系统
CN109858085A (zh) * 2018-12-26 2019-06-07 钢铁研究总院 一种金属材料热处理过程中的奥氏体化测定方法
CN109991387A (zh) * 2019-03-06 2019-07-09 华南理工大学 一种模拟γ-TiAl合金在非等温条件下的相场分析法
CN111538499A (zh) * 2020-04-24 2020-08-14 苏州浪潮智能科技有限公司 一种构建计算材料模拟平台的方法和设备
CN111599421A (zh) * 2020-05-11 2020-08-28 北京迈高材云科技有限公司 基于高通量材料计算的全自动声子谱计算方法及其系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MARIEKE E. KLIJN等: "Application of Empirical Phase Diagrams for Multidimensional Data Visualization of High-Throughput Microbatch Crystallization Experiments", 《JOURNAL OF PHARMACEUTICAL SCIENCES》 *
QU JINGYU等: "High dielectric ternary oxides from crystal structure prediction and high-throughput screening", 《SCIENTIFIC DATA》 *
李波等: "浅谈集成计算材料工程和材料基因工程:思想及实践", 《中国材料进展》 *
杨小渝等: "基于材料基因组计划的计算和数据方法", 《科技导报》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112685911A (zh) * 2021-01-12 2021-04-20 湖南大学 一种材料计算框架、方法、系统及计算机设备
CN112951334A (zh) * 2021-01-25 2021-06-11 西安交通大学 一种大型压力容器结构料集成计算系统的搭建方法
CN112951334B (zh) * 2021-01-25 2024-03-29 西安交通大学 一种大型压力容器结构料集成计算系统的搭建方法
CN113808685A (zh) * 2021-08-27 2021-12-17 西北工业大学深圳研究院 一种非中心对称超导拓扑电子材料的分析方法及系统
CN113808685B (zh) * 2021-08-27 2024-01-16 西北工业大学深圳研究院 一种非中心对称超导拓扑电子材料的分析方法及系统
CN113723931A (zh) * 2021-09-09 2021-11-30 中国工程物理研究院计算机应用研究所 一种适用于多尺度高通量材料计算的工作流建模方法
CN113723931B (zh) * 2021-09-09 2024-04-19 中国工程物理研究院计算机应用研究所 一种适用于多尺度高通量材料计算的工作流建模方法
CN113889201A (zh) * 2021-09-15 2022-01-04 成都材智科技有限公司 一种核电结构材料计算数据集成系统及方法
CN113836115B (zh) * 2021-09-28 2023-06-27 苏州浪潮智能科技有限公司 数据获取方法、装置、电子设备及可读存储介质
CN113836115A (zh) * 2021-09-28 2021-12-24 苏州浪潮智能科技有限公司 数据获取方法、装置、电子设备及可读存储介质
CN113838108B (zh) * 2021-09-29 2023-07-21 中国科学院长春光学精密机械与物理研究所 多尺度光谱tdicmos点线配准的电荷累积方向测试系统
CN113838108A (zh) * 2021-09-29 2021-12-24 中国科学院长春光学精密机械与物理研究所 多尺度光谱tdicmos点线配准的电荷累积方向测试系统
CN114048027B (zh) * 2021-10-21 2022-05-13 中国科学技术大学 一种应用于超算集群调度的作业运行参数优化方法
CN114048027A (zh) * 2021-10-21 2022-02-15 中国科学技术大学 一种应用于超算集群调度的作业运行参数优化方法
CN114065620B (zh) * 2021-11-11 2022-06-03 四川大学 基于像素图表征和cnn的可解释性分子动力学轨迹分析方法
CN114065620A (zh) * 2021-11-11 2022-02-18 四川大学 基于像素图表征和cnn的可解释性分子动力学轨迹分析方法
CN114329674A (zh) * 2021-12-31 2022-04-12 北京迈高材云科技有限公司 基于Quantum Espresso的云端高通量材料自动筛选方法和系统
CN114329674B (zh) * 2021-12-31 2024-05-03 北京迈高材云科技有限公司 基于Quantum Espresso的云端高通量材料自动筛选方法和系统

Also Published As

Publication number Publication date
CN112102887B (zh) 2023-02-24

Similar Documents

Publication Publication Date Title
CN112102887B (zh) 多尺度集成可视化的高通量自动计算流程及数据智能系统
Lu et al. Speedup your analytics: Automatic parameter tuning for databases and big data systems
CN103605662B (zh) 一种分布式计算框架参数优化方法、装置及系统
Brohée et al. Network Analysis Tools: from biological networks to clusters and pathways
Kučera et al. Semantic BMS: Allowing usage of building automation data in facility benchmarking
CN108319807B (zh) 一种掺杂式能源材料的高通量计算筛选方法
US20180165386A1 (en) Chaining analytic models in tenant-specific space for a cloud-based architecture
Ding et al. A new TRIZ-based patent knowledge management system for construction technology innovation
Huang et al. PMODTRAN: a parallel implementation based on MODTRAN for massive remote sensing data processing
Mohammadi et al. A genetic algorithm for simultaneous lotsizing and sequencing of the permutation flow shops with sequence-dependent setups
Jia et al. Combined scheduling algorithm for re-entrant batch-processing machines in semiconductor wafer manufacturing
Fioravanti et al. ℋ 2 filtering of discrete-time Markov jump linear systems through linear matrix inequalities
CN108140022B (zh) 数据查询方法和数据库系统
Wang et al. A hybrid estimation of distribution algorithm for the semiconductor final testing scheduling problem
Haines Maximum likelihood estimation for N‐mixture models
Jha et al. Introducing distributed dynamic data‐intensive (D3) science: Understanding applications and infrastructure
CN109597702B (zh) 消息总线异常的根因分析方法、装置、设备及存储介质
CN111311352A (zh) 货源匹配方法、系统、设备及存储介质
Liu et al. A method for flight test subject allocation on multiple test aircrafts based on improved genetic algorithm
Lushbough et al. BioExtract server—an integrated workflow-enabling system to access and analyze heterogeneous, distributed biomolecular data
EP3343372A1 (en) Distributed cache cleanup for analytic instance runs processing operating data from industrial assets
CN105809577B (zh) 一种基于规则和组件的电厂信息化数据的分类处理方法
Basnet A hybrid genetic algorithm for a loading problem in flexible manufacturing systems
KR101178968B1 (ko) 연구개발 정보 관리 시스템 및 그 방법
Maile A software tool to compare measured and simulated building energy performance data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant