CN107273670A - 一种高通量材料计算数据自动采集和加工方法及系统 - Google Patents

一种高通量材料计算数据自动采集和加工方法及系统 Download PDF

Info

Publication number
CN107273670A
CN107273670A CN201710399012.XA CN201710399012A CN107273670A CN 107273670 A CN107273670 A CN 107273670A CN 201710399012 A CN201710399012 A CN 201710399012A CN 107273670 A CN107273670 A CN 107273670A
Authority
CN
China
Prior art keywords
physico
chemical property
data
property data
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710399012.XA
Other languages
English (en)
Inventor
杨小渝
任杰
王宗国
赵旭山
张明明
刘海东
宋健龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Network Information Center of CAS
Original Assignee
Computer Network Information Center of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Network Information Center of CAS filed Critical Computer Network Information Center of CAS
Priority to CN201710399012.XA priority Critical patent/CN107273670A/zh
Publication of CN107273670A publication Critical patent/CN107273670A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种高通量材料计算数据自动采集和加工方法及系统,以快速获取目标材料物理化学性质并自动存储。该方法包括:构建第一性原理的计算流程;根据计算流程,对获取的所述目标材料大量晶体结构数据进行第一性原理计算;自动采集得到第一性原理计算结果;判断分析结果中的数据来源,对第一性原理计算结果进行分类和规范化加工,从而得到更多的物理化学性质并实时自动分类存储。本发明同样适用于对用户已有的大量第一性原理计算数据的规范化加工和材料物化性质的获取。本发明提供的方法和系统能得到目标材料更多的物理化学性质,并且实现了材料物化性质的快速自动获取和集中统一管理,提高了第一性原理计算数据的复用和共享。

Description

一种高通量材料计算数据自动采集和加工方法及系统
技术领域
本发明涉及材料基因工程领域,尤其涉及一种高通量材料计算数据自动采集和加工方法及系统,以快速获取目标材料物理化学性质并自动存储。
背景技术
目前,当用户对材料进行完第一性原理计算后,还需要登录计算集群将结果文件下载到本地计算机进行数据的手动处理和分析,从而获取材料的物理化学性质。当用户对第一性原理计算结果文件进行处理时,需要手动地登陆、下载计算结果,然后从相关计算结果文件中将自己感兴趣的物化性质数据,如能带、态密度、弹性常数或介电常数等提取出来,或者从相关计算结果文件中提取关键数据,将关键数据提取出来后再通过公式推演计算得到材料物化性质数据。对于涉及多次第一性原理计算才能获得的物化性质数据,如状态方程以及扩散系数等,获取过程将变得十分复杂。同时,不少用户进行完第一性原理计算和数据分析后,这些数据便被遗弃在用户的本地计算机中,不仅无法重复利用,而且容易丢失。目前缺乏自动化和规范化的材料计算数据处理方法和系统。因此,亟需一种自动采集并处理第一性原理计算数据及结果的方法和系统,以实现目标材料更多物理化学性质的快速获取,集中管理和用户共享等。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种高通量材料计算数据自动采集和加工方法及系统,以快速获取目标材料物理化学性质并自动存储
本发明解决上述技术问题的技术方案如下:
一种高通量材料计算数据自动采集和加工方法及系统,包括以下步骤:
步骤1,构建第一性原理的计算流程,所述计算流程包括目标材料晶体结构数据的获取过程、第一性原理计算作业提交过程、第一性原理计算数据自动采集过程和第一性原理计算数据的规范化加工过程;
步骤2,根据所述计算流程,围绕目标材料的大量晶体结构数据,对每一个所述晶体结构数据进行第一性原理计算的作业提交,在获取第一性原理计算结果后,判断第一性原理计算结果中数据的来源,当所述数据来源为来自单个所述计算过程时,执行规范化加工步骤3,当所述数据来源为来自多个所述计算过程时,执行规范化加工步骤4;
步骤3,从所述第一性原理计算结果中提取得到材料的基本物化性质数据,并进一步分析和规范化加工,得到更多的材料基本物化性质数据;
步骤4,汇集多个所述计算过程得到的第一性原理计算结果,调用预存的程序对汇集结果进行分析和处理,得到材料的基本物化性质数据,并进一步分析和规范化加工,得到更多的材料基本物化性质数据。
需要说明的是,所述计算过程包括7大基元计算,具体为:结构优化计算、基态能量计算、能带计算、态密度计算、弹性常数计算、磁学性质计算和介电常数计算。
步骤1中,根据系统预设的计算流程或用户自行配置的计算流程,对所述晶体结构数据进行上述7大基元计算中的任一项或任几项的单次计算,具体的计算流程可以根据用户的需求随意搭配,例如,针对介电常数计算,用户可以选择结构优化计算、基态能量计算和介电常数计算作为一个计算流程。
上述7大基元的计算流程可根据用户的使用需求随意组合搭配,并不对本发明构成限制。
本发明的有益效果是:本发明提供的一种高通量材料计算数据自动采集和加工方法及系统,通过对某材料大批量第一性原理计算结果的自动采集、规范化加工得到材料更多的物理化学性质、以及对所述物理化学性质的实时自动地存储,实现了对材料物化性质的快速自动获取和不同用户的材料计算性质数据的集中统一管理,减少了计算数据的丢失,提高了第一性原理计算数据的复用率,实现了材料计算数据的共享,帮助加快新材料研发。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步地,步骤3具体包括:
步骤3.1,从所述第一性原理计算结果中提取得到材料基本物化性质数据,将所述材料基本物化性质数据作为第一类物化性质数据实时保存,并判断所述材料基本物化性质数据是否能被进一步计算推导得到更多物化性质,如果能,则执行步骤3.2;
步骤3.2,从预设的物化性质算法库中选择与待推导物化性质相匹配的算法,对所述物化性质进行计算推导,得到第二类物化性质数据;
步骤4具体包括:
步骤4.1,汇集多个所述计算过程得到的第一性原理计算结果,并调用预存的程序进行分析和处理,得到材料的基本物化性质数据,作为第三类物化性质数据实时保存;
步骤4.2,判断所述基本物化性质数据是否能被进一步计算推导得到更多物化性质,如果能,则执行步骤4.3;
步骤4.3,从预设的物化性质算法库中选择与待推导物化性质相匹配的物化性质算法,对所述物化性质进行计算推导,得到第四类物化性质数据。
进一步地,在步骤2中,得到所述第一性原理计算结果的方法还包括:获取用户直接输入的第一性原理计算结果;
当所述第一性原理计算结果为用户直接输入时,还包括:
步骤5,对所述第一性原理计算结果进行解析,判断第一性原理计算结果中数据的来源;
步骤6,对所述计算流程中所述分析过程中数据来源的个数进行识别和判断,当所述数据来源为来自单个所述计算过程时,执行步骤3,当所述数据来源为来自多个所述计算过程时,执行步骤4。
进一步地,所述自动采集和加工方法还包括:
步骤7,计算结束后,通过无模式存储的方法,以文档集形式存储所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据和所述第四类物化性质数据,分别将所述晶体结构数据存储在结构数据文档集中,将所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据和所述第四类物化性质数据存储在计算数据文档集中;
步骤8,分别对所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据和所述第四类物化性质数据进行统计分析,得到分析结果并输出。
采用上述进一步方案的有益效果是:通过计算能够得到更多往往通过实验难以获取的材料物理化学性质。
进一步地,在将所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据存储在文档集之前,还包括对所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据的类型进行识别判断的步骤:
当所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据为单值数据时,将所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据以数值的形式存储在所述文档集中;
或,当所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据为多值数据时,将所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据以数值组的形式存储在所述文档集中;
或,当所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据为文件数据时,将所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据的文件路径存储在所述文档集中;
或,当所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据为复杂数据时,将所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据以内嵌文档的形式存储在所述文档集中。
需要说明的是,复杂数据指的是多维数据,该数据在某个维度下有数据结构,或某个维度下有数据类型、长度的动态变化。
其中,以文档集形式存储的所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据均为大量数据。
采用上述进一步方案的有益效果是:通过将晶体结构数据和物化性质数据分类存储,能够使材料数据更易被检索和查询,更易于数据的可视化,并以更好的方式呈现给用户,同时方便对材料计算数据进行统计和分析。
本发明解决上述技术问题的另一种技术方案如下:
自动采集和加工一种高通量材料计算数据自动采集和加工系统,包括:
判断模块,用于判断所述分析过程中数据来源,当所述数据来源为来自单个所述计算过程时,调用第一分类模块,当所述数据来源为来自多个所述计算过程时,调用第二分类模块;
第一分类模块,用于从所述第一性原理计算结果中提取得到材料的基本物化性质数据,并对所述基本物化性质数据进行分类和处理;
第二分类模块,用于汇集多个所述计算过程得到的第一性原理计算结果,调用预存的程序汇集进行分析和处理,得到更多材料物理化学性质。
进一步地,所述第一分类模块具体包括:
第一判断单元,用于从所述第一性原理计算结果中提取得到材料基本物化性质数据,将所述材料基本物化性质数据作为第一类物化性质数据实时保存,并判断所述材料基本物化性质数据是否能被进一步计算推导,如果能,则调用第一计算单元;
第一计算单元,用于从预设的物化性质算法中选择与待推导物理化学性质对应的物化性质算法,对所述物化性质数据进行计算推导,得到第二类物化性质数据;
所述第二分类模块具体包括:
收集处理单元,用于汇集多个所述计算过程得到的第一性原理计算结果,并调用预存的程序进行分析和处理,得到材料的基本物化性质数据;
第二判断单元,用于将所述材料的基本物化性质数据作为第三类物化性质数据实时保存,并判断所述基本物化性质数据是否能被进一步计算推导,如果能,则调用第二计算单元;
第二计算单元,用于从预设的物化性质算法库中选择与待推导物理化学性质对应物化性质算法,对所述物化性质数据进行计算推导,得到第四类物化性质数据。
进一步地,所述处理模块还用于:获取用户直接输入的第一性原理计算结果;
所述判断模块还用于:对所述第一性原理计算结果进行解析,判断数据来源,当所述数据来源为来自单个所述计算过程时,调用第一分类模块,当所述数据来源为来自多个所述计算过程时,调用第二分类模块。
进一步地,所述自动采集和加工系统还包括:
数据库,用于当计算结束后,通过无模式存储的方法,以文档集形式存储所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据和所述第四类物化性质数据,分别将所述晶体结构数据存储在结构数据文档集中,将所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据和所述第四类物化性质数据存储在计算数据文档集中;
分析模块,用于分别对所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据和所述第四类物化性质数据进行统计分析,得到分析结果并输出。
进一步地,所述数据库具体包括:
识别判断单元,用于对所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据的类型进行识别判断;
分类存入单元,用于当所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据为单值数据时,将所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据以数值的形式存储在所述文档集中;
或,当所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据为多值数据时,将所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据以数值组的形式存储在所述文档集中;
或,当所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据为文件数据时,将所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据的文件路径存储在所述文档集中;
或,当所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据为复杂数据时,将所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据以内嵌文档的形式存储在所述文档集中。
本发明附加的方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明实践了解到。
附图说明
图1为本发明实施例提供的一种高通量材料计算数据自动采集和加工方法的流程示意图;
图2为本发明另一实施例提供的一种计算石墨烯材料介电常数并自动采集和加工计算数据的方法流程图;
图3为本发明另一实施例提供的一种计算金属钇热力学性质并自动采集和加工计算数据的方法流程图;
图4为金属钇的摩尔吉布斯自由能G与SGTE标准纯物质热力学数据库中计算结果的比较图;
图5为本发明另一实施例提供的一种高通量材料计算数据自动采集和加工系统的结构框架图;
图6为本发明另一实施例提供的一种数据来源为单个计算过程时的计算流程示意图;
图7为本发明另一实施例提供的一种数据来源为多个计算过程时的计算流程示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,为本发明实施例提供的一种高通量材料计算数据自动采集和加工方法的流程示意图,该方法包括:
S101,构建第一性原理的计算流程,计算流程包括目标材料晶体结构数据的获取过程、第一性原理计算作业提交过程、第一性原理计算数据自动采集过程和第一性原理计算数据的规范化加工过程;
S102,根据计算流程,围绕目标材料的大量晶体结构数据,对每一个晶体结构数据进行第一性原理计算的作业提交;
S103,在第一性原理计算完成后,自动采集计算结果;
S104,在获取第一性原理计算结果后,判断第一性原理计算结果中数据的来源,当数据来源为来自单个计算过程时,执行规范化加工S105,当数据来源为来自多个计算过程时,执行规范化加工S106;
S105,从第一性原理计算结果中提取得到材料的基本物化性质数据,并进一步分析和规范化加工,得到更多的材料基本物化性质数据;
S106,汇集多个计算过程得到的第一性原理计算结果,调用预存的程序对汇集结果进行分析和处理,得到材料的基本物化性质数据,并进一步分析和规范化加工,得到更多的材料基本物化性质数据。
上述实施例提供的一种高通量材料计算数据自动采集和加工方法,通过计算某材料的物理化学性质所涉及的第一性原理计算的次数进行识别和判断,分别对材料进行第一性原理计算,并分别采集计算结果并处理,实现了对大量第一性原理计算的材料计算数据的高通量自动采集和规范化处理加工,最终得到材料的物理化学性质,并实时自动地存储。本发明能够快速地对大量的不同来源,不同用户的第一性原理计算数据以自动流程方式规范化处理,从而得到材料的物理化学性质,保存并共享,帮助新材料研发。
如图2所示,为本发明另一实施例提供的一种计算石墨烯材料介电常数并自动采集和加工计算数据的方法流程图,通过高通量集成计算平台系统计算石墨烯材料的介电常数,包括以下步骤:
S201,用户选取预先设计好的计算介电常数的流程,其中,计算流程依次包括结构优化、基态能量计算和介电常数计算。
S202,获取石墨烯材料的晶体结构数据,对石墨烯材料开展介电常数计算。石墨烯材料的结构为2个碳原子的密排六方结构。
S203,判断得知该计算过程中,没有数据的汇集处理,即对于数据的分析过程来说,其数据来源是单一的,是依次经过了结构优化、基态能量计算和介电常数计算这三个过程,而不是分别来自于两个计算过程的。
S204,用户分别设置结构优化、基态能量计算和介电常数计算的计算参数,并开始计算。
S205,上述三个第一原理基元计算结束后,得到计算结果文件。
S206,提取计算结果文件中的介电常数。介电常数以多维数组的方式呈现(包括xx,yy,zz,xy,yz,zx方向),系统抽取石墨烯的晶体结构数据和介电函数在各个方向(包括xx,yy,zz,xy,yz,zx方向)的分量数据,将这些数据存入数据库中。其中,晶体结构数据以多值数据的形式,存入到数据库的结构文档集中,介电常数通过其6个介电函数分量呈现,以多维数组的形式存入到计算数据文档集中。
S207,判断介电常数是否可以进一步计算推导得到其他的物化性质数据。由于通过介电常数还可计算光学性质数据,包括折射率、能量损失谱、消光系数、吸收系数、反射率和光电导率等,所以判断结果为是,执行S208。
S208,系统调用预存在物化性质数据推导算法库中的相关算法,根据介电常数和相关算法,推导计算出石墨烯材料的折射率、能量损失谱、消光系数、吸收系数、反射率和光电导率。
S209,系统将这些推导得到的光学性质按其相应的形式存入材料数据库的计算数据文档集中。例如,折射率为单值数据,就将折射率以单值数据的形式存入到计算数据文档集中。
S210,对基元计算的直接结果(介电常数)进行评估。联网查找介电常数的相关参考文献,根据参考文献中的数据来进行可靠性评估。例如,分别求解6组数据的均方误差,将均方误差的大小与参考文献中的数据进行比对,判断介电常数计算的可靠性。其中,对于参考文献中数据的提取,可以通过软件程序实现,也可以通过人工提取,也可以根据实验数据中获得实验数据对介电常数的可靠性进行评估。
S211,对推导得到的物化性质(光学性质)进行评估。对于推导得到的光学性质,首先使用参考文献数据或实验数据通过均方误差来评估,如果没有相关光学性质文献数据或实验数据,再基于介电常数的可靠性对光学性质进行可靠性评估。
如图3所示,为本发明另一实施例提供的一种计算金属钇热力学性质并自动采集和加工计算数据的方法流程图,通过高通量集成计算平台系统设计声子谱计算流程,开展声子谱自动流程计算,自动采集得到声子谱数据、声子态密度数据以及含温度效应的热力学性质数据,具体包括以下步骤:
S301,构建第一性原理的计算流程,获取用户上传的金属钇的初始晶体结构。
S302,选择结构优化第一性原理基元计算,对初始晶体结构开展晶胞弛豫计算,获得最优的晶体结构。
S303,选择基态能量计算第一性原理基元计算,对优化后的晶体结构开展能量计算,得到基态能量计算结果。
S304,直接从基态能量计算结果中抽取基态总能E0,调用物化性质计算工具箱,计算电子热激发对热力学性质的贡献Fel
S305,调用建模工具箱,改变金属钇的晶胞体积,包括2个正应变体积、2个负应变体积和1个原始体积,共计生成5个变形结构。
S306,选择基态能量计算第一性原理基元计算,分别对5个变形后的晶体结构开展基态能量计算,得到5个变形后的晶体结构计算结果。本步骤中,基态能量计算共产生5个计算任务。
S307,分别5个变形后的晶体结构计算结果中直接抽取基态总能和原子作用力,并进行汇总。
S308,调用建模工具箱,根据汇总的5个计算结果中抽取得到的基态总能和原子作用力,产生10个改变原子位置的扰动结构。
S309,选择基态计算第一性原理基元计算,对10个扰动结构开展能量计算,得到10个扰动结构的计算结果。本步骤中,基态能量计算共产生10个计算任务。
S310,分别从10个扰动结构的计算结果中直接抽取基态总能和原子作用力,并进行汇总。
S311,调用物化性质计算工具箱,根据从10个扰动结构的计算结果中抽取得到的基态总能和原子作用力,计算晶格振动对热力学性质的贡献Fph、声子谱和声子态密度。
S312,汇总步骤S304中的E0、Fel,以及步骤S311中的Fph,调用物化性质计算工具箱,计算金属钇的热力学性质数据,包括:G、H、S和Cp等,其种,G为吉布斯自由能,H为焓,S为熵,Cp为定压比热容。
S313,将声子谱数据和声子态密度数据、热力学数据数据自动写入数据库中进行存储。
S314,对热力学性质数据进行统计和分析。将金属钇的摩尔吉布斯自由能G与SGTE标准纯物质热力学数据库的计算结果进行比较,结果见图4,由图4可知,金属钇的摩尔吉布斯自由能GCalc与SGTE数据库中的数据吻合度高,说明计算结果可靠。
S315,对统计误差进行分析。例如,可以采用以下公式:
其中,GCalc为基于步骤S312得到的第一性原理计算后抽取的热力学性质数据,GSGTE为SGTE标准热力学性质数据,n为用于对比分析的SGTE数据数量。本实施例中计算数据与SGTE数据的均方误差值为0.0005742,误差在允许范围内,说明计算结果可靠。
S316,输出金属钇的热力学性质和分析结果。例如,可以将金属钇的热力学性质和分析结果通过无线通信的方式发送到预先设置的手机等终端上。
如图5所示,为本发明另一实施例提供的一种高通量材料计算数据自动采集和加工系统的结构框架图,该系统包括:
判断模块530,用于判断分析过程中数据来源,当数据来源为来自单个计算过程时,调用第一分类模块530,当数据来源为来自多个计算过程时,调用第二分类模块540;
第一分类模块540,用于从第一性原理计算结果中提取得到材料的基本物化性质数据,并对基本物化性质数据进行分类和处理;
第二分类模块550,用于汇集多个计算过程得到的第一性原理计算结果,调用预存的程序汇集进行分析和处理,得到更多材料物理化学性质,从第二计算结果中提取得到第二物化性质数据,并对物化性质数据进行分类和处理。
进一步地,第一分类模块540具体包括:
第一判断单元541,用于从第一性原理计算结果中提取得到材料基本物化性质数据,将材料基本物化性质数据作为第一类物化性质数据实时保存,并判断材料基本物化性质数据是否能被进一步计算推导,如果能,则调用第一计算单元542;
第一计算单元542,用于从预设的物化性质算法中选择与待推导物理化学性质对应的物化性质算法,对物化性质数据进行计算推导,得到第二类物化性质数据;
第二分类模块550具体包括:
收集处理单元551,用于汇集多个计算过程得到的第一性原理计算结果,并调用预存的程序进行分析和处理,得到材料的基本物化性质数据;
第二判断单元552,用于将材料的基本物化性质数据作为第三类物化性质数据实时保存,并判断基本物化性质数据是否能被进一步计算推导,如果能,则调用第二计算单元553;
第二计算单元553,用于从预设的物化性质算法库中选择与待推导物理化学性质对应物化性质算法,对物化性质数据进行计算推导,得到第四类物化性质数据。
进一步地,处理模块520还用于:获取用户直接输入的第一性原理计算结果;
判断模块530还用于:对第一性原理计算结果进行解析,判断数据来源,当数据来源为来自单个计算过程时,调用第一分类模块540,当数据来源为来自多个计算过程时,调用第二分类模块550。
进一步地,自动采集和加工系统还包括:
数据库560,用于当计算结束后,通过无模式存储的方法,以文档集形式存储晶体结构数据、第一类物化性质数据、第二类物化性质数据、第三类物化性质数据和第四类物化性质数据,分别将晶体结构数据存储在结构数据文档集中,将第一类物化性质数据、第二类物化性质数据、第三类物化性质数据和第四类物化性质数据存储在计算数据文档集中;
分析模块570,用于分别对第一类物化性质数据、第二类物化性质数据、第三类物化性质数据和第四类物化性质数据进行统计分析,得到分析结果并输出。
进一步地,数据库560具体包括:
识别判断单元561,用于对晶体结构数据、第一类物化性质数据、第二类物化性质数据、第三类物化性质数据或第四类物化性质数据的类型进行识别判断;
分类存入单元562,用于当晶体结构数据、第一类物化性质数据、第二类物化性质数据、第三类物化性质数据或第四类物化性质数据为单值数据时,将晶体结构数据、第一类物化性质数据、第二类物化性质数据、第三类物化性质数据或第四类物化性质数据以数值的形式存储在文档集中;
或,当晶体结构数据、第一类物化性质数据、第二类物化性质数据、第三类物化性质数据或第四类物化性质数据为多值数据时,将晶体结构数据、第一类物化性质数据、第二类物化性质数据、第三类物化性质数据或第四类物化性质数据以数值组的形式存储在文档集中;
或,当晶体结构数据、第一类物化性质数据、第二类物化性质数据、第三类物化性质数据或第四类物化性质数据为文件数据时,将晶体结构数据、第一类物化性质数据、第二类物化性质数据、第三类物化性质数据或第四类物化性质数据的文件路径存储在文档集中;
或,当晶体结构数据、第一类物化性质数据、第二类物化性质数据、第三类物化性质数据或第四类物化性质数据为复杂数据时,将晶体结构数据、第一类物化性质数据、第二类物化性质数据、第三类物化性质数据或第四类物化性质数据以内嵌文档的形式存储在文档集中。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在另一实施例中,如图6所示,给出一种数据来源为单个计算过程时的计算流程示意图,图中,分析过程605处理的数据都来源于计算过程604。
如图7所示,给出一种数据来源为多个计算过程时的计算流程示意图,分析过程705处理的数据分别来源于计算过程703和计算过程704,也就是说,在分析过程705中,有一个对来自计算过程703和计算过程704汇集的处理过程。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或连接可以是通过一些接口、装置或单元的间接耦合或连接,或其它的形式耦合或连接。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种高通量材料计算数据自动采集和加工方法,以快速获取目标材料物理化学性质并自动存储,其特征在于,包括以下步骤:
步骤1,构建第一性原理的计算流程,所述计算流程包括目标材料晶体结构数据的获取过程、第一性原理计算作业提交过程、第一性原理计算数据自动采集过程和第一性原理计算数据的规范化加工过程;
步骤2,根据所述计算流程,围绕目标材料的大量晶体结构数据,对每一个所述晶体结构数据进行第一性原理计算的作业提交,在获取第一性原理计算结果后,判断第一性原理计算结果中数据的来源,当所述数据来源为来自单个所述计算过程时,执行规范化加工步骤3,当所述数据来源为来自多个所述计算过程时,执行规范化加工步骤4;
步骤3,从所述第一性原理计算结果中提取得到材料的基本物化性质数据,并进一步分析和规范化加工,得到更多的材料基本物化性质数据;
步骤4,汇集多个所述计算过程得到的第一性原理计算结果,调用预存的程序对汇集结果进行分析和处理,得到材料的基本物化性质数据,并进一步分析和规范化加工,得到更多的材料基本物化性质数据。
2.根据权利要求1所述的自动采集和加工方法,其特征在于,步骤3具体包括:
步骤3.1,从所述第一性原理计算结果中提取得到材料基本物化性质数据,将所述材料基本物化性质数据作为第一类物化性质数据实时保存,并判断所述材料基本物化性质数据是否能被进一步计算推导得到更多物化性质,如果能,则执行步骤3.2;
步骤3.2,从预设的物化性质算法库中选择与待推导物化性质相匹配的算法,对所述物化性质进行计算推导,得到第二类物化性质数据;
步骤4具体包括:
步骤4.1,汇集多个所述计算过程得到的第一性原理计算结果,并调用预存的程序进行分析和处理,得到材料的基本物化性质数据,作为第三类物化性质数据实时保存;
步骤4.2,判断所述基本物化性质数据是否能被进一步计算推导得到更多物化性质,如果能,则执行步骤4.3;
步骤4.3,从预设的物化性质算法库中选择与待推导物化性质相匹配的物化性质算法,对所述物化性质进行计算推导,得到第四类物化性质数据。
3.根据权利要求1所述的自动采集和加工方法,其特征在于,在步骤2中,得到所述第一性原理计算结果的方法还包括:获取用户直接输入的第一性原理计算结果;
当所述第一性原理计算结果为用户直接输入时,还包括:
步骤5,对所述第一性原理计算结果进行解析,判断第一性原理计算结果中数据的来源;
步骤6,当所述数据来源为来自单个所述计算过程时,执行步骤3,当所述数据来源为来自多个所述计算过程时,执行步骤4。
4.根据权利要求1至3任一项所述的自动采集和加工方法,其特征在于,还包括:
步骤7,计算结束后,通过无模式存储的方法,以文档集形式存储所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据和所述第四类物化性质数据,分别将所述晶体结构数据存储在结构数据文档集中,将所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据和所述第四类物化性质数据存储在计算数据文档集中;
步骤8,分别对所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据和所述第四类物化性质数据进行统计分析,得到分析结果并输出,用以帮助材料计算数据的可靠性评估。
5.根据权利要求4所述的自动采集和加工方法,其特征在于,在将所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据存储在文档集之前,还包括对所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据的类型进行识别判断的步骤:
当所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据为单值数据时,将所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据以数值的形式存储在所述文档集中;
或,当所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据为多值数据时,将所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据以数值组的形式存储在所述文档集中;
或,当所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据为文件数据时,将所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据的文件路径存储在所述文档集中;
或,当所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据为复杂数据时,将所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据以内嵌文档的形式存储在所述文档集中。
6.一种高通量材料计算数据自动采集和加工系统,其特征在于,包括:
判断模块,用于判断所述分析过程中数据来源,当所述数据来源为来自单个所述计算过程时,调用第一分类模块,当所述数据来源为来自多个所述计算过程时,调用第二分类模块;
第一分类模块,用于从所述第一性原理计算结果中提取得到材料的基本物化性质数据,并对所述基本物化性质数据进行分类和处理;
第二分类模块,用于汇集多个所述计算过程得到的第一性原理计算结果,调用预存的程序汇集进行分析和处理,得到更多材料物理化学性质。
7.根据权利要求6所述的自动采集和加工系统,其特征在于,所述第一分类模块具体包括:
第一判断单元,用于从所述第一性原理计算结果中提取得到材料基本物化性质数据,将所述材料基本物化性质数据作为第一类物化性质数据实时保存,并判断所述材料基本物化性质数据是否能被进一步计算推导,如果能,则调用第一计算单元;
第一计算单元,用于从预设的物化性质算法中选择与待推导物理化学性质对应的物化性质算法,对所述物化性质数据进行计算推导,得到第二类物化性质数据;
所述第二分类模块具体包括:
收集处理单元,用于汇集多个所述计算过程得到的第一性原理计算结果,并调用预存的程序进行分析和处理,得到材料的基本物化性质数据;
第二判断单元,用于将所述材料的基本物化性质数据作为第三类物化性质数据实时保存,并判断所述基本物化性质数据是否能被进一步计算推导,如果能,则调用第二计算单元;
第二计算单元,用于从预设的物化性质算法库中选择与待推导物理化学性质对应物化性质算法,对所述物化性质数据进行计算推导,得到第四类物化性质数据。
8.根据权利要求6所述的自动采集和加工系统,其特征在于,所述处理模块还用于:获取用户直接输入的大量第一性原理计算结果;
所述判断模块还用于:对所述的每一个第一性原理计算结果进行解析,判断数据来源,当所述数据来源为来自单个所述计算过程时,调用第一分类模块,当所述数据来源为来自多个所述计算过程时,调用第二分类模块。
9.根据权利要求6至8任一项所述的自动采集和加工系统,其特征在于,还包括:
数据库,用于当计算结束后,通过无模式存储的方法,以文档集形式存储所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据和所述第四类物化性质数据,分别将所述晶体结构数据存储在结构数据文档集中,将所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据和所述第四类物化性质数据存储在计算数据文档集中;
分析模块,用于分别对所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据和所述第四类物化性质数据进行统计分析,得到分析结果并输出,用以帮助材料计算数据的可靠性评估。
10.根据权利要求9所述的自动采集和加工系统,其特征在于,所述数据库具体包括:
识别判断单元,用于对所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据的类型进行识别判断;
分类存入单元,用于当所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据为单值数据时,将所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据以数值的形式存储在所述文档集中;
或,当所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据为多值数据时,将所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据以数值组的形式存储在所述文档集中;
或,当所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据为文件数据时,将所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据的文件路径存储在所述文档集中;
或,当所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据为复杂数据时,将所述晶体结构数据、所述第一类物化性质数据、所述第二类物化性质数据、所述第三类物化性质数据或所述第四类物化性质数据以内嵌文档的形式存储在所述文档集中。
CN201710399012.XA 2017-05-31 2017-05-31 一种高通量材料计算数据自动采集和加工方法及系统 Pending CN107273670A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710399012.XA CN107273670A (zh) 2017-05-31 2017-05-31 一种高通量材料计算数据自动采集和加工方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710399012.XA CN107273670A (zh) 2017-05-31 2017-05-31 一种高通量材料计算数据自动采集和加工方法及系统

Publications (1)

Publication Number Publication Date
CN107273670A true CN107273670A (zh) 2017-10-20

Family

ID=60065361

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710399012.XA Pending CN107273670A (zh) 2017-05-31 2017-05-31 一种高通量材料计算数据自动采集和加工方法及系统

Country Status (1)

Country Link
CN (1) CN107273670A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109545285A (zh) * 2018-11-13 2019-03-29 中国核动力研究设计院 一种核反应堆数字实验平台的知识使用方法
CN109543211A (zh) * 2018-09-30 2019-03-29 兰州空间技术物理研究所 单层石墨烯本征缺陷下的电导率计算方法
CN110176280A (zh) * 2019-05-10 2019-08-27 北京大学深圳研究生院 一种描述材料晶体结构的方法及其应用
CN111599421A (zh) * 2020-05-11 2020-08-28 北京迈高材云科技有限公司 基于高通量材料计算的全自动声子谱计算方法及其系统
CN112102887A (zh) * 2020-09-02 2020-12-18 北京航空航天大学 多尺度集成可视化的高通量自动计算流程及数据智能系统
CN114678087A (zh) * 2022-03-09 2022-06-28 南京邮电大学 一种高通量材料计算数据自动采集和加工方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070208436A1 (en) * 2002-01-15 2007-09-06 Millennium Inorganic Chemicals Integrated, multi-step computer implemented system and method for measuring and improving manufacturing processes and maximizing product research and development speed and efficiency using high-throughput screening and governing semi-empirical model
CN105975727A (zh) * 2016-05-30 2016-09-28 成都云材智慧数据科技有限公司 材料数据的处理、生成、应用方法及终端、云处理平台
CN106126928A (zh) * 2016-06-24 2016-11-16 西安交通大学 获得固态及液态氟盐热中子散射数据库的方法及数据库
CN106372329A (zh) * 2016-08-31 2017-02-01 中国科学院计算机网络信息中心 材料基因工程高通量集成计算与数据管理的方法及系统
CN106447229A (zh) * 2016-10-31 2017-02-22 电子科技大学 一种材料信息学中的材料数据管理系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070208436A1 (en) * 2002-01-15 2007-09-06 Millennium Inorganic Chemicals Integrated, multi-step computer implemented system and method for measuring and improving manufacturing processes and maximizing product research and development speed and efficiency using high-throughput screening and governing semi-empirical model
CN105975727A (zh) * 2016-05-30 2016-09-28 成都云材智慧数据科技有限公司 材料数据的处理、生成、应用方法及终端、云处理平台
CN106126928A (zh) * 2016-06-24 2016-11-16 西安交通大学 获得固态及液态氟盐热中子散射数据库的方法及数据库
CN106372329A (zh) * 2016-08-31 2017-02-01 中国科学院计算机网络信息中心 材料基因工程高通量集成计算与数据管理的方法及系统
CN106447229A (zh) * 2016-10-31 2017-02-22 电子科技大学 一种材料信息学中的材料数据管理系统及方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
L. SHEN ET AL: "First-principles study on new media/memory materials and design concept for nonvolatile data storage", 《2012 DIGEST APMRC》 *
林欣悦等: "金属Li相稳定性的第一性原理研究", 《原子与分子物理学报》 *
王娟等: "SQS二元合金设计的高通量方法和技术研究", 《计算机工程与科学》 *
王幸阳等: "一种计算材料数据库系统", 《科研信息化技术与应用》 *
肖建茂等: "基于材料基因工程的锂离子电池材料数据生成及数据挖掘平台", 《江西师范大学学报( 自然科学版)》 *
范晓丽: "材料基因组计划与第一性原理高通量计算", 《中国材料进展》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543211A (zh) * 2018-09-30 2019-03-29 兰州空间技术物理研究所 单层石墨烯本征缺陷下的电导率计算方法
CN109543211B (zh) * 2018-09-30 2023-02-17 兰州空间技术物理研究所 单层石墨烯本征缺陷下的电导率计算方法
CN109545285A (zh) * 2018-11-13 2019-03-29 中国核动力研究设计院 一种核反应堆数字实验平台的知识使用方法
CN110176280A (zh) * 2019-05-10 2019-08-27 北京大学深圳研究生院 一种描述材料晶体结构的方法及其应用
WO2020228140A1 (zh) * 2019-05-10 2020-11-19 北京大学深圳研究生院 一种描述材料晶体结构的方法及其应用
CN111599421A (zh) * 2020-05-11 2020-08-28 北京迈高材云科技有限公司 基于高通量材料计算的全自动声子谱计算方法及其系统
CN112102887A (zh) * 2020-09-02 2020-12-18 北京航空航天大学 多尺度集成可视化的高通量自动计算流程及数据智能系统
CN112102887B (zh) * 2020-09-02 2023-02-24 北京航空航天大学 多尺度集成可视化的高通量自动计算流程及数据智能系统
CN114678087A (zh) * 2022-03-09 2022-06-28 南京邮电大学 一种高通量材料计算数据自动采集和加工方法及系统

Similar Documents

Publication Publication Date Title
CN107273670A (zh) 一种高通量材料计算数据自动采集和加工方法及系统
Malek et al. Dynamics of Lennard-Jones clusters: A characterization of the activation-relaxation technique
CN103235825B (zh) 一种基于Hadoop云计算框架的海量人脸识别搜索引擎设计方法
Xiong et al. K-means clustering versus validation measures: a data distribution perspective
JP4780554B2 (ja) 新規材料の構成物質情報探索方法、及び新規材料の構成物質情報探索システム
Poulin et al. Markov entropy decomposition: a variational dual for quantum belief propagation
CN104063507B (zh) 一种图计算方法及系统
CN104462184B (zh) 一种基于双向抽样组合的大规模数据异常识别方法
CN106372329A (zh) 材料基因工程高通量集成计算与数据管理的方法及系统
CN106372122B (zh) 一种基于维基语义匹配的文档分类方法及系统
Abe et al. Complex networks emerging from fluctuating random graphs: analytic formula for the hidden variable distribution
CN106528608A (zh) 一种云架构下的电网gis数据冷热存储方法和系统
Beltran-Villegas et al. Colloidal cluster crystallization dynamics
CN110389932A (zh) 电力文件自动分类方法及装置
CN110826181A (zh) 一种相变材料的性能获取方法、终端设备和计算机可读介质
Liu et al. Surrogate-assisted environmental selection for fast hypervolume-based many-objective optimization
Li Taming Dyson-Schwinger equations with null states
CN108416395A (zh) 一种基于属性简约的交互式决策树构建方法
Dogan et al. Real-space solution to the electronic structure problem for nearly a million electrons
CN114519073A (zh) 一种基于图谱关系挖掘的产品配置推荐方法及系统
CN101599077A (zh) 一种三维对象检索的方法
CN109086381A (zh) 模糊概念格的一种更新生成方法
CN101794443A (zh) 基于线性最小二乘支持向量机的高光谱图像端元选择方法
Al_Zyadat et al. Securitizing big data characteristics used tall array and mapreduce
Dong et al. Perturbative critical behavior from spacetime dependent couplings

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171020

RJ01 Rejection of invention patent application after publication