CN107871056B - 一种高斯软件输出文件自动化数据分析方法及装置 - Google Patents
一种高斯软件输出文件自动化数据分析方法及装置 Download PDFInfo
- Publication number
- CN107871056B CN107871056B CN201711049654.3A CN201711049654A CN107871056B CN 107871056 B CN107871056 B CN 107871056B CN 201711049654 A CN201711049654 A CN 201711049654A CN 107871056 B CN107871056 B CN 107871056B
- Authority
- CN
- China
- Prior art keywords
- data
- requirements
- read
- meets
- output file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000007405 data analysis Methods 0.000 title claims description 20
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 7
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 6
- 230000009471 action Effects 0.000 claims description 5
- 238000013500 data storage Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims description 3
- 230000001351 cycling effect Effects 0.000 claims 1
- 238000004364 calculation method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 2
- 230000005610 quantum mechanics Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/90—Programming languages; Computing architectures; Database systems; Data warehousing
Landscapes
- Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Stored Programmes (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开高斯软件输出文件自动化数据分析方法及装置,包括:读取高斯软件输出文件;查找循环标识;读取第一个循环标识与第二个循环标识之间的数据;根据作业类型分析本次读取数据是否符合要求;若符合要求则存储所读取的符合要求的数据;继续查找第三个循环标识;读取第二个循环标识与第三个循环标识之间的数据;根据作业类型分析本次读取数据是否符合要求;若符合要求则判断该次读取的符合要求的数据是否优于所存储的符合要求的数据,若是则将本次读取的符合要求的数据替换所存储的符合要求的数据进行存储;若否则舍弃本次读取的符合要求的数据;之后继续查找第四个循环标识,以此循环,直至读取完全部数据。本发明减少工作量,提高工作效率。
Description
技术领域
本发明涉及高斯文件输出文件处理领域,具体涉及一种高斯软件输出文件自动化数据分析方法及装置。
背景技术
高斯(Gaussian)软件是目前计算化学领域内最流行、应用范围最广的综合性量子化学计算程序包。高斯软件基于量子力学而开发,它致力于把量子力学理论应用于实际问题,它可以通过一些基本命令验证和预测目标体系几乎所有的性质。其可执行程序可在不同型号的大型计算机,超级计算机,工作站和个人计算机上运行,并相应有不同的版本。此外,可视化软件GaussView的发布及计算机的快速发展更是大大降低了理论计算的门槛,使得各领域研究者能够轻松使用Gaussian研究和分析各种科学问题。
目前高斯输出文件分析工具只有高斯官方推出的Gaussview,该软件的功能主要是图形化的方式来显示分子优化后的构象,以及一些相关的作图功能。在可视化的查看分子构象方面该软件功能强大,但是在分析数据上面还有些欠缺,使用该软件虽然可以获取常用的各种数据,但是需要很多步骤,所需要的时间也比较长,在面对大量输出文件需要分析处理时,继续采用Gaussview的方式将变得不现实。
发明内容
为解决上述问题,本发明提供一种自动化分析高斯软件输出文件数据的方法及装置。
本发明的技术方案是:一种高斯软件输出文件自动化数据分析方法,包括以下步骤:
读取高斯软件输出文件;
查找循环标识;
读取第一个循环标识与第二个循环标识之间的数据;
根据作业类型分析本次读取数据是否符合要求;
若符合要求,则存储所读取的符合要求的数据;
分析完第一个循环标识与第二循环标识之间的数据后,继续查找第三个循环标识;
读取第二个循环标识与第三个循环标识之间的数据;
根据作业类型分析本次读取数据是否符合要求;
若符合要求,则判断该次读取的符合要求的数据是否优于所存储的符合要求的数据,若是,则将本次读取的符合要求的数据替换所存储的符合要求的数据进行存储;若否,则舍弃本次读取的符合要求的数据;
之后继续查找第四个循环标识,以此循环,直至读取完全部数据。
进一步地,所读取的高斯软件输出文件是高斯软件对甲烷分子进行优化后的输出文件。
进一步地,所查找循环标识为Standard orientation。
进一步地,作业类型为过渡态搜索任务。
进一步地,所读取数据为分子振动频率;读取数据是否符合要求的条件是分子振动频率是否为负值且唯一。
进一步地,作用类型为构象优化任务。
进一步地,所读取数据为分析坐标偏移;读取数据是否符合要求的条件是分子坐标偏移是否收敛。
本发明的技术方案还包括基于上述高斯软件输出文件自动化数据分析方法的数据分析装置,包括:
读取文件单元:用于读取高斯软件输出文件;
查找循环标识单元:用于查找循环标识;
读取数据单元:用于读取两个循环标识之间的数据;
数据分析单元:用于分析所读取数据是否符合要求;
存储单元:用于存储所读取的符合要求的数据;
数据判断单元:用于判断所的读取的符合要求的数据是否优于所存储的符合要求的数据。
本发明提供的高斯软件输出文件自动化数据分析方法及装置,根据用户的需求筛选所需的信息,并进一步进行数据分析处理,为客户减少不必要的工作量,提高工作效率。
具体实施方式
下面通过具体实施例对本发明进行详细阐述,以下实施例是对本发明的解释,而本发明并不局限于以下实施方式。
实施例一:
通常情况下高斯的输出文件一般在几十MB甚至上百MB,其中大部分的信息是高斯计算过程中的函数迭代产生的中间数据,对于大多数的科研人员并没有太多的意义,所以科研人员如果需要提取某些数据则需要通过人工的方式在输出文件查询,一个输出文件中又包含很多信息,这些信息散布在整个输出文件中,将这些数据全都找出将消耗非常多的时间。
因此本实施例通过以下方法实现高斯软件输出文件自动化数据分析,可以将所需要的数据瞬间一次性的提取出来,极大地缩短用户在寻找数据方面所花的时间,从而大大提高了效率。
高斯软件的一个正常计算会有成百上千个循环,针对该情况本实施例具体设计以下方法步骤:
读取高斯软件输出文件;
查找循环标识;
读取第一个循环标识与第二个循环标识之间的数据;
根据作业类型分析本次读取数据是否符合要求;
若符合要求,则存储所读取的符合要求的数据;
分析完第一个循环标识与第二循环标识之间的数据后,继续查找第三个循环标识;
读取第二个循环标识与第三个循环标识之间的数据;
根据作业类型分析本次读取数据是否符合要求;
若符合要求,则判断该次读取的符合要求的数据是否优于所存储的符合要求的数据,若是,则将本次读取的符合要求的数据替换所存储的符合要求的数据进行存储;若否,则舍弃本次读取的符合要求的数据;
之后继续查找第四个循环标识,以此循环,直至读取完全部数据。
本实施例以甲烷为例,即上述所读取的高斯软件输出文件是高斯软件对甲烷分子进行优化后的输出文件。
则所查找的循环标识为Standard orientation,以此为标识,读取其之后且下一个Standard orientation之前的数据。
若作用类型为过渡态搜索任务,则所读取数据为分子振动频率;读取数据是否符合要求的条件是分子振动频率是否为负值且唯一。
若作用类型为构象优化任务,则所读取数据为分析坐标偏移;读取数据是否符合要求的条件是分子坐标偏移是否收敛。
本实施例通过以上方法循环读取数据,检查出最优的符合要求的数据,实现自动轻松地将需要的信息提取出来。
实施例二:
在以上实施例基础上,本发明的自动化数据分析方法由一数据分析装置实现,该数据分析装置包括:
读取文件单元:用于读取高斯软件输出文件;
查找循环标识单元:用于查找循环标识;
读取数据单元:用于读取两个循环标识之间的数据;
数据分析单元:用于分析所读取数据是否符合要求;
存储单元:用于存储所读取的符合要求的数据;
数据判断单元:用于判断所的读取的符合要求的数据是否优于所存储的符合要求的数据。
本发明的高斯软件输出文件自动化数据分析方法及装置,简化高斯输入文件的分析流程,加快数据分析速度,弥补现有工具的不足,帮助科研人员以最少的时间完成相关的数据分析工作。
以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。
Claims (2)
1.一种高斯软件输出文件自动化数据分析方法,其特征在于,包括以下步骤:
读取高斯软件输出文件;
查找循环标识;
读取第一个循环标识与第二个循环标识之间的数据;
根据作业类型分析本次读取数据是否符合要求;
若符合要求,则存储所读取的符合要求的数据;
分析完第一个循环标识与第二循环标识之间的数据后,继续查找第三个循环标识;
读取第二个循环标识与第三个循环标识之间的数据;
根据作业类型分析本次读取数据是否符合要求;
若符合要求,则判断该次读取的符合要求的数据是否优于所存储的符合要求的数据,若是,则将本次读取的符合要求的数据替换所存储的符合要求的数据进行存储;若否,则舍弃本次读取的符合要求的数据;
之后继续查找第四个循环标识,以此循环,直至读取完全部数据;
所读取的高斯软件输出文件是高斯软件对甲烷分子进行优化后的输出文件;
所查找循环标识为Standard orientation;
作业类型为过渡态搜索任务时,所读取数据为分子振动频率;读取数据是否符合要求的条件是分子振动频率是否为负值且唯一;
作用类型为构象优化任务时,所读取数据为分析坐标偏移;读取数据是否符合要求的条件是分子坐标偏移是否收敛。
2.一种基于权利要求1所述高斯软件输出文件自动化数据分析方法的数据分析装置,其特征在于,包括:
读取文件单元:用于读取高斯软件输出文件;所读取的高斯软件输出文件是高斯软件对甲烷分子进行优化后的输出文件;
查找循环标识单元:用于查找循环标识;所查找循环标识为Standard orientation;
读取数据单元:用于读取两个循环标识之间的数据;
数据分析单元:用于分析所读取数据是否符合要求;
存储单元:用于存储所读取的符合要求的数据;
数据判断单元:用于根据作业类型判断所的读取的符合要求的数据是否优于所存储的符合要求的数据;若符合要求,则判断该次读取的符合要求的数据是否优于所存储的符合要求的数据,若是,则将本次读取的符合要求的数据替换所存储的符合要求的数据进行存储;若否,则舍弃本次读取的符合要求的数据;
作业类型为过渡态搜索任务时,所读取数据为分子振动频率;读取数据是否符合要求的条件是分子振动频率是否为负值且唯一;
作用类型为构象优化任务时,所读取数据为分析坐标偏移;读取数据是否符合要求的条件是分子坐标偏移是否收敛。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711049654.3A CN107871056B (zh) | 2017-10-31 | 2017-10-31 | 一种高斯软件输出文件自动化数据分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711049654.3A CN107871056B (zh) | 2017-10-31 | 2017-10-31 | 一种高斯软件输出文件自动化数据分析方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107871056A CN107871056A (zh) | 2018-04-03 |
CN107871056B true CN107871056B (zh) | 2020-11-27 |
Family
ID=61756729
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711049654.3A Active CN107871056B (zh) | 2017-10-31 | 2017-10-31 | 一种高斯软件输出文件自动化数据分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107871056B (zh) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101504679B (zh) * | 2009-03-19 | 2010-07-21 | 西安近代化学研究所 | 一种含能化合物的计算机辅助设计系统 |
CN106372329B (zh) * | 2016-08-31 | 2019-10-11 | 中国科学院计算机网络信息中心 | 材料基因工程高通量集成计算与数据管理的方法及系统 |
-
2017
- 2017-10-31 CN CN201711049654.3A patent/CN107871056B/zh active Active
Non-Patent Citations (2)
Title |
---|
肟和环戊二烯杂Diel-Alder反应的理论计算;徐文媛 等;《吉首大学学报(自然科学版)》;20120331;第33卷(第2期);第89-92页 * |
轴不对称支撑的手性N-O酰胺化合物催化亚胺硅氢化反应的过渡态研究;潘威 等;《高等学校化学学报》;20150228;第36卷(第2期);第325-329页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107871056A (zh) | 2018-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106295250B (zh) | 二代测序短序列快速比对分析方法及装置 | |
Liao et al. | Gunther: Search-based auto-tuning of mapreduce | |
Yang et al. | MapReduce workload modeling with statistical approach | |
CN111400724B (zh) | 基于代码相似性分析的操作系统脆弱性检测方法、系统及介质 | |
US8522216B2 (en) | Memory leak detection | |
US20130145350A1 (en) | Efficient, large scale trace storage system | |
Nguyen et al. | Towards automatic tuning of apache spark configuration | |
CN111813845B (zh) | 基于etl任务的增量数据抽取方法、装置、设备及介质 | |
CN106326122A (zh) | 一种软件单元测试用例管理系统 | |
CN108694221B (zh) | 数据实时分析方法、模块、设备和装置 | |
CN110377519B (zh) | 大数据系统的性能容量测试方法、装置、设备及存储介质 | |
CN113656183B (zh) | 任务处理方法、装置、设备及存储介质 | |
Nguyen et al. | Understanding the influence of configuration settings: An execution model-driven framework for apache spark platform | |
Anwar et al. | On the use of microservers in supporting hadoop applications | |
CN102708029B (zh) | 性能瓶颈诊断方法和设备 | |
KR20160117691A (ko) | 스토리지 시스템 및 그것의 동작 방법 | |
Yang et al. | Redis automatic performance tuning based on eBPF | |
CN107871056B (zh) | 一种高斯软件输出文件自动化数据分析方法及装置 | |
US20120124428A1 (en) | Method and system for testing software on programmable devices | |
CN116401113B (zh) | 一种异构众核架构加速卡的环境验证方法、装置及介质 | |
Kim et al. | Performance evaluation and tuning for MapReduce computing in Hadoop distributed file system | |
Ouyang et al. | An approach for modeling and ranking node-level stragglers in cloud datacenters | |
WO2018205391A1 (zh) | 信息检索准确性评估方法、系统、装置及计算机可读存储介质 | |
Copos et al. | Inputfinder: Reverse engineering closed binaries using hardware performance counters | |
CN110990271A (zh) | 代码性能检测方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20201104 Address after: 215100 No. 1 Guanpu Road, Guoxiang Street, Wuzhong Economic Development Zone, Suzhou City, Jiangsu Province Applicant after: SUZHOU LANGCHAO INTELLIGENT TECHNOLOGY Co.,Ltd. Address before: 450000 Henan province Zheng Dong New District of Zhengzhou City Xinyi Road No. 278 16 floor room 1601 Applicant before: ZHENGZHOU YUNHAI INFORMATION TECHNOLOGY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |