CN109411028A - 基于分子自由度深度学习计算水分子能量的方法 - Google Patents

基于分子自由度深度学习计算水分子能量的方法 Download PDF

Info

Publication number
CN109411028A
CN109411028A CN201811133722.9A CN201811133722A CN109411028A CN 109411028 A CN109411028 A CN 109411028A CN 201811133722 A CN201811133722 A CN 201811133722A CN 109411028 A CN109411028 A CN 109411028A
Authority
CN
China
Prior art keywords
matrix
energy
layer
group
structure parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811133722.9A
Other languages
English (en)
Inventor
崔洪光
周立川
商祎行
周毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University
Original Assignee
Dalian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University filed Critical Dalian University
Priority to CN201811133722.9A priority Critical patent/CN109411028A/zh
Publication of CN109411028A publication Critical patent/CN109411028A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于分子自由度深度学习计算水分子能量的方法,属于分子能量计算技术领域,包括步骤S1:构建水分子数据库;S2:随机选取m个构型和对应能量作为训练组,其余1000‑m个构型和对应能量作为测试组;S3:将训练组水分子空间坐标转化,并作为计算的起始;S4:提取训练组能量数据作为训练组输出能量矩阵,并与列构型参数输入矩阵一一对应S5:构建测试组构型参数输入矩阵和测试组输出能量矩阵;S6:经过双神经层计算得到能量矩阵Ecalc:本发明减小了训练组和测试组的比值对于训练结果准确性的影响。

Description

基于分子自由度深度学习计算水分子能量的方法
技术领域
本发明涉及分子能量计算技术领域,具体涉及一种基于分子自由 度深度学习计算水分子能量的方法。
背景技术
当代人工智能的机器学习,在分子结构优化、最低能量计算领域 中,显著特点是随着初始矩阵自由度的增大,即分子结构越复杂自由 度越大,必须增大训练组与测试组的比值,才能得到准确的结果。受 这一特点的制约,该方法在复杂分子体系或多分子体系应用中,很难 得到满意结果。
发明内容
为解决现有技术中存在的缺陷,本发明提供一种通过深度学习计 算水分子能量的方法,减小了训练组和测试组的比值对于训练结果准 确性的影响。
本发明为解决其技术问题所采用的技术方案是:一种基于分子自 由度深度学习计算水分子能量的方法,包括如下步骤:
S1:构建水分子数据库,所述水分子数据库包含1000个不同构 型水分子的空间坐标和与构型对应的能量;
S2:随机选取m个构型和对应能量作为训练组,其余1000-m 个构型和对应能量作为测试组;
S3:将训练组水分子空间坐标转化为两个氢氧键键长rO-H1,rO-H2、分子键角θ以及三个原子间距离的倒数1/rO-H1,1/rO-H2,1/rH1-H2, 每个构型参数分别构成独立的六个列构型参数矩阵,并以此六个列构 型参数矩阵作为计算的起始;
S4:提取训练组能量数据作为训练组输出能量矩阵,并与列构型 参数输入矩阵一一对应,即训练组的六个列构型参数输入矩阵R1, R2,R3,R4,R5,R6和训练组输出能量矩阵Ereal分别为:
S5:构建测试组构型参数输入矩阵和测试组输出能量矩阵,测试 组矩阵行数为1000-m;即测试组的六个列构型参数输入矩阵 和测试组输出能量矩阵分别为:
S6:依据训练组构型参数,采用双神经层计算结构对水分子能量 进行学习,经过双神经层计算得到能量矩阵Ecalc
其中Activation Function为神经网络激活函数,当i为1到5时,应 用的是tf.nn.relu线性整流函数,当i为6时,应用的是tf.nn.softmax 激活函数;Ri为训练组的第i个列构型参数输入矩阵,W_ini为第一 神经层第i个权重矩阵,b_ini为第一神经层第i个偏置矩阵,W_outi为第二神经层第i个权重矩阵,b_outi为第二神经层第i个偏置矩阵。
进一步的,所述步骤S6的具体步骤为:第一神经层中当i为1 到5时,应用的是tf.nn.relu线性整流函数,当i为6时,应用的是 tf.nn.softmax激活函数,第二神经层不采用任何激活函数,每层神经 元个数为10个,第一神经层六个权重矩阵W_ini分别为:
第一神经层六个偏置矩阵b_ini分别为:
第二神经层六个权重矩阵W_outi分别为:
第二神经层六个偏置矩阵b_outi为:
进一步的,W_ini和W_outi的初始值由随机数产生,b_ini和b_outi的初始值全部设为0.1。
本发明的有益效果是:摆脱了传统计算平台的制约;避免了收敛 问题,将计算效率达到最优水准,减小了训练组和测试组的比值对于 训练结果准确性的影响;可以更加灵活地在神经网络中使用多种激活 函数,以得到更精确的计算结果。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合实施 例,对本发明的技术方案进行清楚、完整的描述。
实施例1
一种通过深度学习计算水分子能量的方法,采用1000个不同构 型水分子的空间坐标和与之对应的能量。水分子的两个氢氧键变化范 围为键角变化范围为104.2±8.59°。直接以分子 构型训练分子能量,随机选取m个构型和对应能量作为训练组,其 余1000-m个构型和对应能量作为测试组,计算水分子能量,验证 训练结果的正确性。
将训练组分子空间坐标转化为两个氢氧键键长(rO-H1,rO-H2)、分 子键角(θ)以及三个原子间距离的倒数(1/rO-H1,1/rO-H2,1/rH1-H2), 每个构型参数分别构成独立的六个列构型参数矩阵,并以此六个列构 型参数矩阵作为计算的起始。提取训练组能量数据作为训练组输出能 量矩阵,并与列构型参数输入矩阵一一对应,即训练组的六个列构型 参数输入矩阵R1,R2,R3,R4,R5,R6和训练组输出能量矩阵Ereal分别为:
构建测试组构型参数输入矩阵和测试组输出能量矩阵,矩阵行数 为1000-m;即测试组的六个列构型参数输入矩阵 和测试组输出能量矩阵分别为:
依据训练组构型参数,采用双神经层计算结构对水分子能量进行 学习。为保证学习效率,第一神经层采用激活函数,第二神经层未采 用任何激活函数,每层神经元个数为10个,经过双神经层计算得到 能量矩阵Ecalc
其中Activation Function为神经网络激活函数,当i为1到5时,应用的 是tf.nn.relu线性整流函数,当i为6时,应用的是tf.nn.softmax激活 函数;Ri为训练组的第i个列构型参数输入矩阵,W_ini为第一神经 层第i个权重矩阵,六个权重矩阵分别为:
b_ini为第一神经层第i个偏置矩阵,六个偏置矩阵分别为:
W_outi为第二神经层第i个权重矩阵,六个权重矩阵分别为:
b_outi为第二神经层第i个偏置矩阵,六个偏置矩阵分别为:
其中,W_ini和W_outi初始值由随机数产生,b_ini和b_outi初始值全 部设为0.1。
实施例2
本实施例给出了本发明的硬件平台与软件环境的优选方案。
选择低端的i5-6500 CPU@3.20GHz/NVIDIA Corporation GK208 [GeForce GT730]/4G Mem硬件平台,以获得更高的通用性能;软件 环境为Linux kernel 4.9/TensorFlow-GPU 1.8.0(通过pip方式安装), 驱动程序为CUDA 9.0/cuDNN 7.1。
实施例3
本实施例给出了本发明输入数据选取的优选方案。
使用Brockherde等提供的water数据集,该数据集包含1000个 水分子的构型和与之一一对应的能量,构型采用Bohr positions表 达,能量单位为kcal/mol。这一方法在确保分子能量精确度随着训练 集增大而提高的情况下,避免使用梯度下降法计算最小化总能量,将 结果与使用标准DFT近似(PBE)所计算结果进行对比。水分子参 数设置为三个:两个键长和一个键角。依据PBE结果构建优化的水 分子构型(θ0=104.2°)为训练的起始点,在和 ±8.59°之间产生随机组合构型。
实施例4
本实施例给出了本发明结果计算的优选方案。
采用tensorflow-gpu默认配置,未启动CPU并行运算。双核四 线程i5 CPU,每线程占用率约为40%左右,每线程内存占用率约为 19.4%。默认开启GPU运算,内存时钟频率为0.9015GHz,内存使 用1.923/1.95GiB。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范 围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技 术范围内,根据本发明的技术方案及其发明构思加以等同替换或改 变,都应涵盖在本发明的保护范围之内。

Claims (3)

1.一种基于分子自由度深度学习计算水分子能量的方法,其特征在于,包括如下步骤:
S1:构建水分子数据库,所述水分子数据库包含1000个不同构型水分子的空间坐标和与构型对应的能量;
S2:随机选取m个构型和对应能量作为训练组,其余1000-m个构型和对应能量作为测试组;
S3:将训练组水分子空间坐标转化为两个氢氧键键长rO-H1,rO-H2、分子键角θ以及三个原子间距离的倒数1/rO-H1,1/rO-H2,1/rH1-H2,每个构型参数分别构成独立的六个列构型参数矩阵,并以此六个列构型参数矩阵作为计算的起始;
S4:提取训练组能量数据作为训练组输出能量矩阵,并与列构型参数输入矩阵一一对应,即训练组的六个列构型参数输入矩阵R1,R2,R3,R4,R5,R6和训练组输出能量矩阵Ereal分别为:
S5:构建测试组构型参数输入矩阵和测试组输出能量矩阵,测试组矩阵行数为1000-m;即测试组的六个列构型参数输入矩阵R1*,R2*,R3*,R4*,R5*,R6*和测试组输出能量矩阵Ereal*分别为:
S6:依据训练组构型参数,采用双神经层计算结构对水分子能量进行学习,经过双神经层计算得到能量矩阵Ecalc
其中Activation Function为神经网络激活函数,当i为1到5时,应用的是tf.nn.relu线性整流函数,当i为6时,应用的是tf.nn.softmax激活函数;Ri为训练组的第i个列构型参数输入矩阵,W_ini为第一神经层第i个权重矩阵,b_ini为第一神经层第i个偏置矩阵,W_outi为第二神经层第i个权重矩阵,b_outi为第二神经层第i个偏置矩阵。
2.根据权利要求1所述的基于分子自由度深度学习计算水分子能量的方法,其特征在于,所述步骤S6的具体步骤为:第一神经层采用激活函数,第二神经层不采用任何激活函数,每层神经元个数为10个,第一神经层六个权重矩阵W_ini分别为:
第一神经层六个偏置矩阵b_ini分别为:
第二神经层六个权重矩阵W-outi分别为:
第二神经层六个偏置矩阵b_outi为:
3.根据权利要求2所述的基于分子自由度深度学习计算水分子能量的方法,其特征在于,W_ini和W_outi的初始值由随机数产生,b_ini和b_outi的初始值全部设为0.1。
CN201811133722.9A 2018-09-27 2018-09-27 基于分子自由度深度学习计算水分子能量的方法 Pending CN109411028A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811133722.9A CN109411028A (zh) 2018-09-27 2018-09-27 基于分子自由度深度学习计算水分子能量的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811133722.9A CN109411028A (zh) 2018-09-27 2018-09-27 基于分子自由度深度学习计算水分子能量的方法

Publications (1)

Publication Number Publication Date
CN109411028A true CN109411028A (zh) 2019-03-01

Family

ID=65465348

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811133722.9A Pending CN109411028A (zh) 2018-09-27 2018-09-27 基于分子自由度深度学习计算水分子能量的方法

Country Status (1)

Country Link
CN (1) CN109411028A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111710376A (zh) * 2020-05-13 2020-09-25 中国科学院计算机网络信息中心 大分子及团簇体系分块计算负载均衡方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6587845B1 (en) * 2000-02-15 2003-07-01 Benjamin B. Braunheim Method and apparatus for identification and optimization of bioactive compounds using a neural network
US20170329892A1 (en) * 2016-05-10 2017-11-16 Accutar Biotechnology Inc. Computational method for classifying and predicting protein side chain conformations
CN108536998A (zh) * 2018-03-05 2018-09-14 复旦大学 一种适用于机器学习势能面构造的物质结构描述方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6587845B1 (en) * 2000-02-15 2003-07-01 Benjamin B. Braunheim Method and apparatus for identification and optimization of bioactive compounds using a neural network
US20170329892A1 (en) * 2016-05-10 2017-11-16 Accutar Biotechnology Inc. Computational method for classifying and predicting protein side chain conformations
CN108536998A (zh) * 2018-03-05 2018-09-14 复旦大学 一种适用于机器学习势能面构造的物质结构描述方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
FELIX BROCKHERDE等: "By-passing the Kohn-Sham equations with machine learning", 《NATURE COMMUNICATIONS》 *
GREGOIRE MONTAVON等: "Learning Invariant Representations of Molecules for Atomization Energy Prediction", 《ANNUAL CONFERENCE ON NEURAL INFORMATION PROCESSING SYSTEMS》 *
KRISTOF T.SCHUTT等: "Quantum-chemical insights from deep tensor neural networks", 《NATURE COMMUNICATIONS》 *
刘芹: "应用神经网络方法优化密度泛函近似中的半经验参数", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
陈俊等: "基于神经网络的分子体系势能面构造", 《中国科学:化学》 *
陈柳杨: "构建多维化学反应势能面新方法", 《中国优秀硕士学位论文全文数据库工程科技I辑》 *
陈炽宏: "基于神经网络的大分子体系势能面的构建", 《中国优秀硕士学位论文全文数据库工程科技I辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111710376A (zh) * 2020-05-13 2020-09-25 中国科学院计算机网络信息中心 大分子及团簇体系分块计算负载均衡方法及系统
CN111710376B (zh) * 2020-05-13 2023-04-07 中国科学院计算机网络信息中心 大分子及团簇体系分块计算负载均衡方法及系统

Similar Documents

Publication Publication Date Title
CN106570823B (zh) 基于平面特征匹配的点云粗拼接方法
CN107065922B (zh) 基于队形库的多无人机队形编队方法
CN106099393A (zh) 基于遗传算法的子阵稀布与阵元稀疏天线阵列综合布阵方法
CN107451619A (zh) 一种基于感知生成对抗网络的小目标检测方法
CN105701540B (zh) 一种自生成神经网络构建方法
CN109871609B (zh) 基于bp-fem对海洋浮式平台系泊系统响应的预测方法
CN103675799B (zh) 一种相控阵声纳系统换能器稀疏面阵优化方法
CN106503802A (zh) 一种利用遗传算法优化bp神经网络系统的方法
CN110223323A (zh) 基于深度特征自适应相关滤波的目标跟踪方法
CN107145943A (zh) 混沌背景中基于改进教学优化算法的检测回声状态网络微弱信号的方法
US20240160221A1 (en) Method for constructing episodic memory model based on rat brain visual pathway and entorhinal-hippocampal cognitive mechanism
CN108445751A (zh) 融合递归图与深度学习的多目标ssvep意念控制法及应用
CN110346654A (zh) 基于普通克里金插值的电磁频谱地图构建方法
CN109165730A (zh) 交叉阵列神经形态硬件中状态量化网络实现方法
CN109583594A (zh) 深度学习训练方法、装置、设备及可读存储介质
CN109411028A (zh) 基于分子自由度深度学习计算水分子能量的方法
CN106372721B (zh) 大规模神经网络的3d可视化方法
CN107862329A (zh) 一种基于深度置信网络的雷达一维距离像真假目标识别方法
CN110348748A (zh) 基于多属性决策的滑坡治理方案选择方法及治理方法
CN108717176A (zh) 基于人工蜂群算法的多站时差定位方法
CN108594793A (zh) 一种改进的rbf飞控系统故障诊断网络训练方法
CN110363163A (zh) 一种方位角可控的sar目标图像生成方法
CN106899595A (zh) 基于强化学习的不完全信息网络安全分析方法及装置
CN108460829B (zh) 一种用于ar系统的三维图像注册方法
CN102298128A (zh) 基于自适应扩散基函数分解的组织纤维束结构信息提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190301