CN117669342A

CN117669342A - 一种基于深度学习的新型环保绝缘气体分子筛选方法

Info

Publication number: CN117669342A
Application number: CN202311676067.2A
Authority: CN
Inventors: 刘伟; 朱太云; 马凤翔; 宋玉梅; 朱姗; 董王朝; 曹骏; 徐霄筱; 杭忱; 许争杰; 俞登洋
Original assignee: Electric Power Research Institute of State Grid Anhui Electric Power Co Ltd
Current assignee: Electric Power Research Institute of State Grid Anhui Electric Power Co Ltd
Priority date: 2023-12-01
Filing date: 2023-12-01
Publication date: 2024-03-08

Abstract

本发明公开了一种基于深度学习的新型环保绝缘气体分子筛选方法，包括：建立已知气体分子电气环保性质的基础库；将基础库中的气体分子用分子描述符表示，生成分子数据矩阵，并将矩阵划分为训练库和测试库；搭建深度学习模型，训练库用于训练深度学习模型，测试库测试训练后的深度学习模型的预测精度，直至获取最佳深度学习模型；将基础库中的气体分子通过官能团置换方法批量生成新的小分子结构，形成气体分子目标库；采用最佳深度学习模型对气体分子目标库的气体分子进行筛选，输出潜在绝缘替代气体；对潜在绝缘替代气体，分别针对性能指标进行评估，输出位于评估线内的高性能潜在绝缘替代气体。通过本发明能够降低实验试错法的时间成本。

Description

一种基于深度学习的新型环保绝缘气体分子筛选方法

技术领域

本发明涉及电气绝缘介质技术领域，具体为一种基于深度学习的新型环保绝缘气体分子筛选方法。

背景技术

六氟化硫(SF₆)最早被作为灭火气体，因其优良的电气性能和良好的化学稳定性，目前作为最佳的气体绝缘介质应用于各类高压电力设备。然而，SF₆具有极强的温室效应，其全球变暖潜质值(Global warming potential,GWP)达到CO₂的24300倍，是《京都东议定书》、《巴黎协定》等国际公约中明确限制排放的温室气体之一。欧盟最新发布的温室气体法规修正案，明确了SF₆禁用时间表，规定了中高压设备不得采用GWP大于10的绝缘介质，环保型绝缘替代介质开发势在必行。

电气绝缘气体开发异常艰难，需要同时满足高电气强度、低液化温度、低温室效应和高化学稳定性等。半个多世纪以来，虽然经过了艰苦的实验及理论探索，并未发现一种全面达到或超越SF₆的环保替代气体，未取得实质性的突破。

对于全新绝缘气体分子的开发，实验试错法是最原始、最直接的寻找目标分子的方法，从提出假设到实验验证，不断迭代从而不断接近目标分子，每次验证都需要上千万的项目支撑，该方式耗时耗力，截止目前也未能找到一个综合性能与SF₆媲美的环保绝缘气体分子。

近年来，随着计算技术的快速发展，从大数据中提取知识，已经成为目前科学发展的主流形式。机器学习已经成为一种被广泛应用的成功方法。传统的机器学习算法主要有随机森林、支持向量机、k-最近邻、朴素贝叶斯、逻辑回归、DBSCAN等，对于寻求SF₆的环保代替气体需要将大量的分子结构信息作为输入，而这些传统的机器学习方法，对于高维输入变量的问题或复杂分类问题并不擅长。

发明内容

本发明所要解决的技术问题在于：解决现有的绝缘气体分子预测技术的主要问题在于大多采用实验试错法，该法耗时耗力，传统的机器学习算法对于高维输入变量的问题或复杂分类问题并不擅长的问题。

为解决上述技术问题，本发明提供如下技术方案：

一种基于深度学习的新型环保绝缘气体分子筛选方法，包括以下步骤：

S100，建立已知气体分子电气环保性质的基础库；所述电气环保性质的性能指标包括：绝缘性能、液化温度和GWP；

S200，将所述基础库中的气体分子用分子描述符表示，生成分子数据矩阵；并将所述分子数据矩阵划分为训练库和测试库；

S300，搭建深度学习模型，所述训练库用于训练所述深度学习模型，并使用训练后的深度学习模型中的专家系统评估所述测试库中气体分子的性能指标，并与真实值比较，评估预测精度；不断更新深度学习模型的参数，直至评估预测精度达到预测标准，将此时的深度学习模型作为最佳深度学习模型；

S400，将所述基础库中的气体分子通过官能团置换方法批量生成新的小分子结构，形成气体分子目标库；

S500，采用所述最佳深度学习模型对所述气体分子目标库的气体分子进行筛选，设定筛选综合性能指标，通过所述筛选综合性能指标对初步筛选结果进行排序，设定评估界线，输出处于所述评估界线内的潜在绝缘替代气体；

S600，对所述潜在绝缘替代气体，分别针对性能指标进行评估，再次使用所述筛选综合性能指标进行排序，并设定评估线，输出位于所述评估线内的高性能潜在绝缘替代气体。

优点：本发明实现对气体分子关键电气环保性能指标的快速、准确评估，能够大大降低了实验试错法的时间成本，提高了筛选的效率，为当前新型绝缘气体分子的研究提供了新思路。

本发明提供了一种基于大数据与深度学习算法相结合的方法，通过高通量搜索，预测出各方面性能指标都比较优异的SF₆新型环保替代气体，为SF₆环保替代气体的探索提供新思路。可减少大规模的实验测试，在很大程度上加快了新分子的研发周期。但本实例仅限于为实现SF₆的环保替代提供理论支撑，降低实验试错法的时间成本，最终预测出的气体分子还需进行实验验证。

在本发明的一实施例中，所述基础库中气体分子的结构类型，从以下方式产生：

a)调研、检索近半个世纪以来绝缘气体研发方面的文献、技术报告和专利，收集相关绝缘分子数据；

b)检索文献、分子理化性质数据库和物理化学手册，收集小分子的电气环保相关理化性质，且无论是否可以作为绝缘气体；

对于比较典型的气体分子类型，但缺少电气环保相关理化性质数据，采用高精度量子化学及分子动力学模拟的方法进行评估。

在本发明的一实施例中，对于缺少液化温度的气体分子，通过以下步骤获取：

S111，建立多个气体分子的无无定形晶胞，获取初始气体晶体结构；

S112，基于密度泛函理论，优化所述初始气体晶体结构的成键参数和晶胞参数，获取稳定的分子力学环境气体晶体结构；

S113，采用CompassⅡ力场，对所述初始气体晶体结构进行能量初始化，获取稳定的力场能量环境气体晶体结构；

S114，分别计算所述分子力学环境气体晶体结构和所述力场能量环境气体晶体结构中，每个单分子的平均相互作用力和密度；

S115，将所述分子力学环境气体晶体结构和所述力场能量环境气体晶体结构的平均相互作用力和密度分别对比，获取初始液化温度预测模型；

S116，不断调整所述初始液化温度预测模型中初始气体晶体结构的CompassⅡ力场的力场参数，更新所述初始液化温度预测模型，以获取拟合的最佳液化温度预测模型；

S117，将多个待测气体分子的无无定形晶胞带入所述最佳液化温度预测模型中，进行升温和降温模拟，获取液化温度曲线，根据所述液化温度曲线获取液化温度范围。

在本发明的一实施例中，所述获取所述最佳液化温度预测模型，包括：每调整一次初始气体晶体结构的力场参数，更新一次初始液化温度预测模型，且每更新一次，均对初始气体晶体结构进行一次能量初始化，并计算相应的平均相互作用力和密度，直至平均相互作用力和密度分别与所述分子力学环境气体晶体结构的平均相互作用力和密度相近，将此时拟合的液化温度预测模型为最佳液化温度预测模型。

在本发明的一实施例中，在进行升温模拟时，包括以下步骤：

将所述最佳液化温度预测模型能量初始化，将多个待测气体分子的无无定形晶胞带入能量初始化后的最佳液化温度预测模型；

在正则系综下，设置初始温度、升温步长，构建动力学模拟环境；

在所述初始温度下，温度每升高一个升温步长，则对最佳液化温度预测模型所在的环境进行一次分子动力学模拟，并得到此温度下稳定的结构，并记录此温度下最佳液化温度预测模型所在环境的密度；

重复上一步，直至待测气体分子的液态体系沸腾并完全汽化，将确定逐步升温过程中的密度突变点，记录此时的第一突变温度；

在进行降温模拟时，包括以下步骤：

设置降温步长，待测气体分子完全汽化后，再逐步降温；

每降低一个降温步长，对最佳液化温度预测模型所在的环境进行一次分子动力学模拟，并得到此温度下稳定的结构，并记录此温度下最佳液化温度预测模型所在环境的密度；

重复上一步，直至待测气体分子的气态体系完全液化，确定逐步降温过程中的密度突变点，记录此时的第二突变化温度；

将升温模拟时，获取的密度数据，以及降温模拟时，获取的密度数据，绘制液化温度曲线；在所述液化温度曲线中，所述第一突变温度和所述第二突变化温度之间范围为液化温度范围。

在本发明的一实施例中，对于缺少GWP的气体分子，通过以下步骤获取：

S121，确定优化基组，基于所述优化基组对气体分子和水分子进行结构优化，获取能量最低，最稳定的气体分子-水分子优化结构以及气体分子优化结构；

S122，将所述气体分子-水分子优化结构中的气体分子和水分子进行比例混合，构建初始气体-水共晶结构；

S123，根据第一性原理对最低总能量空间群下的初始气体-水共晶结构进行优化，获取最佳气体-水共晶结构；

S124，根据分子动力学及密度泛函方法，对所述最佳气体-水共晶结构进行反应路模拟，获取所述最佳气体-水共晶结构的全部分解路径；

S125，获取所有分解路径的速率常数并对比，选取速率常数最小的为所述最佳气体-水共晶结构反应的决速步；

S126，获取所述最佳气体-水共晶结构反应的决速步的反应速率常数；以及根据所述反应速率常数获取气体的大气寿命；

S127，获取所述气体分子优化结构的红外光谱，并根据所述红外光谱获取波段，并根据所述波段获取每单位横截面的光谱分辨辐射强迫；

S128，根据所述波段和所述光谱分辨辐射强迫，获取气体分子优化结构的辐射效率；

S129，根据所述大气寿命和所述辐射效率，获取气体的全球变暖潜能值。

在本发明的一实施例中，所述构建初始气体-水共晶结构包括：在全局力场下，获取所述气体分子优化结构和所述水分子之间的作用力；并基于蒙特卡洛的算法，预测作用力分别在C2/c空间群、P1空间群、P21空间群、P2/c空间群和P212121空间群下所有作用之间的组合堆叠，获取多个初始气体-水共晶结构，并对每个空间群下初始气体-水共晶结构的总能量进行排序，获取最低总能量空间群下的初始气体-水共晶结构。

在本发明的一实施例中，采用超软赝势使最低总能量空间群下的初始气体-水共晶结构受力平衡，获取最低总能量空间群下能量最低的初始气体-水共晶结构，作为最佳绝缘气体-水共晶结构。

在本发明的一实施例中，获取所述最佳气体-水共晶结构的所有分解路径包括：

将所述最佳气体-水共晶结构的能量初始化，确保所述最佳气体-水共晶结构所在的环境在升温前的平衡；

在正则系综下，设置初始温度、模拟步数和温度间隔，以初始温度作为第一个温度进行动力学模拟，随后以确定的温度间隔对所述最佳气体-水共晶结构所在的环境进行逐步升温，直至获得气体与水分子中羟基自由基的全部分解路径。

在本发明的一实施例中，所述形成气体分子目标库包括：

输入基础库中的气体分子；

设置置换规则，生成新的小分子结构需满足Lewis八电子规则和杂化轨道理论；

通过官能团置换方法，在满足置换规则的基础上，批量置换分子结构；

输出符合置换规则的新的气体分子结构，形成所述成气体分子目标库；且所述成气体分子目标库中的气体分子均采用B3LYP/6-311G*方法进行结构优化，确定其基态几何构型。

与现有技术相比，本发明的有益效果是：本发明首次提出对比分子结构和能量数据来拟合分子力场的方法，拟合的参数包括成键参数和非键参数，拟合出的完整力场参数可用于液化温度的预测。首次使用各个分子拟合的力场参数计算混合气体的液化温度，具有成本低的特点，并且解决了绝缘气体的液化温度在实验上很难实现的问题，能够准确预测出气体的液化温度，还具有流程简洁、成本稳定、计算效率高的优点，能够对寻找绝缘气体提供有利参考。

对于辐射效率的计算，本申请考虑分子中极化键的作用，采用优化基组计算分子键距，得到更准确的波数。对于大气寿命计算，基于Car-Parrinello分子动力学方法真实模拟绝缘气体和大气中成分的反应路径，计算决速步的反应速率常数，得到大气寿命值。最后将得到的辐射效率和大气寿命值带入GWP计算公式得到绝缘气体的GWP，具有可靠性强、计算效率高，精度高且重复性好的优点。

分子动力学是基于第一性原理的分子动力学方法，从基本的物理学定律出发，不依赖假设与经验拟合的推导与计算。直接对分子的结构进行分析得到分子运动的行为规律，模拟体系的动力学演化过程，能够更简洁地实现化学反应的从头计算，真实模拟出化学反应的所有路径。密度泛函理论(Density functional theory,DFT)是以电子密度为基本的变量来描述体系状态的方法。通过任意区域的电子密度分布函数就能得到反应体系的总能量和基态性质。本发明首次采用CPMD及DFT的方法，从绝缘气体分子的结构出发，模拟出其在大气中的真实反应路径，并计算每条路径的速率常数，进而确定反应的决速步。本方法降低了实验方法带来的危险性和时间成本，避免了传统过渡态方法不确定性强的缺点，具有成本稳定、简单易行、精确度高的特点。

传统过渡态理论通过直接猜测设计化学反应可能发生的路径，根据猜测得到的路径再计算活化能，确定反应决速步。此方法人为主观性较强、结果不确定性过大。本发明直接从分子结构出发，更简洁地实现化学反应的从头计算，真实模拟出化学反应的所有路径。相比较于实验方法和传统过渡态理论，本发明能够更精确模拟出化学反应的所有路径，具有成本稳定、可靠性强、精确度高的特点。

主要采用计算化学的方法，从分子的结构出发，考虑每个原子的特性，计算绝缘气体与大气成分反应决速步的反应速率，进而得到了大气寿命值。

根据对比例和实施例的结果均表明本发明获得的GWP更接近于文献值，避免了过度依赖经验，且流程简单，计算效率高，成本稳定。

附图说明

图1为本发明实施例的一种基于深度学习的新型环保绝缘气体分子筛选方法流程图。

图2为本发明实施例的C₄F₇N晶体结构示意图。

图3为本发明实施例的液化温度曲线示意图。

图4为本发明实施例的绝缘气体-水共晶结构示意图。

图5至图7为本发明实施例的C₄F₇N与-OH的三条分解路径。

图8为本发明实施例的气体分子优化结构的红外光谱。

具体实施方式

为便于本领域技术人员理解本发明技术方案，现结合说明书附图对本发明技术方案做进一步的说明。

术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

请参阅图1所示，本发明提供一种基于深度学习的新型环保绝缘气体分子筛选方法，包括以下步骤：

S100，建立已知气体分子电气环保性质的基础库；所述电气环保性质的性能指标包括：绝缘性能、液化温度和GWP。

在本实施例中，基础库包含尽可能多的分子结构类型，从而实现“大数据”样本全覆盖。主要以下方式产生：从以下方式产生：

c)调研、检索近半个世纪以来绝缘气体研发方面的文献、技术报告和专利，收集相关绝缘分子数据。

d)检索文献、分子理化性质数据库和物理化学手册，收集小分子的电气环保相关理化性质，且无论是否可以作为绝缘气体。

e)对于比较典型的气体分子类型，但缺少电气环保相关理化性质数据，采用高精度量子化学及分子动力学模拟的方法进行评估。

请参阅如图1至图3所示，在本发明的一实施例中，在方式c)中，对于缺少液化温度的气体分子，通过以下步骤获取：

S111，建立多个气体分子的无无定形晶胞，获取初始气体晶体结构。

请参阅图2所示，在本实施例中，以C₄F₇N为例。在Amorphous Cell中，将环境温度设置为268K，密度设为1.5g/cm³，得到构建初始气体晶体结构的初始环境，然后在初始环境中搭建100个C₄F₇N分子的无定形晶胞，得到初始的C₄F₇N晶体结构。

S112，基于密度泛函理论，优化所述初始气体晶体结构的成键参数和晶胞参数，获取稳定的分子力学环境气体晶体结构。

S113，采用CompassⅡ力场，对所述初始气体晶体结构进行能量初始化，获取稳定的力场能量环境气体晶体结构。

在本实施例中，由于CompassⅡ力场是高精度力场，能够对体系进行原子尺度模拟研究，因此选择CompassⅡ力场对初始的C₄F₇N晶体结构进行能量初始化，即对无序的晶体结构进行初始运行，使能量降低，处于一个合理的范围振动，得到可以进行分子动力学模拟的合理结构。

S114，分别计算所述分子力学环境气体晶体结构和所述力场能量环境气体晶体结构中，每个单分子的平均相互作用力和密度。

具体的，通过以下公式获取平均相互作用力：

式中，E₀为平均相互作用力，E_total为气体晶体的总能量，E_mo为单个分子的能量，n为分子数。

通过以下公式获取密度：

ρ＝m/V；

式中，ρ为晶体结构的密度，m为晶体结构中晶体的质量，V为晶体结构的体积。

气体的沸腾就是分子间作用力消失的过程，而液化就是分子间作用力的重新产生，因此液化温度与分子之间的作用力密切相关。分子之间的作用力又取决于分子的结构式，结构式的不同导致分子质量不同，再加上由分子间距决定的体积的差异，密度也是非常重要的评估参数，因此需要获取晶体结构中的每个单分子的平均相互作用力和晶体结构的密度。

S115，将所述分子力学环境气体晶体结构和所述力场能量环境气体晶体结构的平均相互作用力和密度分别对比，获取初始液化温度预测模型。

在本实施例中，通过平均相互作用力和密度公式，获取分子力学环境气体晶体结构的平均相互作用力E₁和密度ρ1，以及获取力场能量环境气体晶体结构的平均相互作用力E₂和密度ρ2，将两者的平均相互作用力和密度分别作减法，获取初始液化温度预测模型。

S116，不断调整所述初始液化温度预测模型中初始气体晶体结构的CompassⅡ力场的力场参数，更新所述初始液化温度预测模型，以获取拟合的最佳液化温度预测模型。

在本实施例中，获取所述最佳液化温度预测模型，包括：每调整一次初始气体晶体结构的力场参数，更新一次初始液化温度预测模型，且每更新一次，均对初始气体晶体结构进行一次能量初始化，并计算相应的平均相互作用力和密度，直至平均相互作用力和密度分别与所述分子力学环境气体晶体结构的平均相互作用力和密度相近，将此时拟合的液化温度预测模型为最佳液化温度预测模型。

具体的，所述相近的判断标准为：更新后的气体晶体结构计算得到的平均相互作用力和密度分别与所述分子力学环境气体晶体结构的平均相互作用力和密度的误差小于2％。

以及本步骤中的CompassⅡ力场的力场参数包括成键参数和非键参数，其中，成键参数包括键长、键角、二面角，非键参数包括分子电荷和范德华力。

分子动力学是以牛顿运动定律为理论基础，能够有效地记录分子在体系中的运动轨迹。分子力场能量准确性直接决定计算模拟的成败，所以如何获得精确度高的力场参数，对仿真模拟至关重要。对于一个化学反应，如果能拟合合适的力场，就可以在确定的温度和压力下模拟反应的真实情况。分子力场是描述体系中原子间相互作用的一套参数化的经验势函数参数，主要由两大部分组成：描述分子内成键相互作用的成键参数和描述分子间相互作用的非键参数，描述的是未成键的原子或基团之间的相互作用。基于这些参数就可以构建针对绝缘气体这一特定体系的新力场，就可以基于分子动力学方法，模拟气体逐步降温的过程来观察分子之间的距离、密度和受力情况，从而得到温度与密度的关系，进而求出绝缘气体的液化温度。因此，本实例基于分子力场拟合对气体液化温度进行了预测。

S117，将多个待测气体分子的无定形晶胞带入所述最佳液化温度预测模型中，进行升温和降温模拟，获取液化温度曲线，根据所述液化温度曲线获取液化温度范围。

在进行升温模拟时，包括以下步骤：

将所述最佳液化温度预测模型能量初始化，将多个待测气体分子的无无定形晶胞带入能量初始化后的最佳液化温度预测模型。

在正则系综下，设置初始温度、升温步长，构建动力学模拟环境。

在所述初始温度下，温度每升高一个升温步长，则对最佳液化温度预测模型所在的环境进行一次分子动力学模拟，并得到此温度下稳定的结构，并记录此温度下最佳液化温度预测模型所在环境的密度。

重复上一步，直至待测气体分子的液态体系沸腾并完全汽化，将确定逐步升温过程中的密度突变点，记录此时的第一突变温度。

在本实施例中，将1000个C₄F₇N分子的无无定形晶胞带入能量初始化后的最佳液化温度预测模型。

在进行降温模拟时，包括以下步骤：

设置降温步长，待测气体分子完全汽化后，再逐步降温。

每降低一个降温步长，对最佳液化温度预测模型所在的环境进行一次分子动力学模拟，并得到此温度下稳定的结构，并记录此温度下最佳液化温度预测模型所在环境的密度。

重复上一步，直至待测气体分子的气态体系完全液化，确定逐步降温过程中的密度突变点，记录此时的第二突变化温度。

具体的，初始温度260K，升温步长为1K，在整个模拟的过程中，每一个温度设置时长为1000ps，总模拟时长为11ns。其中，所述降温步长与所述升温步长的数值相等。

将升温模拟时，获取的密度数据，以及降温模拟时，获取的密度数据，绘制液化温度曲线。在所述液化温度曲线中，所述第一突变温度和所述第二突变化温度之间范围为液化温度范围。请参阅图3所以，预测的C₄F₇N分子的液化温度在266K～268K，而根据文献得到的C₄F₇N分子的液化温度在268K，即本发明的预测精度高。

请参阅如图1、图4至图8所示，在本发明的一实施例中，对于缺少GWP的气体分子，通过以下步骤获取：

S121，确定优化基组，基于所述优化基组对气体分子和水分子进行结构优化，获取能量最低，最稳定的气体分子-水分子优化结构以及气体分子优化结构。

请参阅图4所示，在本实施例中，绝缘气体以C₄F₇N为例。为确定优化C₄F₇N分子结构的优化基组，本实例对不同泛函方法基组下C₄F₇N分子的选定键距进行比较，如表1所示。

表1不同泛函方法基组下C₄F₇N的选定键距比较

方法基组	C-F	C-C(F)	C-(CN)	C≡N	时间(min)*
						B3LYP/def2tzvp	1.37	1.56	1.47	1.15	4.86
BP86/def2tzvp	1.38	1.57	1.47	1.16	3.81
						WB97XD/def2tzvp	1.36	1.56	1.47	1.14	5.43
M06-2X/def2tzvp	1.32	1.54	1.47	1.14	5.43
						MP2/aug-cc-pVTZ	1.33	1.54	1.47	1.16	137

根据绝缘气体在不同泛函方法基组下的键距比较，获取键距精度高的方法基组，作为优化基组。从表1中可以看出，作为基准，在相同基组下，BP86/def2tzvp基组方法在结构描述方面花费的时间最短，但精度最弱。B3LYP/def2tzvp基组方法的结果甚至比BP86/def2tzvp基组方法更弱。与B3LYP/def2tzvp基组方法相比，M06-2X/def2tzvp基组方法提高键距的精度，其时间误差也可相对忽略，因此选择M06-2X/def2tzvp基组方法进行优化。

温室气体在大气中的降解过程主要依赖与羟基自由基-OH的反应，要寻找温室气体与-OH的反应路径的决速步，因此考虑-OH的加入是得到合理的分解路径的前提。在实施例中，以H₂O作为-OH的产生源。

S122，将所述气体分子-水分子优化结构中的气体分子和水分子进行比例混合，构建初始气体-水共晶结构。

在本实施例中，将优化后的C₄F₇N分子和H₂O分子按照1：1的比例混合，构建一个初始C₄F₇N-H₂O共晶结构。具体的，构建初始气体-水共晶结构包括：在全局力场下，获取所述气体分子优化结构和所述水分子之间的作用力。并基于蒙特卡洛的算法，预测作用力分别在C2/c空间群、P1空间群、P21空间群、P2/c空间群和P212121空间群下所有作用之间的组合堆叠，获取多个初始气体-水共晶结构，并对每个空间群下初始气体-水共晶结构的总能量进行排序，获取最低总能量空间群下的初始气体-水共晶结构。

在本实施例中，选择合适的力场是为了模拟体系中C₄F₇N分子和H₂O分子之间的作用力，而全局力场(Universal force field,UFF)可以适用于周期表中所有元素，能够适用于任何原子和分子。E势能表示为价相互作用或成键相互作用与非成键相互作用的总和。

E＝E_R+E_θ+E_φ+E_ω+E_vdw+E_el

其中，E_R、E_θ、E_φ、E_ω、E_vdw和E_el分别为气体-水共晶结构的键伸缩能、键角弯曲能、二面角扭转能、键角面外弯曲能、范德华能以及静电能。根据上述公式中UFF力场里的6种作用力，计算得到了C₄F₇N分子和H₂O分子之间的作用能。

在此基础下，基于蒙特卡洛(Monte-Carlo,MC)算法，预测气体-水共晶结构在C2/c空间群、P1空间群、P21空间群、P2/c空间群、P212121空间群，这五个空间群内的堆积情况，得到其最低总能量、范德华能量、预测结构数量和晶体参数。

其中，分别定义C₄F₇N和H₂O为刚性转子，即在基于蒙特卡洛算法进行堆积时，转子内部不发生改变，只作为一个质点，转子之间相对位置改变。由于大多数晶体都属于C2/c空间群、P1空间群、P21空间群、P2/c空间群、P212121空间群，这五个空间群，因此预测了在这五个空间群下C₄F₇N和H₂O的可能堆积情况，如下表2所示。

表2空间群绝缘气体-水共晶结构的堆积

其中表2中，a、b、c为晶胞的三组棱长，α、β、γ为晶胞的棱间交角。将预测出的几万个共晶结构进行能量排序，取出能量最低的C₄F₇N-H₂O共晶结构作为后续研究对象。

S123，根据第一性原理对最低总能量空间群下的初始气体-水共晶结构进行优化，获取最佳气体-水共晶结构。

在本实施例中，采用超软赝势使最低总能量空间群下的初始气体-水共晶结构受力平衡，获取最低总能量空间群下能量最低的初始气体-水共晶结构，作为最佳绝缘气体-水共晶结构。

S124，根据分子动力学及密度泛函方法，对所述最佳气体-水共晶结构进行反应路模拟，获取所述最佳气体-水共晶结构的全部分解路径。

请参阅图5至图8所示，在本实施例中，获取所述最佳气体-水共晶结构的所有分解路径包括：

S1241，将所述最佳气体-水共晶结构的能量初始化，确保所述最佳气体-水共晶结构所在的环境在升温前的平衡。

具体的，首先将时间步长设置为0.1fs，测试原子力场收敛至每原子10^-1～10^-2au，进行能量初始化

分子动力学模拟验证体系的热力学稳定性，在正则系综下，采用动力学模拟确定结构在低温环境下稳定存在的基础上，再逐步升温进行动力学模拟。

S1242，在正则系综下，设置初始温度、模拟步数和温度间隔，以初始温度作为第一个温度进行动力学模拟，随后以确定的温度间隔对所述最佳气体-水共晶结构所在的环境进行逐步升温，直至获得气体与水分子中羟基自由基的全部分解路径。

具体的，在正则系综下，以500K为第一个温度进行2ps共两万步的动力学模拟，随后以500K为间隔升温，直至3000K。为了加快反应进程，更快得到完整分解轨迹，温度在2000K以下时模拟步数较少，为20000～40000步，高温下模拟步长较长，为60000-80000步。总模拟时长为26ps(260000步)的总步长，获取所述最佳气体-水共晶结构的全部分解路径。

根据分解过程，将C₄F₇N与-OH所有反应过程总结成三条分解路径：

第一条分解路径：在反应的初期，H₂O分解生成-OH，链反应a为-OH进攻最弱C-CN键以生成HOCN和-CF(CF₃)₂活性片段。

第二条分解路径：链反应b为水分子中氧原子的孤对电子靠近缺中心电子的-CF(CF₃)₂活性片段，其中C-(CF₃)键的裂解伴随着C-OH₂键的形成同时进行。

第三条分解路径：由于氧与-CF(CF₃)₂活性片段之间的协同相互作用触发H自由基与-CF(CF₃)₂片段共同争夺F原子的反应，最终-H与-F结合形成HF。

三条路径为C₄F₇N与-OH的可能反应机制，不同的触发机制需要经过不同的决速步、过渡态，因此越过的反应势垒也不同。

S125，获取所有分解路径的速率常数并对比，选取速率常数最小的为所述最佳气体-水共晶结构反应的决速步。

其中，速率常数通过以下公式获取：

式中，k表示为速率常数，A表示为阿伦尼乌斯常数，E_a表示为分解活化能，R表示为摩尔气体常量，T表示为热力学温度，e表示为自然对数的底数。

在本实施例中，计算得到第一条分解路径Path(a)、第二条分解路径Path(b)和第三条分解路径Path(c)在298K处的速率常数分别为3.14×10^-15，6.26×10^-4，1.92×10^-8。其中第一条分解路径Path(a)的速率常数最小，最终确定第一条分解路径Path(a)为反应的决速步。

S126，获取所述最佳气体-水共晶结构反应的决速步的反应速率常数；以及根据所述反应速率常数获取气体的大气寿命。

根据其中过渡态理论(Transition state theory,TST)，计算所述最佳气体-水共晶结构反应的决速步的反应速率常数。具体的，所述反应速率常数通过以下公式获取：

式子，k_OH为反应速率常数，k_B为Boltzmann常数，h为普朗克常数，c'为标准气体浓度，R表示为摩尔气体常量，T表示为热力学温度，Δ_r ^≠G^Θ为标准摩尔活化Gibbs自由能，exp为指数函数。

根据E.S.C.Kewok和R.Atkinson提出的大气寿命计算公式，计算C₄F₇N的大气寿命。具体的，绝缘气体的大气寿命通过以下公式获取：

式中，τ表示为大气寿命，k_OH为反应速率常数，c_OH为大气中-OH的浓度为1×106mol·cm^-3，α'为经验参数取值为2.1。经过计算C₄F₇N的大气寿命为21.2年。

S127，获取所述气体分子优化结构的红外光谱，并根据所述红外光谱获取波段，并根据所述波段获取每单位横截面的光谱分辨辐射强迫。

在本实施例中，气体分子优化结构在优化环境中，可自动获取气体分子优化结构的红外光谱，如图8所示。具体的，优化环境为Gaussian 16。

根据红外光谱的波峰，确定波段，并根据波段查询每单位横截面Wm^-2cm(cm²·molecule^-1)^-1的光谱分辨辐射强迫。

S128，根据所述波段和所述光谱分辨辐射强迫，获取气体分子优化结构的辐射效率。

具体的，所述气体分子优化结构的辐射效率，通过以下公式获取：

式中，RE为辐射效率，F_i为每单位横截面的光谱分辨辐射强迫，i为波段，Δv为波数增量，取值为1cm^-1，σ_i为波段i在波数增量Δv上取平均值的吸收截面。

其中，绝缘气体的全球变暖潜能值GWP通过以下公式获取：

式中，T0为时间周期，一般为100年，AGWP为100年CO₂的全球变暖潜能值，根据IPCC在2018年的报告，该值为9.17×10^-14W·m^-2·yr^-1·kg^-1。最终计算得到C₄F₇N的GWP为2153。

对比例1：基于基团贡献法的C₄F₇N的GWP计算方法

采取基团贡献法对C₄F₇N分子在大气中与OH自由基的反应速率常数k_OH1进行计算，其中，k_OH1＝K₁+K₂+K₃+K₄，K₁为OH自由基从C-H和O-H键中吸收H原子的速度，K₂为OH自由基与气体中不饱和碳碳双键与三键的反应速度，K₃为OH自由基与气体中芳香环反应的速度，K₄为OH自由基与气体中含有N、P、S元素官能团的反应速度。根据分子中不同基团与-OH的反应速率计算出k_OH((CF₃)₂CFCN)＝6.1×10^-16cm³molecule^-1s^-1，利用CH₃CCl₃的大气寿命作为参考，根据以下公式估算C₄F₇N的大气寿命。

式中，τ_OH((CF₃)₂CFCN)为基于基团贡献法计算得到的C₄F₇N的大气寿命，k_OH(CH₃CCl₃)取值为6.03×10^-15cm³molecule^-1s^-1，τ_OH(CH₃CCl₃)为CH₃CCl₃的大气寿命为5年，得到基于基团贡献法计算得到的C₄F₇N的大气寿命约为49年。

获取C₄F₇N分子结构的波段，并根据所述波段获取每单位横截面的光谱分辨辐射强迫，再根据辐射效率计算公式，得到C₄F₇N分子结构的辐射效率为0.21W·(m²·ppbv)^-1。C₄F₇N的大气寿命和辐射效率，根据全球变暖潜能值计算公式，得到基于基团贡献法的C₄F₇N的GWP为680。

对比例2：基于传统过渡态法的C₄F₇N的GWP计算方法

基于OH自由基能与C₄F₇N通过氢键作用能够形成复合物，且具有强活性的OH自由基可以催化C₄F₇N在大气环境催化下的分解，可以猜测得到一系列C₄F₇N在OH自由基作用下分解的可能路径。并在M062X/Aug-cc-pVTZ计算水平上，使用传统过渡态理论计算所有可能路径的反应能垒和决速步反应速率常数。再根据反应速率常数计算C₄F₇N的大气寿命。采用Pinnock提出计算辐射效率方法计算得到C₄F₇N的辐射效率为0.21。最终将大气寿命值和辐射效率值带入GWP公式，计算得到C₄F₇N的大气寿命为47年。最后，将辐射效率值和大气寿命值值代入GWP计算公式，可得基于传统过渡态法的C₄F₇N的GWP为1597。

请参阅表3，对比例1和2与发明相比，本发明估算的GWP更接近实验数据。

表3对比例1和2与本发明估算的GWP对比

	基团贡献法	过渡态法	实施例1	文献值
					GWP	1564	1597	2153	2090

在本发明的一实施例中，对于缺少绝缘强度的气体分子，通过以下步骤获取：采用M06-2X/6-311++G**方法计算出分子的偶极矩α₀和绝热电离能ε_j，然后通过以下公式计算出绝缘强度值E_cal：

E_cal＝k'α₀ ^l(ε_j)^m；

其中，k'，l，m，为不同的校正系数，可以通过已知绝缘强度分子的值进行拟合。在本实施例中，获取气体分子的绝缘强度的方法，为现有技术，在此不再详细叙述。

S200，将所述基础库中的气体分子用分子描述符表示，生成分子数据矩阵；并将所述分子数据矩阵划分为训练库和测试库。

在本实施例中，气体分子的结构决定了其性质，但计算机并不能直接识别其分子坐标，需要提取其结构的内在拓扑信息，生成一个数据矩阵作为深度学习模型的分子描述符。具体的，使用Python语言，编写一个小分子描述符的生成程序：输入所述基础库中的气体分子的分子坐标，将分子结构转化成多种分子描述符作为输出，且分子描述符以数据矩阵的形式呈现，从而实现批量小分子描述符的生成。多种分子描述符决定了输入信息的精准程度，为了兼顾效率及精度采用多种物理及化学信息分子描述符的组合，具体的，多种分子描述符包括库伦矩阵、CORINA描述符、MACCS指纹和Morgan指纹。

S300，搭建深度学习模型，所述训练库用于训练所述深度学习模型，并使用训练后的深度学习模型中的专家系统评估所述测试库中气体分子的性能指标，并与真实值比较，评估预测精度；不断更新深度学习模型的参数，直至评估预测精度达到预测标准，将此时的深度学习模型作为最佳深度学习模型。

在本实施例中，所述深度学习模型平台使用Python语言，在Linux系统下编写程序，其主要由3个部分组成：1)输入层，将所述分子描述符作为输入层。2)中间隐藏层，即所选取的神经网络模型，其决定了深度学习模型的学习程度，采用DNN多层全连接的神经网络模型。隐藏层决定了深度学习模型的智商，网络模型简单则训练速度快，但预测精度难以保证，网络模型过于复杂则训练成本难以承受，通过不断的测试寻找一个能接受的平衡点。3)输出层，输出电气环保性质的性能指标。采用测试库不断对搭建好的深度学习模型进行测试并与真实值比较，通过计算平均绝对误差(Mean absolute error，MAE)和决定系数R²来评估深度学习模型的效果，通过不断调整参数，达到最佳预测精度。

S400，将所述基础库中的气体分子通过官能团置换方法批量生成新的小分子结构，形成气体分子目标库。

在本实施例中，气体分子目标库是基于已有的基础库的气体分子，采用python语言编写气体分子智能生成程序，并采用官能团置换方法在原有的气体分子的基础上批量生成新的小分子结构，将原有的气体分子不断的重新排列组合，形成新的气体分子结构，且原有的气体分子在重新排列的组合时，符合Lewis八电子规则和杂化轨道理论。具体的，输入基础库中的气体分子；设置置换规则，生成新的小分子结构需满足Lewis八电子规则和杂化轨道理论；通过官能团置换方法，在满足置换规则的基础上，批量置换分子结构；输出符合置换规则的新的气体分子结构，形成所述成气体分子目标库；且所述成气体分子目标库中的气体分子均采用B3LYP/6-311G*方法进行结构优化，确定其基态几何构型。其中，在批量生成的过程中，不对官能团置换进行打分，而是采用穷举法生成尽可能多的分子结构。

S500，采用所述最佳深度学习模型对所述气体分子目标库的气体分子进行筛选，设定筛选综合性能指标，通过所述筛选综合性能指标对初步筛选结果进行排序，设定评估界线，输出处于所述评估界线内的潜在绝缘替代气体。

在本实施例中，在所述最佳深度学习模型对所述气体分子目标库的气体分子进行筛选时，首先将获取所述气体分子目标库的气体分子的分子坐标，再将所述气体分子目标库的气体分子的分子坐标转化成多种分子描述符作为输出，并输入至最佳深度学习模型的输入层中。

其中，所述筛选综合性能指标为：绝缘性能：60％；液化温度：20％；GWP：20％。在本实施例中，评估界线为通过筛选综合性能指标对初步筛选结果进行排序后的前500个，即前500个气体分子为潜在绝缘替代气体，并将其输出，进行下一步评估。

在本实施例中，对所述潜在绝缘替代气体，分别针对性能指标进行评估，使用的方法为，针对对于缺少液化温度的气体分子、缺少GWP的气体分子以及缺少绝缘强度的气体分子的获取方法一致。评估线为，对于这500个潜在绝缘替代气体进行性能指标评估后，所述筛选综合性能指标进行排序，对于排名前5的潜在绝缘替代气体为高性能潜在绝缘替代气体。

在本实施例中，对于气体分子性质预测这样的复杂问题，深度学习通过学习数据样本的特点，能够自动寻找气体分子的特征而无需手动设计。也可以通过增加神经网络中的隐藏层进而提取更深层次的特征，显著提升模型的预测能力和分类能力。

目前深度学习在推荐、分类、目标检测、语音识别、图像分割、药物活性预测等方面取得了较大的突破。常见的深度学习模型主要分为无监督学习模型和监督学习模型，在监督学习中，计算机从过去的数据中学习，并将学习的结果应用到当前的数据中，以预测未来的事件。而无监督学习是使用既未分类也未标记的数据进行自行学习。机器必须能够对数据进行分类，而无需事先提供任何有关数据的信息。对于绝缘气体的分子信息，无监督学习能够打破原有学习的思维定势，从数据中找到有用的见解进行学习，更适用于SF₆的环保代替气体的预测。深度神经网络作为最常见的无监督深度学习方法具备至少一个隐层的神经网络，能够为复杂非线性系统提供建模，但多出的层次为模型提供了更高的抽象层次，因而能够提高模型的预测能力。因此可以采用DNN的方法搭建深度学习系统。

基于深度学习的绝缘气体分子筛选系统首先需要大量的已知案例进行训练，数据的可靠程度及数量会影响训练质量，并决定系统的最终性能。因此在采用筛选系统之前需要建立绝缘气体分子的基础库。可以通过调研、查阅大量文献查询相关绝缘气体分子数据及其理化性质，但往往会存在经典的气体分子缺少相关理化性质。量子化学及分子动力学模拟等方法能够从电子和原子的角度分析气体分子，预测分子的性能。因此，对于缺少相关理化性质的气体分子，采用高精度量子化学和分子动力学方法进行评估。

气体分子的结构决定了其性质，在使用深度学习系统预测绝缘气体系统时，计算机并不能直接识别其分子坐标，需要提取分子结构的内在拓扑信息，生成一个数据矩阵作为深度学习系统的分子描述符。分子描述符分为物理描述符如库伦矩阵和多张力表示等，及化学信息描述符如，分子存取系统结构密钥、拓扑指纹、摩根指纹等。分子描述符如果过于简单，会影响深度学习的预测精度。如果过于复杂，则深度学习系统很难训练成功，难以收敛。因此需要采用Python语言编写程序，通过输入分子坐标，输出多种分子描述符，从而实现批量小分子描述符的生成。

深度学习专家系统训练过程非常耗时，但训练完成后对气体分子电气环保性能指标的预测非常快，可以实现对所有可能气体分子的“海选”。因此，首先要确立“海选”对象，即气体分子目标库。对于分子目标库的建立可以通过编写气体分子智能生成程序，基于已有的小分子库采用官能团置换方法在原有气体分子的基础上批量生成新的小分子结构。

因此，本发明提供了一种基于大数据与深度学习算法相结合的方法，通过高通量搜索，预测出各方面性能指标都比较优异的SF₆新型环保替代气体，为SF₆环保替代气体的探索提供新思路。可减少大规模的实验测试，在很大程度上加快了新分子的研发周期。但本实例仅限于为实现SF₆的环保替代提供理论支撑，降低实验试错法的时间成本，最终预测出的气体分子还需进行实验验证。

全面达到SF₆的环保替代气体可能存在于浩如烟海的文献及小分子数据库中，但其作为绝缘气体方面的物理化学性质并未被研究，有待人们去挖掘。或者全面达到SF₆的环保替代气体只在理论上存在，但尚未被人研究过，文献及小分子数据库中没有记录，但可以通过高通量分子设计法构建出来。因此可以通过对文献及小分子数据进行筛选过着通过高通量分子设计寻找到可以全面达到SF₆的环保替代气体。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内，不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

以上所述实施例仅表示发明的实施方式，本发明的保护范围不仅局限于上述实施例，对于本领域的技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明保护范围。

Claims

1.一种基于深度学习的新型环保绝缘气体分子筛选方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于深度学习的新型环保绝缘气体分子筛选方法，其特征在于，所述基础库中气体分子的结构类型，从以下方式产生：

f)调研、检索近半个世纪以来绝缘气体研发方面的文献、技术报告和专利，收集相关绝缘分子数据；

g)检索文献、分子理化性质数据库和物理化学手册，收集小分子的电气环保相关理化性质，且无论是否可以作为绝缘气体；

h)对于比较典型的气体分子类型，但缺少电气环保相关理化性质数据，采用高精度量子化学及分子动力学模拟的方法进行评估。

3.根据权利要求2所述的基于深度学习的新型环保绝缘气体分子筛选方法，其特征在于，对于缺少液化温度的气体分子，通过以下步骤获取：

4.根据权利要求3所述的基于深度学习的新型环保绝缘气体分子筛选方法，其特征在于，所述获取所述最佳液化温度预测模型，包括：每调整一次初始气体晶体结构的力场参数，更新一次初始液化温度预测模型，且每更新一次，均对初始气体晶体结构进行一次能量初始化，并计算相应的平均相互作用力和密度，直至平均相互作用力和密度分别与所述分子力学环境气体晶体结构的平均相互作用力和密度相近，将此时拟合的液化温度预测模型为最佳液化温度预测模型。

5.根据权利要求3所述的基于深度学习的新型环保绝缘气体分子筛选方法，其特征在于，在进行升温模拟时，包括以下步骤：

在进行降温模拟时，包括以下步骤：

设置降温步长，待测气体分子完全汽化后，再逐步降温；

6.根据权利要求2所述的基于深度学习的新型环保绝缘气体分子筛选方法，其特征在于，对于缺少GWP的气体分子，通过以下步骤获取：

7.根据权利要求6所述的基于深度学习的新型环保绝缘气体分子筛选方法，其特征在于，所述构建初始气体-水共晶结构包括：在全局力场下，获取所述气体分子优化结构和所述水分子之间的作用力；并基于蒙特卡洛的算法，预测作用力分别在C2/c空间群、P1空间群、P21空间群、P2/c空间群和P212121空间群下所有作用之间的组合堆叠，获取多个初始气体-水共晶结构，并对每个空间群下初始气体-水共晶结构的总能量进行排序，获取最低总能量空间群下的初始气体-水共晶结构。

8.根据权利要求6所述的基于深度学习的新型环保绝缘气体分子筛选方法，其特征在于，采用超软赝势使最低总能量空间群下的初始气体-水共晶结构受力平衡，获取最低总能量空间群下能量最低的初始气体-水共晶结构，作为最佳绝缘气体-水共晶结构。

9.根据权利要求6所述的基于深度学习的新型环保绝缘气体分子筛选方法，其特征在于，获取所述最佳气体-水共晶结构的所有分解路径包括：

10.根据权利要求1所述的基于深度学习的新型环保绝缘气体分子筛选方法，其特征在于，所述形成气体分子目标库包括：

输入基础库中的气体分子；