CN113780522B - 基于深度神经网络的托卡马克等离子体大破裂预测算法 - Google Patents
基于深度神经网络的托卡马克等离子体大破裂预测算法 Download PDFInfo
- Publication number
- CN113780522B CN113780522B CN202110992488.0A CN202110992488A CN113780522B CN 113780522 B CN113780522 B CN 113780522B CN 202110992488 A CN202110992488 A CN 202110992488A CN 113780522 B CN113780522 B CN 113780522B
- Authority
- CN
- China
- Prior art keywords
- matrix
- neural network
- layer
- value
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于等离子体物理领域,具体为基于深度神经网络的托卡马克等离子体大破裂预测算法,训练数据集准备、进行神经网络模型创建及预测计算,之后进行模型参数训练,神经网络模型训练完成后,将参数输入神经网络模型进行计算,便可以获得实时的破裂可能性值。针对聚变装置的数据特点进行了定制化优化的神经网络模型,这一模型可以简便地接入不同类型地控制和诊断信号,克服了标准神经网络模型对数据源的限制问题,也令神经网络更加适用于处理长序列、多模态、多噪声标签的聚变数据,最终在破裂预测任务上实现了提前30ms,96.1%预测正确率的效果。
Description
技术领域
本发明属于等离子体物理领域,具体涉及一种基于深度神经网络的托卡马克等离子体大破裂预测算法。
背景技术
现有技术的托卡马克等离子体大破裂预测技术可以大致分为两类:(1)传统机器学习方法;(2)基于标准神经网络方案的方法。
基于传统机器学习的预测方法通过一些破裂相关的物理分析,得到若干低维度的与破裂有较为直接关联性的物理量,例如密度与Greenwald密度极限的比值、锁模幅值等,然后通过随机森林、支持向量机、全连接神经网络等传统机器学习算法综合各个相关量给出破裂发生的可能性。而基于标准神经网络方案的方法则适当减少对手动提取物理特征过程的依赖,收集例如安全因子剖面分布,密度剖面分布等维度较高,更细致刻画等离子体本身性质的数据,通过深度神经网络的特征提取能力,令网络自行学习与破裂相关的特征,并用于预测破裂事件。
基于传统机器学习的预测方法在2010年前后得到了充分的研究,但最终被发现缺少在装置间的泛化能力,并且正确率本身存在瓶颈难以突破。这一方面来源于与破裂相关的物理特征的提取方法在不同装置上存在较强的特异性,一方面也来源于传统机器学习算法对复杂问题的解析能力不足。因此这一类技术在解决未来聚变堆破裂问题上很难起到实质性的帮助。
基于标准神经网络方案的方法是目前的主流技术方案,这一方案通常利用计算机领域用于处理图像和文本数据的卷积神经网络和循环神经网络来从等离子体物理性质数据中提取与破裂相关的物理信息,但这些标准神经网络对输入数据的数值分布性质的有较高的要求,托卡马克上的控制和诊断信号种类非常繁多,使得标准神经网络能够利用的数据源非常有限,聚变数据的长序列、多模态、多噪声标签等特点也都限制了标准神经网络方案在破裂预测任务上的表现。
发明内容
本发明的目的是提供一种基于深度神经网络的托卡马克等离子体大破裂预测算法,能够解决标准神经网络模型对数据源的限制问题,提高预测正确率。
本发明的技术方案如下:
基于深度神经网络的托卡马克等离子体大破裂预测算法,包括如下步骤:
步骤一、训练数据集准备;
获取托卡马克装置历史放电中与破裂相关的各个诊断和控制系统的信号;
采集多次历史放电中的时间序列数据,形成训练数据集;
步骤二、神经网络模型创建及预测计算
神经网络模型的层序列包括一维卷积层、批归一化层、全连接层和循环神经网络层;
2.1利用神经网络层序列进行计算,得到低采样率输入的时序特征显著性矩阵;
2.2利用神经网络层序列进行计算,得到高采样率输入的时序特征显著性矩阵;
2.3将步骤2.1和步骤2.2的矩阵输出进行拼接,经神经网络层序列进行计算,得到最终的神经网络模型输出,即破裂可能性值;
步骤三、进行模型参数训练
3.1根据每个神经网络层的输入和输出矩阵规模,利用Glorot初始化法给定参数矩阵的初始化值
3.2随机抓取训练数据集中的时间序列数据,随机截取时间长度一端,构成一个训练批次的数据,其包括输入矩阵A、输入矩阵C和输出标签L,以及权重矩阵Weight;其中A和C来自于对历史数据库的采集,L由该数据来源的放电实验是否发生了破裂决定,如果数据来源的实验发生了破裂,且数据对应的时间距离破裂不超过0.1秒,则L取值为1,否则为-1;如果数据来源的实验发生了破裂,且数据对应的时间距离破裂在0.03秒和0.2秒之间,则Weight取值为0,否则取值为1。
3.3将一个训练批次的数据输入神经网络模型进行计算,神经网络对每个A和C的值得出计算结果Y,将Y与标签L求hinge loss,并以Weight加权,则会得到本批次的预测损失,如下式所示。
Loss=max(1,1-Y*L)*Weight
3.4更新神经网络模型的权重参数W*
B*的计算方式与W*完全相同,将公式中的W替换为B即可;
其中η代表梯度下降法的步长,用于确定最小化预测损失,Loss为前一步骤计算的预测损失;
步骤3.5反复执行3.2-3.4步骤,直到损失函数不再下降,或者整个训练集的数据都被抓取过20次以上,则停止训练;
步骤四、推理阶段实时化部署
神经网络模型训练完成后,将参数输入神经网络模型进行计算,便可以获得实时的破裂可能性值。
步骤一所述的各个诊断和控制系统的信号为单值浮点数和浮点数向量。
所述的单值浮点数为15道1kHz信号,包括等离子体电流、等离子体电流与预设电流差值、等离子体环压、环向磁场、欧姆场线圈电流、Bolometer系统平均辐射水平、中平面电子线积分密度、0-5千电子伏能区硬X射线水平、5-10千电子伏能区硬X射线水平、ECRH加热系统加热功率、NBI加热系统加热功率、等离子体储能、等离子体水平位移、等离子体垂直位移和等离子体归一化比压;所述的浮点数向量为6道10kHz信号,包括偏滤器去氘α线辐射强度、软X射线中平面线积分强度、对称位置极向磁探针一对和对称位置环向磁探针一对。
所述的采集多次历史放电中的时间序列数据,形成训练数据集中,采集的时间区间从每一次放电过程等离子体电流达到预设平顶段开始,到等离子体电流持续10ms以上偏离预设值超过20kA为止。
所述的采集多次历史放电中的时间序列数据,形成训练数据集中,获得3805个时间序列数据,每个时间序列数据的长度范围为50ms—3000ms,每毫秒为一个时间节点,对应15个单值浮点数和6个长度10的浮点数向量,所有时间序列数据构成训练数据集。
所述步骤2.1中的神经网络层序列包含两个并行的循环神经网络层;
神经元数量为16的循环神经网络层;
神经元数量为16的循环神经网络层;
将获得的15个单值浮点数对应输入15个并行的神经网络层序列进行计算,得到低采样率输入的时序特征显著性矩阵,其为15*1的矩阵输入转换为15*16的矩阵输出。
所述步骤2.2中的神经网络层序列为6个并行的神经网络层,即
卷积核数量为32、卷积核宽度为3的一维卷积层;
卷积核数量为32、卷积核宽度为3的批归一化层;
卷积核数量为64、卷积核宽度为3的一维卷积层;
卷积核数量为64、卷积核宽度为3的批归一化层;
卷积核数量为64、卷积核宽度为3的一维卷积层;
卷积核数量为64、卷积核宽度为3的批归一化层;
将获得的6个长度10的浮点数向量对应输入6个并行的神经网络层序列进行计算,得到高采样率输入的时序特征显著性矩阵,其为6*32的矩阵输出。
所述步骤2.3中,将步骤2.1和步骤2.2的矩阵输出进行拼接,得到长度432的一维向量,所述的神经网络层序列包括
神经元数量为128的循环神经网络层;
神经元数量为128的循环神经网络层;
神经元数量为32的全连接层;
神经元数量为32的全连接层;
神经元数量为1的全连接层。
所述步骤二中一维卷积层用于提取一维数据的局部特征,公式如下。
其中,X为前一神经网络层的输出,为I*J的二维矩阵,I为模型输入数据的宽度,J为输入的通道数;X(i+n,j)表示X矩阵中坐标为(i+n,j)的值,i取值范围为[0,I);n的取值范围为[0,N);
W为卷积层的权重矩阵,为M*N*J的三维浮点数矩阵,其中M表示卷积核的个数,N表示卷积核的宽度;
Y为一维卷积层的输出数据,为I*M的浮点数矩阵,Y(i,m)表示Y矩阵中坐标为(i,m)的值,i取值范围是[0,I),而m取值范围为[0,M);
B为卷积层的偏置矩阵,为M的一维浮点数矩阵,B(m)表示矩阵中坐标为(m)的值。
所述步骤二中批归一化层的作用一方面是平滑神经网络的损失函数随权重的分布从而加速训练,一方面是拉近不同来源数据的分布差异,便于进行合并计算,公式如下;
其中,X为前一神经网络层的输出,为I*J的二维矩阵,I为模型输入数据的宽度,J为输入的通道数,W为卷积层的权重矩阵,为M*N*J的三维浮点数矩阵,其中M表示卷积核的个数,N表示卷积核的宽度;B为卷积层的偏置矩阵,为M的一维浮点数矩阵;Y为一维卷积层的输出数据,为I*M的浮点数矩阵;
X(i,j)和Y(i,j)分别表示矩阵X和Y中坐标为(i,j)的值,其中i的取值范围为[0,I),j的取值范围为[0,J),μ(j)表示第j个通道上的输入的平均值;σ表示各个通道上输入标准差的矩阵,σ(j)表示第j个通道上的输入的标准差。
所述步骤二中全连接层的作用是综合输入数值的全局特征,分析并计算最终输出,公式如下;
其中,X为前一神经网络层的输出,为I*J的二维矩阵,I为模型输入数据的宽度,J为输入的通道数,W为卷积层的权重矩阵,为M*N*J的三维浮点数矩阵,其中M表示卷积核的个数,N表示卷积核的宽度;B为卷积层的偏置矩阵,为M的一维浮点数矩阵;Y为一维卷积层的输出数据,为I*M的浮点数矩阵;
X(i)表示X矩阵中坐标为(i)的值,W(i,j)表示W矩阵中坐标为(i,j)的值,其中i,j的取值范围分别是是[0,I),[0,J);B(j)表示矩阵中坐标为(j)的值;Y(j)表示Y矩阵中坐标为(j)的值。
所述步骤二中循环神经网络层是2个全连接层的组合,输入数据会拼接上一个相同矩阵尺寸的隐藏状态矩阵再进行2个全连接层的计算,一个全连接层的输出会留存在神经网络内部,作为下一次计算时的隐藏状态矩阵,另一个全连接层的输出则作为本层的输出结果。
包括步骤四中,在托卡马克控制系统中设置一个阈值,当破裂预测算法的输出超过这一阈值便发送触发脉冲给MGI系统,进行破裂缓解,便可达到预期的破裂防护效果。
阈值的取值位于[-1,1]区间。
若希望减少系统误报警的频率,便可适当调高阈值,若希望减少漏报警的频率,便适当调低阈值。
以0.1的步长调整阈值。
本发明的显著效果如下:
针对聚变装置的数据特点进行了定制化优化的神经网络模型,这一模型可以简便地接入不同类型地控制和诊断信号,克服了标准神经网络模型对数据源的限制问题,也令神经网络更加适用于处理长序列、多模态、多噪声标签的聚变数据,最终在破裂预测任务上实现了提前30ms,96.1%预测正确率的效果,在解决未来聚变堆破裂问题上能够起到更加关键的帮助。具体为:
1)与本领域现有技术相比,本发明提出的计算模型充分考虑了聚变装置数据的特殊性,针对多模态、长序列、多标签噪声、数据源存在时间演化现象等特性对标准神经网络方法进行重构设计,从而能够在处理聚变装置数据时有更加稳定且优异的效果。在托卡马克等离子体大破裂预测任务上获得了很高的预测正确率。
2)提出的计算模型可以较为简单地进行各种不同数据源的添加和移除,从而可以更加简便地进行装置间的移植,也便于通过拓展数据源进一步提升计算模型的表现。
附图说明
图1为实施例结果示意图。
具体实施方式
下面通过附图及具体实施方式对本发明作进一步说明。
步骤一、训练数据集准备
步骤1.1、从托卡马克历史数据库中获取历史放电中与破裂相关的各个诊断和控制系统的信号,信号名、采样频率;
本实施例中,获取的历史放电数据如下:
单值浮点数
等离子体电流:1kHz(千赫兹);
等离子体电流与预设电流差值:1kHz;
等离子体环压:1kHz;
环向磁场:1kHz;
欧姆场线圈电流:1kHz;
Bolometer系统平均辐射水平:1kHz;
中平面电子线积分密度:1kHz;
0-5千电子伏能区硬X射线水平:1kHz;
5-10千电子伏能区硬X射线水平:1kHz;
ECRH加热系统加热功率:1kHz;
NBI加热系统加热功率:1kHz;
等离子体储能:1kHz;
等离子体水平位移:1kHz;
等离子体垂直位移:1kHz;
等离子体归一化比压:1kHz;
浮点数向量
偏滤器去氘α线辐射强度:10kHz
软X射线中平面线积分强度:10kHz;
对称位置极向磁探针一对:10kHz,2道;
对称位置环向磁探针一对:10kHz,2道;
全部输入信号共计15道1kHz信号,6道10kHz信号,合并作为破裂预测算法的输入数据,即每毫秒有15个单值浮点数和6个长度10的浮点数向量作为算法输入。
步骤1.2、采集多次历史放电中的时间序列数据,形成训练数据集
采集托卡马克共计3805次历史放电的数据,从中采集前一步骤中提到的全部输入信号通道的数值,采集的时间区间从每一次放电过程等离子体电流达到预设平顶段开始,到等离子体电流持续10ms以上偏离预设值超过20kA为止,获得3805个时间序列数据,每个时间序列数据的长度范围为50ms—3000ms,每毫秒为一个时间节点,对应步骤1.1获得的15个单值浮点数和6个长度10的浮点数向量。这些时间序列数据构成训练数据集。
步骤二、神经网络模型创建及预测计算
神经网络模型包括以下几种功能组合:一维卷积层、批归一化层、全连接层和循环神经网络层,整个神经网络是大量这种组件的组合,结合实施例具体描述几种功能组合构成神经网络模型的方案
一维卷积层:这一组件用于提取一维数据的局部特征,公式如下。
X是组件的输入数据,通常是前一神经网络层的输出,一个浮点数构成、尺寸为I*J的二维矩阵。I表示输入的宽度,通常在神经网络模型的第一层,I即为模型输入数据的宽度,在后续各层中则等于前一层神经网络输出的宽度。J表示输入的通道数,在第一层等于1,在后续各层等于前一层神经网络的卷积核数量及神经元数量。X(i+n,j)表示X矩阵中坐标为(i+n,j)的值,i取值范围为[0,I),所以i+n的值可能会超过矩阵宽度I,当超过时则用第I-1位的值代替。j取值范围为[0,J)。
W和B是神经网络层内部的待定参数。W为卷积层的权重矩阵,是一个尺寸为M*N*J的三维浮点数矩阵,其中M表示卷积核的个数,N表示卷积核的宽度,J与输入数据X的通道数一致,
Y为一维卷积层的输出数据,是一个尺寸为I*M的浮点数矩阵,可以看出输出数据的尺寸会由输入数据X的尺寸及神经网络层参数唯一确定,Y(i,m)表示Y矩阵中坐标为(i,m)的值,i取值范围是[0,I),而m取值范围为[0,M)。
W(m,n,j)表示W矩阵中坐标为(m,n,j)的值;其中m,n,j的取值范围分别是是[0,M),[0,N),[0,J);
B为卷积层的偏置矩阵,是一个尺寸为M的一维浮点数矩阵,B(m)表示矩阵中坐标为(m)的值,m的取值范围为[0,M),目前两个矩阵只有明确的矩阵大小但没有确定的数值,其数值需要通过随机初始化后进行梯度下降法优化来确定,计算方法会在步骤三中给出;
M表示卷积核的个数,N表示卷积核的宽度,为人工设计的神经网络层参数。
当以上参数全部确认后,本层神经网络的输出矩阵尺寸便也确定,为I*M,第一个维度与输入X的宽度一致,第二个维度与卷积核数量一致。
后续创建模型时会反复调用本组件,每次调用时都会用到不同的M,N,I,J值,W、B的取值则在步骤三通过梯度下降法确定,所以在这里只给出符号定义,而不给出具体取值。
批归一化层:本组件的作用一方面是平滑神经网络的损失函数随权重的分布从而加速训练,一方面是拉近不同来源数据的分布差异,便于进行合并计算,公式如下。
X是组件的输入数据,通常是前一神经网络层的输出结果,是一个尺寸为I*J的二维浮点数矩阵,I表示输入的宽度,J表示输入的通道数。批归一化层不会改变输入输出的矩阵尺寸,因此输出数据Y是相同尺寸的浮点数矩阵。X(i,j)和Y(i,j)分别表示矩阵X和Y中坐标为(i,j)的值,其中i的取值范围为[0,I),j的取值范围为[0,J)。
归一化会在通道维度上进行,因此μ表示各个通道上输入平均值的矩阵,μ(j)表示第j个通道上的输入的平均值,j的取值范围是[0,J),σ表示各个通道上输入标准差的矩阵,σ(j)表示第j个通道上的输入的标准差,j的取值范围是[0,J),这些取值将在步骤三中,模型被输入了一批次的数据后,在该批次输入上计算获得。
后续创建模型时会反复调用本组件,具体的μ和σ的取值会在步骤三对具体批次数据计算时确定,所以在这里只给出符号定义,而不给出具体取值。
全连接层:这一组件的功能是综合输入数值的全局特征,分析并计算最终输出。公式如下。
公式中X是组件的输入数据,通常是前一神经网络层的输出,一个浮点数构成、尺寸为I的一维矩阵。I表示输入的宽度,通常在神经网络模型的第一层,I即为模型输入数据的宽度,在后续各层中则等于前一层神经网络输出的宽度。X(i)表示X矩阵中坐标为(i)的值,i取值范围为[0,I)。
W和B是神经网络层内部的待定参数。W为卷积层的权重矩阵,是一个尺寸为I*J的二维浮点数矩阵,其中I即为输入数据的宽度,J表示本层神经元的数量,为人工设计的神经网络层参数。W(i,j)表示W矩阵中坐标为(i,j)的值,其中i,j的取值范围分别是是[0,I),[0,J)。B是全连接层的偏置矩阵,是一个尺寸为J的一维浮点数矩阵,B(j)表示矩阵中坐标为(j)的值,j的取值范围为[0,J),目前两个矩阵只有明确的矩阵大小但没有确定的数值,其数值需要通过随机初始化后进行梯度下降法优化来确定,计算方法会在步骤三中给出。
Y为一维卷积层的输出数据,是一个尺寸为J的浮点数矩阵,可以看出输出数据的尺寸会由神经网络层的神经元数量唯一确定。Y(j)表示Y矩阵中坐标为(j)的值,j取值范围是[0,J)。
后续创建模型时会反复调用本组件,每次调用时都会用到不同的J值,W、B的取值则在步骤三通过梯度下降法确定,所以在这里只给出符号定义,而不给出具体取值。
循环神经网络层:这一神经网络层是2个全连接层的组合,输入数据会拼接上一个相同矩阵尺寸的隐藏状态矩阵再进行2个全连接层的计算,一个全连接层的输出会留存在神经网络内部,作为下一次计算时的隐藏状态矩阵,另一个全连接层的输出则作为本层的输出结果。其涉及到的神经元数量J的定义与全连接层一致。
利用上述几种功能组合构成的神经网络进行预测计算,以下为应用以上功能组合的具体步骤
步骤2.1将步骤1.1获得的15个单值浮点数对应输入15个并行的神经网络层序列进行计算,得到低采样率输入的时序特征显著性矩阵。
每个神经网络层序列包含:
神经元数量为16的循环神经网络层;
神经元数量为16的循环神经网络层。
经过计算,这部分15*1的矩阵输入转换为15*16的矩阵输出,也就是低采样率输入的时序特征显著性矩阵。
步骤2.2将步骤1.1获得的6个长度10的浮点数向量对应输入6个并行的神经网络层序列进行计算,得到高采样率输入的时序特征显著性矩阵;
每个序列包含:
卷积核数量为32、卷积核宽度为3的一维卷积层;
卷积核数量为32、卷积核宽度为3的批归一化层;
卷积核数量为64、卷积核宽度为3的一维卷积层;
卷积核数量为64、卷积核宽度为3的批归一化层;
卷积核数量为64、卷积核宽度为3的一维卷积层;
卷积核数量为64、卷积核宽度为3的批归一化层;
前一神经网络层的输出矩阵在宽度的维度上求平均值;
神经元数量为32的循环神经网络层;
经过计算,这部分6*10*1的矩阵输入转换为6*32的矩阵输出,也就是高采样率输入的时序特征显著性矩阵。
步骤2.3将步骤2.1和步骤2.2的矩阵输出进行拼接,得到长度432的一维向量,这一向量再经过以下神经网络层序列进行计算,得到最终的神经网络模型输出,也就是破裂可能性值;
拼接是指将步骤2.1和步骤2.2输出的15*16、6*32的二维矩阵中的值按照逐行、逐列的顺序在一维向量中重新排列。
神经网络层序列包括:
神经元数量为128的循环神经网络层;
神经元数量为128的循环神经网络层;
神经元数量为32的全连接层;
神经元数量为32的全连接层;
神经元数量为1的全连接层
经过这一系列计算,得到最终的神经网络模型输出。
最终由步骤2.1、步骤2.2和步骤2.3中提及的神经网络层序列形成的神经网络模型,其输入为每个时间节点对应的15个单值浮点数和6个长度10的浮点数向量,输出为1个单值浮点数,对应破裂发生的概率。
但是其中的神经网络层中的W、B等参数矩阵还没有确定,需要通过步骤三的训练得出。
步骤三、模型参数训练
通过在训练数据集上的计算来得到W、B等参数矩阵的具体值,具体的执行步骤如下:
步骤3.1根据每个神经网络层的输入和输出矩阵规模,利用Glorot初始化法给定参数矩阵的初始化值。即如果神经网络层的输入是共计m个数字,输出是共计n个数字,则本层所有参数矩阵的数值通过一个均值为0,方差为2/(m+n)的正态分布随机数给定。
步骤3.2随机抓取训练数据集中的128个时间序列数据,随机截取其中200时间长度的一段,构成一个训练批次的数据,每个批次的数据包含了1个128*200*15*1的输入矩阵A,1个128*200*6*10*1的输入矩阵C,128*200的输出标签L,和128*200的权重Weight。
其中A和C来自于对历史数据库的采集,L由该数据来源的放电实验是否发生了破裂决定,如果数据来源的实验发生了破裂,且数据对应的时间距离破裂不超过0.1秒,则L取值为1,否则为-1。
Weight同样由数据来源的放电实验是否发生了破裂决定,如果数据来源的实验发生了破裂,且数据对应的时间距离破裂在0.03秒和0.2秒之间,则Weight取值为0,否则取值为1。
步骤3.3将一个训练批次的数据输入神经网络模型进行计算,神经网络对每个A和C的值,会给出一个计算结果Y,将Y与标签L求hinge loss(合页损失函数),并以Weight加权,则会得到本批次的预测损失,如下式所示。
Loss=max(1,1-Y*L)*Weight
公式中max表示对括号内的两个数字求最大值,剩余符号与前一步中介绍的一致。
步骤3.4采用梯度下降法进行最小化预测损失,更新神经网络模型的权重参数,即用更新的参数W*和B*替代原本的W、B;
W*的计算方式为,其中η代表梯度下降法的步长,Loss为前一步骤计算的预测损失。
B*的计算方式与W*完全相同,将公式中的W替换为B即可。
步骤3.5反复执行3.2-3.4步骤,直到损失函数不再下降,或者整个训练集的数据都被抓取过20次以上,则停止训练,此时更新的权重参数W即为最终确定的参数,即破裂可能性值;
步骤四、推理阶段实时化部署
在破裂预测算法的神经网络模型训练完成后,在托卡马克控制系统中实时获取输入信号列表对应的数值,也即15个单值浮点数和6个长度10的浮点数向量,将其输入神经网络模型进行计算,便可以获得实时的破裂可能性值,这一数值位于-1到1的区间内,越接近1代表破裂的可能性越大。
在托卡马克控制系统中设置一个阈值,当破裂预测算法的输出超过这一阈值便发送触发脉冲给MGI系统,进行破裂缓解,便可达到预期的破裂防护效果。这一阈值的取值位于[-1,1]区间,若希望减少系统误报警的频率,便可适当调高阈值,若希望减少漏报警的频率,便适当调低阈值,具体取值可在实际应用中随时按需调整。通常以0.1的步长调整阈值。
如图1所示,给出了实施例结果示意图,显示破裂预警任务的测试效果。
在破裂放电(a)Shot 35033中,系统输出在破裂发生前一段时间上升到警戒线以上,触发破裂预警;
在非破裂放电(b)Shot 35175中,系统输出持续处于较低的水平,不干扰正常放电的进行。
Claims (11)
1.基于深度神经网络的托卡马克等离子体大破裂预测算法,其特征在于,包括如下步骤:
步骤一、训练数据集准备;
获取托卡马克装置历史放电中与破裂相关的各个诊断和控制系统的信号;
采集多次历史放电中的时间序列数据,形成训练数据集;
步骤二、神经网络模型创建及预测计算
神经网络模型的层序列包括一维卷积层、批归一化层、全连接层和循环神经网络层;
2.1利用神经网络层序列进行计算,得到低采样率输入的时序特征显著性矩阵;
2.2利用神经网络层序列进行计算,得到高采样率输入的时序特征显著性矩阵;
2.3将步骤2.1和步骤2.2的矩阵输出进行拼接,经神经网络层序列进行计算,得到最终的神经网络模型输出,即破裂可能性值;
步骤三、进行模型参数训练
3.1根据每个神经网络层的输入和输出矩阵规模,利用Glorot初始化法给定参数矩阵的初始化值;
3.2随机抓取训练数据集中的时间序列数据,随机截取时间长度一端,构成一个训练批次的数据,其包括输入矩阵A、输入矩阵C和输出标签L,以及权重矩阵Weight;其中A和C来自于对历史数据库的采集,L由该数据来源的放电实验是否发生了破裂决定,如果数据来源的实验发生了破裂,且数据对应的时间距离破裂不超过0.1秒,则L取值为1,否则为-1;如果数据来源的实验发生了破裂,且数据对应的时间距离破裂在0.03秒和0.2秒之间,则Weight取值为0,否则取值为1;
3.3将一个训练批次的数据输入神经网络模型进行计算,神经网络对每个A和C的值得出计算结果Y,将Y与标签L求hinge loss,并以Weight加权,则会得到本批次的预测损失,如下式所示;
Loss=max(1,1-Y*L)*Weight
3.4确定更新后的神经网络模型的权重参数W*和B*
其中,W为卷积层的权重矩阵;B是全连接层的偏置矩阵;B*的计算方式与W*完全相同,将公式中的W替换为B即可;
其中η代表梯度下降法的步长,用于确定最小化预测损失,Loss为前一步骤计算的预测损失;
步骤3.5反复执行3.2-3.4步骤,直到损失函数不再下降,或者整个训练集的数据都被抓取过20次以上,则停止训练;
步骤四、推理阶段实时化部署
神经网络模型训练完成后,将参数输入神经网络模型进行计算,便可以获得实时的破裂可能性值;
步骤一所述的各个诊断和控制系统的信号为单值浮点数和浮点数向量;
所述的单值浮点数为15道1kHz信号,包括等离子体电流、等离子体电流与预设电流差值、等离子体环压、环向磁场、欧姆场线圈电流、Bolometer系统平均辐射水平、中平面电子线积分密度、0-5千电子伏能区硬X射线水平、5-10千电子伏能区硬X射线水平、ECRH加热系统加热功率、NBI加热系统加热功率、等离子体储能、等离子体水平位移、等离子体垂直位移和等离子体归一化比压;所述的浮点数向量为6道10kHz信号,包括偏滤器去氘α线辐射强度、软X射线中平面线积分强度、对称位置极向磁探针一对和对称位置环向磁探针一对;
步骤2.1将步骤1.1获得的15个单值浮点数对应输入15个并行的神经网络层序列进行计算,得到低采样率输入的时序特征显著性矩阵;
步骤2.2将步骤1.1获得的6个长度10的浮点数向量对应输入6个并行的神经网络层序列进行计算,得到高采样率输入的时序特征显著性矩阵;
所述步骤2.1中的神经网络层序列包含两个并行的循环神经网络层;
神经元数量为16的循环神经网络层;
神经元数量为16的循环神经网络层;
将获得的15个单值浮点数对应输入15个并行的神经网络层序列进行计算,得到低采样率输入的时序特征显著性矩阵,其为15*1的矩阵输入转换为15*16的矩阵输出;
所述步骤2.2中的神经网络层序列为6个并行的神经网络层,即
卷积核数量为32、卷积核宽度为3的一维卷积层;
卷积核数量为32、卷积核宽度为3的批归一化层;
卷积核数量为64、卷积核宽度为3的一维卷积层;
卷积核数量为64、卷积核宽度为3的批归一化层;
卷积核数量为64、卷积核宽度为3的一维卷积层;
卷积核数量为64、卷积核宽度为3的批归一化层;
将获得的6个长度10的浮点数向量对应输入6个并行的神经网络层序列进行计算,得到高采样率输入的时序特征显著性矩阵,其为6*32的矩阵输出;
所述步骤2.3中,将步骤2.1和步骤2.2的矩阵输出进行拼接,得到长度432的一维向量,所述的神经网络层序列包括
神经元数量为128的循环神经网络层;
神经元数量为128的循环神经网络层;
神经元数量为32的全连接层;
神经元数量为32的全连接层;
神经元数量为1的全连接层。
2.如权利要求1所述的基于深度神经网络的托卡马克等离子体大破裂预测算法,其特征在于:所述的采集多次历史放电中的时间序列数据,形成训练数据集中,采集的时间区间从每一次放电过程等离子体电流达到预设平顶段开始,到等离子体电流持续10ms以上偏离预设值超过20kA为止。
3.如权利要求2所述的基于深度神经网络的托卡马克等离子体大破裂预测算法,其特征在于:所述的采集多次历史放电中的时间序列数据,形成训练数据集中,获得3805个时间序列数据,每个时间序列数据的长度范围为50ms—3000ms,每毫秒为一个时间节点,对应15个单值浮点数和6个长度10的浮点数向量,所有时间序列数据构成训练数据集。
4.如权利要求1所述的基于深度神经网络的托卡马克等离子体大破裂预测算法,其特征在于:所述步骤二中一维卷积层用于提取一维数据的局部特征,公式如下,
其中,X为前一神经网络层的输出,为I*J的二维矩阵,I为模型输入数据的宽度,J为输入的通道数;X(i+n,j)表示X矩阵中坐标为(i+n,j)的值,i取值范围为[0,I);n的取值范围为[0,N);
W为卷积层的权重矩阵,为M*N*J的三维浮点数矩阵,其中M表示卷积核的个数,N表示卷积核的宽度;
Y为一维卷积层的输出数据,为I*M的浮点数矩阵,Y(i,m)表示Y矩阵中坐标为(i,m)的值,i取值范围是[0,I),而m取值范围为[0,M);
B为卷积层的偏置矩阵,为M的一维浮点数矩阵,B(m)表示矩阵中坐标为(m)的值。
5.如权利要求1所述的基于深度神经网络的托卡马克等离子体大破裂预测算法,其特征在于:所述步骤二中批归一化层的作用一方面是平滑神经网络的损失函数随权重的分布从而加速训练,一方面是拉近不同来源数据的分布差异,便于进行合并计算,公式如下;
其中,X为前一神经网络层的输出,为I*J的二维矩阵,I为模型输入数据的宽度,J为输入的通道数,W为卷积层的权重矩阵,为M*N*J的三维浮点数矩阵,其中M表示卷积核的个数,N表示卷积核的宽度;B为卷积层的偏置矩阵,为M的一维浮点数矩阵;Y为一维卷积层的输出数据,为I*M的浮点数矩阵;
X(i,j)和Y(i,j)分别表示矩阵X和Y中坐标为(i,j)的值,其中i的取值范围为[0,I),j的取值范围为[0,J),μ(j)表示第j个通道上的输入的平均值;σ表示各个通道上输入标准差的矩阵,σ(j)表示第j个通道上的输入的标准差。
6.如权利要求1所述的基于深度神经网络的托卡马克等离子体大破裂预测算法,其特征在于:所述步骤二中全连接层的作用是综合输入数值的全局特征,分析并计算最终输出,公式如下;
其中,X为前一神经网络层的输出,为I*J的二维矩阵,I为模型输入数据的宽度,J为输入的通道数,W为卷积层的权重矩阵,为M*N*J的三维浮点数矩阵,其中M表示卷积核的个数,N表示卷积核的宽度;B为卷积层的偏置矩阵,为M的一维浮点数矩阵;Y为一维卷积层的输出数据,为I*M的浮点数矩阵;
X(i)表示X矩阵中坐标为(i)的值,W(i,j)表示W矩阵中坐标为(i,j)的值,其中i,j的取值范围分别是是[0,I),[0,J);B(j)表示矩阵中坐标为(j)的值;Y(j)表示Y矩阵中坐标为(j)的值。
7.如权利要求1所述的基于深度神经网络的托卡马克等离子体大破裂预测算法,其特征在于:所述步骤二中循环神经网络层是2个全连接层的组合,输入数据会拼接上一个相同矩阵尺寸的隐藏状态矩阵再进行2个全连接层的计算,一个全连接层的输出会留存在神经网络内部,作为下一次计算时的隐藏状态矩阵,另一个全连接层的输出则作为本层的输出结果。
8.如权利要求1所述的基于深度神经网络的托卡马克等离子体大破裂预测算法,其特征在于:步骤四中,在托卡马克控制系统中设置一个阈值,当破裂预测算法的输出超过这一阈值便发送触发脉冲给MGI系统,进行破裂缓解,便可达到预期的破裂防护效果。
9.如权利要求8所述的基于深度神经网络的托卡马克等离子体大破裂预测算法,其特征在于:阈值的取值位于[-1,1]区间。
10.如权利要求9所述的基于深度神经网络的托卡马克等离子体大破裂预测算法,其特征在于:若希望减少系统误报警的频率,便可适当调高阈值,若希望减少漏报警的频率,便适当调低阈值。
11.如权利要求10所述的基于深度神经网络的托卡马克等离子体大破裂预测算法,其特征在于:以0.1的步长调整阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110992488.0A CN113780522B (zh) | 2021-08-27 | 2021-08-27 | 基于深度神经网络的托卡马克等离子体大破裂预测算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110992488.0A CN113780522B (zh) | 2021-08-27 | 2021-08-27 | 基于深度神经网络的托卡马克等离子体大破裂预测算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113780522A CN113780522A (zh) | 2021-12-10 |
CN113780522B true CN113780522B (zh) | 2023-09-08 |
Family
ID=78839613
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110992488.0A Active CN113780522B (zh) | 2021-08-27 | 2021-08-27 | 基于深度神经网络的托卡马克等离子体大破裂预测算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113780522B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116679863B (zh) * | 2023-07-28 | 2023-10-24 | 中国科学院合肥物质科学研究院 | 一种适用于east辐射偏滤器充气系统的数据处理系统 |
CN117371299B (zh) * | 2023-12-08 | 2024-02-27 | 安徽大学 | 一种托卡马克新经典环向粘滞力矩的机器学习方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4650632A (en) * | 1984-04-16 | 1987-03-17 | The United States Of America As Represented By The United States Department Of Energy | Tokamak plasma current disruption infrared control system |
CN101663735A (zh) * | 2007-08-24 | 2010-03-03 | 塞米西斯科株式会社 | 使用智能算法的实时腔室监控方法 |
RU2668231C1 (ru) * | 2017-07-03 | 2018-09-27 | Российская Федерация, от имени которой выступает Государственная корпорация по атомной энергии "Росатом" | Система управления неустойчивостью внутреннего срыва плазмы в режиме реального времени в установках типа токамак |
CN108802650A (zh) * | 2018-07-17 | 2018-11-13 | 中国科学院合肥物质科学研究院 | 一种等离子体内撕裂模磁岛位置的实时探测系统及方法 |
CN111935892A (zh) * | 2019-05-13 | 2020-11-13 | 中科智云科技有限公司 | 用于测量等离子体状态的方法和设备 |
CN112488125A (zh) * | 2020-11-28 | 2021-03-12 | 重庆邮电大学 | 一种基于高速视觉诊断和bp神经网络的重建方法及系统 |
CN112737366A (zh) * | 2020-12-29 | 2021-04-30 | 核工业西南物理研究院 | 一种脉冲发电机供电的晶闸管电源控制系统 |
CN112889090A (zh) * | 2018-08-17 | 2021-06-01 | 道特里斯艾欧公司 | 使用人工智能对物理动态系统执行建模和控制的系统和方法 |
CN112992385A (zh) * | 2021-05-06 | 2021-06-18 | 西南交通大学 | 一种准环对称仿星器磁场位形的设计方法 |
CN113010846A (zh) * | 2021-03-30 | 2021-06-22 | 合肥工业大学 | 一种基于子分类器权重投票的等离子体破裂预测方法 |
KR20210093506A (ko) * | 2020-01-20 | 2021-07-28 | 전홍석 | D+t 연료를 펄스 레이저로 고온 플라즈마로 만들고 이를 초고속 총알로 압축하여 핵융합을 일으키는 핵융합 장치 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200051701A1 (en) * | 2016-03-09 | 2020-02-13 | PineSci Consulting | Methods and apparatus for facilitating localized nuclear fusion reactions enhanced by electron screening |
US10937073B2 (en) * | 2019-01-23 | 2021-03-02 | Intuit Inc. | Predicting delay in a process |
-
2021
- 2021-08-27 CN CN202110992488.0A patent/CN113780522B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4650632A (en) * | 1984-04-16 | 1987-03-17 | The United States Of America As Represented By The United States Department Of Energy | Tokamak plasma current disruption infrared control system |
CN101663735A (zh) * | 2007-08-24 | 2010-03-03 | 塞米西斯科株式会社 | 使用智能算法的实时腔室监控方法 |
RU2668231C1 (ru) * | 2017-07-03 | 2018-09-27 | Российская Федерация, от имени которой выступает Государственная корпорация по атомной энергии "Росатом" | Система управления неустойчивостью внутреннего срыва плазмы в режиме реального времени в установках типа токамак |
CN108802650A (zh) * | 2018-07-17 | 2018-11-13 | 中国科学院合肥物质科学研究院 | 一种等离子体内撕裂模磁岛位置的实时探测系统及方法 |
CN112889090A (zh) * | 2018-08-17 | 2021-06-01 | 道特里斯艾欧公司 | 使用人工智能对物理动态系统执行建模和控制的系统和方法 |
CN111935892A (zh) * | 2019-05-13 | 2020-11-13 | 中科智云科技有限公司 | 用于测量等离子体状态的方法和设备 |
KR20210093506A (ko) * | 2020-01-20 | 2021-07-28 | 전홍석 | D+t 연료를 펄스 레이저로 고온 플라즈마로 만들고 이를 초고속 총알로 압축하여 핵융합을 일으키는 핵융합 장치 |
CN112488125A (zh) * | 2020-11-28 | 2021-03-12 | 重庆邮电大学 | 一种基于高速视觉诊断和bp神经网络的重建方法及系统 |
CN112737366A (zh) * | 2020-12-29 | 2021-04-30 | 核工业西南物理研究院 | 一种脉冲发电机供电的晶闸管电源控制系统 |
CN113010846A (zh) * | 2021-03-30 | 2021-06-22 | 合肥工业大学 | 一种基于子分类器权重投票的等离子体破裂预测方法 |
CN112992385A (zh) * | 2021-05-06 | 2021-06-18 | 西南交通大学 | 一种准环对称仿星器磁场位形的设计方法 |
Non-Patent Citations (1)
Title |
---|
J-TEXT实时破裂预测与避免系统设计与实现;胡斐然;中国博士学位论文全文数据库 (工程科技Ⅱ辑)(第(2019)5期);C040-13 * |
Also Published As
Publication number | Publication date |
---|---|
CN113780522A (zh) | 2021-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113780522B (zh) | 基于深度神经网络的托卡马克等离子体大破裂预测算法 | |
EP3422518B1 (en) | A method for recognizing contingencies in a power supply network | |
CN106570513A (zh) | 大数据网络系统的故障诊断方法和装置 | |
CN110213222A (zh) | 基于机器学习的网络入侵检测方法 | |
CN116229380B (zh) | 一种变电站涉鸟故障相关鸟种识别方法 | |
Blokland et al. | Uncertainty aware anomaly detection to predict errant beam pulses in the Oak Ridge Spallation Neutron Source accelerator | |
CN112215279B (zh) | 一种基于免疫rbf神经网络的电网故障诊断方法 | |
CN112434743A (zh) | 基于gil金属微粒局部放电时域波形图像的故障识别方法 | |
CN110263944A (zh) | 一种多变量故障预测方法和装置 | |
SadeghpourHaji et al. | A wavelet support vector machine combination model for daily suspended sediment forecasting | |
CN113780432B (zh) | 基于增强学习的网络信息系统运维异常智能检测方法 | |
Ren et al. | DLformer: A dynamic length transformer-based network for efficient feature representation in remaining useful life prediction | |
CN110570114A (zh) | 基于可变循环神经网络的电能质量扰动识别方法、系统及介质 | |
CN110163332B (zh) | 一种变压器故障诊断方法 | |
CN113792620B (zh) | 基于深度神经网络的托卡马克边缘局域模实时识别算法 | |
Wang et al. | Positive sequential data modeling using continuous hidden markov models based on inverted dirichlet mixtures | |
CN116597635A (zh) | 无线通讯智能燃气表控制器及其控制方法 | |
CN114565051B (zh) | 基于神经元影响程度的产品分类模型的测试方法 | |
Kim et al. | SIGNAL FAULT IDENTIFICATION IN NUCLEAR POWER PLANTS BASED ON DEEP NEURAL NETWORKS. | |
CN113762475B (zh) | 一种等离子体破裂预测器的预测依据可视化方法 | |
CN115391523A (zh) | 风电场多源异构数据处理方法及装置 | |
Santoso et al. | Nuclear plant fault diagnosis using probabilistic reasoning | |
Zhan et al. | Differential Convolutional Fuzzy Time Series Forecasting | |
Yan et al. | Feature selection for partial discharge diagnosis | |
Zhang et al. | A Pipeline Abnormal Signal Detection Method Based on 1D-Faster R-CNN. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |