CN116680987A - 石墨坩埚的成型方法及其系统 - Google Patents

石墨坩埚的成型方法及其系统 Download PDF

Info

Publication number
CN116680987A
CN116680987A CN202310709330.7A CN202310709330A CN116680987A CN 116680987 A CN116680987 A CN 116680987A CN 202310709330 A CN202310709330 A CN 202310709330A CN 116680987 A CN116680987 A CN 116680987A
Authority
CN
China
Prior art keywords
feature
time sequence
thermal infrared
training
heat treatment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310709330.7A
Other languages
English (en)
Inventor
胡锡莲
朱羽霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningbo Tongyao New Material Technology Co ltd
Original Assignee
Ningbo Tongyao New Material Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo Tongyao New Material Technology Co ltd filed Critical Ningbo Tongyao New Material Technology Co ltd
Priority to CN202310709330.7A priority Critical patent/CN116680987A/zh
Publication of CN116680987A publication Critical patent/CN116680987A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2113/00Details relating to the application field
    • G06F2113/10Additive manufacturing, e.g. 3D printing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/08Thermal analysis or thermal optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/12Timing analysis or timing optimisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Geometry (AREA)
  • Computer Hardware Design (AREA)
  • Crystals, And After-Treatments Of Crystals (AREA)

Abstract

公开了一种石墨坩埚的成型方法及其系统。其首先将多个预定时间点的石墨坩埚的热红外图像分别通过卷积神经网络模型以得到多个热红外分布特征矩阵,接着,将所述多个热红外分布特征矩阵进行池化后通过多尺度邻域特征提取模块以得到热红外分布时序特征向量,然后,将所述多个预定时间点的热处理温度值排列为热处理温度时序输入向量后通过时序编码器以得到热处理时序特征向量,接着,计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到分类特征矩阵,最后,将所述分类特征矩阵通过分类器以得到用于表示当前时间点的热处理温度值应增大或应减小的分类结果。这样,可以提高石墨坩埚的烧结品质和使用寿命。

Description

石墨坩埚的成型方法及其系统
技术领域
本申请涉及智能控制领域,且更为具体地,涉及一种石墨坩埚的成型方法及其系统。
背景技术
石墨具有耐高温、抗氧化、化学性能稳定等特性,因而用石墨做成的坩埚容器,广泛应用于锂电池负极、金刚石炭源材料的提纯、稀土熔炼、贵重金属熔炼等需要高温热处理的行业。
传统制造石墨坩埚的方案,通常是用石墨电极的坯料经机械加工而成。然而用石墨电极加工生产坩埚的方法存在如下问题:电极的利用率较低,受电极成型方式及配方的限制,产物会对环境产生污染,生产效率低下。
针对上述问题,近年来,石墨坩埚的制备方案中出现了一种新型的方法—3D打印。其能够根据石墨坩埚所需尺寸和形状,在计算机辅助设计软件中绘制出石墨坩埚的三维模型,并将三维模型导入到3D打印机中。3D打印机按照预设程序,将石墨粉末逐层喷射到特定位置,并使用激光或其他加热方法,使其烧结成实心坩埚。继而,再将3D打印出来的坩埚进行表面处理,以提高其力学性能和化学稳定性。相比传统方法,3D打印可以实现快速、高效地制造复杂形状的石墨坩埚,而且还具有极高的精度和可控性,有利于提高生产效率。
在使用3D打印方案来制备石墨坩埚的过程中,需要通过将3D打印出来的坩埚放入热处理炉中,在高温下进行长时间的烧结,使得坩埚内部的石墨颗粒充分结合,从而形成实心坩埚。但是,在烧结过程中,石墨坩埚会因温度差异而发生变形和开裂,导致打印出来的坩埚形状不符合预期或者破损。并且,石墨粉末需要被充分烧结成实心坩埚,但是过高的温度容易使得石墨坩埚表面氧化或者出现缺陷,从而降低其品质和使用寿命。
因此,期望一种优化的石墨坩埚的成型方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种石墨坩埚的成型方法及其系统。其首先将多个预定时间点的石墨坩埚的热红外图像分别通过卷积神经网络模型以得到多个热红外分布特征矩阵,接着,将所述多个热红外分布特征矩阵进行池化后通过多尺度邻域特征提取模块以得到热红外分布时序特征向量,然后,将所述多个预定时间点的热处理温度值排列为热处理温度时序输入向量后通过时序编码器以得到热处理时序特征向量,接着,计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到分类特征矩阵,最后,将所述分类特征矩阵通过分类器以得到用于表示当前时间点的热处理温度值应增大或应减小的分类结果。这样,可以提高石墨坩埚的烧结品质和使用寿命。
根据本申请的一个方面,提供了一种石墨坩埚的成型方法,其包括:获取预定时间段内多个预定时间点的热处理温度值和所述多个预定时间点的石墨坩埚的热红外图像;将所述多个预定时间点的石墨坩埚的热红外图像分别通过使用空间注意力模型的卷积神经网络模型以得到多个热红外分布特征矩阵;计算所述多个热红外分布特征矩阵的全局均值以得到热红外全局表征时序输入向量;将所述热红外全局表征时序输入向量通过多尺度邻域特征提取模块以得到热红外分布时序特征向量;将所述多个预定时间点的热处理温度值按照时间维度排列为热处理温度时序输入向量后通过包含全连接层和一维卷积层的时序编码器以得到热处理时序特征向量;计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到分类特征矩阵;以及将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示当前时间点的热处理温度值应增大或应减小。
在上述的石墨坩埚的成型方法中,将所述多个预定时间点的石墨坩埚的热红外图像分别通过使用空间注意力模型的卷积神经网络模型以得到多个热红外分布特征矩阵,包括:所述使用空间注意力模型的卷积神经网络模型的各层在层的正向传递过程中对输入数据分别进行:对输入数据进行卷积处理以生成卷积特征图;对所述卷积特征图进行池化处理以生成池化特征图;对所述池化特征图进行非线性激活以生成激活特征图;计算所述激活特征图的各个位置沿通道维度的均值以生成空间特征矩阵;计算所述空间特征矩阵中各个位置的类Softmax函数值以获得空间得分矩阵;以及
计算所述空间特征矩阵和所述空间得分图的按位置点乘以获得特征矩阵;其中,所述使用空间注意力模型的卷积神经网络模型的最后一层输出的所述多个热红外分布特征矩阵。
在上述的石墨坩埚的成型方法中,所述多尺度邻域特征提取模块包括并行的第一卷积层和第二卷积层,以及,与所述第一卷积层和所述第二卷积层连接的多尺度特征融合层,其中,所述第一卷积层和所述第二卷积层使用具有不同尺度的一维卷积核。
在上述的石墨坩埚的成型方法中,将所述热红外全局表征时序输入向量通过多尺度邻域特征提取模块以得到热红外分布时序特征向量,包括:使用所述多尺度邻域特征提取模块的第一卷积层对所述热红外全局表征时序输入向量进行一维卷积编码以得到第一尺度热红外分布特征向量,其中,所述第一卷积层具有第一长度的第一一维卷积核;使用所述多尺度邻域特征提取模块的第二卷积层对所述热红外全局表征时序输入向量进行一维卷积编码以得到第二尺度热红外分布特征向量,其中,所述第二卷积层具有第二长度的第二一维卷积核,所述第一长度不同于所述第二长度;以及
使用所述多尺度邻域特征提取模块的多尺度特征融合层将所述第一尺度热红外分布特征向量和所述第二尺度热红外分布特征向量进行级联以得到所述热红外分布时序特征向量。
在上述的石墨坩埚的成型方法中,将所述多个预定时间点的热处理温度值按照时间维度排列为热处理温度时序输入向量后通过包含全连接层和一维卷积层的时序编码器以得到热处理时序特征向量,包括:使用所述时序编码器的全连接层以如下全连接编码公式对所述热处理温度时序输入向量进行全连接编码以提取出所述热处理温度时序输入向量中各个位置的特征值的高维隐含特征,其中,所述全连接编码公式为:,其中/>是所述热处理温度时序输入向量,/>是输出向量,/>是权重矩阵,/>是偏置向量,表示矩阵乘;使用所述时序编码器的一维卷积层以如下一维编码公式对所述热处理温度时序输入向量进行一维卷积编码以提取出所述热处理温度时序输入向量中各个位置的特征值间的高维隐含关联特征,其中,所述一维编码公式为:/>,其中,/>为卷积核在/>方向上的宽度,/>为卷积核参数向量,/>为与卷积核函数运算的局部向量矩阵,/>为卷积核的尺寸,/>表示所述热处理温度时序输入向量,/>表示对所述热处理温度时序输入向量进行一维卷积编码。
在上述的石墨坩埚的成型方法中,计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到分类特征矩阵,包括:以如下响应性公式计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到所述分类特征矩阵;其中,所述响应性公式为:,其中,/>表示所述热红外分布时序特征向量,/> 表示所述热处理时序特征向量,/>表示所述分类特征矩阵,/>表示矩阵相乘。
在上述的石墨坩埚的成型方法中,还包括对所述包含使用空间注意力模型的卷积神经网络模型、所述多尺度邻域特征提取模块、所述包含全连接层和一维卷积层的时序编码器和所述分类器进行训练;其中,对所述包含使用空间注意力模型的卷积神经网络模型、所述多尺度邻域特征提取模块、所述包含全连接层和一维卷积层的时序编码器和所述分类器进行训练,包括:获取训练数据,所述训练数据包括预定时间段内多个预定时间点的训练热处理温度值和所述多个预定时间点的石墨坩埚的训练热红外图像,以及,所述当前时间点的热处理温度值应增大或应减小的真实值;将所述多个预定时间点的石墨坩埚的训练热红外图像分别通过所述使用空间注意力模型的卷积神经网络模型以得到多个训练热红外分布特征矩阵;计算所述多个训练热红外分布特征矩阵的全局均值以得到训练热红外全局表征时序输入向量;将所述训练热红外全局表征时序输入向量通过所述多尺度邻域特征提取模块以得到训练热红外分布时序特征向量;将所述多个预定时间点的训练热处理温度值按照时间维度排列为训练热处理温度时序输入向量后通过所述包含全连接层和一维卷积层的时序编码器以得到训练热处理时序特征向量;计算所述训练热红外分布时序特征向量相对于所述训练热处理时序特征向量的响应性估计以得到训练分类特征矩阵;将所述训练分类特征矩阵通过所述分类器以得到分类损失函数值;计算所述训练热红外分布时序特征向量和所述训练热处理时序特征向量的概率分布移位信息补偿损失函数值;以及
以所述分类损失函数值和所述概率分布移位信息补偿损失函数值的加权和作为损失函数值,并通过梯度下降的反向传播来对所述包含使用空间注意力模型的卷积神经网络模型、所述多尺度邻域特征提取模块、所述包含全连接层和一维卷积层的时序编码器和所述分类器进行训练。
在上述的石墨坩埚的成型方法中,将所述训练分类特征矩阵通过所述分类器以得到分类损失函数值,包括:使用所述分类器以如下分类公式对所述训练分类特征矩阵进行处理以生成训练分类结果,其中,所述分类公式为:其中,表示将所述训练分类特征矩阵投影为向量,/>为全连接层的权重矩阵,/>表示全连接层的偏置矩阵;以及计算所述训练分类结果与所述真实值之间的交叉熵值作为所述分类损失函数值。
在上述的石墨坩埚的成型方法中,计算所述训练热红外分布时序特征向量和所述训练热处理时序特征向量的概率分布移位信息补偿损失函数值,包括:以如下优化公式计算所述训练热红外分布时序特征向量和所述训练热处理时序特征向量的所述概率分布移位信息补偿损失函数值;其中,所述优化公式为:,其中,/>是所述训练热红外分布时序特征向量,/>是所述训练热处理时序特征向量,/>表示/>函数,表示/>函数,/>表示以2为底的对数函数,/>和/>为移位补偿超参数,且/>为加权超参数,/>表示所述概率分布移位信息补偿损失函数值。
根据本申请的另一个方面,提供了一种石墨坩埚的成型系统,其包括:数据获取模块,用于获取预定时间段内多个预定时间点的热处理温度值和所述多个预定时间点的石墨坩埚的热红外图像;空间编码模块,用于将所述多个预定时间点的石墨坩埚的热红外图像分别通过使用空间注意力模型的卷积神经网络模型以得到多个热红外分布特征矩阵;池化模块,用于计算所述多个热红外分布特征矩阵的全局均值以得到热红外全局表征时序输入向量;多尺度编码模块,用于将所述热红外全局表征时序输入向量通过多尺度邻域特征提取模块以得到热红外分布时序特征向量;时序编码模块,用于将所述多个预定时间点的热处理温度值按照时间维度排列为热处理温度时序输入向量后通过包含全连接层和一维卷积层的时序编码器以得到热处理时序特征向量;响应性估计模块,用于计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到分类特征矩阵;以及
分类模块,用于将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示当前时间点的热处理温度值应增大或应减小。
与现有技术相比,本申请提供的石墨坩埚的成型方法及其系统,其首先将多个预定时间点的石墨坩埚的热红外图像分别通过卷积神经网络模型以得到多个热红外分布特征矩阵,接着,将所述多个热红外分布特征矩阵进行池化后通过多尺度邻域特征提取模块以得到热红外分布时序特征向量,然后,将所述多个预定时间点的热处理温度值排列为热处理温度时序输入向量后通过时序编码器以得到热处理时序特征向量,接着,计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到分类特征矩阵,最后,将所述分类特征矩阵通过分类器以得到用于表示当前时间点的热处理温度值应增大或应减小的分类结果。这样,可以提高石墨坩埚的烧结品质和使用寿命。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员而言,在没有做出创造性劳动的前提下,还可以根据这些附图获得其他的附图。以下附图并未刻意按实际尺寸等比例缩放绘制,重点在于示出本申请的主旨。
图1为根据本申请实施例的石墨坩埚的成型方法的应用场景图。
图2为根据本申请实施例的石墨坩埚的成型方法的流程图。
图3为根据本申请实施例的石墨坩埚的成型方法的架构示意图。
图4为根据本申请实施例的石墨坩埚的成型方法的子步骤S140的流程图。
图5为根据本申请实施例的石墨坩埚的成型方法中还包括的训练步骤的子步骤的流程图。
图6为根据本申请实施例的石墨坩埚的成型系统的框图。
具体实施方式
下面将结合附图对本申请实施例中的技术方案进行清楚、完整地描述,显而易见地,所描述的实施例仅仅是本申请的部分实施例,而不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,也属于本申请保护的范围。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
虽然本申请对根据本申请的实施例的系统中的某些模块做出了各种引用,然而,任何数量的不同模块可以被使用并运行在用户终端和/或服务器上。所述模块仅是说明性的,并且所述系统和方法的不同方面可以使用不同模块。
本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,根据需要,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
如上所述,在使用3D打印方案来制备石墨坩埚的过程中,需要通过将3D打印出来的坩埚放入热处理炉中,在高温下进行长时间的烧结,使得坩埚内部的石墨颗粒充分结合,从而形成实心坩埚。但是,在烧结过程中,石墨坩埚会因温度差异而发生变形和开裂,导致打印出来的坩埚形状不符合预期或者破损。并且,石墨粉末需要被充分烧结成实心坩埚,但是过高的温度容易使得石墨坩埚表面氧化或者出现缺陷,从而降低其品质和使用寿命。因此,期望一种优化的石墨坩埚的成型方案。
相应地,在本申请的技术方案中,考虑到在实际进行坩埚的烧结过程中,为了能够避免因温度导致的石墨坩埚变形开裂等缺陷问题,以提高石墨坩埚的品质和使用寿命,期望基于石墨坩埚的热分布特征来自适应地调整热处理温度值,以减少内部应力的积累和释放,从而提高石墨坩埚的烧结品质和使用寿命。但是,由于石墨坩埚的热分布特征信息和热处理温度值都是在时间维度上有着各自的动态变化规律性,并且这两者之间还具有着时序的协同关联关系。因此,在此过程中,难点在于如何建立所述热处理温度值时序变化和所述石墨坩埚的热分布特征的时序变化之间的映射关系,以基于实际的石墨坩埚热分布变化情况来自适应地调整热处理温度值,从而避免因温度导致的石墨坩埚变形开裂等缺陷问题,提高石墨坩埚的烧结品质和使用寿命。
近年来,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。深度学习以及神经网络的发展为挖掘所述热处理温度值时序变化和所述石墨坩埚的热分布特征的时序变化之间的复杂映射关系提供了新的解决思路和方案。本领域普通技术人员应知晓,基于深度学习的深度神经网络模型可以通过适当的训练策略,例如通过梯度下降的反向传播算法来调整所述深度神经网络模型的参数以使之能够模拟事物之间的复杂的非线性关联,而这显然适合于模拟并建立所述热处理温度值时序变化和所述石墨坩埚的热分布特征的时序变化之间的复杂映射关系。
具体地,在本申请的技术方案中,首先,获取预定时间段内多个预定时间点的热处理温度值和所述多个预定时间点的石墨坩埚的热红外图像。应可以理解,所述石墨坩埚的热红外图像能够很好的反映出所述石墨坩埚在烧结过程中的热分布特征信息,以此有利于后续准确地建立与热处理温度值之间的联系。
然后,使用在图像的隐含特征提取方面具有优异表现的卷积神经网络模型来进行所述多个预定时间点的石墨坩埚的热红外图像的特征提取,特别地,考虑到在实际进行所述石墨坩埚的热分布特征提取时,应更加关注于空间位置上关于所述石墨坩埚的热分布隐含特征信息而忽略与石墨坩埚烧结热分布特征无关的干扰特征。应可以理解,鉴于注意力机制能够选择聚焦位置,产生更具分辨性的特征表示,且加入注意力模块后的特征会随着网络的加深产生适应性的改变。因此,在本申请的技术方案中,将所述多个预定时间点的石墨坩埚的热红外图像分别通过使用空间注意力模型的卷积神经网络模型中进行处理,以提取出所述各个预定时间点的石墨坩埚的热红外图像中聚焦于空间上的关于所述石墨坩埚的热分布高维隐含特征信息,从而得到多个热红外分布特征矩阵。值得一提的是,这里,所述空间注意力所提取到的图像特征则反映了空间维度特征差异的权重,用来抑制或强化不同空间位置的特征,以此来提取出空间上聚焦于石墨坩埚的热分布特征信息。
进一步地,考虑到由于所述石墨坩埚的热分布特征信息在时间维度上有着动态性的变化规律,也就是说,所述各个预定时间点的石墨坩埚的热红外图像中聚焦于空间上的关于所述石墨坩埚的热分布高维隐含特征信息间具有着时序关联关系,并且,这种关联关系在不同的时间周期跨度下具有着不同的模式关联特征。因此,进一步计算所述多个热红外分布特征矩阵的全局均值以得到热红外全局表征时序输入向量后,将所述热红外全局表征时序输入向量通过多尺度邻域特征提取模块中进行特征提取,以提取出聚焦于空间位置上的所述石墨坩埚的热分布特征信息在不同时间跨度下的多尺度邻域关联特征,从而得到热红外分布时序特征向量。
对于所述多个预定时间点的热处理温度值来说,考虑到所述热处理温度值在时间维度上也具有着动态性的变化规律性,并且所述热处理温度值在时间维度上的动态性规律不仅存在于所述热处理温度值的时序关联特征表示,还存在于各个预定时间点下的所述热处理温度值数据中。因此,为了能够充分地进行所述热处理温度值的时序动态变化特征表达,在本申请的技术方案中,将所述多个预定时间点的热处理温度值按照时间维度排列为热处理温度时序输入向量后通过包含全连接层和一维卷积层的时序编码器以得到热处理时序特征向量。特别地,这里,所述时序编码器由交替设置的全连接层和一维卷积层组成,其通过一维卷积层进行一维卷积编码来提取出所述热处理温度值在时序维度上的关联特征,以及通过全连接层进行全连接编码来提取所述热处理温度值的高维隐含特征。
接着,进一步再计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计,以此来表示烧结过程中的所述石墨坩埚的热力分布时序动态多尺度关联特征和所述热处理温度值的时序动态变化特征的关联性特征分布信息,即所述烧结过程中的所述石墨坩埚的热力分布的时序变化特征与所述热处理温度值的时序变化特征在高维特征空间中的映射关系,并以此作为分类特征矩阵通过分类器中进行分类处理,以得到用于表示当前时间点的热处理温度值应增大或应减小的分类结果。
也就是,在本申请的技术方案中,所述分类器的标签包括当前时间点的热处理温度值应增大(第一标签),以及,当前时间点的热处理温度值应减小(第二标签),其中,所述分类器通过软最大值函数来确定所述分类特征向量属于哪个分类标签。值得注意的是,这里的所述第一标签p1和所述第二标签p2并不包含人为设定的概念,实际上在训练过程当中,计算机模型并没有“当前时间点的热处理温度值应增大或应减小”这种概念,其只是有两种分类标签且输出特征在这两个分类标签下的概率,即p1和p2之和为一。因此,热处理温度值应增大或应减小的分类结果实际上是通过分类标签转化为符合自然规律的二分类的类概率分布,实质上用到的是标签的自然概率分布的物理意义,而不是“当前时间点的热处理温度值应增大或应减小”的语言文本意义。应可以理解,在本申请的技术方案中,所述分类器的分类标签为所述当前时间点的热处理温度值应增大或应减小的控制策略标签,因此,在得到所述分类结果后,可基于所述分类结果来自适应地调整所述当前时间点的热处理温度值增大或减小,以此来减少内部应力的积累和释放,提高石墨坩埚的烧结品质和使用寿命。
特别地,在本申请的技术方案中,这里,在计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计得到所述分类特征矩阵时,所述分类特征矩阵实质上表达将所述热红外分布时序特征向量和所述热处理时序特征向量基于其间的特征域响应分布融合,由此,在所述热红外分布时序特征向量和所述热处理时序特征向量的特征分布融合的情况下,其各自的特征分布在模型的参数空间内后向传播通过分类器时,会遇到各自的特征表达信息的退化问题。
基于此,本申请的申请人引入针对所述热红外分布时序特征向量和所述热处理时序特征向量/>的概率分布移位信息补偿损失函数,表示为:,其中,/>和/>为移位补偿超参数,且/>为加权超参数。
这里,基于函数从所述热红外分布时序特征向量/>和所述热处理时序特征向量/>分别得到的类概率值本身会对于各自的特征分布遵循概率分布,使用所述概率分布移位信息补偿损失函数来对所述热红外分布时序特征向量/>和所述热处理时序特征向量/>的特征表示的概率分布的移位来进行信息补偿,并通过/>函数来使得补偿带来的交叉信息熵最大化,这样,可以使得融合后的所述分类特征矩阵的特征分布能够最大程度地还原融合前的所述热红外分布时序特征向量和所述热处理时序特征向量的特征表达信息,从而提升所述分类特征矩阵通过分类器得到的分类结果的准确性。这样,能够实时准确地基于实际的石墨坩埚热分布变化情况来自适应地调整热处理温度值,从而减少内部应力的积累和释放,避免因温度导致的石墨坩埚变形开裂等缺陷问题,提高石墨坩埚的烧结品质和使用寿命。
图1为根据本申请实施例的石墨坩埚的成型方法的应用场景图。如图1所示,在该应用场景中,首先,可以分别通过温度传感器(例如,图1中所示意的C1)和红外摄像机(例如,图1中所示意的C2)获取预定时间段内多个预定时间点的热处理温度值(例如,图1中所示意的D1)和所述多个预定时间点的石墨坩埚(例如,图1中所示意的N)的热红外图像(例如,图1中所示意的D2),然后,将所述多个预定时间点的热处理温度值和所述多个预定时间点的石墨坩埚的热红外图像输入至部署有石墨坩埚的成型算法的服务器中(例如,图1中所示意的S),其中,所述服务器能够使用所述石墨坩埚的成型算法对所述多个预定时间点的热处理温度值和所述多个预定时间点的石墨坩埚的热红外图像进行处理以得到用于表示当前时间点的热处理温度值应增大或应减小的分类结果。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
图2为根据本申请实施例的石墨坩埚的成型方法的流程图。如图2所示,根据本申请实施例的石墨坩埚的成型方法,包括步骤:S110,获取预定时间段内多个预定时间点的热处理温度值和所述多个预定时间点的石墨坩埚的热红外图像;S120,将所述多个预定时间点的石墨坩埚的热红外图像分别通过使用空间注意力模型的卷积神经网络模型以得到多个热红外分布特征矩阵;S130,计算所述多个热红外分布特征矩阵的全局均值以得到热红外全局表征时序输入向量;S140,将所述热红外全局表征时序输入向量通过多尺度邻域特征提取模块以得到热红外分布时序特征向量;S150,将所述多个预定时间点的热处理温度值按照时间维度排列为热处理温度时序输入向量后通过包含全连接层和一维卷积层的时序编码器以得到热处理时序特征向量;S160,计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到分类特征矩阵;以及,S170,将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示当前时间点的热处理温度值应增大或应减小。
图3为根据本申请实施例的石墨坩埚的成型方法的架构示意图。如图3所示,在该网络架构中,首先,获取预定时间段内多个预定时间点的热处理温度值和所述多个预定时间点的石墨坩埚的热红外图像;接着,将所述多个预定时间点的石墨坩埚的热红外图像分别通过使用空间注意力模型的卷积神经网络模型以得到多个热红外分布特征矩阵;然后,计算所述多个热红外分布特征矩阵的全局均值以得到热红外全局表征时序输入向量;接着,将所述热红外全局表征时序输入向量通过多尺度邻域特征提取模块以得到热红外分布时序特征向量;然后,将所述多个预定时间点的热处理温度值按照时间维度排列为热处理温度时序输入向量后通过包含全连接层和一维卷积层的时序编码器以得到热处理时序特征向量;接着,计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到分类特征矩阵;最后,将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示当前时间点的热处理温度值应增大或应减小。
更具体地,在步骤S110中,获取预定时间段内多个预定时间点的热处理温度值和所述多个预定时间点的石墨坩埚的热红外图像。在实际进行坩埚的烧结过程中,为了能够避免因温度导致的石墨坩埚变形开裂等缺陷问题,以提高石墨坩埚的品质和使用寿命,期望基于石墨坩埚的热分布特征来自适应地调整热处理温度值,以减少内部应力的积累和释放,从而提高石墨坩埚的烧结品质和使用寿命。但是,由于石墨坩埚的热分布特征信息和热处理温度值都是在时间维度上有着各自的动态变化规律性,并且这两者之间还具有着时序的协同关联关系。因此,在本申请的技术方案中,通过建立所述热处理温度值时序变化和所述石墨坩埚的热分布特征的时序变化之间的映射关系,以基于实际的石墨坩埚热分布变化情况来自适应地调整热处理温度值,从而避免因温度导致的石墨坩埚变形开裂等缺陷问题,提高石墨坩埚的烧结品质和使用寿命。
更具体地,在步骤S120中,将所述多个预定时间点的石墨坩埚的热红外图像分别通过使用空间注意力模型的卷积神经网络模型以得到多个热红外分布特征矩阵。使用在图像的隐含特征提取方面具有优异表现的卷积神经网络模型来进行所述多个预定时间点的石墨坩埚的热红外图像的特征提取,特别地,考虑到在实际进行所述石墨坩埚的热分布特征提取时,应更加关注于空间位置上关于所述石墨坩埚的热分布隐含特征信息而忽略与石墨坩埚烧结热分布特征无关的干扰特征。应可以理解,鉴于注意力机制能够选择聚焦位置,产生更具分辨性的特征表示,且加入注意力模块后的特征会随着网络的加深产生适应性的改变。因此,在本申请的技术方案中,将所述多个预定时间点的石墨坩埚的热红外图像分别通过使用空间注意力模型的卷积神经网络模型中进行处理,以提取出所述各个预定时间点的石墨坩埚的热红外图像中聚焦于空间上的关于所述石墨坩埚的热分布高维隐含特征信息,从而得到多个热红外分布特征矩阵。值得一提的是,这里,所述空间注意力所提取到的图像特征则反映了空间维度特征差异的权重,用来抑制或强化不同空间位置的特征,以此来提取出空间上聚焦于石墨坩埚的热分布特征信息。
应可以理解,卷积神经网络(Convolutional Neural Network,CNN)是一种人工神经网络,在图像识别等领域有着广泛的应用。卷积神经网络可以包括输入层、隐藏层和输出层,其中,隐藏层可以包括卷积层、池化(pooling)层、激活层和全连接层等,上一层根据输入的数据进行相应的运算,将运算结果输出给下一层,输入的初始数据经过多层的运算之后得到一个最终的结果。卷积神经网络模型利用卷积核作为特征过滤因子在图像局部特征提取方面具有非常优异的性能表现,且相较于传统的基于统计或者基于特征工程的图像特征提取算法,所述卷积神经网络模型具有更强的特征提取泛化能力和拟合能力。
相应地,在一个具体示例中,将所述多个预定时间点的石墨坩埚的热红外图像分别通过使用空间注意力模型的卷积神经网络模型以得到多个热红外分布特征矩阵,包括:所述使用空间注意力模型的卷积神经网络模型的各层在层的正向传递过程中对输入数据分别进行:对输入数据进行卷积处理以生成卷积特征图;对所述卷积特征图进行池化处理以生成池化特征图;对所述池化特征图进行非线性激活以生成激活特征图;计算所述激活特征图的各个位置沿通道维度的均值以生成空间特征矩阵;计算所述空间特征矩阵中各个位置的类Softmax函数值以获得空间得分矩阵;以及,计算所述空间特征矩阵和所述空间得分图的按位置点乘以获得特征矩阵;其中,所述使用空间注意力模型的卷积神经网络模型的最后一层输出的所述多个热红外分布特征矩阵。
更具体地,在步骤S130中,计算所述多个热红外分布特征矩阵的全局均值以得到热红外全局表征时序输入向量。由于所述石墨坩埚的热分布特征信息在时间维度上有着动态性的变化规律,也就是说,所述各个预定时间点的石墨坩埚的热红外图像中聚焦于空间上的关于所述石墨坩埚的热分布高维隐含特征信息间具有着时序关联关系,并且,这种关联关系在不同的时间周期跨度下具有着不同的模式关联特征。
因此,进一步计算所述多个热红外分布特征矩阵的全局均值以得到热红外全局表征时序输入向量后,将所述热红外全局表征时序输入向量通过多尺度邻域特征提取模块中进行特征提取,以提取出聚焦于空间位置上的所述石墨坩埚的热分布特征信息在不同时间跨度下的多尺度邻域关联特征,从而得到热红外分布时序特征向量。
更具体地,在步骤S140中,将所述热红外全局表征时序输入向量通过多尺度邻域特征提取模块以得到热红外分布时序特征向量。
相应地,在一个具体示例中,所述多尺度邻域特征提取模块包括并行的第一卷积层和第二卷积层,以及,与所述第一卷积层和所述第二卷积层连接的多尺度特征融合层,其中,所述第一卷积层和所述第二卷积层使用具有不同尺度的一维卷积核。
相应地,在一个具体示例中,如图4所示,将所述热红外全局表征时序输入向量通过多尺度邻域特征提取模块以得到热红外分布时序特征向量,包括:S141,使用所述多尺度邻域特征提取模块的第一卷积层对所述热红外全局表征时序输入向量进行一维卷积编码以得到第一尺度热红外分布特征向量,其中,所述第一卷积层具有第一长度的第一一维卷积核;S142,使用所述多尺度邻域特征提取模块的第二卷积层对所述热红外全局表征时序输入向量进行一维卷积编码以得到第二尺度热红外分布特征向量,其中,所述第二卷积层具有第二长度的第二一维卷积核,所述第一长度不同于所述第二长度;以及,S143,使用所述多尺度邻域特征提取模块的多尺度特征融合层将所述第一尺度热红外分布特征向量和所述第二尺度热红外分布特征向量进行级联以得到所述热红外分布时序特征向量。
更具体地,在步骤S150中,将所述多个预定时间点的热处理温度值按照时间维度排列为热处理温度时序输入向量后通过包含全连接层和一维卷积层的时序编码器以得到热处理时序特征向量。对于所述多个预定时间点的热处理温度值来说,考虑到所述热处理温度值在时间维度上也具有着动态性的变化规律性,并且所述热处理温度值在时间维度上的动态性规律不仅存在于所述热处理温度值的时序关联特征表示,还存在于各个预定时间点下的所述热处理温度值数据中。因此,为了能够充分地进行所述热处理温度值的时序动态变化特征表达,在本申请的技术方案中,将所述多个预定时间点的热处理温度值按照时间维度排列为热处理温度时序输入向量后通过包含全连接层和一维卷积层的时序编码器以得到热处理时序特征向量。
特别地,这里,所述时序编码器由交替设置的全连接层和一维卷积层组成,其通过一维卷积层进行一维卷积编码来提取出所述热处理温度值在时序维度上的关联特征,以及通过全连接层进行全连接编码来提取所述热处理温度值的高维隐含特征。
相应地,在一个具体示例中,将所述多个预定时间点的热处理温度值按照时间维度排列为热处理温度时序输入向量后通过包含全连接层和一维卷积层的时序编码器以得到热处理时序特征向量,包括:使用所述时序编码器的全连接层以如下全连接编码公式对所述热处理温度时序输入向量进行全连接编码以提取出所述热处理温度时序输入向量中各个位置的特征值的高维隐含特征,其中,所述全连接编码公式为:,其中是所述热处理温度时序输入向量,/>是输出向量,/>是权重矩阵,/>是偏置向量,/>表示矩阵乘;使用所述时序编码器的一维卷积层以如下一维编码公式对所述热处理温度时序输入向量进行一维卷积编码以提取出所述热处理温度时序输入向量中各个位置的特征值间的高维隐含关联特征,其中,所述一维编码公式为:/>,其中,/>为卷积核在/>方向上的宽度,/>为卷积核参数向量,/>为与卷积核函数运算的局部向量矩阵,/>为卷积核的尺寸,/>表示所述热处理温度时序输入向量,/>表示对所述热处理温度时序输入向量进行一维卷积编码。
更具体地,在步骤S160中,计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到分类特征矩阵。以此来表示烧结过程中的所述石墨坩埚的热力分布时序动态多尺度关联特征和所述热处理温度值的时序动态变化特征的关联性特征分布信息,即所述烧结过程中的所述石墨坩埚的热力分布的时序变化特征与所述热处理温度值的时序变化特征在高维特征空间中的映射关系。
相应地,在一个具体示例中,计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到分类特征矩阵,包括:以如下响应性公式计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到所述分类特征矩阵;其中,所述响应性公式为:,其中,/>表示所述热红外分布时序特征向量,/> 表示所述热处理时序特征向量,/>表示所述分类特征矩阵,/>表示矩阵相乘。
更具体地,在步骤S170中,将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示当前时间点的热处理温度值应增大或应减小。因此,在得到所述分类结果后,可基于所述分类结果来自适应地调整所述当前时间点的热处理温度值增大或减小,以此来减少内部应力的积累和释放,提高石墨坩埚的烧结品质和使用寿命。
应可以理解,分类器的作用是利用给定的类别、已知的训练数据来学习分类规则和分类器,然后对未知数据进行分类(或预测)。逻辑回归(logistics)、SVM等常用于解决二分类问题,对于多分类问题(multi-class classification),同样也可以用逻辑回归或SVM,只是需要多个二分类来组成多分类,但这样容易出错且效率不高,常用的多分类方法有Softmax分类函数。
相应地,在一个具体示例中,所述的石墨坩埚的成型方法,还包括对所述包含使用空间注意力模型的卷积神经网络模型、所述多尺度邻域特征提取模块、所述包含全连接层和一维卷积层的时序编码器和所述分类器进行训练;其中,如图5所示,对所述包含使用空间注意力模型的卷积神经网络模型、所述多尺度邻域特征提取模块、所述包含全连接层和一维卷积层的时序编码器和所述分类器进行训练,包括:S210,获取训练数据,所述训练数据包括预定时间段内多个预定时间点的训练热处理温度值和所述多个预定时间点的石墨坩埚的训练热红外图像,以及,所述当前时间点的热处理温度值应增大或应减小的真实值;S220,将所述多个预定时间点的石墨坩埚的训练热红外图像分别通过所述使用空间注意力模型的卷积神经网络模型以得到多个训练热红外分布特征矩阵;S230,计算所述多个训练热红外分布特征矩阵的全局均值以得到训练热红外全局表征时序输入向量;S240,将所述训练热红外全局表征时序输入向量通过所述多尺度邻域特征提取模块以得到训练热红外分布时序特征向量;S250,将所述多个预定时间点的训练热处理温度值按照时间维度排列为训练热处理温度时序输入向量后通过所述包含全连接层和一维卷积层的时序编码器以得到训练热处理时序特征向量;S260,计算所述训练热红外分布时序特征向量相对于所述训练热处理时序特征向量的响应性估计以得到训练分类特征矩阵;S270,将所述训练分类特征矩阵通过所述分类器以得到分类损失函数值;S280,计算所述训练热红外分布时序特征向量和所述训练热处理时序特征向量的概率分布移位信息补偿损失函数值;以及,S290,以所述分类损失函数值和所述概率分布移位信息补偿损失函数值的加权和作为损失函数值,并通过梯度下降的反向传播来对所述包含使用空间注意力模型的卷积神经网络模型、所述多尺度邻域特征提取模块、所述包含全连接层和一维卷积层的时序编码器和所述分类器进行训练。
相应地,在一个具体示例中,将所述训练分类特征矩阵通过所述分类器以得到分类损失函数值,包括:使用所述分类器以如下分类公式对所述训练分类特征矩阵进行处理以生成训练分类结果,其中,所述分类公式为:其中,表示将所述训练分类特征矩阵投影为向量,/>为全连接层的权重矩阵,/>表示全连接层的偏置矩阵;以及,计算所述训练分类结果与所述真实值之间的交叉熵值作为所述分类损失函数值。
特别地,在本申请的技术方案中,这里,在计算所述训练热红外分布时序特征向量相对于所述训练热处理时序特征向量的响应性估计得到所述训练分类特征矩阵时,所述训练分类特征矩阵实质上表达将所述训练热红外分布时序特征向量和所述训练热处理时序特征向量基于其间的特征域响应分布融合,由此,在所述训练热红外分布时序特征向量和所述训练热处理时序特征向量的特征分布融合的情况下,其各自的特征分布在模型的参数空间内后向传播通过分类器时,会遇到各自的特征表达信息的退化问题。基于此,本申请的申请人引入针对所述训练热红外分布时序特征向量和所述训练热处理时序特征向量的概率分布移位信息补偿损失函数。
相应地,在一个具体示例中,计算所述训练热红外分布时序特征向量和所述训练热处理时序特征向量的概率分布移位信息补偿损失函数值,包括:以如下优化公式计算所述训练热红外分布时序特征向量和所述训练热处理时序特征向量的所述概率分布移位信息补偿损失函数值;其中,所述优化公式为:,其中,/>是所述训练热红外分布时序特征向量,/>是所述训练热处理时序特征向量,/>表示/>函数,表示/>函数,/>表示以2为底的对数函数,/>和/>为移位补偿超参数,且/>为加权超参数,/>表示所述概率分布移位信息补偿损失函数值。
这里,基于函数从所述训练热红外分布时序特征向量和所述训练热处理时序特征向量分别得到的类概率值本身会对于各自的特征分布遵循概率分布,使用所述概率分布移位信息补偿损失函数来对所述训练热红外分布时序特征向量和所述训练热处理时序特征向量的特征表示的概率分布的移位来进行信息补偿,并通过/>函数来使得补偿带来的交叉信息熵最大化,这样,可以使得融合后的所述训练分类特征矩阵的特征分布能够最大程度地还原融合前的所述训练热红外分布时序特征向量和所述训练热处理时序特征向量的特征表达信息,从而提升所述训练分类特征矩阵通过分类器得到的分类结果的准确性。
综上,基于本申请实施例的石墨坩埚的成型方法,其首先将多个预定时间点的石墨坩埚的热红外图像分别通过卷积神经网络模型以得到多个热红外分布特征矩阵,接着,将所述多个热红外分布特征矩阵进行池化后通过多尺度邻域特征提取模块以得到热红外分布时序特征向量,然后,将所述多个预定时间点的热处理温度值排列为热处理温度时序输入向量后通过时序编码器以得到热处理时序特征向量,接着,计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到分类特征矩阵,最后,将所述分类特征矩阵通过分类器以得到用于表示当前时间点的热处理温度值应增大或应减小的分类结果。这样,可以提高石墨坩埚的烧结品质和使用寿命。
图6为根据本申请实施例的石墨坩埚的成型系统100的框图。如图6所示,根据本申请实施例的石墨坩埚的成型系统100,包括:数据获取模块110,用于获取预定时间段内多个预定时间点的热处理温度值和所述多个预定时间点的石墨坩埚的热红外图像;空间编码模块120,用于将所述多个预定时间点的石墨坩埚的热红外图像分别通过使用空间注意力模型的卷积神经网络模型以得到多个热红外分布特征矩阵;池化模块130,用于计算所述多个热红外分布特征矩阵的全局均值以得到热红外全局表征时序输入向量;多尺度编码模块140,用于将所述热红外全局表征时序输入向量通过多尺度邻域特征提取模块以得到热红外分布时序特征向量;时序编码模块150,用于将所述多个预定时间点的热处理温度值按照时间维度排列为热处理温度时序输入向量后通过包含全连接层和一维卷积层的时序编码器以得到热处理时序特征向量;响应性估计模块160,用于计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到分类特征矩阵;以及,分类模块170,用于将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示当前时间点的热处理温度值应增大或应减小。
在一个示例中,在上述石墨坩埚的成型系统100中,所述空间编码模块120,由于:所述使用空间注意力模型的卷积神经网络模型的各层在层的正向传递过程中对输入数据分别进行:对输入数据进行卷积处理以生成卷积特征图;对所述卷积特征图进行池化处理以生成池化特征图;对所述池化特征图进行非线性激活以生成激活特征图;计算所述激活特征图的各个位置沿通道维度的均值以生成空间特征矩阵;计算所述空间特征矩阵中各个位置的类Softmax函数值以获得空间得分矩阵;以及,计算所述空间特征矩阵和所述空间得分图的按位置点乘以获得特征矩阵;其中,所述使用空间注意力模型的卷积神经网络模型的最后一层输出的所述多个热红外分布特征矩阵。
在一个示例中,在上述石墨坩埚的成型系统100中,所述多尺度邻域特征提取模块包括并行的第一卷积层和第二卷积层,以及,与所述第一卷积层和所述第二卷积层连接的多尺度特征融合层,其中,所述第一卷积层和所述第二卷积层使用具有不同尺度的一维卷积核。
在一个示例中,在上述石墨坩埚的成型系统100中,所述多尺度编码模块140,用于:使用所述多尺度邻域特征提取模块的第一卷积层对所述热红外全局表征时序输入向量进行一维卷积编码以得到第一尺度热红外分布特征向量,其中,所述第一卷积层具有第一长度的第一一维卷积核;使用所述多尺度邻域特征提取模块的第二卷积层对所述热红外全局表征时序输入向量进行一维卷积编码以得到第二尺度热红外分布特征向量,其中,所述第二卷积层具有第二长度的第二一维卷积核,所述第一长度不同于所述第二长度;以及,使用所述多尺度邻域特征提取模块的多尺度特征融合层将所述第一尺度热红外分布特征向量和所述第二尺度热红外分布特征向量进行级联以得到所述热红外分布时序特征向量。
在一个示例中,在上述石墨坩埚的成型系统100中,所述时序编码模块150,用于:使用所述时序编码器的全连接层以如下全连接编码公式对所述热处理温度时序输入向量进行全连接编码以提取出所述热处理温度时序输入向量中各个位置的特征值的高维隐含特征,其中,所述全连接编码公式为:,其中/>是所述热处理温度时序输入向量,/>是输出向量,/>是权重矩阵,/>是偏置向量,/>表示矩阵乘;使用所述时序编码器的一维卷积层以如下一维编码公式对所述热处理温度时序输入向量进行一维卷积编码以提取出所述热处理温度时序输入向量中各个位置的特征值间的高维隐含关联特征,其中,所述一维编码公式为:/>,其中,/>为卷积核在/>方向上的宽度,/>为卷积核参数向量,/>为与卷积核函数运算的局部向量矩阵,/>为卷积核的尺寸,/>表示所述热处理温度时序输入向量,/>表示对所述热处理温度时序输入向量进行一维卷积编码。
在一个示例中,在上述石墨坩埚的成型系统100中,所述响应性估计模块160,用于:以如下响应性公式计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到所述分类特征矩阵;其中,所述响应性公式为:,其中,表示所述热红外分布时序特征向量,/> 表示所述热处理时序特征向量,/>表示所述分类特征矩阵,/>表示矩阵相乘。
在一个示例中,在上述石墨坩埚的成型系统100中,还包括对所述包含使用空间注意力模型的卷积神经网络模型、所述多尺度邻域特征提取模块、所述包含全连接层和一维卷积层的时序编码器和所述分类器进行训练的训练模块;其中,所述训练模块,用于:获取训练数据,所述训练数据包括预定时间段内多个预定时间点的训练热处理温度值和所述多个预定时间点的石墨坩埚的训练热红外图像,以及,所述当前时间点的热处理温度值应增大或应减小的真实值;将所述多个预定时间点的石墨坩埚的训练热红外图像分别通过所述使用空间注意力模型的卷积神经网络模型以得到多个训练热红外分布特征矩阵;计算所述多个训练热红外分布特征矩阵的全局均值以得到训练热红外全局表征时序输入向量;将所述训练热红外全局表征时序输入向量通过所述多尺度邻域特征提取模块以得到训练热红外分布时序特征向量;将所述多个预定时间点的训练热处理温度值按照时间维度排列为训练热处理温度时序输入向量后通过所述包含全连接层和一维卷积层的时序编码器以得到训练热处理时序特征向量;计算所述训练热红外分布时序特征向量相对于所述训练热处理时序特征向量的响应性估计以得到训练分类特征矩阵;将所述训练分类特征矩阵通过所述分类器以得到分类损失函数值;计算所述训练热红外分布时序特征向量和所述训练热处理时序特征向量的概率分布移位信息补偿损失函数值;以及,以所述分类损失函数值和所述概率分布移位信息补偿损失函数值的加权和作为损失函数值,并通过梯度下降的反向传播来对所述包含使用空间注意力模型的卷积神经网络模型、所述多尺度邻域特征提取模块、所述包含全连接层和一维卷积层的时序编码器和所述分类器进行训练。
在一个示例中,在上述石墨坩埚的成型系统100中,将所述训练分类特征矩阵通过所述分类器以得到分类损失函数值,包括:使用所述分类器以如下分类公式对所述训练分类特征矩阵进行处理以生成训练分类结果,其中,所述分类公式为:其中,/>表示将所述训练分类特征矩阵投影为向量,/>为全连接层的权重矩阵,/>表示全连接层的偏置矩阵;以及,计算所述训练分类结果与所述真实值之间的交叉熵值作为所述分类损失函数值。
在一个示例中,在上述石墨坩埚的成型系统100中,计算所述训练热红外分布时序特征向量和所述训练热处理时序特征向量的概率分布移位信息补偿损失函数值,包括:以如下优化公式计算所述训练热红外分布时序特征向量和所述训练热处理时序特征向量的所述概率分布移位信息补偿损失函数值;其中,所述优化公式为:,其中,/>是所述训练热红外分布时序特征向量,/>是所述训练热处理时序特征向量,/>表示/>函数,表示/>函数,/>表示以2为底的对数函数,/>和/>为移位补偿超参数,且/>为加权超参数,/>表示所述概率分布移位信息补偿损失函数值。
这里,本领域技术人员可以理解,上述石墨坩埚的成型系统100中的各个模块的具体功能和操作已经在上面参考图1到图5的石墨坩埚的成型方法的描述中得到了详细介绍,并因此,将省略其重复描述。
如上所述,根据本申请实施例的石墨坩埚的成型系统100可以实现在各种无线终端中,例如具有石墨坩埚的成型算法的服务器等。在一个示例中,根据本申请实施例的石墨坩埚的成型系统100可以作为一个软件模块和/或硬件模块而集成到无线终端中。例如,该石墨坩埚的成型系统100可以是该无线终端的操作系统中的一个软件模块,或者可以是针对于该无线终端所开发的一个应用程序;当然,该石墨坩埚的成型系统100同样可以是该无线终端的众多硬件模块之一。
替换地,在另一示例中,该石墨坩埚的成型系统100与该无线终端也可以是分立的设备,并且该石墨坩埚的成型系统100可以通过有线和/或无线网络连接到该无线终端,并且按照约定的数据格式来传输交互信息。
根据本申请的另一方面,还提供了一种非易失性的计算机可读存储介质,其上存储有计算机可读的指令,当利用计算机执行所述指令时可以执行如前所述的方法。
技术中的程序部分可以被认为是以可执行的代码和/或相关数据的形式而存在的“产品”或“制品”,通过计算机可读的介质所参与或实现的。有形的、永久的储存介质可以包括任何计算机、处理器、或类似设备或相关的模块所用到的内存或存储器。例如,各种半导体存储器、磁带驱动器、磁盘驱动器或者类似任何能够为软件提供存储功能的设备。
所有软件或其中的一部分有时可能会通过网络进行通信,如互联网或其他通信网络。此类通信可以将软件从一个计算机设备或处理器加载到另一个。例如:从视频目标检测设备的一个服务器或主机计算机加载至一个计算机环境的硬件平台,或其他实现系统的计算机环境,或与提供目标检测所需要的信息相关的类似功能的系统。因此,另一种能够传递软件元素的介质也可以被用作局部设备之间的物理连接,例如光波、电波、电磁波等,通过电缆、光缆或者空气等实现传播。用来载波的物理介质如电缆、无线连接或光缆等类似设备,也可以被认为是承载软件的介质。在这里的用法除非限制了有形的“储存”介质,其他表示计算机或机器“可读介质”的术语都表示在处理器执行任何指令的过程中参与的介质。
本申请使用了特定词语来描述本申请的实施例。如“第一/第二实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
除非另有定义,这里使用的所有术语(包括技术和科学术语)具有与本发明所属领域的普通技术人员共同理解的相同含义。还应当理解,诸如在通常字典里定义的那些术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非这里明确地这样定义。
上面是对本发明的说明,而不应被认为是对其的限制。尽管描述了本发明的若干示例性实施例,但本领域技术人员将容易地理解,在不背离本发明的新颖教学和优点的前提下可以对示例性实施例进行许多修改。因此,所有这些修改都意图包含在权利要求书所限定的本发明范围内。应当理解,上面是对本发明的说明,而不应被认为是限于所公开的特定实施例,并且对所公开的实施例以及其他实施例的修改意图包含在所附权利要求书的范围内。本发明由权利要求书及其等效物限定。

Claims (10)

1.一种石墨坩埚的成型方法,其特征在于,包括:获取预定时间段内多个预定时间点的热处理温度值和所述多个预定时间点的石墨坩埚的热红外图像;将所述多个预定时间点的石墨坩埚的热红外图像分别通过使用空间注意力模型的卷积神经网络模型以得到多个热红外分布特征矩阵;计算所述多个热红外分布特征矩阵的全局均值以得到热红外全局表征时序输入向量;将所述热红外全局表征时序输入向量通过多尺度邻域特征提取模块以得到热红外分布时序特征向量;将所述多个预定时间点的热处理温度值按照时间维度排列为热处理温度时序输入向量后通过包含全连接层和一维卷积层的时序编码器以得到热处理时序特征向量;计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到分类特征矩阵;以及将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示当前时间点的热处理温度值应增大或应减小。
2.根据权利要求1所述的石墨坩埚的成型方法,其特征在于,将所述多个预定时间点的石墨坩埚的热红外图像分别通过使用空间注意力模型的卷积神经网络模型以得到多个热红外分布特征矩阵,包括:所述使用空间注意力模型的卷积神经网络模型的各层在层的正向传递过程中对输入数据分别进行:对输入数据进行卷积处理以生成卷积特征图;对所述卷积特征图进行池化处理以生成池化特征图;对所述池化特征图进行非线性激活以生成激活特征图;计算所述激活特征图的各个位置沿通道维度的均值以生成空间特征矩阵;计算所述空间特征矩阵中各个位置的类Softmax函数值以获得空间得分矩阵;以及计算所述空间特征矩阵和所述空间得分图的按位置点乘以获得特征矩阵;其中,所述使用空间注意力模型的卷积神经网络模型的最后一层输出的所述多个热红外分布特征矩阵。
3.根据权利要求2所述的石墨坩埚的成型方法,其特征在于,所述多尺度邻域特征提取模块包括并行的第一卷积层和第二卷积层,以及,与所述第一卷积层和所述第二卷积层连接的多尺度特征融合层,其中,所述第一卷积层和所述第二卷积层使用具有不同尺度的一维卷积核。
4.根据权利要求3所述的石墨坩埚的成型方法,其特征在于,将所述热红外全局表征时序输入向量通过多尺度邻域特征提取模块以得到热红外分布时序特征向量,包括:使用所述多尺度邻域特征提取模块的第一卷积层对所述热红外全局表征时序输入向量进行一维卷积编码以得到第一尺度热红外分布特征向量,其中,所述第一卷积层具有第一长度的第一一维卷积核;使用所述多尺度邻域特征提取模块的第二卷积层对所述热红外全局表征时序输入向量进行一维卷积编码以得到第二尺度热红外分布特征向量,其中,所述第二卷积层具有第二长度的第二一维卷积核,所述第一长度不同于所述第二长度;以及使用所述多尺度邻域特征提取模块的多尺度特征融合层将所述第一尺度热红外分布特征向量和所述第二尺度热红外分布特征向量进行级联以得到所述热红外分布时序特征向量。
5.根据权利要求4所述的石墨坩埚的成型方法,其特征在于,将所述多个预定时间点的热处理温度值按照时间维度排列为热处理温度时序输入向量后通过包含全连接层和一维卷积层的时序编码器以得到热处理时序特征向量,包括:使用所述时序编码器的全连接层以如下全连接编码公式对所述热处理温度时序输入向量进行全连接编码以提取出所述热处理温度时序输入向量中各个位置的特征值的高维隐含特征,其中,所述全连接编码公式为: ,其中/>是所述热处理温度时序输入向量,/>是输出向量,/>是权重矩阵,/>是偏置向量,/>表示矩阵乘;使用所述时序编码器的一维卷积层以如下一维编码公式对所述热处理温度时序输入向量进行一维卷积编码以提取出所述热处理温度时序输入向量中各个位置的特征值间的高维隐含关联特征,其中,所述一维编码公式为:,其中,/>为卷积核在/>方向上的宽度,/>为卷积核参数向量,/>为与卷积核函数运算的局部向量矩阵,/>为卷积核的尺寸,/>表示所述热处理温度时序输入向量,/>表示对所述热处理温度时序输入向量进行一维卷积编码。
6.根据权利要求5所述的石墨坩埚的成型方法,其特征在于,计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到分类特征矩阵,包括:以如下响应性公式计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到所述分类特征矩阵;其中,所述响应性公式为:,其中,/>表示所述热红外分布时序特征向量,/> 表示所述热处理时序特征向量,/>表示所述分类特征矩阵,/>表示矩阵相乘。
7.根据权利要求6所述的石墨坩埚的成型方法,其特征在于,还包括对所述包含使用空间注意力模型的卷积神经网络模型、所述多尺度邻域特征提取模块、所述包含全连接层和一维卷积层的时序编码器和所述分类器进行训练;其中,对所述包含使用空间注意力模型的卷积神经网络模型、所述多尺度邻域特征提取模块、所述包含全连接层和一维卷积层的时序编码器和所述分类器进行训练,包括:获取训练数据,所述训练数据包括预定时间段内多个预定时间点的训练热处理温度值和所述多个预定时间点的石墨坩埚的训练热红外图像,以及,所述当前时间点的热处理温度值应增大或应减小的真实值;将所述多个预定时间点的石墨坩埚的训练热红外图像分别通过所述使用空间注意力模型的卷积神经网络模型以得到多个训练热红外分布特征矩阵;计算所述多个训练热红外分布特征矩阵的全局均值以得到训练热红外全局表征时序输入向量;将所述训练热红外全局表征时序输入向量通过所述多尺度邻域特征提取模块以得到训练热红外分布时序特征向量;将所述多个预定时间点的训练热处理温度值按照时间维度排列为训练热处理温度时序输入向量后通过所述包含全连接层和一维卷积层的时序编码器以得到训练热处理时序特征向量;计算所述训练热红外分布时序特征向量相对于所述训练热处理时序特征向量的响应性估计以得到训练分类特征矩阵;将所述训练分类特征矩阵通过所述分类器以得到分类损失函数值;计算所述训练热红外分布时序特征向量和所述训练热处理时序特征向量的概率分布移位信息补偿损失函数值;以及以所述分类损失函数值和所述概率分布移位信息补偿损失函数值的加权和作为损失函数值,并通过梯度下降的反向传播来对所述包含使用空间注意力模型的卷积神经网络模型、所述多尺度邻域特征提取模块、所述包含全连接层和一维卷积层的时序编码器和所述分类器进行训练。
8.根据权利要求7所述的石墨坩埚的成型方法,其特征在于,将所述训练分类特征矩阵通过所述分类器以得到分类损失函数值,包括:使用所述分类器以如下分类公式对所述训练分类特征矩阵进行处理以生成训练分类结果,其中,所述分类公式为:其中,/>表示将所述训练分类特征矩阵投影为向量,/>为全连接层的权重矩阵,/>表示全连接层的偏置矩阵;以及计算所述训练分类结果与所述真实值之间的交叉熵值作为所述分类损失函数值。
9.根据权利要求8所述的石墨坩埚的成型方法,其特征在于,计算所述训练热红外分布时序特征向量和所述训练热处理时序特征向量的概率分布移位信息补偿损失函数值,包括:以如下优化公式计算所述训练热红外分布时序特征向量和所述训练热处理时序特征向量的所述概率分布移位信息补偿损失函数值;其中,所述优化公式为:,其中,/>是所述训练热红外分布时序特征向量,/>是所述训练热处理时序特征向量,/>表示/>函数,表示/>函数,/>表示以2为底的对数函数,/>和/>为移位补偿超参数,且/>为加权超参数,/>表示所述概率分布移位信息补偿损失函数值。
10.一种石墨坩埚的成型系统,其特征在于,包括:数据获取模块,用于获取预定时间段内多个预定时间点的热处理温度值和所述多个预定时间点的石墨坩埚的热红外图像;空间编码模块,用于将所述多个预定时间点的石墨坩埚的热红外图像分别通过使用空间注意力模型的卷积神经网络模型以得到多个热红外分布特征矩阵;池化模块,用于计算所述多个热红外分布特征矩阵的全局均值以得到热红外全局表征时序输入向量;多尺度编码模块,用于将所述热红外全局表征时序输入向量通过多尺度邻域特征提取模块以得到热红外分布时序特征向量;时序编码模块,用于将所述多个预定时间点的热处理温度值按照时间维度排列为热处理温度时序输入向量后通过包含全连接层和一维卷积层的时序编码器以得到热处理时序特征向量;响应性估计模块,用于计算所述热红外分布时序特征向量相对于所述热处理时序特征向量的响应性估计以得到分类特征矩阵;以及分类模块,用于将所述分类特征矩阵通过分类器以得到分类结果,所述分类结果用于表示当前时间点的热处理温度值应增大或应减小。
CN202310709330.7A 2023-06-15 2023-06-15 石墨坩埚的成型方法及其系统 Pending CN116680987A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310709330.7A CN116680987A (zh) 2023-06-15 2023-06-15 石墨坩埚的成型方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310709330.7A CN116680987A (zh) 2023-06-15 2023-06-15 石墨坩埚的成型方法及其系统

Publications (1)

Publication Number Publication Date
CN116680987A true CN116680987A (zh) 2023-09-01

Family

ID=87790658

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310709330.7A Pending CN116680987A (zh) 2023-06-15 2023-06-15 石墨坩埚的成型方法及其系统

Country Status (1)

Country Link
CN (1) CN116680987A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117225921A (zh) * 2023-09-26 2023-12-15 山东天衢铝业有限公司 一种铝合金型材挤压的自动控制系统及其方法
CN117315585A (zh) * 2023-10-11 2023-12-29 湖南盛翔自控有限公司 电解槽智能控制系统及其方法
CN117393921A (zh) * 2023-10-17 2024-01-12 浙江博时新能源技术有限公司 分布式储能设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117225921A (zh) * 2023-09-26 2023-12-15 山东天衢铝业有限公司 一种铝合金型材挤压的自动控制系统及其方法
CN117225921B (zh) * 2023-09-26 2024-03-12 山东天衢铝业有限公司 一种铝合金型材挤压的自动控制系统及其方法
CN117315585A (zh) * 2023-10-11 2023-12-29 湖南盛翔自控有限公司 电解槽智能控制系统及其方法
CN117315585B (zh) * 2023-10-11 2024-03-22 湖南盛翔自控有限公司 电解槽智能控制系统及其方法
CN117393921A (zh) * 2023-10-17 2024-01-12 浙江博时新能源技术有限公司 分布式储能设备

Similar Documents

Publication Publication Date Title
CN116680987A (zh) 石墨坩埚的成型方法及其系统
CN110555523B (zh) 一种基于脉冲神经网络的短程跟踪方法及系统
Zhao et al. Autodim: Field-aware embedding dimension searchin recommender systems
Jiao et al. Remaining useful life prediction for a roller in a hot strip mill based on deep recurrent neural networks
CN115896817A (zh) 氟氮混合气的生产方法及其系统
CN115393779B (zh) 用于激光熔覆金属球制造的控制系统及其控制方法
CN114332578A (zh) 图像异常检测模型训练方法、图像异常检测方法和装置
CN115909171A (zh) 钢包透气砖生产方法及其系统
CN116577677A (zh) 退役动力电池的放电测试系统及其方法
CN116580029B (zh) 铝合金铸造成品的质检管控系统及其方法
CN113486963B (zh) 一种密度自适应的点云端到端采样方法
CN111062450A (zh) 基于fpga和scnn架构的图像分类装置及方法
Vicente-Sola et al. Keys to accurate feature extraction using residual spiking neural networks
CN115990983A (zh) 一种可调节式加工模具及其方法
CN116177858A (zh) 高纯石英坩埚的制备方法及其系统
CN116596900A (zh) 石墨坩埚的制造方法及其系统
CN116832968A (zh) 锂云母的智能浮选工艺及其系统
CN117190657A (zh) 隧道式烘干生产线及其方法
CN117070741A (zh) 酸洗机组的控制方法及其系统
CN116166072A (zh) 电子级六氟丙烯裂解温度控制系统
CN116880688A (zh) 基于多通道信息融合的手势识别方法及其系统
CN116059681A (zh) 用于控制结晶成核的超声控制方法及其系统
Liu et al. Focusformer: Focusing on what we need via architecture sampler
CN116520154A (zh) 锂电池极片检测的性能评估方法及其系统
CN116375006A (zh) 碳纳米管物理分散方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination