CN115130546A - 异常参数检测方法、装置、计算机可读介质及电子设备 - Google Patents
异常参数检测方法、装置、计算机可读介质及电子设备 Download PDFInfo
- Publication number
- CN115130546A CN115130546A CN202210491071.0A CN202210491071A CN115130546A CN 115130546 A CN115130546 A CN 115130546A CN 202210491071 A CN202210491071 A CN 202210491071A CN 115130546 A CN115130546 A CN 115130546A
- Authority
- CN
- China
- Prior art keywords
- vector
- convolution
- encoder
- time sequence
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L21/00—Processes or apparatus adapted for the manufacture or treatment of semiconductor or solid state devices or of parts thereof
- H01L21/67—Apparatus specially adapted for handling semiconductor or electric solid state devices during manufacture or treatment thereof; Apparatus specially adapted for handling wafers during manufacture or treatment of semiconductor or electric solid state devices or components ; Apparatus not specifically provided for elsewhere
- H01L21/67005—Apparatus not specifically provided for elsewhere
- H01L21/67242—Apparatus for monitoring, sorting or marking
Abstract
本申请属于人工智能领域,涉及一种异常参数检测方法、装置、计算机可读介质及电子设备。包括:实时获取包含参数值的第一时间序列,对所述第一时间序列进行预处理以获取第一向量;将所述第一向量输入至卷积堆叠自编码器,通过所述卷积堆叠自编码器对所述第一向量进行卷积和反卷积处理,以获取第二向量;根据所述第一向量和所述第二向量确定第一差值集合,对所述第一差值集合中的异常值进行检测,以获取检测结果。本申请能够通过对第一时间序列中的参数值进行差分处理以保证时间序列的平稳性,同时采用卷积堆叠自编码器防止数据泄露,进一步地提高了检测结果的准确性。
Description
技术领域
本申请属于人工智能技术领域,具体涉及一种异常参数检测方法、异常参数检测装置、计算机可读介质以及电子设备。
背景技术
在设备运行过程中,设备的参数、生成的数据都可以构成时间序列,为了对设备运行状况进行判断,可以通过对该时间序列进行分析,判断其中是否存在异常点,如果存在则说明设备运行存在异常,需要进行维护,以保证设备的正常运行。例如在采用半导体制造设备制造半导体材料时,半导体制造设备的参数对半导体的后续制造起着关键的作用,稍有不慎就会造成半导体的不可用,所以在加工过程中,需要根据设备的参数生成的时间序列进行异常判断,及时调整相关参数设置,避免因为设备关键参数而造成的经济损失。
但是,相关技术中对时间序列进行异常值检测的方法通常都存在准确性差的问题。
发明内容
本申请的目的在于提供一种异常参数检测方法、异常参数检测装置、异常参数检测系统、计算机可读介质以及电子设备,能够克服相关技术中存在的异常参数检测的准确性差的问题。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供一种异常参数检测方法,该方法包括:实时获取包含参数值的第一时间序列,对所述第一时间序列进行预处理以获取与所述第一时间序列对应的第一向量;将所述第一向量输入至卷积堆叠自编码器,通过所述卷积堆叠自编码器对所述第一向量进行卷积和反卷积处理,以获取第二向量;根据所述第一向量和所述第二向量确定第一差值集合,对所述第一差值集合中的异常值进行检测,以获取检测结果。
根据本申请实施例的一个方面,提供一种异常参数检测装置,该装置包括:预处理模块,用于实时获取包含参数值的第一时间序列,对所述第一时间序列进行预处理以获取与所述第一时间序列对应的第一向量;模型处理模块,用于将所述第一向量输入至卷积堆叠自编码器,通过所述卷积堆叠自编码器对所述第一向量进行卷积和反卷积处理,以获取第二向量;异常检测模块,用于根据所述第一向量和所述第二向量确定第一差值集合,对所述第一差值集合中的异常值进行检测,以获取检测结果。
在本申请的一些实施例中,基于以上技术方案,所述预处理模块配置为:对所述第一时间序列中相邻两时间点对应的参数值进行差分处理,以获取与所述第一时间序列对应的第一差分时间序列;根据预设的时间滑动窗口对所述第一差分时间序列进行转换,以获取所述第一向量。
在本申请的一些实施例中,基于以上技术方案,所述预处理模块配置为:在对所述第一时间序列中相邻两时间点对应的参数值进行差分处理之前,对所述第一时间序列中的参数值进行对齐处理,以将所述第一时间序列中的参数值按时间顺序排列。
在本申请的一些实施例中,所述卷积堆叠自编码器包括输入层、卷积单元、反卷积单元和输出层,所述卷积单元包括一个或多个卷积层,所述反卷积单元包括一个或多个反卷积层;基于以上技术方案,所述模型处理模块配置为:通过所述输入层将所述第一向量传送至所述卷积单元,通过所述卷积单元中的卷积层对所述第一向量进行一维卷积操作,以获取与所述第一向量对应的高阶向量;将所述高阶向量传送至所述反卷积单元,通过所述反卷积单元中的反卷积层对所述高阶向量进行反卷积操作,以获取与所述第一向量具有相同维度的第二向量,并通过所述输出层输出所述第二向量。
在本申请的一些实施例中,基于以上技术方案,所述异常检测模块配置为:将所述第一向量和所述第二向量中同一维度的数值相减,以获取多个差值;对各所述差值取绝对值,并根据获取的多个差值绝对值确定所述第一差值集合。
在本申请的一些实施例中,基于以上技术方案,所述异常检测模块配置为:判断所述第一差值集合中的各个差值绝对值是否包含于异常区间;当所述差值绝对值包含于所述异常区间中时,判定所述差值绝对值为异常值。
在本申请的一些实施例中,基于以上技术方案,所述异常区间是采用统计的方法对第二差值集合进行计算生成的,所述第二差值集合是根据第三向量和通过所述卷积堆叠自编码器对所述第三向量进行处理生成的第四向量所生成的,其中,所述第三向量是根据包含历史参数的第二时间序列生成的向量。
在本申请的一些实施例中,基于以上技术方案,所述异常区间是采用3-sigma准则对所述第二差值集合进行计算生成的。
在本申请的一些实施例中,基于以上技术方案,所述异常参数检测装置还包括:获取模块,用于在将所述第一向量输入至卷积堆叠自编码器之前,获取包含历史参数的第二时间序列,对所述第二时间序列进行预处理以获取第三向量;预测模块,用于将所述第三向量输入至待训练的卷积堆叠自编码器,通过所述待训练的卷积堆叠自编码器对所述第三向量进行卷积和反卷积处理,以获取预测向量;调参模块,用于根据所述预测向量和所述第三向量对所述待训练的卷积堆叠自编码器进行调参,直至获取所述卷积堆叠自编码器。
在本申请的一些实施例中,基于以上技术方案,所述获取模块配置为:对所述第二时间序列中相邻两时间点对应的历史参数值进行差分处理,以获取与所述第二时间序列对应的第二差分时间序列;根据预设的时间滑动窗口对所述第二差分时间序列进行转换,以获取所述第三向量。
在本申请的一些实施例中,基于以上技术方案,所述获取模块配置为:在对所述第二时间序列中相邻两时间点对应的历史参数值进行差分处理之前,对所述第二时间序列中的参数值进行对齐处理,以将所述第二时间序列中的参数值按时间顺序排列。
在本申请的一些实施例中,基于以上技术方案,所述调参模块包括:损失函数确定单元,用于根据所述预测向量和所述第三向量确定损失函数;优化单元,用于最小化所述损失函数,以获取最优参数,并根据所述最优参数对所述待训练的卷积堆叠自编码器的参数进行调整。
在本申请的一些实施例中,所述损失函数为均方差损失函数;基于以上技术方案,所述优化单元配置为:判断所述均方差损失函数的下降趋势是否趋于稳定;当所述均方差损失函数的下降趋势未趋于稳定时,对所述均方差损失函数进行梯度下降,并将获取的梯度反向传播,以更新所述待训练的卷积堆叠自编码器中的参数;重复以上两步骤,直至所述均方差损失函数的下降趋势趋于稳定。
在本申请的一些实施例中,基于以上技术方案,所述异常参数检测装置还配置为:当所述检测结果为所述第一差值集合中存在异常值时,触发报警装置进行错误提示。
根据本申请实施例的一个方面,提供一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如以上技术方案中的异常参数检测方法。
根据本申请实施例的一个方面,提供一种电子设备,该电子设备包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器被配置为经由执行所述可执行指令来执行如以上技术方案中的异常参数检测方法。
本申请实施例提供的技术方案,通过实时获取包含参数值的第一时间序列,对该第一时间序列进行预处理以获取与其对应的第一向量;接着将第一向量输入至卷积堆叠自编码器,通过卷积堆叠自编码器对第一向量进行处理,以获取第二向量;然后根据第一向量和第二向量确定第一差值集合,最后对第一差值集合中的异常值进行检测,以获取检测结果。本申请中一方面能够通过对第一时间序列中的参数值进行差分处理的方式以保证时间序列的平稳性;另一方面能够通过卷积堆叠自编码器对预处理得到的第一向量进行卷积和反卷积处理,由于卷积堆叠自编码器中采用的是卷积层对输入的第一向量进行一维卷积,而不是全连接层进行全连接,因此可以防止数据泄露,进一步提高了异常检测结果的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性地示出了应用本申请技术方案的系统的架构框图。
图2示意性地示出了本申请中异常参数检测方法的步骤流程示意图。
图3示意性地示出了本申请中的预处理获取第一向量的流程示意图。
图4示意性地示出了本申请中的卷积堆叠自编码器的结构示意图。
图5示意性地示出了本申请中的对待训练的卷积堆叠自编码器进行训练的流程示意图。
图6示意性地示出了本申请中的对区域内CO2排放量进行异常检测的流程示意图。
图7示意性地示出了本申请中异常参数检测装置的结构框图。
图8示意性示出了适于用来实现本申请实施例的电子设备的计算机系统结构框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
相关技术中,在对半导体制造设备的异常参数进行检测时,由于半导体设备的参数数据通常表现为时间序列,因此对时间序列进行异常值检测的一个简单方法是标记那些偏离平均数、偏差和定量等常见统计属性的数据点。或者通过移动平均或低通滤波技术来识别异常,然而遍历时间序列并非易事,因为它是动态的,有时是未知的。异常检测的实现通常涉及到对许多参数的建模和分析,这些参数可能是复杂的、部分可观察的,甚至具有非线性的关联性。
在一种半导体设备参数异常检测方法中,其通过构建一个SAE(StackedAutoencoder,堆叠自编码器)网络,该SAE网络使用了5层全连接的编码器和5层全连接的解码器,然后训练SAE网络直至稳定,最后计算模型输入和输出的差值绝对值,并求出这些绝对值的平均值。在判断参数值是否是异常值时,当它的原始值和经过SAE网络后的值的差的绝对值偏离平均值一定的标准差时,就确定为异常值。
但是这种方法存在以下问题:首先,未对时间序列做任何处理,很多时候时间序列是不平稳的,如果直接输入模型训练,就会导致模型欠拟合,导致测试数据的效果不好;其次,SAE网络使用了5层全连接的编码器和5层全连接的解码器,但是全连接的网络没有考虑时间序列的先后顺序,会导致数据泄露,结果不准确;最后在判断异常值时并不明确“一定的标准差”是多少,所以在判断异常值时存在较大误差。
针对相关技术中存在的问题,本申请实施例提供了一种新的异常参数检测方法。
在对本申请实施例中的技术方案进行详细说明之前,首先对本申请实施例中可能涉及到的技术名词进行解释和说明。
1.时间序列:时间序列是不同时间点的一系列变量所组成的有序序列。以半导体制造设备为例,在制造半导体时,会有温度参数、功率参数等等,根据一段时间内各时间点对应的温度参数可以生成温度时间序列,根据一段时间内各时间点对应的功率参数可以生成功率时间序列。
2.数据对齐:将数据按照时间顺序排序。
3.差分处理:轮询时间序列中的各个参数值,将当前参数值与前一时间点对应的参数值相减。
4.卷积堆叠自编码器:自编码器的一种,是一种无监督式学习模型,本质上使用了一个神经网络来产生一个高维输入的低维表示,卷积堆叠自编码包含两个主要的部分,编码器和解码器,编码器用来发现给定数据的压缩表示,解码器用来重建原始输入。
5.异常区间:用于判断差值集合中是否存在异常点的数值区间。本申请实施例中的异常区间是采用统计的方式对差值集合进行处理所形成的用于检测异常的数值区间,统计的方式比如可以采用n-sigma准则、箱型图,等等,可选地,当采用n-sigma准则时,该n-sigma准则可以是3-sigma准则。其中,差值集合是根据训练向量和与训练向量对应的输出向量所确定的,输出向量是训练后的卷积堆叠自编码器对训练向量进行处理所输出的向量。
在介绍本申请使用到的一些技术名词之后,以下结合图1对应用本申请技术方案的示例性系统架构进行说明:
图1示意性地示出了应用本申请技术方案的示例性系统架构框图。
如图1所示,系统架构100可以包括终端设备101、网络102和服务器103。终端设备101具体可以是用于进行生产加工的制造设备,或者是如台式计算机、笔记本电脑、智能手机、智能车载终端、飞行器等电子设备,当终端设备101是用于进行生产加工的制造设备时,在制造设备上可以内置或外置对加工参数进行采集的传感器或其它参数采集电子器件。服务器103可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。网络102可以是能够在终端设备101、参数采集电子器件和服务器103之间提供通信链路的各种连接类型的通信介质,例如可以是有线通信链路或者无线通信链路。
根据实现需要,本申请实施例中的系统架构可以具有任意数目的终端设备、网络和服务器。例如,服务器可以是由多个服务器设备组成的服务器群组。另外,本申请实施例提供的技术方案可以应用于服务器103,也可以应用于终端设备101,当然也可以由终端设备101和服务器103共同实施,本申请对此不做特殊限定。
在本申请的一个实施例中,以终端设备101为用于进行生产加工的制造设备为例,在制造设备加工过程中,参数采集电子器件能够实时采集制造设备在运行时段内的参数,该运行时段内的参数可以构成一时间序列,接着可以通过网络102将该时间序列传送至服务器103。服务器103接收到时间序列后,对时间序列进行预处理以获取对应的第一向量,并调用训练好的卷积堆叠自编码器对第一向量进行处理,以获取第二向量,接着根据第一向量和第二向量可以确定一差值集合,通过对差值集合中的异常值进行检测,可以获取检测结果。当检测结果为差值集合中存在异常值时,可以触发终端设备101发出错误提示,以便技术人员及时调整制造设备的加工参数,保证产品的正常加工,避免因为参数错误导致产品的良率降低,进而造成经济损失。
其中,对时间序列进行预处理具体是对时间序列中的参数进行差分处理,并将差分处理后的参数转换为向量形式,其中对时间序列中的参数进行差分处理具体可以是将时间序列中相邻两时间点对应的参数值进行差分运算,以生成与时间序列对应的差分时间序列,在获取差分时间序列后,可以通过一固定的时间滑动窗口在差分时间序列上按照设定的步长进行滑动,以将差分时间序列转换为第一向量。同时,在根据第一向量和第二向量确定差值集合时,可以将第一向量和第二向量中对应同一维度的数值相减并取绝对值,根据所得到的所有绝对值即可形成该差值集合。
在本申请的一个实施例中,也可以由终端设备101执行本申请中的异常参数检测方法,终端设备101在得到包含参数值的时间序列后,对时间序列进行预处理以获取对应的第一向量,然后调用卷积堆叠自编码器,对该第一向量进行卷积和反卷积处理,以获取第二向量;接着根据第一向量和第二向量可以确定一差值集合,通过对差值集合中的异常值进行检测,可以获取检测结果,进而可以根据检测结果确定是否需要对终端设备101中的参数进行调整。其中对时间序列进行预处理的方法和获取差值集合的方法与上述的对时间序列进行预处理的方法和获取差值集合的方法相同,在此不再赘述。
本申请实施例中所使用的卷积堆叠自编码器(Convolutional StackedAutoencoder,简称CSAE)是自编码器的一种,其属于机器学习模型,并且是基于人工智能(Artificial Intelligence,AI)实现的。以下对人工智能的相关概念进行说明:
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。前述的卷积堆叠自编码器就是机器学习模型的一种示例。
本申请中的异常参数检测方法可以应用于各种工况的制造设备的参数异常检测场景,通过对制造设备的关键参数进行异常值检测,及时的调整相关参数设置,避免因为参数异常而造成的经济损失,还可以应用于其它任意地可以生成时间序列的场景,比如对股票波动性进行检测、对网络设备的流量进行监测、对计算机性能指标进行评估、对区域内CO2排放量的突变进行检测等等。接下来以对半导体制造设备进行异常参数检测为例,对本申请中的异常参数检测方法进行详细说明。
图2示意性地示出了本申请一个实施例中的异常参数检测方法的步骤流程示意图,该异常参数检测方法可以由终端设备执行,也可以由服务器执行,该终端设备、服务器具体可以是图1中的终端设备101、服务器103。如图2所示,本申请实施例中的异常参数检测方法主要可以包括如下的步骤S210至步骤S230。
步骤S210:实时获取包含参数值的第一时间序列,对所述第一时间序列进行预处理以获取第一向量;
步骤S220:将所述第一向量输入至卷积堆叠自编码器,通过所述卷积堆叠自编码器对所述第一向量进行卷积和反卷积处理,以获取第二向量;
步骤S230:根据所述第一向量和所述第二向量确定第一差值集合,对所述第一差值集合中的异常值进行检测,以获取检测结果。
在本申请实施例提供的异常参数检测方法中,通过实时获取包含参数值的第一时间序列,对该第一时间序列进行预处理以获取与其对应的第一向量;接着将第一向量输入至卷积堆叠自编码器,通过卷积堆叠自编码器对第一向量进行卷积和反卷积处理,以获取第二向量;然后根据第一向量和第二向量确定第一差值集合,最后对第一差值集合中的异常值进行检测,以获取检测结果。本申请中能够通过卷积堆叠自编码器对第一向量进行处理,其中在对第一向量进行特征提取时,是采用卷积层进行一维卷积处理进行特征提取的,能够考虑到第一时间序列中参数的先后顺序,因此能够防止数据泄露,进而提高了异常检测结果的准确性。
下面对本申请中的异常参数检测方法的各个方法步骤的具体实现方式进行详细说明。
在步骤S210中,实时获取包含参数值的第一时间序列,对所述第一时间序列进行预处理以获取第一向量。
在本申请的一个实施例中,在采用半导体制造设备制造半导体时,参数设置可能是实时变化的,也可能是间隔一定时间变化的,因此为了避免参数异常导致产品良率降低,在制造设备运行过程中,可以实时获取制造设备加工产品时的参数值,并根据一段时间内所采集的参数值生成第一时间序列,进而针对该第一时间序列进行参数的异常检测。其中第一时间序列中可以包含任意数量的参数值,例如可以是制造设备运行一分钟、五分钟、十分钟等时间段内的参数值,本申请实施例对此不作具体限定。通过对制造设备进行实时的异常参数检测,可以获取制造设备的实时状态,如果存在参数异常,则可以及时发出错误提示,以便技术人员及时调整设备参数,以保证产品的良率,进而避免企业遭受严重的经济损失。
在获取第一时间序列后,由于第一时间序列不平稳,因此为了保证检测结果的准确性,在根据第一时间序列进行异常检测之前,需要对第一时间序列进行预处理,以获取与其对应的第一向量。在本申请的实施例中,对第一时间序列进行预处理具体可以是进行差分处理和向量转换。
图3示出了预处理获取第一向量的流程示意图,如图3所示,该流程至少包括步骤S301-S302,具体为:
在步骤S301中,对第一时间序列中相邻两时间点对应的参数值进行差分处理,以获取与所述第一时间序列对应的第一差分时间序列。
在本申请的一个实施例中,在进行差分处理时,可以将第一时间序列中任一时间点对应的参数值作为目标参数值,接着用目标参数值减去与该时间点相邻的前一时间点所对应的参数值,即可获取与目标参数值和相邻的前一时间点对应的参数值对应的差分结果,在对第一时间序列中所有的参数值进行轮询并进行差分处理后,即可获取第一差分时间序列。举例而言,当一时间序列为[1,2,3,4,5,6],那么通过进行差分处理可以获取差分时间序列为[1,1,1,1,1]。
在步骤S302中,根据预设的时间滑动窗口对所述第一差分时间序列进行转换,以获取所述第一向量。
在本申请的一个实施例中,为了将第一差分时间序列转换为第一向量,可以通过时间滑动窗口对差分时间序列进行处理,以获取第一向量。具体地,可以预先设置一固定大小的时间滑动窗口,例如可以将时间滑动窗口的大小设置为3、5、8等等,将时间滑动窗口的滑动步长设置为1、2等等,在本申请的实施例中,时间滑动窗口的大小和滑动步长可以根据第一差分时间序列中所包含的数据量来灵活调整,包括且不限于上述的时间滑动窗口的大小和滑动步长,本申请实施例对此不作具体限定。其中,时间滑动窗口的大小表示该时间滑动窗口在第一差分时间序列上进行滑动时,一次可覆盖多少个差分值,例如当时间滑动窗口的大小为5时,说明时间滑动窗口每次滑动都可以覆盖5个差分值,滑动步长表示每次时间滑动窗口滑动时移动的格数,例如当滑动步长为1时,说明时间滑动窗口每次滑动时移动1格,1格对应一个差分值。在设定好时间滑动窗口的大小和步长后,采用该时间滑动窗口在第一差分时间序列上进行滑动,并在滑动的过程中提取差分值,进而根据所提取的差分值可以构建得到第一向量。
举例而言,当第一差分时间序列中包含100个差分值,时间滑动窗口的大小为10,滑动步长为1时,那么可以通过时间滑动窗口的滑动在不添加padding的情况下从第一差分时间序列中提取到91个具有10个差分值的元素,根据该91个元素即可形成第一向量,也就是说,第一向量只是第一差分时间序列的一种向量化表示,其中的差分值并未发生任何变化。值得注意的是,第一向量中包含的元素的数量随滑动步长以及时间滑动窗口的大小变化而变化。
通过时间滑动窗口对第一差分时间序列进行转换,最后得到的数据尺寸为shape=(n,time-steps,dim),其中n为第一差分时间序列的行数,dim为每个时间点对应的参数维度,例如可以是每个时间点半导体制造设备参数的个数,当只对单个维度的半导体制造设备的参数进行异常检测时,dim=1,time-steps为时间滑动窗口的大小,继续以上述例子为例,通过对包含100个差分值的第一差分时间序列进行转换,最终得到的第一向量的尺寸为(100,10,1)。
在本申请的一个实施例中,参数维度dim还可以设置为其它值,例如设置为2、3等,以半导体制造设备为例,在半导体制造加工过程中,温度、功率、湿度都是参数维度,那么在对半导体制造设备的参数进行异常检测时,可以同时对温度、功率进行异常检测,同时对温度、湿度进行异常检测,同时对功率、湿度进行异常检测,也可以同时对温度、功率和湿度进行异常检测,相应地,就可以将参数维度分别设置为2、2、2和3。
在本申请的一个实施例中,第一时间序列中可能存在数据量大、数据散乱的问题,因此在对第一时间序列中相邻两时间点对应的参数值进行差分处理之前,还可以对第一时间序列中的参数值进行对齐处理,以将第一时间序列中的参数值按时间顺序排列,以保证第一时间序列中的参数值是严格按照时间顺序记录的,避免影响异常检测结果的准确性,同时还可以保证在获取异常检测结果后,准确定位发生异常的时间点。
在本申请的一个实施例中,还可以对第一时间序列中的参数值进行清洗,以去除第一时间序列中的残缺数据、错误数据和重复数据,以免该些残缺数据、错误数据和重复数据影响异常检测结果的准确性。
在步骤S220中,将所述第一向量输入至卷积堆叠自编码器,通过所述卷积堆叠自编码器对所述第一向量进行卷积和反卷积处理,以获取第二向量。
在本申请的一个实施例中,在获取第一向量后,可以通过机器学习模型对第一向量进行处理,以获取与第一向量对应的第二向量。在本申请的实施例中,该机器学习模型具体可以是卷积堆叠自编码器,由于卷积堆叠自编码器中的编码器是由卷积层形成的,解码器是由反卷积层形成的,而卷积层能够考虑时间序列的先后顺序,可以有效防止数据泄露,提高异常检测结果的准确率。
在本申请的一个实施例中,卷积堆叠自编码器包括依次连接的输入层、卷积单元、反卷积单元和输出层,其中卷积单元包括一个或多个卷积层,反卷积单元包括一个或多个反卷积层。
图4示出了一种卷积堆叠自编码器的结构示意图,如图4所示,卷积堆叠自编码器400包括依次连接的输入层401、第一卷积层402、第二卷积层403、第一反卷积层404、第二反卷积层405和输出层406。其中,第一卷积层402和第二卷积层403的处理过程具体为下采样过程,也就是编码过程,第一反卷积层404和第二反卷积层405的处理过程具体为上采样过程,也就是解码过程。对卷积堆叠自编码器而言,其对应的输入向量和输出向量的大小相同,因此为了保证输出的第二向量与输入的第一向量的大小相同,可以将第一卷积层402和第二卷积层403组成的卷积单元与第一反卷积层404和第二反卷积层405组成的反卷积单元对称设置,其中的结构参数也对称设置,具体而言,第一卷积层402的结构参数和第二反卷积层405的结构参数设置为相同的参数,第二卷积层403的结构参数和第一反卷积层404的结构参数设置为相同的参数。
在根据第一差分时间序列获取第一向量后,可以将第一向量通过输入层401输入卷积堆叠自编码器,该第一向量可以通过输入层401传送至由第一卷积层402和第二卷积层403组成的卷积单元,以便第一卷积层402和第二卷积层403依次对第一向量进行特征提取,以获取高阶特征,接着该高阶特征可以传送至由第一反卷积层404和第二反卷积层405组成的反卷积单元,依次通过第一反卷积层404和第二反卷积层405对高阶特征进行反卷积处理,也就是解码,以将其转换为大小与第一向量大小相同的第二向量,并通过输出层406输出。
其中,第一卷积层402和第二卷积层403依次对第一向量进行特征提取时,采用一维卷积方法进行特征提取,一维卷积顾名思义是沿着一个方向进行特征提取,在特征提取时,卷积核可以沿着纵向(width)或者沿着横向(lenth)进行滑动以提取特征,不同于二维卷积,二维卷积是沿着横向和纵向两个方向同时提取特征的。本申请实施例中通过采用一维卷积进行特征抽取,可以避免数据泄露,进而提高了异常检测结果的准确性。
值得说明的是,图4所示的卷积堆叠自编码器中包含两层卷积层和两层反卷积层,当然还可以根据实际需要设置其它数量的卷积层和反卷积层,只要保证卷积层构成的卷积单元和反卷积层构成的反卷积单元是对称结构即可。
在本申请的一个实施例中,为了保证卷积堆叠自编码器输出的第二向量的准确性,在使用卷积堆叠自编码器对第一向量进行处理生成第二向量之前,需要采用训练样本对待训练的卷积堆叠自编码器进行训练,以获取收敛稳定的卷积堆叠自编码器。
接下来,对待训练的卷积堆叠自编码器的训练过程进行详细说明。
在本申请的一个实施例中,可以获取大量半导体制造设备的历史参数值,并将该些历史参数值分为两部分,一部分作为训练数据,一部分作为测试数据,其中训练数据用于生成训练样本,测试数据用于生成测试样本。在获取训练样本和测试样本后,可以根据训练样本对待训练的卷积堆叠自编码器进行训练,并在训练结束后采用测试样本对卷积堆叠自编码器的稳定性进行测试。
图5示出了对待训练的卷积堆叠自编码器进行训练的流程示意图,如图5所示,在步骤S501中,获取包含历史参数值的第二时间序列,对所述第二时间序列进行预处理以获取第三向量;在步骤S502中,将所述第三向量输入待训练的卷积堆叠自编码器,通过所述待训练的卷积堆叠自编码器对所述第三向量进行卷积和反卷积处理,以获取预测向量;在步骤S503中,根据所述预测向量和所述第三向量对所述待训练的卷积堆叠自编码器进行调参,直至获取所述卷积堆叠自编码器。
其中,步骤S501中对第二时间序列进行预处理获取第三向量的方法与上述实施例中对第一时间序列进行预处理并生成第一向量的方法相同,具体地,首先对第二时间序列中相邻两时间点对应的历史参数值进行差分处理,以获取与第二时间序列对应的第二差分时间序列;然后根据预设的时间滑动窗口对第二差分时间序列进行转换,以获取第三向量。进一步地,在对第二时间序列中相邻两时间点对应的历史参数值进行差分处理之前,还可以对第二时间序列中的历史参数值进行对齐处理,以将第二时间序列中的参数值按时间顺序排列。更进一步地,还可以在对历史参数值进行对齐处理之前,对历史参数值进行清洗,以去除其中的残缺数据、重复数据和错误数据。
在本申请的一个实施例中,形成测试样本的方法与形成训练样本的方法相同,都是先对历史参数值形成的时间序列进行对齐和差分处理,以获取与时间序列对应的差分时间序列,接着采用预设的时间滑动窗口对差分时间序列进行转换,以获取对应的向量。由于在处理数据的过程中,都采用了差分处理的方法,因此可以保证训练数据和测试数据保持同一分布,提高了卷积堆叠自编码器的稳定性。
在本申请的一个实施例中,待训练的卷积堆叠自编码器与上述实施例中的卷积堆叠自编码器的结构一致,可以包含一个或多个待训练的卷积层和一个或多个待训练的反卷积层,如图4中所示的卷积堆叠自编码器,待训练的卷积堆叠自编码器可以包括两层待训练的卷积层和两层待训练的反卷积层。
在本申请的一个实施例中,将第三向量输入至待训练的卷积堆叠自编码器中,待训练的卷积堆叠自编码器对第三向量进行特征提取,并输出与第三向量对应的预测向量。在获取预测向量后,可以根据预测向量和输入的第三向量对待训练的卷积堆叠自编码器中的参数进行调整,通过多次的迭代优化,可以获取使待训练的卷积堆叠自编码器具有最优性能的最优参数,具有最优参数的卷积堆叠自编码器即为训练成功的卷积堆叠自编码器。
在根据预测向量和第三向量对待训练的卷积堆叠自编码器进行调参时,首先根据预测向量和第三向量确定损失函数,然后对损失函数进行最小化处理,以获取最优参数,并根据最优参数对待训练的卷积堆叠自编码器中的参数进行调整。在本申请的实施例中,对损失函数进行最小化处理可以采用任意地梯度下降算法,例如批量梯度下降算法、随机梯度下降算法、牛顿法、自适应梯度算法、Adam算法等等,以获取最优参数,并将具有最优参数的待训练的卷积堆叠自编码器作为训练成功的卷积堆叠自编码器。
在本申请的一个实施例中,该损失函数具体可以是均方差损失函数,在根据预测向量和第三向量确定均方差损失函数后,判断该均方差损失函数的下降趋势是否趋于稳定,当判定均方差损失函数的下降趋势并未趋于稳定时,对损失函数进行梯度下降,并将获取的梯度反向传播,以更新待训练的卷积堆叠自编码器中的参数,通过多次的迭代,在均方差损失函数的下降趋势趋于稳定,即均方差损失函数达到极小值时,即可停止训练,并根据最新获取的参数值更新待训练的卷积堆叠自编码器,以获取稳定的卷积堆叠自编码器。其中,在判断均方差损失函数的下降趋势是否趋于稳定可以根据每两次训练得到的均方差损失函数之间的差值来确定,当每两次训练得到的均方差损失函数的差值维持不变或者只有很小幅度的变化时即可认为下降趋势趋于稳定。
其中,最优参数即为待训练的卷积堆叠自编码器中的最优权重,在更新待训练的卷积堆叠自编码器中的权重时,采用的更新规则如公式(1)所示:
其中,W为权重,lr为优化器的学习率,loss为损失函数。
学习率为超参数,可以人为设定,在训练阶段通常采用较小的学习率,例如可以设置为0.1等等。通过多次的迭代训练,即可获取最优权重,进而得到收敛且稳定的卷积堆叠自编码器。
在本申请的一个实施例中,还可以设置训练次数,当对待训练的卷积堆叠自编码器进行正向数据处理和反向梯度更新的次数达到预设的训练次数时,即可认为训练完成,得到的卷积堆叠自编码器即为最终所需的稳定收敛的卷积堆叠自编码器。
在完成对待训练的卷积堆叠自编码器的训练后,即可采用其对训练样本进行处理,以生成对应的输出向量,进而根据训练样本和输出向量可以确定异常区间,用于对参数的异常进行判断。
在步骤S230中,根据所述第一向量和所述第二向量确定第一差值集合,对所述第一差值集合中的异常值进行检测,以获取检测结果。
在本申请的一个实施例中,在获取第一向量和第二向量后,可以根据第一向量和第二向量之间的差值确定第一差值集合,接着对第一差值集合中的异常值进行检测以获取检测结果,并根据该检测结果可以判断半导体制造设备的参数是否存在异常,以及是否需要提醒技术人员对半导体制造设备的参数进行调整。
在本申请的一个实施例中,在确定第一差值集合时,可以将第一向量和第二向量中同一维度的数值相减,以获取多个差值,接着对各个差值取绝对值,最后根据所有的差值绝对值即可确定得到第一差值集合。
在本申请的一个实施例中,在对第一差值集合中的异常值进行检测时,可以根据第一差值集合中各个差值绝对值与异常区间的关系确定第一差值集合中是否存在异常值,具体而言,当差值绝对值包含于异常区间中时,说明该差值绝对值为异常值,也就是说,半导体制造设备的参数存在异常,需要进行调整;当差值绝对值不包含于异常区间中,说明该差值绝对值为正常值,相应地,半导体制造设备的参数正常,不需要进行调整。
在本申请的一个实施例中,异常区间是采用统计的方法对第二差值集合进行计算生成的。其中,第二差值集合是根据第三向量和通过卷积堆叠自编码器对第三向量进行处理生成的第四向量所生成的,第三向量是上述实施例中对待训练的卷积堆叠自编码器进行训练时所采用的训练样本,其是对包含历史参数的第二时间序列进行预处理生成的,通过卷积堆叠自编码器对第三向量进行处理以获取第四向量,将第四向量与第三向量中同一维度的数值相减,并取绝对值,即可获取第二差值集合;统计的方法例如可以是n-sigma准则、箱形图,等等,当然还可以是采用其它方法来确定异常区间,本申请实施例对此不作具体限定。
为了使本申请的技术方案更清晰,接下来以n-sigma准则和箱型图为例,对生成异常区间的方法进行说明。
(一)采用n-sigma准则确定异常区间
n-sigma准则基于目标分布是正态或近似正态分布,正态分布的概率密度的公式如式(2)-(3)所示:
其中,在正态分布中σ代表标准差,μ代表均值。
在确定标准差和均值后,可以根据所确定的标准差和均值确定异常区间。检测异常的方法通常包括三种:第一种是检测突增异常,对应的异常区间为:{X:X>μ+nσ};第二种是检测突降异常,对应的异常区间为:{X:X<μ-nσ};第三种是检测双向(突增或突降)异常,对应的异常区间为:{X:X>μ+nσor X<μ-nσ}。在本申请的实施例中,由于在形成第一差值集合以及第二差值集合时,都是对两向量同一维度的数值相减后的差值取绝对值形成的,因此只需要采用检测突增异常的区间作为异常区间即可,对应的表达式为:{X:X>μ+nσ},其中n为n-sigma准则中采用的n值,且n为正整数。当第一差值集合中存在差值绝对值落在该异常区间中时,说明该差值绝对值为异常值,半导体制造设备的参数存在异常,需要进行调整。
根据公式(2)-(3)可以计算得到,数值分布在(μ-2σ,μ+2σ)中的概率为0.9545,数值分布在(μ-3σ,μ+3σ)中的概率为0.9973。通常把等于±3σ的误差作为极限误差,对于正态分布的随机误差,落在±3σ以外的概率只有0.27%,它在有限次测量中发生的可能性很小,因此可以将3σ准则作为粗大误差判别准则,如果测量数据中某个测量值的残余误差的绝对值>3σ,则该测量值为坏值,应剔除。
在本申请的实施例中,n-sigma准则具体可以是3-sigma准则,通过基于3-sigma准则对第二差值集合进行计算可以确定异常区间,相应地,该异常区间具体为:{X:X>μ+3σ}。也就是说,在确定第二差值集合后,可以根据第二差值集合计算得到均值μ和标准差σ,将均值μ和标准差σ代入所确定的异常区间的表达式中即可得到异常区间的最小值。
接着,将第一差值集合中各个差值绝对值与异常区间中的最小值进行比较,即可获取第一差值集合中的异常值,具体地,当第一差值集合中存在大于或等于该最小值的差值绝对值时,说明该差值绝对值为第一差值集合中的异常值,与该差值绝对值对应的设备参数值即为异常参数值,那么就需要提醒技术人员及时对半导体制造设备的参数进行调整,以保障设备参数的准确性,进而提高产品的良率,防止企业遭受经济损失。
(二)采用箱型图确定异常区间
箱型图可以用来观察数据整体的分布情况,具体而言是利用数据中的五个统计量:最小值、下四分位数Q1、中位数、上四分位数Q3与最大值来描述数据的一种统计图,它能够直观地显示数据的异常值、分布的离散程度以及数据的对称性。其中,中位数是数据按从小到大的顺序排列后处于中间位置的值,如果序列是偶数个,则中位数为中间两个数的平均值;下四分位数Q1为位于数据序列25%位置处的数;上四分位数Q3为位于数据序列75%位置处的数;四分位间距IQR为上四分位数和下四分位数之间的差值;最小值是根据下四分位数、四分位间距和预设的调整系数确定的值;最大值是根据上四分位数、四分位间距和预设的调整系数确定的值。当存在小于最小值或者大于最大值的数据时,就说明该数据为异常值。值得说明的是,还可以根据其它的分位数确定异常区间。
以四分位数构建箱型图为例,在本申请的实施例中,在获取第二差值集合后,可以计算第二差值集合中的上四分位数和下四分位数,在确定预设的调整系数后,可以根据上四分位数、下四分位数和预设的调整系数确定异常区间,该异常区间的具体表达式为[0,Q1-αIQR]和[Q3+αIQR,∞),其中,α为预设的调整系数,通常设置为1.5,当然还可以设置为其它的值,例如增大至3。值得注意的是,由于第二差值集合中的数值均为差值绝对值,大于或等于0,因此本申请实施例中将异常区间的下限设置为0,当第一差值集合中的数值落在该异常区间内时,说明该数值对应的参数为异常参数。
本申请实施例中设置异常区间的目的是为了判断参数值是否偏离正常参数区间,因此在本申请实施例中,只要能够基于第二差值集合确定一个区间,将第一差值集合中距离大部分数据较远的数据点筛选出来即可。例如还可以根据第二数值区间计算均值和标准差,将均值和标准差相加得到的值作为异常区间最小值,那么当第一差值集合中的数值大于或等于异常区间最小值时,就说明该数值对应的参数值为异常参数,进一步地,还可以为标准差设置权重,例如将均值和经权重处理后的标准差相加得到的值作为异常区间最小值,等等。
在本申请的一个实施例中,在本申请的系统架构中还可以设置一报警装置,当监测到第一差值集合中存在异常值时,触发报警装置进行错误提示,同时半导体制造设备停止加工,待技术人员将参数调整为正常值之后,再继续加工。这样可以实时发现参数的异常,并进行及时的提醒,保障了产品的良率,避免了企业的经济损失。
本申请中的异常参数检测方法除了可以应用于对半导体制造设备进行异常检测,还可以应用到其它任意的可生成时间序列的场景中,例如可以采用本申请中的异常参数检测方法检测区域内CO2排放量发生异常的情况、检测股票在一定时间内的波动性、检测网络设备的流量变化、评估计算机性能指标、检测景点游客数量随季节变化的变化情况,等等。
接下来,以对区域内CO2排放量的异常情况进行检测为例对本申请的技术方案进行说明。图6示出了对区域内CO2排放量进行异常检测的流程示意图,如图6所示:
在步骤S601中,采集历史CO2排放量数据;该历史CO2排放量数据可以是过去五年内某区域内监测到的数据,当然也可以是其它时间段内监测到的数据,并且该CO2排放量数据可以是以小时、天、周等为单位的排放量。
在步骤S602中,对历史CO2排放量数据进行对齐,以将所有数据按时间顺序排列形成第一时间序列。
在步骤S603中,对第一时间序列进行差分处理以获取第一差分时间序列。
在步骤S604中,通过预先设置的时间滑动窗口将第一差分时间序列转换为第一向量。
在步骤S605中,采用第一向量训练待训练的卷积堆叠自编码器;在获取该第一向量后,可以将其作为训练样本,用于对待训练的卷积堆叠自编码器。在完成对待训练的卷积堆叠自编码器的训练后,可以采用测试样本对训练好的卷积堆叠自编码器进行测试,以判断其是否收敛。其中,该测试样本可以是在形成训练样本的同时根据历史CO2排放量数据生成的,由于生成训练样本和生成测试样本的方法相同,并且在进行处理的过程中都采用了差分处理,因此可以保证训练样本和测试样本保持同一分布,并且克服了时间序列的不平稳性,使得在采用训练样本对待训练的卷积堆叠自编码器进行训练时,可以防止卷积堆叠自编码器欠拟合,进而可以提高卷积堆叠自编码器的稳定性。
在步骤S606中,将第一向量输入至训练好的卷积堆叠自编码器,以获取卷积堆叠自编码器输出的输出向量。
在步骤S607中,将第一向量和输出向量中对应同一维度的数值相减并取绝对值,以获取第一差值集合。
在步骤S608中,基于该第一差值集合采用统计的方法确定CO2排放异常区间。
在步骤S609中,获取待处理的CO2排放量数据;待处理的CO2排放量数据可以是该区域近一年、近半年等时间段内监测到的CO2排放量数据。
在步骤S610中,对待处理的CO2排放量数据进行对齐,以生成第二时间序列。
在步骤S611中,对第二时间序列进行差分处理,以生成第二差分时间序列。
在步骤S612中,通过预设的时间滑动窗口可以将第二差分时间序列转换为第二向量。
在步骤S613中,将第二向量输入至训练好的卷积堆叠自编码器中进行特征提取,以获取第三向量。
在步骤S614中,将第二向量和第三向量中对应同一维度的数组相减并对差值取绝对值,以获取第二差值集合。
在步骤S615中,将第二差值集合中各差值绝对值与CO2排放异常区间进行对比,以确定异常排放数据;如果存在差值绝对值落在该CO2排放异常区间中时,说明该差值绝对值为异常值,该差值绝对值对应的CO2排放量数据为异常排放数据,如果不存在差值绝对值落在该CO2排放异常区间中时,说明第二差值集合中的差值绝对值都是正常值,该区域近一年、近半年等时间段内监测到的CO2排放量数据也都是符合正常的排放标准的。
上述实施例中,都是从一个维度对半导体制造设备、CO2排放量数据进行异常检测的,本申请实施例中还可以从多个维度对检测对象进行异常检测,无论是一个维度还是多个维度,采用训练好的卷积堆叠自编码器都可以对与原始数据对应的向量进行特征提取,并根据原始数据对应的向量、卷积堆叠自编码器输出的向量和异常区间进行异常检测。
本申请中的异常参数检测方法,通过实时获取包含参数值的第一时间序列,对该第一时间序列进行预处理以获取与其对应的第一向量;接着将第一向量输入至卷积堆叠自编码器,通过卷积堆叠自编码器对第一向量进行卷积和反卷积处理,以获取第二向量;然后根据第一向量和第二向量确定第一差值集合,最后对第一差值集合中的异常值进行检测,以获取检测结果。本申请一方面能够通过对第一时间序列进行差分处理以保证时间序列的平稳性,在训练卷积堆叠自编码器时,采用与差分时间序列对应的向量进行训练,可以防止卷积堆叠自编码器欠拟合,保证了卷积堆叠自编码器的稳定性;另一方面由于卷积堆叠自编码器中的编码器和解码器分别是卷积层和反卷积层,卷积层能够考虑时间序列的先后顺序,相对于现有的包含全连接层的自编码器,本申请能够通过采用卷积堆叠自编码器防止数据泄露;再一方面能够通过结合统计的方法进行异常参数判断,提高了异常检测结果的准确性。当将本申请中的异常参数检测方法应用于设备参数的异常检测时,可以及时发现参数的异常,进而提高了产品的良率,避免了企业因为产品不合格所导致的经济损失。本申请中的异常参数检测方法可操作性强,并且泛化能力更强,通用性更高。
应当注意,尽管在附图中以特定顺序描述了本申请中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
以下介绍本申请的装置实施例,可以用于执行本申请上述实施例中的导航方法。图7示意性地示出了本申请实施例提供的异常参数检测装置的结构框图。如图7所示,异常参数检测装置700包括:预处理模块710、模型处理模块720和异常检测模块730,具体地:
预处理模块710,用于实时获取包含参数值的第一时间序列,对所述第一时间序列进行预处理以获取第一向量;模型处理模块720,用于将所述第一向量输入至卷积堆叠自编码器,通过所述卷积堆叠自编码器对所述第一向量进行卷积和反卷积处理,以获取第二向量;异常检测模块730,用于根据所述第一向量和所述第二向量确定第一差值集合,对所述第一差值集合中的异常值进行检测,以获取检测结果。
在本申请的一些实施例中,基于以上技术方案,所述预处理模块710配置为:对所述第一时间序列中相邻两时间点对应的参数值进行差分处理,以获取与所述第一时间序列对应的第一差分时间序列;根据预设的时间滑动窗口对所述第一差分时间序列进行转换,以获取所述第一向量。
在本申请的一些实施例中,基于以上技术方案,所述预处理模块710配置为:在对所述第一时间序列中相邻两时间点对应的参数值进行差分处理之前,对所述第一时间序列中的参数值进行对齐处理,以将所述第一时间序列中的参数值按时间顺序排列。
在本申请的一些实施例中,所述卷积堆叠自编码器包括输入层、卷积单元、反卷积单元和输出层,所述卷积单元包括一个或多个卷积层,所述反卷积单元包括一个或多个反卷积层;基于以上技术方案,所述模型处理模块720配置为:通过所述输入层将所述第一向量传送至所述卷积单元,通过所述卷积单元中的卷积层对所述第一向量进行一维卷积操作,以获取与所述第一向量对应的高阶向量;将所述高阶向量传送至所述反卷积单元,通过所述反卷积单元中的反卷积层对所述高阶向量进行反卷积操作,以获取与所述第一向量具有相同维度的第二向量,并通过所述输出层输出所述第二向量。
在本申请的一些实施例中,基于以上技术方案,所述异常检测模块730配置为:将所述第一向量和所述第二向量中同一维度的数值相减,以获取多个差值;对各所述差值取绝对值,并根据获取的多个差值绝对值确定所述第一差值集合。
在本申请的一些实施例中,基于以上技术方案,所述异常检测模块730配置为:判断所述第一差值集合中的各个差值绝对值是否包含于异常区间;当所述差值绝对值包含于所述异常区间中时,判定所述差值绝对值为异常值。
在本申请的一些实施例中,基于以上技术方案,所述异常区间是采用统计的方法对第二差值集合进行计算生成的,所述第二差值集合是根据第三向量和通过所述卷积堆叠自编码器对所述第三向量进行处理生成的第四向量所生成的,其中,所述第三向量是根据包含历史参数的第二时间序列生成的向量。
在本申请的一些实施例中,基于以上技术方案,所述异常区间是采用3-sigma准则对第二差值集合进行计算生成的。
在本申请的一些实施例中,基于以上技术方案,所述异常参数检测装置700还包括:获取模块,用于在将所述第一向量输入至卷积堆叠自编码器之前,获取包含历史参数值的第二时间序列,对所述第二时间序列进行预处理以获取第三向量;预测模块,用于将所述第三向量输入至待训练的卷积堆叠自编码器,通过所述待训练的卷积堆叠自编码器对所述第三向量进行卷积和反卷积处理,以获取预测向量;调参模块,用于根据所述预测向量和所述第三向量对所述待训练的卷积堆叠自编码器进行调参,直至获取所述卷积堆叠自编码器。
在本申请的一些实施例中,基于以上技术方案,所述获取模块配置为:对所述第二时间序列中相邻两时间点对应的历史参数值进行差分处理,以获取与所述第二时间序列对应的第二差分时间序列;根据预设的时间滑动窗口对所述第二差分时间序列进行转换,以获取所述第三向量。
在本申请的一些实施例中,基于以上技术方案,所述获取模块配置为:在对所述第二时间序列中相邻两时间点对应的历史参数值进行差分处理之前,对所述第二时间序列中的参数值进行对齐处理,以将所述第二时间序列中的参数值按时间顺序排列。
在本申请的一些实施例中,基于以上技术方案,所述调参模块包括:损失函数确定单元,用于根据所述预测向量和所述第三向量确定损失函数;优化单元,用于最小化所述损失函数,以获取最优参数,并根据所述最优参数对所述待训练的卷积堆叠自编码器的参数进行调整。
在本申请的一些实施例中,所述损失函数为均方差损失函数;基于以上技术方案,所述优化单元配置为:判断所述均方差损失函数的下降趋势是否趋于稳定;当所述均方差损失函数的下降趋势未趋于稳定时,对所述均方差损失函数进行梯度下降,并将获取的梯度反向传播,以更新所述待训练的卷积堆叠自编码器中的参数;重复以上两步骤,直至所述均方差损失函数的下降趋势趋于稳定。
在本申请的一些实施例中,基于以上技术方案,所述异常参数检测装置700还配置为:当所述检测结果为所述第一差值集合中存在异常值时,触发报警装置进行错误提示。
本申请各实施例中提供的异常参数检测装置的具体细节已经在对应的方法实施例中进行了详细的描述,此处不再赘述。
图8示意性地示出了用于实现本申请实施例的电子设备的计算机系统结构框图,该电子设备可以是如图1中所示的终端设备101和服务器103。
需要说明的是,图8示出的电子设备的计算机系统800仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图8所示,计算机系统800包括中央处理器801(Central Processing Unit,CPU),其可以根据存储在只读存储器802(Read-Only Memory,ROM)中的程序或者从存储部分808加载到随机访问存储器803(Random Access Memory,RAM)中的程序而执行各种适当的动作和处理。在随机访问存储器803中,还存储有系统操作所需的各种程序和数据。中央处理器801、在只读存储器802以及随机访问存储器803通过总线804彼此相连。输入/输出接口805(Input/Output接口,即I/O接口)也连接至总线804。
在一些实施例中,以下部件连接至输入/输出接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid CrystalDisplay,LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如局域网卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至输入/输出接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
特别地,根据本申请的实施例,各个方法流程图中所描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理器801执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台电子设备执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
Claims (16)
1.一种异常参数检测方法,其特征在于,包括:
实时获取包含参数值的第一时间序列,对所述第一时间序列进行预处理以获取第一向量;
将所述第一向量输入至卷积堆叠自编码器,通过所述卷积堆叠自编码器对所述第一向量进行卷积和反卷积处理,以获取第二向量;
根据所述第一向量和所述第二向量确定第一差值集合,对所述第一差值集合中的异常值进行检测,以获取检测结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一时间序列进行预处理以获取第一向量,包括:
对所述第一时间序列中相邻两时间点对应的参数值进行差分处理,以获取与所述第一时间序列对应的第一差分时间序列;
根据预设的时间滑动窗口对所述第一差分时间序列进行转换,以获取所述第一向量。
3.根据权利要求1所述的方法,其特征在于,在对所述第一时间序列中相邻两时间点对应的参数值进行差分处理之前,所述方法还包括:
对所述第一时间序列中的参数值进行对齐处理,以将所述第一时间序列中的参数值按时间顺序排列。
4.根据权利要求1所述的方法,其特征在于,所述卷积堆叠自编码器包括输入层、卷积单元、反卷积单元和输出层,所述卷积单元包括一个或多个卷积层,所述反卷积单元包括一个或多个反卷积层;
所述将所述第一向量输入至卷积堆叠自编码器,通过所述卷积堆叠自编码器对所述第一向量进行卷积和反卷积处理,以获取第二向量,包括:
通过所述输入层将所述第一向量传送至所述卷积单元,通过所述卷积单元中的卷积层对所述第一向量进行一维卷积操作,以获取与所述第一向量对应的高阶向量;
将所述高阶向量传送至所述反卷积单元,通过所述反卷积单元中的反卷积层对所述高阶向量进行反卷积操作,以获取与所述第一向量具有相同维度的第二向量,并通过所述输出层输出所述第二向量。
5.根据权利要求1所述的方法,其特征在于,所述根据所述第一向量和所述第二向量确定第一差值集合,包括:
将所述第一向量和所述第二向量中同一维度的数值相减,以获取多个差值;
对各所述差值取绝对值,并根据获取的多个差值绝对值确定所述第一差值集合。
6.根据权利要求1或5所述的方法,其特征在于,所述对所述第一差值集合中的异常值进行检测,包括:
判断所述第一差值集合中的各个差值绝对值是否包含于异常区间;
当所述差值绝对值包含于所述异常区间时,判定所述差值绝对值为异常值。
7.根据权利要求6所述的方法,其特征在于,所述异常区间是采用统计的方式对第二差值集合进行计算生成的,所述第二差值集合是根据第三向量和通过所述卷积堆叠自编码器对所述第三向量进行处理生成的第四向量所生成的,其中,所述第三向量是根据包含历史参数的第二时间序列生成的向量。
8.根据权利要求7所述的方法,其特征在于,所述异常区间是采用3-sigma准则对所述第二差值集合进行计算生成的。
9.根据权利要求1所述的方法,其特征在于,在将所述第一向量输入至卷积堆叠自编码器之前,所述方法还包括:
获取包含历史参数值的第二时间序列,对所述第二时间序列进行预处理以获取第三向量;
将所述第三向量输入至待训练的卷积堆叠自编码器,通过所述待训练的卷积堆叠自编码器对所述第三向量进行卷积和反卷积处理,以获取预测向量;
根据所述预测向量和所述第三向量对所述待训练的卷积堆叠自编码器进行调参,直至获取所述卷积堆叠自编码器。
10.根据权利要求9所述的方法,其特征在于,所述对所述第二时间序列进行预处理以获取第三向量,包括:
对所述第二时间序列中相邻两时间点对应的历史参数值进行差分处理,以获取与所述第二时间序列对应的第二差分时间序列;
根据预设的时间滑动窗口对所述第二差分时间序列进行转换,以获取所述第三向量。
11.根据权利要求10所述的方法,其特征在于,在对所述第二时间序列中相邻两时间点对应的历史参数值进行差分处理之前,所述方法还包括:
对所述第二时间序列中的参数值进行对齐处理,以将所述第二时间序列中的参数值按时间顺序排列。
12.根据权利要求9所述的方法,其特征在于,所述根据所述预测向量和所述第三向量对所述待训练的卷积堆叠自编码器进行调参,包括:
根据所述预测向量和所述第三向量确定损失函数;
最小化所述损失函数,以获取最优参数,并根据所述最优参数对所述待训练的卷积堆叠自编码器的参数进行调整。
13.根据权利要求12所述的方法,其特征在于,所述损失函数为均方差损失函数;
所述最小化所述损失函数,以获取最优参数,包括:
判断所述均方差损失函数的下降趋势是否趋于稳定;
当所述均方差损失函数的下降趋势未趋于稳定时,对所述均方差损失函数进行梯度下降,并将获取的梯度反向传播,以更新所述待训练的卷积堆叠自编码器中的参数;
重复以上两步骤,直至所述均方差损失函数的下降趋势趋于稳定。
14.一种异常参数检测装置,其特征在于,包括:
预处理模块,用于实时获取包含参数值的第一时间序列,对所述第一时间序列进行预处理以获取第一向量;
模型处理模块,用于将所述第一向量输入至卷积堆叠自编码器,通过所述卷积堆叠自编码器对所述第一向量进行卷积和反卷积处理,以获取第二向量;
异常检测模块,用于根据所述第一向量和所述第二向量确定第一差值集合,对所述第一差值集合中的异常值进行检测,以获取检测结果。
15.一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现权利要求1至13中任意一项所述的异常参数检测方法。
16.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至13中任意一项所述的异常参数检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210491071.0A CN115130546A (zh) | 2022-05-07 | 2022-05-07 | 异常参数检测方法、装置、计算机可读介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210491071.0A CN115130546A (zh) | 2022-05-07 | 2022-05-07 | 异常参数检测方法、装置、计算机可读介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115130546A true CN115130546A (zh) | 2022-09-30 |
Family
ID=83377050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210491071.0A Pending CN115130546A (zh) | 2022-05-07 | 2022-05-07 | 异常参数检测方法、装置、计算机可读介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115130546A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117476136A (zh) * | 2023-12-28 | 2024-01-30 | 山东松盛新材料有限公司 | 一种高纯羧酸酯合成工艺参数优化方法及系统 |
-
2022
- 2022-05-07 CN CN202210491071.0A patent/CN115130546A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117476136A (zh) * | 2023-12-28 | 2024-01-30 | 山东松盛新材料有限公司 | 一种高纯羧酸酯合成工艺参数优化方法及系统 |
CN117476136B (zh) * | 2023-12-28 | 2024-03-15 | 山东松盛新材料有限公司 | 一种高纯羧酸酯合成工艺参数优化方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11334407B2 (en) | Abnormality detection system, abnormality detection method, abnormality detection program, and method for generating learned model | |
CN116757534B (zh) | 一种基于神经训练网络的智能冰箱可靠性分析方法 | |
CN109033513B (zh) | 电力变压器故障诊断方法与电力变压器故障诊断装置 | |
CN111967688A (zh) | 一种基于卡尔曼滤波器与卷积神经网络的电力负荷预测方法 | |
CN110334865B (zh) | 一种基于卷积神经网络的电力设备故障率预测方法及系统 | |
CN116380445B (zh) | 基于振动波形的设备状态诊断方法及相关装置 | |
CN115308562A (zh) | 芯片测试方法及相关设备 | |
WO2022171788A1 (de) | Vorhersagemodell zum vorhersagen von produktqualitätsparameterwerten | |
Wang et al. | Time-variant digital twin modeling through the Kalman-generalized sparse identification of nonlinear dynamics | |
CN115130546A (zh) | 异常参数检测方法、装置、计算机可读介质及电子设备 | |
Kim et al. | Inspection schedule for prognostics with uncertainty management | |
CN113891342B (zh) | 基站巡检方法、装置、电子设备及存储介质 | |
CN113204857A (zh) | 基于极端梯度提升树算法的电子器件剩余寿命预测方法 | |
CN116029221B (zh) | 一种电力设备故障诊断方法、装置、设备及介质 | |
CN115795350B (zh) | 一种血流变测试杯生产过程中异常数据信息处理方法 | |
CN112241512A (zh) | 提升审计精度的方法及系统 | |
CN116738192A (zh) | 一种基于数字孪生的安全数据评估方法及系统 | |
CN116776284A (zh) | 用于机电设备的故障诊断方法、计算机设备及存储介质 | |
CN114897047B (zh) | 基于深度字典的多传感器数据漂移检测方法 | |
CN114648060A (zh) | 基于机器学习的故障信号规范化处理及分类方法 | |
CN112766537B (zh) | 一种短期电负荷预测方法 | |
CN114298413A (zh) | 一种水电机组振摆趋势预测方法 | |
CN110676855A (zh) | 一种配电网无功电压控制参数智能优化调整方法 | |
Ikonen et al. | Calibration of physical models with process data using FIR filtering | |
CN117131465B (zh) | 单管塔损伤识别方法、装置、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |