CN1422407A - 信号处理技术 - Google Patents

信号处理技术 Download PDF

Info

Publication number
CN1422407A
CN1422407A CN01807837.0A CN01807837A CN1422407A CN 1422407 A CN1422407 A CN 1422407A CN 01807837 A CN01807837 A CN 01807837A CN 1422407 A CN1422407 A CN 1422407A
Authority
CN
China
Prior art keywords
vector
data
base
relevant
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN01807837.0A
Other languages
English (en)
Inventor
C·J·St·C·韦伯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qinetiq Ltd
Original Assignee
Qinetiq Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qinetiq Ltd filed Critical Qinetiq Ltd
Publication of CN1422407A publication Critical patent/CN1422407A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2134Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Complex Calculations (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

一种用于生成分离信号分量的信号处理技术,包括如下步骤:将基向量与输入数据进行相关,以产生输出向量;将非线性函数应用到输出向量,以产生非线性化向量;以及将非线性化向量与基向量进行卷积,以产生分离信号分量。每个向量可以包括一个一维信道向量集合。对分离信号分量进行组合,形成重构输入信号和表示重构信号与对应输入信号间偏差的异常信号。通过涉及使用称作基本比例尺的加权因子的训练来确定基向量。基本比例尺当在产生重构向量中用来对分离信号分量进行加权时,具有减小重构向量与用来求得它们的对应输入数据间均方误差的效果。

Description

信号处理技术
本发明涉及一种信号处理技术,还涉及一种用于实现该技术的计算机程序和计算机系统。
信号处理的一般要求是对来自动态系统例如机器的信号进行监测,并且执行各种工艺流程,例如异常检测、条件监测、故障检测、信噪比增强、背景抑制以及盲信号分离。最后一个过程也称作独立分量分析,并且术语“盲”表示信号分离是在没有信号特性的知识或者不作有关信号特性的假设的情况下执行的。它产生与当前监测信号特性特征对应的所谓“分离信号分量”。
很多现有技术过程要么要求预先知道要监测的系统的特征,要么要求对训练数据进行标注、分离或者先前分析。这样的一个例子是由Rumelhart D E,Hinton G E和Williams R J.公开的用于多层感知器的被监视的“反向传播”训练,具体内容参见Rumelhart和McClelland,并行分布处理1(Parallel Distributed Processing 1),MIT,1986中的“通过误差传播学习内部表示(Learning Internal Representations By ErrorPropagation)”。
本领域内一种众所周知的现有技术称作“主要分量分析”或PCA:该技术可以定义为确定输入数据向量的协方差矩阵特征向量的过程,其中,协方差矩阵是以统计学教科书的传统方式,通过每个数据向量的自平均外积减去平均数据向量的自外积而获得的。特征向量是系统特征参数的一种特例,在线性代数标准教材中定义为“基向量”。然而,PCA是一种线性技术,因此不能用来提取二阶矩以上的特征,即更高阶特征或更高阶统计。信号处理中很多感兴趣的动态系统具有不能通过PCA有效提取的高阶统计量。类似的情况也适用于线性神经网络例如线性感知器。
Rumelhart等(同上)和Minsky M L以及Papert S A.的感知器(Perceptrons),MIT,1969公开了多个已知可以用来提取高阶特征的非线性感知器。而且,这是一个实现当前被处理信号非线性变换的神经网络例子。然而,这种技术通常要求先验知识,监视,或者对训练数据的人工标注或分类,甚至并不一定提取实际上有用或有信息的特征。在最后一点上,在远离实际有效解的错误最小值处可能发生收敛。
美国专利No.5,377,306和5,453,940是公开一种启发式处理器的相关专利,对该处理器进行训练,以根据经验将训练数据与对应结果进行拟合,然后通过该拟合形式使用测试数据预测迄今未知的结果。这两个专利都描述求取多个径向基函数,它们是输入数据距离原点或中心集合中每个原点或中心的径向距离的函数:在训练模式下,向量通过这些向量矩阵的三角化与对应结果进行拟合;三角化是通过用于求解线性方程的超定(overdetermined)集且产生最小二乘拟合结果的QR分解过程来进行的。这将确定一个权向量,当应用于径向基函数时,该权向量将提供对应结果的估计值,该估计值反过来又可以与实际结果(如果可以得到)进行比较。因为该方法是非线性的,所以适用于提取高阶统计量;该方法根据训练数据提供信号重构,并且可以用于异常检测。然而,该方法具有如下缺点:对输入信号的时间同步程度很敏感,并且只有在特定环境下,才能提取有用的数据特征。
本发明提供一种用于生成分离信号分量的信号处理技术,包括如下步骤:
a)将基向量与输入数据进行相关,以产生输出向量;
b)将非线性函数应用到输出向量,以产生非线性化向量;以及
c)将非线性化向量与基向量进行卷积,以产生分离信号分量。
本发明具有很多优点。它以在信号处理中称作“非监督”的方式进行工作:即,不需要具有当前监测系统信号特性的先验知识。基向量可以从先验知识或估计获得,或者如下所述,可以通过本身是非监督的训练过程来获得。在后一种情况下,本发明将对无标注、无分类以及先前未见过的训练数据进行自适应,并且生成在基向量中体现的训练数据重要特征模型。对数据进行费力的人工标注是不需要的。
因此,与主要分量分析(PCA)的现有技术相同,本发明可以用来监测新型环境和设计。与PCA不同,该算法是非线性技术,并且因此与PCA相比,它能够对更高阶数据特征进行建模。
本发明不是根据径向或无向积量度,而是使用相关和卷积,获得输入信号与基向量之间的关系。当在传统串行计算机上实现时,本发明具有双重优点:当正确实现时,只需要相对少的计算步骤以及使用相对小的计算机存储器。
求取径向距离或无向积的现有技术对输入信号的时间同步很敏感。相反,本发明使用既提供时不变性又具有不要求输入信号同步优点的相关和卷积。
本发明适用于并行实现,例如多路处理并行计算机或数字信号处理(DSP)设备阵列;还可以用于是光学或全息计算设备,特别(虽然不是排它性的)是基于自适应光折射性大量全息晶体的任何这种设备,因为自适应光折射特性可以用来实现训练算法。
在本发明的技术中,一维时间信号对之间的卷积和相关操作可以按照众所周知的卷积定理通过如下步骤来实现,将信号傅立叶变换到频域以提供两个频率分量集合,在相关的情况下对其中一个集合进行复数共轭,在每个频率上将信号的频率分量或者分量与共轭进行相乘,以提供乘积,然后对该乘积进行反傅立叶变换。数据和基向量可以是多维的,并且卷积和相关操作可以通过如下步骤进行实现:
a)将数据向量和基向量处理为多个称作信道向量的一维时间信号;
b)通过上述傅立叶技术,将每个数据向量信道向量与对应的基向量信道向量进行相关或卷积,并且获得多个一维相关或卷积函数;以及
c)对相关或卷积函数进行向量叠加,以生成和向量。
分离信号分量可以进行组合,以形成至少一个结果信号,该信号包括输入信号的重构信号和异常信号(表示重构信号与对应输入信号的偏差)中的至少一个。
基向量可以通过包括如下步骤的训练过程进行确定:
a)为基向量设置不等的初始当前值;
b)使用当前值执行该信号处理技术;
c)为每个基向量求得至少一个相应的相关项信号,与从输入数据和所述至少一个结果信号中选择的对应信号进行相关;
d)对于每个基向量,将相应的相关项与对应信号进行相关,以产生至少一个相应的相关函数;
e)修改每个基向量,以形成相应的新当前值,该新当前值加入与相应的相关项相对应的至少一个相关函数一致的影响量;
f)重复步骤(b)到(e),直到当前值收敛。
对新当前值的影响量可以与该至少一个相关函数成比例,这个关系中的比例常数称作学习率参数。
该至少一个相关项信号可以是如下向量中的至少一个:
a)输入数据向量的相关向量,求得方式为对输出向量的每个元素应用所述非线性函数的梯度,并且将所形成的向量与根据基向量和异常向量的相关而获得的对应向量进行相乘;以及
b)异常向量的相关向量,从非线性化输出向量求得。
该至少一个相关项信号可以是或包括数据向量的相关向量,对应基向量可以是多维的,对应于多个信道,并且当与异常向量进行相关时产生多个相关函数,在与输出向量进行相乘之前,相关函数可以通过组合来自不同信道的具有相同时标的影响量简化为一维向量。
该至少一个相关向量可以是或包括输入数据向量的相关向量,在与所述相关函数进行相乘之前,可以通过与非线性化输出向量相对应的非线性化函数梯度对输出向量进行操作。在如上操作之后并且在与所述相关函数进行相乘之前,输出向量可以用从统称为基本比例尺的数量中选择的相应的加权因子进行相乘,这些基本比例尺当应用于各个重构向量时,具有减小重构向量与用来求得它们的对应输入数据之间均方误差的效果。
该至少一个相关向量可以是或包括异常向量的相关向量,它通过将非线性化输出向量的元素与其相应的基本比例尺进行相乘而求得。
该至少一个相关向量可以是多个相关向量,该技术在修改每个基向量以形成相应的新当前值之前包括计算与这些向量的相关函数的步骤,以及组合作为结果的多个相关函数的步骤。
基向量可以通过包括输入数据训练集合的批处理模式迭代过程来确定,以用于重构过程,并且其中,在每次迭代中,相应的训练集合子集经过重构过程,迭代包括子迭代,在每个子迭代中,子集的不同成员经过重构过程,在每次迭代之后对基向量进行修改,以形成加入从子集中的输入数据获得的多个影响量的相应的新当前值,每个影响量根据与相应的相关项相对应的对应至少一个相关函数。
可选地,基向量可以在连续自适应迭代过程中获得,其中,在每次迭代中,输入数据集合的不同成员经过重构过程,并且在每次迭代之后对基向量进行修改,以形成加入从那个成员获得的单影响量的相应的新当前值,那个影响量根据与相应的相关项相对应的对应至少一个相关函数。
可选地,对基向量的更新可以在包括如下步骤的单次(Single-Pass)训练过程中获得:
a)提供当前基向量的初始值;
b)从当前基向量、输出向量、非线性化输出向量和分离信号分量中求得数据向量的q-相关和Q-相关向量;
c)将数据向量的q-相关向量与对应数据向量进行相关;
d)将数据向量的Q-相关向量与对应数据向量进行相关;
e)将输出向量与分离信号分量进行相关,这些向量和分量是从对应数据向量求得的;
f)对下一数据向量,重复步骤(c)、(d)和(e);
g)叠加涉及数据向量的q-相关向量的相关;
h)叠加涉及数据向量的Q-相关向量与输出向量的相关;以及
i)从基本比例尺的二次函数求得对基向量的影响量,其中,该二次函数包括涉及与数据向量的q-相关向量相对应的叠加相关的线性项,以及进行相减的涉及其它叠加相关的二次项。
每个子集中的输入数据项数目至少等于基向量的数目,并且每个子集随机地从训练集合中进行选取,避免重复使用小子集或者高相关子集。
可以通过将分离信号分量与各个基本比例尺进行相乘,并且通过向量叠加对结果乘积进行相加,组合分离信号分量,以形成至少一个结果信号。
基本比例尺可以通过在输入数据集合上进行如下计算而算出:
a)向量平均值,由输入数据向量与对应分离信号分量间的无向积组成;
b)矩阵平均值,由与单个输入数据项相对应的分离信号分量之间的无向积组成;
c)平均无向积矩阵的逆;以及
d)逆矩阵与平均无向积向量的乘积,该乘积为一个其元素为基本比例尺的向量。
可选地,基本比例尺可以通过如下步骤进行计算:
a)为基本比例尺设置不等的初始当前值;
b)计算异常向量和与相同输入数据项相对应的每个分离信号分量的相应的无向积;
c)修改每个基本比例尺,以形成相应的新当前值,该新当前值加入和与之对应的无向积一致的影响量;
d)对下一数据项,重复步骤(b)和(c)。
应用于输出向量的非线性函数可以是对于小自变量很小而当自变量值在阀值附近时开始快速增长的阀值函数;该函数最好是不剧变的,而是相对平滑和连续的,并且对于小于阀值的自变量值最好不完全变为0。该函数对于小于阀值的自变量值,可以指数渐近于0,并且可以是sigmoid函数。
另一方面,本发明提供一种用于控制计算机系统操作和用于通过包括如下步骤的过程生成分离信号分量的计算机程序:
a)将基向量与输入数据进行相关,以产生输出向量;
b)将非线性函数应用到输出向量,以产生非线性化向量;以及
c)将非线性化向量与基向量进行卷积,以产生分离信号分量。
本发明的计算机程序还可以用于实现前述本发明信号处理技术的其它特性。
另一方面,本发明提供一种使用上述计算机程序进行编程的计算机系统。
另一方面,本发明提供一种编程用来通过包括如下步骤的处理技术生成分离信号分量的计算机系统:
a)将基向量与输入数据进行相关,以产生输出向量;
b)将非线性函数应用到输出向量,以产生非线性化向量;以及
c)将非线性化向量与基向量进行卷积,以产生分离信号分量。
本发明的计算机系统还可以进行编程用来实现前述本发明信号处理技术的其它特性。
为了更全面地理解本发明,现在将参照附图仅作为示例对本发明的实施例进行描述,其中:
图1示出信道与一维和四维数据向量间的关系;
图2是本发明重构过程的流程图;
图3是在图2所示的本发明重构过程中使用的基向量更新过程的流程图;
图4是在更新基向量的图3过程中使用的基向量的批处理模式训练过程的流程图;
图5是在更新基向量的图3过程中使用的基向量的连续模式训练过程的流程图;
图6是在更新基向量的图3过程中使用的相关向量计算过程的流程图;
图7是在图2所示的本发明重构过程中使用的基本比例尺矩阵求逆计算过程的流程图;
图8是在图2所示的本发明重构过程中使用的基本比例尺梯度下降计算过程的流程图;以及
图9是训练基向量而无需求得重构、异常或相关向量的过程的流程图。
参照图1,从传感器(未示出)输出的数据元素用如10的方块表示,并且以固定的采样率产生,即连续的样本或元素间的时间间隔相等。在该图中,时间向右边增长,因此最左边的数据元素是最早获得的。单个传感器在任何采样时间间隔都产生单个数据元素10,并且与单个信道12相对应。监测系统(未示出)参数的多个传感器在这样的间隔产生多个数据元素10;它们以并行方式与多个信道相对应,其中四个如14所示。每个信道包含由数据元素序列表示的单个时变信号,该信号可以是从传感器实时获得的,或者是这种信号的记录。如果处理是以数字方式实现的,则对该信号进行数字化,但是假如该信号是适于时域内卷积和相关过程的形式,它也可以是模拟的。用于数字和模拟卷积/相关的设备众所周知:例如,对于前者是相关器/卷积器集成电路或数字计算机,并且对于后者是霍尔效应、平面声波或光学设备。卷积和相关通过同一处理设备进行实现,因为它们是非常类似的-数字相关器/卷积器在例如美国专利No.4,885,715中有描述。
每个一维数据元素序列或行(12为一行而14为四行)将称作信道向量,12是包括单个信道向量的数据向量。它们具有有限长度(即,数据元素的数目),因为它们是在预定时间周期T(以生成连续数据元素间的采样时间间隔为单位进行量度)内使用固定采样率来获得的。如图所示,T=23。数据元素可能例如是从电机获得的,其中,同时从位于该电机定子上各点的磁场传感器对信号进行监测。Nsensors个传感器产生Nsensors个一维信道向量,这些向量可以统称作单个Nsensors维数据向量。一个传感器当然是Nsensors个传感器的一种特殊情况(即,Nsensors=1)。需要强调的是,向量维数这一术语不是指对数据进行采样的时间维数;包括T个时间采样的一维向量用T数目(一行数据元素)来表示,并且在包括T个时间采样的Nsensors维向量的情况下,它将用TNsensors数目的有序列表来表示。
每个数据向量12或14与具有相同维数和信道向量数目的相应的基向量相对应:与数据向量14对应的四维(4-D)基向量(即,具有四个信道向量)如16所示。后面将要进行更详细的描述,基向量可以在训练过程中求得,并且表示训练使用数据的主要特征。Nsensors维基向量的过程可以通过对于除如18所示的一个信道之外的每个信道将坐标限制为0来转变为一维等价向量。这也适用于在本发明的操作过程中将产生的其它Nsensors维向量。因此,1维基向量的过程是Nsensors维基向量过程的一种特殊情况。
现在参照图2,在操作监测阶段的本发明过程总体上用20表示;以方框图的形式概要示出:在本说明书中,所采用的约定是菱形(参见后面附图)表示迭代重复,平行四边形表示输入和输出信号,而矩形表示过程。生成在过程20中使用的输入所需的子过程将在后面描述。有两个子过程是需要的,其中一个是提供基向量,该向量表达正在通过传感器进行监测的系统的特征模型。基向量可以从系统知识获得,或者可选地,它们可以与后面将要描述的附加步骤一起使用过程20的全部或部分从训练数据中进行确定。基向量类似于线性系统的特征向量,但是在本例中,不同之处是基向量是通过一种涉及非线性的过程求得的。如果去除非线性,那么它们将简化为特征向量。另一理想但不是必需的输入是一个基本比例尺集合,这些标量是可以采用如下方式求得的加权因子:它们将最小化通过过程20产生的重构向量集合相对于从中求得它们的各个输入数据的均方误差。
每个基向量可以是一维或多维的;如果是一维,它可以与相应的信道相相关。一个或多个一维基向量可以与相应的信道相相关。可选地,它们可以是多维的,并且与具有相同维数的数据向量相对应,并且具有等于那个维数的信道数目。
在过程20的第一步22,输入新的或当前数据向量21,然后确定这个向量与每个基向量24在时间维度中的相应的一维相关函数。多维数据和基向量的相关作为信道对的集合处理,给出在时间维度中的一维相关函数集合,然后对它们进行求和;也就是,数据向量的第i信道向量与对应基向量的第i信道向量进行相关,对于所有Nsensors信道或者i值重复这一过程,为每个数据/基向量维度或信道i给出相应的第i一维相关函数。然后这些Nsensors个一维相关函数一起进行向量叠加:也就是,对具有相同时标的Nsensors个一维相关函数系数进行求和,产生一个一维总和向量。如果基向量和数据向量只是一维的,在这两个一维向量之间计算的相关函数将已经是一维的,而不需要在多个信道上求和(如前所述,一维基向量的情况是Nsensors维基向量的一种特殊情况,其中除一个之外的所有基向量信道都为零值。因此,除一个之外的所有Nsensors个相关函数都将为零值,并且在信道索引上求和将产生如同只选非零信道进行相关一样的结果。)
如果使用串行计算机执行相关,通过使用众所周知的快速傅立叶变换(FFT)算法将每个相对应的一维信道向量对傅立叶变换到频域,对与基向量相对应的经过傅立叶变换的信道向量的频率分量进行复数共轭,然后通过将共轭频率分量同与基向量相对应的经过傅立叶变换的信道向量的频率分量进行分量相乘,产生乘积,然后将乘积反傅立叶变换到时域,可以最有效地执行前述一维相关函数中的每个相关函数。在这个关系中,分别具有元素或分量ai、bi(i=1,2,3...等)的两个向量a和b的分量相乘定义为形成向量c,其中第i元素ci为具有相同下标的元素对ai、bi的乘积aibi,并且对于所有元素或i值进行重复。
采用众所周知的FFT算法,该相关过程的操作数量级为Tloge T,其中,T为每个信道的时间采样数,然而不使用傅立叶变换执行相关所需的操作数量级为T2;当T很大时,它表示非常大的计算机操作节省。如果使用光学处理技术,通过光学折射的物理过程可以自然并且瞬时求得傅立叶变换。
以方程形式进行概括,当使用上述傅立叶变换过程时,数据向量x的第i传感器信道(第i传感器)与第c基向量wc的第i信道之间的一维相关函数用下式给出: cor ( x i sensor , w c , i sensor ) = F - 1 ( F ( x i sensor ) × ( F ( w c , i sensor ) ) dr ) - - - - ( 1 )
其中,F和F-1分别表示傅立叶变换和反傅立叶变换运算,()*表示括号项的共轭复数,而×表示分量相乘。对于Nsensors维基向量和数据向量,如上所述,在22的相关为每个基向量生成相应的Nsensors个一维相关函数集合。每个基向量的多个相关函数进行向量叠加:也就是,第i相关函数的第t时间采样加到与那个基向量相对应的每个其它相关函数的第t时间采样,并且对于所有t=1到T,重复这一过程,以产生由下式给出的T个时间采样的一维向量: Σ i = 1 N sensors ( cor ) i sensor , t ( i = 1 , . . . , T ) - - - - ( 2 )
求和是在信道14上而不是在时间维度上进行的。这将产生一个一维输出向量集合26,其中每个输出向量具有T个元素,并且与相应的基向量相对应。在一维的情况下,各个相关函数与每个基向量一一对应,并且如上所述,它变为输出向量集合26的成员。因此输出向量在两种情况下都是一维的:它们具有时标,而不具有信道索引。
过程20的下一步骤是在28对输出向量进行非线性化。通过非线性函数-sigmoid函数对每个输出向量的每个元素进行操作,产生一个经过非线性化的一维输出向量集合,其中每个输出向量都对应于相应的基向量。对比二阶矩或统计量更精细或有用的任何输入数据向量特征进行建模,非线性化是必要的。变量a的sigmoid函数r(a)的一种特殊情况-称作logistic函数-定义为: r ( a ) ∞ [ 1 + exp ( a - θ s ) ] - 1 - - - - ( 3 )
其中θ表示阀值,并且s的大小确定阀值过渡过程的陡度。该逻辑函数在小于阀值的区间内指数趋向于0,并且当参数a的值很大时,指数趋向于1。也可以使用其它非线性函数,后面将对此进行讨论。为非线性化输出向量,对方程(3)进行求值,依次用r(a)代替每个向量系数a,逐个产生非线性化输出变量的系数。
在所有的方程中,标量用斜体表示;矩阵和变量用粗体表示;第c基向量用wc表示,并且与数据向量x相同,它具有两个索引isample和isensor:其中第二索引isample取值范围为1到Nsamples(表示当前处理采样序列中的时间采样总数);第一索引isensor取值范围为1到Nsensors(表示当前监测传感器的数目)。基向量的数目用Nbasis表示。每个基向量包括Nsensors个一维信道向量,其中每个向量对应于相应的传感器:与索引为isensor的传感器相对应的第c基向量的信道向量用wc,isensor表示。
以方程形式概括22到30所示的过程,为数据向量x计算的第c非线性化输出向量rc(x)如下给出: r c ( x ) = r ( Σ i sensor = 1 N sensors cor ( x i sensor , w c , i sensor ) ) ( c = 1 , . . . , N basis ) - - - - ( 4 )
其中,非线性函数r(a)(a表示方程(4)中的求和项)在方程(3)中给出,并且一维向量Xisensor表示Nsensors维输入数据向量x的笫i信道。
非线性化输出向量集合出现在30,并且它们与来自阶段24的对应基向量一起馈送到卷积阶段32。计算每个非线性化输出向量与其对应基向量间的卷积函数:这将为每个基向量产生相应的分离信号分量。
每个非线性化输出向量及其对应基向量都是实数值且具有时间采样值。当基向量是一维时它们之间的卷积函数通过以与相关类似的方式进行计算,步骤为:
(a)对两个向量进行一维傅立叶变换;
(b)对这些傅立叶变换进行分量相乘;以及
(c)对乘积结果进行反傅立叶变换,产生作为卷积函数和分离信号分量34的实数值一维向量。
在基向量为Nsensors维的更一般情况下,第c非线性化输出向量rc与其对应基向量wc间的卷积函数cnv(rc,wc,isensor)如下给出: cnv ( r c , W c , i sensor ) = F - 1 ( F ( r c ) × F ( W c , i sensor ) ) - - - - ( 5 )
其中,如同前面,F和F-1表示傅立叶变换和反傅立叶变换,而×表示分量相乘。这种更一般的情况显然包括如上所述Nsensors=1的特殊情况。
对于一维基向量,与各个非线性化输出向量的卷积是一维的,并且与各个基向量对应的分离信号分量也是一维的。对于多维基向量,依次使用基向量的每一行或信道,执行卷积;对于每个基向量,这将产生Nsensors个卷积函数的集合,其中每个卷积函数与Nsensors个信道14中的相应的一个相对应。在多维情况下,分离信号分量本身是具有相同维数的多维向量。
每个分离信号分量34是用对应基向量进行建模的当前数据向量的那个分量的重构。在一维情况下,它是用对应一维基向量进行建模的信道向量那个分量的重构。在一般Nsensors维的情况下,它是用对应Nsensors维基向量进行建模的Nsensors维数据向量那个分量的重构。它是盲信号分离(也称作独立分量分析)电子信号处理技术感兴趣的结果,因为输入信号分离为每个由相应的基向量进行建模的分量部分。
分离信号分量34传给重构步骤36,该步骤还接收基本比例尺集合的当前版本,其中对于每个分量,都存在的一个基本比例尺与之对应。基本比例尺就是前面所述的加权值,它们在优化时最小化重构向量集合相对于从中求得它们的数据向量的均方误差,虽然优化在很多情况下不是必需的。在这个步骤中,与基向量一一对应的所有分离信号分量组合在一起,以产生当前数据向量的重构,下面称作重构向量,并且具有与信道12或14相同的维数。
组合分离信号分量的优选方法是加权线性求和:也就是,每个分离信号分量用相应的基本比例尺进行相乘或加权,其中,每个基本比例尺是与相应的基向量相对应的数值。它具有如下优点:可以直接确定基本比例尺,后面将对此进行描述,也就是,不需要自适应方法。以这种方式从每个信号分量产生加权分量,并且通过向量叠加对它们进行求和,以产生作为重构向量40的组合向量。使用基本比例尺进行加权不是必需的,但是如果正确实现它,将大大改善敏感性和性能。
以方程形式概括32到42所示的过程,与第i传感器和输入数据向量x相相关的重构向量的第i信道向量(X(x))isensor如下给出: ( X ( x ) ) i sensor = Σ c = 1 N basis a c cnv ( W c , i sensor , r c ( x ) ) - - - - ( 6 )
其中,ac是与第c基向量对应的基本比例尺,并且其它表达式如同方程(4)所定义。
重构向量40是其中训练数据包含当前监测信号的很多应用如信噪比增强和背景抑制的特定感兴趣的结果。这是因为过程20产生一种在基向量和基本比例尺中实施的训练模型,并且对于每个新输入信号,它使用该模型重构根据通过输入训练数据建入模型的重要特征构建的那个信号估计量:该估计量是重构向量40,它是能够使用模型特性进行编码的输入信号分量,并且其中重要信号特征相对于背景干扰得到增强。因此,重构强调建模信号,而背景干扰的重构程度则小得多。因为在28引入的非线性,所以过程20是非线性技术:因此与线性技术如主要分量分析相比,它可以对精细、重要且有用得多的训练数据特征进行建模。
重构向量40对于如图象信号处理的应用特别重要,其中,重构向量40与背景抑制以及所需图象特征增强相关:在这些应用中,根据用来训练过程20的数据统计量,对图象特征而不是更随机的背景进行建模和重构是可能的。如果数据包含所需图象特征的足够范例,这一结果将是可以实现的:如果否,该算法将改变为对干扰进行建模,并且图象特征将被看作异常分量。
过程20的下一步骤是异常增强步骤42。在此,每个重构向量与从中求得它的输入数据向量进行比较。该比较产生Nsensors维的异常向量44,即维数与信道数目相等。
虽然,可以使用很多比较技术,但是用来产生异常向量A(x)的优选比较方法是向量相减,即:
A(x)=x-X(x)                    (7)
为了在训练数据向量的样本{x}上计算均方重构误差<E>{X},只需要采用从样本中求得的异常向量,形成每个异常向量与其自身的相应的无向积,并且在这些无向积上产生均值<E>{X},即:
<E>{x}=<|x-X(x)|2>{x}=<A(x)·A(x)>{x}         (8)
其中,‘.’符号表示无向积操作。在此描述的实施例将最小化该均方重构误差作为训练结果,因为训练执行该数量的梯度下降。
异常向量可以看作没有由在过程20中实施的训练模型进行编码的当前输入数据向量的那个分量。它是当前信号向量或信号与那个信号的重构之间的差别,其中,该信号重构使用根据早期训练使用数据构建的以基向量和基本比例尺进行表达的模型。在条件监测和异常监测应用中,该差别是感兴趣的结果,因为它包含异常分量。
在比较输入信号与对应模型重构中,步骤42使得突出、强调和检测新数据中的异常成为可能,这些异常不具备在早期训练过程20中使用的数据的特征。
除过程20的步骤之外,还需要执行其它计算来使用输入数据向量的样本集合,适应或训练基向量。对于过程20用来在训练的过程中进行监测是可能的,即,在监测阶段开始之前,不需要完成训练阶段,因为可以将基向量作为监测过程的一部分自适应更新。
基向量通过迭代训练或学习过程进行产生或适应。它们可以通过批处理模式训练进行产生,这最适合于使用数字计算机的本发明实现。计算机寄存器用来累积对基向量的更新。在不使用计算机的光学或其它实现中,可能存在与清零步骤相差不大的平均过程:在这些实现中,类似于清零的过程可以通过物理存储器衰变来替代实现;甚至在计算机实现中,代替显式的清零,可以通过应用“健忘因子”来使用衰变,该因子用来在每个操作循环以预设比例减小存储器或寄存器内容。
现在参照图3,所示的方框图是总体上用50表示的训练过程,用于产生对基向量的更新。如同图2,平行四边形表示输入和输出信号,矩形表示过程,并且前面描述过的部分使用相同的标号。
监测阶段所涉及步骤(即,重构过程20)是产生基向量所涉及步骤的子集。重构过程20自身需要基向量24来工作,并且这些向量可以通过后面将要描述的本发明过程来获得:开始这些过程尚未执行。然而通过分析可以看出,在重构20中对于基向量使用什么初始值来进行训练是没有关系的,因为训练过程50是以如下方式产生基向量的:使基向量收敛于可接受值,而不管它们的初始值。它们可以设为例如最初随机选取的值,或者可选地,设为先前已确定为至少与当前监测系统适当值近似的值。
对属于训练数据向量所选集合的向量21逐个执行过程20。对于这些向量中的每个向量,在过程20获得输出向量、非线性化输出向量以及异常向量26、30和44;后者在步骤52与基向量24和基本比例尺38一起使用,以计算数据和异常向量21和44的各个相关向量54。后面将对该计算进行更详细的描述。之所以称作数据和异常向量的相关向量,是因为它们用于计算相关函数,而不是因为它们是相关操作的结果。各个相关向量与每个数据和异常向量一一对应,并且它是一维的。在本发明的其它实施例中,可能只需要计算上述相关向量之一,或者可能需要计算重构向量或其它向量的相关向量。
在步骤56,每个相关向量54与其相应的对应的数据向量21或异常向量44进行相关,以产生后面将要更详细描述的相关函数。当使用如前所述的FFT对两个信号进行相关时,需要对其中一个信号的傅立叶变换进行复数共轭(另外一个信号则不需要),在本例中,是对相关变量的傅立叶变换进行复数共轭。在步骤58,与每个基向量对应的Nsensors个相关函数通过向量叠加进行组合,然后加到与它们的基向量对应的更新寄存器内容60。这将该内容转变为更新值60′。各个寄存器(未示出)与每个基向量一一对应,并且寄存器和向量具有相同的维数。对于在训练过程50的每次迭代中使用的第一数据向量,寄存器内容开始为0,并且此后对于为训练过程50选择的每个新数据向量,如上所述进行增加。
现在还参照图4,所示的方框图是用70总体表示的过程,用于通过批处理模式训练方法更新基向量。前面描述过的部分使用相同的标号。这是在串行计算机实现中更新基向量的优选方法。在72,更新寄存器开始设为0,并且在74选取训练数据向量的样本,即只使用训练数据向量的子集,从而减少训练时间。然后为该样本中的每个向量对更新过程50进行子迭代,并且因此更新寄存器对内容60进行累加。对此的数学表达式将在后面与该过程所需的其它数量表达式一起给出。通过将与更新寄存器内容成比例的小增量加到基向量78,对基向量78进行更新,这个关系中的比例常数为固定的正数,称作学习率参数。基向量然后通过长度调整进行归一化,然后成为用于下一迭代84的向量82。为执行归一化,根据下式计算基向量wc的长度: | w c | 2 = &Sigma; i sensor = 1 N sensors w c , i sin sor &CenterDot; w c , i sensor - - - - ( 9 )
其中,‘.’符号如同前面表示无向积操作。
方程(9)是平方向量长度之和,并且通过采用它的平方根得到适当的归一化因子:每个基向量信道向量wc,isensor然后通过乘以如下因子对长度进行调整:
归一化因子=
迭代循环最终收敛,也就是,基向量在连续的两个样本之间不再有大的变化。收敛可以通过例如均方重构误差变得小于预设值的标准,或者简单地在预定数目的迭代循环之后,进行判定。训练阶段于是终止,监测阶段或过程20可以开始。
每次迭代可以涉及训练数据向量集合的限定样本,并且然后在对该样本进行处理之后更新基向量。迭代通常对样本进行限定,因为使用全部训练数据集合将太费时。每次迭代都需要改变样本,并且样本每次都需要是随机选择的训练数据向量子集,以促使训练模型在统计上代表尽可能大的数据向量数量。在此,术语“迭代”用来表示通过训练过程对训练样本中所有数据向量的训练,对其中一个向量的训练称作子迭代。
现在还参照图5,所示的方框图是用100总体表示的过程,用于通过连续自适应训练更新基向量,这是对批处理模式训练的一种替换。前面描述过的部分使用相同的标号。过程100适用于本发明的光学实现。在对每个训练数据向量进行处理之后,不是在寄存器中存储更新,而是对基向量本身进行小量更新。这比批处理模式训练更适用于光学实现,因为基向量的连续自适应可能便于使用自适应全息介质如光折射性晶体进行实现。
对于迭代期间的每个训练数据向量,如同前面,使用当前基向量102在更新过程50中计算与每个基向量对应的数据和异常向量的相关向量。还计算每个相关向量和与之相对应的数据或异常向量之间的相关函数。在106,与每个基向量对应的相关函数104然后进行组合,并且以等于该组合乘以学习率参数的增量,增加每个基向量。在108归一化之后,基向量110用于使用另一输入数据向量的下一子迭代112。
现在将对用于计算相关向量的过程进行描述。可以看出,该过程保证基向量最终收敛于使在用于训练的数据向量集合或子样本上平均的异常向量均方长度最小的结构。除统计波动之外,该训练法连续减小这一长度,直到它达到最小。该长度的减小是模型准确性的一种衡量,并且因此该模型在训练之后比以前更准确。用于计算相关向量的其它过程不能保证这一属性,但是可能更便于光学实现进行求取,或者对于串行计算机模拟速度更快。
现在参照图6,其中前面描述过的部分使用相同的标号,所示的方框图是用120总体表示的过程,用于计算异常和数据向量的相关向量。这是本发明的优选但不是根本的特性。对于每个基向量,都存在相应的这两个相关向量与之对应,并且这两个相关向量是一维的。它们称作相关向量,这是因为它们是相关项(在本说明书中用于表示“要进行相关的项”):即,它们用于相关操作,而不是相关操作所生成的结果。重构过程20用来生成异常向量、输出向量以及非线性化输出向量122、124和126,并且这些向量结合基向量和标量128和130进行使用。通过将每个非线性化输出向量与对应基向量的基本比例尺进行分量相乘(如前面所定义),在134计算异常向量的相关向量132:即,将非线性化输出向量rc(x)的每个元素与对应基本比例尺ac进行相乘,以产生异常向量的相关向量avcvc(x)元素,即:
avcvc(x)=acrc(x)           (11)
数据向量的相关向量如下计算:如前所述在136计算异常向量与每个基向量之间的相关函数,以生成与每个基向量对应的一维向量gc(x);在Nsensors维基向量的情况下,在138产生Nsensors个相关函数,并且在140通过向量叠加进行求和,以将它们简化为一个。在计算两个信号间的相关函数中,如前所述,其中一个信号的傅立叶变换需要(另外一个信号的则不需要)进行复数共轭,在本例中,是基向量的傅立叶变换进行复数共轭。
在重构过程20中使用的非线性函数r(a)的导数或梯度dr/da,在142对每个输出向量124的每个元素进行运算;也就是,在dr/da中用向量元素替换a,然后求值,以产生新的元素。这将生成与每个基向量一一对应的各个一维梯度向量rc(x),并且在144它与对应基向量的基本比例尺进行相乘,以产生另一一维向量146。应用函数dr/da不是必需的,但是保证训练过程将单调地减小异常向量的均方长度。在148,通过相关和应用函数dr/da分别生成的两个一维向量140和146一起进行分量相乘(如前面所定义),乘积结果是数据向量的相关向量150。
以数学形式,(第c)数据向量的相关向量dvcvc(x)如下给出:
dvcvc(x)=r′c(x)×gc(x)       (c=1,...,Nbasis)      (12)
其中,×如同前面表示分量相乘,并且其中 g c ( x ) &equiv; &Sigma; i sensor = 1 N sensors cor ( ( x - X ( x ) ) i sensor , a c w c , i sensor ) ( c = 1 , . . . , N basis ) - - - - ( 13 )
并且,r′c(x)是梯度向量,即r′(a)≡dr/da,如下给出: r &prime; ( &Sigma; i sensor = 1 N sensors cor ( x i sensor , w c , i sensor ) ) ( c = 1 , . . . , N basis ) - - - - ( 14 )
这些表达式用来增加如图4的60所示的基向量更新寄存器的当前内容bvurc,isensor,从而,在迭代结束时,它们的内容由如下公式确定: bvur c , i sensor = &lang; cor ( ( x x - X ( x ) ) i sensor , avcv c ) &rang; { x } + &lang; cor ( x i sensor , dvcv c ) &rang; { x } - - - - ( 15 )
其中,((X(x))isensor是与第i传感器isensor对应的重构向量第i信道,它由方程(6)给出,并且为方便起见,重复如下: ( X ( x ) ) i sensor = &Sigma; c &prime; = 1 N basis a c &prime; cnv ( w c &prime; , i sensor , r c &prime; ( x ) ) - - - - ( 6 )
现在对确定基本比例尺的方法进行描述。用于优化基本比例尺的优选标准是将它们设为使重构均方误差(这是在训练向量的某样本上进行平均的重构和数据向量之间的均方向量差)最小的值组合。那个样本可以是训练数据向量的全集或者从该全集中抽取的某随机子集。
矩阵求逆法是计算使重构向量集合相对于从中求得它们的输入数据向量的均方误差最小的基本比例尺的值的组合的最快的方法。与此不同,并且虽然更慢,迭代梯度下降法避免对矩阵进行存储并且求逆的需要,如果基向量数目很大,矩阵将很大。矩阵求逆是在串行计算机实现中优化基本比例尺的优选方法。梯度下降是在光学计算机实现中的优选方法。矩阵求逆不是迭代过程,而是单个步骤(虽然它包括用来在一个数据向量集合上累加样本均值的‘子迭代’)。因此,它具有稳定性和速度的优点:如果增量更新足够大,所计算的最优值不会在真最优值的附近振荡,梯度下降过程则可能发生这种情况。
如果存储器资源不受限制,对于串行计算机实现,最好采用矩阵求逆法。如果存储器资源受到限制,对于串行计算机实现,最好采用梯度下降法,但是它的增量自适应特性可能更适合于光学计算设备如自适应光折射性晶体的物理学。
如果分离信号分量采用不同于(加权)线性求和的方式进行组合,则必须采用梯度下降法。如果重构以非线性方式组合分离信号分量,矩阵求逆法将无效。如果以非线性方式组合分离信号分量,则必须修改梯度下降法的步骤,以将非线性考虑在内。熟悉梯度下降优化法的技术人员将能够推导必要的修改,但是在此不对这些修改进行显式的阐述,因为它们不从根本上改变本发明的性质。
现在参照图7,所示的方框图是用160总体表示的过程,用于通过矩阵求逆法计算基本比例尺。这是使用传统串行计算机实现本发明的优选方法。前面描述过的部分使用相同的标号。在162和164,定义具有Nbasis个元素的向量和具有N2 basis个矩阵元素的Nbasis×Nbasis矩阵,每个矩阵的所有元素初始设为0:在此,Nbasis是基向量的数目。Nbasis元素向量具有元素,其中每个元素累加数据向量与分离信号分量(SSC)之间无向积的样本均值,并且Nbasis×Nbasis矩阵具有N2 basis个元素,其中每个元素累加各个SSC对之间无向积的样本均值168。Nbasis元素向量和Nbasis×Nbasis矩阵在它们相应的更新寄存器中进行累加。在170,从可用训练数据向量中选择一个样本,该样本与在训练的一次迭代中使用的相同。在172的迭代提供训练数据向量174,以输入到从中生成Nbasis个SSC的重构过程20。
训练数据向量174与每个SSC之间的无向积在178计算,以形成在180加到适当数据-SSC无向积更新寄存器内容166的Nbasis个无向积。类似地,SSC对之间的无向积在182进行计算,并且在184加到SSC-SSC无向积更新寄存器内容168。在186开始下一子迭代,从而通过步骤20和178-184对训练样本中的下一向量进行处理。该过程继续下一子迭代,直到处理完训练样本中的所有数据向量为止,并且内容166和168在相应的更新寄存器中进行累加;寄存器内容166和168然后在188除以训练样本中的向量数目,并且N2 basis个平均SSC-SSC无向积组成在190进行求逆的Nbasis×Nbasis矩阵。对于训练样本,这提供数据-SSC无向积平均向量192和逆矩阵194,它们在196一起进行相乘,以产生具有由下式给出的作为Nbasis个基本比例尺最优值的元素ac的向量198: a c = &Sigma; c &prime; ( M - 1 ) cc &prime; &lang; &Sigma; i sensor = 1 N sensors x i sensor . cnv ( w c , i xensor , r c &prime; ( x ) ) &rang; { x } - - - - ( 16 )
其中,(M-1)cc′表示如上所述Nbasis×Nbasis矩阵的逆,‘.’符号如同前面表示无向积操作,并且其它参数如同前面所定义。矩阵Mcc′本身由下式给出: M cc &prime; = &lang; &Sigma; i sensor = 1 N sensors cnv ( w c , i sensor , r c ( x ) ) cnv ( w c , i xensor , r c &prime; ( x ) ) &rang; { x } - - - - ( 17 )
在单个信道的情况下,分离信号分量向量对之间的无向积只有在这些向量与同一信道相相关时才不为零。在这种情况下,也只用对应的信道向量计算一维分离信号分量向量与一维数据向量之间的无向积。
现在参照图8,所示的方框图是用200总体表示的过程,用于通过梯度下降法计算基本比例尺。前面描述过的部分使用相同的标号。这是使用光学计算机实现本发明的优选方法。它是与用于基向量的过程100类似的连续自适应训练周期;批处理模式过程70的同等过程也是可能的,但是将不作描述,因为它可以通过采用过程70和200的原理直接推出。在过程200中,如同前面的过程,选择训练数据向量集合的样本,202在并且选取基本比例尺的初始值作为第一“旧基本比例尺”,以与第一数据向量203一起使用。旧基本比例尺202和第一数据向量203输入到重构过程20,以产生多个SSC 34和异常向量44;在204分别计算每个SSC34和异常向量44之间的无向积,并且这将分别提供与每个基本比例尺对应的无向积:那个无向积与如上所述的学习率参数进行相乘,以提供在206用来增加相应基本比例尺的结果。因此每个数据向量提供与相应的基本比例尺对应的SSC-异常向量无向积集合,并且使得所有基本比例尺进行增加,以生成用于下一迭代的更新基本比例尺208。
该过程然后在210对下一训练数据向量203进行子迭代,更新基本比例尺208变为“旧”基本比例尺202。作为迭代结果,基本比例尺趋近于它们的最优值结构。梯度下降过程200可以可选地与对基向量进行自适应的过程100同时运行。该用于优化基本比例尺的过程200也可以成为对应基向量同等过程100的一部分:这两个过程的流程图是类似的,并且可以使用相同的训练向量样本在同一循环内更新基本比例尺和基向量。过程200可以成为批处理模式基向量训练过程70的一部分。
用于优化基本比例尺的矩阵求逆过程与用于优化基向量和基本比例尺的梯度下降过程相差很大:它不是迭代过程,因为在训练完一个训练向量样本之后,直接计算最优值。基本比例尺的优化不独立于基向量的优化,并且因此每次基向量变化时,最优基向量值必须随之进行重新计算。
对于基本比例尺的优化和基向量的批处理模式训练的相对顺序,存在各种不同的选择。例如可以在进行基向量更新过程的几次迭代之前计算一次基本比例尺值。这一选项假定对于基向量训练周期的这几次迭代,可以忽略基向量缓慢变化的影响,然后,对于下几个迭代,重新计算基本比例尺。
对于批处理模式基向量训练,可选地,可以根据前面迭代期间所执行的优化在训练周期的每次迭代之前对基本比例尺值进行计算。在每次迭代的结束时,用于下一迭代的基本比例尺值的计算方式如下:如果基向量改变足够慢,则不重新计算基本比例尺,直到若干训练周期迭代之后。这一选项可能是串行、并行和光学计算机实现的速度、简单性和灵活性的最佳折衷。
另一方面,本发明提供对通过批处理模式和连续自适应方法进行训练以产生基向量的替代方法,并且该替代方法称作单次训练。在本实施例中,在每次迭代,都对于并且使用相同的训练数据向量样本获得最优基本比例尺和对基向量的批处理模式更新。
现在参照图9,其中前面描述过的部分使用相同的标号,以流程图的形式用220表示上面所述的替代实施例。在该图中,假定在222已从可用训练数据向量集合中选择随机选取的数据训练样本,并且该同一样本还用于矩阵求逆过程160,以确定后面将要描述也作为输入的基本比例尺的最优值,但是为减小说明复杂性,矩阵求逆过程160在图中没有示出。
在224和226,将Nbasis个向量的集合和N2 basis个向量的集合定义为称作更新寄存器(与基向量更新寄存器不同)的相应的计算机存储器地址集合的内容。这两个集合中的每个向量都是Nsensors维的。每个更新寄存器都具有存储相应的包含NsensorsNsamples个元素的Nsensors维向量的容量,并且其中每个元素的初始存储值为0。更新寄存器的两个集合224和226分别指定为qc寄存器和Qcc′寄存器,并且它们分别作为信号228和230出现:在此,下标索引c和cc′分别表示与第c基向量以及索引分别为c和c′的基向量对的对应关系;其中每个索引的取值范围为1到基向量的总数目Nbasis,从而索引c唯一标识每个qc寄存器,并且cc′唯一标识每个Qcc′寄存器(矩阵Qcc′是对称的,因此向量Qcc′具有与向量Qc′c相同的元素)。qc寄存器228和Qcc′寄存器230在累加循环232期间进行增加,下面将对此进行描述,这是对训练样本中的每个数据向量进行的;该累加循环如同设计为同时运行的在用于确定确定基本比例尺的矩阵求逆过程160的172进行迭代的累加循环,使用同一训练模式样本。
当前数据向量在234输入到重构过程20的步骤22到32,生成如前所述的Nbasis个输出向量26、非线性化输出向量30和分离信号分量(SSC)34:这些向量出现在236,并且向相关向量求取阶段238提供输入。相关向量求取阶段238为当前数据向量求得称作数据向量的q-相关向量的Nbasis个向量(表示为dvqcvc),以及称作数据向量的Q-相关向量的N2 basis个向量(表示为dvQcvc,c′)。这两种类型的相关向量都是一维的,并且它们不依赖于基本比例尺ac。对于Nbasis个基向量中的每个,都存在一个q-相关向量,并且对于Nbasis个基向量的每个成对组合,都存在一个Q-相关向量,即总共N2 basis个Q-相关向量。
要在求取阶段238求得数据向量的q-相关向量dvqcvc,如方程(14)一样在重构过程20中使用的非线性函数梯度中插入每个输出向量的每个元素,作为自变量:对于每个输出向量,这提供相应的结果向量,然后输出向量与该结果向量进行如前面所定义的分量相乘,这又提供一个乘积向量,以加到在阶段20获得的对应非线性化输出向量。结果和是当前数据向量的q-相关向量dvqcvc240,由下式给出: dvqcv c &equiv; r c ( x ) + [ r &prime; c ( x ) &times; &Sigma; j sensor = 1 N sensors cor ( x j sensor , w c , j sensor ) ] - - - - ( 18 )
其中,rc(x)和r′c(x)(由公式(4)和(14)分别给出)分别是当前输入向量x的第c非线性化输出向量30(参见方程(11))和梯度向量,×如同前面表示分量相乘,并且求和是在数据向量的信道向量xjsensor与基向量的信道向量(例如,第c基向量的第j信道wc,jsensor)之间的Nsensors个相关(cor)上进行的,该求和产生如前所述的第c输出向量。
要在求取阶段238求得数据向量的Q-相关向量dvQcvc,c′,在20求得的Nbasis个SSC cnv(wc′,isensor,rc′(x))中的每个依次与Nbasis个基向量中的每个进行相关,以为N2 basis个SSC/基向量成对组合中的每个产生相应的相关函数向量;SSC、基向量和相关函数向量全都具有等于传感器数目的维数,即,它们是Nsensors维的。将相关函数向量的两个索引表示为t和i,其中t表示时间采样,并且i表示传感器/信道,在所有i值上对相同t值的元素进行求和,为分离信号分量(用索引c′标识)与基向量(用索引c标识)的N2 basis个成对组合(用索引对c和c′标识)中的每个产生相应的一维和向量。插入与第c基向量相对应的相同索引输出向量(第c)的元素,作为在重构过程20中使用的非线性函数梯度r′c(a)的自变量a,这将产生Nbasis个梯度向量,用来与对应和向量(即,索引为cc′的和向量集合,其中c′的取值范围为1到Nbasis)进行分量相乘,产生当前数据向量的N2 basis个Q-相关向量dvQcvc,c′242,由下式给出: dvQcv c , c &prime; &equiv; r &prime; c ( x ) &times; &Sigma; j sensor = 1 N basis cor ( cnv ( W c &prime; , j sensor , r c &prime; ( x ) ) , W c , j sensor ) - - - - ( 19 )
其中,各项如同前面所定义。
对于Nbasis个数据向量的q-相关向量和N2 basis个数据向量的Q-相关向量中的每个,分别在244和246计算与当前数据向量的相关函数,并且将结果加到对应qc或Qcc′寄存器224或226(关系未示出)。然后在248计算SSC和输出向量的N2 basis个成对组合中每个组合的相关函数,并且将其中每个结果加到对应Qcc′寄存器226。除此之外,还存在其它因素来更新系数Qcc′矩阵的每个元素,也就是,用来自两个相关函数和的样本平均值的相应的影响量进行更新,其中,一个相关函数是SSCcnv(wc′,isensor,r′c(x))与输出向量之间的相关函数,另外一个是当前数据向量与其Q-相关向量dvQcvc,c′之间的相关函数。
在250,通过对下一数据向量重复步骤242到248的过程继续进行累加,直到处理完所选样本中的所有数据向量为止,并且在寄存器224和226中累加它们对qc或Qcc′的影响量,以提供信号252。
总而言之,系数向量qc和系数矩阵Qcc′的最终累加值方程如下给出(其中,除以训练样本的大小以从累加和中获得实际平均值是没有必要的,因为该除法操作与使用这些数量最终求得的基向量值无关): ( q c ) i sensor &equiv; &lang; cor ( x i sensor , r c ( x ) + [ r &prime; c ( x ) &times; &Sigma; j sensor = 1 N sensors cor ( s j sensor , w c , j sensor ) ] ) &rang; { x } - - - - ( 20 ) ( Q c , c &prime; ) i sensor &equiv; &lang; cor ( cnv ( w c &prime; , i sensor , r c &prime; ( x ) , r c ( x ) ) ) &rang; { x } + &lang; cor ( x i sensor r &prime; c ( x ) &times; &Sigma; j sensor = 1 N sensors cor ( cnv ( W c &prime; j sensor , r c &prime; ( x ) ) , W c , j sensor ) ) &rang; { x } - - - ( 21 )
通过整理方程(6)、(11)、(12)、(13)和(15),可以看出,基向量更新寄存器内容60(参见图3和4),即第c基向量的与第i传感器isensor对应的信道向量bvurc,isensor如下给出: bvur ci sensor = a c ( q c ) i sensor - a c &Sigma; c &prime; N basis a c &prime; ( Q c , c &prime; ) i sensor - - - - ( 22 )
其中,ac是第c个基本比例尺。qc和Qcc′独立于基本比例尺,从而基向量更新是基本比例尺的二次函数。在对qc和Qcc′进行累加之后,使用训练数据的相同样本通过矩阵求逆过程160(参见图7)计算最优基本比例尺254,并且在256对方程(22)进行求值,以如下确定对每个基向量的基向量更新258。基向量更新在寄存器(未示出)中进行累加,其中每个寄存器设为方程(22)右边第一项(即,对于第c基向量,为用相应的基本比例尺ac加权的向量qc)的第一值。每个基向量更新寄存器然后通过减去方程(22)右边第二项(即,对于第c基向量,为相应的基本比例尺ac与用相应的基本比例尺ac′加权的向量Qcc′在c′值上的和的乘积)进行减小。
在使用第一样本提供对每个基向量的第一更新或影响量之后,使用更多的样本对过程220进行迭代,并且根据以同样方式获得的新影响量累加基向量,并且每次样本迭代都更趋近于收敛。每次迭代的基向量值是通过增加前面迭代的基向量值而产生的,因此第一次迭代之前的基向量值需要进行初始化。初始值可以通过各种方式进行选取,也就是,基向量元素可以初始化为如下值:
(a)随机数;或者
(b)基于当前监测系统的专家先验知识的估计值。
基向量的初始元素不应该全是相同的值:为使各种基向量收敛,并且对数据的不同特征进行编码,采用不同的值是必要的。基向量在每次迭代时可以归一化为例如固定的向量长度。如果这样,在初始化之后,即第一次样本迭代之前,它们也需要以相同的方式进行归一化。
通过使用12个磁搜索线圈来监测电机的旋转,对本发明进行测试:这些线圈在空间上分布在电机的附近。这样给出12个信号信道,用来发现数据集合之间的差别和对人工引入变形的敏感性;在此,一个数据集合是四个信道输出的组合,从而12个信道给出三个这样的集合。结果发现,本发明具有良好的用于监测电机基频和谐波变化的能力。
通过将小的模拟变形引入到每个传感器信号的一个峰值,检查变形敏感性。这种变形对应于电机轴每旋转一次发生一次的故障,例如转子磁极过热,或者电机磁铁中有一个发生去磁。变形通过减小波形幅度来模拟:使用三种变形程度,即5%、10%和15%幅度的减小。这种影响很难通过传统频谱分析来检测,但是结果发现,本发明成功地检测出它们,甚至还能够对它们进行区分。
还可以从传统感应电机采集数据,从中获得声学信号和振动信号。产生对应于三种电机条件(电机供电的正常操作、以及20%与40%失衡)的数据集合。本发明对于故障检测、区分和定位给出良好的结果。
使用本发明对变速箱中的机械故障进行研究。这些故障经常源于一个或多个轮齿出现小规模损坏,这又使啮合碰撞产生瞬时振动。在现有技术中,检测程度小于轮齿宽度30%的轮齿损坏,是不可能的,本发明经证实能够对程度比这更小的轮齿损坏对应的小故障进行检测。小故障检测对于早期给出潜在问题的告警以在它们变得更严重之前进行修理,是很重要的。
另外,还对两节螺旋变速箱进行研究:获取4个振动数据信道。使用本发明对该数据进行分析,结果发现,本发明能够检测和区分本领域传统技术例如频谱和时频分析不能检测和区分的小故障。
用于求得向量之间的相关和卷积函数的前述过程,最适合于具有周期边界条件的向量。每个均具有T个时间采样的两个一维向量之间的相关函数相当于T个无向积的集合。在这个集合中,如果其中一个向量的所有元素都移动一个时间采样,将那个向量的最后一个时间采样从终点移到起点,第(t+1)个无向积将等于第t个无向积。如果向量的最后一个时间采样以这种方式有效地与第一个时间采样相邻,也就是,如果向量表示时间采样圆周而不是具有起点和终点的线段,则可以说该向量具有周期或循环边界条件。
因此,本发明的上述实施例最适合于具有周期边界条件的数据向量,例如,具有周期性波形(其中,终点至少近似重复起点)的数据。对于这种向量,可以任意选取起点和终点,而不影响波形的性质。换句话说,数据向量时间坐标的零点是任意的,它对本发明的效果没有影响。这种数据的一个例子是从旋转机中获得的数据,其中,每个数据向量的范围为全部旋转数目。在此所述的本发明实施例不要求数据与时间参考点同步。
前述实施例对于非周期传感器数据,效果可能差些,因为该数据的终点和起点的不连续性将如同任何其它波形区域一样进行处理;这可能导致错误的假象。这个潜在问题可以通过在较长、填零的数据向量中嵌入数据,或者将相关/卷积函数的某些单元设为零而加以克服,以排除起点-终点变化范围的回转向量对应的无向积。
对重构过程20的非线性函数的选择不是特别严格,但是某些非线性函数确实会更好些。具有阀值特征的非线性函数是有用的,因为可以发现使用它们产生的经过训练的基向量对应于在训练数据中经常出现感兴趣特征:例如,一些谐波频率的相关组合、瞬变或者局限在时间上的其它特征。经验观察发现,本发明表现得就象一种独立分量分析(ICA)的新方法,除了在本发明中不从任何统计独立原理获得分量(基向量)之外,它类似于盲信号分离。
阀值函数对于小的输入自变量值,一般都相当小(接近于0),并且对于特征阀值附近的输入值开始快速增长。如果阀值函数不急剧而是相对平滑和连续,例如前面所述的sigmoid函数,这是有用的,因为这样,训练将平滑地收敛。如果当输入自变量小于阀值时,阀值函数不完全变为0,这也是有用的,因为如果对于训练集合中的所有数据向量,该函数均完全为0,训练可能根本不收敛。阀值函数最好是在小于阀值的区间内指数趋向于0。
如在sigmoid函数中,阀值函数对于大的输入值会发生收敛(levelout)。可选地,它对于大的输入自变量值可以继续增长,如同下面函数: r ( a ) &infin; s log [ 1 + exp ( a - &theta; s ) ] - - - - ( 23 )
其导数是sigmoid:参数如同方程(2)的定义;该函数在远大于阀值处变得近似线性,并且在小于阀值的区间内指数趋向于0。
如果阀值函数图比这增长得还快,训练的收敛可能会慢得多,如同方程(23)函数的平方,即: r ( a ) &Proportional; ( s log [ 1 + exp ( a - &theta; s ) ) 2 - - - - ( 24 )
该函数在小于阀值的区间内指数趋向于0,但是在远大于阀值处变得近似二次。
根据光学元件的自然物理特性产生的其它非线性函数可能更适合于本发明的光学实现。
如果在批处理模式训练周期的每次迭代中使用整个训练集合,训练将以最大可能平滑方式收敛,消除连续迭代间的统计波动。然而,用来训练的输入向量数目越大,训练所需的计算机时间则相应成比例地越多。从而,在实际中,对于每次迭代所采用的训练向量数目,可能是主观上最优的,这表示训练时间和统计波动幅度之间的折衷。这些波动必须不能太大,以致于训练无法收敛。
可以使用一个公认规则来表示每次迭代的最小训练向量数目。使用梯度下降,本发明最小化作为异常向量均方长度的目标函数。众所周知,梯度下降不能随着时间增加其目标函数值(不考虑统计波动),而是只能单调减小,直到它收敛于最小值。因此,测试每次迭代所采用的训练模式样本或子集是否足够大是,目标函数应该随迭代的进行单调减小,并且不应该产生如同统计波动占主导地位情况下出现的上下跳动。只有当优化已收敛于目标函数最小值的附近,波动才会随迭代的进行偶尔导致小的增加。
每次迭代取样的训练向量数目应该远大于基向量的数目-在理想情况下,至少为10倍。如果统计波动在连续迭代之间是不相关的,在每次迭代所选取的输入向量的选择应该是整个训练集合的完全随机子集:训练不应该重复使用相同的小子集,或者高相关的子集。这是所有神经网络训练过程的众所周知的特性,并且将不作描述。
学习率参数值假如足够小将对训练模型的性质没有影响。如同每次达代的训练向量数目,学习率也决定连续迭代间的统计波动大小。因此,测试学习率是否足够小是,异常向量的均方长度应该随迭代的进行单调减小。但是学习率不应该设为太小,以致于学习将花费不切实际的时间长度来收敛。在采用批处理模式训练并且基向量更新寄存器和基向量自身已归一化为单位长度的情况下,通过分析可以看出,平滑收敛要求学习率参数显著小于1(假定基向量更新寄存器已归一化为单位长度)。0.1值是开始试错法过程的安全估计值:该值可以逐渐减小,直到统计波动不再占主导地位。
在本发明的上述实施例中,一些过程步骤表述为‘对于每个基向量’重复。然而这些重复在附图中并没有明确地表示为迭代循环,因为在本发明的光学或并行计算机实现中,可以采用并行方式对所有基向量应用一种操作:只有对于本发明的串行计算机实现,迭代循环才有意义。
重构过程20是本发明的重要特征。本发明可以在两种不同的模式下进行使用:监测模式和训练模式。如果可以获得基向量和基本比例尺参数的预先训练结构,可以只在监测模式下使用本发明。
本发明的过程是被称作“非监督”的过程,因为它不需要当前监测系统特征的先验知识。它对未标注、未分类和以前未见过的训练数据进行自适应,即训练是“非监督”的。该过程生成它自己的训练数据特征模型。费力的人工数据标注是不需要的。
因此本发明可以用来监测新型环境和设计。众所周知的线性技术主要分量分析(PCA)用于一些类似的应用,并且也具有该优点;然而,由于本发明使用非线性方法,因此与PCA相比,它能够对更精细、重要和有用的训练数据特征进行建模。
在使用本发明检测机器故障中,例如由于改变机器负荷而造成的正常机器信号变化典型地大于故障出现并且损害机器性能时的结果变化。因此使用在不同已知操作条件下获得的数据向量训练不同的模型,然后将数据向量与在相同操作条件下训练的模型进行比较,是可行的。同时连续地运行训练和监测阶段来检测在相对短的时间范围内可能发生的与连续更新模型的偏离,也是可能的。
本发明使用相关和卷积函数比较输入信号向量和基向量。这与在径向基函数方法中使用的径向量度(参见美国专利No.5,377,306和5,453,940)以及在投影研究和感知器或神经网络方法中使用的简单无向积量度截然不同。虽然卷积在数学上等同于计算以特殊方式进行约束的特定无向积集合,但是卷积的计算过程完全不同于计算等同的无向积集合。甚至在传统串行计算机上实现时,特别使用傅立叶变换也具有双重优点:与其它方法相比,是更快速的计算过程并且需要少得多的计算机存储器量。
计算径向距离或无向积的神经网络方法现有技术对输入信号的时间同步程度很敏感。本发明使用时不变的时间维度相关/卷积方法:因此,它可以进行训练,并且执行重构和异常增强功能,而不管输入信号是否在时间上发生平移或偏移。因此,输入信号不需要相对于任何绝对时间参考点进行同步。这将是很多应用的重要特性。
本发明的过程具有特别好地适合于并行硬件实现(例如,多路处理并行计算机、数字信号处理集成电路阵列、或者光学或全息计算设备)的特性。全息计算设备可能例如是基于自适应光折射性大量全息晶体,从原理上可以使用其自适应物理特性来非常高效地实现自适应训练算法。这种并行硬件在原理上实现本发明可以比传统串行计算机实现现有技术快得多。
在前面描述中给出的用于计算在过程20、50、70、100、120、160、200和220中生成的数量和结果的方程显然可以通过记录在记录介质上并且运行在传统计算机系统上的适当计算机程序进行求值。熟练的程序员实现这种程序是非常简单的,而不需要任何创造性,因为相关、卷积、傅立叶变换、求和、相乘、平方、平方根、平均等是众所周知的计算过程。因此对这种程序和系统不作进一步的描述。

Claims (56)

1.一种用于生成分离信号分量的信号处理技术,其特征在于它包括如下步骤:
a)将基向量与输入数据进行相关,以产生输出向量;
b)将非线性函数应用到输出向量,以产生非线性化向量;以及
c)将非线性化向量与基向量进行卷积,以产生分离信号分量。
2.如权利要求1所述的信号处理技术,其特征在于,数据向量和基向量是多维的,并且多维卷积和相关操作通过如下步骤进行实现:
a)将数据向量和基向量设置为多个称作信道向量的一维信号;
b)将每个数据向量信道向量与对应的基向量信道向量进行相关或卷积,以产生多个一维相关或卷积函数;以及
c)对多个相关或卷积函数进行向量叠加,以产生提供卷积或相关结果的和向量。
3.如权利要求1或2所述的信号处理技术,其特征在于,一维信号对之间的卷积和相关操作通过如下步骤实现:将两个信号快速傅立叶变换到频域,在相关的情况下对两个傅立叶变换之一进行复数共轭,在执行了一个傅立叶变换的共轭后,将两个傅立叶变换的频率分量进行相乘,然后执行快速傅立叶反变换到原始域。
4.如权利要求1、2或3所述的信号处理技术,其特征在于,它包括如下步骤,对分离信号分量进行组合,形成至少一个结果信号,该信号包括输入信号的重构信号和表示重构信号与对应输入信号的偏差的异常信号中的至少一个。
5.如权利要求1所述的信号处理技术,其特征在于,基向量通过包括如下步骤的训练过程进行确定:
a)为基向量设置不等的初始当前值;
b)使用基向量的当前值执行该信号处理技术;
c)为每个基向量求得至少一个相应的相关项向量,以与从输入数据和所述至少一个结果信号中选择的对应向量进行相关;
d)对于每个基向量,将相应的相关项与对应向量进行相关,以产生至少一个相应的相关函数;
e)修改每个基向量,以形成相应的新当前值,该新当前值加入根据与相应的相关项相对应的至少一个相关函数的影响量;
f)重复步骤(b)到(e),直到当前值收敛。
6.如权利要求5所述的信号处理技术,其特征在于,所述影响量与所述至少一个相关函数成比例,这个关系中的比例常数称作学习率参数。
7.如权利要求5所述的信号处理技术,其特征在于,该至少一个相关项信号是如下向量中的至少一个:
a)输入数据向量的相关向量,求得方式为对输出向量的每个元素应用所述非线性函数的梯度,并且将所形成的向量与根据基向量和异常向量的相关而获得的对应向量进行相乘;以及
b)异常向量的相关向量,从非线性化输出向量求得。
8.如权利要求7所述的信号处理技术,其特征在于,该至少一个相关项信号是或包括数据向量的相关向量,对应基向量是多维的,对应于多个信道,当与异常向量进行相关时产生多个相关函数,并且在与输出向量进行相乘之前,相关函数通过组合来自不同信道的具有相同时标的影响量简化为一维向量。
9.如权利要求7或8所述的信号处理技术,其特征在于,该至少一个相关向量是或包括输入数据向量的相关向量,并且在与所述相关函数进行相乘之前,通过与非线性化输出向量相对应的非线性化函数梯度对输出向量进行操作。
10.如权利要求9所述的信号处理技术,其特征在于,在通过所述梯度进行操作之后和与所述相关函数进行相乘之前,输出向量用从统称为基本比例尺的数量中选择的相应的加权因子进行相乘,这些基本比例尺当应用于各个重构向量时,具有减小重构向量与用来求得它们的对应输入数据之间均方误差的效果。
11.如权利要求10所述的信号处理技术,其特征在于,该至少一个相关向量是或包括异常向量的相关向量,它通过将非线性化输出向量的元素与其相应的基本比例尺进行相乘而求得。
12.如权利要求11所述的信号处理技术,其特征在于,该至少一个相关向量是多个相关向量,该技术包括在修改每个基向量以形成相应的新当前值之前计算这些向量的相关函数的步骤,以及组合作为结果的多个相关函数的步骤。
13.如权利要求11或12所述的信号处理技术,其特征在于,基向量通过包括输入数据训练集合,以用于重构过程的批处理模式迭代过程来确定,并且其中,在每次迭代中,相应的训练集合子集经受重构过程,在每次迭代中,对基向量进行连续修改,以形成加入从子集中的输入数据获得的多个影响量的相应的新当前值,每个影响量根据与相应的相关项相对应的至少一个对应的相关函数。
14.如权利要求13所述的信号处理技术,其特征在于,每个子集中的输入数据项数目至少等于基向量的数目,并且每个子集随机地从训练集合中选取,避免重复使用小子集或者高相关子集。
15.如权利要求4所述的信号处理技术,其特征在于,组合分离信号分量以形成至少一个结果信号包括将分离信号分量与各个基本比例尺进行相乘,并且通过向量叠加对结果乘积进行相加。
16.如权利要求10、11或15所述的信号处理技术,其特征在于,基本比例尺通过如下计算而算出:
a)在输入数据集合上的无向积向量平均值,其中,无向积为输入数据项与对应分离信号分量(SSCs)的无向积;
b)在输入数据集合上的无向积矩阵平均值,其中,无向积为与单个输入数据项相对应的分离信号分量对之间的无向积;
c)平均无向积矩阵的逆;以及
d)逆矩阵与数据-SSC无向积平均向量的乘积,该乘积为一个其元素为基本比例尺的向量。
17.如权利要求10、11或15所述的信号处理技术,其特征在于,基本比例尺通过如下步骤进行计算:
a)为基本比例尺设置不等的初始当前值;
b)计算异常向量和与相同输入数据项相对应的每个分离信号分量的相应的无向积;
c)修改每个基本比例尺,以形成相应的新当前值,该新当前值加入根据与之对应的无向积的影响量;
d)对下一数据项,重复步骤(b)和(c)。
18.如权利要求1所述的信号处理技术,其特征在于,非线性函数是具有如下特性中至少一个的阀值函数,也就是说,它
a)对于小自变量很小而当自变量值在阀值附近时开始快速增长;
b)不剧变,而是相对平滑和连续;
c)对于小于阀值的自变量值,不完全变为0;
d)对于小于阀值的自变量值,指数渐近于0;以及
e)是sigmoid函数。
19.如权利要求1所述的信号处理技术,其特征在于,基向量通过如下步骤获得:
a)提供当前基向量的初始值;
b)从当前基向量和非线性化输出向量求得数据向量的q-相关和Q-相关向量;
c)将数据向量的q-相关向量与对应数据向量进行相关;
d)将数据向量的Q-相关向量与对应数据向量进行相关;
e)将输出向量与分离信号分量进行相关,这些向量和分量是从对应数据向量求得的;
f)对涉及数据向量的q-相关向量的那些相关进行求和;
g)对涉及数据向量的Q-相关向量与输出向量的那些相关进行求和;
h)对下一数据向量,重复步骤(b)到(g);以及
i)从基本比例尺的二次函数求得对基向量的影响量,包括涉及与数据向量的q-相关向量相对应的相加的相关的线性项,以及从其中减去的涉及其它相加的相关的二次项。
20.一种用于控制计算机系统操作并且用于生成分离信号分量的计算机程序,其特征在于,该程序设计为实现包括如下步骤的过程:
a)将基向量与输入数据进行相关,以产生输出向量;
b)将非线性函数应用到输出向量,以产生非线性化向量;以及
c)将非线性化向量与基向量进行卷积,以产生分离信号分量。
21.如权利要求20所述的计算机程序,其特征在于,数据向量和基向量是多维的,并且该过程通过如下步骤实现卷积和相关操作:
a)将数据向量和基向量设置为多个称作信道向量的一维信号;
b)将每个数据向量信道向量与对应的基向量信道向量进行相关或卷积,以产生多个一维相关或卷积函数;以及
c)对多个相关或卷积函数进行向量叠加,以产生提供卷积或相关结果的和向量。
22.如权利要求20或21所述的计算机程序,其特征在于,该过程通过如下步骤实现向量对之间的卷积和相关操作:将两个向量快速傅立叶变换到频域,只在相关的情况下对两个傅立叶变换之一进行复数共轭,在执行了一个傅立叶变换的共轭后,将两个傅立叶变换的频率分量进行相乘,然后执行快速傅立叶反变换到原始域。
23.如权利要求21或22所述的计算机程序,其特征在于,该过程包括如下步骤:对分离信号分量进行组合,形成至少一个结果信号,该信号包括输入信号的重构信号和表示重构信号与对应输入信号的偏差的异常信号中的至少一个。
24.如权利要求23所述的计算机程序,其特征在于,该过程通过包括如下步骤的训练过程确定基向量:
a)为基向量设置不等的初始当前值;
b)使用当前值执行该信号处理技术;
c)为每个基向量求得至少一个相应的相关项向量,以与从输入数据和所述至少一个结果信号中选择的对应向量进行相关;
d)对于每个基向量,将相应的相关项与对应向量进行相关,以产生至少一个相应的相关函数;
e)修改每个基向量,以形成相应的新当前值,该新当前值加入根据与相应的相关项相对应的至少一个相关函数的影响量;
f)重复步骤(b)到(e),直到当前值收敛。
25.如权利要求24所述的计算机程序,其特征在于,所述影响量与该至少一个相关函数成比例,这个关系中的比例常数称作学习率参数。
26.如权利要求24所述的计算机程序,其特征在于,该至少一个相关项信号是如下向量中的至少一个:
a)输入数据向量的相关向量,求得方式为对输出向量的每个元素应用所述非线性函数的梯度,并且将所形成的向量与根据基向量和异常向量的相关而获得的对应向量进行相乘;以及
b)异常向量的相关向量,从非线性化输出向量求得。
27.如权利要求26所述的计算机程序,其特征在于,该至少一个相关项信号是或包括数据向量的相关向量,对应基向量是多维的,对应于多个信道,当与异常向量进行相关时产生多个相关函数,并且在与输出向量进行相乘之前,该过程通过组合来自不同信道的具有相同时标的影响量,将相关函数简化为一维向量。
28.如权利要求26或27所述的计算机程序,其特征在于,该至少一个相关向量是或包括输入数据向量的相关向量,并且在与所述相关函数进行相乘之前,该过程通过与非线性化输出向量相对应的非线性化函数梯度对输出向量进行操作。
29.如权利要求28所述的计算机程序,其特征在于,在通过所述梯度进行操作之后和在与所述相关函数进行相乘之前,该过程将输出向量与从统称为基本比例尺的数量中选择的相应的加权因子进行相乘,这些基本比例尺当应用于各个重构向量时,具有减小重构向量与用来求得它们的对应输入数据之间均方误差的效果。
30.如权利要求29所述的计算机程序,其特征在于,该至少一个相关向量是或包括异常向量的相关向量,它通过将非线性化输出向量的元素与其相应的基本比例尺进行相乘而求得。
31.如权利要求30所述的计算机程序,其特征在于,该至少一个相关向量是多个相关向量,该过程包括在修改每个基向量以形成相应的新当前值之前计算与这些向量的相关函数的步骤,以及组合作为结果的多个相关函数的步骤。
32.如权利要求30或31所述的计算机程序,其特征在于,该过程通过包括输入数据训练集合的批处理模式迭代过程来确定基向量,以用于重构过程,并且其中,在每次迭代中,相应的训练集合子集经过重构过程,在每次迭代,对基向量进行连续修改,以形成加入从子集中的输入数据获得的多个影响量的相应的新当前值,每个影响量根据与相应的相关项相对应的对应至少一个相关函数。
33.如权利要求32所述的计算机程序,其特征在于,每个子集中的输入数据项数目至少等于基向量的数目,并且该过程随机地从训练集合中选取每个子集,避免重复使用小子集或者高相关子集。
34.如权利要求23所述的计算机程序,其特征在于,组合分离信号分量以形成至少一个结果信号的步骤包括,将分离信号分量与各个基本比例尺进行相乘,并且通过向量叠加对结果乘积进行相加。
35.如权利要求29、30或34所述的计算机程序,其特征在于,该过程通过进行如下计算来算出基本比例尺:
a)在输入数据集合上的无向积向量平均值,其中,无向积为输入数据项与对应分离信号分量(SSCs)的无向积;
b)在输入数据集合上的无向积矩阵平均值,其中,无向积为与单个输入数据项相对应的分离信号分量对之间的无向积;
c)平均无向积矩阵的逆;以及
d)逆矩阵与数据-SSC无向积平均向量的乘积,该乘积为一个其元素为基本比例尺的向量。
36.如权利要求29、30或34所述的计算机程序,其特征在于,该过程通过如下步骤计算基本比例尺:
a)为基本比例尺设置不等的初始当前值;
b)计算异常向量和与相同输入数据项相对应的每个分离信号分量的相应的无向积;
c)修改每个基本比例尺,以形成相应的新当前值,该新当前值加入根据与之对应的无向积的影响量;
d)对下一数据项,重复步骤(b)和(c)。
37.如权利要求20所述的计算机程序,其特征在于,非线性函数是具有如下特性中至少一个的阀值函数,也就是说,它
a)对于小自变量很小并且对于阀值附近自变量值开始快速增长;
b)不急剧,而是相对平滑和连续;
c)对于小于阀值的自变量值,不完全变为0;
d)对于小于阀值的自变量值,指数渐近于0;以及
e)是sigmoid函数。
38.如权利要求20所述的计算机程序,其特征在于,该过程通过如下步骤获得基向量:
a)提供当前基向量的初始值;
b)从当前基向量和非线性化输出向量求得数据向量的q-相关和Q-相关向量;
c)将数据向量的q-相关向量与对应数据向量进行相关;
d)将数据向量的Q-相关向量与对应数据向量进行相关;
e)将输出向量与分离信号分量进行相关,这些向量和分量是从对应数据向量求得的;
f)对涉及数据向量的q-相关向量的那些相关进行求和;
g)对涉及数据向量的Q-相关向量与输出向量的那些相关进行求和;
h)对下一数据向量,重复步骤(b)到(g);以及
i)从基本比例尺的二次函数求得对基向量的影响量,包括涉及与数据向量的q-相关向量相对应的相加的相关的线性项,以及从其中减去的涉及其它相加的相关的二次项。
39.一种计算机系统,使用如权利要求20至38中的任一项所述的程序进行编程。
40.一种编程为执行一种处理技术以生成分离信号分量的计算机系统,其特征在于,该技术包括如下步骤:
a)将基向量与输入数据进行相关,以产生输出向量;
b)将非线性函数应用到输出向量,以产生非线性化向量;以及
c)将非线性化向量与基向量进行卷积,以产生分离信号分量。
41.如权利要求40所述的计算机系统,其特征在于,数据向量和基向量是多维的,并且卷积和相关操作通过如下步骤进行实现:
a)将数据向量和基向量设置为多个称作信道向量的一维信号;
b)将每个数据向量信道向量与对应的基向量信道向量进行相关或卷积,以产生多个一维相关或卷积函数;以及
c)对多个相关或卷积函数进行向量叠加,以产生提供卷积或相关结果的和向量。
42.如权利要求40或41所述的计算机系统,其特征在于,该技术通过如下步骤实现卷积和相关操作,将两个信号快速傅立叶变换到频域,只在相关的情况下对两个傅立叶变换之一进行复数共轭,在执行了一个傅立叶变换的共轭后,将两个傅立叶变换的频率分量进行相乘,然后执行快速傅立叶反变换到原始域。
43.如权利要求41或42所述的计算机系统,其特征在于,编程用来执行的该技术包括如下步骤,对分离信号分量进行组合,形成至少一个结果信号,该信号包括输入信号的重构信号和表示重构信号与对应输入信号的偏差的异常信号中的至少一个。
44.如权利要求43所述的计算机系统,其特征在于,该技术通过包括如下步骤的训练过程确定基向量:
a)为基向量设置不等的初始当前值;
b)使用当前值执行该信号处理技术;
c)为每个基向量求得至少一个相应的相关项向量,以与从输入数据和所述至少一个结果信号中选择的对应向量进行相关;
d)对于每个基向量,将相应的相关项与对应向量进行相关,以产生至少一个相应的相关函数;
e)修改每个基向量,以形成相应的新当前值,该新当前值加入根据与相应的相关项相对应的至少一个相关函数的影响量;
f)重复步骤(b)到(e),直到当前值收敛。
45.如权利要求44所述的计算机系统,其特征在于,该至少一个相关项信号是如下向量中的至少一个:
a)输入数据向量的相关向量,求得方式为对输出向量的每个元素应用所述非线性函数的梯度,并且将所形成的向量与根据基向量和异常向量的相关而获得的对应向量进行相乘;以及
b)异常向量的相关向量,从非线性化输出向量求得。
46.如权利要求45所述的计算机系统,其特征在于,该至少一个相关项信号是或包括数据向量的相关向量,对应基向量是多维的,对应于多个信道,并且当与异常向量进行相关时产生多个相关函数,并且在与输出向量进行相乘之前,相关函数通过组合来自不同信道的具有相同时标的影响量简化为一维向量。
47.如权利要求45或46所述的计算机系统,其特征在于,该至少一个相关向量是或包括输入数据向量的相关向量,并且在与所述相关函数进行相乘之前,通过与非线性化输出向量相对应的非线性化函数梯度对输出向量进行操作。
48.如权利要求47所述的计算机系统,其特征在于,在通过所述梯度进行操作之后和在与所述相关函数进行相乘之前,用来对系统进行编程的该技术将输出向量与从统称为基本比例尺的数量中选择的相应的加权因子进行相乘,这些基本比例尺当应用于各个重构向量时,具有减小重构向量与用来求得它们的对应输入数据之间均方误差的效果。
49.如权利要求48所述的计算机系统,其特征在于,该至少一个相关向量是或包括异常向量的相关向量,它通过将非线性化输出向量的元素与其相应的基本比例尺进行相乘而求得。
50.如权利要求49所述的计算机系统,其特征在于,该至少一个相关向量是多个相关向量,该技术在修改每个基向量以形成相应的新当前值之前包括计算与这些向量的相关函数的步骤,以及组合作为结果的多个相关函数的步骤。
51.如权利要求49或50所述的计算机系统,其特征在于,用来对系统进行编程的技术通过包括输入数据训练集合的批处理模式迭代过程来确定基向量,以用于重构过程,并且其中,在每次迭代中,相应的训练集合子集经过重构过程,在每次迭代,对基向量进行连续修改,以形成加入从子集中的输入数据获得的多个影响量的相应的新当前值,每个影响量根据与相应的相关项相对应的对应至少一个相关函数。
52.如权利要求43所述的计算机系统,其特征在于,用来对系统进行编程的技术组合分离信号分量以形成至少一个结果信号的步骤,包括将分离信号分量与各个基本比例尺进行相乘,并且通过向量叠加对结果乘积进行相加。
53.如权利要求48、49或52所述的计算机系统,其特征在于,该技术通过在输入数据集合上进行如下计算来算出基本比例尺:
a)无向积向量平均值,其中,无向积为输入数据项与对应分离信号分量(SSCs)的无向积;
b)无向积矩阵平均值,其中,无向积为与单个输入数据项相对应的分离信号分量对之间的无向积;
c)平均无向积矩阵的逆;以及
d)逆矩阵与数据-SSC无向积平均向量的乘积,该乘积为一个其元素为基本比例尺的向量。
54.如权利要求48、49或52所述的计算机系统,其特征在于,该技术通过如下步骤计算基本比例尺:
a)为基本比例尺设置不等的初始当前值;
b)计算异常向量和与相同输入数据项相对应的每个分离信号分量的相应的无向积;
c)修改每个基本比例尺,以形成相应的新当前值,该新当前值加入根据与之对应的无向积的影响量;
d)对下一数据项,重复步骤(b)和(c)。
55.如权利要求40所述的计算机系统,其特征在于,非线性函数是具有如下特性中至少一个的阀值函数,也就是说,它
a)对于小自变量很小并且对于阀值附近自变量值开始快速增长;
b)不急剧,而是相对平滑和连续;
c)对于小于阀值的自变量值,不完全变为0;
d)对于小于阀值的自变量值,指数渐近于0;以及
e)是sigmoid函数。
56.如权利要求40所述的计算机系统,其特征在于,用来对系统进行编程的技术通过如下步骤获得基向量:
a)提供当前基向量的初始值;
b)从当前基向量和非线性化输出向量求得数据向量的q-相关和Q-相关向量;
c)将数据向量的q-相关向量与对应数据向量进行相关;
d)将数据向量的Q-相关向量与对应数据向量进行相关;
e)将输出向量与分离信号分量进行相关,这些向量和分量是从对应数据向量求得的;
f)对涉及数据向量的q-相关向量的那些相关进行求和;
g)对涉及数据向量的Q-相关向量与输出向量的那些相关进行求和;
h)对下一数据向量,重复步骤(b)到(g);以及
从基本比例尺的二次函数求得对基向量的影响量,包括涉及与数据向量的q-相关向量相对应的相加的相关的线性项,以及从其中减去的涉及其它相加的相关的二次项。
CN01807837.0A 2000-02-17 2001-01-31 信号处理技术 Pending CN1422407A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GBGB0003571.7A GB0003571D0 (en) 2000-02-17 2000-02-17 Signal processing technique
GB0003571.7 2000-02-17

Publications (1)

Publication Number Publication Date
CN1422407A true CN1422407A (zh) 2003-06-04

Family

ID=9885720

Family Applications (1)

Application Number Title Priority Date Filing Date
CN01807837.0A Pending CN1422407A (zh) 2000-02-17 2001-01-31 信号处理技术

Country Status (7)

Country Link
US (1) US6954721B2 (zh)
EP (1) EP1256069A2 (zh)
JP (1) JP2003523577A (zh)
CN (1) CN1422407A (zh)
AU (1) AU2001228692A1 (zh)
GB (1) GB0003571D0 (zh)
WO (1) WO2001061526A2 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101256552B (zh) * 2007-02-27 2010-06-23 北京大学 矢量信号处理方法及采用该方法的矢量信号处理系统
CN107290579A (zh) * 2017-06-20 2017-10-24 安徽建筑大学 基于特征排序向量内积的单通道多电器叠加电流信号分离方法
CN109155763A (zh) * 2016-05-11 2019-01-04 微软技术许可有限责任公司 数据流上的数字信号处理
CN109325589A (zh) * 2017-07-31 2019-02-12 华为技术有限公司 卷积计算方法及装置
CN109461095A (zh) * 2018-10-18 2019-03-12 深圳供电局有限公司 一种用于非侵入式负荷辨识的负荷事件检测的数据处理方法及设备
CN110543482A (zh) * 2019-08-29 2019-12-06 中国信息通信研究院 一种最大时间间隔误差计算方法及系统

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6915224B2 (en) * 2002-10-25 2005-07-05 Jung-Ching Wu Method for optimum spectrum analysis
JP3905466B2 (ja) * 2002-12-05 2007-04-18 東京エレクトロン株式会社 プラズマ処理方法及びプラズマ処理装置
JP2005201869A (ja) * 2004-01-19 2005-07-28 Mitsutoyo Corp 信号処理方法、信号処理プログラム、この信号処理プログラムを記録した記録媒体および信号処理装置
US20060277041A1 (en) * 2005-06-06 2006-12-07 Stig Stuns Sparse convolution of multiple vectors in a digital signal processor
US8014590B2 (en) * 2005-12-07 2011-09-06 Drvision Technologies Llc Method of directed pattern enhancement for flexible recognition
US7584396B1 (en) 2005-12-27 2009-09-01 At&T Corp. System and method for decoding a signal using compressed sensor measurements
US7450032B1 (en) 2005-12-27 2008-11-11 At & T Intellectual Property Ii, L.P. System and method for encoding a signal using compressed sensor measurements
US8606544B2 (en) * 2006-07-25 2013-12-10 Fisher-Rosemount Systems, Inc. Methods and systems for detecting deviation of a process variable from expected values
US8145358B2 (en) 2006-07-25 2012-03-27 Fisher-Rosemount Systems, Inc. Method and system for detecting abnormal operation of a level regulatory control loop
US20080107222A1 (en) * 2006-11-06 2008-05-08 L3 Communications Integrated Systems, L.P. System and method for signal phase correction
US7921350B2 (en) * 2007-03-05 2011-04-05 General Electric Company System and method for fault detection and localization in time series and spatial data
AU2010321603B2 (en) * 2009-11-23 2015-03-26 Advanced Micro Devices, Inc. Improved Orthogonal Frequency Division Multiplexing (OFDM)
US8694299B2 (en) * 2010-05-07 2014-04-08 Exxonmobil Upstream Research Company Artifact reduction in iterative inversion of geophysical data
WO2013040485A2 (en) * 2011-09-15 2013-03-21 University Of Washington Through Its Center For Commercialization Cough detecting methods and devices for detecting coughs
US9147265B2 (en) * 2012-06-04 2015-09-29 Raytheon Company System and method for rapid cluster analysis of hyperspectral images
US10296580B1 (en) 2015-09-18 2019-05-21 Amazon Technologies, Inc. Delivering parsed content items
US10127210B1 (en) 2015-09-25 2018-11-13 Amazon Technologies, Inc. Content rendering
US10601894B1 (en) 2015-09-28 2020-03-24 Amazon Technologies, Inc. Vector-based encoding for content rendering
US10241983B1 (en) * 2015-09-28 2019-03-26 Amazon Technologies, Inc. Vector-based encoding for content rendering
US10341345B1 (en) 2015-12-15 2019-07-02 Amazon Technologies, Inc. Network browser configuration
US10348797B1 (en) 2015-12-15 2019-07-09 Amazon Technologies, Inc. Network browser configuration
US10249305B2 (en) * 2016-05-19 2019-04-02 Microsoft Technology Licensing, Llc Permutation invariant training for talker-independent multi-talker speech separation
US10586153B2 (en) * 2016-06-16 2020-03-10 Qatar University Method and apparatus for performing motor-fault detection via convolutional neural networks
WO2017216647A1 (en) * 2016-06-17 2017-12-21 Tata Consultancy Services Limited Health monitoring and prognostics of a system
US10957337B2 (en) 2018-04-11 2021-03-23 Microsoft Technology Licensing, Llc Multi-microphone speech separation
US10785744B1 (en) * 2019-04-10 2020-09-22 Cisco Technology, Inc. Offloading location computation from cloud to access point (AP) with projection on base phase vectors
US11410048B2 (en) * 2019-05-17 2022-08-09 Honda Motor Co., Ltd. Systems and methods for anomalous event detection
WO2021071711A1 (en) * 2019-10-09 2021-04-15 The Uab Research Foundation Method for uncertainty estimation in deep neural networks
US20240037627A1 (en) * 2022-07-28 2024-02-01 Yahoo Ad Tech Llc Combining vectors output by multiple different mechanisms for content item retrieval

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9106082D0 (en) * 1991-03-22 1991-05-08 Secr Defence Dynamical system analyser
US5285480A (en) * 1991-09-03 1994-02-08 General Electric Company Adaptive MLSE-VA receiver for digital cellular radio
US5694474A (en) * 1995-09-18 1997-12-02 Interval Research Corporation Adaptive filter for signal processing and method therefor
US5872628A (en) * 1996-09-27 1999-02-16 The Regents Of The University Of California Noise pair velocity and range echo location system
US6700923B1 (en) * 1999-01-04 2004-03-02 Board Of Regents The University Of Texas System Adaptive multiple access interference suppression
GB2352907B (en) * 1999-07-30 2004-03-03 Sony Uk Ltd Method of processing signals and apparatus for signal processing

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101256552B (zh) * 2007-02-27 2010-06-23 北京大学 矢量信号处理方法及采用该方法的矢量信号处理系统
CN109155763A (zh) * 2016-05-11 2019-01-04 微软技术许可有限责任公司 数据流上的数字信号处理
CN107290579A (zh) * 2017-06-20 2017-10-24 安徽建筑大学 基于特征排序向量内积的单通道多电器叠加电流信号分离方法
CN109325589A (zh) * 2017-07-31 2019-02-12 华为技术有限公司 卷积计算方法及装置
CN109461095A (zh) * 2018-10-18 2019-03-12 深圳供电局有限公司 一种用于非侵入式负荷辨识的负荷事件检测的数据处理方法及设备
CN110543482A (zh) * 2019-08-29 2019-12-06 中国信息通信研究院 一种最大时间间隔误差计算方法及系统
CN110543482B (zh) * 2019-08-29 2022-04-26 中国信息通信研究院 一种最大时间间隔误差计算方法及系统

Also Published As

Publication number Publication date
US20030055610A1 (en) 2003-03-20
AU2001228692A1 (en) 2001-08-27
WO2001061526A2 (en) 2001-08-23
EP1256069A2 (en) 2002-11-13
WO2001061526A3 (en) 2002-04-25
GB0003571D0 (en) 2000-04-05
US6954721B2 (en) 2005-10-11
JP2003523577A (ja) 2003-08-05

Similar Documents

Publication Publication Date Title
CN1422407A (zh) 信号处理技术
CN111832353B (zh) 基于emd与ba优化svm的汽轮机转子故障诊断方法
JP5408128B2 (ja) 画像処理装置、画像処理方法、処理装置、およびプログラム
CN110543860B (zh) 基于tjm迁移学习的机械故障诊断方法及系统
CN109033719B (zh) 一种风力涡轮机轴承故障诊断方法
Huang et al. Acoustic signal analysis for detecting defects inside an arc magnet using a combination of variational mode decomposition and beetle antennae search
CN107811649B (zh) 一种基于深度卷积神经网络的心音多分类方法
CN108399434B (zh) 基于特征提取的高维时间序列数据的分析预测方法
CN110705456A (zh) 一种基于迁移学习的微型电机异常检测方法
Li et al. Non-parallel least squares support matrix machine for rolling bearing fault diagnosis
CN113239022B (zh) 医疗诊断缺失数据补全方法及补全装置、电子设备、介质
CN114169110B (zh) 基于特征优选和GWOA-XGBoost的电机轴承故障诊断方法
CN114662386A (zh) 一种轴承故障诊断方法及系统
US20240135145A1 (en) Generation of Realistic Data for Training Of Artificial Neural Networks
CN111626312A (zh) 基于快速多分离字典学习的风力机轴承故障诊断方法
Yu et al. A fault diagnosis approach for diesel engine valve train based on improved ITD and SDAG-RVM
CN116226646A (zh) 轴承健康状态及剩余寿命的预测方法、系统、设备及介质
Zhang et al. Feature-level consistency regularized Semi-supervised scheme with data augmentation for intelligent fault diagnosis under small samples
CN117725480A (zh) 一种避雷器故障智能检测方法及系统
Yeswanth et al. Iterative super resolution network (ISNR) for potato leaf disease detection
Shewale et al. Compiler optimization prediction with new self-improved optimization model
CN117609768A (zh) 一种基于改进鲸鱼算法的立式水泵机组故障诊断方法
CN114295967A (zh) 一种基于迁移神经网络的模拟电路故障诊断方法
CN116543229A (zh) 基于自适应累积系数的深度学习优化器的图像分类方法
CN116340812A (zh) 一种变压器局部放电故障模式识别方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication