CN1264507A - 用于盲目信号分离的方法与装置 - Google Patents

用于盲目信号分离的方法与装置 Download PDF

Info

Publication number
CN1264507A
CN1264507A CN98807317.XA CN98807317A CN1264507A CN 1264507 A CN1264507 A CN 1264507A CN 98807317 A CN98807317 A CN 98807317A CN 1264507 A CN1264507 A CN 1264507A
Authority
CN
China
Prior art keywords
signal
signals
output signals
group
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN98807317.XA
Other languages
English (en)
Inventor
盖姆兹·厄坦恩
法思·M·萨拉姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Clarity LLC
Original Assignee
Clarity LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Clarity LLC filed Critical Clarity LLC
Publication of CN1264507A publication Critical patent/CN1264507A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2134Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H21/00Adaptive networks
    • H03H21/0012Digital adaptive filters

Abstract

一组一般化的结构、框架、算法和装置,基于对其中已接收的、已测量的、已记录的或者已存储的诸信号或诸函数的处理结果,通过对一组已接收的诸混合物和诸函数进行处理,用以分离、鉴别和恢复诸原始信号源。为了从各种信号混合物中分离和恢复原始的信号内容,可以使用多种标准,它们可以单独使用,也可以跟其他标准结合使用。本发明的系统在一种变化着的干扰环境中,在对诸原始信号几乎不作出假设的前提下,能够对混合在一起的若干未知信号进行盲目分离与恢复。本发明的系统在非多路复用的介质共享、自适应干扰抑制、各种声学传感器、各种声学诊断、各种医学诊断和仪器设备、语音、声音、语言识别和处理、有线的和无线的已调制通信信号接收机,以及各种蜂窝通信等方面,都有实际的应用。

Description

用于盲目信号分离的方法与装置
本申请是由Gamze Erten和Fathi M.Salam发明的、于1997年6月18日申请的题为《用于实时自适应信号分离、鉴别和恢复的体系结构、框架与装置》的顺序号为No.60/050,147的美国临时专利申请的继续申请。
本发明涉及通过处理一组混合信号的多个测量结果来恢复原始信号信息或内容的方法与装置。更具体地说,本发明涉及用于从已接收的它们的混合物的测量结果中恢复若干原始信号的各种自适应系统。
诸独立(信号)源的恢复与分离是一个古典的又是困难的信号处理问题。在许多实际情况下,诸信号源以及混合介质的有关诸特性为未知,这个事实使这个问题复杂化。
以下的问题陈述对于最好地理解这个问题是有帮助的:参看附图中的图1,考虑N个独立信号102,S1(t),...,以及SN(t)。各独立信号102可以代表独立的诸讲者或各种语音、各种声音、音乐、基于射频或基于光的无线传输、各种电子的或光的通信信号、各种静止图像、各种视频等信号其中任何一种或它们的组合。各独立信号102在它们于其中传播的介质或环境104中,借助于自然的或人工合成的混合,可能发生延时或互相重叠。信号分离过程106将各独立信号102的混合物转换为各输出信号108,U1(t),...,以及UN(t)。
在各独立信号源的恢复与分离中,通常使用的方法有两大类:神经激励自适应算法以及常规的离散信号处理。
神经激励自适应结构和算法的发展跟随在由J.Herault和C.Jutten最初提出的、现在被称为Herault-Jutten(或RJ)算法的一种方法之后。这一组方法适于CMOS集成已经得到承认。然而,标准的HJ算法只有使用所建议的、已经被表明主要地在特定环境中工作的自适应规律,才处于最佳的探索式的状态下。前人关于HJ算法所进行的工作仍然不足以支持或保证在实验仿真中的成功。Herault和Jutten认识到这些分析上的缺陷,并且他们说明了待解决的附加问题。他们所提出的算法假设一种线性的介质和滤波或者没有延时。特别是,假设各原始信号是经由一个未知的但是常系数的矩阵的介质来传输的。归结起来,Herault-Jutten方法(i)被限制于满秩以及线性静态混合环境之中,(ii)需要进行矩阵求逆运算,以及(iii)没有考虑信号延时的存在。然而,在许多实际应用中,将出现滤波和各种相对延时。相应地,在许多实际情况下以及真实世界应用中,这些方法不能成功地分离各种信号。
各种常规的用于信号分离的信号处理方案大多数起源于在传统的数字信号处理方法的精神指导下的离散域中并且使用诸信号的统计特性。这样的信号分离方法使用的计算过程大多数涉及离散信号变换以及滤波器/变换函数倒置。采取一组累积量形式的诸信号的统计特性被用来获取诸混合信号的分离,在这里,这些累积量从数学上被强迫趋于零。这就构成了寻求恢复与互相分离诸信号的传递函数的诸算法族的难题。另一方面,计算所有可能的累积量将是不实际的,并且由于过多地占用时间而无法进行实时处理。
这两种方法的诸特性阐述如下。
用于信号分离的神经激励体系结构和算法
用于信号分离的这些神经激励自适应方案的集合假设“统计上独立”的信号矢量S(t)=[S1(t),...,以及SN(t)]T被混合以产生信号矢量M(t)。矢量M(t)被诸传感器(例如传声器,天线,等等)所接收。
用一般(静态或动态)运算符τ来表示混合环境。则:
M(t)=τ(S(t))                      方程式(1)
可以用几种公式表示法来倒置混合过程,即,在一种“盲目”方式下的运算符τ,在这里,不存在关于混合运算符τ或者诸原始信号源S(t)的特性或内容的先验知识。我们将这些分为两类,静态和动态。关于所使用的自适应标准,例如,高阶累积量的信息最大化和最小化,等等,还可以作出附加的区分。
静态情形。静态情形被限制于通过一个常数非单一矩阵来进行混合。让我们假设“统计上独立”的信号矢量S(t)=[S1(t),...,SN(t)]T被混合以产生信号矢量M(t)。特别是,用一个常数矩阵A来代表混合运算符τ,即
M(t)=AS(t)                              方程式(2)
图2A和2B表示在通过一个混合矩阵A来进行静态混合的情况下,信号分离与恢复网络的两种结构。U(t)为输出,它近似等于诸原始源信号S(t)。Y(t)含有被用来更新非混合过程的诸参数的诸数值,即图2A中的W以及图2B中的D。在图2A中的结构需要计算常数混合矩阵A的逆矩阵,它要求A是可求逆的,即A-1存在。在图2B中的结构并不限制在收敛时,矩阵D的离开对角线的诸元素必须等于矩阵A的离开对角线的诸元素。然而,在这种情况下,限定矩阵A的对角线元素等于“1.0”。即使混合矩阵是不可求逆的,但是通过将D的对角线元素设置为零,人们还是可以从实质上总结出混合过程是可求逆的。如图2A和2B所示,利用输出U(t)的一个函数来进行加权更新。这两个矩阵的各行的更新由用于信号分离、鉴别或恢复(例如高阶累积量的信息最大化、最小化等)的标准来加以定义。
作为一个例子,针对下列情况
U(t)=WM(t)                               方程式(3)的一种可能的加权更新规则是
Figure A9880731700101
式中η为足够地小,g为奇函数,并且M为混合物的集合,U为诸输出的集合,它对诸源信号作出估计。上角标T表示转置,以及-T表示逆转置。要注意的是,函数g在更新过程中起到一个附带的作用,若跟上图联系起来,则有
Y(t)=g(U(t))                  方程式(5)
人们使用方程式(4)去更新在方程式(3)中矩阵W的各行。这是一个叠代的更新过程,W的各行收敛,因此乘积WA差不多等于全同矩阵或者全同矩阵的一个排列。
另一方面,在图2B中,针对矩阵D的各行dij的一个可能有用的规则一般地被描述为
dij=ηf(ui(t))g(uj(t))      方程式(6)
式中,η为足够地小,实际上某些对f有用的函数包括一个三次函数,而对g有用的函数则包括一个双曲正切函数。当使用这个步骤时,人们可以在每一个连续的步骤和采样点上,用计算方法从方程式(7)中解出U(t)
U(t)=[I+D]-1M(t)                方程式(7)
此项计算可能是一个沉重的负担,特别是对高维数的矩阵D来说,情况更是这样。
动态情况。动态混合模型说明更加真实的混合环境,定义这样的环境模型,并且开发一种更新规律,以便在这个框架内恢复诸原始信号。
在动态情况下,矩阵A不再是一个常数矩阵。参照静态实例中的反馈结构,将方程式(7)U(t)=[I+D]-1M(t)
看作快速动态方程式的一个方程式
Figure A9880731700111
通过从一种随意的猜测对方程式(8)中的微分方程式进行初始化将为计算提供方便。无论如何,重要的是保证在方程式(8)以及像由方程式(6)所定义的一种更新步骤之间的时间坐标的分离。通过令方程式(6)中的η和方程式(8)中的τ充分地小,就能保证这一点。
若我们假设M(t)的维数为N,则一组用以定义动态信号分离算法的微分方程式可以被写成i=1,...,N
这里列出了N个微分方程式。此外,可以用多种标准,例如,对在方程式(6)中的函数f和g进行评估,来定义针对矩阵D的各行的自适应过程。图3是在反馈结构中的动态模型的一种图解。U(t)近似于S(t)。函数g定义用于该反馈网络的加权更新的标准。
将信号分离标准应用于诸参数的自适应。在迄今为止所定义的各种结构中,关于自适应标准的应用的诸步骤还论述得很少。已经特别提到两个隐含的步骤:
第1个是将信号分离诸函数、自适应诸步骤和标准应用到任意的诸数据点-不管这些点中的每一个在实际上和物理上是不是可访问的。因此,自适应分离步骤将自适应诸函数和标准个别地和瞬时地施加到已测量的混合信号中的每一个元素,随后进行适当的参数更新。
在图2A中所描述的第2类型的步骤使用方程式(3)。在这种情况下,该标准被应用于整个数据集,或者从整个数据集中选出的诸数据点。因此,不是逐个样本地进行有关的自适应过程,而是利用整个数据集,并且假设在其上应用一个常数的、静态混合矩阵。虽然这个方法跟第1个相比显得更稳健一些,但它实质上是一种不适用于实时信号分离的离线方法。而且,当关于一个静态常数矩阵的假设为不正确时,非混合过程的精度将受到影响。
基于传递函数的信号分离方案
用传递函数来表示信号混合与分离使得这个方案成为一种动态环境模型和方法。
在图4A和4B中,图解了通过对两个混合物的测量结果进行处理来分离两组信号的一种结构。图4A和4B表示在一个两信号系统中,针对信号混合与分离的一种常规的传递函数表示方法。两组信号U1和U2近似于S1和S2。G将以H为模型的混合过程加以倒置。在高于二维的各高维信号的情况下,这样一种传递函数方案是既不实际也不可扩展的。而且,将混合环境扩展到传递函数域也已经消除了诸信号的时域性质。这也导致从方程组中对各项初始条件的排除。
在传递函数域中用于诸分离功能的这些结构导致3种严重的不足,它们全都对一种实际的方法与装置的设计与实施产生障碍。首先,如同所表达的那样,这种公式表示方法妨碍将这种分离步骤普遍推广到二维以上的高维场合。换句话说,当存在两种以上的混合物和两个以上的源时,该分离方法的一种实际的正式化并不存在。通过直接参照于当前的诸方法,即,矩阵的各乘法项被这样写出,使得每一个标量方程对希望等于零的所得到的乘积矩阵中的一行给出定义。由于也允许对一个对角线矩阵进行排列,所以就产生了多个方程式。对一个两种混合物的问题来说,其结果是两对(总共4个)方程式,其中的每一个都具有两个乘积项。离开这个条件,方程式的数目就会增加。为了使需要描述的方程式的数目趋于精确,对于N维实例的一个特定的排列来说,方程式的数目等于(N2-N)。对于二维问题来说,这个数值为2。
其次,针对传递函数的倒置步骤是特定的,并且不存在诀窍或教导。维数的影响在这里起着决定性的作用。从本方法可以清楚地看出所得到的结构使得诸网络需要这样的传递分量,后者的阶次依赖于混合环境的各传递分量的乘积。因此,人们不可能设计一种具有一个固定阶次的网络结构。
第三,由于这种公式表示方法并不处于时域之中,并且不能用任意的初始条件来进行初始化,所以诸初始条件不能被定义。因此,这种方法不适用于实时的或在线的信号分离。
需要的是一种通过介质或信道来分离诸混合信号的方法,在其中可以获得高质量的信号分离。需要的是一种对通过各种介质进行传输的诸混合信号进行恢复与分离的方法,在其中,诸信号的分离达到如此高的质量,从而实质上增加了(i)该介质或信道的信号传输容量。(ii)接收信号的质量,或(iii)以上二者。介质或诸信道可以包括导线、电缆、光纤、基于无线电或光的诸频率或诸频段的一种组合,还可以包括固体、液体、气体质点或真空的一种组合。
本发明旨在实现一个信号处理系统,用于将多组输入信号分离为多组输出信号。诸输入信号由已经受到一种介质影响的多组源信号的一个混合物组成。诸源信号与多个源相关。诸输出信号对诸源信号作出估计。本系统包括多个传感器,用以检出诸输入信号,以及一个存储装置,用以接收和存储诸输入信号。本系统还包括一个结构处理器,用以定义和计算一个信号分离结构,在这里,信号分离结构定义一种介于诸输入信号和诸输出信号之间的关系,并且这种关系具有恒定的诸参数以及时变的诸参数这两种情形。本系统还包括一个更新处理器,用以为每一个时变参数计算一个变化率,并且响应于跟每一个时变参数相关的变化率,计算诸时变参数。还包括一个输出处理器,它根据信号分离结构、恒定的诸参数以及时变的诸参数,来计算诸输出信号。
图1表示信号分离、鉴别和恢复问题的一种图形描述。
图2A和2B表示用于信号分离的两种静态神经网络结构。
图3表示在反馈动态混合和分离诸模型的情况下,信号分离与恢复网络的一种结构。
图4A和4B表示对一个双信号系统进行信号混合与分离的一种常规的传递函数表示和方法。
图5A表示本发明的一种方法的一份处理流程图。
图5B表示用于信号混合与分离的一种常规的传递函数频域表示方法。
图6A和6B表示针对状态空间时域结构的两种混合模型。
图7A和7B表示针对状态空间时域结构的两种信号分离模型。
图8表示一种典型的数字信号处理(DSP)实施结构。
图9表示一种典型的DSP内部结构。
图10表示多线程自适应处理过程。
图11表示基于一种先进先出(FIFO)堆栈结构和数据采集过程的一个恒定宽度长堆栈的一个实施例。
图12表示基于一种先进先出(FIFO)堆栈结构的一个恒定宽度长堆栈的另一个实施例。
图13A和13B表示使用来自一个长堆栈的诸数据点(短堆栈)的一个集合的分离标准的一种应用,上述长堆栈含有在一个时间窗口上已测量或已计算的诸数据点的所有有关的集合。
图14表示一种根据本发明的信号分离和恢复方法的音频应用。
图15表示基于DSP的手持式装置的3种音频输入接口,上述接口可以被嵌入到话筒-DSP接口之中。
图16表示适用本发明的一种音频装置的一份概略图。
图17表示一种智能话筒阵列装置。
图5A表示本发明的一种方法的一份处理流程图。它包括:(1)获取诸样本(方框502);(2)内插或提高采样率(方框504);(3)选择样本集合(方框506);(4)计算自适应诸参数(方框508);(5)计算内部诸状态(方框510);(6)计算诸输出(方框512);(7)存储和/或显示诸输出(方框514)。
获取诸样本包括获取通过多个传感器(例如诸话筒)所记录的多通道数据。这样的数据还可以来自先前已混合的诸声迹,例如录音演播室的已混合的诸信号。可以用联机(在线)方式来对数据进行采样,以便用于实时处理,或者从一种存储介质(如磁带、硬盘驱动器等)中调用数据。
对可能需要进行过采样的诸算法实行内插。若对信号进行过采样(例如已经预录音的诸声迹)是不可能的或不实际的,则人们可以在各采样点之间进行内插,以便在相同的信号持续时间内提供更多的数据点。可以根据所获得的数据的采样率以及目标输入采样率来提高采样率。例如,为了从10kHz的采样数据中生成60kHz的数据,则该采样率提高因子为6。换句话说,在可得到的每一个(译者注:应为每两个)采样点之间,产生了5个(数据)点。
选择样本集合涉及选择在该处理过程的每一次迭代中所使用的诸数据点。
计算自适应的诸参数可能涉及一种方法,它使用一个函数的诸导数来计算该函数的数值(在这种情况下该函数就是自适应的诸参数)。这些方法中的大多数被称为解微分方程式的积分方法,例如龙格-库塔法。
计算诸内部状态涉及注视其体系结构。这些内部状态还可以采取实际状态以及这些状态的诸导数的形式,或者采取样本的时间序列的形式。使用解微分方程式的各种类型的积分方法,例如龙格-库塔法,就能从它们的诸导数计算出诸状态数值。
使用先前计算的诸状态和诸参数来计算诸输出。
在对本发明的各种结构进行分类时,可以作出一种区分。这跟混合与分离过程模型有关,并且根据应用环境以及诸被测信号的性质来规定分离、鉴别或恢复的步骤。这种区分设置关于混合和分离模型的数学方程式和原理,并将其应用于混合与分离诸过程之中。
存在3种结构与方法的集合,它们可以被详细列举如下:
1.基于传递函数的频域结构与方法。
2.状态空间时域结构与方法。
3.映射结构与方法。
基于传递函数的频域信号分离结构与方法
图5B表示用于信号混合与分离的一种常规的传递函数频域表示方法。U(s)和S(s)为多维信号,并且U(s)逼近S(s)。H(s)倒置以 H(S)为模型的混合过程。这种倒置的计算可能涉及构筑常规的信号滤波器、最大化或最小化函数,或者基于最佳控制理论以及变分法的标准。
为了将介于已测量的混合信号M(t)以及原始的信号源S(t)之间的关系表示为一个传递函数,人们应当假定该信号处于线性时不变环境之中。这是由于人们仅能用一个传递函数来表示各种线性时不变关系。因此,用一个传递函数来作为信号分离问题的公式表示,当包括各种动态和滤波效应时,也假定是处于时不变(静止)的环境下。
然而,对精确定义的带宽受限的诸信号来说,这种公式表示有着多种应用场合,对这些应用场合来说,也可以作出若干这样的假设。
介于源信号S(t)的拉普拉斯变换,即S(s)以及被测量的混合信号M(t)的拉普拉斯变换,即M(s)之间的关系由下式定义:
Figure A9880731700161
本发明的目标是,在不知道实际的 H(S)的条件下,获得作为 H(S)的逆的H(s),并由此重构各原始信号。
针对两个信号来执行这个过程,即,S和M的维数均为2,是可能的,因为乘积
Figure A9880731700171
Figure A9880731700172
对于这种二维的情形来说,需要满足的诸方程组是容易求解的。在将此种结构推广到两个以上的信号时,下列方程式成立:
H(s) H(s)=T(s)                          方程式(13)
式中,T(s)为对角线形式。若令T(s)等同于全同矩阵,在上述矩阵中所有对角线行均等于1.0,则
H(s)= H(s)-1          方程式(14)并且因此式中adj( H(S))是一个矩阵,其第(i,j)行作为第(j,i)个余因子被计算,依此类推,第(j,i)个余因子就是将 H(S)取消第j行和第i列所形成的矩阵的行列式乘以(-1)j+1,由此可进一步定义
ΔH(s)=adj( H(s))              方程式(16)
因此,一个针对较高维数的一般化结构作为由方程式(16)所定义的一个网络出现。要注意的是,在这种情况下,有:
H(s) H(s)=det( H(s))I     方程式(17)
传递函数H(s)的诸元素hij(s)的实际公式表达取决于混合介质的各种特性以及各原始信号源或它们的各种成分的行为与相互作用。
分离滤波器H(s)的诸元素的构建过程要求乘积 H(S)是一个全同矩阵或者是它的一个排列,或者不这样的话也可以是如方程式(17)所示的一个对角线矩阵。若离开了二维的情况,则这个逆矩阵的计算就变得很繁琐。每一组信号的添加都产生一个实质上的计算负担。然而,若有人知道诸信号以及混合介质的特性,则从理论上来说,就可以遵循这个步骤。
利用这种用于信号分离、鉴别和恢复的结构的一个示例步骤可以归结为:
1.构建和分配一个存储器结构,它被用于存储诸测量结果,以及从诸测量结果的处理中所获得的诸数据结果。
2.构建一个传递函数N×N元素矩阵作为H(s)传递函数(混合传递函数的逆),它的各行都是数量传递函数。
3.接收诸测量结果或诸混合信号的一个新的集合。
4.对诸测量结果的新的集合进行处理。
5.对信号分离标准和各项功能进行评估。
6.相应地更新滤波器以及传递函数元素的诸参数。
7.积累用于修改传递函数诸参数或诸定义的证据。
8.对诸测量结果的新的集合进行处理,以便对各原始信号(在混合之前)作出估计,必要时存储这些处理的诸结果。
9.对成功的分离以及鉴别的诸指标作出估计。
10.若存储器分配为不充分或不适当,则转到步骤1。
11.若滤波器公式的修改是适当的则继续,否则转到步骤2。
12.转到步骤3。
人们可以将传递函数转换为一种状态空间表示,从中可得到的附加的好处是将初始条件的影响纳入其中。当人们在一般意义上来考虑混合环境模型(例如,混合传递函数的实际特性可能随时间而变化)时,这种纳入变得特别重要。在下一节中将说明本发明的这种特定的方法。
状态空间时域结构与方法
图6A和6B表示用于状态空间时域结构的两种混合模型。图6A表示一个总的框架。图6B表示A和B为固定的这样一种特例,以及它与常规信号处理的关系。这两种模型应用于信号分离结构的多种类型之中。
图7A和7B表示用于状态空间时域结构的两种信号分离模型。图7A表示一个一般的模型和结构。图7B表示一个特例,在所示出的诸模型中,只有这种模型没有如在图6A中所示的用以描述参数更新诸步骤的诸箭头。
本发明的结构将混合与分离的诸环境建立为一个线性动态系统的模型。这样一来,混合环境的诸参数被表示为如图6A所示的实现方法δ=(A,B,C,D);反过来, δ=( A, B, C, D)则是如图7所示的分离环境的实现方法。这些参数支配着用于混合和分离的诸环境的动态变化。当实现方法 δ为准恒定并且作为混合环境的行为模型时,实现方法δ有待于由分离过程来给出定义。
针对状态空间时域结构的混合模型可应用于多种类型的分离结构。该模型是下列数学方程式的一种结构描述:
x= A x+ Bs                             方程式(18)
m= C x+ Ds                             方程式(19)
另一方面,如图7A所示,状态空间时域信号分离结构可以从数学上被描述为
Figure A9880731700201
u=Cx+Dm                             方程式(21)
这种结构定义了为了在信号分离、鉴别和恢复过程中利用这种数学结构所需的步骤。这要求以这样一种方式来定义
用于信号分离、鉴别和恢复诸算法的一个步骤或一组步骤,使得当这些步骤被实践时,必要的诸参数收敛于某些稳定的或准稳定的解,分离与鉴别过程的诸输出是原始的诸信号源S(t)的诸复制品或者充分相似的诸拷贝。
本发明的这种结构的方法是:
1.能处理多个,即,多于两个混合物
2.能直接地包括各种初始条件的影响
3.通过假设诸矩阵(A,B,C,D)和( A, B, C, D)都
  是时间的函数,使得本方法可以推广应用到包括时
  变的条件在内
4.例如,对于混合来说,允许纳入各种一般的非线性
  模型
x= Γ( x,s,P1)                           方程式(22)
m= Ф( x,s,P2)                           方程式(23)
并且,对于分离来说
Figure A9880731700211
u=Φ(x,m,W2)                           方程式(25)
5.通过假设在诸方程式22-25中的诸运算符Γ, Γ,Φ, Φ均为时间的诸函数,使得本方法可以推广应用于包括非线性和时变的诸模型在内。
在线性的情况下,可以将介于( A, B, C, D)和(A,B,C,D)之间的倒置关系表示为下列形式:
由方程式(19)
s=- D-1 C x+ D-1m            方程式(26)
因此,参照方程式(21),给出诸源信号s的估计为u,
 Δ
C=- D-1 C                  方程式(27)
以及
 Δ
D=- D-1                   方程式(28)
类似地,将s= D-1+ C x+ D-1m代入方程式(18),可以表示为
 Δ
A= A- B D-1 C                                   方程式(29)
以及
 Δ
B= B D-1                                      方程式(30)
若 D不是一个方形矩阵,并且因此不是可求逆的,例如在所获得的诸测量结构或诸混合物多于诸源的情况下,人们可以执行一个使用伪求逆[ DT D]-1的一般化步骤,假设[ DT D],它是一个方形矩阵,事实上是可求逆的。
在这种方式下,人们需要用适当的更新规则去重建该网络,使得网络诸参数变为方程式(26-30)的下列的变通形式:
s=-[ DT D]-1DT Cx+[ DT D]-1DTm                   方程式(31)
 Δ
C=-[ DT D]DT C                                 方程式(32)
 Δ
D=-[ DT D]DT                                  方程式(33)
 Δ
A= A- B[ DT D]-1 DT C                             方程式(34)
 Δ
B= B[ DT D]-1 DT                                方程式(35)
通过多种适当的计算技术以及应用程序,包括在本发明的实践中所赋予的多种软件和硬件诸部件,来为诸参数A,B,C和D求解,以便精确地或近似地得到它们的诸解。输入到这样一种应用程序的是通过多个检出器所接收的诸混合物的一个适当的集合,其中每一个检出器都从多个源那里接收诸信号。在用本发明的实践处理输入信号之后,来自计算装置的输出是已分离的诸信号的一个集合,包括已恢复的诸源信号,后者无干扰地精密地对诸源信号作出估计。
使用若干族信息最大化标准,多种优化函数以及各种数值求解方法,可以使用连续的(如在模拟电子学中)以及离散的时间(如在数字计算中)作为近似解,通过对诸混合物的一个给定的集合的诸优化函数的选定集合进行计算,使得信号分离问题得以解决。
利用这种用于信号分离、鉴别和恢复的结构的一个步骤可以归纳如下:
1.构建和分配一个存储器结构,它被用于存储诸测量结果,以及从所述诸测量结果的处理中所获得的诸数据结果,并设置测量数据采集或各种采样率。
2.构建具有适当维数的4个矩阵A,B,C和D。
3.接收诸测量结果或诸已混合信号的一个新的集合。
4.通过进行信号调理、存储以及相关的诸步骤,对正在到来的诸混合信号和诸测量结果进行处理。
5.对各种信号分离标准和功能进行评估。
6.相应地更新这4个矩阵的诸元素,或者它们的一个子集。
7.积累用于修改矩阵维数、收敛速率、时间常数以及其他诸参数或诸定义的证据。
8.对诸测量结果的新的集合进行处理,以便对各原始信号(在混合之前)作出估计,并且在必要时存储这些处理的诸结果。
9.对成功的分离以及鉴别的诸指标作出估计。
10.若存储器分配或数据测量结果的采样率为不充分或不适当,则转到步骤1。
11.若滤波器公式的修改是适当的则继续,否则转到步骤2。
12.转到步骤3。
特例。可以设计一个特例,在其中,混合与分离模型的正规形式从方程式(18-21)所表达的正规形式被修改,因此A, A,B, B被固定。在图6B和7B中,用图解方式来表示这个特例。
在常规的信号处理和相关技术中,就混合模型而言,这个特例产生让混合矩阵 C在其上进行运算的(诸)源信号的一组已滤波的和/或已延时的样式。这种运算的结果被添加到 Ds运算的运算结果之中。因此,方程式(10)可以改写为
M(s)= H(s)S(s)= C(sI-A)-1 BS(s)B+ DS(s)       方程式(36)
类似地,就分离模型和结构而言,这个特例产生让矩阵C在其上进行运算的混合物m的一组已滤波的和/或已延时的样式。这个运算结果跟对m进行D运算的结果相加,以便获得已分离的诸信号u。
U(s)=H(s)M(s)=[C(sI-A)-1B+D]M(s)          方程式(37)
本特例明确地建立了各种状态空间时域结构与各种传递函数模型之间的等同关系。利用正规结构形式的步骤也十分相似;但要强调以下的差别:
1.在步骤2,A和B可以是固定的。
2.在步骤6,只有两个矩阵C和D需要进行更新。
  映射结构和方法
映射结构和方法是用以为上述诸结构与诸方法的物理实现与实施提供方便的一个可供选择的实施例,特别是通过硬件加速仿真或者一个数字信号处理器装置。为了达到这个目标,通过简单地用时间样本来取代对时间的诸导数,就能以离散时间形式来观察以上的各模型,即,
Figure A9880731700251
式中,z可以是在上式中的x或 x。下面列出用以实施映射结构与方法的完整步骤:
用时域关系来表示混合环境:
Figure A9880731700252
式中,(k)表示在连续时间实例中的k阶导数,k表示在离散时间实例中的延时样本数。跟以前一样,s(t)为源,m(t)为混合物,并且u(t)为已分离的诸输出信号。
信号分离网络将由下式来定义
Figure A9880731700253
式中,矩阵C和D的维数是n×m,并且A的维数是n×n。一般地,L’≥L,并且N’≥N,但是也可以考虑L’<L和N’<N的情况。因此,实现方法现在可以表示为:
u(t)=WΦ                                  方程式(40)
式中
W=[DC1...CL;-A1...-AN′]                 方程式(41)
以及
Figure A9880731700254
要注意的是,W不一定是一个方形矩阵,即,W的维数是
n×[L’m+N’n ]。
映射模型对应于在信号处理中的无限冲击响应(IIR)模型。而且,通过消除与输出信号矢量u(t)的诸导数有关的各项,就能获得有限冲击响应(FIR)诸模型的特例。
物理实现与实施
软件仿真。基于传递函数频域结构、状态空间时域结构以及映射结构的各种结构表示方法都可以容易地被转换为一段计算机程序。例如以上的步骤可以用一种计算机可解析的语言进行编码,并且所得到的计算机指令的集合可以在一个兼容的计算平台上被执行。因此,软件仿真是处于本发明的诸实施选项之中,并且涉及以这样一种方式、使用一种特定的语言对算法进行编码,使得它有可能在一个特定的处理器中自动地执行。高级语言,例如FORTRAN和C/C++,都支持处理器专用的和一般的编译程序,使得代码变为可移植的。某些这样的代码可以跟其他各种函数捆绑在一起,并且嵌入到一个现成的平台或者纳入到处理器的主程序存储器之中。另一方面,一些比较新的语言,例如JAVA,是与平台无关的,因此,该算法可以被编码,以便在一个网络环境中的多种平台上运行。
硬件加速仿真。诸步骤也可以从一种高级语言(例如C/C++,FORTRAN,等等)被编码或转换到一种特定的信号处理器件,或者通过将该步骤嵌入到处于一个信号处理器里面或外面的一个特定的设备程序或存储器件之中。这就构成了上述结构的硬件加速实施。硬件加速仿真实施可以快到能够实现实时在线信号分离、鉴别和恢复。可以用于这种用途的各种器件包括但不局限于:具有高功能的各种数字信号处理器(DSP)、各种微处理器、各种专用集成电路(ASIC)、各种可编程器件,后者包括但不局限于:各种现场可编程门阵列(FPGA)、各种可重构器件、各种在系统中的可编程器件、可编程逻辑阵列(PLA),或者具有能进行快速乘法与加法运算并提供灵活的高精度的事先指定的或定制的处理器核心的其他定制的已建立的或已编程的自动结构。
图8表示一种可能的数字信号处理(DSP)实施结构800。DSP 800包括一个或多个A/D(模拟到数字)转换器802,它被连接到一个数据堆栈804。数据堆栈804被连接到一个DSP器件806,它依次访问一个存储器件808以及D/A(数字到模拟)转换器810。DSP器件806的内部可以包括如下所示的多种功能单元。根据应用的性质、混合物的数目、所期望的精度等因素,采用不同的配置是可能的。
图9表示一种典型的DSP器件806的方框图描述。可以很方便地将信号分离过程作为一部分集成到其他步骤中去,这些步骤已经被纳入,用以进行该器件所特有的其他信号处理功能。A/D转换器802以及D/A转换器810可以被集成到这种结构中去,以实现单片的解决方案。DSP器件806可以包括一个存储器件902、一个乘法累加器(MAC)904,一个算术逻辑单元(ALU)906,诸累加器908、诸移位寄存器910、诸内部累加器912,以及诸地址单元和诸寄存器914。存储器件902可以包括一个存放程序的ROM以及一个存放数据/程序的RAM。MAC 904可以包括一个或多个乘法器和加法器。算术逻辑单元(ALU)可以包括一个或多个加法器、逻辑运算器,以及比较器。诸累加器908可以包括各种TEST电路、各串行口、诸定时器、诸等待状态发生器、诸时钟发生器、一个主机口、一个主机接口、诸堆栈,以及诸辅助寄存器。
一个典型的步骤如下:到来的诸信号被转换为电信号,并且这些混合物被数字化和存储。然后实行本发明的诸步骤、诸算法和诸结构,以便进行具体的各源信号的分离、鉴别和恢复。已描述过的一个或多个单元,例如各种DSP和/或具有多种功能单元的各种DSP都可以被用来实行这种用于各种实时运算的过程。诸DSP单元可以被编程,以便实行为求解与算法有关的诸方程式所需的诸步骤。通过将高级语言进行编译,以便将该步骤转换为DSP器件能解码和执行的汇编或机器语言,就能获得这样的程序。通过优化用于DSP各功能单元的步骤,定制手工编写的机器或汇编语言代码就能进一步地加速算法的执行。
随后,形成诸源信号的近似值的来自这些过程的诸输出可以被存储、转换为模拟的诸数值,和/或作进一步的处理。进一步处理的例子包括信号调理、分类、识别、解调,以及用于信号处理的其他各种运算。
用以处理过分确定(诸混合物的数目多于诸源的数目)、确定不足(诸混合物的数目少于诸源的数目)、变动(诸源和诸混合物的数目发生变动)或未知(诸混合物和/或诸源的数目为未知)的诸附加步骤已经以流程图的形式列出。而且,附加的差错校验、数据完整性,以及数据辨识方案可以丰富本方案的可能性、应用领域、鲁棒性和可靠性。
这些步骤可以容易地被编程,以便装入到DSP里面,或者装入到已经嵌入了所需的信号分类、鉴别和恢复诸功能的器件之中。
用于参数自适应的各种函数和标准
可以采用若干种自适应技术,以便获得本发明的各种结构和方法的诸参数。
神经激励静态结构。如方程式(3)和图2所描述的那样,在一种神经激励静态结构的情况下,信号分离要求计算一个加权矩阵W。为此,我们首先引入外部乘积矩阵Q
Q=f(u)g(u)T                          方程式(43)
式中,f和g是两个适当的奇函数,它们可以或不可以相关,并且u为用以估计诸输入源信号s的诸输出信号的集合。由于u是时间的函数,所以这个矩阵也是时间的函数。还可以在函数f和g中建立进一步的时间依赖关系。
通过对从数学上描述W的导数,即
Figure A9880731700281
,的微分方程式之一进行积分,就能根据在产生矩阵W的方程式(43)中的Q,考虑将自适应步骤分为几类。作为例子,在离散时间数字实施方案中,可以通过欧拉近似法来计算W,欧拉近似法建立了W和
Figure A9880731700291
之间的数值上的联系:
式中,
Figure A9880731700293
为W对时间的导数在时间t的数值,h为介于两个相继的W数值,即Wt+1和Wt之间的时间步长。
下面列出针对W的9种加权更新规则:
Figure A9880731700294
Figure A9880731700295
Figure A9880731700296
W=η(diag(Q)-Q)                             方程式(48)
Figure A9880731700298
Figure A9880731700299
Figure A98807317002910
Figure A98807317002911
式中,α是一个正数。在方程式(45-53)中,η为自适应速率,在这里η是一个在进行过程中可以改变的数目。上角标(-T)表示逆转置,diag(Q)是一个对角线矩阵,其中除对角线元素以外的各元素均等于零,并且diag(Q)的各对角线元素等于Q的对应元素。 diag(Q)为diag(Q)的时间平均值。
状态空间结构。如方程式(20-21)所描述的那样,在状态空间时域结构的情况下,信号分离要求计算诸矩阵A,B,C和D。为此,我们首先引入两个外部乘积矩阵K和L
K=f(u)g(x)T                            方程式(54)
L=f(u)g(u)T                            方程式(55)
式中,f和g是两个适当的奇函数,它们可以或不可以相关,并且u为用以估计诸输入源信号s的诸输出信号的集合。m为所接收的诸混合物的集合,并且x为诸内部状态的集合。这些矩阵u、m都是时间的诸函数,并且x也是时间的诸函数。还可以在函数f和g中建立进一步的时间依赖关系。
假设,如同在状态空间时域表示法中所给出的那样,即,矩阵A和B是固定的,根据在产生矩阵C和D的方程式(51-52)中的K和L,就能考虑将诸自适应步骤分为几类。如同前面对W所作的处理那样,通过对从数学上描述C和D的诸导数的诸微分方程式之一进行积分,就能得到C和D。在方程式(44)中给出了一个例子。
下面列出针对C的9种加权更新规则:
=η(γI-K)     方程式(56)
=η(γI-K)C    方程式(57)
=η(γI-K)C-T                  方程式(58)
=η(γdiag(K)-K)               方程式(59)
=η(γdiag(K)-K)C              方程式(60)
=η(γdiag(K)-K)C-T            方程式(61)
=η(γ diag(K)-K)               方程式(62)
=η(γ diag(K)-K)C              方程式(63)
=η(γ diag(K)-K)C-T            方程式(64)
式中γ≥0,并且 diag(K)为diag(K)的时间平均值,通过对diag(K)矩阵的一个或多个样本进行平均运算就能得出。
在方程式(56-64)中,η为自适应速率,在这里η是一个在进行过程中可以改变的数目。上角标(-T)表示逆转置,diag(K)是一个对角线矩阵,其中除对角线元素以外的所有各元素均等于零,并且diag(K)的各对角线元素等于K的对应元素。在方程式(54)中对K作了描述。
相应地,下面列出针对D的9种加权更新规则:
Figure A9880731700312
Figure A9880731700313
Figure A9880731700321
Figure A9880731700322
Figure A9880731700323
Figure A9880731700324
Figure A9880731700325
Figure A9880731700326
式中,α>0,并且 diag(L)为diag(L)的时间平均值,通过对diag(L)矩阵的一个或多个样本进行平均运算就能得出。
在方程式(65-73)中,η为自适应速率,在这里η是一个在进行过程中可以改变的数目。上角标(-T)表示逆转置,diag(L)是一个对角线矩阵,其中除对角线元素以外的所有各元素均等于零,并且diag(L)的各对角线元素等于L的对应元素。在方程式(55)中对L作了描述。
可以用多种方法将方程式(56-64)  以及(65-73)组合在一起。由于对C和D来说各有9种(加权更新规则),所以共有81种可能的排列。
映射结构。应用于神经激励静态结构的各方程式,即方程式(45-53),也可以应用于映射结构,其各种参数被描述为在方程式(40-41)中的一个矩阵W。为了使维数的表示法保持一致,我们针对映射结构的情况重写本发明的9种加权更新规则。首先,将L重新定义为:
K=f(u)g(Φ)T                        方程式(74)
式中,f(u)的维数为n×1,并且g(Φ)T的维数为1×N,其中,在方程式(42)的表示法中,N=(L’+1)m+N’n。
然后,可以设计出下列的各种加权更新规则:
Figure A9880731700332
Figure A9880731700333
Figure A9880731700334
Figure A9880731700335
Figure A9880731700336
Figure A9880731700337
Figure A9880731700338
Figure A9880731700339
在方程式(75-83)中,η为自适应速率,在这里η是一个在进行过程中可以改变的数目。上角标(-T)表示逆转置,diag(L)是一个对角线矩阵,其中除对角线元素以外的各元素均等于零,并且diag(L)的各对角线元素等于L的对应元素。标记[I/O]指的是一个n×N维的非方形矩阵,它由一个正数α乘以n×n全同矩阵I组成,并且其余各列(即诸列N-n到N)被填充以零。标记diag[I/O]表示通过从L中取前n列而获得的n×n子矩阵的诸对角线元素。在一个量上面的横线表示在一个或多个样本上的时间平均值。W-T表示非方形矩阵W的伪倒置的转置。
实时在线参数自适应
可以将一项附加的技术添加到上述诸结构和诸步骤中去,以便改进信号分离和恢复诸步骤。
可以针对计算出来的或所获得的任意各数据点的单独的瞬间来更新未混合的(或者,自适应的网络权值)矩阵行。虽然通过这种应用方法有可能实现实时在线信号分离,但是由于它允许一个单独的点去改变进展性解的轨迹,使得这种方法也很容易出错。用于更新分离过程诸参数的另一个步骤对整个数据集,或者从整个数据集的几个选定的数据点上采用该标准。这个方法尚缺乏对实际的实施来说是很重要的因果关系:相关的自适应过程并不随着时间或针对每个样本来进行,而是利用整个数据集,包括在正在更替中的诸瞬时的诸数值。还有,假定在整个范围内都使用一个常数的静态混合矩阵。虽然这个方法跟第1个相比显得更稳健一些,但重要的是,一种离线的方法不适合于实时信号分离。而且,当一种静态常数矩阵的假设为不正确时,非混合过程的精度将受到影响。
连续多线程自适应。图10表示多线程自适应处理过程。几个信号分离过程在时间上可以互相重叠,以避免参数的饱和,并降低持续性的不正确参数估计的似然度。每一个矩形代表一次分离过程。在每一个过程的开始处,进行诸参数的初始化并且采用自适应标准。在每一个时间点上,有一个主过程,从该过程得出的分离结果被报告,以及一个或多个从过程。
因此,在每一个时间点上,存在着一个以上的过程,由这些过程得到的分离结果被报告。每一个过程的输出可以以多种不同方式被使用。例如,假设,在已分离的诸信号中,仅有一组感兴趣的单独的信号有待于作出估计。在这种情况下,将有一个主过程对感兴趣的该信号的质量进行优化,而其他过程的诸结果则被忽略。在另一个例子中,冗余过程(或从过程)的诸结果可以跟那些来自主过程和/或那些来自其他从过程的诸结果进行比较,以便(1)存取每一次分离过程的成功,(2)评估和选择各最佳初始化点,或(3)决定一个过程将在何时完结。当一次主过程完结时,一次从过程就开始发生。在图10中,在时间指标t1处,过程1完结。在该点上,根据它们的诸分离结果的质量测量数据,其他3个从过程中的最好的一个可以像主过程那样发生。
形成一个数据缓冲区或集合(长堆栈),准备用于参数自适应。如上面讨论的那样,在一个单独的数据点或在所获得的整个数据集上进行信号分离标准的应用以及诸分离参数的计算和自适应。这两种情况都属于有限制的使用。在单独的数据点的情况下,有可能出现这样的情况,即,一个单独的或一系列的含有噪声的诸数据点会使诸自适应参数的轨迹从它们的理想解发生改变或偏离。在频谱的相反的一端,将分离标准应用于整个数据集通常是不实际的,这是因为(i)存储每一个数据点是不可能的,以及(ii)处理所有数据点所产生的潜伏期(译者注:指延时)可能是不能接受的。
因此,本发明涉及产生一个实时在线滚动时间窗口,其大小和内容可以根据施加于已测量的诸信号、已分离的诸信号或者该特定应用的各种时间约束条件的不同的标准来进行调整。通常,这些标准将测量分离或鉴别过程的成功水平、诸如已测量或已分离的诸信号的功率谱、已分离或已测量的诸信号的统计相似性此类的诸参数,或者在分离过程中,由操作人员加以引导。长堆栈可以被包含在一个存储器件、一个数字或模拟记录介质之中。
在获得一组新的已测量信号之后,数据集的各项内容可能被修改。完成这一步最直截了当的方法就是从数据集中消除最旧的诸数据点。通过建立一个如图11所示的先进先出(FIFO)型堆栈就能做到这一点。图11表示基于一种先进先出(FIFO)堆栈结构和数据采集过程的一个恒定宽度长堆栈的一个实施例。阴影区表示在本例中的长堆栈的内容。到采样时间=W为止,所获得的每一个数据集都被存储。当采样时间=W时,堆栈已存满数据。过了这一点,就从堆栈中删除最旧的数据集。要注意的是,这是本发明的一种简化的说明,并且该堆栈可以不是FIFO型或者不属于恒定的宽度。下面的步骤是基于本发明的用以选择一个数据集的一段程序的一个实例:
1.设置数据堆栈的长度。
2.对信号分离的诸参数进行初始化。
3.获取当前时间实例的诸测量结果的集合。
4.这是一个有用的数据集合或数据点吗?
  否→是否希望对这个数据集进行分离?
      是→转到步骤6。
      否→转到步骤3。
  是→数据堆栈满了吗?
      否→将数据点作为最新的数据点加以存储。
      是→抛弃最旧的数据点,将这个数据点作为最
          新的加以存储。
5.是否希望对这个数据集进行分离?
      是→转到步骤6。
      否→转到步骤3。
6.执行信号分离步骤。
7.若这是一个有用的数据点,则将分离过程的诸结果
  存入数据堆栈。
8.若到达检查点,则对该分离过程是否成功作出估
  计。
9.对分离结果满意吗?
  否→转到步骤1。
  是→是否希望缩减堆栈的大小?
         否→转到步骤3。
         是→转到步骤1。
有可能将诸潜伏期引入到这个过程之中,这就是说,人们可以输出在当前时间实例之前所获得的诸样本,而不是对最新得到的样本进行分离的结果。
为了应用自适应参数评估标准,从长堆栈中随机地或确定地选择诸元素的一个子集(短堆栈)。在执行信号分离与鉴别算法之前,特别是在应用自适应参数评估标准之前,人们需要从长堆栈中选择那些数据点以供使用。在图12中示出了这种概念的一个简化的说明。图12表示基于一种深度为7个元素的先进先出(FIFO)堆栈结构的一个恒定宽度长堆栈的一个实例。阴影区表示在本例中长堆栈的内容。到采样时间=7为止,所获得的每一个数据集都被存储。当采样时间指标=7时,堆栈已存满数据。过了这一点,就从堆栈中删除最旧的数据集。在每一个过程时间指标处,都从长堆栈中选出两个元素,用以形成短堆栈。这些元素被表示为黑方块。
若使用诸结果和测量值的最新集合,或者使用诸结果和测量值的全部集合,则不需要进行这样的选择。由于现时的诸输出将依赖于未来的诸混合物,所以后面的计算是没有因果关系的。因此,后面的计算只能以离线方式进行。正如在信号分离和鉴别算法的实时执行中已经表明的那样,通常这是不实际的。
人们希望这样:或者通过确定地、随机地。或者伪随机地从它那里选出诸(数据)点的一个集合,使得人们可以使用可用的整个数据堆栈的一个选定的集合。确定的选择是完全地可预报的,并且每次都相同于一组相同的数据。然而,使用随机的或伪随机的选择标准,即使对相同的数据而言,也可能产生不同的被选择的诸集合。
一种强有力的确定的标准就是扩展或收缩短堆栈的大小,短堆栈开始于或结束于一个长堆栈的随机的或预先确定的指标、或者环绕着后者而扩展。可以由分离过程的诸结果来引导这个过程,即,所接收到的分离与鉴别的质量可以被用来规定数据在长堆栈中的指标、增加或减少在短堆栈每一点处的数据元素的数目、短堆栈的大小以及在短堆栈中数据的数值精度。各种确定的步骤可以跟各种随机的步骤组合在一起,例如随机地选择长度、数值精度、起点以及短堆栈的元素数目。随机的诸步骤可以利用适当的概率分布函数来规定在长堆栈中将被纳入短堆栈的各元素的指标。例如,各指标的概率分布可以支持或不支持对最新的诸数据点的选择。概率分布的定义本身可以是一个基于原始的和已分离的信号以及在进行计算时的各种混合特性的随机的或确定的过程,针对网络的更新的计算可以全都是有因果关系的,即,输出的当前数值仅仅依赖于该混合物的当前的和以往的诸数值。
图13表示使用来自一个长堆栈的诸数据点(短堆栈)的一个集合的分离标准的应用,上述长堆栈含有在一个时间窗口上测量或计算的诸数据点的所有有关的集合。在图13中,以图示的方式表现长的和短的各堆栈的结构和诸元素。长堆栈的宽度为N个元素,深度为M个元素。其函数按照它们的时间指标k被分成小组。有N个时间实例,它们含有M组计算结果,包括已被测量诸信号和已被估计的诸原始信号或已分离的诸信号,各项中间计算的诸结果,以及其中的各种函数。长堆栈的各项内容表示测量与计算的一个活动窗口或历史。最新测量和计算的诸数据点被添加到具有最后指标的堆栈行,而所述数据点的最旧的集合则从堆栈中被清除。正如前面所建议的那样,堆栈本身的大小不需要保持恒定。
短堆栈是从长堆栈中为了在一个特定时间实例中进行计算而选出的诸行的一个子集,当进行一次计算时,在每一个时间实例中,短堆栈的内容也被修改。在时间t被选出的诸短堆栈行被用来在时间t计算已估计的诸原始信号或者已分离的诸信号。然而,要注意的是,虽然时间t是进行计算的时间,但它不一定是跟已分离的输出有关的时间。在输出中,可以存在一个潜伏期,即,一个向前看的方案可以投入工作,使得在时间t所计算的是针对时间t-L的已分离的信号,这里L表示潜伏期。
因此,本发明的算法和框架考虑到一般的时域系统,使得本发明能够适应在信号与波传播、传输和变换的实践中经常遇到的信号延时和其他非线性事件的变化现象。
本发明也允许通过控制用于选择长堆栈行、特别是短堆栈行的标准,来处理在统计上有意义的诸间隔,并使用各种不同的输出加权形式。
用于自适应参数估计的递归步骤。在多种应用中,特别是当希望得到高精度的分离过程时,人们可以递归地应用信号分离过程,这就是说,来自信号分离过程的输出可以被当作下一个分离过程的输入来处理,直至达到所需精度为止。每一次相继的分离过程可以使用相同于或不同于上一次过程的模型、结构和各种参数。本方法可以跟本发明的其他实时在线步骤,例如多线程自适应步骤,组合在一起。
音频信号处理应用
对于语音、讲者和/或语言识别和处理来说,提出了跟这些处理相关的计算上的挑战,或者出于用户隐私和/或监视的各种目标,人们希望得到无噪声的清晰的信号,例如没有受到噪声、环境声以及其他讲者污染的语音段。本发明的信号分离结构和算法可以被用来作为迈向这个目标的一个前端。传声器阵列可以被用来获取多种样式的语音(和其他)诸信号。这些可能是在用以获得原始的个别的诸信号或语音段的信号分离过程中所使用的诸混合信号,跟由诸传声器所拾取的诸原始信号相比,这些语音段将含有较小的噪声以及其他干扰源。
图14表示一种根据本发明的信号分离和恢复步骤的音频应用。通过传声器阵列1402的诸元件将各种音频信号之后为各种电信号。传声器阵列1402中的每一个元件接收在该环境中各种声音的一种不同的样式(或混合物)。可以根据应用的性质、诸混合物的数目、所期望的精度,以及其他有关的标准,来设计各传声器元件的不同安排。经过某些信号调理和滤波之后,这些混合信号从模拟格式被转换为数字格式,因此,它们可以被存储和处理。根据本发明的信号分离和恢复步骤对本系统的DSP器件806进行编程。DSP器件806的内部可以包括多种功能单元,用于各种算术和逻辑运算、数字表示、数据存储以及读出装置,以便获得最佳的性能。图中所示的各种电路和结构还可以进一步地集成,直到在一块单独的芯片上实现整个系统。图14说明在示于图8的硬件加速实施选项的框架中的专用系统。
图15表示基于DSP的手持式装置的3种音频输入接口,上述接口可以被嵌入到传声器-DSP接口之中。图的最左边是通往一个传声器1502的流行的接口。传声器1502被连接到一个A/D转换器1504,它依次地被连接到一个直接存储器存取(DMA)通道1506以及DSP或语音处理器芯片1508。在图的中间以一种直截了当的方式来表现诸传声器1502,如同在图14中的例子那样。这可以使用另一个A/D转换器1504,并且或许更重要地,使用DSP或处理器芯片1508的另一个DMA通道1506。图的最右边,我们示出了一种可能的方法,在其中使用一个多路复用器1510,使得这种影响得以减少。送往多路复用器1510的选择信号没有示出,但是它可以按照一种直截了当的方式从采样时钟产生。要注意的是,在多路复用输入的情况下,对音频信号通路的影响得以最小化。还可以考虑一种略有不同的方法,即,若需要进行同时采样,则可以使用两个A/D转换器1504并对已数字化的数据进行多路复用,以取代(模拟的)诸传声器输出。
图16表示适于与本发明配合使用的一种音频装置的一份概略图。这是一部智能的声音传感和处理装置1600,它可以被编程以便执行多种功能。这个装置可以单独(作为整体)使用,也可以作为一部计算或通信装置的一部分来使用,以实现基于语音或声音的接口。智能传声器1600通过一个传声器阵列1604从诸声源处接收多种声音。传声器阵列1604由诸传声器元件1605的一个阵列组成。传声器阵列1604被连接到一个A/D转换器1606以及一个或多个DSP或者集成的DSP诸核心1608。DSP核心1608被连接到一个存储器件1610,至少一个数字电路1612以及模拟电路1614,一个在线编程接口1616,以及一个D/A转换器1618。存储器件1610可以存放已在前面说明过的用于信号分离与恢复的各种算法和步骤。数字电路1612以及模拟电路1614可以包括信号转换、调理以及接口电路。D/A转换器1618(的输出)送往诸输出通道1620以及其他输出端1622。虽然在图中所表示的是,它们都处于该图的一个平面上,但是传声器的诸轴线不需要共面。事实上,类似于图17所示的一种圆柱形的设计安排就是所希望的,它能从所有方向进行拾音。这些方向中的某些可能不起作用。在图16的概略图中所描述的智能传声器含有传声器元件1605。该装置是能够执行音频信号分离与恢复任务的最小化装置。通过编程还可以将一项附加的特性添加到数字信号处理器之中。经过预先编程之后,这种装置可以被用来作为各种常规传声器的替代物,或者用于新的音频接口之中,后者通过在线编程而使用其灵活性。虽然为了图解其部件,它被画成比常规传声器大一些,但实际上,由于它的集成度跟高,其大小跟常规传声器是可比拟的,或者小于后者。
传声器技术和各种传声器阵列。传声器是一种装置,它将作为空气质点的振动运动而接收的声能转换为电能,后者作为电子的一种振动运动沿着传声器电缆而送出。一旦发生这样的转换,声音信息就从正常的声学约束中被解放出来。它可以被放大,在一根导线上或经由无线电波被发送,它可以被存储和处理。
今天传声器是一种无所不在的装置。存在着多种类型的传声器,并且本节提供与各种传声器有关的技术的一个简要的纵览。任何传声器的所期望的诸特性在某种程度上依赖于指望它投入何种具体的应用。然而,在研究声学换能的原理以及生产厂家的传声器说明书时,下列的性能类目在选择适当的传声器方面具有重要的影响:
1.在轴线方向上的频率响应,它指的是在一个恒定的声级下,信号输出与频率之间的关系
2.方向性,指的是传声器对从一个平面上的所有角度所接收的各种声音的响应,例如全方向性、心脏形、散弹枪形
3.离开轴线的频率响应,同(1),但离开轴线
4.灵敏度,或者传声器将声能转换为电能的效率
5.自身噪声,或固有噪声电平
6.畸变,换句话说,对声能的响应偏离于线性的程度
除了几种基于热丝或离子云的外来的类型以外,所有实际的传声器都经由响应于一块轻的薄膜的声波的机械振动,将声能转换为机械能。一般来说这块薄膜为圆形,并在其四周被夹紧,虽然也会出现其他的形状,并且包括伸展于在其被夹紧的两端之间的薄型箔带变种。因此,虽然看上去好象是同时发生,但是,实际上它表现为:在传声器中能量的转换通常分两个阶段发生:由声能到机械能以及由机械能到电能。
在第1阶段,一个任何换能器类型的传声器从声波抽取机械能的两种主要方式是压力操作和压力梯度操作。压力操作场合的显著特征是传声器的后表面是封闭的,因此,作用力是在前面的瞬时空气压力。通过外壳切开一个小的开口,以便使长期的内部的和外部的空气压力趋于均衡。一个纯粹压力操作的传声器是全方向性的。另一方面,一个压力梯度传声器以这样的方式被建立,其薄膜的两面同等地开放于空气之中。在任何瞬间作用于薄膜的力不是简单地归因于在前端的压力,而是归因于压差,或者介于前面和后面之间的压力梯度。这对系统的方向性有重大影响。若将压力和压力梯度操作结合在一起,则有可能得到完整的方向图族。
第2阶段可以使用多种发电机原理,将所抽取的机械能转换为电能,并且相应地由此对各种传声器进行分类。某些普通的类别可以叙述如下:
1.动圈式(电动式)传声器,基于这样的原理,即,一个导体在一个磁场中的运动产生一个电动势,引起电流在导体中流动
2.箔带式传声器,基于与电动式传声器相同的原理,其中箔带起着薄膜和导体的作用
3.电容式(电容式或静电式)传声器,基于换能器元件是一个电容器,其电容量根据薄膜的振动而改变
4.驻极体传声器,它使用一块极化的或中性薄膜,其固定平板涂敷以驻极体材料(背极化)
5.压电式传声器,使用结晶或陶瓷材料,后者具有压电特性,当一块薄膜上的振动通过一根杆被传送到双压电晶片(将两块极化方向相反的平板连接在一起以形成一个单独的单元)时,在输出端产生一个跟有效位移成正比的交变电压
6.碳精传声器,用于多种电话中,它使用碳化硬煤(石墨)的颗粒,当受到外部压力振动时将引起它们的接触面积增加或减少
在过去十年中,硅微细加工技术已经成功地被应用于在硅片上制作小型传声器。各种硅传声器基于不同的原理,例如,压电、压阻以及电容等原理都是可用的。由于在改进了的尺寸控制、极端小型化、集成于单片电路上的能力,以及作为批量加工的结果的潜在的低价格等方面取得的长足进展,在这个领域中存在着日益增长的兴趣。
在这里,我们讨论两种类型的微细加工传声器,即电容式和压电式。
微细加工电容式传声器。由于较高的灵敏度、平坦的频率响应以及低的噪声电平,所以大多数硅传声器基于电容原理。电容式传声器可以分为驻极体传声器、电容式传声器以及具有集成的场效应晶体管(FETs)的电容式传声器。电容式传声器包括一块柔软的薄膜以及一块刚性背板。这两个部件可以被实现为两块分离的硅片或者一块单独的芯片。通过使用各向异性的蚀刻方法在背板上形成传声孔。各种硅传声器的薄膜可以是薄的聚酯箔片、聚酯树脂、一种低压化学蒸镀(LPCVP)氮化硅薄膜,等等。针对两芯片结构的传声器,使用硅直接键接、阳极键接、或者高分子聚合物粘结带等方法来组装薄膜以及背板。这样的组装过程通常涉及繁琐的对准步骤,并且使得大多数健接工艺也涉及到一些影响集成电子学并改变材料特性的诸步骤,所以看起来采用单芯片解决方案的各种传声器应当是首选的。
这种传声器的制造工艺序列使用7层掩模,起着包括硅各向异性蚀刻以及牺牲层(即防蚀消耗层)蚀刻工艺。已被提出权利要求的有波纹的薄膜在硅电容式传声器的设计中具有若干长处。首先,波纹减少了薄膜的内应力从而达到较高的灵敏度。其次,它可以通过使用单硅片工艺来制造。在形成气隙之后就自动地产生各传声孔,即,牺牲层被去除并且薄膜被放松。通过选择适当的结构参数,就能优化薄膜的灵敏度以及共振频率。
微细加工压电式传声器。已经从理论上和实验上对各种微细加工压电式传声器的性能极限进行探索。此外,在一种介于商业的CMOS生产厂家和大学的微细加工设备之间的协作交互过程中,使用在芯片上具有剩余应力补偿的大规模集成(LSI)CMOS电路,已经制造出这样的装置并进行测试。一个这样的2500×2500×3.5μm的立方体传声器具有一个压电ZnO层,它位于一个起支撑作用的、用低压化学蒸镀法(LPCVD)生成的富含硅的氮化硅层之上。已封装的传声器具有一个18kHz的共振频率,一个品质因数=40(近似值),以及一个未经放大的灵敏度0.92μV/Pa,这跟计算的灵敏度之间良好地保持一致。差动放大器提供49 dB的增益,并且在输入端具有13μV的A-加权噪声。
在批量的微细加工中,人们已经尝试了相关的工艺技术,即,将一块硅片前面的各种特征赋予它的背面。为了达到这个目的,一块小的(30μm见方以及1.6μm厚)的薄膜可用作一块对准样板。与此同时,对准薄膜做得更厚一些,在这些区域中,可以使用“筛网式”的掩模样板,对大面积的诸薄膜进行局部的蚀刻。筛网式掩模技术利用介于诸平面(100)和(111)之间的蚀刻速率之差,来控制在所选定区域内每一个蚀刻凹坑所达到的深度。大面积的、局部蚀刻的诸薄膜(2到3mm见方)是充分地结实,使之能经受在一个硅片生产环境中的后续的IC工艺诸步骤。这个已报道的尺寸将随着较小的诸特征尺寸的可用性而减小。对准薄膜由于其面积非常小,使得它可以通过这些步骤被加工。在诸电路都已经完工之后,被局部地蚀刻的诸薄膜可以被缩减到有用的厚度。这项技术已经成功地被用来制造各种传声器以及在芯片上的各种CMOS电路。
微细加工压电传声器的使用产生了建立用电热方法可调谐的共振频率的机会。通过由在薄膜上的多晶硅加热器所引起的热膨胀,具有这种特性的专用器件获得了共振频率调制fm。在介于20.8与15.1kHz之间,已经测量到随着电阻功率的增加,fm以-127Hz/mW的比率降低。机械品质因数Qm约为100。而且,温度-功率曲线是线性的,在薄膜上的最热的敏感元件处,其斜率为0.3℃/mW。可变的共振频率以及高的品质因数提供了一种声音滤波能力,使之能应用于超声距离探测、各种速度传感器、各种信号元件以及语音处理。
跟前几代产品在4个端角上夹紧诸薄膜有所不同,组合的传声器-微型扬声器装置具有一个排除了剩余应力的悬臂,而在(老产品的)被夹紧的诸薄膜中,这种剩余应力是存在的。悬臂的使用使得灵敏度水平高于具有微细加工诸薄膜的其他各种传声器。此外,当该装置作为一个输出换能器用电气方式被驱动时,即,作为微型扬声器来使用时,其自由端的相当大的偏移量能产生有效的声音输出。
通过将力学、压电和电路理论组合在一起,就能发展集成传声器的理论。还需要进行的是对灵敏度-带宽乘积以及信噪比的理论上的优化。
传声器阵列组合以及传声器各部件的自适应调谐。当前使用的“传声器阵列”一词指的是以m(米)为量级的跨越长距离的诸传声器的各种安排。这是由两种因素所导致的结果。首先,大多数常用传声器的直径不允许较小的阵列尺寸。其次,由于建立传声器阵列的主要动力是向波束形成算法提供所需的输入,该算法由于与大多数音频信号相关的较长的波长(0.1-1.0m),要求各传声器元件之间具有较大的间隔,已经不需要将诸传声器安装得十分靠近。例如,一个用于确定扬声器位置的一维传声器阵列含有51个传声器,它们被排列在一条线上,互相之间具有4cm的均匀间隔,跨越的距离为2m。这种排列在4kHz的频率以内,能提供没有空间二义性的选择性。
仅仅随着技术与新算法的出现,随着对内耳的工作原理的了解,现在我们有理由去建立类似于内耳的结构,以便进行为真正的智能音频接口所需的各种信号处理。从这一点出发,在下文中,传声器阵列一词被用来专指在任何坐标上均小于5cm的紧凑的结构。在这个尺寸上,一个单独的器件或接口可以容纳该阵列,并且为了进行各种复杂的音频信号功能,例如信号分离,也没有必要将各种传声器摆满整个房间。在这个尺寸上,虽然各种物理的尺寸使得波束形成和定位从数学上来说是不实际的,但是,最终目标是将一个人用一只好耳朵所能实现的所有功能都集成到这样一个器件里面。为了解决要求各种物理尺寸适于进行声源定位和波束形成的各种进一步的问题,可以安排多个器件。
将传声器集成到硅片上使得对传声器尺寸和间隔的紧密控制成为可能。在各种波束形成算法的更加可靠的使用中,人们期待着能实现这样的结果。然而,微细加工的各种传声器部件的响应特性,跟它们的各种常规的对立物相比,其可预测性是较低的。各种压电式传声器的紧密耦合所涉及的若干问题仍有待于解决。要注意的是,我们在本文中,将个别的微细加工的或微型电气-机械的系统(MEMS)器件看作在各相似单元的一个阵列中的一个单独的元件,这类似于在一个CCD阵列中的一个单独的像素,或者在一块集成电路中的一个晶体三极管。
由于在生产过程中各种现有的物理约束,来自每一个MEMS器件的各种信号通常呈现出偏移和非线性,使得已被转换的各种信号必须依赖于用于调理、测试,以及出厂前一次性校准的现成的微电子学(器件与方法),以便为诊断和控制产生可靠的诸测量结果。然而,由于例如辐射、器件老化,以及温度变化等原因,使得仅有出厂前的一次性校准对普遍化的使用来说是不够的。而且,当人们考虑到将类似的、甚至根本不相同的各种MEMS器件紧凑地集成到相同的基底上去时,对这个问题的外部安装方法将抵消由MEMS所提供的小型化的好处。
本发明的应用使用带有各种声学传感器的各种集成的自适应系统,这是因为它能在出现异常情况和非线性时,提供对在线处理或离线处理的关系进行修改的能力。此外,使用模块化的设计结构直截了当地避免了信号调理系统的扩大。
数字信号处理器。用于音频、语音以及多媒体应用的数字信号处理器有很多种。在一种特定的应用中,将根据所面临的任务来选择最好的处理器家族,以便用于各种音频信号的分离和恢复。各项选择是在不同的结构以及数值的表示方法(例如浮点或定点)之间进行。为了获得高度集成的解决方案(例如,一个芯片),可能需要嵌入一个DSP核心,它来自一个预先设计的器件或者根据标准的硅单元库来进行设计。
编译程序通往DSP汇编程序和连接程序的前端产生介于本发明所述的两种实施方法选项之间的可移植性。因此,介于软件仿真实施方法以及硬件加速仿真实施方法的高级语言算法之间存在一种双路连接。此外,介于多种计算环境以及DSP仿真环境之间也存在一种类似的直接联系,例如,用于各种处理器的C/C++库和编译程序。
人们希望产生为每一种数字信号处理器所专用的快速和紧凑的汇编语言代码。不幸的是,由一种专门的DSP编译程序所产生的汇编语言代码通常不是像人们所期望的那样好。用于数字处理器设计和配套设计的各种工具环境由一系列的模型组成。从较高的行为水平开始,这种分层的描述有助于在它们在物理上被提交之前对各种设计差错进行鉴别与纠正。而且,只要所描述的诸器件实际上能够从物理上实现,它也能给出一个很精确的性能估计。
可编程逻辑可以是相关的开发过程的一个组成部分。一个可编程的DSP核心(一个DSP处理器,它被设计成可以集成到一个定制芯片之中)可以跟定制逻辑集成在一起,以区分一个系统,并降低系统成本、所占的空间以及功耗。
信号转换、调理和接口电路。信号转换、调理和接口电路像分离元件那样现成可用,例如A/D和D/A转换器、存储器集成电路、定时器、运算放大器、滤波器,等等。为了进行快速的原型试验以及可编程性,希望使用模拟的和数字的这两种可编程器件。
许多数字现场可编程门阵列(FPGA)的经销商正在提供日益增长的复杂性以及用于编程的门与引脚计数器件。还可以进一步地参照各种形式的可重构硬件,它包括动态系统驻留重构、虚拟硬件以及可重构的DSP核心。对于各种自适应处理算法以及它们的实施来说,存在一种涉及软件和硬件的无缝整合、还有处理器与传感器的无缝整合的正在成长中的机会。本发明涉及模拟与数字两种信号,还要参照硬件的模拟可编程性,例如电气可编程的模拟电路(EPAC)。必要时,将模拟、数字以及混合信号可编程器件跟各种定制的电子模型或各种分离元件组合在一起可能是有利的。追求各种跟现成地与之相伴的各种声学敏感器件能最终地整合在一起的定制电路和结构也可能是有利的。
前面所作的关于本发明的说明是为了图解和说明的目的而提供的。不打算把它作为无遗漏的,或者将本发明限制于所公开的各种丝毫不差的形式。对专业人士来说,作出若干修改和变更是显而易见的。我们打算由以下各项权利要求及其等价物来规定本发明的范围。

Claims (42)

1.一个信号处理系统,用于将多组输入信号分离为多组输出信号,诸输入信号由已经受到一种介质影响的多组源信号的一个混合物组成,诸源信号跟多个源相关,诸输出信号对诸源信号作出估计,本系统包括:
多个传感器,用以检出诸输入信号;
一个存储装置,用以接收和存储诸输入信号;
一个结构处理器,用以定义和计算一种信号分离结构,该信号分离结构定义介于诸输入信号和诸输出信号之间的一种关系,上述关系具有恒定的诸参数以及时变的诸参数;
一个更新处理器,用以为每一个时变参数计算一个变化率,以及响应于跟每一个时变参数相关的变化率,计算诸时变参数;以及
一个输出处理器,用以根据信号分离结构、诸恒定参数,以及诸时变参数,来计算诸输出信号。
2.根据权利要求1所述的一个信号处理系统,其中多个传感器被排列成一个传感器阵列,传感器阵列具有一个方向性的响应图形。
3.根据权利要求2所述的一个信号处理系统,其中,通过对诸输入信号进行信号处理,可以对传感器阵列的方向性响应图形进行修改。
4.根据权利要求1所述的一个信号处理系统,其中,诸输入信号的数量以及诸输出信号的数量是不相等的。
5.根据权利要求4所述的一个信号处理系统,其中,至少一组输出信号是至少两组源信号的一个函数。
6.根据权利要求4所述的一个信号处理系统,其中,至少两组输出信号是一组相同的源信号的诸函数。
7.根据权利要求1所述的一个信号处理系统,其中,诸输出信号的计算基于该系统的多种内部状态。
8.根据权利要求1所述的一个信号处理系统,其中,诸输出信号的计算也基于至少一组输入信号,诸输出信号,先前接收的诸输入信号,以及先前计算的诸输出信号。
9.根据权利要求1-8所述的一个信号处理系统,其中,由一种状态空间表示方法来定义信号分离结构,上述状态空间表示方法建立介于诸输入信号以及诸输出信号之间的关系。
10.根据权利要求9所述的一个信号处理系统,其中,诸输出信号的计算也基于状态空间结构的各种当前状态。
11.根据权利要求9所述的一个信号处理系统,其中,诸输出信号的计算也基于状态空间结构先前计算的各种状态。
12.根据权利要求9所述的一个信号处理系统,其中,诸输出信号的计算也基于状态空间结构的当前状态以及先前计算的各种状态。
13.根据权利要求9-12所述的一个信号处理系统,其中,状态空间表示方法被映射到一个有限冲击响应(FIR)滤波器中去。
14.根据权利要求9-12所述的一个信号处理系统,其中,状态空间表示方法被映射到一个无限冲击响应(IIR)滤波器中去。
15.根据权利要求9-12所述的一个信号处理系统,其中,状态空间表示方法被归纳为一个非线性时变函数。
16.一种用于将多组输入信号分离为多组输出信号的方法,诸输入信号由已经受到一种介质影响的多组源信号的一个混合物组成,诸源信号跟多个源相关,诸输出信号对诸源信号作出估计,本方法包括:
接收诸输入信号;
存储诸输入信号;
定义一种信号分离结构,该信号分离结构定义介于诸输入信号和诸输出信号之间的一种关系,上述关系具有恒定的诸参数以及时变的诸参数;
对恒定的诸参数以及时变的诸参数进行初始化;
为每一个时变参数计算一个变化率;
响应于与每一个时变参数相关的变化率,计算诸时变参数;以及
根据信号分离结构、诸恒定参数,以及诸时变参数,来计算诸输出信号。
17.根据权利要求16所述的一种方法,其中,至少一组时变参数的变化率被纳入到一个至少是二维的数组之中。
18.根据权利要求17所述的一种方法,其中至少有一个数组合有被安排在一个第1一维数组之中的一组输出信号的一个扩展函数的外部乘积的一个函数,以及被安排在一个第2一维数组之中的一组输出信号的一个压缩函数。
19.根据权利要求16所述的一种方法,其中,由一种状态空间表示方法来定义信号分离结构,上述状态空间表示方法建立介于诸输入信号以及诸输出信号之间的关系。
20.根据权利要求19所述的一种方法,其中,至少一组时变参数的变化率被纳入到一个至少是二维的数组之中。
21.根据权利要求20所述的一种方法,其中,至少有一个数组含有一组被安排在一个第1一维数组之中的一组输出信号的一个扩展函数的一个外部乘积的一个函数,以及被安排在一个第2一维数组之中的状态空间结构的一组内部状态的一个压缩函数。
22.根据权利要求17或20所述的一种方法,其中,至少有一个数组含有被安排在一个至少是二维的第1数组之中的一组输出信号的至少一个扩展函数的一个外部乘积的一个函数,以及被安排在一个至少是二维的第2数组之中的一组输出信号的至少一个压缩函数。
23.根据权利要求16-22所述的一种方法,其中多种方法在时间上互相重叠。
24.根据权利要求23所述的一种方法,其中至少有一种方法,使用诸常数数值的一个预定的集合或者诸数值的一个随机集合,以便初始化诸参数。
25.根据权利要求23所述的一种方法,其中至少有一种方法使用先前通过在时间上重叠的另一种方法计算出来的诸参数。
26.根据权利要求23所述的一种方法,其中至少有一种方法被终结。
27.根据权利要求26所述的一种方法,其中至少有一种方法使用由先前已终结的诸方法计算出来的诸参数。
28.一个声学信号鉴别系统,用以将多组(输入)信号鉴别为多组输出信号,诸输入信号由已经受到一种介质影响的多组源信号的一个混合物组成,诸源信号跟多个源相关,诸输出信号对诸源信号作出估计,本系统包括:
多个声学传感器,用以检出诸输入信号,诸输入信号由一组源信号的一组函数组成;
一个存储装置,用以接收和存储诸输入信号;
一个结构处理器,用以定义和计算一个声学信号鉴别结构,该结构定义介于诸输入信号和诸输出信号之间的一种关系,上述关系具有恒定的诸参数以及时变的诸参数;
一个更新处理器,用以为每一种时变参数计算一个变化率,以及响应于跟每一个时变参数相关的变化率,计算诸时变参数;以及
一个输出处理器,用以根据声学信号鉴别结构、诸恒定参数,以及诸时变参数,来计算诸输出信号。
29.根据权利要求28所述的一个声学信号鉴别系统,其中,多个声学传感器被排列成一个声学传感器阵列,该声学传感器阵列具有一个方向性的响应图形。
30.根据权利要求29所述的一个声学信号鉴别系统,其中,通过对由声学传感器阵列的诸声学传感器所检出的诸信号进行处理,可以对声学传感器阵列的方向性响应图形进行修改。
31.根据权利要求28所述的一个声学信号鉴别系统,其中,诸输入信号的数量以及诸输出信号的数量是不相等的。
32.根据权利要求31所述的一个声学信号鉴别系统,其中,至少一组输出信号是至少两组源信号的一个函数。
33.根据权利要求31所述的一个声学信号鉴别系统,其中,至少两组输出信号是相同的源信号的诸函数。
34.根据权利要求28所述的一个声学信号鉴别系统,其中,诸输出信号的计算也基于在至少一个先前的瞬时中计算出来的各种内部状态。
35.根据权利要求28所述的一个声学信号鉴别系统,其中,诸输出信号的计算也基于至少一组输入信号,诸输出信号,先前接收的诸输入信号,以及先前计算的诸输出信号。
36.根据权利要求28-35中任何一项所述的一个声学信号鉴别系统,其中,根据一种状态空间表示方法来定义信号分离结构(译者注:应为信号鉴别结构),上述状态空间表示方法建立介于诸输入信号以及诸输出信号之间的关系。
37.根据权利要求36所述的一个声学信号鉴别系统,其中,诸输出信号的计算也基于状态空间结构的各种当前状态。
38.根据权利要求36所述的一个声学信号鉴别系统,其中,诸输出信号的计算也基于在至少一个先前的瞬时中计算出来的状态空间结构的各种状态。
39.根据权利要求36所述的一个声学信号鉴别系统,其中,诸输出信号的计算也基于当前各种状态,以及在至少一个先前的瞬时中计算出来的状态空间结构的各种状态。
40.根据权利要求36-39中任何一项所述的一个声学信号鉴别系统,其中,状态空间表示方法被映射到一个有限冲击响应(FIR)滤波器中去。
41.根据权利要求36-39中任何一项所述的一个声学信号鉴别系统,其中,状态空间表示方法被映射到一个无限冲击响应(IIR)滤波器中去。
42.根据权利要求36-39中任何一项所述的一个声学信号鉴别系统,其中,状态空间表示方法被归纳为一个非线性时变函数。
CN98807317.XA 1997-06-18 1998-06-18 用于盲目信号分离的方法与装置 Pending CN1264507A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US5014797P 1997-06-18 1997-06-18
US60/050,147 1997-06-18

Publications (1)

Publication Number Publication Date
CN1264507A true CN1264507A (zh) 2000-08-23

Family

ID=21963611

Family Applications (1)

Application Number Title Priority Date Filing Date
CN98807317.XA Pending CN1264507A (zh) 1997-06-18 1998-06-18 用于盲目信号分离的方法与装置

Country Status (10)

Country Link
US (1) US6625587B1 (zh)
EP (1) EP0990306B1 (zh)
JP (1) JP4477148B2 (zh)
CN (1) CN1264507A (zh)
AT (1) ATE247340T1 (zh)
AU (1) AU740617C (zh)
CA (1) CA2294262A1 (zh)
DE (1) DE69817181T2 (zh)
HK (1) HK1027444A1 (zh)
WO (1) WO1998058450A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101095324B (zh) * 2004-08-30 2012-09-05 京瓷公司 用于对无线通信信号进行盲源分离的系统和方法
CN106789218A (zh) * 2016-12-13 2017-05-31 中国电子科技集团公司第二十研究所 一种基于事件的链路冲突实时仿真方法
CN107710238A (zh) * 2015-06-29 2018-02-16 微软技术许可有限责任公司 具有堆栈存储器的硬件加速器上的深度神经网络处理
CN112434415A (zh) * 2020-11-19 2021-03-02 中国电子科技集团公司第二十九研究所 一种面向微波光子阵列系统射频前端异构模型的实现方法
CN114970607A (zh) * 2022-05-06 2022-08-30 北京谛声科技有限责任公司 基于深度神经网络声发射信号分离的变压器局放检测方法

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6278377B1 (en) 1999-08-25 2001-08-21 Donnelly Corporation Indicator for vehicle accessory
ATE257985T1 (de) * 1998-06-18 2004-01-15 Clarity Llc Adaptive zustandsraum-signaltrennung, unterscheidungs- und rückgewinnungsarchitekturen und ihre anpassungen zur verwendung in dynamischen umgebungen
US6691073B1 (en) 1998-06-18 2004-02-10 Clarity Technologies Inc. Adaptive state space signal separation, discrimination and recovery
US6735482B1 (en) 1999-03-05 2004-05-11 Clarity Technologies Inc. Integrated sensing and processing
US6768515B1 (en) 1999-03-05 2004-07-27 Clarity Technologies, Inc. Two architectures for integrated realization of sensing and processing in a single device
SE521024C2 (sv) * 1999-03-08 2003-09-23 Ericsson Telefon Ab L M Metod och anordning för att separera en blandning av källsignaler
EP1230739B1 (en) 1999-11-19 2016-05-25 Gentex Corporation Vehicle accessory microphone
US7120261B1 (en) 1999-11-19 2006-10-10 Gentex Corporation Vehicle accessory microphone
EP1154674B1 (de) * 2000-02-02 2008-12-10 Bernafon AG Schaltung und Verfahren zur adaptiven Geräuschunterdrückung
CN1436436A (zh) * 2000-03-31 2003-08-13 克拉里提有限公司 用于话音信号提取的方法和设备
US6999926B2 (en) * 2000-11-16 2006-02-14 International Business Machines Corporation Unsupervised incremental adaptation using maximum likelihood spectral transformation
KR100878992B1 (ko) * 2001-01-30 2009-01-15 톰슨 라이센싱 에스.에이. 지오메트릭 소스 분리 신호 처리 기술
CA2436484C (en) 2001-02-14 2008-01-22 Gentex Corporation Vehicle accessory microphone
US6985858B2 (en) * 2001-03-20 2006-01-10 Microsoft Corporation Method and apparatus for removing noise from feature vectors
AUPR647501A0 (en) * 2001-07-19 2001-08-09 Vast Audio Pty Ltd Recording a three dimensional auditory scene and reproducing it for the individual listener
US20030125959A1 (en) * 2001-12-31 2003-07-03 Palmquist Robert D. Translation device with planar microphone array
US6859772B2 (en) * 2002-05-07 2005-02-22 Motorola, Inc. Mixed signal dynamical environment modeling
US7047043B2 (en) * 2002-06-06 2006-05-16 Research In Motion Limited Multi-channel demodulation with blind digital beamforming
US6934397B2 (en) 2002-09-23 2005-08-23 Motorola, Inc. Method and device for signal separation of a mixed signal
EP1600789B1 (en) * 2003-03-04 2010-11-03 Nippon Telegraph And Telephone Corporation Position information estimation device, method thereof, and program
CN100430747C (zh) * 2003-03-04 2008-11-05 日本电信电话株式会社 位置信息估计装置及其方法
US20040205403A1 (en) * 2003-03-28 2004-10-14 Mitchell Markow Acoustic power spectra sensor for hard disk drive to provide early detection of drive failure and diagnostic capabilities
US7646744B2 (en) 2003-04-07 2010-01-12 Shaolin Li Method of operating multi-antenna wireless data processing system
US8014374B2 (en) 2003-04-07 2011-09-06 Bellow Bellows Llc System and method for achieving timing compatibility with multi-antenna wireless data protocols
US7512083B2 (en) 2003-04-07 2009-03-31 Shaolin Li Single chip multi-antenna wireless data processor
US7933255B2 (en) 2003-04-07 2011-04-26 Bellow Bellows Llc Multi-antenna wireless data processing system
US7389096B2 (en) 2003-04-07 2008-06-17 Bellow Bellows Llc Monitoring system using multi-antenna transceivers
KR100600313B1 (ko) * 2004-02-26 2006-07-14 남승현 다중경로 다채널 혼합신호의 주파수 영역 블라인드 분리를 위한 방법 및 그 장치
US7415392B2 (en) * 2004-03-12 2008-08-19 Mitsubishi Electric Research Laboratories, Inc. System for separating multiple sound sources from monophonic input with non-negative matrix factor deconvolution
EP1581026B1 (en) * 2004-03-17 2015-11-11 Nuance Communications, Inc. Method for detecting and reducing noise from a microphone array
US20070177695A1 (en) * 2004-03-31 2007-08-02 Board Of Trustees Of Michigan State University Multi-user detection in cdma systems
US7409670B1 (en) * 2004-04-01 2008-08-05 Altera Corporation Scheduling logic on a programmable device implemented using a high-level language
EP1752969A4 (en) * 2005-02-08 2007-07-11 Nippon Telegraph & Telephone SIGNAL SEPARATION DEVICE, SIGNAL SEPARATION METHOD, SIGNAL SEPARATION PROGRAM, AND RECORDING MEDIUM
WO2006131959A1 (ja) * 2005-06-06 2006-12-14 Saga University 信号分離装置
JP4051408B2 (ja) * 2005-12-05 2008-02-27 株式会社ダイマジック 収音・再生方法および装置
US8180067B2 (en) * 2006-04-28 2012-05-15 Harman International Industries, Incorporated System for selectively extracting components of an audio input signal
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
US8036767B2 (en) 2006-09-20 2011-10-11 Harman International Industries, Incorporated System for extracting and changing the reverberant content of an audio input signal
JP5232791B2 (ja) 2006-10-12 2013-07-10 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びその方法
EP2092516A4 (en) 2006-11-15 2010-01-13 Lg Electronics Inc METHOD AND APPARATUS FOR AUDIO SIGNAL DECODING
CN101632117A (zh) 2006-12-07 2010-01-20 Lg电子株式会社 用于解码音频信号的方法和装置
EP2122613B1 (en) 2006-12-07 2019-01-30 LG Electronics Inc. A method and an apparatus for processing an audio signal
US8542802B2 (en) 2007-02-15 2013-09-24 Global Tel*Link Corporation System and method for three-way call detection
US20080201158A1 (en) 2007-02-15 2008-08-21 Johnson Mark D System and method for visitation management in a controlled-access environment
US8017898B2 (en) 2007-08-17 2011-09-13 Magna Electronics Inc. Vehicular imaging system in an automatic headlamp control system
US8451107B2 (en) 2007-09-11 2013-05-28 Magna Electronics, Inc. Imaging system for vehicle
US8290449B2 (en) * 2007-09-18 2012-10-16 California Institute Of Technology Equalization of third-order intermodulation products in wideband direct conversion receiver
KR101434200B1 (ko) * 2007-10-01 2014-08-26 삼성전자주식회사 혼합 사운드로부터의 음원 판별 방법 및 장치
US8446470B2 (en) 2007-10-04 2013-05-21 Magna Electronics, Inc. Combined RGB and IR imaging sensor
GB0720473D0 (en) * 2007-10-19 2007-11-28 Univ Surrey Accoustic source separation
US8131541B2 (en) 2008-04-25 2012-03-06 Cambridge Silicon Radio Limited Two microphone noise reduction system
US20100020170A1 (en) 2008-07-24 2010-01-28 Higgins-Luthman Michael J Vehicle Imaging System
KR101178801B1 (ko) * 2008-12-09 2012-08-31 한국전자통신연구원 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법
US9225838B2 (en) 2009-02-12 2015-12-29 Value-Added Communications, Inc. System and method for detecting three-way call circumvention attempts
JP5375400B2 (ja) * 2009-07-22 2013-12-25 ソニー株式会社 音声処理装置、音声処理方法およびプログラム
JP5400225B2 (ja) 2009-10-05 2014-01-29 ハーマン インターナショナル インダストリーズ インコーポレイテッド オーディオ信号の空間的抽出のためのシステム
US20120300959A1 (en) * 2011-05-26 2012-11-29 Leonard Marshall Ribbon microphone with usb output
CN102749849B (zh) * 2012-07-03 2016-04-27 西安交通大学 一种壳体结构表面变频率特性的主动控制方法
CN104636313B (zh) * 2014-12-16 2017-12-29 成都理工大学 一种冗余扩展单源观测信号的盲信号分离方法
US10572961B2 (en) 2016-03-15 2020-02-25 Global Tel*Link Corporation Detection and prevention of inmate to inmate message relay
US9609121B1 (en) 2016-04-07 2017-03-28 Global Tel*Link Corporation System and method for third party monitoring of voice and video calls
US10429491B2 (en) * 2016-09-12 2019-10-01 The Boeing Company Systems and methods for pulse descriptor word generation using blind source separation
US10324168B2 (en) 2016-09-12 2019-06-18 The Boeing Company Systems and methods for spatial filtering using data with widely different error magnitudes
US10324167B2 (en) 2016-09-12 2019-06-18 The Boeing Company Systems and methods for adding functional grid elements to stochastic sparse tree grids for spatial filtering
US10573291B2 (en) 2016-12-09 2020-02-25 The Research Foundation For The State University Of New York Acoustic metamaterial
US10027797B1 (en) 2017-05-10 2018-07-17 Global Tel*Link Corporation Alarm control for inmate call monitoring
US10225396B2 (en) 2017-05-18 2019-03-05 Global Tel*Link Corporation Third party monitoring of a activity within a monitoring platform
US10860786B2 (en) 2017-06-01 2020-12-08 Global Tel*Link Corporation System and method for analyzing and investigating communication data from a controlled environment
US9930088B1 (en) 2017-06-22 2018-03-27 Global Tel*Link Corporation Utilizing VoIP codec negotiation during a controlled environment call
EP3553773B1 (en) * 2018-04-12 2020-06-03 Spotify AB Training and testing utterance-based frameworks

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5140670A (en) 1989-10-05 1992-08-18 Regents Of The University Of California Cellular neural network
US5208786A (en) 1991-08-28 1993-05-04 Massachusetts Institute Of Technology Multi-channel signal separation
IL101556A (en) 1992-04-10 1996-08-04 Univ Ramot Multi-channel signal separation using cross-polyspectra
US5355528A (en) 1992-10-13 1994-10-11 The Regents Of The University Of California Reprogrammable CNN and supercomputer
US5383164A (en) * 1993-06-10 1995-01-17 The Salk Institute For Biological Studies Adaptive system for broadband multisignal discrimination in a channel with reverberation
US5706402A (en) 1994-11-29 1998-01-06 The Salk Institute For Biological Studies Blind signal processing system employing information maximization to recover unknown signals through unsupervised minimization of output redundancy
US6389445B1 (en) 1995-08-31 2002-05-14 The Trustees Of Columbia University In The City Of New York Methods and systems for designing and making signal-processor circuits with internal companding, and the resulting circuits
US6185309B1 (en) 1997-07-11 2001-02-06 The Regents Of The University Of California Method and apparatus for blind separation of mixed and convolved sources
ATE257985T1 (de) 1998-06-18 2004-01-15 Clarity Llc Adaptive zustandsraum-signaltrennung, unterscheidungs- und rückgewinnungsarchitekturen und ihre anpassungen zur verwendung in dynamischen umgebungen

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101095324B (zh) * 2004-08-30 2012-09-05 京瓷公司 用于对无线通信信号进行盲源分离的系统和方法
CN107710238A (zh) * 2015-06-29 2018-02-16 微软技术许可有限责任公司 具有堆栈存储器的硬件加速器上的深度神经网络处理
CN107710238B (zh) * 2015-06-29 2021-07-23 微软技术许可有限责任公司 具有堆栈存储器的硬件加速器上的深度神经网络处理
CN106789218A (zh) * 2016-12-13 2017-05-31 中国电子科技集团公司第二十研究所 一种基于事件的链路冲突实时仿真方法
CN106789218B (zh) * 2016-12-13 2019-12-31 中国电子科技集团公司第二十研究所 一种基于事件的链路冲突实时仿真方法
CN112434415A (zh) * 2020-11-19 2021-03-02 中国电子科技集团公司第二十九研究所 一种面向微波光子阵列系统射频前端异构模型的实现方法
CN112434415B (zh) * 2020-11-19 2023-03-14 中国电子科技集团公司第二十九研究所 一种面向微波光子阵列系统射频前端异构模型的实现方法
CN114970607A (zh) * 2022-05-06 2022-08-30 北京谛声科技有限责任公司 基于深度神经网络声发射信号分离的变压器局放检测方法
CN114970607B (zh) * 2022-05-06 2024-03-29 北京谛声科技有限责任公司 基于深度神经网络声发射信号分离的变压器局放检测方法

Also Published As

Publication number Publication date
AU740617B2 (en) 2001-11-08
EP0990306B1 (en) 2003-08-13
JP2002507351A (ja) 2002-03-05
CA2294262A1 (en) 1998-12-23
AU740617C (en) 2002-08-08
WO1998058450A1 (en) 1998-12-23
JP4477148B2 (ja) 2010-06-09
AU8162998A (en) 1999-01-04
EP0990306A1 (en) 2000-04-05
DE69817181D1 (de) 2003-09-18
ATE247340T1 (de) 2003-08-15
US6625587B1 (en) 2003-09-23
HK1027444A1 (en) 2001-01-12
DE69817181T2 (de) 2004-06-17

Similar Documents

Publication Publication Date Title
CN1264507A (zh) 用于盲目信号分离的方法与装置
CN1643571A (zh) 用于与通信系统一起使用的麦克风和声音活动检测(vad)配置
CN1242376C (zh) 声音识别系统、装置、声音识别方法
CN1193644C (zh) 用频谱减少来降低双送话器信号噪声的系统和方法
JP4186745B2 (ja) マイクロホン装置、ノイズ低減方法および記録装置
CN1664610A (zh) 使用传声器阵列聚束的系统和方法
CN1898943A (zh) 用于处理输入信号的设备和方法
CN1436436A (zh) 用于话音信号提取的方法和设备
CN1716381A (zh) 用循环正则化作多通道回声的消除
CN1783958A (zh) 用于检测物理量分布的半导体设备及电子装置
CN1717720A (zh) 声处理系统、声处理装置、声处理方法、声处理程序及存储媒体
CN1864322A (zh) 用于发射系统的自适应预矫正
CN1238969C (zh) 将多个输入信号分离成多个输出信号的系统
CN101030990A (zh) 回声防止电路、滤波系数设定方法及程序
US9949041B2 (en) Hearing assistance device with beamformer optimized using a priori spatial information
TWI807285B (zh) 聲音採集裝置、聲音處理設備及方法、裝置、存儲介質
CN1620190A (zh) 信号转换器、输出放大设备声频装置和发射与接收系统
CN1538784A (zh) 音响信号处理装置及其方法
CN1543708A (zh) 提供用最小二乘导出的脉冲响应误差特性估计量的方法与装置
Hu et al. Sound zone control with fixed acoustic contrast and simultaneous tracking of acoustic transfer functions
Hu et al. Inspection of the secondary path modeling in active noise control from the viewpoint of channel identification in stereo acoustic echo cancellation
Männchen et al. Design and electroacoustic analysis of a piezoelectric MEMS in-ear headphone
TWI790578B (zh) 矽基麥克風裝置及電子設備
CN1838704A (zh) 回波防止电路、数字信号处理电路及滤波系数设定方法
CN1106069C (zh) 音响信号波形加重处理装置及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication