DE69817181T2

DE69817181T2 - Verfahren und gerät zur blindseparierung von signalen

Info

Publication number: DE69817181T2
Application number: DE69817181T
Authority: DE
Inventors: Gamze Erten; M. Fathi SALAM
Original assignee: Clarity Ann Arbor LLC; Clarity LLC
Current assignee: Clarity Ann Arbor LLC; Clarity LLC
Priority date: 1997-06-18
Filing date: 1998-06-18
Publication date: 2004-06-17
Anticipated expiration: 2018-06-19
Also published as: HK1027444A1; EP0990306B1; EP0990306A1; ATE247340T1; AU8162998A; US6625587B1; CN1264507A; JP2002507351A; AU740617C; JP4477148B2; DE69817181D1; CA2294262A1; AU740617B2; WO1998058450A1

Description

VERWEIS AUF VERWANDTE ANMELDUNG
Diese Anmeldung ist eine Continuation in Part der provisorischen US-Patentanmeldung mit dem Titel ARCHITECTURES, FRAMEWORKS, ALGORITHMS AND DEVICES FOR REAL TIME ADAPTIVE SIGNAL SEPARATION, DISCRIMINATION AND RECOVERY, Seriennummer 60/050 147, angemeldet am 18. Juni 1997, mit den Erfindern Gamze Erten und Fathi M. Salam.
HINTERGRUND DER ERFINDUNG
Gebiet der Erfindung
Die vorliegende Erfindung bezieht sich auf Verfahren und eine Vorrichtung zur Rückgewinnung bzw. Wiedefierstellung ursprüngliche(r/n) Signalinformation oder -inhalte durch das Verarbeiten mehrerer Meßwerte bzw. Messungen von einem Satz bzw. einer Menge von gemischten Signalen. Genauer gesagt bezieht sich die Erfindung auf adaptive Systeme zur Wiederherstellung mehrerer ursprünglicher Signale aus empfangenen Meßwerten ihrer Mischungen.
Diskussion der verwandten Technik
Die Wiederherstellung und Trennung von unabhängigen Quellen ist ein klassisches, aber schwieriges Problem bei der Signalverarbeitung. Das Problem ist kompliziert aufgrund der Tatsache, daß in vielen Situationen in der Praxis viele relevante Eigenschaften sowohl der Signalquellen als auch der mischenden Medien unbekannt sind.
Um das Problem am besten zu verstehen, ist die folgende Problemfeststellung hilfreich: Unter Bezug auf 1 der Zeichnungen betrachten wir N unabhängige Signale 102, s₁(t), ... und s_N(t). Die unabhängigen Signale 102 können irgendwelche oder eine Kombination von unabhängigen Sprechern oder Ansprachen, Geräuschen, Musik, funk- oder lichtbasierten drahtlosen Übertragungen, elektronischen oder optischen Kommunikationssignalen, stehenden Bildern, Videos, etc. sein. Die unabhängigen Signale 102 können durch natürliches oder synthetisches Mischen in dem Medium oder der Umgebung 104, durch welches sie sich fortpflanzen bzw. ausbreiten, untereinander verzögert und überlagert sein. Ein Signaltrennungsprozeß 106 transformiert die Mischung der unabhängigen Signale 102 in Ausgangssignale 108, u₁(t), ... und u_N(t).
Zwei Hauptkategorien von Verfahren werden häufig zur Wiederherstellung und Trennung der unabhängigen Quellen verwendet: neuronal inspirierte, adaptive Algorithmen und herkömmliche diskrete Signalverarbeitung.
Neuronal inspirierte, adaptive Architekturen und Algorithmen folgen einem Verfahren, das ursprünglich von J. Herault und C. Jutten vorgeschlagen wurde, und jetzt Herault-Jutten (oder HJ) Algorithmus genannt wird. Man erkennt, daß dieser Satz bzw. diese Menge von Verfahren für CMOS-Integration geeignet ist. Jedoch ist der Standard-HJ-Algorithmus bestenfalls heuristisch mit vorgeschlagenen Anpassungsregeln, von denen gezeigt wurde, daß sie vorwiegend unter speziellen Umständen funktionieren. Die Theorie und die Analyse früherer Arbeiten, die sich auf den HJ-Algorithmus beziehen, sind immer noch nicht ausreichend, um den Erfolg, der sich in experimentellen Simulationen einstellt, zu belegen oder zu garantieren. Herault und Jutten erkennen diese analytischen Schwächen bzw. Nachteile an, und sie beschreiben zusätzliche Probleme, die zu lösen sind. Ihr vorgeschlagener Algorithmus geht von einem linearen Medium und keinerlei Filterung oder keinerlei Verzögerungen aus. Insbesondere wird davon ausgegangen, daß die ursprünglichen Signale über das Medium mittels einer Matrix von unbekannten, aber konstanten Koeffizienten übertragen werden. Um es zusammenzufassen, ist das Herault-Jutten-Verfahren (i) auf vollständig und linear statisch mischende Umgebungen beschränkt, (ii) benötigt Matrixinvertierungsoperationen und (iii) berücksichtigt nicht das Vorliegen von Signalverzögerungen. Bei vielen praktischen Anwendungen treten jedoch Filterung und relative Verzögerungen auf. Dementsprechend scheitern diese Verfahren in vielen praktischen Situationen und Anwendungen aus der realen Welt dabei, die Signale erfolgreich zu trennen.
Herkömmliche Ansätze zur Signaltrennung bei der Signalverarbeitung gehen meistens auf die diskrete Domäne im Geiste der traditionellen, digitalen Signalverarbeitungsverfahren zurück und verwenden statistische Eigenschaften von Signalen. Solche Verfahren zur Signaltrennung setzen Berechnungen ein, die meistens diskrete Signaltransformationen und ein Invertieren der Filter/Transformationsfunktion nach sich ziehen. Die statistischen Eigenschaften der Signale in der Form einer Menge von Kumulanten werden verwendet, um eine Trennung von gemischten Signalen zu erreichen, wobei die Korrelation dieser Kumulanten mathematisch zu einer Annäherung gegen Null gebracht wird. Dies stellt die Krux bei der Familie von Algorithmen dar, die nach Parametern von Übertragungsfunktionen suchen, welche die Signale wiederherstellen und voneinander trennen. Andererseits würde die Berechnung aller möglichen Kumulanten nicht praktikabel und zu zeitaufwendig für eine Echtzeitimplementierung sein.
Die Spezifika dieser beiden Verfahren werden unten näher ausgeführt.
Neuronal inspirierte Architektur und Algorithmen zur Signaltrennung bzw. -separierung
Diese Sätze von neuronal inspirierten, adaptiven Ansätzen zur Signaltrennung bzw. -separierung gehen davon aus, daß der "statistisch unabhängige" Signalvektor S(t) = [s₁(t), ... und s_N(t)]^T gemischt wird, um den Signalvektor M(t) zu erzeugen. Der Vektor M(t) wird von den Sensoren (z. B. Mikrofonen, Antennen, etc.) empfangen.
Die mischende Umgebung sei durch den allgemeinen (statischen oder dynamischen) Operator r repräsentiert. Dann gilt M(t) = τ(S(t)) Gleichung (1)
Es gibt verschiedene Formulierungen, die verwendet werden können, um den Mischungsprozeß, d. h. den Operator τ, auf eine "blinde" Art und Weise zu invertieren, bei der keine a priori Kenntnis über die Natur oder den Inhalt des Mischungsoperators τ oder die ursprünglichen Quellen S(t) vorliegt. Wir gruppieren diese in zwei Kategorien, statisch und dynamisch. Zusätzliche Unterscheidun gen können bezüglich der Natur der angewandten Adaptionskriterien vorgenommen werden, z. B. Informationsmaximierung, Minimierung der Kumulanten hoher Ordnung, etc.
Der statische Fall. Der statische Fall ist auf das Mischen durch eine konstante, nichtsinguläre Matrix beschränkt. Nehmen wir an, daß der "statistisch unabhängige" Signalvektor S(t) = [s₁(t), ... und s_N(t)]^T gemischt wird, um den Signalvektor M(t) zu erzeugen. Speziell sei der Mischungsoperator τ durch eine konstante Matrix A repräsentiert, nämlich M(t) = A S(t) Gleichung (2)
Die 2A und 2B zeigen zwei Architekturen des Netzwerks zur Signaltrennung und Wiederherstellung im Falle eines statischen Mischens durch eine Mischungsmatrix A. U(f) ist die Ausgangsgröße, welche die ursprünglichen Signale S(t) annähert bzw. approximiert. Y(t) enthält die Werte, die beim Aktualisieren der Parameter des Entmischungsprozesses verwendet werden, d. h. W in 2A und D in 2B. Die Architektur in 2A berechnet notwendigerweise die Inverse der konstanten Mischungsmatrix A, was es erforderlich macht, daß A^–1 invertierbar ist, d. h. daß A^–1 existiert. Die Architektur in 2B unterliegt nicht der Einschränkung, nach der die Elemente außerhalb der Diagonalen der Matrix D bei Konvergenz exakt diejenigen der Elemente außerhalb der Diagonalen der Matrix A sind. In diesem Fall sind die Diagonalenelemente der Matrix A jedoch darauf eingeschränkt, gleich "1.0" zu sein. Indem die Diagonalenelemente von D auf Null gesetzt werden, kommt man im Wesentlichen zu dem Schluß, daß der Mischungsprozeß auch dann invertierbar sein kann, wenn es die Mischungsmatrix nicht ist. Wie in den 2A und 2B gezeigt, verwendet die Gewichtungsaktualisierung eine Funktion der Ausgangsgröße U(t). Die Aktualisierung der Einträge dieser beiden Matrizen wird durch die Kriterien definiert, die für die Signaltrennung, -unterscheidung oder -wiederherstellung verwendet werden, z. B. Informationsmaximierung, Minimierung der Kumulanten hoher Ordnung, etc.
Als ein Beispiel könnte eine mögliche Aktualisierungsregel für die Gewichtung für den Fall, in dem U(t) = W M(t) Gleichung (3)ist, sein
wobei η hinreichend klein ist, g eine ungerade Funktion ist und M die Menge von Mischungen ist, U die Menge von Ausgaben ist, welche die Quellsignale abschätzen, das hochgesetzte T bezeichnet die Transponierte, und –T bezeichnet die Inverse der Transponierten. Es ist zu beachten, daß die Funktion g eine zusätzliche Rolle beim Aktualisieren spielt, was zu dem Diagramm von oben in Beziehung gesetzt werden kann als Y(t) = g(U(t)) Gleichung (5)
Man verwendet Gleichung (4), um die Einträge von W in Gleichung (3) zu aktualisieren. Durch diesen iterativen Aktualisierungsvorgang, konvergieren die Einträge von W so, daß das Produkt WA ungefähr gleich der Identitätsmatrix oder einer Permutation der Identitätsmatrix ist.
Andererseits wird in 2B eine möglicherweise nützliche Regel für die Aktualisierung der Einträge d_ij von Matrix D allgemein beschrieben als dij = ηf(ui(f))g(uj(t)) Gleichung (6)wobei η hinreichend klein ist. In der Praxis umfassen einige nützliche Funktionen für f eine kubische Funktion und für g eine hyperbolische Tangensfunktion. Wenn diese Prozedur verwendet wird, löst man rechnerisch für U(t) aus Gleichung (7) unten U(t) = [I + D]–1M(t) Gleichung (7)bei jedem aufeinander folgenden Schritt und Abtast-Punkt. Diese Berechnung ist eine potentiell schwere Belastung, insbesondere für hochdimensionale D.
Der dynamische Fall. Das dynamische Mischungsmodell berücksichtigt realistischere Mischungsumgebungen, definiert solche Umgebungsmodelle und entwickelt ein Aktualisierungsgesetz, um die ursprünglichen Signale innerhalb dieses Rahmens wiederherzustellen.
In dem dynamischen Fall ist die Matrix A keine konstante Matrix mehr. Unter Bezug auf die Rückkopplungsstruktur des statischen Beispiels ist es einfacher, Gleichung 7, wobei U(f) = [I + D]^–1 M(t) ist, als eine Gleichung der schnellen dynamischen Gleichung zu betrachten τU(t) = –U(t) – DU(t) + M(t) Gleichung (8)
Dies erleichtert die Berechnung durch Initialisieren der Differentialgleichung in Gleichung (8) mit einer beliebigen Schätzung. Es ist jedoch wichtig, die Trennung von Zeitskalen zwischen Gleichung (8) und der Aktualisierungsprozedur wie derjenigen, die durch Gleichung (6) definiert ist, sicherzustellen. Dies kann sichergestellt werden, indem n in Gleichung (6) und r in Gleichung (8) hinreichend klein gemacht werden.
Wenn wir annehmen, daß die Dimensionalität von M(f) gleich N ist, kann ein Satz von Differentialgleichungen, die den dynamischen Signaltrennungsalgorithmus definieren, geschrieben werden als
für i = 1, ..., N
Dies ist eine Aufzählung von N Differentialgleichungen. Zusätzlich kann der Adaptionsprozeß für die Einträge der Matrix D durch mehrere Kriterien definiert werden, z. B. die Auswertung der Funktionen f und g in Gleichung (6). 3 ist eine bildliche Darstellung des dynamischen Modells in Rückkopplungskonfiguration. U(t) nähert S(t) an bzw. approximiert S(t). Die Funktion g definiert die Kriterien, die für eine Gewichtungsaktualisierung des Rückkopplungsnetzwerkes verwendet werden.
Die Anwendung von Signaltrennungskriterien für die Adaption von Parametern. Innerhalb der Architekturen, die bisher definiert wurden, wurde wenig zu Prozeduren für die Anwendung der Adaptionskriterien dargelegt. Zwei implizierte Prozeduren wurden erwähnt:
Die erste ist die Anwendung der Signaltrennungsfunktionen, Adaptionsprozeduren und -kriterien auf beliebige, zufällige Punkte von Daten – unabhängig davon, ob auf jeden von diesen Punkten praktisch und physikalisch zugegriffen werden kann oder nicht. Daher wendet die adaptive Trennungsprozedur die Adaptionsfunktionen und -kriterien auf jedes Element der gemessenen gemischten Signale individuell und augenblicklich an, woraufhin geeignete Aktualisierungen von Parametern vorgenommen werden.
Die zweite Art von Prozedur, die in 2A beschrieben ist, verwendet Gleichung (3). In diesem Fall werden die Kriterien auf die gesamte Datenmenge oder auf ausgewählte Datenpunkte aus der gesamten Datenmenge angewandt. Daher schreitet der zugehörige Adaptionsprozeß nicht pro Abtastung voran, sondern verwendet die ganze Datenmenge, auf die eine angenommene bzw. unterstellte konstante, statische Mischungsmatrix angewandt wird. Auch wenn dieses Verfahren in gewissem Maße robuster als das erste ist, ist es im Wesentlichen ein Offline-Verfahren, das nicht für Signaltrennung in Echtzeit geeignet ist. Darüber hinaus erleidet die Exaktheit bzw. Genauigkeit des Entmischungsprozesses Einbußen, wenn die Annahme einer statischen, konstanten Matrix nicht richtig ist.
Der übertraaungsfunktionsbasierte Ansatz zur Signaltrennung bzw. -separierung
Die Darstellung bzw. Repräsentation der Signalmischung und -trennung bzw. -separierung durch Übertragungsfunktionen macht diesen Ansatz zu einem dynamischen Umgebungsmodell und -verfahren.
Eine Struktur zum Trennen zweier Signale durch das Verarbeiten zweier Mischungsmessungen ist in den 4A und 4B dargestellt. Die 4A und 4B zeigen eine herkömmliche Repräsentation für eine Übertragungsfunktion für eine Signalmischung und -trennung für ein System mit zwei Signalen. Die zwei Signale U₁ und U₂ approximieren S₁ und S₂. G invertiert den Mischungsprozeß, der als H modelliert ist. Solch ein Übertragungsfunktionsansatz ist weder praktikabel noch erweiterbar im Fall von höherdimensionalen Signalen mit mehr als zwei Dimensionen. Darüber hinaus hat die Ausdehnung bzw. Erweiterung der Mischungsumgebung auf die Übertragungsfunktionsdomäne auch die Zeitdomänennatur der Signale beseitigt bzw. entfernt. Dies verursacht auch den Ausschluß der Anfangsbedingungen aus dem Satz von Gleichungen.
Diese Architekturen für die Trennungsfunktionen in der Übertragungsfunktionsdomäne führen zu drei ernsthaften Defiziten, die alle somit Hindernisse für den Entwurf und die Implementierung eines brauchbaren Verfahrens und einer Vorrichtung darstellen. Als erstes schließt die so ausgedrückte Formulierung die Verallgemeinerung der Trennungsprozedur auf höhere Dimensionen aus, wenn die Dimensionalität des Problems zwei übersteigt. Mit anderen Worten gibt es keine brauchbare Formalisierung des Trennungsverfahrens, wenn es mehr als zwei Mischungen und zwei Quellen gibt. Man kann dies durch direkten Bezug auf aktuelle Verfahren veranschaulichen, bei denen Ma trixmultiplikationsterme ausgeschrieben werden, so daß jede skalare Gleichung einen der Einträge der resultierenden Produktmatrix definiert, die wunschgemäß gleich Null sein sollen. Da Permutationen einer Diagonalmatrix auch zulässig sind, werden mehrere Sätze von Gleichungen erstellt. Für ein Problem mit zwei Mischungen führt dies zu zwei Paaren (insgesamt vier) von Gleichungen, jede mit zwei Produkttermen. Jenseits davon steigt die Anzahl von Gleichungen an. Um genau zu sein, ist die Anzahl von benötigten Gleichungen zur Beschreibung der Anzahl von Gleichungen für eine spezifische Permutation des N-dimensionalen Falles gleich (N² – N). Für das zweidimensionale Problem ist dieser Wert gleich 2.
Zweitens wird die Invertierungsprozedur für die Übertragungsfunktion ad hoc erstellt und es gibt kein Rezept oder Anleitung dafür. Der Einfluß der Dimensionalität spielt eine entscheidende bzw. zentrale Rolle dabei. Aus dem Verfahren wird ersichtlich, daß die resultierende Architektur zu Netzwerken führt, die Übertragungskomponenten benötigen, deren (Größen) Ordnung von Produkten der Übertragungskomponenten der Mischungsumgebung abhängt. Daher kann man keine Netzwerkarchitektur mit einer festen (Größen) Ordnung entwerfen.
Drittens können die Anfangsbedingungen nicht definiert werden, da die Formulierung nicht in der Zeitdomäne liegt und nicht mit beliebigen Anfangsbedingungen initialisiert werden kann. Folglich ist das Verfahren nicht für Echtzeit- oder Online-Signaltrennung geeignet.
Was benötigt wird, ist ein Verfahren zur Trennung gemischter Signale durch Medien oder Kanäle, bei denen eine hohe Qualität von Signaltrennung erreicht wird. Was benötigt wird, ist ein Verfahren, gemischte Signale, die durch verschiedene Medien übertragen werden, wiederherzustellen und zu trennen, wobei die Trennung der Signale von solch hoher Qualität ist, daß (i) die Signalübertragungskapazität des Mediums oder des Kanals, (ii) die Qualität des empfangenen Signals oder (iii) beides wesentlich gesteigert wird. Die Medien oder Kanäle können sowohl eine Kombination von Leitungen, Kabeln, Glasfasern, drahtlosen funk- oder lichtbasierten Frequenzen oder Bändern als auch eine Kombination von festen, flüssigen, gasförmigen Partikeln oder Vakuum umfassen.
ZUSAMMENFASSUNG DER ERFINDUNG
Ein erster Aspekt der vorliegenden Erfindung richtet sich auf ein Signalverarbeitungssystem gemäß Anspruch 1.
Ein zweiter Aspekt der vorliegenden Erfindung richtet sich auf ein Verarbeitungsverfahren zur Signaltrennung gemäß Anspruch 28.
Ein dritter Aspekt der vorliegenden Erfindung richtet sich auf ein akustisches Signalunterscheidungssystem gemäß Anspruch 46.
KURZBESCHREIBUNG DER ZEICHNUNGEN
1 zeigt eine grafische Darstellung des Problems der Signaltrennung, -unterscheidung und -wiederherstellung.
Die 2A und 2B zeigen zwei statische, neuronale Netzwerkstrukturen zur Signaltrennung.
3 zeigt eine Architektur des Netzwerks zur Signaltrennung und -wiederherstellung im Falle von Rückkopplung dynamischer Mischungs- und Trennungsmodelle.
Die 4A und 4B zeigen eine herkömmliche Übertragungsfunktionsrepräsentation und ein Verfahren für die Signalmischung und -trennung für ein System mit zwei Signalen.
5A zeigt ein Prozeßflußdiagramm eines Verfahrens der vorliegenden Erfindung.
5B zeigt eine herkömmliche Frequenzdomänenrepräsentation für die Signalmischung und -trennung mittels einer Übertragungsfunktion.
Die 6A und 6B zeigen zwei Mischungsmodelle für die Architektur (in) der Zustandsraum-Zeit-Domäne.
Die 7A und 7B zeigen zwei Signaltrennungsmodelle für die Architektur (in) der Zustandsraum-Zeit-Domäne.
8 zeigt eine Architektur einer typischen DSP-Implementierung.
9 zeigt eine interne Architektur eines typischen DSP.
10 zeigt Adaptionsprozesse mit mehreren Strängen.
11 zeigt eine Ausführungsform eines langen Stack- bzw. Kellerspeichers mit konstanter Breite, die auf einem First-In-First-Out (FIFO) Stackkonstrukt und einem Prozeß zur Datenakquisition beruht.
12 zeigt eine weitere Ausführungsform eines langen Stack- bzw. Kellerspeichers mit konstanter Breite, die auf einem First-In-First-Out (FIFO) Stackkonstrukt beruht.
Die 13A und 13B zeigen eine Anwendung der Trennungskriterien unter Verwendung einer Menge von Datenpunkten (kurzer Stack) aus einem langen Stack, der alle relevanten Mengen von Datenpunkten enthält, die über ein Zeitfenster gemessen oder berechnet wurden.
14 zeigt eine Audioanwendung, die auf den Prozeduren zur Signaltrennung und -wiederherstellung gemäß dieser Erfindung beruht.
15 zeigt drei Audioeingabeschnittstellen für das Handgerät auf DSP-Basis, das in die Mikrofon-DSP-Schnittstelle eingebettet sein kann.
16 zeigt eine Skizze einer Audioeinrichtung, die zur Verwendung mit der vorliegenden Erfindung geeignet ist.
17 zeigt ein intelligentes Mikrofon-Array-Gerät.
DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
5A zeigt ein Prozeßflußdiagramm eines Verfahrens der vorliegenden Erfindung. Dieses enthält: (1) Samples bzw. Abtastungen beschaffen (Block 502); (2) interpolieren oder "upsampling" bzw. "höher abtasten" (Block 504); (3) Sample- bzw. Abtastmengen auswählen (Block 506); (4) adaptive Parameter berechnen (Block 508); (5) interne Zustände berechnen (Block 510); (6) Ausgaben berechnen (Block 512); und (7) Ausgaben speichern und/oder darstellen (Block 514).
Das Beschaffen von Samples bzw. Abtastungen beinhaltet das Beschaffen der Mehrkanal-Daten, die durch mehrere Sensoren, z. B. Mikrofone, aufgenommen werden. Solche Daten könnten auch aus zuvor gemischten Tonspuren kommen, z. B. in einem Aufnahmestudio gemischte Signale. Die Daten können Online für einen Echtzeit-Prozeß abgetastet oder aus einem Speichermedium, Band, Festplattenlaufwerk, etc. abgerufen werden.
Das Interpolieren wird für Algorithmen durchgeführt, die ein Oversampling bzw. eine Überabtastung benötigen. Wenn ein Oversampling der Signale nicht möglich ist (z. B. vorher aufgenommene Tonspuren) oder nicht praktikabel ist, kann man zwischen den Abtastpunkten interpolieren, um mehr Datenpunkte für die selbe Dauer des Signals zur Verfügung zu haben. Upsampling bzw. höhere Abtastung kann abhängig von der Abtastrate der beschafften Daten und der Zieleingabedatenrate durch Upsampling um einen bestimmten Faktor durchgeführt werden. Um zum Beispiel aus Daten, die mit 10 kHz abgetastet wurden, Daten von 60 kHz zu machen, ist der Upsampling-Faktor gleich 6. Mit anderen Worten werden je fünf Punkte zwischen allen verfügbaren Abtastpunkten erzeugt.
Das Auswählen der Sample-Menge zieht das Auswählen der Datenpunkte, die bei jeder Iteration des Prozesses verwendet werden, nach sich.
Das Berechnen adaptiver Parameter kann ein Verfahren beinhalten, das die Ableitungen einer Funktion benutzt, um den Wert der Funktion zu berechnen (die Funktion sind in diesem Fall die adaptiven Parameter). Die meisten dieser Verfahren werden als Integrationsverfahren zum Lösen von Differentialgleichungen bezeichnet, z. B. Runge-Kutta.
Das Berechnen interner Zustände geht einher mit dem Betrachten der Architektur. Diese internen Zustände können auch die Form tatsächlicher Zustände und Ableitungen dieser Zustände haben oder die Form von Samples bzw. Abtastmengen über die Zeit bzw. über eine gewisse Zeit. Zustandswerte können aus ihren Ableitungen unter Verwendung verschiedener Arten von Integrationsverfahren zum Lösen von Differentialgleichungen berechnet werden, z. B. Runge-Kutta.
Das Berechnen der Ausgaben verwendet die Zustände und Parameter, die zuvor berechnet wurden.
Eine Unterscheidung kann bei der Kategorisierung der Architekturen der vorliegenden Erfindung gemacht werden. Diese bezieht sich auf die Mischungs- und Trennungsprozeßmodelle und definiert die Prozedur der Unterscheidung bzw. Ansprechschwelle beim Separieren oder der Wiederherstellung – abhängig von der Anwendungsumgebung und der Art der gemessenen Signale. Diese Unterscheidung legt die mathematischen Gleichungen und Axiome sowohl für das Mischungsals auch für das Trennungsmodell fest und findet daher sowohl für die Mischungs- als auch für die Trennungsprozeduren Anwendung.
Es gibt drei Mengen von Architekturen und Verfahren, die wie folgt aufgezählt werden können:

1. Übertragungsfunktionsbasierte Frequenzbereichsarchitektur und -verfahren.
2. Zustandsraum-Zeitdomänen-Architektur und -Verfahren.
3. Abbildungsarchitektur und -verfahren.

Übertragungsfunktionsbasierte Frequenzbereichs-Signaltrennungs-Architektur und -Verfahren
5B zeigt eine herkömmliche Darstellung für Signalmischung und -trennung auf der Basis des Übertragungsfunktions-Frequenzbereichs. U(s) und S(s) sind mehrdimensionale Signale, und U(s) approximiert S(s). H(s) invertiert den Mischungsprozeß, der als H(s) modelliert ist. Die Berechnung dieser Inversen kann die Konstruktion herkömmlicher Signalfilter oder Maximierungs- oder Minimierungsfunktionen oder von Kriterien, die auf optimaler Steuerungs- bzw. Kontrolltheorie und dem Vanationskalkül beruhen, einbeziehen.
Für die Beziehung zwischen den gemessenen gemischten Signalen M(t) und den ursprünglichen Quellen der Signale S(t), die als eine Übertragungsfunktion darzustellen ist, muß man annehmen, daß die Umgebung eine lineare Invariante der Zeit ist. Das kommt daher, daß man nur lineare, zeitinvariante Beziehungen durch eine Übertragungsfunktion darstellen kann. Daher geht eine Formulierung des Signaltrennungsproblems durch eine Übertragungsfunktion, wenn sie dynamische und filternde Effekte umfaßt, ebenso von einer zeitinvarianten (stationären) Umgebung aus.
Es gibt jedoch viele Anwendungen dieser Formulierung auf wohldefinierte Signale mit beschränktem Frequenzbereich, über die viele solche Annahmen getroffen werden können.
Die Beziehung zwischen der Laplace-Transformation des Quellsignals S(f), d. h. S(s) und der Laplace-Transformation des gemessenen, gemischten Signals M(t), d. h. M(s) ist wie folgt definiert:
Ziel dieser Erfindung ist es, ohne Kenntnis des tatsächlichen H(s), H(s) als die Inverse von H(s) zu erhalten und somit die ursprünglichen Signale wiederherzustellen.
Die Ausführung dieses Prozesses für zwei Signale, d. h. bei dem die Dimensionalität sowohl von S als auch von M zwei ist, ist möglich, wegen des Produktes
oder
Für diesen zweidimensionalen Fall ist der Satz von Gleichungen, die erfüllt sein müssen, leicht lösbar. Beim Ausdehnen der Architektur auf mehr als zwei Signale, setzt man gleich: H(s)H(s) = T(s) Gleichung (13)wobei T(s) von diagonaler Form ist. Wenn man T(s) gleich der Identität setzt, in der alle diagonalen Einträge gleich 1.0 sind, dann gilt H(s) = H(s)–1 Gleichung (14)und daher
wobei adj(H(s)) die Matrix ist, ei welcher der (i,j)-te Eintrag als der (j,i)-ten Kofaktor berechnet ist. Der (j,i)-ten Kofaktor ist seinerseits gleich (–1)^j+i mal die-Determinante der Matrix, die durch Entfernen der j-ten Zeile und der i-ten Spalte von H(s) gebildet wird. Man kann weiter definieren
Somit stellt sich eine generalisierte Struktur für höhere Dimensionen als ein durch Gleichung (16) definiertes Netzwerk heraus. Es ist zu beachten, daß man in diesem Fall hat: H(s)H(s) = det(H(s))I Gleichung (17)
Die tatsächliche Formulierung der Elemente h_ij(s) der Transferfunktion H(s) ist abhängig von den Eigenschaften des mischenden Mediums und dem Verhalten und der Interaktion der ursprünglichen Signalquellen oder ihrer Komponenten.
Die Prozesse für die Konstruktion der Elemente des Trennungsfilters H(s) würden erfordern, daß das Produkt H(s)H(s) eine Identitäts- bzw. Einheitsmatrix oder eine Permutation davon ist, oder alternativ eine Diagonalmatrix wie in Gleichung (17) gezeigt. Die Berechnung dieser Inversen wird jenseits des zweidimensionalen Falles schwerfällig. Das Hinzufügen bzw. die Addition jedes Signals erzeugt eine wesentliche Rechenlast. Nichtsdestoweniger kann dieser Prozedur in der Theorie gefolgt werden, wenn man die Spezifika der Signale und des mischenden Mediums kennt.
Eine Beispielprozedur für die Verwendung dieser Architektur für die Unterscheidung bzw. Ansprechschwelle bei der Signaltrennung und für die Wiederherstellung kann wie folgt zusammengefaßt werden:

1. Eine Speicherstruktur aufbauen und reservieren, die für das Speichern sowohl der Meßwerte als auch der Ergebnisse der Daten, die von der Verarbeitung der Meßwerte herrühren, verwendet wird.
2. Eine Übertragungsfunktionsmatrix mit N × N Elementen konstruieren, welche die Übertragungsfunktion H(s) darstellt (die Inverse der mischenden Übertragungsfunktion), deren Einträge skalare Übertragungsfunktionen sind.
3. Eine neue Menge von Meßwerten oder gemischten Signalen empfangen.
4. Die neue Menge von Meßwerten verarbeiten.
5. Die Kriterien und Funktionen zur Signaltrennung auswerten.
6. Die Parameter der Filter- und Übertragungsfunktionselemente entsprechend aktualisieren.
7. Beweismaterial bzw. Indizien für die Änderung der Parameter der Übertragungsfunktion oder der Definitionen sammeln.
8. Die neue Menge von Meßwerten verarbeiten, um die ursprünglichen Signale (vor dem Mischen) abzuschätzen, und die Ergebnisse dieser Prozesse, soweit notwendig, speichern.
9. Erfolgreiche Trennungs- und Ansprechschwellen-Indikatoren auswerten.
10. Falls die Speicherreservierung unzureichend oder unpassend ist, zu Schritt 1 gehen.
11. Falls die Änderung der Filterformulierung passend ist, weitermachen, sonst zu Schritt 2 gehen.
12. Zu Schritt 3 gehen.

Man kann die Übertragungsfunktion in eine Zustandsraum-Darstellung übersetzen mit dem zusätzlichen Vorteil, die Auswirkung von Anfangsbedingungen einzuschließen. Dieser Einschluß wird besonders wichtig, wenn man das Mischungsumgebungsmodell in dem allgemeinen Sinn betrachtet, z. B. können sich die tatsächlichen Eigenschaften der Mischungsübertragungsfunktion über die Zeit verändern. Dieses spezielle Verfahren der Erfindung wird im nächsten Abschnitt beschrieben.
Architektur und Verfahren (in) der Zustandsraum-Zeit-Domäne
Die 6A und 6B zeigen zwei Mischungsmodelle für die Zustandsraum-Zeit-Domänen-Architektur. 6A zeigt einen allgemeinen Grundaufbau. 6B zeigt einen speziellen Fall, in dem A und B fest sind, und ihre Beziehung zu herkömmlicher Signalverarbeitung. Beide Modelle sind auf mehrere Arten von Trennungsarchitekturen anwendbar.
Die 7A und 7B zeigen zwei Signaltrennungsmodelle für die Architektur (in) der Zustandsraum-Zeit-Domäne. 7A zeigt ein allgemeines Modell und eine allgemeine Architektur. 7B zeigt einen speziellen Fall, es ist nur das Modell ohne die Pfeile in 7A abgebildet, welche die Prozeduren zur Parameteraktualisierung darstellen.
Diese Architektur der Erfindung modelliert sowohl die Mischungs- als auch die Trennungsumgebung als ein lineares, dynamisches System. Auf diese Weise werden die Parameter der Mischungsumgebung durch eine Realisierung
= (A, B, C, D) wie in 6A dargestellt; wohingegen
= (A, B, C, D) die Realisierung der Trennungsumgebung, wie in 7A dargestellt, ist. Diese Parameter bestimmen die Dynamik der Umgebungen für das Mischen und die Trennung. Während die Realisierung
quasi-konstant ist und das Verhalten der Mischungsumgebung modelliert, ist die Realisierung
durch den Trennungsprozeß zu definieren.
Das Mischungsmodell für die Architektur (in) der Zustandsraum-Zeit-Domäne gilt für mehrere Arten von Trennungsarchitekturen. Das Modell ist eine architektonische Abbildung der mathematischen Gleichungen: x = Ax + Bs Gleichung (18) m = Cx + Ds Gleichung (19)
Andererseits kann die Signaltrennungsarchitektur (in) der Zustandsraum-Zeit-Domäne wie in 7A gezeigt mathematisch beschrieben werden als: x . = Ax + Bm Gleichung (20) u = Cx + Dm Gleichung (21)
Diese Architektur definiert die notwendige Prozedur zur Verwendung dieser mathematischen Struktur bei der Signaltrennung, Ansprechschwelle und Wiederherstellung. Dies erfordert die Definition einer Prozedur oder eines Satzes bzw. einer Menge von Prozeduren für die Signaltrennungs-, Ansprechschwellen- und Wiederherstellungsalgorithmen in einer solchen Art und Weise, daß, wenn diese Prozeduren ausgeübt werden, die notwendigen Parameter gegen eine stabile oder quasistabile Lösung konvergieren und die Ausgangsgrößen des Trennungs- und Unterscheidungs- bzw. Ansprechschwellenprozesses die Replikate oder hinreichend ähnliche Kopien der ursprünglichen Signalquellen S(t) sind.
Das Verfahren dieser Architektur der Erfindung:

1. ist in der Lage, mehrere, d. h. mehr als zwei Mischungen zu verarbeiten
2. ist in der Lage, die Auswirkung von Anfangsbedingungen direkt zu erfassen bzw. einzuschließen
3. kann erweitert werden, um Zeitabhängigkeit zu erfassen, indem angenommen wird, daß die Matrizen (A, B, C, D) und (A, B, C, D) Funktionen der Zeit sind
4. kann die Einbeziehung eines allgemeinen, nicht-linearen Models ermöglichen, z. B. für das Mischen x = Γ(x, s, P1 ) Gleichung (22) m = Φ(x,s,P2) Gleichung (23)und für die Trennung x . = Γ(x, m, W1) Gleichung (24) u = Φ(x, m, W2) Gleichung (25)

Diese Gleichungen können erweitert werden, um nicht-lineare und zeitabhängige Modelle einzuschließen bzw. zu erfassen unter der Annahme, daß die Operatoren Γ, Γ, Φ, Φ) in den Gleichungen 22–25 Funktionen der Zeit sind.
In dem linearen Fall kann man die Inversionsbeziehung zwischen (A, B, C, D)und (A, B, C, D) wie folgt zeigen: Mit Gleichung (19)
und daher unter Bezug auf Gleichung (21), gegeben, daß u die abgeschätzten Quellsignale s sind,
und
In ähnlicher Weise kann man zeigen, indem s = –D ^–1 Cx + D ^–1m) in Gleichung (18) substituiert wird, daß
und
In dem Fall, daß D keine quadratische Matrix ist und somit nicht invertierbar ist wie in dem Fall, daß mehr Messungen und Mischungen als Quellen erhalten werden, kann man einer allgemeinen Prozedur folgen, indem man die Pseudoinverse [D ^T D]^–1 verwendet und annimmt, daß [D ^T D], was eine quadratische Matrix ist, tatsächlich invertierbar ist.
Auf diese Weise muß man das Netzwerk mit den passenden Aktualisierungsgesetzen bzw. -regeln neu aufbauen, so daß die Netzwerkparameter die folgenden alternativen Versionen der Gleichungen (26–30) werden:
Man kann nach den Parametern von A, B, C und D auflösen, um ihre Lösungen genau zu erhalten oder angenähert durch eine Vielzahl von geeigneten Berechnungstechniken und -vorrichtungen einschließlich einer Vielzahl von mit der Ausführung der Erfindung ausgestatteten Software- und Hardwarekomponenten. Die Eingangsgröße einer solchen Berechnungsvorrichtung ist eine geeignete Menge von Mischungen, die durch eine Mehrzahl von Detektoren empfangen wurden, wobei jeder Detektor Signale von einer Mehrzahl von Quellen empfängt. Nach der Verarbeitung der Eingabe mit den Praktiken der Erfindung ist die Ausgangsgröße von der Berechnungseinrichtung eine Menge von getrennten Signalen einschließlich der wiederhergestellten Quellsignale, welche die ursprünglichen Quellen ohne gegenseitige Beeinflussung bzw. Interferenz gut abschätzen.
Unter Verwendung verschiedener Familien von Kriterien zur Informationsmaximierung kann eine Vielzahl von Optimierungsfunktionen und numerischen Lösungsverfahren, sowohl mit kontinuierlicher (wie in analoger Elektronik) als auch diskreter Zeit (wie bei digitaler Berechnung), je nach Bedarf verwendet werden, so daß das Problem der Signaltrennung durch das Berechnen der ausgewählten Menge von Optimierungsfunktionen für eine gegebene Menge von Mischungen gelöst wird.
Eine Prozedur zur Verwendung dieser Architektur zur Unterscheidung und Wiederherstellung bei der Signaltrennung kann folgendermaßen zusammengefaßt werden:

1. Eine Speicherstruktur aufbauen und reservieren, die zum Speichern sowohl der Meßwerte als auch der Ergebnisse der Daten, die von der Verarbeitung der Meßwerte herrühren, verwendet wird, und Einstellung von Datenertassungs- oder Abtastraten für die Meßwerte.
2. Konstruieren von vier Matrizen A, B, C und D passender Dimension.
3. Empfangen eines neuen Satzes von Meßwerten oder gemischten Signalen.
4. Verarbeiten der ankommenden Mischungssignale und Meßwerte durch Ausführen von Prozeduren zur Signalkonditionierung und Speicherung und von verwandten Prozeduren.
5. Auswerten von Kriterien und Funktionen zur Signaltrennung.
6. Entsprechendes Aktualisieren der Elemente der vier Matrizen oder einer Teilmenge von ihnen.
7. Sammeln von Beweismaterial bzw. Indizien für die Änderung der Dimensionen der Matrizen, der Konvergenzraten, der Zeitkonstanten und anderer Parameter oder Definitionen.
8. Verarbeiten der neuen Menge von Meßwerten, um die ursprünglichen Signale (vor dem Mischen) abzuschätzen, und Speichern der Ergebnisse dieser Prozesse, soweit notwendig.
9. Erfolgreiche Trennungs- und Ansprechschwellen-Indikatoren auswerten.
10. Falls die Speicherreservierung oder die Abtastrate der Datenerfassung unzureichend oder unpassend ist, zu Schritt 1 gehen.
11. Falls die Änderung der Filterformulierung passend ist, weitermachen, sonst zu Schritt 2 gehen.
12. Zu Schritt 3 gehen.

Spezialfall. Man kann einen Spezialfall entwerfen, in dem die kanonische Form des Mischungsund Trennungsmodells gegenüber ihren kanonischen Formen in den Gleichungen (18–21) abgeändert wird, so daß A, A, B, B fest sind. In den 6B und 7B ist dieser Spezialfall bildlich dargestellt.
In Begriffen herkömmlicher Signalverarbeitung und verwandter Techniken mit Bezug auf das Mischungsmodell führt dieser Spezialfall zu einer Menge von gefilterten und/oder verzögerten Versionen der Quellsignale (s), auf denen die Mischungsmatrix C operiert. Das Ergebnis dieser Operation wird zum Ergebnis der Operation Ds addiert. Folglich kann man Gleichung (10) erneut schreiben als M(s) = H(s)S(s) = C(sI – A)–1 BS(s) + DS(s) Gleichung (36)
In Bezug auf das Trennungsmodell und die Architektur führt dieser Spezialfall auf ähnliche Weise zu einer Menge von gefilterten und/oder verzögerten Versionen der Mischung m, auf denen die Matrix C operiert. Das Ergebnis dieser Operation wird zum Ergebnis der Operation D auf m addiert, um die getrennten Signale u zu erhalten. U(s) = H(s)M(s) = [C(sI – A)–1B + D ]M(s) Gleichung (37)
Der Spezialfall erzeugt explizit die Kongruenz der Architektur (in) der Zustandsraum-Zeit-Domäne mit den Übertragungsfunktionsmodellen. Die Prozedur für die Verwendung der kanonischen Form der Architektur ist sehr ähnlich; die Unterschiede werden wie folgt hervorgehoben:

1. In Schritt 2 können A und B fest sein.
2. In Schritt 6 müßten nur die zwei Matrizen C und D aktualisiert zu werden.

Abbildungsarchitektur und -verfahren
Die Abbildungsarchitektur und das -verfahren stellen eine alternative Ausführungsform zur Erleichterung der physikalischen Realisierung und Implementierung der zuvor beschriebenen Architekturen und Verfahren dar, insbesondere durch hardwarebeschleunigte Emulation oder eine digitale Signalverarbeitungseinrichtung. Zu diesem Zweck können die vorstehenden Modelle in Form von diskreter Zeit betrachtet werden, indem einfach die Zeitableitungen durch Abtastungen in der Zeit ersetzt werden, d. h. z .(t) → z(t + 1), wobei i in den vorstehenden Formulierungen für x oder x stehen kann. Nachstehend ist eine vollständige Prozedur für die Implementierung der Abbildungsarchitektur und des zugehörigen Verfahrens umrissen:
Die Mischungsumgebung werde durch die folgende Zeitdomänenbeziehung repräsentiert:
wobei (k) im Fall kontinuierlicher Zeit die k-te Ableitung, im Fall diskreter Zeit k Verzögerungsabtastungen repräsentiert. Wie zuvor ist s(t) die Quelle, m(t) die Mischung, und u(t) sind die getrennten Ausgabesignale.
Das Signaltrennungsnetzwerk wird definiert durch
wobei die Dimensionen von C und D n x m sind, und die Dimensionen von A n x n sind. Allgemein ist L' ≥ L und N' ≥ N, jedoch kann der Fall, in dem L' < L und N' < N ist, ebenso betrachtet werden. Somit kann die Beziehung nun ausgedrückt werden als: u(t) = WΦ (Gleichung 40)wobei W = [D C1 ... CL'; –A1 ... –AN'] (Gleichung 41)und
Es ist zu beachten, daß W nicht notwendigerweise eine quadratische Matrix ist, d. h. W ist von der Dimension n × [L'm + N'n].
Das Abbildungsmodell korrespondiert mit den IIR-(Infinite Impulse Response, unbeschränktes Impulsansprechverhalten)-Modellen in der Signalverarbeitung. Darüber hinaus erhält man den Spezialfall der FIR-(Finite Impulse Response, endliches Impulsansprechverhalten)-Modelle, indem man die Terme, die mit den Ableitungen des Ausgabevektors u(t) verbunden sind, entfernt.
Physikalische Realisierung und Implementierung
Software-Emulation. Die Architekturdarstellungen der übertragungsfunktionsbasierten Frequenzbereichs-Architektur, der Architektur (in) der Zustandsraum-Zeit-Domäne und der Abbildungsarchitektur können einfach in ein Computerprogramm übersetzt werden. Zum Beispiel können die vorstehenden Prozeduren in einer computerinterpretierbaren Sprache kodiert werden, und die resultierende Menge von Computerbefehlen bzw. -anweisungen kann auf einer kompatiblen Computerplattform ausgeführt werden. Somit ist die Software-Emulation eine der Implementierungsoptionen für diese Erfindung und umfaßt die Kodierung des Algorithmus' in einer bestimmten Sprache in einer Weise, die es ermöglicht, ihn auf einem bestimmten Prozessor automatisch auszuführen. Höhere Sprachen wie FORTRAN und C/C++ verfügen über unterstützende prozessorspezifische und allgemeine Compiler, die es erlauben, daß der Code portabel wird. Einiges von diesem Code kann mit anderen Funktionen gebündelt und auf einer vorhandenen Plattform eingebettet oder in den Programmhauptspeicher des Prozessors aufgenommen werden. Andererseits sind neuere Sprachen wie Java plattformunabhängig, so daß der Algorithmus kodiert werden kann, um auf mehreren Plattformen in einer Netzwerkumgebung abzulaufen.
Hardwarebeschleunigte Emulation. Die Prozeduren können ebenso kodiert oder aus einer höheren Sprache (z. B. C/C++, FORTRAN, etc.) in eine spezifische Signalverarbeitungseinrichtung oder durch Einbetten der Prozedur innerhalb eines spezifischen Geräteprogramms oder einer Speichereinrichtung sowohl innerhalb oder außerhalb eines Signalprozessors übersetzt bzw. umgesetzt werden. Dies stellt eine hardwarebeschleunigte Implementierung der beschriebenen Architektur dar. Eine hardwarebeschleunigte Emulationsimplementierung könnte für eine Online-Signaltrennung-, -unterscheidung und -wiederherstellung in Echtzeit schnell genug sein. Die Einrichtungen, die für diesen Zweck verwendet werden, umfassen, sind jedoch nicht beschränkt auf, aufkommende bzw. neu entstehende digitale Hochleistungssignalprozessoren (Digitale Signalprozessoren, DSP), Mikroprozessoren, anwendungsspezifische integrierte Schaltkreise (Application Specific Integrated Circuit, ASIC), programmierbare Geräte bzw. Einrichtungen einschließlich, jedoch nicht beschränkt auf, feldprogrammierbare Gatteranordnungen bzw. -arrays (Field Programmable Gate Array, FPGA), rekonfigurierbare Einrichtungen, in Systemen programmierbare Einrichtungen, programmierbare logische Arrays (Programmable Logic Array, PLA) oder andere auf Kundenwunsch gebaute oder programmierte, automatische Strukturen mit vorab festgelegten oder kundenspezifischen Prozessorkernen, die schnelle Multiplikations- und Additionsberechnungen ausführen und eine flexible, hohe Genauigkeit bieten.
8 zeigt eine mögliche Architektur einer DSP-Implementierung 800. Die DSP-Architektur 800 beinhaltet einen oder mehrere A/D-(analog zu digital)-Wandler bzw. -Umsetzer 802, die mit einem Datenstack 804 verbunden sind. Der Datenstack 804 ist mit einer DSP-Einrichtung 806 verbunden, die ihrerseits auf eine Speichereinrichtung 808 und D/A-( digital zu analog)-Wandler bzw. – Umsetzer 810 Zugriff hat. Die Interna der DSP-Einrichtung 806 können eine Vielzahl von funktionalen Einheiten umfassen, wie nachstehend gezeigt. Verschiedene Konfigurationen sind möglich, je nach dem Wesen der Anwendung, von der Anzahl von Mischungen, von der gewünschten Genauigkeit, etc.
Eine Abbildung einer typischen DSP-Einrichtung 806 als Blockdiagramm ist in 9 gezeigt. Es kann zweckmäßig sein, den Signaltrennungsprozeß als Teil von anderen Prozeduren zu integrieren, die schon enthalten sind, um andere Signalverarbeitungsfunktionen durchzuführen, die es nur für diese Einrichtung gibt. Die A/D-Wandler 802 und die D/A-Wandler 810 können in diese Struktur für Einzel-Chip-Lösungen integriert werden. Die DSP-Einrichtung 806 kann eine Speichereinrichtung 902, einen MAC (Multiplier Accumulator, Multiplizierer-Akkummulator) 904, eine ALU (Arithmetic Logic Unit, arithmetisch-logische Einheit) 906, Akkumulatoren 908, Schieberegister bzw. Shifters 910, interne Akkumulatoren 912 und Adressierungseinheiten und -register 914 beinhalten. Die Speichereinrichtung 902 kann ein Programm-ROM und ein Daten/Programm-RAM umfassen. Der MAC 904 kann einen oder mehrere Multiplizierer und Addierer beinhalten. Die ALU (arithmetisch-logische Einheit) 906 kann einen oder mehrere Addierer, logische Operatoren und Vergleicher enthalten. Die Akkumulatoren 908 können TEST-Schaltkreise, serielle Anschlüsse, Zeitgeber, Wartezustandsgeneratoren, Taktgeneratoren, einen Hostanschluß, eine Hostschnittstelle, Kellerspeicher bzw. Stacks und Hilfsregister umfassen.
Ein typischer Ablauf ist wie folgt: Die ankommenden Signale werden elektrisch übersetzt bzw. umgesetzt und diese Mischungen werden digitalisiert und gespeichert. Die Prozeduren, Algorithmen und Architekturen dieser Erfindung werden dann zu Trennung, Unterscheidung und Wiederherstellung der individuellen Quellsignale ausgeführt. Eine oder mehrere der beschriebenen Einheiten, z. B. die DSPs und/oder die DSPs mit mehreren funktionalen Einheiten, können verwendet werden, um diesen Prozeß für Echtzeitvorgänge auszuführen. Die DSP-Einheiten können so programmiert werden, daß sie die benötigten Schritte ausführen, um die Gleichungen zu lösen, die mit dem Algorithmus verbunden sind. Dieses Programm kann durch Kompilieren der höheren Sprache erhalten werden, um die Prozedur in Assembler oder Maschinensprache zu übersetzen, die die DSP-Einrichtung dekodieren und ausführen kann. Nach Kundenanforderung gefertigter Maschinen- oder Assemblersprachencode kann die Ausführung des Algorithmus weiter beschleunigen, indem die Prozedur für die funktionalen Einheiten des DSP optimiert wird.
Die Ausgaben von diesen Prozessen, welche die Annäherungen an die Quellsignale bilden, können dann gespeichert, zu analogen Werte konvertiert und/oder weiter verarbeitet werden. Beispiele weiterer Verarbeitung umfassen Signalkonditionierung bzw. -aufbereitung, -klassifizierung, -erkennung, -demodulation und andere Verfahren zur Signalverarbeitung.
Zusätzliche Prozeduren, die überbestimmte (wobei die Anzahl von Mischungen größer als die Anzahl von Quellen ist), unterbestimmte (wobei die Anzahl von Mischungen kleiner als die Anzahl von Quellen ist), variierende (wobei die Anzahl von Quellen und Mischungen variiert) oder unbekannte (wobei die Anzahl von Mischungen und/oder Quellen unbekannt ist) Prozesse behandeln, wurden in Flußdiagrammen umrissen. Darüber hinaus können zusätzliche Fehlerprüfungs-, Datenintegritäts- und Datenkennzeichnungsschemata sowohl die Möglichkeiten und die Anwendungsgebiete als auch die Robustheit und Zuverlässigkeit des Ansatzes anreichern.
Diese Prozeduren können leicht in den DSP oder in die Einrichtung, in der die notwendigen Funktionen zur Signaltrennung, -unterscheidung und -wiederherstellung eingebettet sind, programmiert werden.
Funktionen und Kriterien zur Parameteranpassung
Verschiedene Familien von Adaptionstechniken können angewandt werden, um die Parameter der Architekturen und Verfahren dieser Erfindung zu erhalten.
Neuronal inspirierte, statische Architektur. Wie durch Gleichung (3) und 2 beschrieben, erfordert die Signaltrennung im Fall einer neuronal inspirierten, statischen Architektur die Berechnung eine Gewichtungsmatrix W . Aus diesem Grunde führen wir zunächst die äußere Produktmatrix Q ein als Q = f(u)g(u)T Gleichung (43) wobei f und g zwei geeignete, ungerade Funktionen sind, die in Beziehung stehen können oder nicht, und u die Menge von Ausgabesignalen ist, welche die Eingabequellsignale u abschätzen. Diese Matrix ist eine Funktion der Zeit, da u eine Funktion der Zeit ist. Eine weitere Abhängigkeit von der Zeit kann in die Funktionen f und g eingebaut werden.
Man kann verschiedene Kategorien von Anpassungsprozeduren basierend auf Q in Gleichung (43) betrachten, welche die Matrix W ergeben bzw. zu der Matrix W führen, indem man eine der Differentialgleichungen integriert, welche die Ableitung von W, d. h. W ., mathematisch beschreiben. Als ein Beispiel kann in der digitalen Implementierung mit diskreter Zeit W durch eine Euler-Approximation berechnet werden, welche die Werte von W zu W in Beziehung setzt als Wt+1 = Wt + hW . t Gleichung (44)wobei W_t die Ableitung von W bezüglich der Zeit zum Zeitpunkt t ist, und h der Zeitschritt zwischen den zwei aufeinanderfolgenden Werten von W, d. h. W_t+1 und W_t.
Neun Kategorien von Regeln zur Gewichtungsaktualisierung werden für W folgendermaßen beschrieben: W . = η(αI – Q) Gleichung (45) W . = η(αI – Q)W Gleichung (46) W . = η(αI – Q)W–T Gleichung (47) W . = η(αdiag(Q) – Q) Gleichung (48) W . = η(αdiag(Q) – Q)W Gleichung (49) W . = η(αdiag(Q) – Q)W–T Gleichung (50) W . = η(αdiag(Q) – Q) Gleichung (51) W . = η(αdiag(Q) – Q)W Gleichung (52) W . = η(αdiag(Q)-Q)W–T Gleichung (53)wobei α eine positive Zahl ist. In den Gleichungen (45–53) ist η die Anpassungsrate, wobei η eine Zahl ist, die während des Prozesses variieren kann. Das hochgestellte (–T) repräsentiert die invertierte Transponierte und diag(Q) ist eine Diagonalmatrix, in der alle Elemente außer den Dia gonalelementen gleich Null sind und die Diagonalelemente von diag(Q) gleich denjenigen von Q sind. diag(Q) sind die über die Zeit gemittelten Werte von diag(Q).
Zustandsraumarchitektur. Wie durch die Gleichungen (20–21) beschrieben, erfordert die Signaltrennung im Fall der Architektur in der Zustandsraum-Zeit-Domäne die Berechnung der Matrizen A, B C und D . Aus diesem Grund führen wir zunächst zwei äußere Produktmatrizen K und L ein als K = f(u)g(x)T Gleichung (54) L = f(u)g(x)T Gleichung (55)wobei f und g zwei geeignete, ungerade Funktionen sind, die miteinander in Beziehung stehen können oder nicht, und u die Menge von Ausgabesignalen ist, welche für die Eingabequellsignale s eine Näherung sind, m die Menge der empfangenen Mischungen ist und x die Menge der internen Zustände ist. Diese Matrizen sind Funktionen der Zeit, da u, m und x Funktionen der Zeit sind. Eine weitere Abhängigkeit von der Zeit kann in die Funktionen f und g eingebaut werden.
Man kann verschiedene Kategorien von Anpassungsprozeduren basierend auf K und L in den Gleichungen (51–52) betrachten, welche die Matrizen C und D ergeben bzw. zu den Matrizen C und D führen, unter der Annahme, daß die Matrizen A und B fest bzw. fix sind, wie in dem Spezialfall der Repräsentation in der Zustandsraum-Zeit-Domäne gegeben. Wie zuvor bei W kann man durch Integration einer der Differentialgleichungen, welche die Ableitung von C und D mathematisch beschreiben, C und D erhalten. Ein Beispiel wurde in Gleichung (44) gegeben.
Neun Kategorien von Regeln zur Gewichtungsaktualisierung werden für C folgendermaßen beschrieben: C . = η(γI – K) Gleichung (56) C . = η(γI – K)C Gleichung (57) C . = η(γI – K)C–T Gleichung (58) C . = η(γdiag(K) – K) Gleichung (59) C . = η(γdiag(K) – K)C Gleichung (60) C . = η(γdiag(K) – K)C–T Gleichung (61) C . = η(γdiag(K) – K) Gleichung (62) C . = η(γdiag(K) – K)C Gleichung (63) C . = η(γdiag(K) – K)C–T Gleichung (64)wobei γ ≥ 0 und diag(K) die über die Zeit gemittelten Werte von diag(K) sind, was durch Durchschnittsbildung einer oder mehrerer Abtastungen der Matrix diag(K) realisiert werden kann.
In den Gleichungen (56–64) ist η die Anpassungsrate, wobei η eine Zahl ist, die während des Prozesses variieren kann. Das hochgestellte (–T) repräsentiert die invertierte Transponierte und diag(K) ist eine Diagonalmatrix, in der alle Elemente außer den Diagonalelementen gleich Null sind und die Diagonalelemente von diag(K) gleich denjenigen von K sind. K wurde in Gleichung (54) beschrieben.
Entsprechend werden neun Kategorien von Regeln zur Gewichtungsaktualisierung für D folgendermaßen beschrieben: D . = η(αI – L) Gleichung (65) D . = η(αI – L)D Gleichung (66) D . = η(αI – L)D–T Gleichung (67) D . = η(αdiag(L) – L) Gleichung (68) D . = η(αdiag(L) – L)D Gleichung (69) D . = η(αdiag(L) – L)D–T Gleichung (70) D . = η(αdiag(L) – L) Gleichung (71) D . = η(αdiag(L) – L)D Gleichung (72) D . = η(αdiag(L) – L)D–T Gleichung (73)wobei α > 0 und diag(L) die über die Zeit gemittelten Werte von diag(L) sind, was durch Durchschnittsbildung einer oder mehrerer Abtastungen der Matrix diag(L) realisiert werden kann.
In den Gleichungen (65–73) ist η die Anpassungsrate, wobei η eine Zahl ist, die während des Prozesses variieren kann. Das hochgestellte (–T) repräsentiert die invertierte Transponierte und diag(L) ist eine Diagonalmatrix, in der alle Elemente außer den Diagonalelementen gleich Null sind und die Diagonalelemente von diag(L) gleich denjenigen von L sind. L wurde in Gleichung (55) beschrieben.
Die Gleichungen (56–64) und (65–73) könnten auf vielfältige Weise kombiniert werden. Da neun Kategorien für C und D gezeigt werden, sind 81 Permutationen möglich.
Abbildungsarchitektur. Die Gleichungen, die für die neuronal inspirierte, statische Architektur gelten, d. h. die Gleichungen (45–53) gelten auch für die Abbildungsarchitektur, deren Parameter als eine Matrix W in den Gleichungen (40–41) beschrieben wurden. Um die Dimensionsnotation konsistent zu halten, schreiben wir die neun Kategorien von Regeln zur Gewichtungsaktualisierung für den Fall der Abbildungsarchitektur neu. Zuerst definieren wir L neu als: L = f(u)g(Φ)T Gleichung (74)wobei die Dimensionen von f(u) gleich n × 1, und die Dimensionen von g(Φ)^T gleich 1 × N sind, wobei N = (L' + 1)m + N'n in der Notation von Gleichung (42) ist.
Daraufhin können die folgenden Kategorien von Regeln zur Gewichtungsaktualisierung aufgestellt werden: W . = η([I|0] – L) Gleichung (75) W . = η([I|0] – L)W Gleichung (76) W . = η([I|0] – L)W–T Gleichung (77) W . = η(diag([L|0]) – L) Gleichung (78) W . = η(diag([L|0]) – L)W Gleichung (79) W . = η(diag([L|0]) – L)W–T Gleichung (80) W . = η(diag([L|0]) – L) Gleichung (81) W . = η(diag([L|0]) – L)W Gleichung (82) W . = η(diag([L|0]) – L)W–T Gleichung (83)
In den Gleichungen (75–83) ist η die Anpassungsrate, wobei η eine Zahl ist, die während des Prozesses variieren kann. Das hochgestellte (–T) repräsentiert die invertierte Transponierte und diag(L) ist eine Diagonalmatrix, in der alle Elemente außer den Diagonalelementen gleich Null sind und die Diagonalelemente von diag(L) gleich denjenigen von L sind. Die Notation [I|0] bezieht sich auf eine nicht-quadratische Matrix der Dimension n × N, die zusammengesetzt ist aus der n × n Einheitsmatrix I mal der positiven Zahl alpha, und der Rest der Spalten (d. h. Spalten N-n bis N) sind mit Nullen gefüllt. Die Notation diag[I|0] bezeichnet die Diagonalelemente der n × n Untermatrix, die sich ergibt, wenn die ersten n Spalten von L genommen werden. Balken über einer Größe bedeuten Zeitmittelwerte über eine oder mehrere Abtastungen. W^–T bezeichnet die Transponierte der Pseudoinversen der nicht-quadratischen Matrix W . Man beachte, daß die Aktualisierungsgleichungen für dieses verallgemeinerte W direkt bzw. einfach heraus faktorisiert werden können im Hinblick auf die Aktualisierungsgesetze für die Komponentenmatrizen D, C, ... C_L' und A₁ ... A_N'.
Online-Parameteranpassung in Echtzeit
Die oben beschriebenen Architekturen und Prozeduren können mit zusätzlichen Techniken angereichert werden, um die Prozeduren zur Signaltrennung und -wiederherstellung zu verbessern.
Die Einträge der Entmischungs- (oder adaptiven Netzwerkgewichtungs-) Matrix können für einzelne Momente beliebiger Datenpunkte, die berechnet oder erhalten wurden, aktualisiert werden. Obwohl es durch dieses Verfahren der Anwendung möglich ist, eine Online-Signaltrennung in Echtzeit zu erreichen, ist das Verfahren auch in hohem Maße anfällig für Fehler, da es zuläßt, daß ein einzelner Punkt die Kurve bzw. Trajektorie der sich entwickelnden Lösung ändert. Eine andere Prozedur zum Aktualisieren der Parameter des Trennungsprozesses wendet die Kriterien auf die gesamte Datenmenge oder auf ausgewählte Datenpunkte aus der gesamten Datenmenge an. Diesem Verfahren fehlt Kausalität, die für die praktische Implementierung wesentlich ist: Der zugehörige Anpassungsprozeß schreitet nicht in der Zeit oder je Abtastung voran, sondern verwendet die ganze Datenmenge einschließlich der Werte in ersetzten Momenten. Mehr noch wird angenommen, daß eine konstante, statische Mischungsmatrix über den gesamten Bereich Anwendung findet. Obwohl dieses Verfahren in gewisser Weise robuster ist als das erste, ist es im Wesentlichen ein Offline-Verfahren, das für eine Signaltrennung in Echtzeit nicht geeignet ist. Darüber hinaus leidet die Genauigkeit des Entmischungsprozesses, wenn die Annahme einer statischen, konstanten Matrix unzutreffend ist.
Fortlaufende bzw. stetige Anpassung mit Mehrfach-Threads. 10 zeigt einen Anpassungsprozeß mit Mehrfach-Threads (Mehrfach-Strängen). Mehrere Signaltrennungsprozesse können in der Zeit überlagert werden, um eine Parametersättigung bzw. -saturierung zu verhindern und die Wahrscheinlichkeit einer nachhaltig falschen Parameterabschätzung zu reduzieren. Jedes Rechteck repräsentiert einen Trennungsprozeß. Am Beginn jedes Prozesses werden die Parameter initialisiert und die Anpassungskriterien angewandt. Zu jedem Zeitpunkt gibt es einen Haupt- bzw. Masterprozeß, dessen Trennungsergebnisse gemeldet werden, und einen oder mehrere nachgeordnete bzw. Slaveprozesse.
Somit gibt es zu jedem Zeitpunkt mehr als einen Prozeß, dessen Trennungsergebnisse gemeldet werden. Abhängig von der Anwendung kann jede Prozeßausgabe auf vielfältige Weise verwendet werden. Es sei zum Beispiel angenommen, daß unter den getrennten Signalen nur ein einzelnes, das von Interesse ist, abgeschätzt zu werden braucht. In diesem Fall würde es einen Hauptprozeß geben, der die Qualität dieses Signals, das von Interesse ist, optimiert, wohingegen die Er gebnisse anderer Prozesse ignoriert werden. In einem weiteren Beispiel können die Ergebnisse der redundanten (oder abhängigen) Prozesse mit denjenigen vom Hauptprozeß und/oder denjenigen von anderen abhängigen Prozessen verglichen werden, um (1) den Erfolg jedes Trennungsprozesses zugänglich zu machen, (2) die besten Initialisierungspunkte auszuwerten und auszuwählen oder (3) zu bestimmen, wann ein Prozeß enden sollte. Wenn ein Hauptprozeß endet, übernimmt ein abhängiger Prozeß seinen Platz. In 10 endet Prozeß 1 am Zeitindex t₁. An diesem Zeitpunkt kann abhängig von der Qualitätsmessung ihrer Trennungsergebnisse der beste der drei anderen abhängigen Prozesse seine Stelle als Hauptprozeß übernehmen.
Gestaltung bzw. Ausbildung eines Datenpuffers oder einer Datenmenge (langer Stack) zur Verwendung für die Parameteranpassung. Wie diskutiert werden die Anwendung der Kriterien zur Signaltrennung und die Berechnung und Anpassung der Trennungsparameter entweder auf einem einzelnen Datenpunkt oder der gesamten erhaltenen Datenmenge ausgeführt. Beides ist von begrenzter Brauchbarkeit. Im Falle des einzelnen Punktes ist es möglich und wahrscheinlich, daß ein einzelner Punkt oder eine Reihe von Punkten mit Störungen die Kurve der Anpassungsparameter von ihrer idealen Lösung abweichen lassen oder umlenken würde. Am entgegengesetzten Ende des Spektrums ist das Anwenden der Trennungskriterien auf die ganze Datenmenge häufig nicht praktikabel bzw. unmöglich, da (i) die Speicherung jedes Datenpunktes nicht möglich sein kann und (ii) die Verzögerung, die durch die Verarbeitung aller Datenpunkte hervorgerufen wird, inakzeptabel sein kann.
Aus diesem Grund bezieht die vorliegende Erfindung die Schaffung eines gleitenden Echtzeit-Online-Zeitfensters ein, dessen Größe und Inhalte abhängig von verschiedenen Kriterien, die den gemessenen Signalen, den getrennten Signalen oder den Zeitrandbedingungen bzw. -schranken der speziellen Anwendung auferlegt werden, angepaßt werden können. Diese Kriterien stellen im allgemeinen ein Maß für den Grad des Erfolges des Trennungs- oder Unterscheidungsprozesses dar, und zwar solcher Parameter wie Leistungsspektrum der gemessenen oder getrennten Signale, statistische Ähnlichkeiten der getrennten oder gemessenen Signale, oder sie würden von dem Menschen als Benutzer des Trennungsprozesses geleitet. Der lange Stackspeicher kann in einer Speichereinrichtung, einem digitalen oder analogen Aufnahmemedium, enthalten sein.
Die Inhalte der Datenmenge können modifiziert werden, nachdem eine neue Menge von gemessenen Signalen erhalten wird. Der einfachste Weg, um dies zu tun, ist, einfach die ältesten Datenpunkte aus der Datenmenge zu entfernen. Dies kann durch Einrichten eines Stackspeichers der First-In-First-Out (FIFO)-Art wie in 11 gezeigt geschehen. 11 zeigt eine Ausführungsform eines Stack mit konstanter Länge, der auf einem Prozeß zum Aufbau eines First-In-First-Out (FIFO)-Stack und zur Datenbeschaffung beruht. Der schattierte Bereich zeigt die Inhalte des langen Stackspeichers in diesem Fall an. Bis zum Abtastzeitpunkt = W wird jede erhaltene Datenmenge bzw. jeder erhaltene Datensatz gespeichert. Wenn Abtastzeitpunkt = W, ist der Stack voll. Jenseits dieses Zeitpunktes wird der älteste Datensatz aus dem Stack gelöscht. Es ist zu beachten, daß dies eine vereinfachte Darstellung der Erfindung ist und der Stack nicht nach FIFO-Art oder von konstan ter Breite zu sein braucht. Die untenstehende Prozedur ist ein Beispiel eines Programms, das auf dieser Erfindung zur Auswahl der Datenmenge beruht:

1. Länge des Datenstack setzen.
2. Parameter der Signaltrennung initialisieren.
3. Menge von Meßwerten für den aktuellen Zeitpunkt erhalten.
4. Ist dies eine) brauchbarer) Datenmenge oder -punkt? Nein → Ist es wünschenswert, eine Trennung auf dieser Datenmenge durchzuführen? Ja → Zu Schritt 6 gehen. Nein → Zu Schritt 3 gehen. Ja → Ist der Datenstack voll? Nein → Datenpunkt als neuesten Datenpunkt speichern. Ja → Ältesten Datenpunkt verwerfen, diesen Datenpunkt als letzten speichern
5. Ist es wünschenswert, eine Trennung auf dieser Datenmenge durchzuführen? Ja → Zu Schritt 6 gehen. Nein → Zu Schritt 3 gehen.
6. Prozedur zur Signaltrennung durchführen.
7. Falls dies ein brauchbarer Datenpunkt war, dann die Ergebnisse des Trennungsprozesses in dem Datenstack speichern.
8. Falls ein Kontrollpunkt erreicht wird, den Erfolg des Trennungsprozesses auswerten bzw. bewerten.
9. Ist die Trennung zufriedenstellend? Nein → Zu Schritt 1 gehen. Ja → Ist es wünschenswert, die Stackgröße zu reduzieren? Nein → Zu Schritt 3 gehen. Ja → Zu Schritt 1 gehen.

Es ist möglich, Verzögerungen in den Prozeß einzuführen, das heißt, man kann das Ergebnis der Signaltrennung ausgeben, die auf vor dem aktuellen Zeitpunkt erhaltenen Abtastungen durchgeführt wurde, anstatt auf der jüngst verfügbaren Abtastung.
Stochastische oder deterministische Auswahl einer Teilmenge der Elemente (kurzer Stack) aus einem langen Stack für die Anwendung der Kriterien für die adaptive Parameterabschätzung. Vor der Ausführung des Algorithmus' zur Signaltrennung und -unterscheidung, insbesondere vor der Anwendung der Kriterien für die adaptive Parameterabschätzung, muß man auswählen, welche Datenpunkte aus dem langen Stack verwendet werden sollen. Eine vereinfachte Darstellung des Konzeptes wird in 12 gezeigt. 12 zeigt ein Beispiel eines langen Stack mit konstanter Breite, der auf einem- First-In-First-Out (FIFO) Stackkonstrukt basiert, das sieben Elemente tief ist. Der schattierte Bereich zeigt die Inhalte des langen Stack in diesem Fall an. Bis zum Abtastzeitpunkt = 7 wird jeder erhaltene Datensatz gespeichert. Wenn der Index des Abtastzeitpunktes = 7 ist, ist der Stack voll. Jenseits dieses Punktes wird der älteste Datensatz aus dem Stack gelöscht. Zwei Elemente werden aus dem langen Stack ausgewählt. um den kurzen Stack zu jedem Prozeßzeitindex zu bilden. Diese Elemente sind als schwarze Quadrate gezeigt.
Keine solche Auswahl wird benötigt, wenn man entweder den letzten Satz von Ergebnissen und Meßwerten oder die gesamte Menge von Ergebnissen und Meßwerten verwendet. Die letztgenannte Berechnung ist nicht kausal, da aktuelle Ausgaben von zukünftigen Mischungen abhängen werden. Daher kann die letztgenannte Berechnung nur Offline durchgeführt werden. Wie bereits bei der Echtzeitausführung der Algorithmen zur Signaltrennung und -unterscheidung dargestellt, ist dies häufig nicht praktikabel.
Es mag wünschenswert sein, daß man einen Auswahlsatz des gesamten verfügbaren Datenstack verwendet – entweder durch deterministische, zufällige oder pseudozufällige Auswahl einer Menge von Punkten daraus. Die deterministische Auswahl ist völlig vorhersagbar und wird jedesmal bei einer Menge von identischen Daten dieselbe sein. Die Verwendung von zufälligen oder pseudozufälligen Auswahlkriterien kann jedoch zu unterschiedlichen Auswahlmengen führen, sogar bei identischen Daten.
Ein leistungsfähiges, deterministisches Kriterium ist es, die Größe des kurzen Stack ausgehend von, erweiternd um oder endend bei einem zufälligen oder zuvor festgelegten Index des langen Stack zu erweitern oder zu kontrahieren. Dieser Prozeß kann von den Ergebnissen des Trennungsprozesses geleitet werden, d. h. die Qualität der erhaltenen Trennung und Unterscheidung kann verwendet werden, um den Index der Daten im langen Stack zu definieren, die Anzahl von Datenelementen jedes Punktes im kurzen Stack, die Größe des kurzen Stack und die numerische Genauigkeit der Daten im kurzen Stack zu erhöhen oder zu vermindern. Deterministische Prozeduren können mit stochastischen Prozeduren kombiniert werden, wie denjenigen, die zufällig die Länge, die numerische Genauigkeit, den Startpunkt und die Elemente des kurzen Stack auswählen. Die stochastischen Prozeduren können von passenden Verteilungsfunktionen der Wahrscheinlichkeit Gebrauch machen, um die Indizes der Elemente im langen Stack zu definieren, die in den kurzen Stack einbezogen werden. Zum Beispiel kann die Wahrscheinlichkeitsverteilung der Indizes die Auswahl jüngst verwendeter Punkte begünstigen oder mißbilligen. Die Definition der Wahrscheinlichkeitsverteilung kann selbst ein stochastischer oder deterministischer Prozeß basierend auf Eigenschaften der ursprünglichen und getrennten Signale und der Mischung zum Zeitpunkt der Berechnung sein. Berechungen von Aktualisierungen für das Netzwerk können alle kausal sein, d. h. der aktuelle Wert der Ausgangsgröße hängt nur von gegenwärtigen und vergangenen Werten der Mischung ab.
13 zeigt die Anwendung der Trennungskriterien unter Verwendung einer Menge von Datenpunkten (kurzer Stack) aus einem langen Stack, der alle relevanten Mengen von Datenpunkten enthält, die über ein Zeitfenster berechnet oder gemessen wurden. In 13 werden der Aufbau und die Elemente des langen und kurzen Stack bildlich gezeigt. Der lange Stack ist N Elemente breit und M Elemente tief. Die Funktionen sind nach ihrem Zeitindex k gruppiert. Es gibt N Zeitpunkte, die M Ergebnisse der Berechnung einschließlich der gemessenen Signale und der geschätzten Originalquellen oder der getrennten Signale, der Ergebnisse von Zwischenberechnungen und ver schiedener Funktionen davon umfassen. Die Inhalte des langen Stack repräsentieren ein gleitendes Fenster oder eine gleitende Historie von Meßwerten und Berechnungen. Die zuletzt gemessenen und berechneten Datenpunkte werden an den Stackeintrag mit dem letzten Index angehängt, wohingegen der älteste Satz dieser Punkte aus dem Stack gelöscht wird. Wie zuvor vorgeschlagen, braucht die Größe des Stack selbst nicht konstant zu sein.
Der kurze Stack ist eine Teilmenge von ausgewählten Einträgen aus dem langen Stack für die Berechnung zu einem bestimmten Zeitpunkt. Die Inhalte des kurzen Stack werden auch zu jedem Zeitpunkt geändert, wenn eine Berechnung durchgeführt wird. Die zum Zeitpunkt t ausgewählten Einträge des kurzen Stack werden zum Zeitpunkt t verwendet, um die geschätzten ursprünglichen Signale oder getrennten Signale zu berechnen. Es ist jedoch zu beachten, daß, wenngleich der Zeitpunkt t der Zeitpunkt der Berechnung ist, es nicht der Zeitpunkt zu sein braucht, der der getrennten bzw. separierten Ausgangsgröße zugeordnet ist. Es kann eine Verzögerung bei der Ausgabe geben, das heißt, es könnte ein Vorgriffs- bzw. Look-Ahead-System bzw. -Schema im Einsatz sein, so daß die Berechnung zum Zeitpunkt t das separierte Signal für den Zeitpunkt t – L ist, wobei L die Verzögerung repräsentiert.
Somit betrachtet der Algorithmus der vorliegenden Erfindung und des Grundaufbaus allgemeine Zeitdomänensysteme, wodurch die Erfindung in der Lage ist, sich an sich ändernde Phänomene von Signalverzögerungen und anderer nicht-linearer Ereignisse anzupassen, die in der Praxis routinemäßig bei Signal- und Schwingungsausbreitung, -übertragung und -weiterleitung wahrgenommen werden.
Die vorliegende Erfindung ermöglicht es auch, statistisch signifikante Intervalle zu verarbeiten, und nutzt die verschiedenen Formen von Gewichtung der Ausgangsgrößen aus, indem die Auswahlkriterien der Einträge des langen und insbesondere der kurzen Stack beeinflußt bzw. manipuliert werden.
Rekursive Prozeduren zur Schätzung der adaptiven Parameter. In einer Vielzahl von Anwendungen, speziell wenn hohe Genauigkeit des Trennungsprozesses gewünscht ist, kann man den Prozeß zur Signaltrennung rekursiv anwenden, das heißt, die Ausgangsgrößen von dem Prozeß zur Signaltrennung können als Eingangsgrößen für den nächsten Trennungsprozeß behandelt werden, bis die gewünschte Genauigkeit erreicht wird. Jeder aufeinander folgende Trennungsprozeß kann dasselbe oder ein anderes Modell, dieselbe oder eine andere Architektur und dieselben oder andere Parameter wie bzw. als der vorhergehende Prozeß verwenden. Dieses Verfahren kann auch mit anderen Echtzeit-Online-Prozeduren dieser Erfindung wie der Anpassungsprozedur mit Mehrfach-Threads kombiniert werden.
Anwendung bei Audiosignal-Verarbeitung
Für die Sprach-, Sprecher- und/oder Fremdsprachenerkennung und -verarbeitung ist es bei den Herausforderungen bei der Berechnung, die mit diesen Prozessen verbunden sind, oder aufgrund der Ziele bzw. Zielsetzungen von Privatsphäre bzw. Datenschutz und/oder Überwachung der bzw. für die Benutzer wünschenswert, störungsfreie, klare Signale zu erhalten, z. B. Sprachsegmen te, die nicht durch Rauschen, Umgebungsgeräusche und andere Sprecher gestört sind. Die Architekturen und Algorithmen zur Signaltrennung dieser Erfindung können als eine Eingangsstufe bzw. ein Vorfeld in Richtung auf dieses Ziel verwendet werden. Mikrophonreihen bzw. -arrays können verwendet werden, um mehrere Versionen von Sprach-Signalen (und anderen Signalen) zu erhalten. Diese können die Mischungssignale sein, die bei der Signaltrennung verwendet werden, um die ursprünglichen, individuellen Signale oder Sprachsegmente zu erhalten. Diese Segmente werden weniger Rauschen und andere Quellen von Beeinträchtigungen bzw. Interferenzen enthalten als die ursprünglichen Signale, die von den Mikrofonen aufgenommen wurden.
14 zeigt eine Audioanwendung, die auf den Prozeduren zur Signaltrennung und -wiederherstellung dieser Erfindung beruht. Audiosignale werden von den Elementen eines Mikrofonarray 1402 in elektrische Signale umgewandelt. Jedes Element des Mikrofonarrays 1402 empfängt eine unterschiedliche Version (oder Mischung) der Geräusche in der Umgebung. Unterschiedliche Anordnungen der Mikrofonelemente können abhängig von der Art der Anwendung, der Anzahl von Mischungen, der gewünschten Genauigkeit und anderer relevanter Kriterien konstruiert werden. Im Anschluß an eine gewisse Signalkonditionierung und -filterung werden diese gemischten Signale vom analogen Format in das digitale Format konvertiert, so daß sie gespeichert und verarbeitet werden können. Die DSP-Einrichtung 806 des Systems ist in Übereinstimmung mit den Prozeduren zur Signaltrennung und den Wiederherstellungsprozeduren dieser Erfindung programmiert. Die Interna der DSP-Einrichtung 806 können eine Vielzahl von Funktionseinheiten für verschiedene arithmetische und logische Operationen und Einrichtungen zur digitalen Darstellung, Datenspeicherung und -abfrage umfassen, um eine optimale Leistungsfähigkeit bzw. Ausführung zu erreichen. In der Figur gezeigte Schaltkreise und Strukturen können weiterer Integration im Hinblick auf die Realisierung des ganzen Systems auf einem einzelnen Chip unterzogen werden. 14 stellt das anwendungsspezifische System in dem Grundaufbau der in 8 gezeigten, hardwarebeschleunigten Implementierungsoption dar.
15 zeigt drei Audioeingabeschnittstellen zu dem Handgerät auf DSP-Basis, die in die Mikrofon-DSP-Schnittstelle eingebettet werden können. Ganz links befindet sich die geläufige bzw. vorherrschende Schnittstelle zu einem Mikrofon 1502. Das Mikrofon 1502 ist mit einem A/D-Wandler 1504 verbunden, der seinerseits mit einem DMA-(Direct Memory Access, direkter Speicherzugriff)-Kanal 1506 und einem DSP- oder Sprachprozessor-Chip 1508 verbunden ist. In der Mitte ist gezeigt, daß die Mikrofone 1502 in einer einfachen Art (nebeneinander angeordnet sein können), wie es in 14 der Fall ist. Diese Anordnung kann einen anderen A/D-Wandler 1504 und, vielleicht wichtiger, einen anderen DMA-Kanal 1506 des DSP- oder des Prozessorchips 1508 verwenden. Ganz rechts zeigen wir eine mögliche Art und Weise, in der diese Auswirkungen durch Verwendung eines Multiplexers 1510 reduziert werden könnte. Das Auswahlsignal zum Multiplexer 1510 ist nicht abgebildet, jedoch kann es aus dem Abtasttakt in einfacher Art und Weise erzeugt werden. Es ist zu beachten, daß im Falle der Eingabe über einen Multiplexer die Auswirkung bzw. der Einfluß auf den Pfad des Audiosignals minimiert wird. Man kann auch eine leichte Variation betrachten, wobei man unter Verwendung zweier A/D-Wandler 1504 abtasten kann, falls gleichzeitige Abtastung gewünscht wird, und die digitalisierten Daten anstatt der (analogen) Mikrofonausgaben multiplexen kann.
16 zeigt eine schematische Darstellung einer Audioeinrichtung, die für die Verwendung mit der vorliegenden Erfindung geeignet ist. Dies ist eine intelligente Einrichtung zur Tonabtastungbzw. Tonaufnahme- und -verarbeitung 1600, die programmiert werden kann, um eine Vielzahl von Funktionen durchzuführen. Diese Einrichtung kann als Ganzes oder in Teilen innerhalb einer Verarbeitungs- bzw. Berechnungs- oder Kommunikationseinrichtung verwendet werden, um eine auf Stimm- oder akustischem Signal basierende Schnittstelle zu implementieren. Das intelligente Mikrofon 1600 empfängt eine Mehrzahl von Geräuschen bzw. Tönen von den Quellen 1602 durch ein Mikrofonarray 1604. Das Mikrofonarray 1604 besteht aus einer Anordnung bzw. einem Array von Mikrofonelementen 1605. Das Mikrofonarray 1604 ist mit einem A/D-Wandler 1606 und einem oder mehreren DSPs oder integrierten DSP-Kernen 1608 verbunden. Der DSP-Kern 1608 ist mit einer Speichereinrichtung 1610, mindestens einem digitalen Schaltkreis 1612 und einem analogen Schaltkreis 1614, einer Online-Programmierschnittstelle 1616 und einem D/A-Wandler 1618 verbunden. Die Speichereinrchtung 1610 kann die zuvor beschriebenen Algorithmen und Prozeduren zur Signaltrennung und -wiederherstellung beinhalten. Der digitale Schaltkreis 1612 und der analoge Schaltkreis 1614 können Schaltkreise zur Signalumsetzung und -konditionierung und Schnittstellenschaltkreise umfassen. Der D/A-Wandler 1618 speist die Ausgabekanäle 1620 und andere Ausgänge 1622. Auch wenn es so abgebildet ist, daß sie in der Zeichnung auf einer ebenen Oberfläche liegen, brauchen die Mikrofonachsen nicht koplanar zu sein. Tatsächlich wäre eine zylindrische Anordnung ähnlich der in 17 gezeigten wünschenswert, um Töne bzw. Geräusche aus allen Richtungen aufzunehmen. Einige dieser Richtungen können gesperrt werden. Dieses intelligente Mikrofon enthält Mikrofonelemente 1605, die in ihrer schematischen Darstellung in 16 abgebildet sind. Die Einrichtung ist in minimalem Umfang zu Aufgaben der Audio-Signaltrennung und -wiederherstellung fähig. Zusätzliche Eigenschaften bzw. Fähigkeiten können hinzugefügt werden, indem diese Eigenschaften bzw. Fähigkeiten gleichfalls auf dem digitalen Signalprozessor programmiert werden. Diese Einrichtung bzw. dieses Gerät kann als ein Ersatz für gewöhnliche Mikrofone verwendet werden, nachdem es vorprogrammiert wurde, oder in neuen Audioschnittstellen vennrendet werden, die seine Flexibilität durch Online-Programmieren ausnutzen. Auch wenn es größer als herkömmliche Mikrofone gezeichnet ist, um seine Komponenten zu veranschaulichen, kann es aufgrund seines hohen Grades von Integration tatsächlich vergleichbar groß oder kleiner sein.
Mikrofontechnologie und Mikrofonarrays. Ein Mikrofon ist eine Einrichtung, die akustische Energie, die als Schwingungs- bzw. Vibrationsbewegung von Luftpartikeln empfangen wird, in elektrischen Energie umwandelt, die entlang des Mikrofonkabels als eine Schwingungsbewegung von Elektronen gesendet wird. Sobald dies Umwandlung stattgefunden hat, ist die Schallinformation von den normalen akustischen Beschränkungen bzw. Randbedingungen befreit. Sie kann verstärkt, auf einem Draht oder über Radiowellen übertragen werden, sie kann gespeichert und verarbeitet werden.
Heutzutage ist das Mikrofon ein allgegenwärtiges Gerät. Es gibt viele Arten von Mikrofonen, und dieser Abschnitt stellt einen kurzen Überblick über die mit Mikrofonen verbundene Technologie dar. Die wünschenswerten Eigenschaften jedes Mikrofons hängen in gewissem Maße von der speziellen Anwendung ab, für die es bestimmt ist. Durch das Studieren sowohl der Prinzipien der akustischen Transduktion bzw. Weitergabe bzw. Umwandlung als auch der Herstellerspezifikationen von Mikrofonen haben jedoch die folgenden Ausführungskategorien einen wichtigen Einfluß auf die Auswahl geeigneter Mikrofone:

1. Frequenzgang bzw. Übertragungsbereich auf der Achse, der sich auf die Signalausgabe gegenüber einer Frequenz für ein konstantes akustisches Niveau bezieht.
2. Richtcharakteristik, die sich auf die Reaktion des Mikrofons auf Geräusche bezieht, die von bzw. unter allen Winkeln auf einer Ebene empfangen werden, z. B. Kugel-, Nieren-, Keulencharakteristik
3. Frequenzgang bzw. Übertragungsbereich außerhalb der Achse, dasselbe wie (1), jedoch außerhalb der Achse
4. Empfindlichkeit oder die Effizienz des Mikrofons, akustische Energie in ein elektrisches Signal umzuwandeln
5. Eigenrauschen, oder das inhärente Rauschniveau
6. Verzerrung, mit anderen Worten die Abweichung von einem linearen Ansprechverhalten bzw. von einer linearen Reaktion auf akustische Energie

Mit Ausnahme weniger exotischer Typen, die auf erhitztem Draht oder einer lonenwolke basieren, vollführen alle praxisnahen Mikrofone die Umwandlung von akustischer Energie in mechanische Energie mittels der mechanischen Schwingungen einer dünnen, leichten Membran als Reaktion auf Schallwellen. Im allgemeinen hat diese Membran eine kreisförmige Form und ist an ihrer Peripherie eingespannt, obwohl auch andere Formen auftreten einschließlich der Sorte mit einem dünnen Band, das zwischen Klemmen an jedem Ende gespannt ist. Es zeigt sich daher, daß die Energieumwandlung in Mikrofonen gemeinhin in zwei Stufen bzw. Phasen stattfindet, wenn auch gleichzeitig: akustisch in mechanisch und mechanisch in elektrisch.
In der ersten Phase sind die zwei hauptsächlichen Methoden, mit denen ein Mikrofon bei jeder Art des Umwandlers mechanische Energie aus der Schallwelle extrahiert, Druckübertragung bzw. -betrieb und Druckgefälle- bzw. -gradientenübertragung bzw. -betrieb. Die charakteristische Eigenschaft von druckbetriebenen Mikrofonen ist, daß die hintere Fläche des Mikrofons geschlossen ist, so daß die auslösende bzw. antreibende Kraft diejenige des momentanen Luftdrucks an der Vorderseite ist. Ein kleiner Luftdurchlaß ist in das Gehäuse geschnitten, um auf lange Sicht den inneren und äußeren Luftdruck auszugleichen. Ein ausschließlich druckbetriebenes Mikrofon wirkt in alle Richtungen bzw. hat Kugelcharakteristik. Ein Druckgefälle-Mikrofon andererseits ist so gebaut, daß beide Seiten seiner Membran gleichermaßen für Luft bzw. gegenüber der Luft offen sind. Die zu jedem Zeitpunkt auf die Membran wirkende Kraft rührt nicht einfach von dem Druck an der Vorderseite her, sondern vom Druckunterschied oder Druckgefälle bzw. -gradienten zwischen der Vorder und Rückseite. Dies hat einen wichtigen Einfluß auf die Richtcharakteristik des Systems. Eine ganze Familie von Richtcharakteristik-Mustern wird möglich, wenn man die Druck- und die Druckgefälleübertragung bzw. den Druck- und den Druckgefällebetrieb kombiniert.
Die zweite Phase kann eine Vielzahl der Prinzipien eines elektrischen Generators verwenden, um die extrahierte mechanische Energie in elektrische Energie umzuwandeln, und Mikrofone pflegen entsprechend klassifiziert zu werden. Einige der verbreiteten Kategorien können wie folgt beschrieben werden:

1. Mikrofon mit beweglicher Spule (dynamisches Mikrofon) beruhend auf dem Prinzip, daß die Bewegung eines Leiters in einem elektrischen Feld ein EMF erzeugt, was zu einem Stromfluß in dem Leiter führt
2. Bandmikrofon (Ribbon Microphon) beruhend auf demselben Prinzip wie ein dynamisches Mikrofon, wobei das Band als die Membran und als der Leiter fungiert
3. Kondensor- (Kondensator- und elektrostatisches) Mikrofon, bei dem das Umwandlerelement ein Kondensator ist, der sich basierend auf der Schwingung der Membran verändert
4. Elektret-Mikrofon, das eine polarisierte oder neutrale Membran verwendet, bei der die befestigte Platte mit einem Elektretmaterial beschichtet ist (Rückseitenpolarisiert)
5. Piezoelektrisches Mikrofon, das kristalline oder keramische Materialien verwendet, die piezoelektrische Eigenschaften besitzen, wobei Schwingungen einer Membran durch einen Stab auf das Bimorph (entgegengesetzt polarisierte Scheiben bzw. Plättchen, die zusammengefügt sind, um eine einzige Einheit zu bilden) übertragen werden, was eine veränderliche Spannung an den Ausgangsanschlüssen proportional zu der aktuellen Verrückung bzw. Verschiebung zur Folge hat
6. Das Kohlenstoffmikrofon, verwendet in vielen Telefonen, das Körnchen von verkokter Steinkohle verwendet, welche ihre Kontaktflächen größer oder kleiner werden lassen, wenn sie äußeren Druckschwankungen ausgesetzt werden.

Während der vergangenen Dekade wurden Techniken der Silizium-Mikrotechnik erfolgreich auf die Herstellung von Miniaturmikrofonen auf Siliziumwafer bzw. -scheiben bzw. -kristallplatten angewandt. Es sind auch Siliziummikrofone verfügbar, die auf unterschiedlichen Prinzipien beruhen, z. B. piezoelektrischen, piezoresistiven und kapazitiven Prinzipien. Es gibt ein wachsendes Interesse in diesem Bereich aufgrund der zahlreichen Vorteile durch verbesserte Abmessungs- bzw. Größenkontrolle bzw. -steuerung, extreme Miniaturisierung, der Möglichkeit, On-Chip-Schaltkreise zu integrieren und potentiell niedriger Kosten als Ergebnis von Stapelverarbeitung.
Nachfolgend diskutieren wir zwei Arten von in Mikrotechnik gefertigten Mikrofonen, nämlich kapazitive und piezoelektrische.
In Mikrotechnik gefertigte, kapazitive Mikrofone. Die meisten Siliziummikrofone beruhen auf kapazitiven Prinzipien wegen des flachen Frequenzgangs mit bzw. bei höherer Empfindlichkeit und wegen des niedrigen Rauschpegels. Die kapazitiven Mikrofone können in Elektret-Mikrofone, Kon densor-Mikrofone und Kondensor-Mikrofone mit integrierten Feldeffekttransistoren (FETs) eingeteilt werden. Die kapazitiven Mikrofone bestehen aus einer dünnen, flexiblen Membran und einer starren bzw. festen Rückwand. Die beiden Teile können entweder als zwei separate Siliziumchips oder ein einzelner Chip realisiert werden. Auf der Rückwand werden mittels anisotropen Ätzens akustische Löcher gebildet bzw. geformt. Die Membranen der Siliziummikrofone können dünne Mylar-Folien, Polyester, ein Siliziumnitridfilm mit bzw. aus chemischer Gasphasenabscheidung bei vermindertem Druck (Low Pressure Chemical Vapor Deposition, LPCVP), etc. sein. Für das Zwei-Chip-Struktur-Mikrofon werden Silizium-Direkt-Bonden, anodisches Bonden oder polymere Klebemittel verwendet, um die Membran und die Rückplatte zu montieren. Ein solcher Montagevorgang verursacht immer umständliche Ausrichtungsprozeduren, und da die meisten Bondingprozesse auch mit Prozeduren verbunden sind, die integrierte Elektronik beeinflussen und die Materialeigenschaften verändern, hat es den Anschein, daß Mikrofone mit Einzel-Chip-Lösungen vorzuziehen sein sollten.
Die Sequenz des Herstellungsprozesses dieses Mikrofons verwendet sieben Masken einschließlich des anisotropen Ätzens des Siliziums und des Ätzens der Opferschicht. Es wird geltend gemacht, daß geriffelte Membranen mit Furchen bzw. Riffeln bzw. Wellen verschiedene Vorteile für die Konstruktion von Silizium-Kondensor-Mikrofonen haben. Erstens reduzieren die Wellen die innewohnende bzw. immanente bzw. intrinsische Spannung der dünnen Membran, was zu höherer Empfindlichkeit führt. Zweitens können sie unter Verwendung eines einzigen Wafer-Prozesses hergestellt werden. Akustische Löcher werden automatisch produziert, nachdem der Luftspalt gebildet ist, d. h. die Opferschicht enffernt und die Membram freigegeben ist. Die Empfindlichkeit und der Frequenzgang bzw. die Resonanzfrequenz auf der Membran können durch die Wahl geeigneter Strukturparameter optimiert werden.
In Mikrotechnik gefertigte, piezoelektrische Mikrofone. Die Grenzen der Leistungsfähigkeit von in Mikrotechnik gefertigten, piezoelektrischen Mikrofonen wurden sowohl theoretisch als auch experimentell erforscht. Darüber hinaus wurden solche Geräte bzw. Einrichtungen unter Verwendung von Kompensation der Restspannung bei in großem Maßstab integrierten (Large-Scale-Integrated, LSI) CMOS-Schaltkreisen auf einem Chip in gemeinsamen, interaktiven Prozessen zwischen kommerziellen CMOS-Produktionsstätten und Mikrotechnik-Anlagen von Universitäten hergestellt und getestet. Ein solches 2500 × 2500 × 3,5 μm³ Mikrofon hat eine piezoelektrische ZnO-Schicht auf einer siliziumreichen Siliziumnitrid-Trägerschicht mit bzw. aus chemischer Gasphasenabscheidung bei vermindertem Druck (Low Pressure Chemical Vapor Deposition, LPCVP). Das mit einer Ummantelung versehene Mikrofon hat eine Resonanzschwingung von 18 kHz, einen Qualitätsfaktor Q = 40 (ungefähr) und eine unverstärkte Empfindlichkeit von 0,92 μV/Pa, was gut mit der berechneten Empfindlichkeit übereinstimmt. Differentialverstärker stellen 49 dB Verstärkung bei 13 μV A-bewertetem Rauschen am Eingang zur Verfügung.
Für die Herstellung aus größeren bzw. massiven Teilen mit Mikrotechnik wurden verwandte Verarbeitungs- bzw. Arbeitstechniken versucht, um die Merkmale bzw. Bestandteile auf der Vorderseite eines Wafers auf diejenigen auf seiner Rückseite auszurichten. Zu diesem Zweck kann eine winzige (30 μm² große und 1,6 μm dicke) Membran als ein Ausrichtungsmuster dienen. Zur selben Zeit, zu der diese Ausrichtungsmembran hergestellt wird, können viel dickere, großflächige Membranen unter Verwendung von "Maschen"- bzw. "Netz"-Maskierungsmustern in diesen Bereichen teilweise geätzt werden. Die "Maschen"-Maskierungstechnik nutzt die Ätzungsraten-Unterschiede zwischen (100) und (111) Ebenen aus, um die von den Ätzgruben in ausgewählten Bereichen erreichte Tiefe zu steuern bzw. zu kontrollieren. Die großen, teilweise geätzten Membranen (2 bis 3 mm²) sind ausreichend widerstandsfähig, um die nachfolgenden IC-Verarbeitungsschritte in einer Siliziumfertigungsumgebung zu überstehen. Diese angegebene Größe wird mit der Verfügbarkeit von kleineren darstellbaren Strukturmaßen kleiner werden. Aufgrund ihrer sehr geringen Fläche kann die dünne Ausrichtungsmembran mit diesen Schritte durchgehend verarbeitet werden. Die teilweise geätzten Membranen können in einem abschließenden Ätzungsschritt auf eine brauchbare Dicke reduziert werden, nachdem die Schaltkreise fabriziert wurden. Diese Technik wurde erfolgreich angewandt, um Mikrofone und On-Chip-CMOS-Schaltkreise herzustellen.
Die Verwendung von in Mikrotechnik gefertigten, piezoelektrischen Mikrofonen schafft die Möglichkeit, elektrothermisch einstellbare Resonanzfrequenzen zu erstellen. Spezifische Einrichtungen mit dieser Eigenschaft erreichen eine Resonanzfrequenz-Modulation, f_m, mittels der thermischen Ausdehnung, die durch Polysilizium-Erhitzer auf der Membran herbeigeführt wird. Ein nahezu linearer Abfall von f_m bei ansteigender Widerstandsleistung mit einer Rate von –127 Hz/mW wurde zwischen 20,8 und 15,1 kHz gemessen. Die mechanischen Qualitätsfaktoren Q_m sind ungefähr gleich 100. Darüber hinaus ist die Temperatur-Leistungskurve linear mit einer Steigung bzw. Neigung von 0,3 Celsius/mW am heißesten Abtastelement auf der Membran. Die veränderliche Resonanzfrequenz und der hohe Qualitätsfaktor stellen eine akustische Filterfähigkeit bereit, die in Ultraschall-Entternungsmessern, Geschwindigkeits- bzw. Drehzahlsensoren, Signalisierungselementen und der Sprachverarbeitung Anwendung finden kann.
Anders als ihre Vorgänger mit an vier Ecken befestigten Membranen enthalten kombinierte Mikrofon-Mikrolautsprecher-Einrichtungen einen Träger, der frei von Restspannung ist, wie sie in befestigten Membranen zu finden ist. Die Verwendung des Trägers ermöglicht Empfindlichkeitsniveaus, die größer sind als bei anderen Mikrofonen mit in Mikrotechnik gefertigten Membranen. Wenn die Einrichtung elektrisch als ein Ausgabeumwandler, d. h. ein Mikrolautsprecher, betrieben wird, erzeugen darüber hinaus die relativ großen Ablenkungen bzw. Ausleitungen des freien Endes eine erhebliche akustische Ausgangsleistung.
Die Theorie des integrierten Mikrofons kann durch die Kombination von theoretischer Mechanik, Piezoelektrik- und Schaltkreis-Theorie entwickelt werden. Ebenso benötigt werden theoretische Optimierungen für das Empfindlichkeits-Bandbreiten-Produkt und den Geräuschspannungsabstand.
Mikrofonarray-Aufbau und adaptive Abstimmung von Mikrofonelementen. Die aktuelle Verwendung des Begriffs "Mikrofonarray" bezieht sich auf Anordnungen von Mikrofonen über große Distanzen hinweg, in der Größenordnung von Metern. Dies ist das Ergebnis von zwei Faktoren. Erstens erlaubt der Durchmesser der meisten gewöhnlichen Mikrofone keine kleineren Arrayabmessungen. Zweitens gab es bisher geringen Bedarf, Mikrofone sehr nahe zusammenzupacken, da die hauptsächliche Motivation für den Bau von Mikrofonarrays ist, die erforderliche Eingabe für Richtstrahl-bildende bzw. Beamforming Algorithmen bereitzustellen, was aufgrund der großen Wellenlänge, die mit den meisten Audiosignalen verbunden ist (0,1–1,0 Meter), eine große Distanz der Mikrofonelemente erfordert. Zum Beispiel sind bei einem eindimensionalen Mikrofonarray, das zur Identifikation des Sprecherstandortes eingesetzt wird, 51 Mikrofone in einer Linie mit einem einheitlichen Abstand von 4 cm über eine Distanz von 2 m angeordnet. Diese Anordnung stellt eine Trennschärfe ohne räumliches Aliasing für Frequenzen bis zu 4000 Hz zur Verfügung.
Allein mit dem Aufkommen der (neuen) Technologie und neuer Algorithmen, mit dem Verständnis des Funktionierens des Innenohres, haben wir jetzt die Grundlagen, Strukturen zu bauen, die dem Innenohr gleichen, um die Art von Signalverarbeitung durchzuführen, die für wirklich intelligente Audioschnittstellen benötigt wird. Von diesem Punkt in der Beschreibung an wird der Begriff Mikrofonarray verwendet, um kompakte Strukturen, kleiner als 5 cm in jeder Richtung bzw. Dimension, zu bezeichnen. Bei dieser Größe kann eine einzelne Einrichtung oder Schnittstelle das Array enthalten und es gibt keinen Bedarf, einen ganzen Raum oder ein ganzes Gehäuse mit Mikrofonen zu verkabeln, um anspruchsvolle Funktionen mit Audiosignalen auszuführen, z. B. die Signaltrennung. Obwohl die physikalischen Abmessungen die Richtstrahlbildung und Lokalisierung bei dieser Größe mathematisch praktisch unmöglich machen, ist es das höchste Ziel, alle Funktionen, die eine Person mit einem guten Ohr erfüllen kann, auf einer solchen Einrichtung zu integrieren. Mehrere Einrichtungen können dann angeordnet werden, um darüber hinausgehende Probleme zu lösen, die physikalische Abmessungen benötigen, die für die Lokalisierung der Quellen und die Richtstrahlbildung geeignet sind.
Die Integration des Mikrofons auf Silizium ermöglicht eine genaue Kontrolle der Mikrofonabmessungen und -abstände bzw. -zwischenräume. Dies wiederum wird – so wird erwartet – zu einer zuverlässigeren Ausnutzung von Richtstrahlbildungs-Algorithmen führen. Jedoch sind die Ansprechcharakteristika der in Mikrotechnik gefertigten Mikrofone weniger vorhersagbar als die ihrer herkömmlichen Gegenstücke. Einige Probleme bzw. Aufgaben, welche die enge Kopplung der piezoelektrischen Mikrofone nach sich zieht, bleiben ungelöst. Es ist zu beachten, daß wir die individuelle Einrichtung eines in Mikrotechnik gefertigten oder mikro-elektro-mechanischen Systems (MEMS) in diesem Zusammenhang als eine einzelne Komponente in einem Array von ähnlichen Einheiten betrachten, analog zu einem einzelnen Pixel in einem CCD-Array oder einem Transistor auf einem integrierten Schaltkreis.
Da die Signale von jeder MEMS-Einrichtung gemeinhin Zeitabstände bzw. Regelabweichungen und Nicht-Linearitäten aufgrund vorhandener physikalischer Randbedingungen bzw. Einschränkungen beim Herstellungsprozeß aufweisen, müssen sich die umgewandelten bzw. weitergeleiteten Signale auf serienmäßig gefertigte Mikroelektronik zur Aufbereitung bzw. Konditionierung, zum Testen und zur einmaligen Kalibrierung in der Fabrik stützen, um zuverlässige Meßwerte zur Diagnose und Steuerung bzw. Kontrolle zu erzeugen. Eine solche einmalige Kalibrierung in der Fabrik ist für den generellen Gebrauch aufgrund von z. B. Strahlung, Gerätealterung und Temperaturschwankungen jedoch nicht ausreichend. Darüber hinaus würden äußerliche bzw. von außen vorgenommene Lösungen für das Problem die Vorteile der Miniaturisierung, die durch MEMS erzielt wird, zunichte machen, wenn man eine enge Kopplung ähnlicher und sogar ungleichartiger MEMS-Einrichtungen auf demselben Substrat betrachtet.
Diese Anwendung der Erfindung verwendet integrierte, adaptive Systeme neben den akustischen Sensoren, weil dies die Möglichkeit bietet, bei vorhandenen Anomalien und Nicht-Linearitäten die Beziehungen online oder offline zu ändern. Zusätzlich vereinfacht die Verwendung modularer Strukturen bei der Konstruktion die Erweiterung des Systems zur Signalkonditionierung.
Digitale Signalprozessoren. Es gibt viele digitale Signalprozessoren (DSP) für Audio-, Sprach- und Multimedia-Anwendungen. Es hängt von der Abwägung der Zielkonflikte in einer bestimmten Anwendung ab, die besten Prozessorfamilien für die Trennung und Wiederherstellung von Audiosignalen auszuwählen. Es besteht die Wahl zwischen verschiedenen Architekturen und numerischen Repräsentationen, z. B. Fließkomma oder Festkomma. Um eine hochintegrierte Lösung (z. B. einen Chip) zu erhalten, kann die Einbettung eines DSP-Kerns erforderlich sein, der entweder aus einer zuvor entworfenen Einrichtung stammt oder aus standardmäßigen Bibliotheken von Siliziumzellen entworfen wird.
Der Compiler-Vorrechner zu einem DSP-Assembler und Linker schafft Übertragbarkeit zwischen den beiden in dieser Erfindung beschriebenen Implementierungsoptionen. Es gibt somit eine Verbindung in beide Richtungen zwischen dem Hochsprachen-Algorithmus der Implementierung durch Software-Emulation und der Implementierung durch hardwarebeschleunigte Emulation. Darüber hinaus gibt es eine ähnliche direkte Verbindung zwischen vielen Verarbeitungsumgebungen und den DSP-Emulationsumgebungen, z. B. C/C++-Library bzw. -Bibliothek und -Compiler für verschiedene Prozessoren.
Es ist wünschenswert, schnellen und kompakten Assembler-Code insbesondere für jeden digitalen Signalprozessor zu erzeugen. Unglücklicherweise ist der Assembler-Code, der von einem spezifischen DSP-Compiler erzeugt wird, häufig nicht so optimal wie gewünscht. Verschiedene Toolumgebungen für das Design und Co-Design digitaler Prozessoren bestehen aus einer Hierarchie von Modellen. Beginnend vom Niveau des höheren Verhaltens erleichtert diese Beschreibung in Schichten das Erkennen und Korrigieren von Entwurfsfehlern, bevor sie physikalisch umgesetzt werden. Darüber hinaus liefert sie auch eine ziemlich genaue Abschätzung der Leistungsfähigkeit, vorausgesetzt, daß die beschriebenen Einrichtungen in der Tat physikalisch realisiert werden können.
Programmierbare Logik kann ein integraler Bestandteil des zugehörigen Entwicklungsprozesses sein. Ein programmierbarer DSP-Kern (ein DSP-Prozessor, der zur Integration in einen kundenspezifischen Chip entworfen wurde) kann mit kundenspezifischer Logik integriert werden, um ein System zu differenzieren bzw. zu staffeln und die Systemkosten sowie den Platz- und Leistungsverbrauch zu reduzieren.
Signalumwandlungs-, -konditionierungs- und Schnittstellenschaltkreise. Signalumwandlungs-konditionierungs- und Schnittstellenschaltkreise sind fertig verfügbar als diskrete Komponenten, z. B. A/D- und D/A-Umwandler, Speicher-ICs, Zeitgeber, Operationsverstärker, Filter, etc. Um einer schnellen Prototyperstellung und einer leichten Programmierbarkeit willen kann es wünschenswert sein, programmierbare Einrichtungen bzw. Geräte, sowohl analoge als auch digitale, zu verwenden.
Viele Anbieter von (feldprogrammierbaren Gatterarrays) FPGA bieten zunehmende Komplexität und Gatter- und Anschlußzähleinrichtungen zum Programmieren an. Ferner wird auf rekonfigurierbare Hardware in ihren verschiedenen Formen Bezug genommen, die dynamische, systemresidente Neukonfigurierung und virtuelle Hardware und rekonfigurierbare DSP-Kerne einschließt bzw. umfaßt. Für Algorithmen zur adaptiven Verarbeitung und ihre Implementierungen gibt es wachsende Möglichkeiten, sowohl eine nahtlose Integration von Software und Hardware als auch eine Integration von Prozessor und Sensor zu entwickeln. Da die Erfindung sowohl analoge als auch digitale Signale umfaßt, wird auch auf die analoge Programmierbarkeit von Hardware Bezug genommen, z. B. eines elektrisch programmierbaren analogen Schaltkreises (Electrically Programmable Analog Circuit, EPAC). Es kann vorteilhaft sein, programmierbare Einrichtungen für analoge, digitale und gemischte Signale mit kundenspezifischen elektronischen Modellen oder diskreten Komponenten je nach Bedarf zu kombinieren. Es kann auch nützlich sein, kundenspezifische Schaltkreise und Strukturen anzustreben, die schlußendlich einfach Seite an Seite mit den akustischen Abtasteinrichtungen integriert werden können.
Die vorstehende Beschreibung der Erfindung wurde zu Zwecken der Veranschaulichung und Beschreibung präsentiert. Sie soll nicht erschöpfend sein oder die Erfindung auf die genauen, offenbarten Formen beschränken. Es ist offensichtlich, daß für auf diesem Gebiet praktisch tätige Fachleute viele Änderungen und Abwandlungen erkennbar sind. Der Anwendungs- bzw. Schutzbereich der Erfindung soll durch die folgenden Ansprüche definiert werden.

Claims

Signalverarbeitungssystem mit: zumindest einem Sensor zum Erfassen einer Mehrzahl von Eingangssignalen, welche zumindest ein Quellsignal aufweisen, einer Speichereinrichtung, die mit dem zumindest einen Sensor zum Speichern der Eingangssignale verbunden ist, einem Architekturprozessor, der mit der Speichereinrichtung verbunden ist, um eine Signal-Separierungsarchitektur zu definieren und zu bestimmen, wobei die Signal-Separierungsarchitektur eine Beziehung zwischen der Mehrzahl von Eingangssignalen und zumindest einem Ausgangssignal definiert, wobei die Beziehung konstante Parameter und zeitvariable Parameter hat, einem Erneuerungsprozessor, der mit dem Architekturprozessor verbunden ist, um eine Änderungsrate der zeitlich variierenden Parameter in Reaktion auf eine zugehörige Änderungsrate zu bestimmen, und einem Ausgangsprozessor, der mit der Architektur verbunden ist, um das zumindest eine Ausgangssignal auf der Basis der Signalseparierungsarchitektur, der konstanten Parameter und der zeitvariablen Parameter bereitzustellen, wobei das zumindest eine Ausgangssignal das zumindest eine Quellsignal abschätzt.
Signalverarbeitungssystem nach Anspruch 1, bei welchem der zumindest eine Sensor zumindest zwei Sensoren aufweist und wobei das zumindest eine Ausgangssignal zumindest zwei Ausgangssignale aufweist.
Signalverarbeitungssystem nach Anspruch 1 oder 2, wobei die Signal-Separierungsarchitektur eine Mischungsumgebung und eine Separierungsumgebung als ein lineares dynamisches System modelliert, wobei ein Mischungsmodell die Form x = Ax + Bs, und m = Cx + Dshat, wobei die Signal-Separierungsarchitektur die Form x . = Ax + Bm, und u = Cx + Dmhat, wobei s ein n-dimensionaler Quellsignalvektor, x ein interner Zustand, m ein m-dimensionaler Maßvektor, u eine n-dimensionale Ausgangsgröße und A, B, C und D Parametermatrizen sind.
Signalverarbeitungssystem nach Anspruch 3, wobei die Parametermatrizen Funktionen der Zeit sind, wobei das Mischungsmodell und die Signal-Separierungsarchitektur die Zeitvarianz beinhalten.
Signalverarbeitungssystem nach Anspruch 1 oder 2, wobei die Signal-Separierungsarchitektur eine Mischungsumgebung und eine Separierungsumgebung modelliert, wobei ein nichtlineares Mischungsmodell die Form x = Γ(x, s, P1), und m = Φ(x, s, P2)hat, wobei eine nichtlineare Signal-Separierungsarchitektur die Form x . = Γ(s, m, W1) und u = Φ(x, m, W2)hat.
Signalverarbeitungssystem nach Anspruch 5, wobei die Operatoren Γ, Γ, Φ, Φ Funktionen der Zeit sind, wobei das Mischungsmodell und die Signal-Separierungsarchitektur eine zeitliche Varianz umfassen.
Signalverarbeitungssystem nach Anspruch 3, wobei Umkehrbeziehungen zwischen den Parametermatrizen die folgende Form haben C ≙ –D –1 C, D ≙ D –1, A ≙ A – BD –1C,und B ≙ BD –1.
Signalverarbeitungssystem nach Anspruch 3, wobei eine Anzahl von Messungen größer als eine Anzahl von Quellsignalen ist, wobei die Inversionsbeziehungen zwischen den Parametermatrizen die Form C ≙ –[D T D]–1 D T C, D ≙ –[D T D]–1 D T, A ≙ A – B[D T D]–1 D T C, und B ≙ B[D T D]–1 D T haben.
Signalverarbeitungssystem nach Anspruch 3, wobei das Mischungsmodell durch eine Zeitdomänenbeziehung
repräsentiert wird, wobei (k) im Fall kontinuierlicher Zeit die k-te Ableitung ist und im Falle diskreter Zeitpunkte die um k verzögerten Abtastungen sind, s(t) ein Quellsignal ist, m(t) ein Mischungssignal ist und u(t) ein abgetrenntes Ausgangssignal ist.
Signalverarbeitungssystem nach Anspruch 9, wobei die Signal-Separierungsarchitektur die Form
hat, wobei die Dimensionen von C und D n × m sind und die Dimensionen von A n × n sind, und wobei u(t) = WΦ, wobei W = [DC1 ... CL'; –A1 ... -AN,], und
Signalverarbeitungssystem nach Anspruch 3, wobei das Berechnen der Parametermatrix C das Verwenden zumindest einer Erneuerungsregel für die Wichtung aufweist, welche ausgewählt wird aus einer Gruppe, die besteht aus C . = η(γI – K), C . = η(γI – K)C, C . = η(γI – K)C–T, C . = η(γ diag(K) – K), C . = η(γ diag(K) – K)C, C . = η(γ diag(K) – K)C–T, C . = η(γ diag(K) – K), C . = η(γ diag(K) – K)C, und C . = η(γ diag(K) – K)C–T,wobei γ ≥ 0 und diag(K) die zeitgemittelten Werte von diag(K) sind, die realisiert werden durch Durchschnittbildung über eine oder mehrere Abtastungen der diag(K)-Matrix, wobei η die Adaptierungsrate bzw. -geschwindigkeit ist, wobei Superscript (–T) eine inverse Transponierte repräsentiert, wobei diag(K) eine Diagonalmatrix ist, bei welcher alle Elemente mit Ausnahme der Diagonalelemente gleich Null sind und die Diagonalelemente von diag(K) gleich denjenigen von K sind, wobei die Matrizen K und L äußere Produktmatrizen sind, wobei K = ⨍(u)g(x)T, und L = ⨍(u)g(u)T
Signalverarbeitungssystem nach Anspruch 11, wobei ... D . = η(αI – L), D . = η(αI – L)D, D . = η(αI – L)D–T, D . = η(α diag(L) – L), D . = η(α diag(L) – L)D, D . = η(α diag(L) – L)D–T, D . = η(α diag(L) – L), D . = η(α diag(L) -L)D, und D . = η(α diag(L) -L)D–T ... und diag(L) eine Diagonalmatrix ist, bei welcher alle Elemente mit Ausnahme der Diagonalmatrix gleich null sind und bei welcher die Diagonalelemente von diag(L) gleich denjenigen von L sind.
Signalverarbeitungssystem nach Anspruch 1 oder 2, wobei zumindest ein Signal-Separierungsprozeß zeitlich mit zumindest einem anderen Signal-Separierungsprozeß überlappt.
Signalverarbeitungssystem nach Anspruch 1 oder 2, wobei zumindest ein Signal-Separierungsprozeß adaptive Parameterabschätzung verwendet, wobei die adaptive Parameterabschätzung durchgeführt wird unter Verwendung zumindest eines Auswahldatensatzes aus einem Datenstapel, wobei der zumindest eine Auswahldatensatz durch zumindest ein Ergebnis des zumindest einen Signal-Separierungsprozesses gesteuert bzw. kontrolliert wird.
Signalverarbeitungssystem nach Anspruch 1 oder 2, wobei der zumindest eine Sensor in einem Sensorarray angeordnet ist, wobei das Sensorarray ein Muster für eine gerichtete Reaktion hat, wobei das Muster für die gerichtete Reaktion in der Lage ist, durch Durchführen der Signalverarbeitung der Mehrzahl von Eingangssignalen modifiziert zu werden.
Signalverarbeitungssystem nach Anspruch 1 oder 2, wobei eine Menge aus der Mehrzahl von Eingangssignalen und eine Menge des zumindest einen Ausgangssignales nicht gleich sind.
Signalverarbeitungssystem nach Anspruch 16, wobei zumindest ein Ausgangssignal eine Funktion von zumindest zwei Quellsignalen ist.
Signalverarbeitungssystem nach Anspruch 16, wobei zumindest zwei Ausgangssignale Funktionen desselben Quellsignales sind.
Signalverarbeitungssystem nach Anspruch 1 oder 2, wobei die Bereitstellung von zumindest einem Ausgangssignal auf einer Mehrzahl von internen Zuständen des Signalverarbeitungssystems beruht.
Signalverarbeitungssystem nach Anspruch 1 oder 2, wobei die Bereitstellung des zumindest einen Ausgangssignals auf zumindest einem aus der Mehrzahl von Eingangssignalen, der Ausgangssignale, zuvor empfangenen Eingangssignalen und zuvor berechneten Ausgangssignalen beruht.
Signalverarbeitungssystem nach Anspruch 1 oder 2, wobei die Signal-Separierungsarchitektur eine Zustandsraumwiedergabe aufweist, welche die Beziehung zwischen der Mehrzahl von Eingangssignalen und dem zumindest einen Ausgangssignal bereitstellt.
Signalverarbeitungssystem nach Anspruch 21, wobei die Bereitstellung des zumindest einen Ausgangssignals weiterhin auf zumindest einem aktuellen Zustand der Darstellung des Zustandsraumes beruht.
Signalverarbeitungssystem nach Anspruch 21, wobei die Bereitstellung des zumindest einen Ausgangssignales weiterhin auf zumindest einem vorher berechneten Zustand der Darstellung des Zustandsraumes beruht.
Signalverarbeitungssystem nach Anspruch 21, wobei die Bereitstellung des zumindest einen Ausgangssignales weiterhin auf zumindest einem aktuellen Zustand und einem zuvor berechneten Zustand der Darstellung des Zustandsraumes beruht.
Signalverarbeitungssystem nach Anspruch 21, wobei die Zustandsraumdarstellung eine Zuordnung zu einem Filter mit endlichem Impulsansprechverhalten (FIR-Filter) aufweist.
Signalverarbeitungssystem nach Anspruch 21, wobei die Zustandsraumdarstellung eine Zuordnung zu einem Filter mit unbegrenztem Impulsansprechverhalten (IIR-Filter) aufweist.
Signalverarbeitungssystem nach Anspruch 21, wobei die Zustandsraumdarstellung zu einer nichtlinearen Funktion einer Zeitvarianten verallgemeinert ist.
Verfahren zur Signal-Separierungsungsverarbeitung, mit: Empfangen und Speichern einer Mehrzahl von Eingangssignalen, die zumindest ein Quellsignal aufweisen, Definieren einer Signal-Separierungsarchitektur, wobei die Signal-Separierungsarchitektur eine Beziehung zwischen einer Mehrzahl von Eingangssignalen und zumindest einem Ausgangssignal definiert, anfängliches Einsetzen von konstanten und zeitlich variierenden Parametern der Beziehung, Bestimmen der zeitlich variierenden Parameter in Reaktion auf die Änderungsrate, die jedem der zeitlich variierenden Parameter zugeordnet ist, und Bereitstellen des zumindest einen Ausgangssignales auf der Basis der Signal-Separierungsarchitektur und der konstanten und zeitlich variierenden Parameter, wobei das zumindest eine Ausgangssignal das zumindest eine Quellsignal abschätzt.
Signalverarbeitungsverfahren nach Anspruch 28, bei welchem das zumindest eine Quellsignal zumindest zwei Quellsignale aufweist und wobei das zumindest eine Ausgangssignal zumindest zwei Ausgangssignale aufweist.
Verfahren zur Signal-Separierungsverarbeitung nach Anspruch 28 oder 29, wobei die Signal-Separierungsarchitektur eine Mischungsumgebung und eine Separierungsumgebung als ein lineares dynamisches System modelliert, wobei ein Mischungsmodell die Form x = Ax + Bs, und m = Cx + Dshat, und wobei die Signal-Separierungsarchitektur die Form x = Ax + Bm, und u = Cx + Dm hat, wobei s ein n-dimensionaler Quellsignalvektor, x ein interner Zustand, m ein m-dimensionaler Maßvektor, u eine n-dimensionale Ausgangsgröße und A, B, C und D Parametermatrizen sind.
Verfahren zur Signal-Separierungsverarbeitung nach Anspruch 28 oder 29, wobei die Signal-Separierungsarchitektur eine Mischungsumgebung und eine Separierungsumgebung modelliert, wobei ein nichtlineares Mischungsmodell die Form x = Γ(x, s, P1), und m = Φ(x, s, P2)hat, und wobei eine nichtlineare Signal-Separierungsarchitektur die Form x . = Γ(x, m, W1), u = Φ(x, m, W2)hat, und wobei Γ, Γ, Φ, Φ Funktionen der Zeit sind.
Verfahren zur Signal-Separierungsverarbeitung nach Anspruch 30, wobei Inversionsbeziehungen zwischen den Parametermatrizen die Form haben: C ≙ –D –1 C, D ≙ –D –1, A ≙ A – BD –1C, und B ≙ B D –1
Verfahren zur Signal-Separierungsverarbeitung nach Anspruch 30, wobei eine Anzahl von Messungen größer als eine Anzahl von Quellsignalen ist, wobei Inversionsbeziehungen zwischen den Parametermatrizen die Form haben: C ≙ –[D T D]–1 D T C, D≙ –[D T D]–1 D T, A ≙ A – B[D T D]–1 D T C, undB ≙ B[D T D]–1 D T C
Verfahren zur Signal-Separierungsverarbeitung nach Anspruch 30, wobei das Mischungsmodell wiedergegeben wird durch eine Zeitdomänenbeziehung
wobei (k) im Fall kontinuierlicher Zeit die k-te Ableitung ist und im Falle diskreter Zeitpunkte die um k verzögerten Abtastungen sind, s(t) ein Quellsignal, m(t) ein Mischungssignal und u(t) ein getrenntes Ausgangssignal ist, wobei die Signal-Separierungsarchitektur die Form
hat, wobei die Dimensionen von C und D n x m sind und wobei die Dimensionen von A n × n sind, wobei u(t) = WΦ, wobei W = [DC1 ... CL'; –A1 ... –AN'], und
Verfahren zur Signal-Separierungsverarbeitung nach Anspruch 28 oder 29, wobei die Änderungsrate von zumindest einem Satz von zeitvariablen Parametern in zumindest einem Array enthalten ist, das zumindest zwei Dimensionen hat.
Verfahren zur Signal-Separierungsverarbeitung nach Anspruch 35, wobei das zumindest eine Array eine Funktion eines äußeren Produkts einer linearen, expansiven oder kompressiven Funktion eines Satzes der Ausgangssignale hat, die in einem eindimensionalen Array angeordnet sind, und eine lineare, expansive oder kompressive Funktion eines Satzes von Ausgangssignalen aufweist, die in einem zweiten eindimensionalen Array angeordnet sind.
Verfahren zur Signal-Separierungsverarbeitung nach Anspruch 28 oder 29, wobei die Signal-Separierungsarchitektur eine Zustandsraumdarstellung aufweist, welche eine Beziehung zwischen der Mehrzahl von Eingangssignalen und dem zumindest einen Ausgangssignal bereitstellt.
Verfahren zur Signal-Separierungsverarbeitung nach Anspruch 37, wobei eine Änderungsrate zumindest eines Satzes von zeitvariablen Parametern in zumindest einem Array angeordnet ist, das zumindest zwei Dimensionen hat.
Verfahren zur Signal-Separierungsverarbeitung nach Anspruch 38, wobei das zumindest eine Array eine Funktion eines äußeren Produkts einer linearen, expansiven oder kompressiven Funktion eines Satzes von Ausgangssignalen aufweist, die in einem ersten eindimensionalen Array angeordnet sind, und eine lineare, expansive oder kompressive Funktion eines Satzes von internen Zuständen der Zustandsraumarchitektur aufweist, die in einem zweiten eindimensionalen Array angeordnet sind.
Verfahren zur Signal-Separierungsverarbeitung nach Anspruch 35, wobei das zumindest eine Array eine Funktion eines äußeren Produktes zumindest einer linearen, expansiven oder kompressiven Funktion des Satzes von Ausgangssignalen aufweist, die in einem ersten Array angeordnet sind, welches zumindest zwei Dimensionen hat, und zumindest eine lineare, expansive oder kompressive Funktion eines Satzes von Ausgangssignalen aufweist, die in einem zweiten Array angeordnet sind, welches zumindest zwei Dimensionen hat.
Verfahren zur Signal-Separierungsverarbeitung nach Anspruch 28 oder 29, wobei eine Mehrzahl von Vorgängen des Signal-Separierungsungsprozesses sich zeitlich überlappen.
Verfahren zur Signal-Separierungsverarbeitung nach Anspruch 41, wobei zumindest einer aus der Mehrzahl von Signal-Separierungsprozessen einen vorbestimmten Satz von konstanten Werten oder einen Zufallssatz von Zahlen für das anfängliche Einsetzen von Parametern hat.
Verfahren zur Signal-Separierungsverarbeitung nach Anspruch 41, wobei zumindest einer aus der Mehrzahl von Signal-Separierungsprozessen Parameter verwendet, die zuvor durch ein anderes Verfahren berechnet wurden, welches zeitlich überlappt.
Verfahren zur Signal-Separierungsverarbeitung nach Anspruch 41, wobei zumindest einer aus der Mehrzahl von Signal-Separierungsprozessen abgeschlossen wird.
Verfahren zur Signal-Separierungsverarbeitung nach Anspruch 44, wobei zumindest einer aus der Mehrzahl von Signal-Separierungsprozessen Parameter verwendet, die durch zumindest einen zuvor abgeschlossenen Signal-Separierungsprozeß berechnet wurden.
Akustisches Signalunterscheidungssystem mit: einer Mehrzahl akustischer Sensoren zum Erfassen einer Mehrzahl von Eingangssignalen, wobei jedes Eingangssignal unterschiedliche Mischungen aus einer Mehrzahl von Quellsignalen aufweist, einer Speichereinrichtung, die mit der Mehrzahl akustischer Sensoren verbunden ist, um die Mehrzahl von Eingangssignalen zu speichern, einem Architekturprozessor, der mit der Speichereinrichtung verbunden ist, um eine akustische Signalunterscheidungsarchitektur zu bestimmen, die eine Beziehung zwischen der Mehrzahl von Eingangssignalen und zumindest einem Ausgangssignal bestimmt, wobei die Beziehung konstante Parameter und zeitlich variable Parameter aufweist, einem Updateprozessor, der mit dem Architekturprozessor verbunden ist, um eine Änderungsrate für die zeitlich variierenden Parameter in Reaktion auf eine zugehörige Änderungsrate festzulegen, und einem Ausgangsprozessor, der mit dem Architekturprozessor verbunden ist, um das zumindest eine Ausgangssignal auf der Basis einer akustischen Signalunterscheidungsarchitektur, der konstanten Parameter und der zeitvariablen Parameter bereitzustellen, wobei das zumindest eine Ausgangssignale das zumindest eine Quellsignal abschätzt.
Akustisches Signalunterscheidungssystem nach Anspruch 46, bei welchem das zumindest eine Ausgangssignal zumindest zwei Ausgangssignale aufweist und das zumindest eine Quellsignal zumindest zwei Quellsignale aufweist.
Akustisches Signalunterscheidungssystem nach Anspruch 46 oder 47, wobei die akustische Signalunterscheidungsarchitektur eine Mischungsumgebung und eine Separierungsumgebung als ein lineares dynamisches System modelliert, wobei ein Mischungsmodell die Form x = Ax + Bs, und m = Cx + Dshat, und wobei die Signal-Separierungsarchitektur die Form x = Ax + Bm, und u = Cx + Dmhat, wobei s ein n-dimensionaler Quellsignalvektor ist, x ein interner Zustand ist, m ein mdimensionaler Maßvektor ist, u ein n-dimensionaler Ausgangswert ist und A, B, C und D Parametermatrizen sind.
Akustisches Signalunterscheidungssystem nach Anspruch 46 oder 47, wobei die Signal-Separierungsarchitektur eine Mischungsumgebung und eine Separierungsumgebung modelliert, wobei ein nichtlineares Mischungsmodell die Form x = Γ(x, s, P1), und m = Φ(x, s, P2) hat, wobei eine nichtlineare Signal-Separierungsarchitektur die Formx . = Γ(x, m, W1), u = Φ(x, m, W2)hat, und wobei Γ, Γ, Φ, Φ Funktionen der Zeit sind.
Akustisches Signalunterscheidungssystem nach Anspruch 48, wobei Inversionsbeziehungen zwischen den Parametern die Form haben: C ≙ –D –1C, D ≙ D –1, A ≙ A – BD –1C,und B ≙ BD –1
Akustisches Signalunterscheidungssystem nach Anspruch 48, wobei eine Anzahl von Messungen größer als eine Anzahl von Quellsignalen ist, wobei Inversionsbeziehungen zwischen den Parametermatrizen die Form haben: C ≙ –[D T D]–1 D T C, D ≙ –[D T D]–1 D T, A ≙ A – B[D T D]–1 D T C, und B ≙ B[D T D]–1 D T
Akustisches Signalunterscheidungssystem nach Anspruch 48, wobei das Mischungsmodell durch eine Zeitdomänenrelation
wiedergegeben wird, wobei (k) im Fall kontinuierlicher Zeit die k-te Ableitung ist und im Falle diskreter Zeitpunkte die um k verzögerten Abtastungen sind, s(t) ein Quellsignal ist, m(t) ein Mischungssignal ist und u(t) ein abgetrenntes Ausgangssignal ist, wobei die Signal-Separierungsarchitektur die Form
hat, wobei die Dimensionen von C und D n × m sind und die Dimensionen von A n × n sind, wobei u(t) = WΦ, wobei W = [DC1 ... CL'; –A1 ... –AN,] und
Akustisches Signalunterscheidungssystem nach Anspruch 46 oder 47, wobei die Mehrzahl akustischer Sensoren einen akustischen Sensor aufweist, der ein Muster einer Richtungsreaktion aufweist, wobei das Muster der Richtungsreaktion modifizierbar ist.
Akustisches Signalunterscheidungssystem nach Anspruch 46 oder 47, wobei eine Menge der Mehrzahl von Eingangssignalen und eine Menge des zumindest einen Ausgangssignals nicht gleich sind.
Akustisches Signalunterscheidungssystem nach Anspruch 54, wobei zumindest ein Ausgangssignal eine Funktion von zumindest zwei Quellsignalen ist.
Akustisches Signalunterscheidungssystem nach Anspruch 54, wobei zumindest zwei Ausgangssignale Funktionen desselben Quellsignales sind.
Akustisches Signalunterscheidungssystem nach Anspruch 46 oder 47, wobei das Bereitstellen des zumindest einen Ausgangssignals weiterhin auf internen Zuständen beruht, die an zumindest einem früheren Zeitpunkt berechnet wurden.
Akustisches Signalunterscheidungssystem nach Anspruch 46 oder 47, wobei die Bereitstellung des zumindest einen Ausgangssignales weiterhin auf zumindest einem aus der Mehrzahl von Eingangssignalen, dem zumindest einen Ausgangssignal, zuvor empfangenen Eingangssignalen und zuvor berechneten Ausgangssignalen beruht.
Akustisches Signalunterscheidungssystem nach Anspruch 46 oder 47, wobei die akustische Signal-Separierungsungsarchitektur durch zumindest eine Zustandsraumdarstellung definiert wird, welche die Beziehung zwischen den Eingangssignalen und den Ausgangssignalen bereitgestellt.
Akustisches Signalunterscheidungssystem nach Anspruch 25, wobei die Bereitstellung des zumindest einen Ausgangssignales weiterhin auf zumindest einem aktuellen Zustand der akustischen Signalunterscheidungsarchitektur beruht.
Akustisches Signalunterscheidungssystem nach Anspruch 55, wobei die Bereitstellung des zumindest einen Ausgangssignales weiterhin auf zumindest einem Zustand in der akustischen Signalunterscheidungsarchitektur beruht, welche zu zumindest einem früheren Zeitmoment berechnet wurde.
Akustisches Signalunterscheidungssystem nach Anspruch 59, wobei die Bereitstellung des zumindest einen Ausgangssignales weiterhin auf zumindest einem aktuellen Zustand und zumindest einem Zustand der akustischen Signalunterscheidungsarchitektur beruht, welcher in zumindest einem früheren Zeitpunkt berechnet wurde.
Akustisches Signalunterscheidungssystem nach Anspruch 59, wobei die zumindest eine Zustandsraumwiedergabe einem Filter mit begrenztem Impulsansprechen (FIR-Filter) zugeordnet ist.
Akustisches Signalunterscheidungssystem nach Anspruch 59, wobei die zumindest eine Zustandsraumwiedergabe einem Filter mit unbegrenztem Impulsansprechen (IIR-Filter) zugeordnet ist.
Akustisches Signalunterscheidungssystem nach Anspruch 59, wobei die zumindest eine Zustandsraumdarstellung zu einer nichtlinearen, zeitlich variablen Funktion verallgemeinert ist.