-
HINTERGRUND DER ERFINDUNG
-
1. Gebiet der Erfindung
-
Die
vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung
zum Verbessern des Signal-Rauschabstands eines eine Information
tragenden Signals.
-
2. Beschreibung des Standes
der Technik
-
In
der praktischen Ausführung
vieler Technologien wird ein eine Information tragendes Signal erzeugt.
Einige Beispiele derartiger Technologien sind die Bilderfassung
mit einer Kamera oder einem optoelektronischen Sensor, Funk- und
Fernsehübertragungen
und medizinische Bildaufbereitung mit Magnetresonanz. Die Nützlichkeit
des die Information tragenden Signals hängt von seiner Deutlichkeit
ab, und Rauschen in dem Signal, das ein unvermeidbares Ergebnis
von physikalischen und elektrischen Prozessen ist, setzt dieser
Deutlichkeit eine Grenze. Somit ist es erwünscht, Rauschen im höchstmöglichen
Maß zu
beseitigen oder entsprechend den Signal-Rauschabstand des eine Information
tragenden Signals zu erhöhen.
-
Verschiedene
Vorgehensweisen sind bekannt, um den Signal-Rauschabstand zu verbessern, wie
etwa die Verwendung von verschiedenen Arten von Filtern. Eine Art
der Vorgehensweise, zu welcher die vorliegende Erfindung gehört, verwendet
einen mathematischen Operator, der als Wavelet-Transformation bekannt
ist. Es ist in diesem Zusammenhang bekannt, dass ein elektrisches
Signal typischerweise eine Amplitude hat, die über die Zeit variiert und somit
einen Frequenzinhalt in dem Signal erzeugt. Bestimmte Arten von
Informationen, beispielsweise optische Informationen, haben auch
eine räumliche
Varianz und werden somit häufig
in einen Zeitkontext in dem elektrischen Signal umgewandelt, der
sich aus der Erfassung der optischen Information ergibt.
-
Um
Rauschen zu vermeiden, kann das elektrische Signal in der Frequenzdomäne verarbeitet werden,
beispielsweise mit einem einfachen Filter, oder in einer Domäne einer
höheren
mathematischen Ordnung, die als Transformationsdomäne bekannt
ist. Beispielsweise ist auf dem Gebiet der Signalverarbeitung die
Fourier-Transformation eine allgemein verwendet der Transformationsdomäne. Die Wavelet-Transformationsdomäne besitzt
jedoch gegenüber
der Fourier-Domäne
Vorteile, und war deshalb, weil die Wavelet-Transformation den Frequenzinhalt
in einen räumlichen
Kontext setzt, während die
Fourier-Domäne nur den
Frequenzinhalt eines Signals anspricht. Somit ist die Wavelet-Transformation in
der Lage, im Vergleich zu der Fourier-Transformation einen verbesserten
Signal-Rauschabstand mit Signalen mit schärferen Flanken zu erzeugen.
-
Verschiedene
Vorgehensweisen sind zur Verwendung der Wavelet-Transformation zum Verbessern des Signal-Rauschabstands
bereits bekannt. Jede dieser Vorgehensweisen weist jedoch Nachteile
auf, die von der vorliegenden Erfindung beseitigt werden. Es gibt
folgende bekannte Vorgehensweisen:
- (a) die
Wavelet-Schrumpfungs-Vorgehensweise, die in Ideal Spatial Adaption
via Wavelet Shrinkage, Donoho, D. L. und Johnstone, I. M., Technical Report/Revised
Technical Report, Stanford University 1992, 1993 und 1994, Biometrika, 81:425-455
beschrieben ist.
Diese Vorgehensweise verwendet Wavelet-Zerlegung,
um die verschiedenen Frequenz/Raum-Komponenten des betreffenden
Bildes oder Signals zu identifizieren. Ein statistisch hergeleiteter "Universal-Schwellenwert" auf der Basis der
Standardabweichung der ursprünglichen
Bildamplitude (oder eines Schätzwertes
davon) wird anschließend
verwendet, um die Amplituden der Wavelet-Koeffizienten durch den Schwellenwert
zu beschränken
oder zu schrumpfen. Nach der Durchführung einer umgekehrten Wavelet-Transformation
wird das Bild oder Signal wiedergewonnen, jedoch mit einem etwas
reduzierten Hochfrequenzrauschen.
- (b) Die Vorgehensweise mit Soft-Schwellenwert wurde als eine
Verbesserung der Wavelet-Schrumpfung entwickelt und verwendet einen amplitudenadaptierten
Schwellenwert, um die Leistungsfähigkeit
des Algorithmus auf jeder Ebene der Wavelet-Zerlegung zu optimieren.
Siehe De-Noising via Soft Thresholding, Donoho, D. L., Technical
Report 409, 1992 Department of Statistics, Stanford University.
- (c) Die Cycle-Spinning-Technik, die in Translation-Invariant
De-Noising, Coufman, R. R. und Donoho, D. L., Technical Report,
Department of Statistics, Stanford University 1995 beschrieben ist, verwendet
sowohl die Wavelet-Schrumpfungs-Vorgehensweise
[a] als auch die Vorgehensweise mit Soft-Schwellenwert [b] und wendet die Techniken
auf mehrere Phasenverschiebungen des Eingangssignals oder Bildes
an. Die Resultate für
jede Phasenverschiebung werden gemeinsam einer Durchschnittswertbildung
unterzogen, was zu einer Reduzierung des Rauschens im Vergleich
zu dem Eingangsignal/Bild führt.
- (d) Die Vorgehensweise mit Cross-Validation verwendet die vorstehend
unter [b] genannte Soft-Schwellenwert-Technik und verwendet eine kurzen
Anpassungsannäherung
an die Eingangsdaten, um eine bessere Rausch-Schätzung und damit einen besseren
Schwellenwert zu entwickeln als der "Universal-Schwellenwert", der von Donoho et al. geschaffen wurde.
Siehe Generalized Cross Validation for Wavelet Thresholding, Jansen,
M., Malfait, M., Bultheel, A., 1996.
- (e) Die Vorgehensweise zur Wavelet-Domänenfilterung ist in Wavelet
Domain Filtering for Photon Imaging Systems, Nowak, R. D. und Baraniuk,
R. G., eingereicht im April 1997 bei IEEE Transactions on Image
Processing, beschrieben. In dieser Technik wird die Bilderfassungsperiode
in viele kürzere
Bilder unterteilt, um eine Reihe von Bildern zu schaffen, die durch
den gleichen Poisson-Rauschprozess
beeinflusst sind. Ein Filter des Wiener-Typs wird aufgebaut, wobei
die Eingabedaten verwendet werden, um eine Cross-Validation ähnlich der
Vorrichtung in [d] durchzuführen.
Diese Technik soll gute Rauschentfernungseigenschaften mit einer
minimalen Bildverschlechterung oder Kantenerweichung bieten.
-
In
dem Artikel mit dem Titel "An
Optimal Wavelet Thresholding Method for Speckle Noise Reduction", Image Processing,
Bd. 1, 1994, 74-79, wird Rauschen in einem Bild durch Amplituden-Schwellenwertbearbeitung
der Wavelet-Koeffizienten
entfernt. Der optimale Schwellenwert wird erhalten, indem eine iterative
Annäherung
an das Minimum der Differenz zwischen der Standardabweichung des
geschätzten
Rauschens und der Standardabweichung des entfernten Rauschens erfolgt.
Ein Bild des Rauschens wird erhalten und ein Maß des Rauschbildes wird verwendet,
um den Amplitudenschwellenwert so einzustellen, dass ein optimaler
Wert erhalten wird.
-
Ein
Problem bei allen vorstehend genannten Techniken (a) bis (e) liegt
in dem Erfordernis, einen Schätzwert
des Rauschens in dem Bild zu entwickeln, um einen geeigneten Schwellenwert
zu berechnen. Da das Rauschen sowohl aus Gauß'schen als auch aus Poisson-Komponenten
zusammengesetzt sein kann, sowie sowohl aus additiven als auch multiplikativen
Fehlern, wird dadurch die Effektivität jede dieser Vorgehensweisen
begrenzt. Für
die Techniken [a] bis [c] erscheint in der Tat eine Signal-Rauschabstand-Verbesserung
von mehr als 1,2X unwahrscheinlich. Die Technik [d] hat aufgrund
des Cross-Validation-Optimierungsprozesses
eine Signal-Rauschabstand-Verbesserung von annähernd 1,5X gezeigt, während Technik
[e] mit einer gezeigten Verbesserung von annähernd 2,4X des Signal-Rauschabstands
eine etwas bessere Leistung hatte. Die Techniken [d] und [e] erfordern
jedoch eine große
Anzahl von Berechnungen zum Berechnen ihrer optimierten Schwellenwerte
und funktionieren an komplexen Bildern auf Grund der großen Anzahl
von vorhandenen Merkmalsrändern,
die die Rausch-Schätzwerte
dieser Algorithmen beeinträchtigen
könnten, möglicherweise
nicht gut.
-
KURZBESCHREIBUNG
DER ERFINDUNG
-
Im
Unterschied zum Stand der Technik, der wie vorstehend beschrieben
Amplituden-Schwellenwertbearbeitung der Rausch-Komponenten verwendet,
ver wendet die vorliegende Erfindung Frequenz-Schwellenwertbearbeitung.
Die Wavelet-Transformation kann in vorteilhafter Weise an diese
Vorgehensweise angepasst werden, da sie die Fähigkeit zur automatischen Klassifizierung
von Informationen gemäß Frequenzen
hat.
-
Die
vorliegende Erfindung schafft somit ein Verfahren gemäß Anspruch
1 und eine Vorrichtung gemäß Anspruch
16 zum Verbessern des Signal-Rauschabstands
eines eine Information tragenden Signals.
-
Mit
der Nutzung der vorliegenden Erfindung ist eine stärkere Verbesserung
des Signal-Rauschabstands als nach dem Stand der Technik erreichbar.
Da ferner keine Schwellenwerte berechnet werden müssen und
große
Mengen von Berechnungen vermieden werden, wird ein Großteil der
Verarbeitung, die nach dem Stand der Technik erforderlich ist, vermieden.
-
KURZBESCHREIBUNG
DER ZEICHNUNGEN
-
Die
Erfindung ist unter Bezug auf die beiliegenden Zeichnungen besser
verständlich.
-
1 ist
ein Blockschaltbild eines Radar-Empfängers;
-
2 zeigt
ein optisches Bildaufbereitungssystem;
-
3A und 3B zeigen
ein Daubechies 4 (D4) Wavelet-Transformationspaar;
-
4 ist
ein Blockschaltbild, das eine bevorzugte Ausführungsform der Erfindung zeigt;
-
5 ist
eine Fotografie einer Referenzszene mit einem überlagerten Balkenziel;
-
6 ist
eine Fotografie der Referenzszene aus 5, abgebildet
durch eine tatsächliche
Optik, wobei das System einen Signal-Rauschabstand von 20 hat;
-
7 ist
eine Nahaufnahme des Balkenzielbereichs aus 6;
-
8A zeigt
die Wavelet-Skalierung oder Tiefpassmatrix der Wavelet-Transformation der
ersten Ebene der Referenzszene;
-
8B zeigt
den Wavelet-Koeffizienten oder die Hochpassmatrix der vertikalen
Komponenten der Referenzszene;
-
8C zeigt
den Wavelet-Koeffizienten oder die Hochpassmatrix der horizontalen
Komponenten der Referenzszene;
-
8D zeigt
den Wavelet-Koeffizienten oder die Hochpassmatrix der diagonalen
Komponenten der Referenzszene;
-
9A ist
eine Fotografie eines SCHWELLENWERTBEARBEITETEN BILDES DER EBENE
2;
-
9B ist
eine Fotografie eines SCHWELLENWERTBEARBEITETEN BILDES DER EBENE
4;
-
9C ist
eine Fotografie eines SCHWELLENWERT-BILDES DER EBENE 5;
-
10A ist eine Fotografie eines DIFFERENZ-BILDES
DER EBENE 2;
-
10B ist eine Fotografie eines DIFFERENZ-BILDES
DER EBENE 4;
-
10c ist eine Fotografie eines DIFFERENZ-BILDES
DER EBENE 5;
-
11 zeigt,
wie das Addieren von Hoch- und Niederfrequenzbildern in dem gewünschten
wiedergewonnenen Bild resultiert;
-
12 zeigt
das gewünschte
wiedergewonnene Bild, wenn das DIFFERENZ-BILD DER EBENE 2/5 verwendet
wird;
-
13A zeigt eine Nahaufnahme des Balkenzieles aus
dem verrauschten Bild;
-
13B zeigt eine Nahaufnahme des Balkenzieles aus
dem wiedergewonnenen Bild und demonstriert eine 5X-Verbesserung
des Signal-Rauschabstands;
-
14 zeigt
ein Debauchies 4 (D4) Wavelet-Transformationspaar mit äquivalentem
Zerlegungs- und Rekonstruktions-Tiefpass- und Hochpassfilter;
-
15 zeigt
ein Debauchies 6 (D4) Wavelet-Transformationspaar mit äquivalentem
Zerlegungs- und Rekonstruktions-Tiefpass- und Hochpassfilter;
-
16 zeigt
ein bioorthogonales 4.4 Wavelet-Transformationspaar mit äquivalentem
Zerlegungs- und Rekonstruktions-Tiefpass- und Hochpassfilter;
-
17 zeigt
ein der Erfindung enthaltendes optisches Bildaufbereitungsgerät, das an
einem Satelliten eingesetzt wird; und
-
18 zeigt
einen Computer und Speichermedien, die zur Umsetzung der Erfindung
verwendet werden können.
-
DETAILLIERTE
BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORM
-
1 und 2 sind
zwei Beispiele der vielen verschiedenen Arten von Systemen, die
Rauschen enthaltende, Informationen tragende Signale erzeugen, zu
denen die vorliegende Erfindung gehört.
-
In 1 ist
ein Blockschaltbild eines Radar-Empfängers dargestellt. Ein Radar-Sender
(nicht gezeigt) sendet Impulse aus und während die Antenne 2 des
Radar-Empfängers
bewegt wird, werden aus unterschiedlichen Richtungen kommende, reflektierte
Impulse empfangen und zur Verstärkung zum
Hochfrequenzverstärker 4 weitergeleitet.
Da bei den empfangenen Impulsen Rauschen vorhanden ist, werden sie
dann, wenn die empfangenen Impulse zu klein sind, am Ausgang nicht
erfasst, sondern gehen im Rauschen unter. Um den Signal-Rauschabstand zu
verbessern, ist der Wavelet-Rauschprozessor 6 vorgesehen,
der gemäß der Lehre
der vorliegenden Erfindung arbeitet. Ein eine Information tragendes
Signal mit verbessertem Signal-Rauschabstand kann anschließend zu
der Mischeinrichtung 8 weitergeleitet werden, in der es
in eine Zwischenfrequenz (I.F.) umgewandelt wird, und von dort zu
dem I.F.-Verstärker 10 und
dem Oszilloskop 12, wo das verbesserte Signal angezeigt
wird.
-
Während die
Erfindung auf das Minimieren von Rauschen in jedem allgemeinen Fall
gerichtet ist, ist sie dafür
in einem optischen Bildaufbereitungssystem besonders nützlich.
Ein derartiges System ist in 2 dargestellt
und enthält
gemäß der Darstellung einen
Sensor, der aus einer Optik 14 und einer Detektoranordnung 16 besteht,
und einen Bildaufbereitungsprozessor 18. Rauschen in einem
optischen System macht sich als Unschärfe, unscharfe Merkmalsränder oder
vollständige
Verdunkelung von Bildmerkmalen oder Bildbereichen bemerkbar.
-
Eine
Fernsehkamera ist ein Beispiel eines optischen Bildaufbereitungssystems,
aber es sind auch Systeme mit verbesserter Auflösung möglich, die aus großen Distanzen
(beispielsweise aus dem Weltall) Bilder aufnehmen, anzeigen und/oder
aufzeichnen können
und von einer Verbesserung des Signal-Rauschabstands profitieren. Derartige
Systeme sind in den gleichzeitig anhängigen Anmeldungen Nr. 08/763,610,
erteilt als US-A-6,240,219, und 09/081,842, erteilt als US-A-6,295,392,
eingereicht am 11. Dezember 1996 bzw. am 20. Mai 1998, aufgezeigt.
In einem beispielsweise in der Anmeldung Nr. 09/081,842 beschriebenen
System ist der Prozessor 18 in der dortigen 2 ein
hochauflösender
Prozessor, der in der Lage ist, eine Auflösung über die Grenzfrequenz der Optik 14 hinaus
zu schaffen. Gemäß vorliegender
Erfindung wird der Wavelet-Rauschprozessor 20 beispielsweise
am Ausgang der Detektoranordnung 16 vorgesehen, um den
Signal-Rauschabstand zu verbessern.
-
Wie
vorstehend beschriebenen verwendet die vorliegende Erfindung Wavelet-Transformationsverarbeitung.
Ein Wavelet ist ein mathematischer Operator, der aus einem Transformationspaar
besteht, und es gibt unterschiedliche Typen von Wavelets, die unterschiedliche
technische Namen haben, wie etwa Debauchies 4, Debauchies 6 etc.
Zum Zweck der Erläuterung
ist das Debauchies 4 Wavelet, das in der vorliegenden Erfindung
verwendet werden kann, in 3A und 3B dargestellt.
Gemäß der Darstellung
besteht das Wavelet aus dem Transformationspaar Φ und Ψ, die jeweils eine vorbestimmte
Wellenform sind. Wenn das eine Information tragende Signal jeweils
mit Φ und Ψ multipliziert
wird, wirkt Ψ als
ein Hochpassfilter, während Φ als ein
Tiefpassfilter wirkt. Auf diese Weise wird das Signal gleichzeitig
einer Hochpass- und Tiefpassfilterung unterzogen. Die Ψ-Funktion
nimmt effektiv ein Derivat des Signals und schafft so eine Matrix
von Werten, die die Differenz zwischen benachbarten Werten in einer
Matrix von Werten darstellen, die das Originalsignal enthält, und
die resul tierende Hochfrequenzmatrix der Werte wird als die Skalierungsmatrix bezeichnet.
Andererseits integriert die Φ-Funktion
effektiv die benachbarten Werte in der ursprünglichen Signalmatrix bzw.
nimmt einen Durchschnittwert derselben, und die resultierende Matrix
der Werte wird als Wavelet-Koeffizientenmatrix bezeichnet. Ferner hat
jede resultierende Matrix die Hälfte
der Größe der Wertematrix,
die das ursprüngliche
Signal in einer Dimension darstellt, und die gleiche Größe in der
anderen Dimension. Somit haben die Wavelet-Koeffizientenmatrix (Hochfrequenz) und
die Wavelet-Skalierungsmatrix (Niederfrequenz) zusammen die gleiche Größe wie die
das ursprünglichen
Signal darstellende Matrix. Aus der vorstehenden Erläuterung
ist verständlich,
dass die Wavelet-Transformationsmatrizes sowohl Frequenzinformationen
als auch räumliche Informationen
aufweisen, die sich auf das erfasste Signal beziehen. Die Art der
Hochpass- und Tiefpassfilterung und der resultierenden Matrizes
wird im Detail in Zusammenhang mit nachfolgenden Figuren näher erläutert, aber
nun wird die Erfindung in Zusammenhang mit dem Blockschaltbild in 4 beschrieben.
-
Wie 4 zeigt,
wird das die Information tragende Signal/Bild zunächst erfasst
und digitalisiert, wie in Block 20 dargestellt. In den
von den Blöcken 22, 24, 26, 28 und 30 dargestellten
Blöcken
wird ein als Wavelet-Zerlegung bekannter Prozess durchgeführt. Das
heißt,
dass Wavelet-Transformationen wiederholt genommen werden, um Hochfrequenzkomponenten
zu isolieren, die Rauschen entsprechen. Genauer ausgedrückt wird
eine Wavelet-Transformation
der ersten Ebene des Signals genommen (Block 22) und anschließend wird
eine weitere Wavelet-Transformation (zweite Ebene) der Transformation
der ersten Ebene genommen und so fort. Wie aus der vorstehenden
Erläuterung
des Filterungsvorgangs der Wavelet-Transformationspaare zu ersehen
ist, ist in der ersten Ebene der Inhalt der Transformation hauptsächlich Signalinformation,
jedoch mit dem Berechnen von Transformationen höherer Ordnung sind es hauptsächlich Hochfrequenzkomponenten,
die Rauschen zuzuschreiben sind. Somit ist es der Zweck der Wavelet-Zerlegung,
den Hochfre quenzinhalt des Signals zu isolieren, wobei gewöhnlich Rauschen,
aber keine Informationen in diesen höheren Frequenzen vorliegen.
-
In
der bevorzugten Ausführungsform
wird dies durch Berechnen von Wavelet-Transformationen bis hinauf zur fünften Ebene
erreicht, es versteht sich jedoch, dass die spezifische Ebene variiert
werden kann, während
das Prinzip der Erfindung beibehalten wird. Ferner sei angemerkt,
dass die Begriffe "Hochfrequenz" und "Niederfrequenz" in ihre Verwendung
hierin keine absoluten Werte betreffen, sondern relativ hohe und
niedrige Werte in Verbindung mit dem Frequenzinhalt der speziellen
Signal/Rausch-Kombination, die verarbeitet wird.
-
Sobald
das Rauschen isoliert ist, ist es erwünscht, es von dem ursprünglichen
Signal zu subtrahieren. Ein Wiederherstellungsprozess, der die Berechnung
von umgekehrten Wavelet-Transformationen einschließt, ist
dazu erforderlich. So wird wie vorstehend beschrieben jedesmal dann,
wenn eine Wavelet-Transformation
genommen wird, die Größe des Bildes
in einer Dimension halbiert, und da die Transformation entlang beiden
Dimensionen des Bildes genommen wird, hat das resultierende Bild
in beiden Dimensionen die halbe Größe. Somit ist dann, wenn man
die fünfte
Wavelet-Transformation erreicht, die Größe des Bildes 1/32 des Originals.
Es ist erforderlich, die ursprüngliche
Größe des Bildes
wiederherzustellen, bevor eine sinnvolle Subtraktion von Rauschen
bewirkt werden kann.
-
Durch
das Nehmen einer umgekehrten Wavelet-Transformation wird die Wavelet-Transformation
zurück
in ein Signal in der Zeitdomäne
umgewandelt und das Nehmen der nachfolgenden Transformation niedrigerer
Ordnung stellt die Größe des Signals
oder des Bildes wieder her. Um die umgekehrte Wavelet-Transformation einer
bestimmten Ebene zu nehmen, ist es erforderlich, die Skalierungsmatrix
und die Wavelet-Koeffizientenmatrix für die darüberliegende Ebene zu verwenden.
Da jedoch die Rausch-Information nur in der Koeffizientenmatrix enthalten
ist, werden Blind- oder "geänderte" Wellenlängen-Skalierungsmatrizes
konstruiert. In der bevorzugten Ausführungsform werden die geänderten
Matrizes erhalten, indem alle Koeffizienten auf Null gesetzt wer den,
während
die Größe der Matrix
auf der korrekten Größe für die Transformationsebene,
zu der sie gehört,
gehalten wird.
-
Auf
diese Weise werden in dem von Block 32 dargestellten Schritt
Null-gefüllte
Wavelet-Skalierungmatrizes der ersten, der zweiten, der dritten,
der vierten und der fünften
Ebene konstruiert. Anschließend
wird in Block 34 die umgekehrte Wavelet-Transformation
der vierten Ebene unter Verwendung der Koeffizientenmatrix der fünften Ebene
und der Null-gefüllten
Wavelet-Skalierungsmatrix der fünften
Ebene berechnet. In den Blöcken 36, 40 und 42 werden
die dritten bis ersten umgekehrten Wavelet-Transformationen berechnet,
wobei für
jede Ebene die Koeffizientenmatrix und die Null-gefüllte Wavelet-Skalierungsmatrix
für die
darüberliegende Ebene
verwendet werden. In dem von Block 44 dargestellten Schritt
wird die umgekehrte Wavelet-Transformation für die Ebene unterhalb der ersten Ebene
unter Verwendung der Koeffizientenmatrix der ersten Ebene und der
Null-gefüllten
Wavelet-Skalierungsmatrix der ersten Ebene berechnet.
-
Dies
resultiert in dem SCHWELLENWERTBEARBEITETEN BILD DER EBENE 5, das
dem durch die Wavelet-Transformation der fünften Ebene isolierten Rauschen
entspricht, das in die Zeitdomäne
umgewandelt wurde. Das SCHWELLENWERTBEARBEITETE BILD DER EBENE 5
wird in Block 44 von dem ursprünglichen Bild subtrahiert,
um ein resultierendes Signal zu erzeugen, das als DIFFERENZ-BILD
DER EBENE 5 bezeichnet wird. Dieses resultierende Signal hat im
Vergleich zu dem ursprünglichen
Bildsignal einen verbesserten Signal-Rauschabstand, da das Rauschen davon
subtrahiert wurde. Dies kann als das endgültige wiedergewonnene Signal
verwendet werden oder es kann weiter verbessert werden, wie nachfolgend
beschrieben.
-
Es
sei angemerkt, dass in bestimmten Fällen das SCHWELLENWERTBEARBEITETE
BILD DER EBENE 5 eine geringe Menge von Restbildinformationen (zum
Beispiel Rand- oder Eckdaten) enthalten kann. Dies kann durch die
Tatsache bedingt sein, dass die Werte in der Skalierungsmatrix der
Wavelet-Transformation
der Ebene 5 zwar im wesentlichen Rauschen zuzuschreiben sind, sie
aber doch eine geringe Menge Bildinformationen enthalten können, da es
in einigen Fällen
schwierig sein kann, Hochfrequenz-Bildinformationen von Rauschen
zu unterscheiden.
-
Es
wurde festgestellt, dass ein Signal gefunden werden kann, das zum
Kompensieren der Restbildinformationen nützlich sein kann.
-
Es
wurde festgestellt, dass die Informationen in einer Wavelet-Transformation
einer niedrigeren Ebene für
diesen Zweck verwendet werden können. In
der hierin beschriebenen bevorzugten Ausführungsform ist diese niedrigere
Ebene die Wavelet-Transformation der zweiten Ebene, obgleich in anderen
Ausführungsformen
unterschiedliche Ebenen oder Kombinationen daraus empirisch bestimmt werden
können.
-
Der
Prozess zum Erzeugen des Kompensationssignals ist durch die Blöcke 48, 50 und 52 dargestellt.
In dem von Block 48 dargestellten Schritt wird eine Wavelet-Transformation
der ersten Ebene unter Verwendung der Koeffizientenmatrix der zweiten Ebene
und der Null-gefüllten
Wavelet-Skalierungsmatrix der zweiten Ebene berechnet. Dann wird
in Block 50 die umgekehrte Wavelet-Transformation für die Ebene unterhalb der ersten
Ebene berechnet, und zwar unter Verwendung der Koeffizientenmatrix für die Wavelet-Transformation
der ersten Ebene und der Null-gefüllten Wavelet-Skalierungsmatrix
für die Wavelet-Transformation
der ersten Ebene, wodurch das Kompensationssignal geschaffen wird.
Das Resultat wird auf einer Pixel-für-Pixel-Basis von dem ursprünglichen
Bild subtrahiert, wodurch ein Zwischensignal geschaffen wird, das
als das DIFFERENZ-EBENENBILD DER EBENE 2 bezeichnet ist. Dies wird
in Block 52 Pixel für
Pixel zu dem DIFFERENZ-BILD DER EBENE 5 addiert, wodurch das verbesserte
DIFFERENZ-BILD DER EBENE 2/5 geschaffen wird.
-
Eine
weitere Verbesserung des Signal-Rauschabstands kann durch Einschließen des
Schrittes von Block 54 möglich sein. Hier wird das SCHWELLENWERTBEARBEITETE
BILD DER EBENE 5 zu dem DIFFERENZ-BILD DER EBENE 2/5 addiert. Auf Grund
einer Zeichenänderung,
die jedesmal dann auftritt, wenn eine Wavelet-Transformation berechnet wird,
hat dies den Effekt, dass das Rauschen erneut subtrahiert wird,
wobei festgestellt wurde, dass dies den Signal-Rauschabstand weiter
verbessert. Das Resultat ist das RAUSCH-REDUZIERTE BILD.
-
Wie
vorstehend beschrieben wird in der bevorzugten Ausführungsform
das Frequenz-Schwellenwertbearbeitete Signal (SCHWELLENWERTBEARBEITETES
SIGNAL DER EBENE 5 in 4) von einer Wavelet-Transformation
einer höheren
Ordnung hergeleitet, indem geänderte
Wavelet-Skalierungmatrizes verwendet werden, die Null-gefüllt sind. In
anderen Ausführungsformen
können
jedoch unterschiedliche geänderte
Matrizes verwendet werden. Im Rahmen eines nicht einschränkenden
Beispiels können
die folgenden (oder andere spezifische geänderte Matrizes) verwendet
werden.
- a. Die Werte in den Wavelet-Skalierungmatrizes können auf
eine andere festgelegte Zahl als Null gesetzt werden. Die am besten
funktionierende Zahl kann empirisch bestimmt werden.
- b. Eine modifizierte Version der Amplituden-Schwellenwertbearbeitung
kann verwendet werden. Ein Amplituden-Schwellenwert wird für die Werte
in der Wavelet-Skalierungsmatrix ausgewählt, und alle Werte unterhalb
des Schwellenwerts werden auf Null gesetzt, während alle Werte über dem
Schwellenwert unverändert
bleiben.
-
Ein
Vorrichtungsaspekt der Erfindung kann in einem programmierten Computer 90 implementiert werden,
der in 18 gezeigt ist, der den vorstehend beschriebenen
und in 4 dargestellten Prozess ausführt. Die ein Computerprogramm
aufweisenden Befehle können
auf herkömmlichen
Speichermedien 92, wie z. B. Magnetdisketten oder optischen
Platten gespeichert werden, die von dem Computer 90 gelesen,
in dem lokalen Speicher gespeichert und unter Steuerung des Computers
ausgeführt
würden.
-
Die
Erfindung ist unter Bezugnahme auf 5 bis 15 besser
verständlich,
die verschiedene Stufen des Bildbearbeitungsprozesses sowie einige
der spezifischen Wavelet-Transformationen, die verwendet werden
können,
erläutern.
-
5 zeigt
eine Referenzszene, auf die optisch ein Balkenziel überlagert
ist, sodass es als auf der Erde befindlich erscheint. Die Referenzszene enthält Gras 60,
Bäume 62 und
Straßen 64.
-
6 zeigt
die Referenzszene in der Abbildung durch eine tatsächliche
Optik mit einer Grenzefrequenz, wobei das System einen Signal-Rauschabstand
von 20 (enthält
nur Gauß'sches Rauschen) hat. Es
ist zu erkennen, dass der Großteil
der Hochfrequenz-Details im Hintergrund verloren ist. 7 ist eine
Nahaufnahme des Balkenzielbereichs aus dem Bild in 6.
-
8A bis 8D stellen
Matrixkomponenten der Wavelet-Transformation der ersten Ebene der Referenzszene
dar. Es sei angemerkt, dass alle Matrixkomponenten die halbe Größe des ursprünglichen Bildes
sowohl in horizontaler als auch vertikaler Richtung haben, da die
Wavelet-Transformation in beiden Richtungen genommen wird. 8A ist
die Wavelet-Skalierung oder Tiefpassmatrix, während 8B die
Koeffizienten- oder Hochpassmatrix der vertikalen Komponenten ist. 8C ist
die Koeffizientenmatrix der horizontalen Komponenten, während 8D die
Koeffizientenmatrix der diagonalen Komponenten ist, das heißt die Kreuzmenge
der horizontalen und der vertikalen Komponenten. Diese Figuren zeigen die
Frequenzeigenschaften und die Eigenschaften der räumlichen
Anordnungen der Wavelet-Transformation.
-
9A, 9B und 9C zeigen
jeweils ein SCHWELLENWERT-BILD DER EBENE 2, ein SCHWELLENWERTBEARBEITETES
BILD DER EBENE 4 und ein SCHWELLENWERTBEARBEITETES BILD DER EBENE
5, die alle mit der D4-Wavelet-Transformation
gebildet wurden. Das schwellenwertbearbeitete Bild der Ebene 5 wurde
vorstehend in Verbindung mit 4 erörtert und
es besteht aus Rauschen, das dann, wenn es von dem ursprünglichen
Bild subtrahiert wird, dessen Signal-Rauschabstand verbessert. Das
SCHWELLENWERTBEARBEITETE BILD DER EBENE 2 besteht größtenteils aus
Informationsinhalt, während 9B ein SCHWELLENWERTBEARBEITETES
BILD DER EBENE 4 zeigt, das, wie zu erkennen ist, hinsichtlich des
Hochfrequenz-Inhalts
zwischen den SCHWELLENWERTBEARBEITETEN BILDERN DER EBENE 2 und der
EBENE 5 liegt.
-
10A, 10B und 10C zeigen jeweils ein DIFFERENZ-BILD DER EBENE
2, ein DIFFERENZ-BILD DER EBENE 4 und ein DIFFERENZ-BILD DER EBENE
5 für die
D4-Wavelet-Transformation. Es ist zu beobachten, dass das DIFFERENZ-BILD
DER EBENE 4 und das DIFFERENZ-BILD DER EBENE 5 recht ähnlich sind.
Diese Bilder wurden hinsichtlich des Rauschens korrigiert, scheinen
jedoch einen etwas geringen Kontrast zu haben.
-
11 zeigt,
wie das Addieren von Niederfrequenz- und Hochfrequenzbildern zu
dem gewünschten
wiedergewonnenen Bild führt.
Dies ist der Schritt, der in Block 54 in 4 durchgeführt wird,
mit der Ausnahme, dass in 11 ein
DIFFERENZ-BILD DER EBENE 2/4 anstatt eines DIFFERENZ-BILDES DER
EBENE 2/5 dargestellt ist. Das resultierende wiedergewonnene Bild
ist hinsichtlich des Rauschens korrigiert und hat einen geeigneten Kontrast.
-
Das
resultierende wiedergewonnene Bild unter Verwendung des Differenz-Bildes der Ebene
2/5 und des Daubechies 4 (D4) Wavelet ist in 12 gezeigt. 13B zeigt eine Nahaufnahme des Balkenzieles aus 12,
die eine 5X Verbesserung des Signal-Rauschabstands im Vergleich
zu der Nahaufnahme des Balkenzieles des verrauschten Bildes aus 7 zeigt
(in 13A zu Vergleichszwecken dargestellt).
Dies ist im Vergleich mit den Verbesserungen von 1X bis 2,4X, die
mit dem vorstehend erörterten
Stand der Technik erzielt werden, vorteilhaft.
-
14 zeigt
das Daubechies (D4) Wavelet-Transformationspaar zusammen mit den
entsprechenden Tiefpass- und Hochpassfiltern zur Zerlegung und Wiederherstellung,
die den Funktionen Φ bzw. Ψ entsprechen.
Diese sind nach dem Stand der Technik bekannt und werden hier nur
der Vollständigkeit
halber eingeschlossen. Das ursprüngliche
Signal bildet eine Wertematrix, wie etwa bei einer Rasterabtastung
eines Bildes, das Zeilen und Spalten von Werten hat. Jede Zeile
oder Spalte des Signals wird aufeinanderfolgend in nachfolgender
Weise durch die Filter geleitet. Die ersten acht Werte in einer
Zeile oder Spalte werden mit den Amplitudenwerten entsprechend der
Abszisse 0 bis 7 in dem Tiefpassfilter multipliziert, das heißt der erste
Signalwert mit dem Amplitudenwert für die Abszisse Null, der zweite
Signalwert mit dem Amplitudenwert für die Abszisse 1 usw. Anschließend wird
ein gewichteter Durchschnittswert genommen und der resultierende
Wert entspricht dem ersten Wert in der resultierenden Transformationsmatrix
und so fort für
die verbleibenden Werte.
-
Für das Hochpassfilter
wird eine Gruppe von Differenzen zwischen benachbarten Werten berechnet
und anschließend
wie für
das Tiefpassfilter gewichtet und kombiniert.
-
15 zeigt
die gleiche Information für
die Debauchies 6 (D6) Wavelet-Transformation,
während 16 diese
Information für
die bioorthogonale 4.4 Wavelet-Transformation zeigt. Eine beliebige
andere bekannte Wavelet-Transformation,
z. B. symmetrisch 8, kann auch verwendet werden. Bestimmte Wavelet-Transformationen
können
für bestimmte
Arten von Szenen besser geeignet sein, und in einer Vorrichtung
gemäß der Erfindung
würden
die verschiedenen Wavelets gespeichert und entweder würde eine
Bedienungsperson das für
die Szene am besten geeignete Wavelet auswählen oder dies würde durch
eine geeignete Software automatisch durchgeführt. Das System kann auch hinsichtlich
der spezifischen verwendeten Wavelet-Ebene adaptiv sein, wobei bestimmte
Ebenen (z. B. die fünfte
Ebene wie hierin dargestellt) bei bestimmten Bildern die besten
Resultate ergeben, jedoch unter unterschiedlichen Bedingungen und/oder
mit unterschiedlichen Wavelet-Transformationen andere Ebenen besser funktionieren.
-
Ein
Vorteil der vorliegenden Erfindung liegt darin, dass sie in der
Lage ist, sowohl Poisson-Rauschen als auch Gauß'sches Rauschen zu beseitigen. Poisson-Rauschen
ist schwierig zu behandeln, da es als Teil des Erfassungsprozesses
auftritt und mit der erfassten Signalamplitude variiert, während das Gauß'sche Rauschen von
der Signalamplitude unabhängig
ist. Um Poisson-Rauschen
zu reduzieren, muss die Signalabtastung mit einer zeitlichen oder räumlichen
Rate erfolgen, die mindestens das Zweifache der maximalen Informationsfrequenz
in dem bandbeschränkten
Signal beträgt.
Für einen
Audiosensor, wie z. B. ein Mikrofon, bedeutet dies, dass einen Abtast-Halte/Analog-Digitalwandler, der
vorhanden sein kann, mit mindestens dem Zweifachen der maximalen
Frequenz vorhanden ist, die der Vorverstärker durchleiten kann. In ähnlicher
Weise muss bei einem Funkempfänger
ein Abtast-Halte/Analog-Digitalwandler
mit mindestens dem Zweifachen der maximalen Frequenz abtasten, die
von den Detektor/IF/Vorverstärker-Stufen
durchgeleitet wird. Im Fall der Bildbearbeitung bedeutet dies, dass
mindestens zwei Detektoren innerhalb des Zentralpunkts des Beugungsbildes
des optischen Systems vorhanden sein müssen. Unter diesen Umständen ist
zu sehen, dass ein von nur einem Detektor erfasstes Signal höher als
die höchste
Informationsfrequenz in dem Signal ist und Rauschen sein muss, das
durch Frequenz-Schwellenwertbearbeitung isoliert wird. Es sei angemerkt,
dass bei Verwendung in Verbindung mit dem Höchstauflösungsprozessor der Anmeldung
Nr. 09/081,842 mindestens fünf
Detektoren in dem Zentralpunkt des Beugungsbildes des optischen
Systems vorhanden wären.
-
Ein
weiterer Vorteil der Erfindung liegt darin, dass der Signal-Rauschabstand
bei komplexen Bildern und einfachen Bildern in gleicher Weise verbessert
wird. Somit sind das Verfahren und die Vorrichtung gemäß der Erfindung über eine
große
Bandbreite von Bildtypen stabil.
-
Da
Informationen tragende Signale ubiquitär sind, kann die Erfindung
für zahlreiche
Anwendungen verwendet werden, wozu satellitengestützte Bildaufbereitung,
auch mit Satelliten, die von der Erde aus gesteuert werden, luftgestützte Bildaufbereitung, landgestützte Fernbildaufbereitung,
Unterwasser-Bildaufbereitung,
Infrarot-Bildaufbereitung jeglicher Art, Sonar-Bildaufbereitung,
LIDAR-Bildaufbereitung, Laser-Rückstreuungs-Bildaufbereitung,
die Verbesserung der Genauigkeit von Laser-Entfernungsmessung, die
Verbesserung der Genauigkeit von atmosphärischen Messungen, die Reduzierung des
Rauschens bei der Radar-Bildaufbereitung, die Beseitigung des Rauschens
bei der Doppler-Radar-Bildaufbereitung, wie z. B. Röntgen, CAT-Scan, PET-Scan,
MRI, Ultraschall-Bildaufbereitung, Doppler-Ultraschall-Bildaufbereitung,
thermische Bildaufbereitung, die Beseitigung des Audio-Rauschens,
die Beseitigung von Vibrationen bei Kraftfahrzeugaufhängungen,
die Beseitigung des Funk-Rauschens, die
Reduzierung des Rauschens in Servo-Schleifen, die Reduzierung von
mechanischen Vibrationen, rauscharme Präzisions-Testmessungen, die
Beseitigung von Umgebungs-Hintergrundrauschen, die Reduzierung des
Rauschens bei der Analyse von seismischen Daten, die Reduzierung
des Rauschens bei der Kommunikation auf sehr niedrigen Frequenzen, die
Verbesserung des Fernsehsignals, die Vorverarbeitung für höchstauflösende Bildaufbereitung,
die Beseitigung des Rauschens in der Radioastronomie, die Beseitigung
des Rauschens in Bildern von astronomischen Instrumenten, die Signalverbesserung
in der Computernetzkommunikation und die Signalverbesserung in der
Internet/Intranet-Kommunikation zählen.
-
16 zeigt
eine spezifische Anwendung der Erfindung als Teil eines Satelliten-Bildaufbereitungssystems 84.
Ein derartiges System entspräche im
allgemeinen dem Typ des vorstehend beschriebenen Bildaufbereitungssystems
und würde
eine hierin beschriebene Wavelet-Rauschprozessorvorrichtung enthalten.
Es würde
von dem Satelliten 80 getragen, der um die Erde 82 umläuft, und
Bilder von ausgewählten
Zielen auf der Erde bereitstellen. Der Satellit (einschließlich des
Bildaufbereitungsprozesses) kann über eine Kommunikationsverbindung 86 durch auf
der Erde befindliche Steuereinrichtungen gesteuert werden. Beispielsweise
könnten
die Bildaufbereitungs-Verweildauer, das Gesichtsfeld und die Spektralbänder, die
von Interesse sind, von der Erde aus ausgewählt und gesteuert werden, und
zwar unter Verwendung von Computern mit Funk- oder Laserverbindung
zu dem Satelliten.