DE602004001366T2 - Gewichtete, überbestimmte Rauschunterdrückung - Google Patents

Gewichtete, überbestimmte Rauschunterdrückung Download PDF

Info

Publication number
DE602004001366T2
DE602004001366T2 DE602004001366T DE602004001366T DE602004001366T2 DE 602004001366 T2 DE602004001366 T2 DE 602004001366T2 DE 602004001366 T DE602004001366 T DE 602004001366T DE 602004001366 T DE602004001366 T DE 602004001366T DE 602004001366 T2 DE602004001366 T2 DE 602004001366T2
Authority
DE
Germany
Prior art keywords
combination
noise
digital
weighting factors
linear
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE602004001366T
Other languages
English (en)
Other versions
DE602004001366D1 (de
Inventor
Onur G. Guleryuz
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Publication of DE602004001366D1 publication Critical patent/DE602004001366D1/de
Application granted granted Critical
Publication of DE602004001366T2 publication Critical patent/DE602004001366T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B23MACHINE TOOLS; METAL-WORKING NOT OTHERWISE PROVIDED FOR
    • B23QDETAILS, COMPONENTS, OR ACCESSORIES FOR MACHINE TOOLS, e.g. ARRANGEMENTS FOR COPYING OR CONTROLLING; MACHINE TOOLS IN GENERAL CHARACTERISED BY THE CONSTRUCTION OF PARTICULAR DETAILS OR COMPONENTS; COMBINATIONS OR ASSOCIATIONS OF METAL-WORKING MACHINES, NOT DIRECTED TO A PARTICULAR RESULT
    • B23Q7/00Arrangements for handling work specially combined with or arranged in, or specially adapted for use in connection with, machine tools, e.g. for conveying, loading, positioning, discharging, sorting
    • B23Q7/04Arrangements for handling work specially combined with or arranged in, or specially adapted for use in connection with, machine tools, e.g. for conveying, loading, positioning, discharging, sorting by means of grippers
    • B23Q7/048Multiple gripper units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/10Image enhancement or restoration using non-spatial domain filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • EFIXED CONSTRUCTIONS
    • E01CONSTRUCTION OF ROADS, RAILWAYS, OR BRIDGES
    • E01DCONSTRUCTION OF BRIDGES, ELEVATED ROADWAYS OR VIADUCTS; ASSEMBLY OF BRIDGES
    • E01D2/00Bridges characterised by the cross-section of their bearing spanning structure
    • E01D2/02Bridges characterised by the cross-section of their bearing spanning structure of the I-girder type
    • EFIXED CONSTRUCTIONS
    • E01CONSTRUCTION OF ROADS, RAILWAYS, OR BRIDGES
    • E01DCONSTRUCTION OF BRIDGES, ELEVATED ROADWAYS OR VIADUCTS; ASSEMBLY OF BRIDGES
    • E01D2101/00Material constitution of bridges
    • E01D2101/30Metal
    • E01D2101/32Metal prestressed

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Mechanical Engineering (AREA)
  • Image Processing (AREA)
  • Picture Signal Circuits (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)
  • Analogue/Digital Conversion (AREA)
  • Noise Elimination (AREA)

Description

  • Hintergrund der Erfindung
  • Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf Techniken zur Entfernung von Rauschen von einer digitalen Darstellung (z. B. einem digitalen Bild) unter Verwendung eines Satzes von übervollständigen Transformationen und einer Schwellwertoperation. Die Techniken können in Verfahren/Algorithmen angewendet werden, die in einer Software, einer Hardware oder einer Kombination daraus enthalten sein können, und sie können von einem Computer oder einem anderen prozessorgesteuerten Gerät ausgeführt werden.
  • Beschreibung der zugehörigen Technik
  • Das Signal in dem additiv unabhängigen und identisch verteilten (i.i.d.) Rauschproblem besteht weiter, um maßgeblich beachtet zu werden, während es einen Vergleichspunkt für die fehlerfreie statistische Modellierung und Darstellung von Signalen bereitstellt. Das Problem wurde zunächst unter Verwendung einer einzelnen Transformation angegangen und wurde später auf eine übervollständige Basis ausgedehnt. Seitdem hat sich die Forschung auf diesem Gebiet bislang auf die Erzielung besserer Transformations- und besserer Schwellwertoperationstechniken konzentriert.
  • Entrauschen unter Verwendung von linearen Transformationen und Schwellwertoperationen beruht auf dünnen Dekompositionen mit den verwendeten Transformationen. Unter i.i.d.-Rausch-Annahmen kann gezeigt werden, dass die Transformationskoeffizienten mit kleinen Werten einen sehr niedrigen Störabstand (SNR) aufweisen und eine Schwellwertoperations-Nicht-Linearität, die wirksam diese Koeffizienten ermittelt und entfernt (im Fall einer Hard-Schwellwertoperation) oder verringert (im Fall einer Soft-Schwellwertoperation), kann gezeigt werden, um die Störleistung zu verbessern. Tatsächlich ist diese Verbesserung auf die Gruppe von Signalen beschränkt, über der die verwendeten linearen Transformationen dünne Dekompositionen liefern. Wenn man sich jedoch üblicherweise verwendete örtliche Transformation, wie zum Beispiel Wavelet-Transformationen oder blockdiskrete Kosinus-Transformationen (DCTs) über einem bestimmten Bild vorstellt, ist es ersichtlich, dass viele der DCT- oder Wavelet-Grundfunktionen, die die Transformation umfassen, die Kanten und andere einzigartige Punkte überdecken. Es ist wohlbekannt, dass die Seltenheitseigenschaften diese Wesensmerkmale nicht verschieben, und als ein Ergebnis leidet die Entrauschungsleistung. Entrauschen mit übervollständigen Transformationen, siehe zum Beispiel „Räumlich anpassungsfähiges Bild-Entrauschen unter übervollständiger Expansion" von Xin Li und Orchard M T, Verfahren der internationalen Konferenz zur Bildverarbeitung 2000, versucht dieses Problem durch Mittelwertbildung mehrerer entrauschter Schätzwerte (die den verschobenen Versionen derselben Transformation entsprechen) bei jedem Pixel zu beheben. Man hofft, dass einige der Schätzwerte eine bessere Leistung liefern als andere, was dann in einer Mittelwertbildung korrigiert wird.
  • Ziele der Erfindung
  • Es ist ein Ziel der vorliegenden Erfindung, unter Verwendung übervollständiger Transformationen und einer Schwellwertoperation in der Technologie des Entrauschens digitaler Signale weitere Verbesserungen bereitzustellen, indem ein gesonderter Freiheitsgrad ausgenutzt wird, der bei der Verwendung der oben erörterten Entrauschungsansätze nicht vorhanden ist.
  • Es ist ein weiteres Ziel dieser Erfindung, eine Entrauschungstechnik für ein digitales Bild bereitzustellen, das die Formulierung einer optimalen Kombination von entrauschten Schätzwerten für jedes Pixel und dessen Auflösung für optimale Schätzwerte einbezieht.
  • Übersicht über die Erfindung
  • Nach einem Gesichtspunkt dieser Erfindung werden Verfahren zur Erzielung eines Schätzwertes eines rauschfreien Teils eines verrauschten digitalen Signals bereitgestellt. Ein Verfahren umfasst die Schritte der Anwendung eines Satzes von M linearen Transformationen auf das verrauschte digitale Signal; das Bestimmen von M entrauschten Anfangs-Schätzwerten jedes digitalen Elementes des digitalen Signals; das Herleiten einer Kombination von Gewichtungsfaktoren für die M entrauschten Anfangs-Schätzwerte jedes digitalen Elementes durch Formulieren der Kombination als ein Problem linearer Schätzung und Lösen desselben für die einzelnen Gewichtungsfaktoren; und das Formulieren eines entrauschten Abschluss-Schätzwertes für jedes digitale Element auf Basis der entsprechenden M entrauschten Anfangs-Schätzwerte und der Kombination der Gewichtungsfaktoren.
  • Der Satz von M linearen Transformationen wird vorzugsweise auf das digitale Signal als Ganzes oder auf jedes digitale Element angewendet.
  • Für jede lineare Transformation in dem Satz von M linearen Transformationen werden die die M entrauschten Anfangs-Schätzwerte eines bestimmten digitalen Elementes vorzugsweise erzielt, indem eine Schwellwertoperation für jeden Transformationskoeffizienten, der einen Absolutwert unterhalb eines Schwellwertes aufweist, und eine inverse Transformation der Transformationskoeffizienten, die keiner Schwellwertoperation unterzogenen werden, durchgeführt werden.
  • Vorzugsweise ist die Kombination aus Gewichtungsfaktoren eine optimale Kombination, die so hergeleitet wird, dass ein bedingter mittlerer quadratischer Fehler in Bezug auf die entrauschten Anfangs-Schätzwerte minimiert wird.
  • Der Satz M linearer Transformationen kann eine beliebige Anzahl von Ausprägungen annehmen, einschließlich (i) eine diskrete Kosinustransformation und eine vorgegebene Anzahl ihrer übervollständigen Verschiebungen, (ii) eine Wavelet-Transformation und eine vorgegebene Anzahl ihrer übervollständigen Verschiebungen, oder (iii) eine Fourier-Transformation und eine vorgegebene Anzahl ihrer übervollständigen Verschiebungen.
  • In bevorzugten Ausführungsformen ist das digitale Signal ein Bild oder ein Video-Frame, das/der aus einer Vielzahl von Pixeln besteht, wobei jedes digitale Element ein Pixel oder eine Gruppe von Pixeln umfasst.
  • In einem weiteren Verfahren wird ein Schätzwert x ^ eines rauschfreien Teils x eines verrauschten Signals y erzielt. Das Verfahren umfasst das Erzielen eines Schätzwerts x ^(n) für jedes Element n von x ^ gemäß der folgenden Gleichung:
    Figure 00040001
    worin die Gewichtungsfaktoren αi(n), i = 1, ..., M, n = 1, ..., N optimal bestimmt werden, indem eine Kombination derselben als ein Problem linearer Schätzung formuliert wird. Dann werden die N x ^(n)-Schätzwerte kombiniert, um x ^ zu erzielen.
  • Vorzugsweise wird αi(n) optimal so bestimmt, dass x ^(n) einen bedingten mittleren quadratischen Fehler in Bezug auf die entrauschten Anfangs-Schätzwerte minimiert. Noch besser wird die optimale Bestimmung von αi(n) ferner bestimmt auf Basis eines Skalierfaktors, der eine explizite Abhängigkeit von der Rauschvarianz beseitigt, und (i) auf Basis einer Matrix, die von einem übervollständigen Transformationssatz abhängt, der beim Erzielen jedes x ^(n) angewendet wird, (ii) auf Basis und einer diagonalen Matrix, die von einer Matrix hergeleitet wird, die von einem übervollständigen Transformationssatz abhängt, der beim Erzielen jedes x ^(n) angewendet wird, oder (iii) auf Basis einer reduzierten diagonalen Matrix, die von einer diagonalen Matrix hergeleitet wird, die ihrerseits von einer Matrix hergeleitet wird, die von einem übervollständigen Transformationssatz abhängt, der beim Erzielen jedes x ^(n) angewendet wird.
  • In weiteren Gesichtspunkten bezieht die Erfindung eine Vorrichtung ein, die eine oder mehrere Komponenten zur Durchführung der Verarbeitungsabläufe beinhaltet, die oben in Verbindung mit den Schritten der Verfahren beschrieben sind. Solche Komponenten können mit der Hardware, der Software oder einer Kombination davon implementiert werden. Hardware-Implementierungen können zum Beispiel unter Verwendung eines normalen Mikroprozessors, oder einer oder mehrerer anwendungsspezifischer integrierter Schaltungen (ASICs), einer digitalen Signalverarbeitungs-Schaltung etc. oder einer Kombination davon verwirklicht werden.
  • Nach weiteren Gesichtpunkten der Erfindung können alle oben beschriebenen Verfahren oder deren Schritte in einem Befehlsprogramm (z. B. Software) enthalten sein, das zur Ausführung auf einem Computer oder einer anderen prozessorgesteuerten Vorrichtung gespeichert ist oder dorthin befördert wird. Alternativ kann das Befehlsprogramm mit der Hardware integriert sein, die so aufgebaut ist, dass sie einen oder mehrere Schritte ausführt (z. B. eine oder mehrere ASICs, eine digitale Signalverarbeitungs-Schaltung etc.).
  • Andere Ziele und Leistungen werden zusammen mit einem umfassenderen Verständnis der Erfindung ersichtlich und gewürdigt, indem auf die folgende Beschreibung und die Ansprüche in Verbindung mit den beiliegenden Zeichnungen Bezug genommen wird.
  • Kurze Beschreibung der Zeichnungen
  • 1(a) stellt ein rauschgeschädigtes stückweise konstantes Signal dar, 1(b) stellt den äquivalenten linearen Filter für das Entrauschen bei ns dar, und 1(c) stellt den optimalen Filter für das Entrauschen bei diesem Punkt dar.
  • 2 stellt die berechneten äquivalenten Filter für die Voll-, Diagonal- und Standardauflösungen bei drei Pixeln in dem Bild-Voronoi dar.
  • 3 stellt die Testbilder Voronoi (256 × 256) und Teekanne (960 × 1280) dar.
  • 4, 5 und 6 stellen einen Spitzenwert-Störabstand (PSNR) verglichen mit Schwellwertkurven für die Voll- (nur 4), Diagonal-, Nur-Signifikant- und Standardauflösungs-Systeme dar, die unter verschiedenen Bedingungen erzielt werden.
  • 7(a)–(e) und 8(a)–(d) stellen verrauschte und entrauschte Abschnitte der Testbilder dar.
  • 9 ist ein Ablaufdiagramm, das das grundlegende Verfahren eines Hauptalgorithmus dieser Erfindung darstellt.
  • 10 ist ein Blockdiagramm, das ein beispielhaftes System darstellt, das verwendet werden kann, um die Techniken der vorliegenden Erfindung zu implementieren.
  • Beschreibung der bevorzugten Ausführungsformen
  • A. Übersicht
  • Die vorliegende Erfindung ist hauptsächlich auf das bekannte Szenario ausgerichtet, in dem, unter Verwendung eines Satzes übervollständiger linearer Transformationen und einer Schwellwertoperation, i.d.d.-Rauschen in einem Bild entfernt wird. Eher als der Standardansatz, bei dem man das entrauschte Signal durch Ad-Hoc-Mittellung der entrauschten Schätzungswerte erzielt (die jeder Transformation entsprechen), formuliere ich die optimale Kombination als ein lineares Schätzwert-Problem für jedes Pixel und löse es für optimale Schätzwerte. Mein Ansatz ist unabhängig von den verwendeten Transformationen und dem Schwellwertoperations-Schema. Meine Herleitung der optimalen Schätzwerte erfordert keine expliziten Bildstatistiken sondern beruht lediglich auf der Annahme, dass die verwendeten Transformationen dünne Dekompositionen liefern. Meine anpassungsfähigen Schätzwerte verwenden jedoch implizierte bedingte Statistiken, und sie haben die größte Auswirkung um Kanten und einzigartige Punkte herum, bei denen Standard-Seltenheits-Annahmen scheitern.
  • Nach einem übervollständigen Satz linearer Transformationen (d. h. entweder verschobene Versionen derselben Transformation oder ein allgemeiner Satz von Transformationen {H1, H2, ..., HM} mit HiHi –1 = 1, i = 1, ..., M, wobei 1 die Identität ist), werden diese deshalb nach der vorliegenden Erfindung bei jedem Pixel ausgewertet, und die Transformationskoeffizienten werden einer Schwellwertoperationen (vorzugsweise Hard-Schwellwertoperationen) unterzogen und invers transformiert, um verschiedene entrauschte Schätzwerte zu erhalten, wobei diese Schätzwerte nicht einfach Bemittelt werden, um das Endergebnis zu erhalten. Diese Erfindung stellt vielmehr eine Technik zur aktiven Bestimmung der besseren Schätzwerte bereit, die dann kombiniert werden, um das Endergebnis zu erhalten.
  • Dadurch verliert meine Formulierung weder die Einfachheit der Mittelwertbildung, noch erfordert sie irgendwelche expliziten Statistiken oder Parameter. Drei Schätzfunktionen werden hergeleitet, um den Rechenaufwand zu vermindern. Die erste Schätzfunktion, der auch der wirkungsvollste ist, verbessert die Entrauschungsleistung immer, selbst wenn keine einzigartigen Punkte (z. B. Kanten) in dem Signal vorhanden sind. Die zweite Schätzfunktion ist sehr einfach und erfordert lediglich die Menge der erwarteten Rauschenergie, die in den Pixeln nach der Anwendung jeder Transformation verbleit. Für die Hard-Schwellwertoperation kann dieser angenähert werden durch die Anzahl der Koeffizienten, die die Schwellwertoperation überstehen, oder durch die Anzahl der Nicht-Null-Koeffizienten (nach der Schwellwertoperation) mit Grundfunktionen, die das vorgegebene Pixel überde cken, um den dritten Schätzwert zu erbringen. Es sollte beachtet werden, dass die Hard-Schwellwertoperation eines Koeffizienten c null ergibt, wenn |c| ≤ T ist und andernfalls den Koeffizienten unverändert lässt.
  • Wie in dem Fall mit den Erfindungen der oben bezeichneten zugehörigen Anwendungen, bleibt die Rolle der verwendeten Transformationen sehr wichtig. Tatsächlich besteht die zugrunde liegende Arbeitsbasis des Algorithmus dieser Erfindung in dünnen Bilddarstellungen mit den verwendeten linearen Transformationen. Deshalb kann die vorliegende Erfindung verwendet werden, um Rauschen von einem digitalen Bild/Videoframe zu entfernen und kann sich auch in Wiederherstellungs-Algorithmen ausdrücken, die eine räumliche Vorhersage verwenden, um verlorene Daten in dem Bild oder Videoframe wiederherzustellen. Die Details der vorliegenden Techniken und die Algorithmen der vorliegenden Erfindung werden nachfolgend beschrieben.
  • B. Darstellung
  • Lassen Sie uns das Signal mit x (N × 1) bezeichnen, lassen Sie uns das rauschgeschädigte Signal mit y = x + w bezeichnen, und lassen Sie uns einen übervollständigen Satz linearer Transformationen mit Hi(N × N), i = 1, ..., M bezeichnen. Es sollte verstanden werden, dass (N × 1) die Dimension der Matrix/des Vektors x festlegt. Bei dem übervollständigen Entrauschen durchlaufen die Transformationskoeffizienten jeder Transformation eine Schwellwertoperation, um bei gegebenem y einen Schätzwert x ^ von x zu erzielen. Diese einzelnen Schätzwerte werden dann kombiniert, um bei einem Gesamtschätzwert x ^ anzukommen. Die jeder Transformation entsprechenden einzelnen Schätzwerte x ^i können für i = 1, ..., M folgendermaßen in drei Stufen erzielt werden: ci = Hiy (1) c ^i = τ(ci) (2) x ^i = Hi –1(c ^i) (3) wobei ci(N × 1) die Transformationskoeffizienten auf Grund von Hi darstellt, c ^i(N × 1) die einer Schwellwertoperation unterzogenen Koeffizienten darstellt, τ(...) die Schwellwertoperationsfunktion darstellt, und x ^i ist der ite Schätzwert von x. Man beachte, dass der „Schwellwertoperations"-Ablauf viel allgemeiner sein kann als bei c ^i = τi(c1, ..., ci, ..., cM), i = 1, ..., M. Die einzelnen Schätzwerte werden bei jedem Pixel kombiniert, um mittels folgender Gleichung zu dem entrauschten Abschluss-Signal zu gelangen:
    Figure 00080001
  • In dieser Erfindung wird die obige Gleichung ersetzt durch:
    Figure 00080002
    wobei die Gewichtungen αi(n), i = 1, ..., M, n = 1, ..., N wie nachfolgend beschrieben optimal bestimmt werden. Bei natürlichen übervollständigen Transformationen, wie bei komplexen Wavelets, entsprechen die Techniken dieser Erfindung der Ausführung einer für Pixel anpassungsfähigen inversen Transformation. Dadurch wird klar, dass diese Erfindung an eine große Vielfalt von nicht-linearen Schwellwertoperationen angepasst werden kann; für die Beispiele hierin wird jedoch die Schwellwertoperationsfunktion als Nicht-Linearität genommen, die folgendermaßen einer räumlich gleichmäßigen Hard-Schwellwertoperation für jeden Koeffizienten implementiert:
    Figure 00080003
    für k = 1, ..., N, wobei ci(k) der kte Transformationskoeffizient der iten Transformation ist, und T ist ein vorgegebener Schwellwert. Zur Hilfe bei einer späteren Darstellung werden Indexsätze definiert als: Vi = {m||ci(m)| > T} (7) und die zugehörigen diagonalen Auswahlmatrizen:
    Figure 00090001
  • Mit dieser Darstellung und der Hard-Schwellwertoperation wird Gleichung (3) zu: x ^i = Hi –1SiHiy (9),
  • C. Hauptprinzipien der Erfindung
  • 1(a) zeigt ein rauschgeschädigtes stückweise konstantes Signal, das gemeinsam mit 1(b) und (c) die Hauptprinzipien der Erfindung darstellt. Zur Vereinfachung werden Block-DCT-Dekompositionen (1 bis 4) verwendet. 1(a) beschreibt ein übervollständiges System von vier Transformationen (DCT 1, ..., DCT 4), die das Signal wie dargestellt parkettieren. Die Betrachtung des Pixels, das mit ne gekennzeichnet ist, weist vier Block-DCTs auf, die es überdecken, ein Block von jeder Transformation. Von diesen vier Blocks überdecken die ersten Beiden die „Kante" (schattiert gezeigt) in der Abbildung, wohingegen die letzten Beiden die ebenen Abschnitte des Signals überdecken. Durch die Annäherungsprinzipien wird angenommen, dass die Block-DCTs, die die ebenen Bereiche überdecken, dünne Dekompositionen liefern und gute einzelne entrauschte Schätzwerte für das Pixel bei ne ergeben, wohingegen die Block-DCTs, die die Kante überdecken, nicht zu guten entrauschten Schätzwerten bei ne führen. Folglich ist es eher als bei der Festlegung αi(n) = 0,25 für i = 1, ..., 4 in Gleichung (4) günstig, eine größere Gewichtung auf i = 3 und 4 und weniger Gewichtung auf i = 1 und 2 zu legen, wenn die einzelnen Schätzwerte kombiniert werden.
  • In dem Fall von Pixel ns betrachten wir das Fallbeispiel, in dem der Hard-Schwellwertoperations-Ablauf die DC-Bedingungen der DCT-Koeffizienten nur in den vier überdeckenden Blocks beibehält. Während für diesen Fall die Gleichung (4) den in 1(b) gezeigten äquivalenten Filter darstellt, ist, wie in 1(c) gezeigt, der optimale Filter gegeben durch: α1(ns) = α4(ns) = 0,5 und α2(ns) = α3(ns) = 0.
  • Zur Vereinfachung werden null Schnittmengen und orthonormale Transformationen angenommen. Ziel ist es, die optimalen Gewichtungen in Gleichung (5) herzuleiten, die den bedingten mittleren quadratischen Fehler minimieren, der durch die Indexsätze V1, ..., Vi, ..., VM gegeben ist. E[|x(n) – x ^(n)|2|V1, ..., Vi, ..., VM] (10),wobei E[...] den Erwartungswert bezeichnet. Die primäre Annahme besteht darin, dass die verwendete Transformation dünne Dekompositionen liefert, die Schwellwertoperation erfolgreich ist, und die einzelnen entrauschten Schätzwerte das meiste Rauschen entfernen, d. h.: x ^i ≅ x + wi (11),wobei wi(N × 1) das verbleibende Rauschen in dem iten entrauschten Schätzwert mit E[xw T / i] = 0 darstellt, wobei (...)T die Transponierte bezeichnet. Bei Verwendung der Hard-Schwellwertoperation beinhaltet wi zum Beispiel lediglich die Transformationskoeffizienten von w in dem Indexsatz Vi. In diesem Sinn wird angenommen, dass jedes Vi die Nicht-Null-Koeffizienten der Transformation Hi bestimmt, die eine dünne Dekomposition liefern. Es ist festzustellen, dass: wi = HTi SiHiw (12),da Hi orthonormal ist.
  • Unter Verwendung der Gleichungen (5) und (11) ergibt sich beim Fokussieren der Aufmerksamkeit auf die nten Pixel:
    Figure 00100001
  • Das Ziel ist es αi(n) so zu wählen, dass x ^(n) die Gleichung (10) minimiert. Diese Aufgabenstellung wird zu einem bedingten linearen Schätzwertproblem, wobei x(n) unter Verwendung der ermittelten Mengen x(n) + wi(n) mit den Schätzwertgewichtungen αi(n) berechnet wird.
  • Es sei: Γ(n) = [αi(n) ... αM(n)]T, σ 2 / x(n) = E[x2(n)] und z(n) = [x(n) + wi(n) ... x(n) + wM(n)]T. Gleichung (13) wird zu: x ^(n) = z(n)TΓ(n) (14).
  • Unter Verwendung dieser Darstellung in Gleichung (10) und durch die Herleitungen in Bezug auf die Komponenten von Γ(n) ergibt sich:
    Figure 00110001
    wobei W(n)p,q = E[w T / pwq|V1, ..., Vi, ..., VM] und wie festgestellt E[xw T / i = 0].
  • Lassen Sie uns den Einheitsvektor, der in der nten Komponente gleich 1 und andernfalls gleich 0 ist, mit un(N × 1) bezeichnen. Unter Verwendung der Gleichung (12) und unter der i.i.D.-Rausch-Annahme können die Matrixelemente von W(n)(M × M) dargestellt werden als: W(n)p,q = E[wp(n)wq(n)|V1, ..., VM] (16) = uTn HTp SpHpE[wwT]HTq SqHqun (17) = σ2w uTn HTp SpHpHTq SqHqun (18) = σ2w G(n)p,q (19),wobei σ 2 / w die Rauschabweichung ist und G(n)(M × M) eine Matrix ist, die lediglich von dem übervollständigen Transformationssatz und den Indexsätzen Vi abhängt.
  • Die Gleichung (15) reduziert sich dann auf:
    Figure 00120001
    wobei λ ein Skalierungsfaktor ist. Unter der Annahme, dass σ 2 / x(n) >> σ 2 / w ist, wird Σiαi(n) = 1 erzielt, wodurch λ bestimmt wird und die explizite Abhängigkeit von den statistischen Parametern σ 2 / x(n), σ 2 / w etc. entfernt wird. Man beachte jedoch, dass die Darstellung G(n) von den Indexsätzen abhängt, und es gibt eine implizite Abhängigkeit von Bildstatistiken.
  • Da G(n) positiv semidefinit ist, kann die Gleichung (20) innerhalb des positiven Eigenraums von G(n) aufgelöst werden, um dann Γ(n) zu erbringen, wenn die Rangzahl von G(n) nicht null ist. Für den Fall dass die Rangzahl null ist, wird angenommen, dass Γ(n) auf seinen Standardwert festgelegt ist.
  • Unter Bezug auf Gleichung (20) als die "vollständige Auflösung", ist diese Auflösung kompliziert, da sie die Darstellung und die Auflösung von G(n) bei jedem Pixel erfordert. Bei Betrachtung der Form von G(n) mittels der Gleichung (16), ist festzustellen, dass das Matrixelement (p, q) die Kreuzkorrelation des Restrauschens bei Pixel n nach dem Entrauschen mit der pten und qten Transformation (geteilt durch σ 2 / w) darstellt. In der Annahme, dass diese Kreuzbegriffe verglichen mit anderen Mengen vernachlässigbar sind und dadurch die Elemente außerhalb der Diagonalen von G(n) mit null festgelegt werden, ergibt sich eine Diagonalmatrix D(n), in der gilt:
    Figure 00120002
  • Die Auflösung von Gleichung (20) mit G(n) ersetzt durch D(n) mittels
    Figure 00130001
    wird die "Diagonalauflösung" genannt.
  • Obwohl viel einfacher, erfordert diese Auflösung dennoch das Verfolgen der tatsächlichen Werte der Transformationsgrundfunktionen bei jedem Pixel, da D(n)p,q = uTn HTp SpHpun (23).
  • Das ist unkompliziert für Blocktransformationen, aber es ist erforderlich, die tatsächlichen Grundfunktionen für Transformationen wie Wavelets zu berechnen, die durch wiederholte Filterreihen erzielt werden. In der Annahme, dass die Transformationsgrundfunktionen in ihrem räumlichen Träger konstante Werte aufweisen, kann sogar eine einfachere Gleichung erzielt werden. Man betrachte die mte Grundfunktion der pten Transformation, die durch die mte Reihe von Hp durch
    Hp(m,n), n = 1, ..., N gegeben ist. Lassen Sie uns durch cp(m) die Anzahl der Nicht-Null-Einträge in Hp(m, ...) festlegen. Bei gegebenem m und für n = 1, ..., N gilt:
    Figure 00130002
  • Die "Nur-Signifikant-Auflösung" wird durch Ersetzen der Diagonalmatrix D(n)p,q mit
    Figure 00130003
    in Gleichung (22) erzielt. Man beachte, dass für die Blocktransformationen der diagonale Eintrag D ~(n)p,p bestimmt wird durch die Anzahl der Nicht-Null-Koeffizienten (die Gesamtzahl der Koeffizienten in einem Block minus der Anzahl der Koeffizienten, die bei einer Hard- Schwellwertoperation null ergeben), die durch die pte Transformation mit den Grundfunktionen erzeugt werden, die das nte Pixel überdecken. Die Gewichtung für die pte Transformation bei einem vorgegebenen Pixel wird daher proportional zu dem Inversen der Anzahl von Nicht-Null-Koeffizienten sein, die durch die Transformation mit den Grundfunktionen erzeugt werden, die das Pixel überdecken.
  • Durch Verwenden der Gleichungen (5) und (9) kann der entrauschte Abschluss-Schätzwert folgendermaßen gestaltet sein:
    Figure 00140001
    wobei gilt:
    Figure 00140002
    (N × 1). L(n) kann als ein Äquivalenzzeit verändernder linearer Filter gedacht sein, der auf das verrauschte Signal y angewendet wird, um den entrauschten Output zu erzielen. 2 stellt die berechneten äquivalenten Filter für die Voll-, Diagonal- und Standardauflösungen bei drei Pixeln dar, die progressiv von einer Kante entfernt in dem Bild-Voronoi liegen, wie es in dem vergrößerten Abschnitt des Bild-Voronois gezeigt wird. (Dieses gesamte Bild wird auch gemeinsam mit einem weiteren Testbild (Teekanne) in 3 gezeigt.) Die Äquivalenzfilter sind so ausgelegt, dass sie die gesamten übervollständigen 8 × 8 DCTs verwenden, σw = 5. Die 45°-/135°-Achsen in den Diagrammen liegen in den Zeilen-/Spalten-Dimensionen des Bildes. Der Punkt (0, 0) liegt am oberen Ende des entsprechenden Pixels, und er bezeichnet den Faktor, der von dem Äquivalenzfilter verwendet wird, um dieses Pixel zu vervielfachen. Alle Auflösungen verwenden den Schwellwert, der die jeweils beste Bildbreiten-Spitzenwert-Störabstand-Leistung (PSNR) erzielt.
  • Da ein stückweise konstantes Model für dieses Bild geeignet ist, wird erwartet, dass L(n) die Pixel in dem schwarzen Voronoi-Bereich mittelt, um das entrauschte Ergebnis zu erzielen.
  • Wie in der Abbildung zu sehen ist, bewirkt die Standardauflösung eine sehr kleine räumliche Mittelwertbildung in diesem Bereich. Der räumliche Träger des Filters ist auf eine sehr lokale Umgebung des Pixels beschränkt, und er verbreitert nicht merklich, selbst wenn das Pixel sich von der Kante weg bewegt. Andererseits erzeugt die Diagonalauflösung Filter, die in dem schwarzen Voronoi-Bereich breiter sind, was zu einer besseren räumlichen Mittelwertbildung und einer verbesserten Entrauschungsleistung um die Kanten herum führt. Bei diesem Beispiel werden die Filter, die in dem schwarzen Voronoi-Bereich die breitesten sind, von der Vollauflösung erzeugt, die selbst bei Pixel 1, der am nächsten an der Kante liegt, eine signifikante räumliche Mittelwertbildung durchführt. Alle Auflösungen leisten gute Arbeit, indem sie die Kante nicht ausschließen, aber nur die Auflösungen, die in dieser Erfindung dargelegt sind, erzeugen Filter, die eine signifikant breite Mittelwertbildung in dem richtigen Bereich durchführen.
  • D. Simulationsergebnisse
  • Die Entrauschungsergebnisse für die zwei in 3 gezeigten Testbilder werden nun dargelegt. Alle Techniken werden bei dem Schwellwert, der den Spitzen-PSNR erzielt, gezeigt. Die verwendeten 8 × 8 DCTs und die orthonormalen 3-Level-Daubechies-D8-Wavelets sind vollkommen übervollständig. Der PSNR wird im Vergleich zu den Schwellwertkurven für die Voll-(nur 4), Diagonal-, Nur-Signifikant- und Standardauflösungssysteme in 46 gezeigt. 4 ist eine 8 × 8 DCT und führt zu einem Voronoi mit σw = 5; 5 ist eine 8 × 8 DCT und führt zu einer Teekanne mit σw = 10; und 6 ist eine othonormale D8 und führt zu einer Teekanne mit σw = 10. 7(a)–(e) und 8(a)–(d) stellen verrauschte und entrauschte Abschnitte der Bilder dar, wobei 7(a)–(e) eine 8 × 8 DCT zeigen, die zu einem Voronoi mit σw = 5 führt, und 8(a)–(d) zeigen eine 8 × 8 DCT, die zu einer Teekanne mit σw = 10 führt. In 4 zeigt sich, dass der PSNR für die Vollauflösungs-Spitzenwerte, verglichen mit den anderen Auflösungen, bei einem viel kleineren Schwellwert liegt.
  • Die Vollauflösung ist bei der Nutzung des Modells von Gleichung (11) die schärfste, und sie ist auch die anfälligste gegenüber Modellierungsfehlern. Unter Verwendung des Hard-Schwellwertoperations-Modells treten Modellierungsfehler zwangsläufig bei höheren Schwellwerten auf, die die Leistung der Vollauflösung beschränken. Bessere Schwellwert-Techniken werden erwartet, um die relative Leistung der optimierten Auflösung zu verbes sern. Für Wavelets sind die erzielten Ergebnisse ca. 0,2 dB besser als das Standardsystem (bei dem Standardbild Lena liegen die Verbesserungen bei σw = 10 ca. 0,1 dB über dem Standardsystem). Unter Verwendung der Hard-Schwellwertoperation erzeugen die übervollständigen Transformationen gemeinsam mit den verwendeten Wavelet-Reihen vergleichbare Einträge in D(n)p,p für p = 1, ..., M, was Verstärkungen einschränkt. Bessere Schwellwert-Techniken werden erwartet, um die Leistung zu verbessern.
  • E. Algorithmen
  • Die oben beschriebenen Prinzipien der Erfindung können in Entrauschungsalgorithmen einbezogen werden. Bezüglich des Ablaufdiagramms von 9 beginnt ein solcher Algorithmus in Schritt 901, wodurch ein rauschgeschädigtes Signal y erzielt wird. In Schritt 902 wird der Schwellwert T zum Beispiel auf ein Vielfaches der Rausch-Standardabweichung festgelegt, oder er kann unter Verwendung einer weiteren geeigneten statistischen Berechnung errechnet oder auf einen festen konstanten Wert, wie 10 oder 40, festgelegt werden.
  • In Schritt 903 wird ein übervollständiger Satz linearer Transformationen auf das Signal y angewendet. Eine Schwellwertoperation (vorzugsweise eine Hard-Schwellwertoperation), wie sie in Gleichung (6) festgelegt ist, wird in Schritt 904 auf die Sätze von Transformationskoeffizienten angewendet, um pro Pixel die Schätzwerte x ^i von x und das Signal ohne den Rauschfaktor w zu erzielen. Als nächstes werden in Schritt 905 die einzelnen Schätzwerte bei jedem Pixel ausgewertet und die optimalen Gewichtungen für die Schätzwerte werden hergeleitet. Die gewichteten Schätzwerte bei jedem Pixel werden mathematisch kombiniert (z. B. gemittelt), um ein entrauschtes Abschluss-Signal zu erzielen (Schritt 906).
  • F. Implementierungen und Anwendungen
  • 10 stellt ein beispielhaftes System 100 dar, das verwendet werden kann, um das Verfahren der vorliegenden Erfindung zu implementieren. Wie in 10 dargestellt, beinhaltet das System eine Zentraleinheit (CPU) 101, die Berechnungsressourcen bereitstellt und den Computer steuert. Die CPU 101 kann für die mathematischen Berechnungen mit einem Mikroprozessor oder Ähnlichem bestückt sein, und sie kann auch einen Grafik-Prozessor und/oder Gleitpunkt-Coprozessor beinhalten. Das System 100 beinhaltet ferner einen Systemspeicher 102, der in Form eines Arbeitsspeichers (RAM) und eines Festspeichers (ROM) vorliegen kann. Der Systemspeicher kann verwendet werden, um ein Entrauschungsprogramm während seiner Ausführung, ebenso wie zu verarbeitende Daten und Zwischenergebnisse, zu speichern.
  • Eine Anzahl von Steuerungen und Peripheriegeräten ist, wie in 10 gezeigt, ebenfalls vorhanden. Das Eingabesteuergerät 103 stellt eine Schnittstelle für verschiedene Eingabegeräte 104 dar, wie eine Tastatur, eine Maus oder einen Eingabestift. Es gibt ferner ein Steuergerät 105, das mit einem Scanner 106 oder einem gleichwertigen Gerät zur Digitalisierung von Dokumenten, einschließlich Bilder, die nach der Erfindung bearbeitet werden sollen, in Verbindung steht. Ein Speichersteuergerät 107 bildet die Schnittstelle mit einem oder mehreren Speichergeräten 108, von denen jedes ein Speichermedium beinhaltet, wie ein Magnetband oder eine Magnetscheibe, oder ein optisches Medium, das verwendet werden kann, um Befehlsprogramme für Betriebssysteme, Dienstprogramme und Anwendungen aufzuzeichnen, die Ausführungsformen von Programmen enthalten können, die verschiedene Gesichtpunkte der vorliegenden Erfindung implementieren. Ein Anzeigesteuergerät 109 bietet eine Schnittstelle für ein Anzeigegerät 111, das eine beliebige bekannte Art eines Anzeigegerätes sein kann. Ein Druckersteuergerät 112 ist für die Kommunikation mit einem Drucker 113 ebenfalls vorhanden, um Dokumente zu drucken, einschließlich Bilder, die nach der Erfindung bearbeitet werden sollen. Ein Kommunikations-Steuergerät 114 bildet die Schnittstelle mit einem oder mehreren Kommunikationsgeräten 115, die es ermöglichen, dass das System 100, durch ein beliebiges Netzwerk, einschließlich das Internet, ein lokales Netzwerk (LAN), ein Weitbereichsnetz (WAN) oder durch geeignete elektromagnetische Übertragungssignale, einschließlich Infrarotsignale, mit entfernten Geräten verbunden wird.
  • In dem dargestellten System sind alle Hauptsystemkomponenten mit einem Bus 116 verbunden, der mehr als ein physischer Bus sein kann. Es können jedoch verschiedene Systemkomponenten in physischer Nähe zueinander sein oder auch nicht. Zum Beispiel können die Eingabedaten und/oder die Ausgabedaten über weite Entfernungen von einer physischen Stelle zu einer anderen übertragen werden. Auch auf Programme, die verschiedene Gesichtpunkte dieser Erfindung implementieren, kann von einer entfernten Stelle (z. B. ein Server) über ein Netzwerk zugegriffen werden. Solche Daten und/oder Programme können mittels eines beliebigen maschinenlesbaren Mediums, einschließlich einem Magnetband oder einer Magnetscheibe, oder einer optische Scheibe, Netzwerksignale oder anderer ge eigneter elektromagnetischer Übertragungssignale, einschließlich Infrarotsignale, befördert werden.
  • Während die vorliegende Erfindung bequem mit der Software implementiert werden kann, ist auch eine Hardwareimplementierung oder eine kombinierte Hardware/Softwareimplementierung möglich. Eine Hardwareimplementierung kann zum Beispiel unter Verwendung von ASIC(s), einer digitalen Signalverarbeitungsschaltung oder Ähnlichem durchgeführt werden. Als solches beinhaltet die Anspruchsprache „gerätelesbares Medium" nicht nur Software übertragende Medien, sondern auch Hardware, die Befehle zur Durchführung der erforderlichen Verarbeitung aufweist und die damit fest verdrahtet ist und durch eine Hardware/Software-Kombination. In ähnlicher Weise beinhaltet die Anspruchsprache „Befehlsprogramm" sowohl Software als auch Befehle, die in die Hardware eingebettet sind. Auch die Komponente(n), die auf die Geräteansprüche bezogen ist (sind) beinhaltet (beinhalten) eins beliebiges Gerät oder eine Kombination von Geräten, die in der Lage sind die geforderten Arbeitsabläufe durchzuführen. Solche Geräte können befehlsgestützte Prozessoren (z. B. CPUs), ASICs, digitale Verarbeitungsschaltungen oder eine Kombination davon beinhalten. In Anbetracht dieser Implementierungsalternativen, sollte verstanden werden, dass die Abbildungen und die beiliegende Beschreibung die Gebrauchsinformationen liefern, die ein Fachmann benötigt, um einen Programmcode (d. h. Software) zu schreiben oder Schaltungen (d. h. Hardware) anzufertigen, um die geforderte Verarbeitung durchzuführen.
  • Wie das Vorgenannte zeigt, bietet die vorliegende Erfindung, unter Verwendung einer Schwellwertoperation gemeinsam mit linearen Transformationen, software- oder hardwaregestützte Algorithmen/Techniken zur Rauschentfernung von einem digitalen Signal, die dünne Dekompositionen bereitstellen. Die Algorithmen dieser Erfindung weisen einen breiten Anwendungsbereich auf und können im Allgemeinen verwendet werden, um Rauschen von einem beliebigen digitalen Signal, einschließlich Video-, Festbild-, Audio-(Sprache, Musik etc.)Signale, zu entfernen. Die Algorithmen dieser Erfindung können auch mit einigen Veränderungen verwendet werden, um verlorene Datenbereiche in einem dieser Arten von Signalen vorauszuberechnen, einschließlich Fehlerkorrektur, die sich durch Netzwerkübertragung, Rückgewinnung beschädigter Bilder, Kratzerentfernung etc. ergibt. In den Algorithmen der vorliegenden Erfindung wird die Schwellwertoperation auf jeden Koeffizienten einer bestimmten linearen Transformation angewendet. In den Datenrückgewinnungsalgo rithmen, die nachfolgend kurz beschrieben werden, wird die Schwellwertoperation auf ausgewählte Koeffizienten angewendet.
  • Bezüglich der Vorausberechnung verlorener Datenbereiche, können die Algorithmen dieser Erfindung in den spezifischeren Entrauschungsalgorithmen beinhaltet sein, die in den oben bezeichneten zugehörigen Anwendungen dargelegt werden. Die Algorithmen einer solchen Anwendung gewinnen die vermissten Pixel in diesen Ebenen wiederholend zurück. Nach dem Beschicken diese Ebenen mit einem Anfangswert, wählen die Algorithmen einen Schwellwert und werten verschiedene übervollständige Transformationen über den Ebenen aus. Die gewählten Transformationskoeffizienten werden einer Hard-Schwellwertoperation unterzogen und invers transformiert, um eine Ebene von Pixeln zurück zu gewinnen, während die Pixel in den anderen Ebenen unverändert bleiben. Bei L gegebenen Schichten wird dieser Arbeitsablauf L-fach wiederholt, um alle Ebenen zurück zu gewinnen. Die Algorithmen enden, wenn der Schwellwert einen vorbestimmten unteren Level erzielt.
  • Die Algorithmen der anderen zugehörigen Anwendung, sind das Ergebnis des Erfinders, der erkannt hat, dass die beste Rückgewinnungsleistung üblicherweise von den Anfangswiederholungen kommt. Somit bieten die Algorithmen dieser zugehörigen Anwendung eine schnelle Alternative zu den obigen zugehörigen Anwendungsalgorithmen, während sie dennoch die meisten ihrer Vorzüge erzielen. In den Algorithmen dieser zugehörigen Anwendung wird eine Anfangs-Schwellwertoperations-Entscheidung verwendet, um den Satz von Transformationskoeffizienten festzulegen, die einer Schwellwertoperation bis null unterzogen werden. Dieser Satz wird jedoch nicht bei jeder Wiederholung neu berechnet. Vielmehr wird dieser Satz für jede Ebene festgehalten, was zu bedeutenden Berechnungseinsparungen führt, da die Wiederholungsauflösung nun auf ein System von linearen Gleichungen reduziert wird, die unmittelbar aufgelöst werden können, d. h., jede Ebene wird in einem einzelnen Schritt wiederhergestellt, ohne dass Wiederholungen erforderlich sind. Verglichen mit den obigen zugehörigen Anwendungsalgorithmen, nehmen die Algorithmen dieser zugehörigen Anwendung eine bedeutende Abkürzung, indem die Pixel in jeder Ebene durch die entsprechende Gleichung aufgelöst werden. In ihrer einfachsten Form verwenden die Algorithmen dieser zugehörigen Anwendung einen einzigen Schwellwert, um die Pixel der Ebenen vollständig zurück zu gewinnen, d. h., die Reduzierung des Schwellwertes und weitere Wiederholungen sind nur wünschenswert, wenn sehr ausführliche Informationen zurück gewonnen werden sollen.
  • Obwohl die Erfindung in Verbindung mit verschiedenen spezifischen Ausführungsformen beschrieben wurde, werden weitere Alternativen, Abweichungen, Veränderungen und Anwendungen Fachleuten angesichts der vorstehenden Beschreibung ersichtlich. Deshalb ist die hierin beschriebene Erfindung darauf ausgerichtet, alle solche Alternativen, Abweichungen, Veränderungen und Anwendungen einzubeziehen, sofern sie in den Rahmen der beiliegenden Ansprüche fallen.

Claims (31)

  1. Verfahren zum Bestimmen eines Schätzwertes eines rauschfreien Teils eines verrauschten digitalen Signals, wobei es die folgenden Schritte umfasst: a) Anwenden eines Satzes M linearer Transformationen auf das verrauschte digitale Signal; b) Bestimmen von M rauschunterdrückten Anfangs-Schätzwerten jedes digitalen Elementes des digitalen Signals; c) Herleiten einer Kombination von Gewichtungsfaktoren für die M rauschunterdrückten Anfangs-Schätzwerte jedes digitalen Elementes durch Formulieren der Kombination als ein Problem linearer Schätzung und Lösen desselben für die einzelnen Gewichtungsfaktoren; und d) Formulieren eines rauschunterdrückten Abschluss-Schätzwertes für jedes digitale Element auf Basis der entsprechenden M rauschunterdrückten Anfangs-Schätzwerte und der Kombination aus Gewichtungsfaktoren, die in den Schritten b) bzw. c) bestimmt werden.
  2. Verfahren nach Anspruch 1, wobei der Satz M linearer Transformationen auf das digitale Signal als ein Ganzes oder auf jedes digitale Element angewendet wird.
  3. Verfahren nach Anspruch 1, wobei für jede lineare Transformation in dem Satz M linearer Transformationen die M rauschunterdrückten Anfangs-Schätzwerte eines bestimmten digitalen Elementes ermittelt werden, indem Schwellenwertoperation jedes Transformationskoeffizienten, der einen Absolutwert unterhalb eines Schwellenwertes hat und inverse Transformation der keiner Schwellenwertoperation unterzogenen Transformationskoeffizienten durchgeführt werden.
  4. Verfahren nach Anspruch 1, wobei die Kombination aus Gewichtungsfaktoren eine optimale Kombination ist.
  5. Verfahren nach Anspruch 1, wobei die Kombination aus Gewichtungsfaktoren so hergeleitet wird, dass ein bedingter mittlerer quadratischer Fehler in Bezug auf die rauschunterdrückten Anfangs-Schätzwerte minimiert wird.
  6. Verfahren nach Anspruch 1, wobei der Satz M linearer Transformationen I) eine diskrete Kosinustransformation und eine vorgegebene Anzahl ihrer übervollständigen Verschiebungen, II) eine Wavelet-Transformation und eine vorgegebene Anzahl ihrer übervollständigen Verschiebungen, oder III) eine Fourier-Transformation und eine vorgegebene Anzahl ihrer übervollständigen Verschiebungen umfasst.
  7. Verfahren nach Anspruch 1, wobei das digitale Signal ein Bild oder ein Video-Frameist, das/der aus einer Vielzahl von Pixeln besteht, und jedes digitale Element ein Pixel oder eine Gruppe davon umfasst.
  8. Verfahren zum Ermitteln eines Schätzwertes x ^ eines rauschfreien Teils x eines rauschhaltigen Signals y, das die folgenden Schritte umfasst: Bestimmen eines Schätzwerts x ^(n) für jedes Element n von x ^ gemäß der folgenden Gleichung:
    Figure 00220001
    wobei Gewichtungsfaktoren αi(n), i = 1, ..., M, n = 1, ..., N optimal bestimmt werden, indem eine Kombination derselben als ein Problem linearer Schätzung formuliert wird; und die N x ^(n)-Schätzwerte kombiniert werden, um x ^ zu ermitteln.
  9. Verfahren nach Anspruch 8, wobei αi(n) optimal so bestimmt wird, dass x ^(n) einen bedingten mittleren quadratischen Fehler in Bezug auf die rauschunterdrückten Anfangs-Schätzwerte minimiert.
  10. Verfahren nach Anspruch 9, wobei αi(n) auf Basis eines Skalierfaktors, der explizite Abhängigkeit von Rauschvarianz beseitigt, und einer Matrix, die von einem übervollständigen Transformationssatz abhängt, der beim Ermitteln jedes x ^(n) angewendet wird, optimal bestimmt wird.
  11. Verfahren nach Anspruch 9, wobei αi(n) auf Basis eines Skalierfaktors, der explizite Abhängigkeit von Rauschvarianz beseitigt, und einer diagonalen Matrix, die von einer Matrix hergeleitet wird, die von einem übervollständigen Transformationssatz abhängt, der beim Ermitteln jedes x ^(n) angewendet wird, abhängt, optimal bestimmt wird.
  12. Verfahren nach Anspruch 9, wobei αi(n) auf Basis eines Skalierfaktors, der explizite Abhängigkeit von Rauschvarianz beseitigt, und einer reduzierten diagonalen Matrix, die von einer diagonalen Matrix hergeleitet wird, die ihrerseits von einer Matrix hergeleitet wird, die von einem übervollständigen Transformationssatz abhängt, der beim Ermitteln jedes x ^(n) angewendet wird, optimal bestimmt wird.
  13. Vorrichtung zum Bestimmen eines Schätzwertes eines rauschfreien Teils eines verrauschten digitalen Signals, wobei die Vorrichtung umfasst: eine oder mehrere Komponenten, die so konfiguriert sind, dass sie: a) einen Satz von M linearen Transformationen auf das verrauschte digitale Signal anwenden; b) M rauschunterdrückte Anfangs-Schätzwerte jedes digitalen Elementes des digitalen Signals bestimmen; c) eine Kombination von Gewichtungsfaktoren für die M rauschunterdrückten Anfangs-Schätzwerte jedes digitalen Signals herleiten, indem sie die Kombinati on als ein Problem linearer Schätzung formulieren und dieses für die einzelnen Gewichtungsfaktoren lösen; und d) einen rauschunterdrückten End-Schätzwert jedes digitalen Elementes auf Basis der entsprechenden M rauschunterdrückten Anfangs-Schätzwerte und der Kombination von Gewichtungsfaktoren bestimmen, die in den Schritten b) bzw. c) bestimmt werden.
  14. Vorrichtung nach Anspruch 13, wobei der Satz M linearer Transformationen auf das digitale Signal als ein Ganzes oder auf jedes digitale Element angewendet wird.
  15. Vorrichtung nach Anspruch 13, wobei für jede lineare Transformation in dem Satz M linearer Transformationen die M rauschunterdrückten Anfangs-Schätzwerte eines bestimmten digitalen Elementes ermittelt werden, indem Schwellenwertoperation jedes Transformationskoeffizienten, der einen Absolutwert unterhalb eines Schätzwertes hat, und inverse Transformation der nicht Schwellenwertoperation unterzogenen Transformationskoeffizienten durchgeführt werden.
  16. Vorrichtung nach Anspruch 13, wobei die Kombination aus Gewichtungsfaktoren eine optimale Kombination ist.
  17. Vorrichtung nach Anspruch 13, wobei die Kombination aus Gewichtungsfaktoren so hergeleitet wird, dass ein bedingter mittlerer quadratischer Fehler in Bezug auf die rauschunterdrückten Anfangs-Schätzwerte minimiert wird.
  18. Vorrichtung nach Anspruch 13, wobei der Satz M linearer Transformationen I) eine diskrete Kosinustransformation und eine vorgegebene Anzahl ihrer übervollständigen Verschiebungen, II) eine Wavelet-Transformation und eine vorgegebene Anzahl ihrer übervollständigen Verschiebungen oder III) eine Fourier-Transformation und eine vorgegebene Anzahl ihrer übervollständigen Verschiebungen umfasst.
  19. Vorrichtung nach Anspruch 13, wobei das digitale Signal ein Bild oder ein Video-Frame ist, das/der aus einer Vielzahl von Pixeln besteht, und jedes digitale Element ein Pixel oder eine Gruppe davon umfasst.
  20. Von einer Vorrichtung lesbares Medium mit einem Programm von Befehlen, die eine Maschine anweisen, einen Prozess zum Bestimmen eines Schätzwertes eines rauschfreien Teils eines verrauschten digitalen Signals durchzuführen, wobei das Programm umfasst: a) Befehle zum Anwenden eines Satzes M linearer Transformationen auf das verrauschte digitale Signal; b) Befehle zum Bestimmen von M rauschunterdrückten Anfangs-Schätzwerten jedes digitalen Elementes des digitalen Signals; c) Befehle zum Herleiten einer Kombination von Gewichtungsfaktoren für die M rauschunterdrückten Anfangs-Schätzwerte jedes digitalen Elementes durch Formulieren der Kombination als ein Problem linearer Schätzung und Lösen desselben für die einzelnen Gewichtungsfaktoren; und d) Befehle zum Formulieren eines rauschunterdrückten End-Schätzwertes jedes digitalen Elementes auf Basis der entsprechenden M rauschunterdrückten Anfangs-Schätzwerte und der Kombination aus Gewichtungsfaktoren, die in den Schritten b) bzw. c) bestimmt werden.
  21. Durch eine Vorrichtung lesbares Medium nach Anspruch 20, wobei Befehl a) Befehle zum Anwenden des Satzes M linearer Transformationen auf das digitale Signal als ein Ganzes oder auf jedes digitale Element umfasst.
  22. Durch eine Vorrichtung lesbares Medium nach Anspruch 20, wobei Befehl b) Befehle zum Ermitteln der M rauschunterdrückten Anfangs-Schätzwerte jedes digitalen Elementes durch Durchführen von Schwellenwertoperation jedes Transformationskoeffizienten von jeder linearen Transformation in dem Satz M linearer Transformationen, der einen Absolutwert unterhalb eines Schwellenwertes hat, und inverser Transformierung der nicht Schwellenwertoperation unterzogenen Transformationskoeffizienten umfasst.
  23. Durch eine Vorrichtung lesbares Medium nach Anspruch 20, wobei in Befehl c) die Kombination von Gewichtungsfaktoren eine optimale Kombination ist.
  24. Durch eine Vorrichtung lesbares Medium nach Anspruch 20, wobei in Befehl c) die Kombination von Gewichtungsfaktoren so hergeleitet wird, dass ein bedingter mittlerer quadratischer Fehler in Bezug auf die rauschunterdrückten Anfangs-Schätzwerte minimiert wird.
  25. Durch eine Vorrichtung lesbares Medium nach Anspruch 20, wobei in Befehl a) der Satz M linearer Transformationen I) eine diskrete Kosinustransformation und ein vorgegebene Anzahl ihrer übervollständigen Verschiebungen, II) eine Wavelet-Transformation und eine vorgegebene Anzahl ihrer übervollständigen Verschiebungen oder III) eine Fourier-Transformation und eine vorgegebene Anzahl ihrer übervollständigen Verschiebungen umfasst.
  26. Durch eine Vorrichtung lesbares Medium nach Anspruch 20, wobei das digitale Signal ein Bild oder ein Video-Frame ist, das/der aus einer Vielzahl von Pixeln besteht, und jedes digitale Element ein Pixel oder eine Gruppe davon umfasst.
  27. Durch eine Vorrichtung lesbares Medium mit einem Programm von Befehlen, die eine Maschine anweisen, einen Prozess zum Ermitteln eines Schätzwertes x eines rauschfreien Teils x ^ eines verrauschten Signals y durchzuführen, wobei das Programm umfasst: Befehle zum Bestimmen eines Schätzwertes x ^(n) für jedes Element n von x ^ gemäß der folgenden Gleichung:
    Figure 00260001
    wobei Gewichtungsfaktoren αi(n), i = 1, ..., M , n = 1, ..., N optimal bestimmt werden, indem eine Kombination derselben als Problem linearer Schätzung formuliert wird; und Befehle zum Kombinieren der N x ^(n) Schätzwerte, um x ^ zu ermitteln.
  28. Durch eine Vorrichtung lesbares Medium nach Anspruch 27, wobei αi(n) optimal so bestimmt wird, dass x ^(n) einen bedingten mittleren quadratischen Fehler in Bezug auf die rauschunterdrückten Anfangs-Schätzwerte minimiert.
  29. Durch eine Vorrichtung lesbares Medium nach Anspruch 28, wobei αi(n) auf Basis eines Skalierfaktors, der explizite Abhängigkeit von Rauschvarianz beseitigt, und einer Matrix, die von einem übervollständigen Transformationssatz abhängt, der beim Ermitteln jedes x ^(n) angewendet wird, optimal bestimmt wird.
  30. Durch eine Vorrichtung lesbares Medium nach Anspruch 28, wobei αi(n) auf Basis eines Skalierfaktors, der explizite Abhängigkeit von Rauschvarianz beseitigt, und einer diagonalen Matrix, die von einer Matrix hergeleitet wird, die von einem übervollständigen Transformationssatz abhängt, der beim Ermitteln jedes x ^(n) angewendet wird, optimal bestimmt wird.
  31. Durch eine Vorrichtung lesbares Medium nach Anspruch 28, wobei αi(n) auf Basis eines Skalierfaktors, der explizite Abhängigkeit von Rauschvarianz beseitigt, und einer reduzierten diagonalen Matrix, die von einer diagonalen Matrix hergeleitet wird, die ihrerseits von einer Matrix hergeleitet wird, die von einem übervollständigen Transformationssatz abhängt, der beim Ermitteln jedes x ^(n) angewendet wird, optimal bestimmt wird.
DE602004001366T 2003-06-02 2004-05-25 Gewichtete, überbestimmte Rauschunterdrückung Expired - Lifetime DE602004001366T2 (de)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US779540 1991-10-18
US47540103P 2003-06-02 2003-06-02
US475401P 2003-06-02
US10/779,540 US7352909B2 (en) 2003-06-02 2004-02-13 Weighted overcomplete de-noising

Publications (2)

Publication Number Publication Date
DE602004001366D1 DE602004001366D1 (de) 2006-08-10
DE602004001366T2 true DE602004001366T2 (de) 2006-11-09

Family

ID=33457686

Family Applications (1)

Application Number Title Priority Date Filing Date
DE602004001366T Expired - Lifetime DE602004001366T2 (de) 2003-06-02 2004-05-25 Gewichtete, überbestimmte Rauschunterdrückung

Country Status (6)

Country Link
US (1) US7352909B2 (de)
EP (1) EP1503334B1 (de)
JP (1) JP2004362578A (de)
KR (1) KR100613850B1 (de)
CN (1) CN1599459A (de)
DE (1) DE602004001366T2 (de)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60224035D1 (de) * 2002-08-23 2008-01-24 St Microelectronics Srl Verfahren zur Rauschfilterung einer numerischen Bildfolge
EP1605403A1 (de) * 2004-06-08 2005-12-14 STMicroelectronics S.r.l. Filtrage d'images bruitées
US8594448B2 (en) * 2004-08-16 2013-11-26 Hewlett-Packard Development Company, L.P. Bi-selective filtering in transform domain
US7433427B2 (en) * 2004-11-29 2008-10-07 Hewlett-Packard Development Company, L.P. Enhanced denoising system utilizing incremental parsing
US7627059B2 (en) * 2005-04-05 2009-12-01 Samsung Electronics Co., Ltd. Method of robust timing detection and carrier frequency offset estimation for OFDM systems
US7616699B2 (en) * 2005-04-12 2009-11-10 Samsung Electronics Co., Ltd. Method of soft bit metric calculation with direct matrix inversion MIMO detection
US20060285590A1 (en) * 2005-06-21 2006-12-21 Docomo Communications Laboratories Usa, Inc. Nonlinear, prediction filter for hybrid video compression
US7751506B2 (en) 2005-12-01 2010-07-06 Samsung Electronics Co., Ltd. Method for the soft bit metric calculation with linear MIMO detection for LDPC codes
CN105392005A (zh) 2006-11-08 2016-03-09 汤姆逊许可证公司 用于环内去伪影滤波的方法和设备
CN101779464B (zh) * 2007-06-08 2014-02-12 汤姆森特许公司 多格点基于稀疏性滤波基础上环内去伪像滤波方法和装置
US7965900B2 (en) 2007-09-26 2011-06-21 Hewlett-Packard Development Company, L.P. Processing an input image to reduce compression-related artifacts
WO2009091521A2 (en) * 2008-01-14 2009-07-23 Thomson Licensing Methods and apparatus for de-artifact filtering using multi-lattice sparsity-based filtering
WO2009091387A1 (en) * 2008-01-17 2009-07-23 Thomson Licensing Reduced video flicker
US8731062B2 (en) * 2008-02-05 2014-05-20 Ntt Docomo, Inc. Noise and/or flicker reduction in video sequences using spatial and temporal processing
KR101680915B1 (ko) * 2008-11-25 2016-11-29 톰슨 라이센싱 비디오 인코딩 및 디코딩을 위한 희소성-기반 아티팩트 제거 필터링 방법 및 장치
CN102184523B (zh) * 2011-04-13 2012-11-21 展讯通信(上海)有限公司 基于多分辨率和过完备变换的数字图像降噪方法及系统
CN103854258A (zh) * 2012-12-07 2014-06-11 山东财经大学 一种基于Contourlet变换自适应方向阈值的图像去噪方法
CN104134191B (zh) * 2014-07-11 2017-11-28 三星电子(中国)研发中心 图像去噪方法及其装置
CN110443194B (zh) * 2019-08-05 2021-09-07 哈尔滨工业大学 基于spi稀疏约束的时变信号成分提取方法
CN113822321B (zh) * 2021-07-12 2024-03-01 腾讯科技(深圳)有限公司 生成模型训练方法和装置、噪声尺度生成方法和计算设备

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6610256B2 (en) * 1989-04-05 2003-08-26 Wisconsin Alumni Research Foundation Image processing and analysis of individual nucleic acid molecules
US5081690A (en) * 1990-05-08 1992-01-14 Eastman Kodak Company Row-by-row segmentation and thresholding for optical character recognition
JP2840694B2 (ja) * 1990-06-30 1998-12-24 ソニー株式会社 データ記録装置
US5442462A (en) * 1992-06-10 1995-08-15 D.V.P. Technologies Ltd. Apparatus and method for smoothing images
JP3258821B2 (ja) * 1994-06-02 2002-02-18 三菱電機株式会社 微小異物の位置決め方法、分析方法、これに用いる分析装置およびこれを用いた半導体素子もしくは液晶表示素子の製法
JPH08163594A (ja) * 1994-12-12 1996-06-21 Sony Corp 動画像復号化方法及び動画像復号化装置
FR2736741B1 (fr) * 1995-07-11 1997-09-26 Khiplus Procede de traitement d'une sequence source d'images numeriques bruitees
KR100196872B1 (ko) * 1995-12-23 1999-06-15 전주범 영상 복화화 시스템의 영상 에러 복구 장치
KR100197368B1 (ko) * 1995-12-23 1999-06-15 전주범 영상 에러 복구 장치
KR100197366B1 (ko) * 1995-12-23 1999-06-15 전주범 영상 에러 복구 장치
KR100220678B1 (ko) * 1995-12-29 1999-09-15 전주범 블록 단위 부호화 장치로부터 전송된 영상신호에서의 채널 에러 정정 방법
US6298085B1 (en) * 1997-10-23 2001-10-02 Sony Corporation Source encoding using shuffling of data to provide robust error recovery in a burst error-environment
US6285410B1 (en) * 1998-09-11 2001-09-04 Mgi Software Corporation Method and system for removal of flash artifacts from digital images
KR100587280B1 (ko) * 1999-01-12 2006-06-08 엘지전자 주식회사 오류 은폐방법
US6377280B1 (en) * 1999-04-14 2002-04-23 Intel Corporation Edge enhanced image up-sampling algorithm using discrete wavelet transform
US6643406B1 (en) * 1999-07-28 2003-11-04 Polaroid Corporation Method and apparatus for performing linear filtering in wavelet based domain
US6455860B1 (en) * 1999-09-30 2002-09-24 Gatan, Inc. Resolution enhancement device for an optically-coupled image sensor using high extra-mural absorbent fiber
US6549674B1 (en) * 2000-10-12 2003-04-15 Picsurf, Inc. Image compression based on tiled wavelet-like transform using edge and non-edge filters
US6611627B1 (en) * 2000-04-24 2003-08-26 Eastman Kodak Company Digital image processing method for edge shaping
US6859565B2 (en) * 2001-04-11 2005-02-22 Hewlett-Packard Development Company, L.P. Method and apparatus for the removal of flash artifacts
US6567497B2 (en) * 2001-04-20 2003-05-20 Lockheed Martin Corporation Method and apparatus for inspecting a structure using X-rays
US7206459B2 (en) * 2001-07-31 2007-04-17 Ricoh Co., Ltd. Enhancement of compressed images
US6862366B2 (en) * 2001-09-13 2005-03-01 Seiko Epson Corporation Techniques for scratch and date removal from scanned film
US6587592B2 (en) * 2001-11-16 2003-07-01 Adobe Systems Incorporated Generating replacement data values for an image region

Also Published As

Publication number Publication date
KR100613850B1 (ko) 2006-08-17
EP1503334B1 (de) 2006-06-28
EP1503334A3 (de) 2005-07-20
KR20040104362A (ko) 2004-12-10
US7352909B2 (en) 2008-04-01
EP1503334A2 (de) 2005-02-02
JP2004362578A (ja) 2004-12-24
CN1599459A (zh) 2005-03-23
DE602004001366D1 (de) 2006-08-10
US20040240545A1 (en) 2004-12-02

Similar Documents

Publication Publication Date Title
DE602004001366T2 (de) Gewichtete, überbestimmte Rauschunterdrückung
DE69812800T2 (de) Verfahren und Gerät zur Bildverbesserung
Mohideen et al. Image de-noising using discrete wavelet transform
DE69627982T2 (de) Signaladaptives Nachverarbeitungssystem um Blockierungseffekte und Ringstörungen zu verringern
DE69936723T2 (de) Verfahren zur Datenbearbeitung und zum Einfügen eines Wasserzeichens
DE60030456T2 (de) Verfahren und system zur verbesserung von digitalbildern
EP2243298B1 (de) Rausch- und/oder flimmerverminderung in videosequenzen anhand von räumlicher und zeitlicher verarbeitung
Parmar et al. Performance evaluation and comparison of modified denoising method and the local adaptive wavelet image denoising method
DE60302924T2 (de) Anpassungsfähige nichtlineare Bildvergrösserung mittels Wavelet-Transformkoeffizienten
DE69631819T2 (de) Fehlerverdeckung in einem Block-basierten Bildkodierer
DE102021103293A1 (de) Ein Bayes'sches Bildentrauschungsverfahren, das auf Verteilungsbeschränkungen von rauschhaltigen Bildern basiert
DE19827034A1 (de) Iteratives Filtersystem für medizinische Bilder
DE112008000875T5 (de) Automatische Bildverbesserung
DE102020134755A1 (de) Verarbeiten von videoframes über neuronales faltungsnetzwerk durch verwenden von statistiken vorhergehender frames
DE60023837T2 (de) Vorrichtung und verfahren zur filterung
Kalavathy et al. Analysis of image denoising using wavelet coefficient and adaptive subband thresholding technique
Souidene et al. Image denoising in the transformed domain using non local neighborhoods
EP0845909B1 (de) Verfahren und Filter zur Reduzierung des Blocking Effektes
Jebur et al. Image denoising techniques: An overview
CN108629740A (zh) 一种图像去噪的处理方法及装置
Karthikeyan et al. Multiresolution joint bilateral filtering with modified adaptive shrinkage for image denoising
DE60306800T2 (de) Verfahren und system zur messung von videobildverschlechterung, hervorgerufen durch kodierung zur bitratenreduktion
Belge et al. Wavelet domain image restoration using edge preserving prior models
Maharjan et al. DCTResNet: Transform Domain Image Deblocking for Motion Blur Images
WO2024079264A1 (de) Wiener-filter-basierte signalwiederherstellung mit gelernter signal-zu-rausch-verhältnis-abschätzung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition