DE60315125T2 - Auf Bewegungskompensation basierendes Verfahren und Vorrichtung zur Rauschabschätzung - Google Patents

Auf Bewegungskompensation basierendes Verfahren und Vorrichtung zur Rauschabschätzung Download PDF

Info

Publication number
DE60315125T2
DE60315125T2 DE2003615125 DE60315125T DE60315125T2 DE 60315125 T2 DE60315125 T2 DE 60315125T2 DE 2003615125 DE2003615125 DE 2003615125 DE 60315125 T DE60315125 T DE 60315125T DE 60315125 T2 DE60315125 T2 DE 60315125T2
Authority
DE
Germany
Prior art keywords
resolution
noise
input image
sum
quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE2003615125
Other languages
English (en)
Other versions
DE60315125D1 (de
Inventor
Byung-cheol 405-1104 Cheongmyung Mae Song
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of DE60315125D1 publication Critical patent/DE60315125D1/de
Application granted granted Critical
Publication of DE60315125T2 publication Critical patent/DE60315125T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/004Diagnosis, testing or measuring for television systems or their details for digital television systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/21Circuitry for suppressing or minimising disturbance, e.g. moiré or halo

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Picture Signal Circuits (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf ein Verfahren und eine Vorrichtung zur Schätzung von Rauschen, und im Speziellen auf ein Verfahren und eine Vorrichtung, um Rauschen durch das Abschätzen des Rauschens effektiv zu verringern, wenn ein Videosignal, welches durch das Rauschen verzerrt wurde, in einen Videokodierer eingegeben wird, basierend auf Bewegungskompensieren (Motion-Compensation, MC) und einer diskreten Kosinustransformation (DCT), beispielsweise ein Kodierer wie ein Moving-Picture-Experts-Group (MPEG)-2 oder MPEG-4-Kodierer.
  • In der letzten Zeit wurden Empfänger, wie beispielsweise Set-Top-Boxen und andere Produkte, welche analoge Bodenwellenübertragungen empfangen, eingeführt, welche ein Kompressionsverfahren, wie beispielsweise MPEG-2 oder MPEG-4 benutzen, um die Übertragung zu kodieren und zu speichern. Jedoch werden Bildsignale, welche dem Empfänger eingegeben werden, häufig durch eine Vielzahl von Rauschen (beinhaltend weißes Gauss'sches Rauschen) welches durch die Übertragungskanäle hervorgerufen wird, verzerrt.
  • Zum Beispiel wird ein ganzes Bildsignal durch die Vielzahl von Rauschen, welches das weiße Gauss'sche Rauschen beinhaltet, verzerrt. Wenn ein solches Bildsignal komprimiert wird, wird die Kompressionseffizienz aufgrund des Rauschens vermindert.
  • Deshalb wurde nach Wegen, um das Rauschen in den Bildsignalen zu reduzieren, geforscht. Jedoch nehmen herkömmliche Verfahren, um das Rauschen zu reduzieren, an, dass der Grad des Rauschens teilweise bekannt ist und demgemäß wird eine Vielzahl von Verfahren zum Schätzen des Rauschens angewendet.
  • Ein Beispiel für diese Rauschschätzverfahren sind in dem europäischen Patent Nr. 0712554 offenbart.
  • In Bezug auf 1 wird ein herkömmliches Verfahren zur Rauschreduktion erklärt.
  • 1 ist ein Blockdiagramm, welches eine herkömmliche Rauschschätzvorrichtung zeigt. Die herkömmliche Rauschschätzvorrichtung beinhaltet eine erste Subtraktionseinheit 112, einen Rahmenspeicher 114, eine erste Absolutwertberechnungseinheit 116, einen ersten Tiefpassfilter 118, einen zweiten Tiefpassfilter 120, eine zweite Subtraktionseinheit 122, eine zweite Absolutwertberechnungseinheit 124, eine dritte Subtraktionseinheit 126, eine dritte Absolutwertberechnungseinheit 128, eine Addiererbaugruppe 130 und eine Rauschquantitäts(ab)schätzungseinheit 132.
  • Zuerst berechnet die erste Subtraktionseinheit 112 einen ersten Differenzwert zwischen zwei benachbarten Bildern basierend auf einem aktuellen Eingabebild und einem benachbarten Bild aus dem Rahmenspeicher 114. Der berechnete Differenzwert zwischen den benachbarten Bildern wird der ersten Absolutwertberechnungseinheit 116 eingegeben. Die erste Absolutwertberechnungseinheit 116 berechnet einen Absolutwert des Differenzwertes, welcher von der ersten Subtraktionseinheit 112 berechnet wurde und gibt einen diesen anzeigenden Wert an die dritte Subtraktionseinheit 126 aus.
  • Die dritte Subtraktionseinheit 126 berechnet einen dritten Differenzwert der Eingabe von der ersten Absolutwertberechnungseinheit 116 und der zweiten Absolutwertberechnungseinheit 124 und gibt den berechneten Differenzwert an die dritte Absolutwertberechnungseinheit 128. Die dritte Absolutwertberechnungseinheit 128 berechnet den Absolutwert des dritten Differenzwertes, welcher in der dritten Subtraktionseinheit 126 berechnet wurde und gibt einen diesen anzeigenden Ergebniswert an die Additionseinheit 130 weiter.
  • Die Additionseinheit 130 addiert den Absolutwert, welcher von der dritten Absolutwertberechnungseinheit 128 ausgegeben wurde, in Einheiten von Rahmen.
  • Die Rauschquantitätsschätzungseinheit 132 bestimmt eine Quantität des Rauschens, welches in dem Eingabebild beinhaltet ist basierend auf dem von der Addierereinheit 130 enthaltenen Wertes.
  • Wenn der Wert, welcher in Einheiten von Rahmen von der Additionseinheit 130 berechnet wurde, groß ist, bestimmt die herkömmliche Rauschschätzvorrichtung 100, dass es eine große Menge von Rauschen gibt, und wenn der Wert klein ist, bestimmt die herkömmliche Rauschschätzvorrichtung 100, dass die Menge des Rauschens klein ist.
  • Obwohl die herkömmlich Rauschschätzvorrichtung das Rauschen jedoch in einem beinahe bewegungslosen Bild schätzen kann, wird der Ausgabewert der Additionseinheit 130 auf grund der Bewegung in einem sich bewegenden Bild größer. Demnach ist es sehr schwierig, das Rauschen in einem bewegten Bild zu schätzen.
  • EP-A-0731601, welches den nächstkommenden Stand der Technik repräsentiert, bezieht sich auf die Rauschreduzierung in einem Videosignal. Die beschriebene Vorrichtung umfasst ein Eingabeterminal, ein Signal zu Rauschen verbesserndes Steuerungssignal, welchen einen Schaltkreis für die Ausgabe eines lichtlinearen Signals in Bezug auf das Eingabesignal erzeugt, eine Subtraktionseinheit, eine nichtlineare Begrenzungseinheit und eine Additionseinheit. Eine Differenz zwischen einem in das Eingabeterminal eingegebenen Videosignals und eines Signals, welches von einem Tiefpassfilter ausgegeben wurde, wird durch die Subtraktionseinheit berechnet. Das Signal, welches eine Hochfrequenzbereichskomponente aufweist, wird mit einem Verstärkungsfaktor multipliziert und das multiplizierte Signal wird zu dem ursprünglichen Eingabesignal durch die Additionseinheit addiert. Die Ausgabe der Additionseinheit ist eine Ausgabe des Rauschreduktionskreises.
  • DE 42 21 236 A1 bezieht sich auf die Rauschverminderung von Videosignalen. In einem Bewegungskompensator wird ein Bewegungsvektor berechnet. In einer Subtraktionseinheit wird die Differenz zwischen dem aktuellen Pixel und dem bewegten Pixel, welcher entsprechend dem Bewegungsvektor bewegt wurde, berechnet. Wenn die Bewegung kompensiert wurde, weist das Differenzbild keine Bewegung auf und das Rauschen kann begrenzt werden, wie in dem Fall von statischem Bildinhalt.
  • Kim Sung Deuk et al: „Efficient block-based coding of noisy images by combining prefiltering and DCT", Electronics Letters, IEEE Stevenage, GB, Band 35, Nr. 20, 30. September 1999, Seiten 1717–1719, bezieht sich auf effizientes blockbasiertes Kodieren von verrauschten Bildern durch die Kombination von Vorfilterung und DCT. Der vorgeschlagene Bildkodierer hat nur ein modifiziertes DCT und ein VLC und führt das Vorfiltern und Quantisieren simultan in der modifizierten DCT-Operation durch.
  • Es ist die Aufgabe der vorliegenden Erfindung, ein verbessertes Rauschschätzverfahren und -vorrichtung Bereit zu stellen um effizient Rauschen durch Benutzen von Bewegungsinformation zu schätzen.
  • Diese Aufgabe ist gelöst durch die Gegenstände der unabhängigen Ansprüche.
  • Bevorzugte Ausführungsformen sind durch die abhängigen Ansprüche definiert.
  • Gemäß einem Aspekt der vorliegenden Erfindung ist ein Videokodierer und eine Kodiervorrichtung, welche das verbesserte Rauschschätzverfahren und -vorrichtung verwendet, Bereit gestellt.
  • Zusätzliche Aspekte und Vorteile der Erfindung werden in der folgenden Beschreibung ausgeführt und ergeben sich aus der Beschreibung oder können durch die Anwendung der Erfindung in Erfahrung gebracht werden.
  • Die obigen und andere Aspekte und/oder Vorteile der vorliegenden Erfindung werden deutlich durch die Beschreibung der Aspekte im Detail, in Bezug auf die beigefügten Zeichnungen in welchen:
  • 1 ein Blockdiagramm ist, welches eine herkömmliche Rauschschätzvorrichtung zeigt;
  • 2 ein Blockdiagramm ist, welches eine Rauschschätzvorrichtung gemäß eines Aspektes der vorliegenden Erfindung zeigt;
  • 3a und 3b Diagramme sind, welche ein Bewegungsschätzverfahren verbildlichen, welche bei der Rauschschätzung gemäß eines Aspektes der vorliegenden Erfindung verwendet wird.
  • 4 ein Flussdiagramm ist von Operationen, welche durch ein Rauschschätzverfahren gemäß eines Aspektes der vorliegenden Erfindung durchgeführt werden;
  • 5 ein Blockdiagramm der Rauschschätzvorrichtung gemäß eines anderen Aspektes der vorliegenden Erfindung ist;
  • 6 ein Flussdiagramm der Vorgänge ist, welche durch das Rauschschätzverfahren gemäß eines anderen Aspektes der vorliegenden Erfindung durchgeführt werden;
  • 7 ein Blockdiagramm der Rauschschätzvorrichtung gemäß noch eines weiteren Aspektes der vorliegenden Erfindung ist;
  • 8 ein Blockdiagramm ist, welches einen gewöhnlichen MPEG-Videokodierer zeigt;
  • 9 ein Blockdiagramm ist, welches einen verbesserten Videokodierer gemäß eines Aspektes der vorliegenden Erfindung zeigt; und
  • 10 ein Blockdiagramm ist, welches den verbesserten Videokodierer gemäß eines anderen Aspektes der vorliegenden Erfindung zeigt.
  • Jetzt wird im Detail Bezug genommen auf die vorliegenden Aspekte der Erfindung, wofür Beispiele in den begleitenden Zeichnungen gezeigt sind, worin sich gleiche Bezugszeichen durchweg auf die gleichen Elemente beziehen. Die Aspekte werden weiter unten beschrieben, um die vorliegende Erfindung im Bezug auf die Figuren zu erklären.
  • Ein verbessertes Rauschschätzverfahren gemäß eines Aspektes der vorliegenden Erfindung wird nun in Bezug auf 2 bis 3B erklärt.
  • 2 ist ein Blockdiagramm, welches eine Rauschschätzvorrichtung gemäß eines Aspektes der vorliegenden Erfindung zeigt. Die Rauschschätzvorrichtung, welche in 2 gezeigt ist, beinhaltet eine Berechnungseinheit für die Summe absoluter Differenzen (SAD) bei einer ersten Auflösung 210, eine SAD-Berechnungseinheit bei einer zweiten Auflösung 220 und eine Rauschbestimmungseinheit 270.
  • Die Rauschbestimmungseinheit 270 beinhaltet eine Subtraktionseinheit 230, eine Absolutwerberechnungseinheit 240, eine Additionseinheit 250 und eine Rauschmengenschätzeinheit 260.
  • Wie in 3a gezeigt, durchsucht die SAD-Berechnungseinheit bei einer ersten Auflösung 210 einen Suchbereich eines vorherigen Rahmens nach einem Bewegungsvektor MVL1, welcher einem Block an einer Position (i, j) eines aktuellen Rahmens bei einer ersten Auflösung entspricht. Dann gibt die SAD-Berechnungseinheit bei einer ersten Auflösung 210 einen SAD, welcher den Bewegungsvektor ML1 entspricht, an die Subtraktionseinheit aus, d. h. einen Differenzwert SADL1 zwischen entsprechenden Pels (Pixeln) nach der Bewegung um den gesuchten Bewegungsvektor MVL1 von dem vorherigen Rahmen. In einem Aspekt der vorliegenden Erfindung ist die erste Auflösung definiert als eine erste Auflösungsstufe eines ursprünglichen Eingabebildes.
  • Der Bewegungsvektor MVL1 bei einer ersten Auflösung wird durch die untenstehende Gleichung 1 bestimmt:
    Figure 00050001
  • Hier bezeichnet Fn (i, j) ein Pel an der Position (i, j) in dem aktuellen Rahmen (n-ter Rahmen), d. h. der Pel in einem aktuellen Block, welcher durch eine dicke Linie wie in 3a gezeigt markiert ist. Desgleichen zeigt ± S einen Suchbereich, in welchem nach dem Bewegungsvektor gesucht wird. Fn-1 (i, j) bezeichnet den Pel an der Position (i, j) in dem vorangegangenen Rahmen ((n-1)-ter Rahmer). Die Größe jedes Blockes ist N × N.
  • Wie in 3B gezeigt, sucht die SAD-Berechnungseinheit der zweiten Auflösung 220 in dem Suchbereich des vorherigen Rahmens nach einem Bewegungsvektor MVL2, welcher dem Block an der Position (i, j) des aktuellen Rahmens bei einer zweiten Auflösung entspricht. Dann gibt die SAD-Berechnungseinheit der zweiten Auflösung 220 den SAD, welcher den Bewegungsvektor MVL2, nach dem gesucht wurde, entspricht, an die Subtraktionseinheit 230 aus, d. h. ein Differenzwert SADL2 zwischen den korrespondierenden Pels nach der Bewegung um den MVL2 des vorangegangenen Rahmens. In einem Aspekt der vorliegenden Erfindung ist die zweite Auflösung definiert als eine niedrige Auflösungsstufe des ursprünglichen Eingabebildes.
  • Zusätzlich wird die niedrige Auflösungsstufe erhalten durch das Durchführen einer Tiefpassfilterung des originalen Bildes gemäß eines Aspektes der vorliegenden Erfindung. Jedoch kann ein Rahmen, welcher durch die Reduzierung einer Rahmengröße durch Sub-Sampling (Unterabtastung) nach dem Durchführen der Tiefpassfilterung des Originalbildes erhalten wurde, ebenso als ein Rahmen mit niedriger Auflösung benutzt werden.
  • Bei der ersten Auflösung wird ein Bewegungsvektor für jeden 16 × 16-Block berechnet. Bei der zweiten Auflösung wird ein Sub-Sampling einer Länge und Breite der Hälfte eines jeden Rahmens durchgeführt und der Bewegungsvektor der 8 × 8-Blöcke korrespondierend zu den 16 × 16-Blöcken der ersten Auflösung wird erhalten.
  • Die Subtraktionseinheit 230 berechnet eine Differenz zwischen SADL1, welcher in der SAD-Berechnungseinheit der ersten Auflösung 210 erhalten wurde, und SADL2, welcher in der SAD-Berechnungseinheit der zweiten Auflösung 220 erhalten wurde, und die Absolutwertberechnungseinheit 240 erhält einen Absolutwert der Differenz zwischen SADL1 und SADL2,welcher in der Subtraktionseinheit 230 berechnet wurde.
  • Dies bedeutet dass die Subtraktionseinheit 230 und die Absolutwertberechnungseinheit 240 den Absolutwert, d. h. SAD_DIFFk aus der Differenz zwischen SADL1 und SADL2 für einen k-ten Block berechnen, welcher aktuell berücksichtigt wird gemäß der folgenden Gleichung 2: SAD_DIFFk = |SADL1 – SADL2| (2)
  • Wenn die Rahmengröße bei einer zweiten Auflösung ein Viertel der Rahmengröße bei der ersten Auflösung ist, wird SAD_DIFFk erhalten gemäß Gleichung 3 unten: SAD_DIFFk = |SADL1 – 4 × SADL2| (3)
  • Die Additionseinheit 250 addiert alle SAD_DIFFs für alle Blöcke in dem aktuellen Rahmen zusammen und gibt das Ergebnis der Addition, TOTAL_OF_SAD_DIFF, an die Rauschquantitätsschätzungseinheit 260 aus.
  • Die Rauschquantitätsschätzungseinheit 260 schätzt die Menge des Rauschens basierend auf dem Wert TOTAL_OF_SAD_DIFF, welche von der Additionseinheit 250 eingegeben wurde.
  • Die Information über die Rauschmenge, welche in der Rauschquantitätsschätzungseinheit 260 geschätzt wurde, wird zu einer Rauschreduzierungsfilterungseinheit (nicht gezeigt) gesendet. Die Rauschreduktionsfilterungseinheit führt eine starke (heavy) Rauschreduktionsfilterung des Rahmens, welcher einen großen TOTAL_OF_SAD_DIFF-Wert aufweist, aus, und führt eine leichte (light) Rauschreduktionsfilterung bei einem Rahmen aus, welcher einen kleinen TOTAL_OF_SAD_DIFF-Wert aufweist, so dass die Rauschreduktionsfilterung effektiv ausgeführt wird.
  • Obwohl Operationen bei zwei Auflösungen in dem vorliegenden Aspekt benutzt werden, d. h. die Originalauflösung und die niedrige Auflösung, können in der vorliegenden Erfindung mehr als zwei Auflösungen benutzt werden.
  • 4 ist ein Flussdiagramm der Operationen, welche durch ein Rauschschätzverfahren gemäß eines Aspektes der vorliegenden Erfindung durchgeführt werden.
  • In Operation 410 wird bei der ersten Auflösung nach dem Bewegungsvektor MVL1, welcher zu einem Block einer Position (i, j) des aktuellen Frames (Rahmens) korrespondiert in dem Suchbereich des vorangegangenen Rahmens gesucht. Dann wird der SAD, welcher dem Bewegungsvektor MVL1, nach welchem gesucht wird, entspricht, d. h. der Differenzwert SADL1 zwischen korrespondieren Pels nach dem Bewegen um MVL1 des vorangegangenen Rahmens, berechnet.
  • In Operation 420 wird bei der zweiten Auflösung nach dem Bewegungsvektor MVL2, welcher dem Block bei der Position (i, j) des aktuellen Frames entspricht, in dem Suchbereich des vorangegangenen Rahmens gesucht. Dann wird der SAD, welcher dem gesuchten Bewegungsvektor MVL2 entspricht, d. h. Differenzwert SADL2 zwischen korrespondierenden Pels nach der Bewegung um MVL2 des vorangegangenen Rahmens, berechnet.
  • In Operation 430 wird die Differenz zwischen SADL1, welcher in Operation 410 berechnet wurde, und SADL2, welcher in Operation 420 berechnet wurde, für einen k-ten Block berechnet, und dann wird der Absolutwert der berechneten Differenz zwischen SADL1 und SADL2, d. h. SAD_DIFFk, erhalten unter Benutzung von Gleichung 2 oder Gleichung 3.
  • In Operation 440 wird eine Quantität berechnet, welche durch das Addieren aller SAD_DIFF-Werte für alle Blöcke in dem aktuellen Frame, d. h. TOTAL_SAD_DIFF, erhalten wird.
  • In Operation 450 wird, basierend auf TOTAL_SAD_DIFF, welcher in Operation 440 berechnet wurde, die Rauschmenge des Eingabebildes geschätzt.
  • 5 ist ein Blockdiagramm der Rauschschätzvorrichtung gemäß eines anderen Aspektes der vorliegenden Erfindung.
  • Die Rauschschätzvorrichtung der 5 beinhaltet eine SADL1-Berechnungseinheit der ersten Auflösung 510, eine SADL2-Berechnungseinheit der zweiten Auflösung 520, und eine Rauschbestimmungseinheit 580.
  • Die Rauschbestimmungseinheit 580 beinhaltet eine Subtraktionseinheit 530, eine Absolutwertberechnungseinheit 540, eine Referenz-SADref-Berechnungseinheit 560, und eine Rauschquantitätsschätzeinheit 570.
  • Hier wird, da die SADL1-Berechnungseinheit 510 der ersten Auflösung, die SADL2-Berechnungseinheit der zweiten Auflösung 520, die Subtraktionseinheit 530, die Absolutwertberechnungseinheit 540 und die Rauschquantitätsschätzeinheit 570 die selben Funktionen wie in den entsprechenden funktionalen Einheiten der 2 ausführen, die detaillierte Erklärung dieser ausgelassen.
  • Basierend auf den SAD-Werten für entsprechende Blöcke, welche von der SADL1-Berechnungseinheit der ersten Auflösung 510 ausgegeben wurde, berechnet die Referenz SADref-Berechnungseinheit 560 einen Referenz-SAD, d. h. SADref gemäß Gleichung 4 oder Gleichung 5 unten:
    Figure 00090001
    wobei A eine vorbestimmte Konstante ist.
    Figure 00090002
    wobei A eine vorbestimmte Konstante ist und SADhalf-pel den SAD nach dem Beendigen eine Halb-Pel-Suche bezeichnet.
  • Die Additionseinheit 550 addiert nur einen SAD oder einen SADhalf-pel-Wert, welcher kleiner ist als der Referenz-SAD, welcher durch Gleichung 4 oder Gleichung 5 in jedem Block erhalten wurde, berechnet den SAD-Wert für den Rahmen, d. h. TOTAL_OF_SAD_DIFF, und sendet den SAD-Wert für den Rahmen an die Rauschquantitätsschätzeinheit 570.
  • Deshalb werden die SADs von Blöcken, welche den SAD aufweisen, welcher viel größer ist als der Referenz-SADref, d. h. der durchschnittliche SAD des vorangegangenen Rahmens bei der ursprünglichen Auflösung, ausgelassen wenn die SADs addiert werden, weil wenn SADs addiert werden, kann die Rauschschätzung präziser durchgeführt werden durch das Entfernen der SAD von Blöcken, bei welchen die Bewegungsschätzung nicht akkurat ausgeführt wurde. Die Rauschschätzeinheit 570 schätzt die Menge des Rauschens basierend auf TOTAL_OF_SAD_DIFF, welcher von der SAD-Additionseinheit 550 gesendet wurde.
  • Informationen über die Rauschmenge, welche in der Rauschquantitätsschätzeinheit 570 geschätzt wurde, wird an eine Rauschreduzierungsfilterungseinheit (nicht gezeigt) gesendet. Die Rauschreduzierungsfilterungeinheit führt eine starke Rauschreduktionsfilterung für den Rahmen durch, welcher einen großen TOTAL_OF_SAD_DIFF-Wert aufweist und führt eine leichte Rauschreduzierungsfilterung für den Rahmen durch, welcher einen kleinen TOTAL_OF_SAD_DIFF-Wert aufweist, so dass die Rauschreduzierungsfilterung fiktiv durchgeführt wird.
  • 6 ist ein Flussdiagramm der Operationen, welche von dem Rauschschätzverfahren gemäß eines anderen Aspektes der vorliegenden Erfindung durchgeführt werden.
  • In Operation 610 wird bei einer ersten Auflösung nach dem Bewegungsvektor MVL1, welcher dem Block an der Position (i, j) des aktuellen Rahmens entspricht, in dem Suchbereich des vorangegangenen Rahmens gesucht. Dann wird der SAD, welcher dem gesuchten Bewegungsvektor MVL1 entspricht, berechnet, d. h. der Differenzwert SADL1 zwischen korrespondierenden Pels nach der Bewegung um MVL1 des vorangegangenen Rahmens.
  • In Operation 620 wird, basierend auf dem Differenzwert SADL1, zwischen korrespondierenden Pels, welche in Operation 610 berechnet wurden, der Referenz-SAD, d. h. SADref, gemäß Gleichung 3 oder 4 berechnet. In den vorliegenden Aspekt wird der SADref, welcher in dem aktuellen Rahmen erhalten wurde, benutzt, um das Rauschen für den nächsten Rahmen zu schätzen.
  • In Operation 630, wird bei einer zweiten Auflösung der Bewegungsvektor MVL2, welcher dem Block an der Position (i, j) des aktuellen Rahmens entspricht, in dem Suchbereich des vorangegangenen Rahmens gesucht. Dann wird der SAD, welcher dem gesuchten Bewegungsvektor MVL2 entspricht, berechnet, d. h. der Differenzwert SADL2 zwischen korrespondierenden Pels nach der Bewegung um MVL2 von den vorangegangenen Rahmen.
  • In Operation 640, in einem derzeitig betrachteten k-ten Block wird die Differenz zwischen SADL1, welcher in Operation 610 berechnet wurde, und SADL2, welcher in Operation 630 berechnet wurde, berechnet und dann wird der Absolutwert der berechneten Differenz zwischen SADL1 und SADL2, d. h. SAD_DIFFk, unter Benutzung von Gleichung 2 erhalten.
  • In der Operation 650, werden die SAD_DIFFs der Blöcke, welche der Bedingung SADL1 < SADref in allen Blöcken in dem Rahmen genügen, zusammenaddiert, um TOTAL_OF_SAD_DIFF zu berechnen.
  • In Operation 660 wird basierend auf dem TOTAL_OF_SAD_DIFF-Wert, welcher in Operation 650 berechnet wurde, die Rauschmenge des Eingabebildes geschätzt.
  • 7 ist ein Blockdiagramm eines Beispiels, wo die Rauschschätzeinheit 710 gemäß eines Aspektes der vorliegenden Erfindung bei dem Kodieren eines bewegten Bildes zur Anwendung kommt.
  • Die Rauschschätzeinheit 710 schätzt die Menge des Rauschens, welche in einem Eingabebild enthalten ist basierend auf den Ausführungsformen der 2 oder 5, und gibt die Information der geschätzten Rauschmenge an, die Vorverarbeitungseinheit 720 aus.
  • Weil der Kodierer für bewegte Bilder 730 die gleiche Funktion wie ein gewöhnlicher Kodierer für bewegte Bilder ausführt, wird eine detaillierte Beschreibung dessen nicht wiederholt.
  • 8 ist ein Blockdiagramm, welches einen gewöhnlichen Kodierer zeigt, welcher bewegte Bilder kodiert.
  • Der Kodierer führt eine Funktion aus, um einen kodierten Bitstrom zu erzeugen unter Benutzung einer Kompressionstechnologie für Video-On-Demand (VOD)-Dienste oder Videokommunikationen.
  • Zuerst, um Raumkorrelationen zu entfernen, führt eine diskrete Kosinustransformations (DCT)-Einheit 810 eine DCT-Operation mit den Videodaten aus, welche in Einheiten von 8 × 8-Pel-Blocks eingegeben werden. Die Quantisierungseinheit (Q) 820 führt eine Quantisierung der DCT-Koeffizienten aus, welche in der DCT-Eiheit 810 erhalten wurden und drückt die Koeffizienten durch eine kleine Zahl von representativen Werten aus, so dass eine hocheffiziente verlustbehaftete Kompression ausgeführt wird.
  • Eine inverse Quantisierungs (IQ)-Einheit 830 quantisiert die Bilddaten invers, welche in der Quantisierungseinheit 820 quantisiert wurden. Eine inverse DCT (IDCT)-Einheit 840 führt eine IDCT an den Bilddaten aus, welche in der inversen Quantisierungs-(IQ)-Einheit 830 invers quantisiert wurden. Ein Rahmenspeicher 850 speichert die Bilddaten, welche IDCT-transformiert wurden in der IDCT-Einheit 840 in Einheiten von Rahmen.
  • Eine Bewegungsschätzungs- und -kompensationseinheit (ME/MC) 860 schätzt einen Bewegungsvektor (MV) und einen SAD, welcher einem Block-Matching-Fehler entspricht, für jeden Makroblock unter Benutzung der Bilddaten eines eingegebenen aktuellen Rahmens und der Bilddaten des vorangegangenen Rahmens, welcher in dem Rahmenspeicher 850 gespeichert ist.
  • Eine Variable-Längen-Kodierungs-(VLC)-Einheit 870 entfernt statistische Redundanzen in den DCT-transformierten und quantisierten Daten, gemäß dem Bewegungsvektor, welcher Bewegungsschätzungs- und -kompensationseinheit 860 geschätzt wurde.
  • 9 ist ein Blockdiagramm, welches einen verbesserten Videokodierer zeigt, in welchem das Rauschschätzverfahren gemäß eines Aspektes der vorliegenden Erfindung auf den herkömmlichen Kodierer für bewegte Bilder der 8 zur Anwendung kommt.
  • Der Kodierer für bewegte Bilder, welcher das Rauschreduzierungsverfahren verwendet, kombiniert eine Rauschschätzeinheit 980, eine Quantisierungsgewichtematrixbestimmungseinheit 992 und einen Quantisierungsgewichtmatrixspeicher 994 mit dem gewöhnlichen Kodierer für bewegte Bilder.
  • Weil eine DCT-Einheit 910, eine IDCT-Einheit 940, ein Rahmenspeicher 950, eine Bewegungsschätzungs- und -kompensierungseinheit 960 und eine VLC-Einheit 970 die gleichen Funktionen wie in einem herkömmlichen Kodierer für bewegte Bilder ausführen, wird eine detaillierte Beschreibung dieser hier nicht wiederholt.
  • Die Rauschschätzeinheit 980 schätzt die Menge des Rauschens, welches in einem Eingabebild beinhaltet ist, basierend auf den Aspekten, welche in 2 oder in 4 beschrieben wurden und gibt die Information über die geschätzte Rauschmenge an die Quantisierungsgewichtematrixbestimmungseinheit 992 aus.
  • Die Quantisierungsgewichtematrixbestimmungseinheit 992 bestimmt eine Quantisierungsgewichtematrix basierend auf der von der Rauschschätzeinheit 980 gesendeten Rauschinformation, und sendet Indexinformationen, welche der Quantisierungsgewichtematrix entsprechen, an den Quantisierungsgewichtematrixspeicher 994. Obwohl die Quantisierungsgewichtematrixbestimmungseinheit 992 eine Quantisierungsgewichtematrix basierend auf der von der Rauschschätzeinheit 980 gesendeten Rauschinformation bestimmt in dem vorliegenden Aspekt der vorliegenden Erfindung, kann die Varianz der Bewegungsschätzungs- und -kompensationseinheit 960, welche für jeden Makroblock berechnet wird, ebenso in Betracht gezogen werden.
  • In der vorliegenden Ausführungsform speichert der Quantisierungsgewichtematrixspeicher 994 fünf Quantisierungsgewichtematrizen, welche gemäß der in einem Eingabebild enthaltenen Rauschmenge abgestuft sind.
  • Unter Benutzung der Rauschinformation, welche von der Rauschschätzeinheit 980 gesendet wurde, sendet die Quantisierungsgewichtematrixbestimmungseinheit 992 einen Index einer modifizierten Quantisierungsmatrix, welche der Rauschinformation entspricht, zu dem Quantisierungsgewichtematrixspeicher 994. Wenn die Quantisierungsgewichtematrizen, welche in dem Quantisierungsgewichtespeicher 994 gespeichert sind, in fünf Typen eingeteilt werden, ist der Index gleich 0, 1, 2, 3 oder 4.
  • Basierend auf dem Quantisierungsgewichtematrixindex, welcher von der Quantisierungsgewichtematrixbestimmungseinheit 992 eingegeben wurde, wählt der Quantisierungsgewichtematrixspeicher 994 eine Quantisierungsgewichtematrix dem Index entsprechend aus und sendet die ausgewählte Matrix an die Quantisierungseinheit 920. Die Quantisierungseinheit 920 führt eine Quantisierung durch unter Benutzung der eingegebenen Quantisierugnsgewichtematrix. Die inverse Quantisierungseinheit 930 führt eine Quantisierung basierend auf der ursprünglichen standardmäßigen Quantisierungsgewichtematrix aus.
  • Ebenso kann ein Benutzer neue Quantisierungsgewichtematrizen beliebig bestimmen. Obwohl die Rauschreduzierung in der DCT-Region in Bezug auf eine Y-Komponente eines Eingabebitblocks in dem vorliegenden Aspekt beschrieben wurde, kann die gleiche Vorrichtung auch auf U- und V-Komponenten zusätzlich zu der Y-Komponente angewendet werden. Hierfür werden zusätzliche Gewichtematrizen für die U- und V-Komponenten benötigt.
  • 10 ist ein Blockdiagramm, welches einen verbesserten Kodierer für bewegte Bilder zeigt, welcher ein Rauschreduzierungsverfahren gemäß eines anderen Aspektes der vorliegenden Erfindung verwendet.
  • Der Kodierer für bewegte Bilder, welche das Rauschreduzierungsverfahren verwendet gemäß eines Aspektes der vorliegenden Erfindung, kombiniert eine Rauschschätzeinheit 1080 und eine modifizierte Quantisierungsgewichtematrixerzeugungseinheit 1090 mit dem gewöhnlichen Kodierer für bewegte Bilder.
  • Weil eine DCT-Einheit 1010, eine IDCT-Einheit 1040, ein Rahmenspeicher 1050, eine Bewegungsschätzungs- und -kompensierungseinheit 1060, und eine VLC-Einheit 1070 die gleichen Funktionen wie in dem herkömmlichen Kodierer für bewegte Bilder der 8 ausführen, wird eine detaillierte Beschreibung derer hier nicht wiederholt.
  • Die Rauschschätzeinheit 1080 schätzt die Menge des Rauschens, welches in dem Eingabebild beinhaltet ist, basierend auf den Aspekten, welche in 2 oder in 5 beschrieben wurden, und gibt die Information über die geschätzte Rauschmenge an die modifizierte Quantisierungsgewichtematrixerzeugungseinheit 1090 aus.
  • Die modifizierte Quantisierungsgewichtematrixerzeugungseinheit 1090 erzeugt die modifizierte Quantisierungsgewichtematrix basierend auf der Rauschinformation, welche von der Rauschschätzeinheit 980 gesendet wurde, und sendet die Matrix an die Quantisierungseinheit 1020. Obwohl die modifizierte Quantisieurngsgewichtematrixerzeugungseinheit 1090 eine Quantisierungsgewichtematrix basierend auf der von der Rauschschätzeinheit 1080 gesendeten Information in dem vorliegenden Aspekt bestimmt, kann eine Makroblockvarianz von der Bewegungsschätzungs- und -kompensationseinheit 1060, welche für jeden Makroblock berechnet wird, ebenso berücksichtigt werden. Die Quantisierungseinheit 1020 führt die Quantisierung unter Benutzung der modifizierten Quantisierungsgewichtematrix, durch welche von der modifizierten Modifizierungsgewichtematrixerzeugungseinheit 1090 eingegeben wurde, durch. Die inverse Quantisierungseinheit 1030 führt die inverse Quantisierung basierend auf der ursprünglichen standardmäßigen Quantisierungsgewichtematrix durch.
  • Die vorliegende Erfindung ist nicht beschränkt auf die zuvor beschriebenen Aspekte und es klar, dass zahlreiche Variationen und Änderungen innerhalb des Ansinnens und Schutzbereiches der vorliegenden Erfindung durch den Fachmann durchgeführt werden können. Im Besonderen kann die vorliegende Erfindung angewendet werden auf alle Verfahren und Vorrichtungen für das Kodieren von bewegten Bildern, wie beispielsweise MPEG-1, MPEG-2, und MPEG-4.
  • Die vorliegende Erfindung kann in einem Code, welcher von einem Computer gelesen werden kann, auf einem computerlesbaren Aufnahmemedium ausgeführt werden. Das computerlesbare Aufnahmemedium kann alle Arten von Aufnahmevorrichtungen umfassen, auf welchen computerlesbare Daten gespeichert werden. Die computerlesbaren Aufnahmemedien umfassen Speichermedien wie magnetische Speichermedien (z. B. ROMs, Floppy Disks, Festplatten usw.), optische lesbare Medien (z. B. CD-ROMs, DVDs usw.) und Trägerwellen (z. B. Übertragung über das Internet). Ebenso können die computerlesbaren Medien über Computersysteme verteilt sein, welche über ein Netzwerk verbunden sind und können computerlesbaren Code verteilt speichern und ausführen.
  • Gemäß eines Rauschschätzverfahrens und einer Vorrichtung der vorliegenden Erfindung, wie zuvor beschrieben, kann das Rauschen in einem Eingabebild effektiv geschätzt werden und ein Kodierverfahren für bewegte Bilder und eine Vorrichtung hierfür, welche das Rauschschätzverfahren und -vorrichtung der vorliegenden Erfindung verwenden können das Rauschen in dem Eingabebild effektiv reduzieren, so dass das Kodieren von bewegten Bildern effizienter durchgeführt werden kann.
  • Obwohl einige wenige Aspekte der vorliegenden Erfindung gezeigt und beschrieben wurden, ist dem Fachmann klar, dass Änderungen in diesem Sinne gemacht werden können, ohne von den Prinzipien der Erfindung und dem Schutzbereich, welcher durch die Ansprüche definiert ist, abzuweichen.

Claims (28)

  1. Verfahren, um ein Rauschen eines Eingabebildes abzuschätzen und/oder zu reduzieren, wobei das Verfahren umfasst: Berechnen (410) von Bewegungskompensationsinformation des Eingabebildes bei einer ersten Auflösung; Berechnen (420) der Bewegungskompensationsinformation des Eingabebildes bei einer zweiten Auflösung; und basierend auf der Bewegungskompensationsinformation bei der ersten Auflösung und der Bewegungskompensationsinformation bei der zweiten Auflösung, Abschätzen (450) des Rauschens des Eingabebildes, wobei das Abschätzen (450) des Rauschens des Eingabebildes des Weiteren umfasst: basierend auf der Summe absoluter Differenzen bei der ersten Auflösung und der Summe absoluter Differenzen bei der zweiten Auflösung, wobei die Summe der absoluten Differenzen zwischen korrespondierenden Pixeln in jedem Block des Eingabebildes nach dem Durchführen der Bewegungskompensation gemäß der Bewegungskompensationsinformation berechnet wird, Berechnen einer Differenz zwischen der Summe bei der ersten Auflösung und der Summe bei der zweiten Auflösung in jedem Block des Eingabebildes, und Berechnen (430) eines Absolutwertes der berechneten Differenz zwischen den Summen.
  2. Verfahren gemäß Anspruch 1, des Weiteren umfassend: Durchführen einer Rauschreduzierungsfilterung des Eingabebildes basierend auf der abgeschätzten Rauschinformation.
  3. Das Verfahren gemäß Ansprüchen 1 oder 2, des Weiteren umfassend: Bestimmen einer modifizierten Quantifizierungsgewichtsmatrix basierend auf der Menge des abgeschätzten Rauschens; Durchführen einer diskreten Kosinustransformation des Eingabebildes; und Durchführen einer Quantisierung der diskret kosinustransformierten Eingabebilddaten unter Benutzung der modifizierten Quantisierungsgewichtematrix.
  4. Verfahren gemäß Anspruch 3, wobei die Bestimmung der modifizierten Quantisierungsgewichtematrix durchgeführt wird durch das Auswählen einer Vielzahl von modifizierten Quantisierungsgewichtematrizen, welche in Bezug auf die Menge von Rauschen in dem Eingabebild eingestuft sind.
  5. Verfahren gemäß einem der Ansprüche 1 bis 4, wobei die erste Auflösung eine Originalauflösung und die zweite Auflösung eine niedrige Auflösung ist.
  6. Verfahren gemäß Anspruch 5, wobei die zweite Auflösung durch das Durchführen eines Tiefpass-Filterung erhalten wird.
  7. Verfahren gemäß einem der Ansprüche 1 bis 6, wobei die Berechnung der Bewegungskompensationsinformation in Einheiten von Blöcken durchgeführt wird.
  8. Verfahren gemäß Anspruch 7, wobei die Bewegungskompensationsinformation die Summe absoluter Differenzen ist.
  9. Verfahren gemäß Anspruch 8, wobei das Abschätzen des Rauschens des Eingabebildes des Weiteren umfasst: Addieren des Absolutwertes jedes berechneten Blockes in jedem Rahmen und, basierend auf dem Absolutwert, welcher in jedem Rahmen aufsummiert wird, Abschätzen einer Menge von Rauschen in dem Eingabebild.
  10. Verfahren gemäß Anspruch 9, wobei das Berechnen der Bewegungskompensationsinformation des Eingabebildes bei einer ersten Auflösung des Weiteren umfasst: Berechnen einer Referenzsumme basierend auf der berechneten Summe der absoluten Differenzen bei einer ersten Auflösung, und Addieren des Absolutwertes nur wenn die Summe bei der ersten Auflösung des Blockes kleiner ist als die Referenzsumme.
  11. Vorrichtung, um ein Rauschen eines Eingabebildes abzuschätzen und/oder zu reduzieren, wobei die Vorrichtung umfasst: eine erste Bewegungskompensationsinformationsberechnungsbaugruppe, welche Bewegungskompensationsinformation des Eingabebildes bei einer ersten Auflösung berechnet; eine zweite Bewegungskompensationsinformationsberechnungsbaugruppe, welche die Bewegungskompensationsinformation des Eingabebildes bei einer zweiten Auflösung berechnet; und eine Rauschbestimmungsbaugruppe (980), welche, basierend auf der Bewegungskompensationsinformation bei der ersten Auflösung und der Bewegungskompensationsinformation bei der zweiten Auflösung, das Rauschen des Eingabebildes abschätzt; wobei die Rauschbestimmungsbaugruppe des Weiteren umfasst: eine Summendifferenzberechnungsbaugruppe, welche, basierend auf der Summe absoluter Differenzen bei der ersten Auflösung und der Summe absoluter Differenzen bei der zweiten Auflösung, wobei die Summe der absoluten Differenzen zwischen korrespondierenden Pixeln in jedem Block des Eingabebildes nach dem Durchführen der Bewegungskompensation gemäß der Bewegungskompensationsinformation berechnet wird, eine Differenz zwischen der Summe der ersten Auflösung und der Summe der zweiten Auflösung in jedem Block des Eingabebildes berechnet, und einen Absolutwert der berechneten Summendifferenz berechnet.
  12. Vorrichtung gemäß Anspruch 11, des Weiteren umfassend: eine Rauschreduzierungsbaugruppe, welche eine Rauschreduzierungs-Filterung an dem Eingabebild, basierend auf dem abgeschätzten Rauschen, durchführt.
  13. Vorrichtung gemäß Ansprüchen 11 oder 12, des Weiteren umfassend: eine Quantisierungsgewichtematrixbestimmungsbaugruppe (992), welche eine modifizierte Quantisierungsgewichtematrix, basierend auf der Menge des abgeschätzten Rauschens bestimmt; eine diskrete Kosinustransformationsbaugruppe (910), welche eine diskrete Kosinustransformation an dem Eingabebild durchführt; und eine Quantisierungsbaugruppe, welche eine Quantisierung in diskret kosinustransformierten Eingabebilddaten unter Benutzung der modifizierten Quantisierungsgewichtematrix durchführt.
  14. Vorrichtung gemäß Anspruch 13, wobei die Quantisierungsgewichtematrixbestimmungsbaugruppe (992) eine modifizierte Gewichtematrix bestimmt durch das Auswählen einer Vielzahl von modifizierten Quantisierungsgewichtematrizen, welche eingestuft sind in Bezug auf der Menge des Rauschens in dem Eingabebild.
  15. Vorrichtung gemäß einem der Ansprüche 11 bis 14, wobei die erste Auflösung eine Originalauflösung und die zweite Auflösung eine niedrige Auflösung ist.
  16. Vorrichtung gemäß Anspruch 15, wobei die zweite Auflösung durch das Durchführen einer Tiefpass-Filterung erhalten wird.
  17. Vorrichtung gemäß einem der Ansprüche 11 bis 16, wobei die zweite Bewegungskompensationsinformationsberechnungsbaugruppe die Bewegungskompensationsinformation in Einheiten von Blöcken berechnet.
  18. Vorrichtung gemäß Anspruch 17, wobei die Bewegungskompensationsinformation eine Summe von absoluten Differenzen ist.
  19. Vorrichtung gemäß Anspruch 11, wobei die Rauschbestimmungsbaugruppe des Weiteren umfasst: eine Addiererbaugruppe, welche den Absolutwert von jedem Block, welcher in der Summendifferenzberechnungsbaugruppe in jedem Rahmen berechnet wurde, addiert; und eine Rauschquantitätsabschätzungsbaugruppe, welche, basierend auf dem Berechnungsergebnis der Addiererbaugruppe, eine Menge des Rauschens in dem Eingabebild abschätzt.
  20. Vorrichtung gemäß Anspruch 19, wobei die Rauschbestimmungsbaugruppe des Weiteren umfasst: eine Referenzsummenberechnungseinheit, welche eine Referenzsumme von absoluten Differenzen berechnet, basierend auf der Summe von absoluten Differenzen bei der ersten Auflösung, wobei die Addiererbaugruppe den Absolutwert der Summendifferenzen des Blockes nur, wenn die Summe bei einer ersten Auflösung des Blockes kleiner ist als die Referenzsumme der Absolutdifferenz, addiert.
  21. Vorrichtung gemäß Anspruch 19, wobei die Rauschbestimmungsbaugruppe des Weiteren umfasst: eine erste Baugruppe für das Berechnen von absoluten Differenzen bei einer ersten Auflösung, welche in einem Suchbereich eines vorherigen Rahmens nach einem Bewegungsvektor MVL1 entsprechend einem Block bei der Position (i, j) eines aktuellen Rahmens bei einer ersten Auflösung sucht und Ausgeben einer Summe von absoluten Differenzen entsprechend dem Bewegungsvektor MVL1, der gesucht wurde, umfassend einen Differenzwert SADL1 zwischen korrespondierenden Pixeln nach dem Bewegen um den MVL1 von dem vorherigen Rahmen.
  22. Vorrichtung gemäß Anspruch 21, wobei die erste Auflösung ein Originalauflösungsniveau eines originalen Eingabebildes umfasst.
  23. Vorrichtung gemäß Anspruch 22, wobei der Bewegungsvektor MVL1 bei der ersten Auflösung gemäß der folgenden Gleichung 1 bestimmt wird: wobei Fn(i, j) ein Pixel an der Position (i, j) in dem aktuellen Rahmen (n-ter Rah
    Figure 00200001
    men) ist, ±S einen Suchbereich anzeigt, in welchem der Bewegungsvektor gesucht wird, Fn-1(i, j) der Pixel an der Position (i, j) in dem vorherigen Rahmen ((n-1)-ter Rahmen) ist, und die Größe der Blöcke N × N ist.
  24. Vorrichtung gemäß Anspruch 20, wobei die Referenzsummenberechnungsbaugruppe die Referenzsumme der absoluten Differenz berechnet unter Benutzung von
    Figure 00200002
    oder
    Figure 00210001
    wobei A eine vorbestimmte Konstante ist, K die Anzahl von Blöcken in dem Bild bezeichnet, und SADhalf-pel die Summe von absoluten Differenzen bezeichnet, nachdem eine Halb-Pixel-Suche beendet ist.
  25. Vorrichtung gemäß Anspruch 24, wobei die Addiererbaugruppe nur einen SAD- oder einen SADhalf-pel-Wert addiert, welcher kleiner ist als die Referenzsumme der Absolutdifferenzen, welche in jedem Block erhalten werden, den SAD-Wert für den Rahmen berechnet, und den SAD-Wert für den Rahmen an die Rauschbestimmungsbaugruppe sendet.
  26. Vorrichtung gemäß Anspruch 13, des Weiteren umfassend: eine Invers-Quantisierungsbaugruppe (930), welche das Eingabebild, welches in der Quantisierungseinheit (920) quantisiert wurde, invers quantisiert; eine inverse diskrete Kosinustransformationsbaugruppe (940), welche eine inverse diskrete Kosinustransformation des Eingabebildes durchführt, welches in der Invers-Quantisierungsbaugruppe invers quantisiert wurde; ein Rahmenspeicher (950), welcher das Eingabebild, welches in der inversen diskreten Kosinustransformationsbaugruppe (910) invers diskret kosinustransformiert wurde, in Einheiten von Rahmen speichert; eine Bewegungsschätzungs- und Kompensationsbaugruppe (960), welche einen Bewegungsvektor und eine Summe von Absolutdifferenzen, welche einem Blockanpassungsfehler entspricht, für jeden Makroblock abschätzt, durch das Benutzen des Eingabebildes eines aktuellen Rahmens, welcher eingegeben wird und des Eingabebildes des vorangegangenen Rahmens, welches in dem Rahmenspeicher (950) gespeichert wurde; und eine variable Längencodierungsbaugruppe (970), welche statistische Redundanzen in den diskret kosinustransformierten und quantisierten Daten entfernt, gemäß des Bewegungsvektors, welcher in der Bewegungsschätzungs- und Kompensationsbaugruppe (960) abgeschätzt wurde.
  27. Vorrichtung gemäß Anspruch 13, des Weiteren umfassend: einen Quantisierungsgewichtematrixspeicher (994), wobei die Quantisierungsgewichtematrixbestimmungsbaugruppe (992) einen Index einer modifizierten Quantisierungsmatrix entsprechend des Rauschens an den Quantisierungsgewichtematrixspeicher (994) sendet, und wenn die Quantisierungsgewichtematrizen, welche in dem Quantisierungsgewichtematrixspeicher (994) gespeichert sind, in fünf Typen eingeteilt werden, wird der Index zu 0, 1, 2, 3 oder 4.
  28. Vorrichtung gemäß Anspruch 27, wobei, basierend auf der Quantisierungsgewichtematrix, welche durch die Quantisierungsgewichtematrixbestimmungsbaugruppe (992) eingegeben wurde, der Quantisierungsgewichtematrixspeicher (994) eine Quantisierungsgewichtematrix entsprechend dem Index auswählt und die ausgewählte Matrix an die Quantisierungsbaugruppe (920) sendet, wobei die Quantisierungsbaugruppe (920) die Quantisierung unter Benutzung der eingegebenen Quantisierungsgewichtematrix durchführt.
DE2003615125 2003-01-02 2003-12-19 Auf Bewegungskompensation basierendes Verfahren und Vorrichtung zur Rauschabschätzung Expired - Lifetime DE60315125T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020030000046A KR20040062257A (ko) 2003-01-02 2003-01-02 움직임 보상에 기반한 개선된 노이즈 예측 방법 및 그장치와 이를 사용한 동영상 부호화 방법 및 그 장치
KR2003000046 2003-01-02

Publications (2)

Publication Number Publication Date
DE60315125D1 DE60315125D1 (de) 2007-09-06
DE60315125T2 true DE60315125T2 (de) 2007-12-13

Family

ID=32653300

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2003615125 Expired - Lifetime DE60315125T2 (de) 2003-01-02 2003-12-19 Auf Bewegungskompensation basierendes Verfahren und Vorrichtung zur Rauschabschätzung

Country Status (6)

Country Link
US (1) US7450639B2 (de)
EP (1) EP1445961B1 (de)
JP (1) JP4494803B2 (de)
KR (1) KR20040062257A (de)
CN (1) CN1320830C (de)
DE (1) DE60315125T2 (de)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060193526A1 (en) * 2003-07-09 2006-08-31 Boyce Jill M Video encoder with low complexity noise reduction
US7457438B2 (en) * 2003-12-23 2008-11-25 Genesis Microchip Inc. Robust camera pan vector estimation using iterative center of mass
US7499494B2 (en) * 2003-12-23 2009-03-03 Genesis Microchip Inc. Vector selection decision for pixel interpolation
US7480334B2 (en) * 2003-12-23 2009-01-20 Genesis Microchip Inc. Temporal motion vector filtering
US8472523B2 (en) * 2004-08-13 2013-06-25 Broadcom Corporation Method and apparatus for detecting high level white noise in a sequence of video frames
US7715645B2 (en) 2004-11-17 2010-05-11 Samsung Electronics Co., Ltd. Methods to estimate noise variance from a video sequence
KR100708118B1 (ko) * 2005-01-07 2007-04-16 삼성전자주식회사 복수개의 변형 곱셈 테이블을 이용한 동영상 부호화 및복호화 장치와 그 방법, 및 이를 구현하기 위한프로그램이 기록된 기록 매체
US7773831B2 (en) * 2005-05-10 2010-08-10 Agfa-Gevaert N.V. Method for visual inspection of size-reduced digital image
KR100735561B1 (ko) 2005-11-02 2007-07-04 삼성전자주식회사 이미지 센서로부터 발생되는 잡음을 저감하는 방법 및 장치
EP1865730A3 (de) * 2006-06-06 2010-01-20 Sony Corporation Videosignalverarbeitungsverfahren, Programm eines Videosignalverarbeitungsverfahrens, Aufzeichnungsmedium mit darauf aufgezeichnetem Programm eines Videosignalverarbeitungsverfahrens und Videosignalverarbeitungsgerät
KR100890640B1 (ko) * 2007-11-30 2009-03-27 재단법인서울대학교산학협력재단 국부공간 제약정보 및 예측 노이즈 특성을 이용한 적응적영상복원방법
JP4768779B2 (ja) * 2008-06-02 2011-09-07 株式会社東芝 動画像符号化/復号化の方法及び装置
FR2933520B1 (fr) * 2008-07-04 2011-02-11 Canon Kk Procede et dispositif de restauration d'une sequence video
US8310548B2 (en) * 2009-10-23 2012-11-13 Contec Llc System and method for video quality parametric tests
JP6249913B2 (ja) * 2014-09-16 2017-12-20 三菱電機株式会社 ノイズ除去装置、ノイズ除去方法及び画像符号化装置
US11062424B2 (en) 2019-10-09 2021-07-13 Microsoft Technology Licensing, Llc Systems and methods for motion adaptive filtering as pre-process to video encoding

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4221236C2 (de) 1992-06-27 2002-01-03 Thomson Brandt Gmbh Verfahren zur Rauschreduktion für Videosignale
JPH06224773A (ja) 1993-01-26 1994-08-12 Toshiba Corp 高能率符号化回路
US5361105A (en) * 1993-03-05 1994-11-01 Matsushita Electric Corporation Of America Noise reduction system using multi-frame motion estimation, outlier rejection and trajectory correction
DE69523113T2 (de) 1994-03-07 2002-06-06 Koninklijke Philips Electronics N.V., Eindhoven Rauschmessung
EP0731601B2 (de) 1995-03-06 2006-10-18 Matsushita Electric Industrial Co., Ltd. Vorrichtung zur Videorauschreduktion
JPH09163373A (ja) * 1995-12-08 1997-06-20 Toshiba Corp 雑音低減装置
EP0809409B1 (de) 1996-05-24 2001-08-29 Matsushita Electric Industrial Co., Ltd. Verfahren und Schaltung zur Bestimmung eines Rauschwerts der repräsentativ ist für das Rauschen in einem Signal
US5978518A (en) * 1997-02-25 1999-11-02 Eastman Kodak Company Image enhancement in digital image processing
EP1126729A1 (de) * 2000-02-18 2001-08-22 STMicroelectronics S.r.l. Verfahren zur Schätzung des Rauschpegels in Bildsequenzen und Vorrichtung dafür

Also Published As

Publication number Publication date
KR20040062257A (ko) 2004-07-07
CN1518365A (zh) 2004-08-04
EP1445961B1 (de) 2007-07-25
EP1445961A3 (de) 2005-08-03
US20050013378A1 (en) 2005-01-20
JP2004215275A (ja) 2004-07-29
CN1320830C (zh) 2007-06-06
JP4494803B2 (ja) 2010-06-30
US7450639B2 (en) 2008-11-11
DE60315125D1 (de) 2007-09-06
EP1445961A2 (de) 2004-08-11

Similar Documents

Publication Publication Date Title
DE60315125T2 (de) Auf Bewegungskompensation basierendes Verfahren und Vorrichtung zur Rauschabschätzung
DE69837003T2 (de) Vorrichtung und verfahren zur optimierung der bitratensteurung in einem kodiersystem
DE10253380B4 (de) Verfahren und Einrichtung zum Kodieren sich bewegender Bilder mit fester Rechenkomplexität
DE69817460T2 (de) Bildsequenzdekodierungsverfahren
DE69826155T2 (de) Verfahren und Vorrichtung zur digitalen Videosignalfilterung und -kodierung
DE69313692T2 (de) Kodierung und Dekodierung zur Videokompression mit automatischer Halbbild/Bild Bewegungskompensation auf der Subpixelebene
DE69323586T2 (de) Gerät zur Schichtkodierung/-dekodierung für ein progressives Eingangsbildsignal
DE69530336T2 (de) Bewegungskompensation für digitale Videosignale mit Zeilensprung
DE69525525T2 (de) Bildverarbeitungssystem unter Verwendung von Pixel-zu-Pixel Bewegungsschätzung und Bilddezimation
DE69118654T2 (de) Progressives Signalkodierungssystem für bewegte Bilder
DE69522861T2 (de) Verfahren und Einrichtung zur Codeumwandlung von codiertem Datenstrom
DE69637335T2 (de) Bildsignalkodierungsmethode und -vorrichtung
DE69312132T2 (de) Bildkompressionsgerät
DE69224250T2 (de) Ableitung und Verwendung von Bewegungsvektoren in einem Differenzpulskodemodulationssystem
DE19506372B4 (de) Bi-Direktionales Bewegungsschätzverfahren und ein dafür vorgesehenes Gerät
DE69836696T2 (de) Verfahren und vorrichtung zur durchführung einer hierarchischen bewegungsschätzung unter verwendung einer nicht-linearen pyramide
DE69635369T2 (de) Videokodierungsvorrichtung
DE69624669T2 (de) Videokodierer und -dekodierersystem und -methoden
DE69422564T2 (de) Verfahren zur halbpixel Bewegungskompensation in Bilddekodierung
DE69715660T2 (de) Videokodierung
DE69805228T2 (de) Videosignalkodierung mit adaptiver Quantisierung
DE69932429T2 (de) Verfahren und gerät für die inverse quantisierung von mpeg-4 video
DE102013105461A1 (de) Ratensteuerverfahren für mehrschichtige Videocodierung, sowie Videocodiervorrichtung und Videosignalverarbeitungsvorrichtung, welche das Ratensteuerverfahren verwenden
DE69935564T2 (de) Kodiervorrichtung und -verfahren
DE602004001993T2 (de) Transformations basiertes restbewegungsrahmen kodierungsverfahren mit übervollständiger basis und zugehörige vorrichtung zur videokompression

Legal Events

Date Code Title Description
8364 No opposition during term of opposition