DE10311054B4 - Verfahren zur Teilbandcodierung einer Folge digitalisierter Bilder - Google Patents

Verfahren zur Teilbandcodierung einer Folge digitalisierter Bilder Download PDF

Info

Publication number
DE10311054B4
DE10311054B4 DE2003111054 DE10311054A DE10311054B4 DE 10311054 B4 DE10311054 B4 DE 10311054B4 DE 2003111054 DE2003111054 DE 2003111054 DE 10311054 A DE10311054 A DE 10311054A DE 10311054 B4 DE10311054 B4 DE 10311054B4
Authority
DE
Germany
Prior art keywords
images
resolution
image
output
output images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE2003111054
Other languages
English (en)
Other versions
DE10311054A1 (de
Inventor
Peter Amon
Jürgen Dr. Pandel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE2003111054 priority Critical patent/DE10311054B4/de
Publication of DE10311054A1 publication Critical patent/DE10311054A1/de
Application granted granted Critical
Publication of DE10311054B4 publication Critical patent/DE10311054B4/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Verfahren zur Teilbandcodierung einer Folge digitalisierter Bilder (0, ...., 7), bei dem:
– für eine vorgegebene Anzahl (GOP) von aufeinanderfolgenden Bildern der Folge jeweils sukzessive eine Mehrzahl von zeitlichen Filterungen auf mehreren Auflösungsebenen (R1, R2, R3) durchgeführt wird;
– mittels der zeitlichen Filterung auf einer Auflösungsebene (R1, R2, R3) jeweils aus zwei oder mehreren Eingangsbildern (0, 1; 2, 3; 4, 5; 6, 7; L; LL) der Auflösungsebene ein oder mehrere erste Ausgangsbilder (H; LH, LLH) und ein oder mehrere zweite Ausgangsbilder (L; LL; LLL) erzeugt werden, wobei die zweiten Ausgangsbilder (L; LL; LLL) die Eingangsbilder der nächstniedrigeren Auflösungsebene sind;
– die ersten Ausgangsbilder (H; LH, LLH) einer Auflösungsebene (R1, R2, R3) jeweils mittels einer Hochpassfilterung erzeugt werden;
– die zweiten Ausgangsbilder (L; LL) einer oder mehrerer erster Auflösungsebenen (R1, R2) mittels einer Tiefpassfilterung erzeugt werden;
– in den zweiten Auflösungsebenen die zweiten Ausgangsbilder (LLL) einer...

Description

  • Verfahren zur Teilbandcodierung einer Folge digitalisierter Bilder Die Erfindung betrifft ein Verfahren zur Teilbandcodierung einer Folge digitalisierter Bilder sowie ein entsprechendes Decodierverfahren und entsprechende Codier- und Decodiervorrichtungen.
  • Bei der Übertragung von Multimediaanwendungen, insbesondere von Videosignalen, ist es vorteilhaft, wenn die zu übertragenden Signale in unterschiedlichen Qualitätsstufen bereitgestellt werden. Beispielsweise können für digitales Fernsehen entsprechend der Leistungsfähigkeit der Endgeräte verschiedene Qualitätsstufen zur Übertragung ausgewählt werden. Ebenso kann die Qualität in Abhängigkeit von den Zugangsnetzen ausgewählt werden, wobei beispielsweise für Netze mit geringeren Bandbreiten eine niedrigere Qualität gewählt wird. Eine weitere Möglichkeit besteht darin, die Qualitätsstufe von der Höhe der für die Übertragung bezahlten Gebühren abhängig zu machen. Ferner ist es bei schwankender Netzgüte hilfreich, wenn mehrere unterschiedliche Qualitätsstufen und damit verbundene Datenraten für die Übertragung von Signalen bereitgestellt werden, damit im Fehlerfall die Qualität nur graduell abnimmt und wenigstens eine Mindestqualität eingehalten wird.
  • Zur Bereitstellung von Signalen in mehreren Qualitätsstufen sind aus dem Stand der Technik skalierbare Videocodierverfahren bekannt. Insbesondere sei hier die bewegungskompensierte dreidimensionale Teilbandcodierung, speziell die Waveletcodierung, erwähnt, die in den Dokumenten [1] und [2] beschrieben ist. Bei der Teilbandcodierung werden mehrere aufeinanderfolgenden digitalisierte Bilder einer Bilderfolge zu einer Gruppe GOP (GOP = Group of Pictures) zusammenfasst. Diese Gruppe wird gemeinsam codiert, indem in einer ersten Auflösungsebene jeweils zwei benachbarte Bilder einer zeitlichen Filterung unterzogen werden, so dass der Hochpassanteil und der Tiefpassanteil der Bilder getrennt werden. Um möglichst wenig Signalenergie im Hochpassanteil des Bildes zu erhalten, wird bei der Filterung zusätzlich eine Bewegungskompensation durchgeführt. Eine Zerlegung in Hochpassanteil und Tiefpassanteil wird in weiteren Auflösungsebenen so lange durchgeführt, bis nur noch ein einziges Tiefpassbild auf der untersten Auflösungsebene übrig bleibt. Die aus dem Stand der Technikbekannten Teilbandcodierverfahren haben den Nachteil, dass es zu einer systematischen Verzögerung bei der Codierung kommt, da zur Erzeugung des Tiefpassbildes auf der untersten Auflösungsebene alle Bilder der Gruppe GOP benötigt werden. Es muss somit abgewartet werden, bis diese Bilder eingelesen worden sind. Die Verzögerung ist für alle Kommunikationsanwendungen problematisch, jedoch ist sie besonders bei Videoanwendungen unerwünscht.
  • Die Druckschrift US 5,923,785 lehrt ein Verfahren, bei dem in einem hierarchischen Subband System Koeffizienten einer Wavelet-Transformation codiert werden, wobei diese Koeffizienten ein Bild repräsentieren. Hierbei werden Codierregeln zur Verfügung gestellt, welche durch einen Symbolsatz dargestellt werden, wobei dieser Symbolsatz eine effiziente Codierung der Wavelet Transformation mit Hilfe einer Huffman Codierung ermöglicht.
  • Aufgabe der Erfindung ist es deshalb, ein Verfahren zur Teilbandcodierung zu schaffen, welches neben einer guten Codiereffizienz auch eine geringe systematische Verzögerung aufweist.
  • Diese Aufgabe wird durch die unabhängigen Patentansprüche gelöst. Weiterbildungen der Erfindung sind in den abhängigen Ansprüchen definiert.
  • Bei dem erfindungsgemäßen Teilbandcodierungsverfahren wird für eine vorgegebene Anzahl von aufeinanderfolgenden Bildern einer Bilderfolge jeweils sukzessive eine Mehrzahl von zeitlichen Filterungen auf mehreren Auflösungsebenen durchgeführt. Hierbei wird mittels der zeitlichen Filterung auf einer Auflösungsebene jeweils aus zwei oder mehreren Eingangsbildern der Auflösungsebene ein oder mehrere erste Ausgangsbilder und ein oder mehrere zweite Ausgangsbilder erzeugt, wobei die zweiten Ausgangsbilder die Eingangsbilder der nächstniedrigeren Auflösungsebene sind. Die ersten Ausgangsbilder einer Auflösungsebene werden jeweils mittels einer Hochpassfilterung erzeugt. Bei dem erfindungsgemäßen Verfahren existieren eine oder mehrere erste Auflösungsebenen und eine oder mehrere zweite Auflösungsebenen. Die zweiten Ausgangsbilder der ersten Auflösungsebenen werden mittels einer Tiefpassfilterung erzeugt, wohingegen in den zweiten Auflösungsebenen die zweiten Ausgangsbilder einer jeweiligen zweiten Auflösungsebene Eingangsbildern der jeweiligen zweiten Auflösungsebene entsprechen. Anschließend werden ein oder mehrere der ersten und zweiten Ausgangsbilder örtlich codiert, wodurch codierte Ausgangsbilder erzeugt werden. Je nach erwünschter Auflösung werden die für die entsprechende Auflösung erforderlichen codierten Ausgangsbilder anschließend übertragen, wobei die Übertragung nicht Teil des erfindungsgemäßen Codierverfahrens ist.
  • Der Erfindung liegt die Erkenntnis zugrunde, dass die systematische Verzögerung dadurch verbessert werden kann, dass die Tiefpassfilterungen in einigen Auflösungsebenen, die im Vorangegangenen als zweite Auflösungsebenen bezeichnet wurden, weggelassen werden. Hierdurch wird zur Erzeugung des Ausgangsbildes auf einer niedrigen Auflösungsebene eine geringere Anzahl von Eingangsbildern benötigt. Ferner wurde erkannt, dass die Codiereffizienz bei Weglassung von nur einigen Tiefpassfilterungen nicht wesentlich verschlechtert wird, was jedoch bei der Weglassung der Tiefpassfilterungen in allen Auflösungsebenen der Fall wäre.
  • In einer bevorzugten Ausführungsform des Verfahrens wird vor der Hochpassfilterung eine Bewegungskompensation durchgeführt, so dass das hierdurch erzeugte Bild möglichst wenig Signalenergie enthält.
  • In einer Ausführungsform der Erfindung wird bei der Bewegungskompensation aus einem Eingangsbild ein zeitlich nachfolgendes bewegungskompensiertes Bild erzeugt. Es ist jedoch auch denkbar, dass bei der Bewegungskompensation aus einem Eingangsbild ein zeitlich vorhergehendes bewegungskompensiertes Bild erzeugt wird.
  • In einer weiteren Ausführungsform des erfindungsgemäßen Verfahrens wird vor der Tiefpassfilterung eine inverse Bewegungskompensation durchgeführt. Bei der inversen Bewegungskompensation kann aus einem der ersten Ausgangsbilder ein zeitlich vorhergehendes bewegungskompensiertes Bild erzeugt werden. Alternativ kann aus einem der ersten Ausgangsbilder ein zeitlich nachfolgendes bewegungskompensiertes Bild erzeugt werden.
  • In einer besonders bevorzugten Ausführungsform werden die ersten und zweiten Ausgangsbilder, die örtlich zu codieren sind, einer örtlichen Transformation unterzogen, wobei die Transformation vorzugsweise eine Wavelet-Transformation ist. Die transformierten Ausgangsbilder werden anschließend einer Quantisierung und einer Entropiecodierung unterzogen.
  • In einer besonders bevorzugten Ausführungsform der Erfindung ist wenigstens eine der zweiten Auflösungsebene die niedrigste Ebene. Es hat sich gezeigt, dass insbesondere durch das Weglassen der Tiefpassfilterung in der niedrigsten Auflösungsebene weiterhin eine gute Codiereffizienz bei gleichzeitiger Verringerung der systematischen Verzögerung erreicht wird.
  • In einer weiteren Ausführungsform werden als zweite Auflösungsebenen die niedrigste Auflösungsebene und eine oder mehrere zur niedrigsten Auflösungsebene benachbarte Auflösungsebene verwendet.
  • In einer weiteren bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens umfasst die vorgegebene Anzahl von aufeinanderfolgenden Bildern acht Bilder.
  • Neben dem oben beschriebenen Codierverfahren betrifft die Erfindung ferner ein Verfahren zur Decodierung einer Folge von codierten Ausgangsbildern, die mittels des erfindungsgemäßen Codierverfahrens erzeugt wurden, wobei das Verfahren derart ausgestaltet ist, dass aus den codierten Ausgangsbildern decodierte Eingangsbilder einer Auflösungsebene erzeugt werden.
  • In einer bevorzugten Ausführungsform des Decodierverfahrens werden die codierten Ausgangsbilder örtlich decodiert und ein oder mehrere der zweiten Ausgangsbilder einer oder mehrerer Auflösungsebenen werden rekonstruiert. Je nach Wahl der Skalierung werden bei der Decodierung Ausgangsbilder von einer oder mehrerer der ersten und der zweiten Auflösungsebenen rekonstruiert. Sofern ein oder mehrere der zweiten Ausgangsbilder von einer oder mehreren der ersten Auflösungsebenen rekonstruiert werden, werden in diesen ersten Auflösungsebenen aus wenigstens einem ersten Ausgangsbild und wenigstens einem zweiten Ausgangsbild wenigstens ein decodiertes Eingangsbild rekonstruiert und mit dem rekonstruierten Eingangsbild und dem wenigstens ersten Ausgangsbild wird ein weiteres decodierten Eingangsbild rekonstruiert. Sofern ein oder mehrere der zweiten Ausgangsbilder von einer oder mehreren der zweiten Auflösungsebenen rekonstruiert werden, wird in diesen zweiten Auflösungsebenen mit wenigstens einem ersten Ausgangsbild und wenigstens einem zweiten Ausgangsbild ein decodiertes Eingangsbild rekonstruiert. Das Decodierverfahren unterscheidet somit zwischen den ersten und zweiten Auflösungsebenen, um dadurch ein sinnvoll rekonstruiertes decodiertes Eingangsbild zu erhalten.
  • Neben den oben beschriebenen Codier- und Decodierverfahren umfasst die Erfindung ferner ein kombiniertes Verfahren zur Codierung und Decodierung einer Folge digitalisierter Bilder, welches das oben beschriebene Codierverfahren und das oben beschriebene Decodierverfahren beinhaltet.
  • Darüber hinaus betrifft die Erfindung eine Codiervorrichtung zur Teilbandcodierung einer Folge digitalisierter Bilder, wobei die Codiervorrichtung derart ausgestaltet ist, dass das erfindungsgemäße Codierverfahren durchführbar ist. Ferner umfasst die Erfindung eine Decodiervorrichtung zur Decodierung einer Folge von codierten Bildern, wobei die Decodiervorrichtung derart ausgestaltet ist, dass das oben beschriebene erfindungsgemäße Decodierverfahren durchführbar ist. Darüber hinaus beinhaltet die Erfindung eine Vorrichtung zur Codierung und Decodierung einer Folge digitalisierter Bilder, welche die oben erwähnte Codiervorrichtung sowie die oben erwähnte Decodiervorrichtung umfasst.
  • Ausführungsbeispiele der Erfindung werden nachfolgend anhand der beigefügten Zeichnungen beschrieben.
  • Es zeigen:
  • 1 eine schematische Darstellung eines Verfahrens zur Teilbandcodierung gemäß dem Stand der Technik;
  • 2 eine schematische Darstellung eines Verfahrens zur Teilbandcodierung gemäß einer ersten Ausführungsform der Erfindung;
  • 3 eine schematische Darstellung eines Verfahrens zur Teilbandcodierung gemäß einer zweiten Ausführungsform der Erfindung;
  • 4 eine schematische Darstellung eines Verfahrens zur Decodierung einer mit dem Verfahren der 2 codierten Bilderfolge;
  • 5 eine schematische Darstellung eines Verfahrens zur Decodierung einer mit dem Verfahren der 3 codierten Bilderfolge; und
  • 6 eine schematische Darstellung einer dritten Ausführungsform des erfindungsgemäßen Verfahren zur Teilbandcodierung.
  • 1 zeigt ein Teilbandcodierverfahren gemäß dem Stand der Technik. Hierbei handelt es sich um eine 3D-Teilbandcodierung, wobei 3D für zwei örtliche Dimensionen und die Zeitdimension t steht. In diesem Teilbandcodierverfahren werden acht aufeinanderfolgende Bilder 0 bis 7 einer Folge digitalisierter Bilder codiert. Bei der Codierung wird die bestmögliche Auflösung dann erreicht, wenn alle Bilder 0 bis 7 rekonstruierbar sind. Die bestmögliche Auflösung wird im folgenden als nullte Auflösungsebene R0 bezeichnet.
  • In 1 werden zunächst die Bilder 0 und 1 bzw. 2 und 3 bzw. 4 und 5 bzw. 6 und 7 einer Hochpassfilterung unterzogen. Vor der Durchführung der Hochpassfilterung werden die Bilder 0, 2, 4 und 6 jeweils einer Bewegungskompensation MC unterzogen. Anschließend wird mit dem bewegungskompensierten Bild 0 und dem Bild 1, dem bewegungskompensierten Bild 2 und dem Bild 3, dem bewegungskompensierten Bild 4 und dem Bild 5 sowie dem bewegungskompensierten Bild 6 und dem Bild 7 eine Hochpassfilterung durchgeführt, so dass insgesamt vier Hochpassbilder H entstehen, die in der Terminologie der Patentansprüche als erste Ausgangsbilder bezeichnet werden. Bei dieser Hochpassfilterung werden die hochfrequenten Anteile des Bildes durch eine Differenzbildung herausgefiltert. Die vier Bilder H stellen die Ausgangsbilder der ersten Auflösungsebene R1 dar.
  • In einem nächsten Schritt werden die vier Hochpassbilder jeweils einer inversen Bewegungskompensation IMC unterzogen und anschließend mit den ursprünglichen Bildern 0, 2, 4 bzw. 6 kombiniert, und zwar derart, dass insgesamt vier tiefpassgefilterte Bilder L entstehen. Diese Bilder stellen die zweiten Ausgangsbilder gemäß der Terminologie der Patentansprüche dar und sie bilden gleichzeitig die Eingangsbilder der nächsthö heren, zweiten Auflösungsebene R2. Bei der Tiefpassfilterung wird im wesentlichen der Mittelwert der Bilder 0 und 1 bzw. 2 und 3 bzw. 4 und 5 bzw. 6 und 7 berechnet, was einem Herausfiltern von niedrigen Frequenzanteilen entspricht.
  • In der Auflösungsebene R2 werden im Wesentlichen die Verfahrensschritte der Auflösungsebene R1 wiederholt, wobei nunmehr die Eingangsbilder nicht die ursprünglichen Bilder 0 bis 7, sondern die vier Bilder L sind. Es wird wiederum eine Bewegungskompensation und eine Hochpassfilterung durchgeführt, so dass sich aus den Eingangsbildern L zwei hochpassgefilterte Bilder LH ergeben. Diese Bilder werden anschließend einer inversen Bewegungskompensation und zusammen mit dem jeweiligen ersten Bild L einer Tiefpassfilterung unterzogen und es ergeben sich hieraus zwei tiefpassgefilterte Eingangsbilder LL für die dritte Auflösungsebene R3.
  • In dieser dritten Auflösungsebene werden die beiden Bilder LL kombiniert, wobei wiederum eine Bewegungskompensation und eine Hochpassfilterung durchgeführt wird. Es ergibt sich schließlich das hochpassgefilterte Bild LLH, welches einer inversen Bewegungskompensation IMC unterzogen wird und zusammen mit dem ersten Bild LL anschließend tiefpassgefiltert wird, sodass sich schließlich auf der niedrigsten Auflösungsebene R3 das Bild LLL ergibt.
  • Die Bilder LLL, LLH, LH und H werden anschließend einer Wavelet-Transformation und einer Quantisierung und Entropiecodierung unterzogen, wodurch eine örtliche Codierung erfolgt. Dies ist in 2 und allen weiteren nachfolgenden Figuren durch die Einteilung der Bilder in kleinere Quadrate angedeutet.
  • Die im vorangegangenen beschriebene Teilbandcodierung hat den Vorteil, dass sie skalierbar ist, d.h. in Abhängigkeit von den an die Bildübertragung gestellten Erfordernissen kann die Auflösung bei der Codierung verändert werden. Wenn nur eine geringe zeitliche Auflösung auf der Auflösungsebene R3 erwünscht ist, wird lediglich das Bild LLL übertragen. Sollte die nächsthöhere Auflösung R2 erwünscht sein, werden die Bilder LLL und LLH übertragen. Für eine Auflösung auf der Auflösungsebene R1 werden die Bilder LLL, LLH und LH übertragen. Auf der höchsten Auflösungsebene R0 werden die Bilder LLL, LLH, LH und H übertragen. In den Auflösungsebenen R0, R1 und R2 werden neben den Bildern auch noch Bewegungsinformationen aus Bewegungsschätzungen übertragen, die im Zusammenhang mit den Bewegungskompensationen durchgeführt wurden.
  • Wie sehr anschaulich aus der 1 ersichtlich ist, unterliegt das Codierverfahren einer systematischen Verzögerung. Bei der Erzeugung des Ausgangsbildes LLL der Auflösungsebene R3 werden alle Eingangsbilder 0 bis 7 benötigt. D.h., es müssen erst alle Eingangsbilder eingelesen werden, bevor das Ausgangsbild LLL erzeugt werden kann.
  • In 2 ist eine erste Ausführungsform des erfindungsgemäßen Codierverfahrens dargestellt. Im Unterschied zum Verfahren der 1 wird die in der Auflösungsebene R3 durchgeführte Tiefpassfilterung und inverse Bewegungskompensation IMC weggelassen. Das Bild LLL wird somit nicht berechnet, sondern es wird einfach das Eingangsbild LL der dritten Auflösungsebene unverändert gelassen. Es ergibt sich dadurch bei der örtlichen Codierung zwar eine schlechtere Codiereffizienz, die jedoch nicht wesentlich ins Gewicht fällt. Vielmehr überwiegt der erreichte Vorteil, dass zur Erzeugung des Bildes LLL lediglich die Eingangsbilder 0 bis 3 benötigt werden, d.h. die systematische Verzögerung um vier Bilder vermindert wird. Es sei hierbei angemerkt, dass von den Erfindern durchgeführte Experimente tatsächlich gezeigt haben, dass insbesondere bei der Weglassung der Tiefpassfilterung in der niedrigsten Auflösungsebene keine wesentliche Verschlechterung der Codiereffizienz eintritt.
  • In 3 ist eine zweite Ausführungsform des erfindungsgemäßen Verfahrens gezeigt. Das Verfahren der 3 unterscheidet sich vom Verfahren der 2 darin, dass neben der inversen Bewegungskompensation IMC und der Tiefpassfilterung in der Auflösungsebene R3 auch noch die inversen Bewegungskompensationen IMC und die Tiefpassfilterungen in der Auflösungsebene R2 weggelassen werden. Somit werden zur Erzeugung des Bildes LLL in der Auflösungsebene R3 nur noch die Eingangsbilder 0 und 1 benötigt, wodurch die systematische Verzögerung gegenüber dem Stand der Technik um 6 Bilder vermindert wird. Die Erfinder konnten durch Experimente nachweisen, dass auch bei Weglassung der Tiefpassfilterungen in der Ebene R2 noch eine hinreichende Codiereffizienz gegeben ist, so dass der Vorteil der verminderten systematischen Verzögerung gegenüber dem Nachteil der schlechteren Codiereffizienz weit überwiegt.
  • Die durch das erfindungsgemäße Verfahren verminderte Verzögerung lässt sich auch allgemein wie folgt berechnen:
    Figure 00110001
    delay die Verzögerung ist,
    GOP die vorgegebene Anzahl von Bildern einer Bilderfolge ist, und
    skip die Anzahl der Auflösungsebenen ist, in denen die Tiefpassfilterungen weggelassen wird.
  • Im Folgenden ist noch eine Tabelle wiedergegeben, welche die Verzögerung für unterschiedliche Werte von GOP und unterschiedliche Werte von skip wiedergibt:
    Figure 00110002
    Figure 00120001
  • Der Tabelle kann entnommen werden, dass vor allem bei größeren GOP-Werten deutliche Verzögerungsverminderungen erreicht werden können. Insbesondere besteht hierbei die Möglichkeit, einen optimierten Wert für skip auszuwählen, welcher die kleinste Verzögerung bei noch akzeptabler Codiereffizienz liefert.
  • In 4 ist ein erfindungsgemäßes Decodierverfahren gezeigt, mit dem eine gemäß dem Verfahren der 2 codierte Bilderfolge decodiert wird. In dem Decodierverfahren erfolgt zunächst eine nicht dargestellte örtliche Decodierung der einzelnen mit dem Codierverfahren erzeugten Ausgangsbilder LLL, LLH, LH und H. Anschließend wird das Bild LLL, welches dem Bild LL entspricht, einer Bewegungskompensation unterzogen und mit dem Bild LLH derart kombiniert, dass ein Eingangsbild LL rekonstruiert wird. Entscheidend ist hierbei, dass bei der Rekonstruktion das Bild LLL direkt einer Bewegungskompensation unterzogen werden kann, ohne nochmals bearbeitet zu werden. Im Gegensatz dazu müsste bei einem entsprechenden Decodierverfahren nach dem Stand der Technik das Bild LLH zunächst einer inversen Bewegungskompensation unterzogen werden und anschließend mit dem Bild LLL derart kombiniert werden, dass sich das Bild LL der nächsthöheren Auflösungsebene ergibt. Erst dann könnte die Bewegungskompensation des Bildes LL durchgeführt werden.
  • Auf den Auflösungsebenen R2 und R1 wurden bei der Codierung die Tiefpassfilterungen nicht weggelassen. Deshalb müssen hier zunächst die Bilder LH einer inversen Bewegungskompensation IMC unterzogen werden und anschließend mit den Bildern LL zur Rekonstruktion der Bilder L kombiniert werden. Schließlich werden die auf diese Weise rekonstruierten Bilder L einer Bewegungskompensation MC unterzogen und mit Hilfe des bewegungskompensierten Bildes und des Bildes LH wird ein weiteres Eingangsbild L rekonstruiert. In analoger Weise wird in der Auflösungsebene R1 vorgegangen, wobei in dieser Auflösungsebene die Ausgangsbilder H einer inversen Bewegungskompensation unterzogen werden und mit den Bildern L kombiniert werden, um die Eingangsbilder 0, 2, 4 und 6 zu erhalten. Diese Eingangsbilder werden dann einer Bewegungskompensation MC unterzogen und anschließend wird mit Hilfe der bewegungskompensierten Bilder und der Bilder H die Eingangsbilder 1, 3, 5 und 7 rekonstruiert.
  • In 5 ist ein Decodierverfahren dargestellt, mit dem eine nach dem Verfahren der 3 codierte Bilderfolgen decodiert wird. Bei diesem Decodierverfahren werden zunächst die codierten Ausgangsbilder LLL, LLH, LH und H decodiert und anschließend werden auf der Auflösungsebene R3 in Analogie zum Verfahren der 4 die beiden Bilder LL rekonstruiert. Da bei dem Codierverfahren der 3 auch in der Auflösungsebene R2 die Tiefpassfilterungen weggelassen wurden, können die Bilder L wesentlich einfacher rekonstruiert werden. Aus den Bildern LL und LH wird nämlich kein neues Bild errechnet, sondern die beiden Bilder LL, die jeweils einem Bild L in der Auflösungsebene R2 entsprechen, werden einer Bewegungskompensation unterzogen und anschließend werden mit den bewegungskompensierten Bildern und den Bildern LH weitere Bilder L rekonstruiert. Die nachfolgend in der Auflösungsebene R1 durchgeführten Verfahrensschritte entsprechen den Verfahrensschritten der Auflösungsebene R1 in 4, so dass nicht mehr näher darauf eingegangen wird.
  • In 6 ist eine weitere Ausführungsform des erfindungsgemäßen Codierverfahrens gezeigt. Dieses Codierverfahren unterscheidet sich vom Codierverfahren nach 2 darin, dass die durchgeführten Bewegungskompensationen MC und inversen Bewegungskompensationen in umgekehrter Richtung ablaufen. In 2 wurde bei der Bewegungskompensation aus einem Bild ein zeitlich nachfolgendes Bild berechnet, wohingegen in 6 aus einem Bild ein zeitlich vorhergehendes Bild berechnet wird. Entsprechend wurde in 2 bei der inversen Bewegungskompensation aus einem Bild ein zeitlich vorhergehendes Bild berechnet, wohingegen bei der inversen Bewegungskompensation der 6 aus einem Bild ein zeitlich nachfolgendes Bild berechnet wird. Ansonsten entsprechen sich beide Verfahren, insbesondere wurde bei beiden Verfahren in der Auflösungsebene R3 die Tiefpassfilterung weggelassen. Der Vorteil des Verfahrens der 6 gegenüber dem Verfahren der 2 liegt darin, dass die berechneten Ausgangsbilder LLL bzw. LL bzw. L eine Szene aus der Bildfolge zu einem späteren Zeitpunkt wiedergeben, wodurch die Verzögerung bei diesen Auflösungsstufen vermindert wird.
  • Ein entsprechendes Decodierverfahren zur Decodierung der mit dem Verfahren der 6 erzeugten Ausgangsbilder ergibt sich analog durch eine entsprechende Abwandlung des Decodierverfahrens der 4, so dass auf eine entsprechende Darstellung verzichtet wurde.
  • Für den Fachmann ist ebenfalls ersichtlich, dass auch die Codier- bzw. Decodierverfahren der 3 und 5 durch Vertauschung der Bewegungskompensation bzw. inversen Bewegungskompensation entsprechend modifiziert werden können. Auf entsprechende Darstellungen wurde deshalb verzichtet.
  • Literaturverzeichnis:
    • [1] V. Bottreau, M. Bénetière, B. Felts, B. Pesquet-Popescu, „A Fully Scalable 3D Subband Video Codec", in Proc. ICIP 2001, pp. 1017-1020, Oct. 2001.
    • [2] J.-R. Ohm, „Motion-compensated Wavelet Lifting Filters with Flexible Adaptation", 2002 Tyrrhenian International Workshop on Digital Communications (IWDC 2002), Capri, Italy, September 2002.

Claims (19)

  1. Verfahren zur Teilbandcodierung einer Folge digitalisierter Bilder (0, ...., 7), bei dem: – für eine vorgegebene Anzahl (GOP) von aufeinanderfolgenden Bildern der Folge jeweils sukzessive eine Mehrzahl von zeitlichen Filterungen auf mehreren Auflösungsebenen (R1, R2, R3) durchgeführt wird; – mittels der zeitlichen Filterung auf einer Auflösungsebene (R1, R2, R3) jeweils aus zwei oder mehreren Eingangsbildern (0, 1; 2, 3; 4, 5; 6, 7; L; LL) der Auflösungsebene ein oder mehrere erste Ausgangsbilder (H; LH, LLH) und ein oder mehrere zweite Ausgangsbilder (L; LL; LLL) erzeugt werden, wobei die zweiten Ausgangsbilder (L; LL; LLL) die Eingangsbilder der nächstniedrigeren Auflösungsebene sind; – die ersten Ausgangsbilder (H; LH, LLH) einer Auflösungsebene (R1, R2, R3) jeweils mittels einer Hochpassfilterung erzeugt werden; – die zweiten Ausgangsbilder (L; LL) einer oder mehrerer erster Auflösungsebenen (R1, R2) mittels einer Tiefpassfilterung erzeugt werden; – in den zweiten Auflösungsebenen die zweiten Ausgangsbilder (LLL) einer jeweiligen zweiten Auflösungsebene (R3) Eingangsbildern (LL) der jeweiligen zweiten Auflösungsebene (R3) entsprechen; – ein oder mehrere der ersten und zweiten Ausgangsbilder (LLL, LLH, LH, H) örtlich codiert werden, wodurch codierte Ausgangsbilder erzeugt werden.
  2. Verfahren nach Anspruch 1, bei dem vor der Hochpassfilterung eine Bewegungskompensation (MC) durchgeführt wird.
  3. Verfahren nach Anspruch 2, wobei bei der Bewegungskompensation (MC) aus einem Eingangsbild (0; 2; 4; 6; L; LL) ein zeitlich nachfolgendes bewegungskompensiertes Bild erzeugt wird.
  4. Verfahren nach Anspruch 2, wobei bei der Bewegungskompensation (MC) aus einem Eingangsbild (1; 3; 5; 7; L; LL) ein zeitlich vorhergehendes bewegungskompensiertes Bild erzeugt wird.
  5. Verfahren nach einem der vorhergehenden Ansprüche, bei dem vor der Tiefpassfilterung eine inverse Bewegungskompensation (IMC) durchgeführt wird.
  6. Verfahren nach Anspruch 5, wobei bei der inversen Bewegungskompensation (IMC) aus einem der ersten Ausgangsbilder (H; LH; LLH) ein zeitlich vorhergehendes bewegungskompensiertes Bild erzeugt wird.
  7. Verfahren nach Anspruch 5, wobei bei der inversen Bewegungskompensation (IMC) aus einem der ersten Ausgangsbilder (H; LH; LLH) ein zeitlich nachfolgendes bewegungskompensiertes Bild erzeugt wird.
  8. Verfahren nach einem der vorhergehenden Ansprüche, bei dem die örtlich zu codierenden ersten und zweiten Ausgangsbilder (LLL, LLH, LH, H) zur örtlichen Codierung einer örtlichen Transformation unterzogen werden.
  9. Verfahren nach Anspruch 8, bei dem die Transformation eine Wavelet-Transformation ist.
  10. Verfahren nach Anspruch 8 oder 9, bei dem die ersten und zweiten einer örtlichen Transformation unterzogenen Ausgangsbilder einer Quantisierung und Entropiecodierung unterzogen werden.
  11. Verfahren nach einem der vorhergehenden Ansprüche, bei dem wenigstens eine der zweiten Auflösungsebenen (R3) die niedrigste Auflösungsebene ist.
  12. Verfahren nach einem der vorhergehenden Ansprüche, bei dem die zweiten Auflösungsebenen die niedrigste Auflösungsebene (R3) und eine oder mehrere zur niedrigsten Auflösungsebene (R3) benachbarte Auflösungsebenen (R2) umfassen.
  13. Verfahren nach einem der vorhergehenden Ansprüche, bei dem die vorgegebene Anzahl (GOP) von aufeinanderfolgenden Bildern der Folge 8 Bilder umfasst.
  14. Verfahren zur Decodierung einer Folge von codierten Ausgangsbildern, die mittels eines Verfahrens nach einem der vorhergehenden Ansprüche erzeugt wurden, wobei das Verfahren derart ausgestaltet ist, dass aus den codierten Ausgangsbildern decodierte Eingangsbilder einer Auflösungsebene erzeugt werden.
  15. Verfahren nach Anspruch 14, bei dem: – die codierten Ausgangsbilder (LLL, LLH, LH, H) örtlich decodiert werden und ein oder mehrere der zweiten Ausgangsbilder (L, LL) einer oder mehrerer Auflösungsebenen (R1, R2, R3) rekonstruiert werden; – wenn ein oder mehrere der zweiten Ausgangsbilder (L, LL) von einer oder mehreren der ersten Auflösungsebenen (R1, R2) rekonstruiert werden, in diesen ersten Auflösungsebenen (R1, R2) aus wenigstens einem ersten Ausgangsbild (H; LH) und wenigstens einem zweiten Ausgangsbild (L; LL) wenigstens ein decodiertes Eingangsbild (0; 2; 4; 6; L) rekonstruiert wird und mit dem rekonstruierten Eingangsbild und dem wenigstens ersten Ausgangsbild (H; LH) ein weiteres decodierten Eingangsbild (1; 3; 5; 7; L) rekonstruiert wird; – wenn ein oder mehrere der zweiten Ausgangsbilder (LLL) von einer oder mehreren der zweiten Auflösungsebenen (R3) rekonstruiert werden, in diesen zweiten Auflösungsebenen (R3) mit wenigstens einem ersten Ausgangsbild (LLH) und wenigstens einem zweiten Ausgangsbild (LLL) ein decodiertes Eingangsbild rekonstruiert wird.
  16. Verfahren zur Codierung und Decodierung einer Folge digitalisierter Bilder (0, ...., 7), umfassend ein Verfahren nach einem der Ansprüche 1 bis 13 und ein Verfahren nach Anspruch 14 oder 15.
  17. Codiervorrichtung zur Teilbandcodierung einer Folge digitalisierter Bilder (0, ...., 7), wobei die Codiervorrichtung derart ausgestaltet ist, dass ein Verfahren nach einem der Ansprüche 1 bis 13 durchführbar ist.
  18. Decodiervorrichtung zur Decodierung einer Folge von codierten Bildern, wobei die Decodiervorrichtung derart ausgestaltet ist, dass ein Verfahren nach Anspruch 14 oder 15 durchführbar ist.
  19. Vorrichtung zur Codierung und Decodierung einer Folge digitalisierter Bilder (0, ...., 7), umfassend die Codiervorrichtung nach Anspruch 17 und die Decodiervorrichtung nach Anspruch 18.
DE2003111054 2003-03-13 2003-03-13 Verfahren zur Teilbandcodierung einer Folge digitalisierter Bilder Expired - Fee Related DE10311054B4 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE2003111054 DE10311054B4 (de) 2003-03-13 2003-03-13 Verfahren zur Teilbandcodierung einer Folge digitalisierter Bilder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE2003111054 DE10311054B4 (de) 2003-03-13 2003-03-13 Verfahren zur Teilbandcodierung einer Folge digitalisierter Bilder

Publications (2)

Publication Number Publication Date
DE10311054A1 DE10311054A1 (de) 2004-09-30
DE10311054B4 true DE10311054B4 (de) 2005-03-31

Family

ID=32920779

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2003111054 Expired - Fee Related DE10311054B4 (de) 2003-03-13 2003-03-13 Verfahren zur Teilbandcodierung einer Folge digitalisierter Bilder

Country Status (1)

Country Link
DE (1) DE10311054B4 (de)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5923785A (en) * 1997-03-31 1999-07-13 Interated Systems, Inc. System and method for compressing data

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5923785A (en) * 1997-03-31 1999-07-13 Interated Systems, Inc. System and method for compressing data

Also Published As

Publication number Publication date
DE10311054A1 (de) 2004-09-30

Similar Documents

Publication Publication Date Title
DE69726661T2 (de) Verfahren und vorrichtung zur kodierung eines digitalen informationssignales
DE69633129T2 (de) Waveletbaum-bildcoder mit überlappenden bildblöcken
EP1815690A1 (de) Verfahren zur transcodierung sowie transcodiervorrichtung
DE19638632A1 (de) Verfahren und Vorrichtung zur Bildkodierung
EP1782634A1 (de) Verfahren und vorrichtung zum codieren und decodieren
DE10343220B3 (de) Verfahren und Vorrichtung zur Transcodierung eines Datenstroms, der ein oder mehrere codierte digitalisierte Bilder umfasst
DE69915843T2 (de) Teilbandkodierung/-dekodierung
EP2521357A1 (de) Verfahren und Vorrichtung zur Filterung von kodierten Bildpartitionen
EP1774790A1 (de) Verfahren und vorrichtung zum codieren und decodieren
EP0525900B1 (de) Filterschaltung zur Vorverarbeitung eines Videosignals
DE19903605B4 (de) Verfahren zum Neuanordnen von Signalverlaufspacket-Koeffizienten
EP1425920A2 (de) Verfahren zur videocodierung und computerprogrammprodukt
DE10022520A1 (de) Verfahren zur örtlichen skalierbaren Bewegtbildcodierung
EP1101196B1 (de) Verfahren und anordnung zur bewegungsschätzung in einem digitalisierten bild mit bildpunkten
DE10311054B4 (de) Verfahren zur Teilbandcodierung einer Folge digitalisierter Bilder
EP1829378B1 (de) Bildencodierverfahren, sowie dazugehöriges bilddecodierverfahren, encodiervorrichtung und decodiervorrichtung
DE69630122T2 (de) Verfahren und Vorrichtung zur Vorfilterung von Videobildern
EP0336510B1 (de) Prädiktiver Standbildcodierer
DE10022262A1 (de) Verfahren und eine Anordnung zur Codierung bzw. Decodierung einer Folge von Bildern
EP0366919A2 (de) Zweidimensionales digitales Filter
EP0370315A2 (de) Einrichtung zur Codierung von Videosignalen
DE10219640A1 (de) Verfahren zum Codieren und Decodieren von Videosequenzen und Computerprogrammprodukt
EP0366976A2 (de) Transformationsschaltung
EP1304885A2 (de) Verfahren und Computerprogrammprodukt zur Codierung und Decodierung von Videosignalen
DE102004031407A1 (de) Verfahren zur Bildencodierung einer Folge von Originalbildern, sowie dazugehöriges Bilddecodierverfahren, Encodiervorrichtung und Decodiervorrichtung

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: H04N0007260000

Ipc: H04N0019000000