DE10121259C2 - Optimale SNR-skalierbare Videocodierung - Google Patents

Optimale SNR-skalierbare Videocodierung

Info

Publication number
DE10121259C2
DE10121259C2 DE10121259A DE10121259A DE10121259C2 DE 10121259 C2 DE10121259 C2 DE 10121259C2 DE 10121259 A DE10121259 A DE 10121259A DE 10121259 A DE10121259 A DE 10121259A DE 10121259 C2 DE10121259 C2 DE 10121259C2
Authority
DE
Germany
Prior art keywords
prediction error
video
error signal
video coding
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE10121259A
Other languages
English (en)
Other versions
DE10121259A1 (de
Inventor
Andreas Hutter
Klaus Illgner
Robert Kutka
Juergen Pandel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE10121259A priority Critical patent/DE10121259C2/de
Priority to PCT/DE2001/004940 priority patent/WO2002054774A2/de
Priority to EP01984734A priority patent/EP1413142A2/de
Publication of DE10121259A1 publication Critical patent/DE10121259A1/de
Application granted granted Critical
Publication of DE10121259C2 publication Critical patent/DE10121259C2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

In immer mehr Anwendungen ist es erforderlich codierte Videosequenzen so aufzubereiten, daß diese mit Geräten sehr unterschiedlicher Leistungsfähigkeit decodiert werden können. Anwendungsszenarien sind im Besonderen mobile Endgeräte, auf denen Bildsequenzen, die eigentlich für Desktop-Applikationen codiert wurden, wiedergebbar sein sollen. Auch Videokonferenzen zwischen Teilnehmern mit Desktop und mobilen Endgeräten erfordern eine geschickte Anpassung. Hierbei ist die Information, daß ein Teilnehmer ein mobiler Teilnehmer ist, dem Sender/Initiator nicht notwendigerweise bekannt. Aus technischer Sicht muß in einem solchen Szenario eine schnelle Adaption der generierten bzw. übertragenen Bitrate an sehr unterschiedliche Übertragungsbandbreiten möglich sein (z. B. Übertragung im Festnetz im Gegensatz zu drahtloser Übertragung). Ein zunehmend wichtiger werdendes Szenario stellen sogenannte Streaming-Applikationen, sowohl im Festnetz als auch im drahtlosen Netz, dar. Hierbei stellt ein Service-Provider (der auch eine private Einzelperson sein kann) Videomaterial zum Abruf bereit. Der Client fordert die komprimierten Videodaten an, während gleichzeitig das decodierte Bildmaterial dargestellt wird. Auch hierbei muß der Provider sehr unterschiedlichen Kundenanforderungen Rechnung tragen.
Prinzipiell erfordern solche Problemstellungen skalierbare Codierverfahren. Senderseitig (serverseitig) wird nur ein einziger Bitstrom generiert, aus dem aber Bildsequenzen geringerer Qualität und/oder Auflösung decodiert werden können. Damit kann der Client (Empfänger) für Streaming- Applikationen entscheiden, welche Auflösungsqualität er empfangen möchte. Im Fall variierender Terminaleigenschaften decodiert der Client nur den relevanten Teil, der darstellbar ist. Im Bereich mobiler Applikationen mit zeitlich stark schwankenden Kanaleigenschaften ergibt sich die Möglichkeit einer sehr schnellen Adaption des Senders, bzw. eine elegante Schnittstelle für UEP (unequal error protection).
Grundsätzlich kann zwischen SNR, örtlicher und zeitlicher Skalierbarkeit unterschieden werden. Allen Verfahren gemeinsam ist, daß durch Variation bestimmter Codierparameter die gleiche Bildsequenz bei verschiedenen Bitraten codiert wird. Im Fall der SNR-Skalierung werden durch Variation der Quantisierung unterschiedliche Qualitätsstufen und Bitraten erzielt. Örtliche Skalierbarkeit beschreibt Verfahren, die die Bildsequenz mit unterschiedlichen Ortsauflösungen (Bildgrößen) codieren. Eine zeitliche Skalierbarkeit schließlich stellt die Bildsequenzen mit unterschiedlichen Bildfrequenzen zur Verfügung. Es sei darauf hingewiesen, daß durchaus beliebige Kombinationen der drei Arten möglich sind.
Skalierbare Videocodierverfahren wurden in der wissenschaftlichen Literatur bereits vielfach untersucht, allerdings häufig mit einer Ausrichtung auf bestehende oder in der Entwicklung befindliche Standards (MPEG-2, MPEG-4, H.263, H.26L). Auch wenn die Verfahren Eingang in die Standards gefunden haben, so finden diese Verfahren bislang keine breite Anwendung, da deren Performance (erzielbares peak signal to noise ratio (PSNR) bei gegebener Bitrate) sehr unbefriedigend ist. Eine sogenannte Simulcast-Codierung, bei der die gewünschten Bitströme mit unterschiedlich parametrisierten parallelen und unabhängig voneinander arbeitenden Codecs generiert werden, erreichen eine bessere Qualität bei gleicher Bitrate. Dies ist um so bemerkenswerter, als daß im Fall der Simulcast-Codierung eine nicht unerhebliche Redundanz zwischen den einzelnen Bitströmen erhalten bleibt.
Es ist Aufgabe dieser Erfindung ein Verfahren, entsprechende Programme und entsprechende Datenträger vorzuschlagen, die eine SNR-Skalierung erlauben und dennoch prinzipiell die gleiche Performance eines Unicast-Codecs erreichen.
Diese Aufgaben werden durch die in den Ansprüchen angegebenen Merkmale gelöst. Dabei definiert Anspruch 1 ein Verfahren zur SNR-skalierbaren Videocodierung, bei dem ein Eingangssignal mit Videobildinformation je einer Mehrzahl von Codecs zugeführt wird, die Codecs das Videosignal auf unterschiedlichen Auflösungsebenen mit unterschiedlicher Qualität quantisieren, wobei in jedem Codec eine Bewegungskompensation durchgeführt werden kann aufgrund von Bewegungsvektoren, die durch eine Bewegungsschätzung ermittelt werden, und die Codecs je ein Ausgangssignal mit auf den unterschiedlichen Auflösungsebenen quantisierten Videosignalen ausgeben. Die Erfindung ist dadurch gekennzeichnet, dass die Bewegungsschätzung nur auf der höchsten Qualitätsstufe stattfindet und zur Bewegungskompensation auf allen Auflösungsebenen dieselben geschätzten Bewegungsvektoren verwendet werden.
In einer bevorzugten Ausführung wird nur eine einzige Bewegungskompensation auf der höchsten Qualitätsstufe ausgeführt, die von den Codecs der niedrigeren Auflösungstufen mitverwendet wird.
Das Verfahren zeichnet sich dadurch aus, daß es auf dem hybriden Coderkonzept aufbaut, und damit grundsätzlich kompatibel zu existierenden Standards zur Videocodierung ist. Der oft gemachte Einwurf, daß neue Verfahren nicht kompatibel zu existierenden Verfahren sind, trifft hier nicht zu.
Das Grundprinzip des hybriden Coderkonzepts besteht in der Codierung eines Prädiktionsfehlersignals, welches sich aus der Differenz zwischen Eingangssignal und (quantisierter) bewegungskompensierter Rekonstruktion des vorherigen Bildes ergibt. Im Bezug auf die Berechnung der Prädiktion gibt es sehr viele Varianten, denen allen die zeitliche Prädiktion gemeinsam ist. Darüberhinaus erfolgt die Codierung des Prädiktionsfehlers vielfach nach Ausführung einer Transformation zur Dekorrelation (Ausnutzen örtlicher statistischer Abhängigkeiten). Um die für eine Videoübertragung erforderlichen Kompressionsraten zu erzielen, werden entweder die Intensitäten des Prädiktionsfehlersignals direkt im Ortsbereich oder aber die Transformationskoeffizienten quantisiert und anschließend über eine Entropiecodierung verlustlos komprimiert, sowie auf ein binäres Signal abgebildet.
Um eine optimale Codiereffizienz des skalierbaren Codecs im Vergleich zum Simulcast-Coder zu erzielen, müssen die Prädiktionsfehler der gröber quantisierenden Codecs im Prädiktionsfehler der höchsten Qualitätsstufe enthalten sein. Oder mit anderen Worten, durch sukzessive Quantisierung des Prädiktionsfehlers der höchsten Qualitätsstufe erhält man identisch die Prädiktionsfehler der niedrigeren Qualitätsstufen. Ein solcher Zusammenhang kann im Allgemeinen nicht garantiert werden, da durch Bewegungskompensation und Wahl der Quantisierung eine Abweichung zwischen dem quantisierten Prädiktionsfehlersignal einer geringeren Qualitätsstufe und dem korrespondierend quantisierten Prädiktionsfehlersignal der höchsten Qualitätsstufe entsteht. Verwendet der Sender zur Prädiktion ein anderes Signal als das, das der Empfänger rekonstruieren kann, so kommt es zu einer Abweichung der rekonstruierten Bilder zwischen Sender und Empfänger, die im allgemeinen als Drift bezeichnet wird.
Nach einer Weiterentwicklung wird zur Realisierung der Skalierbarkeit zunächst das am gröbsten quantisierte Prädiktionsfehlersignal codiert und zur Codierung der nächst besseren Auflösungsstufe ein Differenzsignal zwischen beiden Auflösungsstufen codiert. Vorteilhafterweise werden die Quantisierungsstufen der einzelnen Auflösungsebenen so gewählt, dass eine embedded quantization ensteht. Im Fall einer INTRA-Codierung, bei der keine zeitliche Prädiktion erfolgt, erreicht das vorgeschlagene Verfahren eine optimale Performance. Im Falle einer INTER-Codierung gemäß Fig. 2 bzw. 5 wird selbst dann, wenn die Bedingung, daß der Prädiktionsfehler der nächstniedrigeren Auflösungsebene gleich dem quantisierten Prädiktionsfehler der nächsthöheren Auflösungsebene sein soll, die zu übertragenen Differenzsignale aber embedded sind, eine nahe am Optimum liegende Performance erzielt.
Das Verfahren kann nicht nur im Ortsbereich (mit mehreren oder nur einer einzigen MC-Einheit), sondern prinzipiell auch im Spektralbereich verwendet werden. Dabei wird das Eingangssignal einer linearen Transformation unterzogen und das Prädiktionsfehlersignal im Spektralbereich quantisiert und codiert.
Das erfindungsgemäße Verfahren ist kompatibel mit anwendungsspezifischen Videostandards, wie zum Beispiel MPEG- 2, MPEG-4 oder H.263 (Quantisierung und Codierung der DCT- Koeffizienten des Prädiktionsfehlersignals) oder aber auf den Videostandard H.26L (Quantisierung und Codierung der ICT- Koeffizienten (Integer-Cosine-Transform) des Prädiktionsfehlersignals).
Kernpunkt der Erfindung ist, daß in einem hybriden Codierverfahren die Quantisierung des Prädiktionsfehlers identisch ist zur Differenz aus quantisiertem Eingangssignal und quantisiertem Prädiktionssignal (der mathematische Nachweis dafür kann von den Erfindern geliefert werden). Dieser Nachweis gelingt unter Annahmen, die den allgemeinen Fall nur geringfügig einschränken.
Dieses Prinzip läßt sich auf verschiedene Art und Weise in fundamental neuartige Realisierungen SNR-skalierbarer Videocodierverfahren umsetzen:
  • - Quantisierung im Ortsbereich mit mehreren ME/MC- Einheiten;
  • - Quanitisierung im Ortsbereich mit nur einer ME/MC- Einheit; (ME-MC auf einer beliebigen Auflösungsebene)
  • - Quantisierung im Bildbereich einer linearen Transformation;
  • - Quantisierung im Bildbereich einer linearen Transformation einschließlich Bewegungskompensation im Ortsbereich.
Die Besonderheit dieses Ansatzes besteht darin, daß jede Form der Realisierung für sich optimal (INTRA vollständig, INTER nahe am Optimum) in dem Sinne ist, daß sie die gleiche Perfomance wie die eines üblichen Unicast-Coders aufweist, darüberhinaus aber zusätzlich noch die Funktionalität der SNR-Skalierbarkeit bietet.
Der mathematische Nachweis gelang bislang für die ersten drei Verfahren. Details finden sich im folgenden Text.
Zuerst sollen die bislang identifizierten Realisierungen im Detail beschrieben werden. Dabei wird Bezug genommen auf die beiliegenden Zeichnungsfiguren.
Dabei zeigen
Fig. 1 ein strukturelles Ablaufdiagram eines Simulcast Coders.
Fig. 2 ein Struktur- und Ablaufdiagram eines optimal SNR- skalierbaren Video-Encoders der auf dem hybriden Coderkonzept basiert.
Fig. 3A, 3B und 3C zeigen die Strukturen der korrespondierenden Videodecoders für die einzelnen Ebenen.
Fig. 4 zeigt die Struktur des korrespondierenden vollständigen Videodecoders, der alle Auflösungen simultan decodieren und ausgeben kann.
Fig. 5 zeigt die Struktur eines optimal SNR-skalierbaren Codecs mit Quanitisierung im Ortsbereich und nur einer MC-Einheit.
Fig. 6 zeigt ein im Spektralbereich anwendbares SNR- skalierbares Codersystem inklusive einer Bewegungsschätzung und -kompensation im Ortsbereich.
Bevor auf die Ausführungsbeispiele eingegangen wird, sei hier noch kurz erwähnt, was unter dem Ausdruck Codec zu verstehen ist: Ein "Codec", in der Literatur auch als Coder/Decoder oder als Kompressions- und Dekompressionsalgorithmus bezeichnet, codiert (synonym komprimiert) und decodiert (synonym dekomprimiert) verschiedene Arten von Daten. Solche Codierung/Decodierung ist besonders im Zusammenhang mit Daten notwendig, die ansonsten sehr viel Speicherplatz oder Transmissionsbandbreite beanspruchen würden, wie zum Beispiel Video- und Sounddateien. Allgemein gebräuchliche Codecs sind solche die digitale oder digitalisierte analoge Videosignale in komprimierte Videodateien (z. B. MPEG) oder digitalisierte analoge oder digitale Soundsignale in Digitalsound (z. B. MP3, RealAudio) umwandeln. Grundsätzlich können Codecs in Echtzeit (streaming files oder Conferencing)oder auf Grundlage von Speicherdateien verwendet werden.
Zum besseren Verständnis und der Vollständigkeit halber sei hier kurz auf den Simulcast-Coder eingegangen. Grundsätzlich handelt es sich hierbei um N (drei sind in Fig. 1 dargestellt) vollkommen unabhängig operierende Codecs. Das Eingangssignal wird allen N Codecs zugeführt und codiert. Der wesentliche Unterschied ist die unterschiedlich starke Quanitiserung der Transformationskoeffizienten innerhalb der einzelnen Codecs.
Die Schätzung der Bewegungsvektoren selbst ist für die Parameterisierung der Codecs unter dem hier interessierenden Aspekt nicht von Bedeutung. Es sei nur darauf hingewiesen, daß innerhalb eines jeder Codecs eine unabhängige Schätzung durchgeführt wird, und damit die zur Kompensation eingesetzten Bewegungsvektorfelder unterschiedlich sein werden.
Das quantisierte Signal wird nach jedem Quantisierungsblock der Entropiecodierung (VLC - variable length coding) zur verlustlosen Codierung zugeführt. Der Unterschied zwischen den drei dargestellten VLC Signalen liegt in ihren jeweiligen Auflösungsdetails.
Unter Verwendung der eingangs erwähnten gefundenen mathematischen Zusammenhänge, läßt sich ein SNR-skalierbarer Videocodec (Fig. 2) aufbauen, der im Falle einer INTRA- Codierung eine optimale Performance und im Falle der INTER- Codierung eine nahe am Optimum liegende Performance unter den folgenden Voraussetzungen erzielt:
  • - Das Eingangssignal wird vor der Berechnung des Prädiktionsfehlers quantisiert.
  • - Die Bewegungsschätzung findet ausschließlich auf der höchsten Qualitätsstufe statt. Zur Bewegungskompensation werden auf allen Auflösungsebenen dieselben geschätzten Bewegungsvektoren verwendet. Durch diese Einschränkung entsteht in der Regel kein signifikanter Qualitätsverlust der niedrigeren Auflösungsstufen.
  • - Auf eine Transformation des Prädiktionsfehlersignals wird verzichtet. Durch Einsatz geschickter kontext-basierter Entropiecoderverfahren kann eine ähnlich gute Codiereffizient erreicht werden.
  • - Die Quantisierungsstufen der einzelnen Auflösungsebenen müssen so gewählt werden, daß eine sogenannte embedded quantization ensteht.
Zur Realisierung der Skalierbarkeit wird zunächst das am gröbsten quantisierte Prädiktionsfehlersignal codiert. Zur Codierung der nächst besseren Auflösungsstufe genügt es nun das Differenzsignal zwischen beiden Auflösungsstufen zu codieren.
Decoderseitig folgt daraus, daß das Prädiktionsfehlersignal sukzessive aus den decodierten Fehlersignalen geringerer Auflösung rekonstruiert wird. Anzumerken ist, daß eine vollständige Rekonstruktion des Bildes der niedrigeren Auflösungsstufen nicht erforderlich ist. Auch die Decodierung der Bewegungsvektoren ist nur einmal erforderlich.
Optimalität ist dadurch gegeben, daß das Prädiktionsfehlersignal einer gegebenen Auflösungsebene identisch ist zum Prädiktionsfehlersignal, das man erhält, wenn man das Prädiktionsfehlersignal der nächsthöheren Auflösungsebene mit dem Quantisierer der gegebenen Auflösungsebenen quantisiert.
In Fig. 3A wird die Struktur des korrespondierenden Video­ decoders für die grobe Auflösungsebene gezeigt. In Fig. 3B wird die Struktur des korrespondierenden Videodecoders für die nächsthöhere, medium Auflösungsebene gezeigt. In Fig. 3C werden alle drei Auflösungsebenen involviert.
Fig. 4 zeigt die Struktur des korrespondierenden vollständigen Videodecoders für alle Auflösungen.
Das vorherige Verfahren kann derart vereinfacht werden, daß nur noch eine Bewegungskompensation auf der höchsten Qualitätsstufe erforderlich ist. Die resultierende Struktur ist der in Fig. 5 dargestellte SNR-skalierbare Codec mit Quanitisierung im Ortsbereich und nur einer MC-Einheit. Die Optimalität bleibt dabei erhalten.
Die obigen Ausführungsbeispiele beziehen sich auf Konzepte, in denen Prädiktionsfehler im Ortsbereich codiert werden. Das Grundprinzip bleibt aber auch im Spektralbereich unter Verwendung einer beliebigen linearen Transformation gültig. Bleibt die Bewegungskompensation zunächst unberücksichtigt, ergibt sich das in Fig. 6 dargestellte optimale SNR- skalierbare Codersystem. Durch Simulationen durch die Erfinder konnte inzwischen nachgewiesen werden, daß das Verfahren grundsätzlich auch bei gleichzeitiger Anwendung der ICT und der Bewegungskompensation funktioniert.
Abkürzungsglossar
SNR signal to noise ratio
PSNR peak signal to noise ratio
UEP unequal error protection
VLC variable length code
MPEG moving picture experts group
ME motion estimation unit
MC motion compensation
DCT diskrete Cosinus-Transformation
ITC InterfaceCodingTable

Claims (9)

1. Verfahren zur SNR-skalierbaren Videocodierung bei dem ein Eingangssignal mit Videobildinformation je einer Mehrzahl (N) von Codecs zugeführt wird, die Codecs das Videosignal auf unterschiedlichen Auflösungsebenen (0, 1, 2, . . ., N - 1) mit unterschiedlicher Qualität quantisieren, wobei in jedem Codec eine Bewegungskompensation durchgeführt werden kann aufgrund von Bewegungsvektoren die durch eine Bewegungsschätzung ermittelt werden, und die Codecs je ein Ausgangssignal mit auf den unterschiedlichen Auflösungsebenen quantisierten Videosignalen ausgeben, dadurch gekennzeichnet dass die Bewegungsschätzung auf der höchsten Qualitätsstufe stattfindet und zur Bewegungskompensation auf allen Auflösungsebenen dieselben geschätzten Bewegungsvektoren verwendet werden.
2. Verfahren zur Videocodierung nach Anspruch 1, bei dem die Bewegungskompensation für alle Codecs gemeinsam nur auf der höchsten Qualitätsstufe durchgeführt wird.
3. Verfahren zur Videocodierung nach einem der Ansprüche 1 und 2, bei dem ein Prädiktionsfehlersignal errechnet wird und das Eingangssignal (g) mit dem Prädiktionsfehlersignal verknüpft wird.
4. Verfahren zur Videocodierung nach Anspruch 3, wobei auf eine Transformation des Prädiktionsfehlersignals verzichtet wird.
5. Verfahren zur Videocodierung nach Anspruch 3, wobei zur Realisierung der Skalierbarkeit zunächst das am gröbsten quantisierte Prädiktionsfehlersignal codiert wird und zur codierung der nächstbesseren Auflösungsstufe ein Differenzsignal zwischen beiden Auflösungsstufen codiert wird.
6. Verfahren zur Videocodierung nach einem der vorhergehenden Ansprüche, wobei die Quantisierungsstufen der einzelnen Auflösungsebenen so gewählt werden, dass eine embedded quantization ensteht.
7. Verfahren zur Videocodierung nach einem der vorhergehenden Ansprüche, wobei das Eingangssignal einer linearen Transformation unterzogen wird und das Prädiktionsfehlersignal im Spektralbereich quantisiert und codiert wird.
8. Codec zur Durchführung des Verfahrens nach einem der vorhergehenden Ansprüche, wobei das Prädiktionsfehlersignal mit Bezug auf den Videostandard MPEG-2, MPEG-4 oder H.263 mit diskreter Cosinus-Transformation berechnet wird.
9. Codec zur Durchführung des Verfahrens nach einem der Ansprüche 1-7, wobei das Prädiktionsfehlersignal mit Bezug auf den Videostandard H.26L durch einer Integer Cosine Transform (ICT) bestimmt wird.
DE10121259A 2001-01-08 2001-04-30 Optimale SNR-skalierbare Videocodierung Expired - Fee Related DE10121259C2 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE10121259A DE10121259C2 (de) 2001-01-08 2001-04-30 Optimale SNR-skalierbare Videocodierung
PCT/DE2001/004940 WO2002054774A2 (de) 2001-01-08 2001-12-28 Optimale snr-skalierbare videocodierung
EP01984734A EP1413142A2 (de) 2001-01-08 2001-12-28 Optimale snr-skalierbare videocodierung

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10100434 2001-01-08
DE10121259A DE10121259C2 (de) 2001-01-08 2001-04-30 Optimale SNR-skalierbare Videocodierung

Publications (2)

Publication Number Publication Date
DE10121259A1 DE10121259A1 (de) 2002-07-18
DE10121259C2 true DE10121259C2 (de) 2003-07-24

Family

ID=7669909

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10121259A Expired - Fee Related DE10121259C2 (de) 2001-01-08 2001-04-30 Optimale SNR-skalierbare Videocodierung

Country Status (1)

Country Link
DE (1) DE10121259C2 (de)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006042612A1 (de) * 2004-10-15 2006-04-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zum erzeugen einer codierten videosequenz und zum decodieren einer codierten videosequenz unter verwendung einer zwischen-schicht-restwerte-praediktion
JP2008517498A (ja) * 2004-10-15 2008-05-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 中間レイヤ動きデータ予測を用いて符号化されたビデオシーケンスを生成するための装置および方法
DE102004059978B4 (de) * 2004-10-15 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer codierten Videosequenz und zum Decodieren einer codierten Videosequenz unter Verwendung einer Zwischen-Schicht-Restwerte-Prädiktion sowie ein Computerprogramm und ein computerlesbares Medium

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5270813A (en) * 1992-07-02 1993-12-14 At&T Bell Laboratories Spatially scalable video coding facilitating the derivation of variable-resolution images
EP0687112A2 (de) * 1994-06-08 1995-12-13 Matsushita Electric Industrial Co., Ltd. Bildumsetzungsvorrichtung
EP0771119A2 (de) * 1995-10-27 1997-05-02 Kabushiki Kaisha Toshiba Videokodierungs- und -dekodierungsvorrichtung
DE19702048A1 (de) * 1996-02-22 1997-08-28 Ibm Skalierbarer Videocodierer gemäß MPEG2-Standard

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5270813A (en) * 1992-07-02 1993-12-14 At&T Bell Laboratories Spatially scalable video coding facilitating the derivation of variable-resolution images
EP0687112A2 (de) * 1994-06-08 1995-12-13 Matsushita Electric Industrial Co., Ltd. Bildumsetzungsvorrichtung
EP0771119A2 (de) * 1995-10-27 1997-05-02 Kabushiki Kaisha Toshiba Videokodierungs- und -dekodierungsvorrichtung
DE19702048A1 (de) * 1996-02-22 1997-08-28 Ibm Skalierbarer Videocodierer gemäß MPEG2-Standard

Also Published As

Publication number Publication date
DE10121259A1 (de) 2002-07-18

Similar Documents

Publication Publication Date Title
DE60031230T2 (de) Skalierbares videokodierungssystem und verfahren
DE69432142T2 (de) Verfahren und vorrichtung zur effizienten transkodierung
DE69535228T2 (de) Bildumsetzungsvorrichtung
DE69605117T2 (de) Verfahren zur aufteilung und kodierung von daten
DE69322079T2 (de) Videokoder mit zwei schichten
DE69524141T2 (de) Adaptiver Bildkodierer mit dynamischer Bitzuteilung
WO2006056531A1 (de) Verfahren zur transcodierung sowie transcodiervorrichtung
DE10204617B4 (de) Verfahren und Vorrichtungen zur Kompression und Dekompression eines Videodatenstroms
DE69321924T2 (de) Verfahren zum zwei-standard-kodieren von bildern, mit sehr niedriger datenrate und codierer/decodierer zur durchführung dieses verfahrens
DE3889939T2 (de) Verfahren und Mittel zur Kodierung und Dekodierung eines Bildsignals.
DE112015001531T5 (de) Datenkodierung und Dekodierung
WO2002054774A2 (de) Optimale snr-skalierbare videocodierung
DE10121259C2 (de) Optimale SNR-skalierbare Videocodierung
WO2006042612A1 (de) Vorrichtung und verfahren zum erzeugen einer codierten videosequenz und zum decodieren einer codierten videosequenz unter verwendung einer zwischen-schicht-restwerte-praediktion
DE10200901B4 (de) Effiziente Codierung von Videosignalen für skalierbare Simul-cast-Speicherung und -Übertragung sowie zugehöriger Codec
EP1285537B1 (de) Verfahren und eine anordnung zur codierung bzw. decodierung einer folge von bildern
DE69320571T2 (de) Verfahren zur kodierung von bildern mit sehr niedriger datenrate und kodierungsvorrichtung zur ausführung dieses verfahrens
DE69809619T2 (de) Adaptive Videosignalkompression
WO2003026310A2 (de) Effiziente videocodierung für skalierbare simul-cast-speicherung und -übertragung
EP1815689A1 (de) Codierverfahren und decodierverfahren, sowie codiervorrichtung und decodiervorrichtung
DE69216257T2 (de) Videosignalkodierer
WO2006108780A1 (de) Verfahren und vorrichtung zur reduktion eines quantisierungsfehlers
DE10243568A1 (de) Verfahren zur skalierbaren Videocodierung eines Videobildsignals sowie ein zugehöriger Codec
DE102004011422B4 (de) Vorrichtung und Verfahren zum Verarbeiten einer Gruppe von Bildern und Vorrichtung und Verfahren zum Verarbeiten eines Basisbildes und eines oder mehrerer Erweiterungsbilder
DE102004063902B4 (de) Computerprogramm mit einem Verfahren zum Verarbeiten einer Gruppe von Bildern und mit einem Verfahren zum Verarbeiten eines Basisbildes und eines oder mehrerer Erweiterungsbilder

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8304 Grant after examination procedure
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee