-
Die Erfindung betrifft ein Verfahren
zur skalierbaren Videocodierung eines Videobildsignals sowie einen
zugehörigen
Codec.
-
Für
viele Anwendungen sind heutzutage Videosignale in unterschiedlichen
Qualitätsstufen
bereitzustellen, denn in immer mehr Anwendungen ist es erforderlich,
codierte Videosequenzen so aufzubereiten, dass diese mit Geräten sehr
unterschiedlicher Leistungsfähigkeit
decodiert werden können. Beispiele
dafür sind:
- – Digitales
TV in mehreren Qualitätsstufen
für unterschiedliche
Empfänger
(Heim-TV-Geräte,
PC, Organizer, multimediafähige
Mobilfunkendgeräte);
- – Individuelle
Videodienste für
unterschiedliche Endgeräte
und Zugangsnetze (Breitband-Kabel, xDSL, ISDN, UMTS);
- – Pay-TV
und andere Videodienste für
unterschiedliche Gebührenklassen;
- – Verteildienste
für Videoinhalte
auf unterschiedlichen Endgeräten
und Netzen.
-
Anwendungsszenarien sind im besonderen mobile
Endgeräte,
auf denen Bildsequenzen, die eigentlich für Desktop-Applikationen codiert
wurden, wiedergebbar sein sollen. Auch Videokonferenzen zwischen
Teilnehmern mit Desktop und mobilen Endgeräten erfordern eine geschickte
Anpassung der Qualitätsstufen.
Darüber
hinaus ist es bei variabler Netzgüte (Bandbreite, Fehlerrate
etc.) hilfreich, mehrere Datenraten für Videoanwendungen bereitzustellen,
damit bei reduzierter Netzgüte
die Qualität
nur graduell abnimmt und wenigstens eine Mindestbildqualität eingehalten
werden kann.
-
Ein zunehmend wichtiges Szenario
stellen sogenannte Streaming-Applikationen dar. Hierbei stellt ein
Service-Provider (der auch eine private Einzelperson sein kann)
Videomaterial zum Abruf bereit. Ein Client fordert die komprimierten
Videodaten an, während
das decodierte Bildmaterial bereits dargestellt wird. Auch hierbei
muss der Provider sehr unterschiedlichen Kundenanforderungen Rechnung
tragen.
-
Prinzipiell erfordern solche Problemstellungen
skalierbare Codierverfahren. Solche Verfahren sind beispielsweise
in den Dokumenten [1] und [2] beschrieben. Bei diesen Verfahren
wird das Videobildsignal in unterschiedlichen Codierzweigen, die auch
als Layer bezeichnet werden, auf verschiedenen Qualitätsstufen
codiert. Hierbei wird bei niedriger Datenrate die Codierung in einem
Basislayer durchgeführt,
der eine Mindestqualität
für das
decodierte Videosignal gewährleistet.
Durch die Zuführung
des Videosignals zu sog. Enhancement-Layern, die auf einer höheren Auflösungsebene
codieren, kann die Bildqualität
des decodierten Videosignals stufenweise verbessert werden.
-
Es sind örtliche, zeitliche und SNR
(signal-to-noise ratio) skalierbare Codierverfahren bekannt. Allen
Verfahren ist gemeinsam, dass durch Variation bestimmter Codierparameter
die gleiche Bildsequenz bei verschiedenen Bitraten codiert wird. Im
Fall der SNR-Skalierung werden durch Variation der im Encoder durchgeführten Quantisierung
unterschiedliche Qualitätsstufen
und Bitraten erzielt. Bei örtlicher
Skalierbarkeit wird die Bildsequenz mit unterschiedlichen Ortsauflösungen (Bildgrößen) codiert.
Eine zeitliche Skalierung stellt die Bildsequenzen mit unterschiedlichen
Bildfrequenzen zur Verfügung.
Es sei darauf hingewiesen, dass durchaus beliebige Kombinationen
der drei Arten möglich
sind.
-
Bei skalierbaren Videocodierverfahren
wird üblicherweise
mittels Bewegungsschätzung
und Bewegungskompensation das zu codierende Videobildsignal prädiziert
und daraus ein Prädikti onsfehlersignal
bestimmt, das auf unterschiedlichen Auflösungsebenen codiert wird. Die
Bewegungsschätzung
und Bewegungskompensation erfordert einen Bildspeicher und wird
bei den bekannten Verfahren üblicherweise
in jeder Auflösungsebene
durchgeführt,
so dass eine Vielzahl von Bildspeichern benötigt wird.
-
Aus der Druckschrift [3] ist ein
Verfahren zur SNR-Skalierung bekannt, bei dem nur eine Bewegungsschätzung und
Bewegungskompensation für alle
Codierzweige durchgeführt
wird. Das Prädiktionsfehlersignal
wird bei diesem Verfahren gesondert in jedem Codierzweig ermittelt.
-
Aufgabe der vorliegenden Erfindung
ist es, ein skalierbares Videocodierverfahren zu schaffen, das gegenüber bekannten
Verfahren einfacher aufgebaut ist.
-
In dem erfindungsgemäßen Verfahren
zur skalierbaren Videocodierung wird in einem ersten Schritt ein
Prädiktionsfehlersignal
aus der Differenz eines Eingangssignals und eines mittels einer
Bewegungsschätzungs-Einrichtung
und einer Bewegungskompensations-Einrichtung ermittelten Prädiktionssignals
bestimmt. Das Prädiktionsfehlersignal
wird anschließend
transformiert, wodurch ein Transformationssignal erhalten wird.
Dieses Transformationssignal wird dann einer Mehrzahl von Codierzweigen
umfassend je einen Encoder zugeführt,
wobei in den Codierzweigen das Transformationssignal jeweils auf unterschiedlichen
Qualitätsstufen,
die insbesondere unterschiedliche Auflösungsqualitäten betreffen, unter Verwendung
von Quantisierungsparametern quantisiert wird und anschließend eine
Entropiecodierung durchgeführt
wird, wodurch auf den unterschiedlichen Qualitätsstufen quantisierte und entropiecodierte
Ausgangssignale (Di) erhalten werden. Ferner
wird ein in einem vorbestimmten Codierzweig quantisiertes Transformationssignal
mit der Bewegungsschätzungs-Einrichtung
und der Bewegungskompensations-Einrichtung rückgekoppelt.
-
Bei dem erfindungsgemäßen Verfahren
wird das Prädiktionsfehlersignal
nur einmal berechnet und für
alle Codierzweige verwendet. Somit ist das Verfahren gegenüber dem
in der Druckschrift [3] beschriebenen Verfahren deutlich vereinfacht,
da nicht in jedem Codierzweig eine Berechnung des Prädiktionsfehlersignals
durchgeführt
werden muss. Darüber hinaus
wird nur eine einzige Bewegungsschätzungs- und Bewegungskompensations-Einrichtung
benötigt, da
nur eine Bewegungsschätzung
und Bewegungskompensation für
alle Codierzweige durchgeführt wird.
Es kann somit auf die Implementierung einer Vielzahl von Bildspeichern
verzichtet werden.
-
In einer bevorzugten Ausführungsform
der Erfindung ist der Codierzweig, dessen quantisiertes Transformationssignal
rückgekoppelt
wird, der Codierzweig mit der höchsten
Qualitätsstufe.
Dies bedeutet, dass die Bewegungsschätzung und Bewegungskompensation
einheitlich für
alle Codierzweige auf der höchsten
Qualitätsstufe
durchgeführt
wird.
-
In einer vorteilhaften Ausführungsform
der Erfindung sind die Encoder untereinander derart verkoppelt,
dass in wenigstens einem Encoder quantisierte Differenzsignale von
Transformationssignalen einer Entropiecodierung unterzogen werden.
-
In einer besonders bevorzugten Ausführungsform
der Erfindung wird in wenigstens einem Codierzweig eine Entropiecodierung
der Differenz aus einem ersten quantisierten Transformationssignal
und einem zweiten quantisierten Transformationssignal durchgeführt, wobei
das erste quantisierte Transformationssignal das nach der Quantisierung
in dem Codierzweig erhaltene Transformationssignal ist und das zweite
quantisierte Transformationssignal durch eine Prädiktion des ersten guantisierten
Transformationssignals erhalten wird. Vorzugsweise wird die Prädiktion
mithilfe eines quantisierten Transformationssignals einer niedrigeren
als der für
das erste Transformationssignal verwendeten Qualitätsstufe durchgeführt. Diese
Ausführungsform
hat den hat den Vorteil, dass die Quan tisierungsparameter der unterschiedlichen
Auflösungsebenen
frei wählbar sind
und keinen Beschränkungen
hinsichtlich ihrer Werte unterliegen.
-
Das zweite Transformationssignal
wird hierbei vorzugsweise durch die Multiplikation des quantisierten
Transformationssignals der niedrigeren Qualitätsstufe mit einem Faktor zur
Anpassung des Transformationssignals der niedrigeren Qualitätsstufe
an das erste Transformationssignal erhalten. Der Faktor ist insbesondere
der Quotient aus den Quantisierungsparametern der niedrigeren und
der für
das erste Transformationssignal verwendeten Qualitätsstufe.
Hierdurch kann auf einfache Weise ein Wert für das erste Transformationssigna1
prädiziert
werden.
-
Da bei der Decodierung der codierten
Signale ebenfalls wieder eine Prädiktion
durchgeführt
wird, sollte sichergestellt werden, dass die Multiplikation des
Transformationssignals der niedrigeren Qualitätsstufe mit dem Faktor mit
einer vorgegebenen Genauigkeit erfolgt. Dies wird durch die Verwendung von
Festkommaarithmetik erreicht. Die Multiplikation erfolgt insbesondere
gemäß folgender
Gleichung:
wobei
n eine natürliche Zahl
ist,
i der Index für
die Qualitätsstufe
ist,
a
i der Faktor zur Anpassung des
Transformationssignals der niedrigeren Qualitätsstufe i-1 an das Transformationssignal
der Qualitätsstufe
i ist,
L
i–1 das Transformationssignal
der niedrigeren Qualitätsstufe
i-1 ist,
L
i' das mit a
i multiplizierte
Transformationssignal L
i–1 ist,
sign(x)
die Signumfunktion ist,
und [x] der Integerteil von x ist,
d.h. die größte ganze Zahl,
die kleiner gleich x ist.
-
Eine Decodierung von auf diese Weise
codierten Videosignalen erfolgt vorzugsweise, indem die codierten
Eingangssignale mit auf den unterschiedlichen Qualitätsstufen
quantisierten Videosignalen in jeweiligen Decodierzweigen einem
Verarbeitungsschritt umfassend eine separate Entropiedecodierung
und inverse Quantisierung unterzogen werden.
-
Der Verarbeitungsschritt läuft insbesondere derart
ab, dass in wenigstens einem Decodierzweig das nach der separaten
Entropiedecodierung erhaltene Signal zu einem Prädiktionssignal addiert wird, welches
durch eine Prädiktion
des im entsprechenden Encoder quantisierten Transformationssignals erhalten
wird, und die addierten Signale einer inversen Quantisierung zugeführt werden.
Die Prädiktion wird
hierbei vorzugsweise mit Hilfe des der inversen Quantisierung zugeführten Signals
einer niedrigeren als der in dem Decodierzweig verwendeten Qualitätsstufe
durchgeführt.
Um eine ordnungsgemäße Decodierung
zu gewährleisten,
läuft die
Prädiktion analog
zu der bei der Codierung durchgeführten Prädiktion ab, wobei das erste
Transformationssignal nunmehr das im entsprechenden Encoder quantisierte
Transformationssignal ist und das zweite Transformationssignal das
der inversen Quantisierung zugeführte
Signal der niedrigeren Qualitätsstufe
ist. In einer besonders bevorzugten Ausgestaltung wird ferner aus
den jeweils nach dem Verarbeitungsschritt erhaltenen Signalen ein
Signal ausgewählt
und das ausgewählte
Signal einer inversen Transformation unterzogen.
-
In einer weiteren Ausgestaltung der
Erfindung wird das erfindungsgemäße Codierverfahren mit
dem erfindungsgemäßen Decodierverfahren
zu einem gemeinsamen Verfahren kombiniert.
-
Die Erfindung betrifft neben den
oben beschriebenen Verfahren auch eine Vorrichtung zur skalierbaren
Videocodierung mit einer Mehrzahl von Encodern, denen jeweils ein
Eingangssignal mit Videobildinformation zugeführt wird, und durch die das Videosignal
auf unterschiedlichen Qualitätsstufen unter
Verwendung von Quantisierungsparametern quantisierbar und anschließend Entropie-codierbar ist,
wobei mit der Vorrichtung das erfindungsgemäße Verfahren zur skalierbaren
Videocodierung durchführbar
ist.
-
Ferner umfasst die Erfindung eine
Vorrichtung zur Decodierung von nach dem erfindungsgemäßen Codierverfahren
codierten Videosignalen, mit der das erfindungsgemäße Decodierverfahren durchführbar ist.
-
Darüber hinaus betrifft die Erfindung
einen Codec zur skalierbaren Videocodierung und Videodecodierung
mit einer Mehrzahl von Encodern, denen jeweils Videobildinformation
als Eingangssignal dient, und durch die das Videosignal auf unterschiedlichen
Qualitätsstufen
unter Verwendung von Quantisierungsparametern quantisierbar und
anschließend Entropiecodierbar
ist, sowie einer Mehrzahl von Decodern, durch die ein codiertes
Signal auf den unterschiedlichen Qualitätsstufen decodierbar ist, wobei der
Codec derart ausgestaltet ist, dass die erfindungsgemäßen Verfahren
zur Codierung und Decodierung von Videosignalen durchführbar sind.
-
Weitere Vorteile und Details der
Erfindung ergeben sich anhand von einem im Folgenden beschriebenen
vorteilhaften Ausführungsbeispiel
in Verbindung mit den Figuren.
-
Es zeigt:
-
1 ein
vereinfachtes Blockschaltbild eines hybriden Video-Encoders und
-Decoders nach dem Stand der Technik,
-
2 ein
Blockschaltbild einer Ausführungsform
der erfindungsgemäßen Vorrichtung
(Codec) aus drei Encodern und Decodern.
-
Bevor näher auf das Ausführungsbeispiel eingegangen
wird, sei hier noch kurz erwähnt,
was unter dem Ausdruck Codec zu verstehen ist: Ein „Codec", in der Literatur
auch als Coder/Decoder oder als Kompressions- und Dekompressionsalgorithmus bezeichnet,
codiert (synonym komprimiert) und decodiert (synonym dekomprimiert)
verschiedene Arten von Daten. Solche Codierung/Decodierung ist besonders
im Zusammenhang mit Daten notwendig, die ansonsten sehr viel Speicherplatz
und/oder Transmissionsbandbreite beanspruchen würden, wie zum Beispiel Video-
und Audiodaten. Allgemein gebräuchliche
Codecs sind solche, die digitale oder digitalisierte analoge Videosignale
in komprimierte Videodaten (z.B. MPEG) oder digitalisierte analoge oder
digitale Audiosignale in komprimierte Audiodaten (z.B. MP3, RealAudio)
umwandeln. Grundsätzlich
können
Codecs in Echtzeit (z.B. Kommunikation) oder auf Grundlage von Speicherdateien
(z.B. Streaming) verwendet werden.
-
Das erfindungsgemäße Verfahren zeichnet sich
dadurch aus, dass es auf dem hybriden Coderkonzept aufbaut, und
damit grundsätzlich
kompatibel zu existierenden Standards zur Videocodierung ist. Der
oft gemachte Einwurf, dass neue Verfahren nicht kompatibel zu existierenden
Verfahren sind, trifft hier nicht zu.
-
Die Darstellung gemäß 1 zeigt ein vereinfachtes
Blockschaltbild eines hybriden Videocoders.
-
Beim herkömmlichen skalierbaren Codierverfahren
mit n Qualitätsstufen
werden n solche Coder mit entsprechenden Quantisierungsparametern bzw.
anderweitigen Parametern benötigt.
-
In 1 bedeuten:
T:
Transformationseinheit (z.B. DCT, Integer-Transformation)
IT: Einheit zur
Durchführung
der inversen Transformation
Q: Quantisierer
IQ: Einheit
zur Durchführung
der inversen Quantisierung
EC: Entropiecoder
ED: Entropiedecoder
Sp:
Bildspeicher
MV: Bewegungsvektoren
MS: Bewegungsschätzer.
-
Das Grundprinzip des hybriden Coderkonzepts
besteht in der Codierung eines Prädiktionsfehlersignals, welches
sich aus der Differenz zwischen Eingangssignal und (quantisierter)
bewegungskompensierter Rekonstruktion des vorherigen Bildes ergibt.
Im Bezug auf die Berechnung der Prädiktion gibt es sehr viele
Varianten, denen allen die zeitliche Prädiktion gemeinsam ist. Es ist
allerdings auch möglich, dass
von bereits codierten Bildteilen innerhalb des selben Bildes prädiziert
wird.
-
Darüber hinaus erfolgt die Codierung
des Prädiktionsfehlers
vielfach nach Ausführung
einer Transformation zur Dekorrelation (Ausnutzen örtlicher
statistischer Abhängigkeiten).
Um die für
eine Videoübertragung
erforderlichen Kompressionsraten zu erzielen, werden entweder die
Intensitäten
des Prädiktionsfehlersignals
direkt im Ortsbereich oder aber die Transformationskoeffizienten
quantisiert und anschließend über eine
Entropiecodierung verlustlos komprimiert, sowie auf ein binäres Signal
abgebildet.
-
Die Darstellung nach 1 zeigt in diesem Zusammenhang auf der
linken Seite der gestrichelten Linie einen solchen Encoder, auf
der rechten Seite den zugehörigen
Decoder. Dem Encoder eingangsseitig beaufschlagte Videodaten durchlaufen eine Transformation
T und eine Quantisierung Q. Dieses Signal wird zum einen einem Entropiecodierer
EC zugeführt,
der einen komprimierten Videodatenstrom bereitstellt. Zum anderen
erfolgt Encoder intern eine inverse Quantisierung IQ und eine anschließende inverse
Transformation IT. Dieses Signal gelangt in einen Bildspeicher Sp,
dessen Ausgang einmal auf den Eingang rückgekoppelt ist, zum anderen
negativ auf den Eingang der Transformation T gelangt.
-
Der Bildspeicher Sp steuert einen
Bewegungsschätzer
ME, der seinerseits eingangsseitig mit den Videoeingangsdaten beaufschlagt
wird und Bewegungsvektoren MV bereitstellt zur Ansteuerung des Bildspeichers
SP im Encoder. Außerdem
werden diese Bewegungsvektoren auch zum Decoder übertragen und dienen dort ebenfalls
zur Ansteuerung eines decoderseitigen Bildspeichers Sp.
-
Decoderseitig erfolgt zunächst eine
Entropiedecodierung ED der komprimierten Videodaten, anschließend eine
inverse Quantisierung IQ und eine inverse Transformation IT. Die
so ermittelten decodierten Videodaten addiert mit den Daten des
Bildspeichers stellen den Ausgang des Decoders dar. Dieses Summensignal
wird außerdem
dem decoderseitigen Bildspeicher Sp zugeführt, dessen Ausgang auf den
Eingang des Addierers zurückgeführt ist.
-
Die Darstellung nach 2 zeigt nun eine neue Anordnung gemäß einer
Ausführungsform
der Erfindung, welche aus drei Codier- und Decodierzweigen mit Encodern
bzw. Decodern besteht, deren Signale miteinander verknüpft sind.
Die Anzahl der Encoder und damit auch die Anzahl der Decoder kann
allerdings variiert werden. Die drei Encoder, die auf der linken
Seite des Blockschaltbildes übereinander
angeordnet sind, erzeugen drei Datenströme D1, D2 und D3, die zum Decoder übertragen
werden.
-
Encoder 1 codiert die Videodaten
in einer niedrigen Qualitätsstufe,
Encoder 2 in mittlerer Qualitätsstufe und Encoder 3 in
hoher Qualitätsstufe.
-
Die Signale in 2 bedeuten:
X: Eingangsbildsignal
P:
Prädiktionsfehlersignal
P': transformiertes
Prädiktionsfehlersignal
Li: Repräsentant
des quantisierten Transformationssignals, i = 1; 2; 3
ai: die Faktoren, mit denen die Transformationssignale
Li multipliziert werden, i = 2; 3
Li': die Transformationssignale
multipliziert mit den Faktoren ai, i = 2;
3
Di': die der Entropiecodierung in jedem
Codierzweig zugeführten
Signale bzw. die decodierten Signale nach Durchführung der Entropiedecodierung.
XDi: die in jedem Decodierzweig nach Durchführung der
inversen Quantisierung erhaltenen Signale, i = 1; 2; 3
-
Das Eingangsbildsignal X wird zunächst einem
Bewegungsschätzer
ME (ME = Motion Estimation) zugeführt, der Bewegungsvektoren
MV (MV = Motion Vector) ermittelt. Die Bewegungsvektoren MV werden
einem Bewegungskompensator MC (MC = Motion Compensation) zugeführt, in
dem eine Bewegungskompensation durchgeführt wird. Der Bewegungsschätzer und
Bewegungskompensator werden von einem Bildspeicher FB (FB = Frame
Buffer) angesteuert. Das durch die Bewegungsschätzung und Bewegungskompensation
prädizierte
Signal wird negativ mit dem Eingangssignal X verknüpft, so
dass als Differenzsignal ein Prädiktionsfehlersignal
P erhalten wird. Ferner wird das prädizierte Signal auf den Eingang
des Bildspeichers FB rückgekoppelt. Das
Prädiktionsfehlersignal
wird anschließend
einer Transformation T unterzogen und das transformierte Prädiktionsfehlersignal
P' wird allen drei
Encodern zugeleitet. Dadurch, dass die Bewegungsschätzung und
Bewegungskompensation nicht mehr in den einzelnen Codierzweigen
durchgeführt
wird, ist auf der Codierseite nur noch ein einzelner Bewegungsschätzer, Bewegungskompensator
und Bildspeicher erforderlich, so dass der Aufbau des Codierers
weniger komplex ist.
-
In jedem Encoder erfolgt eine Quantisierung Qi , woraus die quantisierten Transformationssignale Li
erhalten werden. Das Signal Li wird nur bei Encoder 1 (niedrige
Qualitätsstufe)
direkt einer Entropiecodierung EC1 zugeführt wird,
aus der der erste komprimierte Datenstrom D1 resultiert.
-
Nur im Encoder 3 erfolgt
eine Rückführung von
L3 über
eine inverse Quantisierung IQ3 und inverse
Transformation IT an den Bildspeicher FB, wobei das rückgeführte Signal
am Eingang des Bildspeichers mit dem durch den Bewegungskompensator MC
ermittelten prädizierten
Signal gekoppelt wird.
-
Die quantisierten Transformationssignale
Li werden zu einer Prädiktion
verwendet, bei der das quantisierte Transformationssignal der nächsthöheren Auflösungsebene
prädiziert
wird. Hierzu wird das Signal L1 bzw. L2 mit dem Faktor a2 bzw,
a3 multipliziert, wobei dieser Faktor vorzugsweise
das Verhältnis
der Stufenhöhen
des Quantisierungen Q1 und Q2 bzw.
Q2 und Q3 ist. Es
werden somit Prädiktionssignale
L2' bzw.
L3' erzeugt,
die dann mit den Signalen L2 bzw. L3 verknüpft
werden. Die Verknüpfung
besteht darin, dass die Differenz D2' bzw. D3' zwischen
L2 und L2' bzw. L3 und L3' gebildet wird.
Diese Differenz wird dann den Entropiecodierungen EC2 bzw. EC3 unterworfen.
Da das Differenzsignal eine geringere Entropie als die quantisierten
Transformationssignale aufweist, ergibt sich eine gegenüber dem
Stand der Technik effizientere Codierung. Ferner sind die Quantisierer
der unterschiedlichen Qualitätsstufen keiner
Beschränkung
mehr unterworfen.
-
Bei der Multiplikation von Li-1 mit dem Faktor ai werden
die Transformationssignale vorzugsweise mit einer Integerzahl multipliziert
und einer nachfolgenden Rechtsschiebeoperation unterworfen. Diese Multiplikation
mit anschließender
Rechtsverschiebung wird auch decoderseitig eingesetzt, wodurch Driftprobleme
zwischen Encoder und Decoder vermieden werden.
-
Rechts der in 2 dargestellten strichpunktierten Linie
ist der Decoder dargestellt. Diesem Decoder werden die im Encoder
codierten Signale Di zugeführt.
Diese Signale werden jeweils Entropiedecodierungen EDi unterworfen,
so dass ausgangsseitig der Entropiedecodierungen die decodierten
Signale L1, D2' bzw. D3' erhalten werden.
Anschließend wird
das Signal L1 einer inversen Quantisierung IQ1 unterworfen,
wohingegen zu den Differenzsignalen D2' bzw. D3' wieder ein Prädiktionssignal
L2' bzw.
L3' hinzuaddiert
wird, welches analog zur Encoderseite durch Multiplikation des Signals
L1 bzw. L2 mit den Faktoren
a2 bzw. a3 erhalten
wurde. Als Ergebnis werden wiederum die quantisierten Transformationskoeffizienten
Li erhalten, die anschließend jeweils
einer inversen Quantisierung IQi unterworfen
werden. Schließlich
werden die resultierenden Signale XD1, XD2 und XD3 einem
Schalter S zugeführt, über welchen
die erwünschte
Qualitätsstufe
für das
decodierte Signal ausgewählt
wird. Das ausgewählte
Signal wird dann einer inversen Transformation IT unterworfen, und
anschließend
wird eine Bewegungskompensation MC in einer decoderseitigen Prädiktionsschleife
mit Bildspeicher FB durchgeführt.
-
Der Vorteil der Datenratenersparnis
ergibt sich nun daraus, dass nicht mehr wie bei dem herkömmlichen
skalierbaren Videocdierverfahren die quantisierten Transformationskoeffizienten,
die durch „Level" L repräsentiert
werden, einer Entropiecodierung unterzogen werden, sondern statt
dessen die quantisierten Differenzsignale Di', die eine geringere Entropie
aufweisen als die Level Li.
-
Das erfindungsgemäße Verfahren ist kompatibel
mit anwendungsspezifischen Videostandards, wie zum Beispiel MPEG2,
MPEG-4, H.263 (Quantisierung und Codierung der DCT-Koeffizienten
des Prädiktionsfehlersignals)
oder Videostandard H.26L (Quanti sierung und Codierung der IT-Koeffizienten (Integer-Transform) des Prädiktionsfehlersignals).
-
Literaturverzeichnis
-
- [1] ITU-T Rec. H.263 "Video
Coding for low bit rate communication", Annex O: "Temporal, SNR, and spatial scalability"
- [2] ISO/IEC JTC1/5C29/WG11 "Generic
coding of moving pictures and associated audio", ISO/IEC 13818-2 Draft International
Standard
- [3] DE 10121259 A1