DE10243568A1 - Verfahren zur skalierbaren Videocodierung eines Videobildsignals sowie ein zugehöriger Codec - Google Patents

Verfahren zur skalierbaren Videocodierung eines Videobildsignals sowie ein zugehöriger Codec Download PDF

Info

Publication number
DE10243568A1
DE10243568A1 DE2002143568 DE10243568A DE10243568A1 DE 10243568 A1 DE10243568 A1 DE 10243568A1 DE 2002143568 DE2002143568 DE 2002143568 DE 10243568 A DE10243568 A DE 10243568A DE 10243568 A1 DE10243568 A1 DE 10243568A1
Authority
DE
Germany
Prior art keywords
signal
coding
transformation
decoding
quantized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE2002143568
Other languages
English (en)
Inventor
Peter Dipl.-Ing. Amon
Jürgen Dr.-Ing. Pandel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE2002143568 priority Critical patent/DE10243568A1/de
Publication of DE10243568A1 publication Critical patent/DE10243568A1/de
Ceased legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

In einem Verfahren zur skalierbaren Videocodierung wird in einem ersten Schritt ein Prädikationsfehlersignal aus der Differenz eines Eingangssignals und eines mittels einer Bewegungsschätzungs-Einrichtung und einer Bewegungskompensations-Einrichtung ermittelten Prädikationssignals bestimmt. Das Prädikationsfehlersignal wird anschließend transformiert, wodurch ein Transformationssignal erhalten wird. Dieses Transformationssignal wird dann einer Mehrzahl von Codierzweigen umfassend je einen Encoder zugeführt, wobei in den Codierzweigen das Transformationssignal jeweils auf unterschiedlichen Qualitätsstufen, unter Verwendung von Quantisierungsparametern quantisiert wird und anschließend eine Entropiecodierung durchgeführt wird, wodurch auf den unterschiedlichen Qualitätsstufen quantisierte und entropiecodierte Ausgangssignale (Di) erhalten werden. Ferner wird ein in einem vorbestimmten Codierzweig quantisiertes Transformationssignal mit der Bewegungsschätzungs-Einrichtung und der Bewegungskompensations-Einrichtung rückgekoppelt.

Description

  • Die Erfindung betrifft ein Verfahren zur skalierbaren Videocodierung eines Videobildsignals sowie einen zugehörigen Codec.
  • Für viele Anwendungen sind heutzutage Videosignale in unterschiedlichen Qualitätsstufen bereitzustellen, denn in immer mehr Anwendungen ist es erforderlich, codierte Videosequenzen so aufzubereiten, dass diese mit Geräten sehr unterschiedlicher Leistungsfähigkeit decodiert werden können. Beispiele dafür sind:
    • – Digitales TV in mehreren Qualitätsstufen für unterschiedliche Empfänger (Heim-TV-Geräte, PC, Organizer, multimediafähige Mobilfunkendgeräte);
    • – Individuelle Videodienste für unterschiedliche Endgeräte und Zugangsnetze (Breitband-Kabel, xDSL, ISDN, UMTS);
    • – Pay-TV und andere Videodienste für unterschiedliche Gebührenklassen;
    • – Verteildienste für Videoinhalte auf unterschiedlichen Endgeräten und Netzen.
  • Anwendungsszenarien sind im besonderen mobile Endgeräte, auf denen Bildsequenzen, die eigentlich für Desktop-Applikationen codiert wurden, wiedergebbar sein sollen. Auch Videokonferenzen zwischen Teilnehmern mit Desktop und mobilen Endgeräten erfordern eine geschickte Anpassung der Qualitätsstufen. Darüber hinaus ist es bei variabler Netzgüte (Bandbreite, Fehlerrate etc.) hilfreich, mehrere Datenraten für Videoanwendungen bereitzustellen, damit bei reduzierter Netzgüte die Qualität nur graduell abnimmt und wenigstens eine Mindestbildqualität eingehalten werden kann.
  • Ein zunehmend wichtiges Szenario stellen sogenannte Streaming-Applikationen dar. Hierbei stellt ein Service-Provider (der auch eine private Einzelperson sein kann) Videomaterial zum Abruf bereit. Ein Client fordert die komprimierten Videodaten an, während das decodierte Bildmaterial bereits dargestellt wird. Auch hierbei muss der Provider sehr unterschiedlichen Kundenanforderungen Rechnung tragen.
  • Prinzipiell erfordern solche Problemstellungen skalierbare Codierverfahren. Solche Verfahren sind beispielsweise in den Dokumenten [1] und [2] beschrieben. Bei diesen Verfahren wird das Videobildsignal in unterschiedlichen Codierzweigen, die auch als Layer bezeichnet werden, auf verschiedenen Qualitätsstufen codiert. Hierbei wird bei niedriger Datenrate die Codierung in einem Basislayer durchgeführt, der eine Mindestqualität für das decodierte Videosignal gewährleistet. Durch die Zuführung des Videosignals zu sog. Enhancement-Layern, die auf einer höheren Auflösungsebene codieren, kann die Bildqualität des decodierten Videosignals stufenweise verbessert werden.
  • Es sind örtliche, zeitliche und SNR (signal-to-noise ratio) skalierbare Codierverfahren bekannt. Allen Verfahren ist gemeinsam, dass durch Variation bestimmter Codierparameter die gleiche Bildsequenz bei verschiedenen Bitraten codiert wird. Im Fall der SNR-Skalierung werden durch Variation der im Encoder durchgeführten Quantisierung unterschiedliche Qualitätsstufen und Bitraten erzielt. Bei örtlicher Skalierbarkeit wird die Bildsequenz mit unterschiedlichen Ortsauflösungen (Bildgrößen) codiert. Eine zeitliche Skalierung stellt die Bildsequenzen mit unterschiedlichen Bildfrequenzen zur Verfügung. Es sei darauf hingewiesen, dass durchaus beliebige Kombinationen der drei Arten möglich sind.
  • Bei skalierbaren Videocodierverfahren wird üblicherweise mittels Bewegungsschätzung und Bewegungskompensation das zu codierende Videobildsignal prädiziert und daraus ein Prädikti onsfehlersignal bestimmt, das auf unterschiedlichen Auflösungsebenen codiert wird. Die Bewegungsschätzung und Bewegungskompensation erfordert einen Bildspeicher und wird bei den bekannten Verfahren üblicherweise in jeder Auflösungsebene durchgeführt, so dass eine Vielzahl von Bildspeichern benötigt wird.
  • Aus der Druckschrift [3] ist ein Verfahren zur SNR-Skalierung bekannt, bei dem nur eine Bewegungsschätzung und Bewegungskompensation für alle Codierzweige durchgeführt wird. Das Prädiktionsfehlersignal wird bei diesem Verfahren gesondert in jedem Codierzweig ermittelt.
  • Aufgabe der vorliegenden Erfindung ist es, ein skalierbares Videocodierverfahren zu schaffen, das gegenüber bekannten Verfahren einfacher aufgebaut ist.
  • In dem erfindungsgemäßen Verfahren zur skalierbaren Videocodierung wird in einem ersten Schritt ein Prädiktionsfehlersignal aus der Differenz eines Eingangssignals und eines mittels einer Bewegungsschätzungs-Einrichtung und einer Bewegungskompensations-Einrichtung ermittelten Prädiktionssignals bestimmt. Das Prädiktionsfehlersignal wird anschließend transformiert, wodurch ein Transformationssignal erhalten wird. Dieses Transformationssignal wird dann einer Mehrzahl von Codierzweigen umfassend je einen Encoder zugeführt, wobei in den Codierzweigen das Transformationssignal jeweils auf unterschiedlichen Qualitätsstufen, die insbesondere unterschiedliche Auflösungsqualitäten betreffen, unter Verwendung von Quantisierungsparametern quantisiert wird und anschließend eine Entropiecodierung durchgeführt wird, wodurch auf den unterschiedlichen Qualitätsstufen quantisierte und entropiecodierte Ausgangssignale (Di) erhalten werden. Ferner wird ein in einem vorbestimmten Codierzweig quantisiertes Transformationssignal mit der Bewegungsschätzungs-Einrichtung und der Bewegungskompensations-Einrichtung rückgekoppelt.
  • Bei dem erfindungsgemäßen Verfahren wird das Prädiktionsfehlersignal nur einmal berechnet und für alle Codierzweige verwendet. Somit ist das Verfahren gegenüber dem in der Druckschrift [3] beschriebenen Verfahren deutlich vereinfacht, da nicht in jedem Codierzweig eine Berechnung des Prädiktionsfehlersignals durchgeführt werden muss. Darüber hinaus wird nur eine einzige Bewegungsschätzungs- und Bewegungskompensations-Einrichtung benötigt, da nur eine Bewegungsschätzung und Bewegungskompensation für alle Codierzweige durchgeführt wird. Es kann somit auf die Implementierung einer Vielzahl von Bildspeichern verzichtet werden.
  • In einer bevorzugten Ausführungsform der Erfindung ist der Codierzweig, dessen quantisiertes Transformationssignal rückgekoppelt wird, der Codierzweig mit der höchsten Qualitätsstufe. Dies bedeutet, dass die Bewegungsschätzung und Bewegungskompensation einheitlich für alle Codierzweige auf der höchsten Qualitätsstufe durchgeführt wird.
  • In einer vorteilhaften Ausführungsform der Erfindung sind die Encoder untereinander derart verkoppelt, dass in wenigstens einem Encoder quantisierte Differenzsignale von Transformationssignalen einer Entropiecodierung unterzogen werden.
  • In einer besonders bevorzugten Ausführungsform der Erfindung wird in wenigstens einem Codierzweig eine Entropiecodierung der Differenz aus einem ersten quantisierten Transformationssignal und einem zweiten quantisierten Transformationssignal durchgeführt, wobei das erste quantisierte Transformationssignal das nach der Quantisierung in dem Codierzweig erhaltene Transformationssignal ist und das zweite quantisierte Transformationssignal durch eine Prädiktion des ersten guantisierten Transformationssignals erhalten wird. Vorzugsweise wird die Prädiktion mithilfe eines quantisierten Transformationssignals einer niedrigeren als der für das erste Transformationssignal verwendeten Qualitätsstufe durchgeführt. Diese Ausführungsform hat den hat den Vorteil, dass die Quan tisierungsparameter der unterschiedlichen Auflösungsebenen frei wählbar sind und keinen Beschränkungen hinsichtlich ihrer Werte unterliegen.
  • Das zweite Transformationssignal wird hierbei vorzugsweise durch die Multiplikation des quantisierten Transformationssignals der niedrigeren Qualitätsstufe mit einem Faktor zur Anpassung des Transformationssignals der niedrigeren Qualitätsstufe an das erste Transformationssignal erhalten. Der Faktor ist insbesondere der Quotient aus den Quantisierungsparametern der niedrigeren und der für das erste Transformationssignal verwendeten Qualitätsstufe. Hierdurch kann auf einfache Weise ein Wert für das erste Transformationssigna1 prädiziert werden.
  • Da bei der Decodierung der codierten Signale ebenfalls wieder eine Prädiktion durchgeführt wird, sollte sichergestellt werden, dass die Multiplikation des Transformationssignals der niedrigeren Qualitätsstufe mit dem Faktor mit einer vorgegebenen Genauigkeit erfolgt. Dies wird durch die Verwendung von Festkommaarithmetik erreicht. Die Multiplikation erfolgt insbesondere gemäß folgender Gleichung:
    Figure 00050001
    wobei
    n eine natürliche Zahl ist,
    i der Index für die Qualitätsstufe ist,
    ai der Faktor zur Anpassung des Transformationssignals der niedrigeren Qualitätsstufe i-1 an das Transformationssignal der Qualitätsstufe i ist,
    Li–1 das Transformationssignal der niedrigeren Qualitätsstufe i-1 ist,
    Li' das mit ai multiplizierte Transformationssignal Li–1 ist,
    sign(x) die Signumfunktion ist,
    und [x] der Integerteil von x ist, d.h. die größte ganze Zahl, die kleiner gleich x ist.
  • Eine Decodierung von auf diese Weise codierten Videosignalen erfolgt vorzugsweise, indem die codierten Eingangssignale mit auf den unterschiedlichen Qualitätsstufen quantisierten Videosignalen in jeweiligen Decodierzweigen einem Verarbeitungsschritt umfassend eine separate Entropiedecodierung und inverse Quantisierung unterzogen werden.
  • Der Verarbeitungsschritt läuft insbesondere derart ab, dass in wenigstens einem Decodierzweig das nach der separaten Entropiedecodierung erhaltene Signal zu einem Prädiktionssignal addiert wird, welches durch eine Prädiktion des im entsprechenden Encoder quantisierten Transformationssignals erhalten wird, und die addierten Signale einer inversen Quantisierung zugeführt werden. Die Prädiktion wird hierbei vorzugsweise mit Hilfe des der inversen Quantisierung zugeführten Signals einer niedrigeren als der in dem Decodierzweig verwendeten Qualitätsstufe durchgeführt. Um eine ordnungsgemäße Decodierung zu gewährleisten, läuft die Prädiktion analog zu der bei der Codierung durchgeführten Prädiktion ab, wobei das erste Transformationssignal nunmehr das im entsprechenden Encoder quantisierte Transformationssignal ist und das zweite Transformationssignal das der inversen Quantisierung zugeführte Signal der niedrigeren Qualitätsstufe ist. In einer besonders bevorzugten Ausgestaltung wird ferner aus den jeweils nach dem Verarbeitungsschritt erhaltenen Signalen ein Signal ausgewählt und das ausgewählte Signal einer inversen Transformation unterzogen.
  • In einer weiteren Ausgestaltung der Erfindung wird das erfindungsgemäße Codierverfahren mit dem erfindungsgemäßen Decodierverfahren zu einem gemeinsamen Verfahren kombiniert.
  • Die Erfindung betrifft neben den oben beschriebenen Verfahren auch eine Vorrichtung zur skalierbaren Videocodierung mit einer Mehrzahl von Encodern, denen jeweils ein Eingangssignal mit Videobildinformation zugeführt wird, und durch die das Videosignal auf unterschiedlichen Qualitätsstufen unter Verwendung von Quantisierungsparametern quantisierbar und anschließend Entropie-codierbar ist, wobei mit der Vorrichtung das erfindungsgemäße Verfahren zur skalierbaren Videocodierung durchführbar ist.
  • Ferner umfasst die Erfindung eine Vorrichtung zur Decodierung von nach dem erfindungsgemäßen Codierverfahren codierten Videosignalen, mit der das erfindungsgemäße Decodierverfahren durchführbar ist.
  • Darüber hinaus betrifft die Erfindung einen Codec zur skalierbaren Videocodierung und Videodecodierung mit einer Mehrzahl von Encodern, denen jeweils Videobildinformation als Eingangssignal dient, und durch die das Videosignal auf unterschiedlichen Qualitätsstufen unter Verwendung von Quantisierungsparametern quantisierbar und anschließend Entropiecodierbar ist, sowie einer Mehrzahl von Decodern, durch die ein codiertes Signal auf den unterschiedlichen Qualitätsstufen decodierbar ist, wobei der Codec derart ausgestaltet ist, dass die erfindungsgemäßen Verfahren zur Codierung und Decodierung von Videosignalen durchführbar sind.
  • Weitere Vorteile und Details der Erfindung ergeben sich anhand von einem im Folgenden beschriebenen vorteilhaften Ausführungsbeispiel in Verbindung mit den Figuren.
  • Es zeigt:
  • 1 ein vereinfachtes Blockschaltbild eines hybriden Video-Encoders und -Decoders nach dem Stand der Technik,
  • 2 ein Blockschaltbild einer Ausführungsform der erfindungsgemäßen Vorrichtung (Codec) aus drei Encodern und Decodern.
  • Bevor näher auf das Ausführungsbeispiel eingegangen wird, sei hier noch kurz erwähnt, was unter dem Ausdruck Codec zu verstehen ist: Ein „Codec", in der Literatur auch als Coder/Decoder oder als Kompressions- und Dekompressionsalgorithmus bezeichnet, codiert (synonym komprimiert) und decodiert (synonym dekomprimiert) verschiedene Arten von Daten. Solche Codierung/Decodierung ist besonders im Zusammenhang mit Daten notwendig, die ansonsten sehr viel Speicherplatz und/oder Transmissionsbandbreite beanspruchen würden, wie zum Beispiel Video- und Audiodaten. Allgemein gebräuchliche Codecs sind solche, die digitale oder digitalisierte analoge Videosignale in komprimierte Videodaten (z.B. MPEG) oder digitalisierte analoge oder digitale Audiosignale in komprimierte Audiodaten (z.B. MP3, RealAudio) umwandeln. Grundsätzlich können Codecs in Echtzeit (z.B. Kommunikation) oder auf Grundlage von Speicherdateien (z.B. Streaming) verwendet werden.
  • Das erfindungsgemäße Verfahren zeichnet sich dadurch aus, dass es auf dem hybriden Coderkonzept aufbaut, und damit grundsätzlich kompatibel zu existierenden Standards zur Videocodierung ist. Der oft gemachte Einwurf, dass neue Verfahren nicht kompatibel zu existierenden Verfahren sind, trifft hier nicht zu.
  • Die Darstellung gemäß 1 zeigt ein vereinfachtes Blockschaltbild eines hybriden Videocoders.
  • Beim herkömmlichen skalierbaren Codierverfahren mit n Qualitätsstufen werden n solche Coder mit entsprechenden Quantisierungsparametern bzw. anderweitigen Parametern benötigt.
  • In 1 bedeuten:
    T: Transformationseinheit (z.B. DCT, Integer-Transformation)
    IT: Einheit zur Durchführung der inversen Transformation
    Q: Quantisierer
    IQ: Einheit zur Durchführung der inversen Quantisierung
    EC: Entropiecoder
    ED: Entropiedecoder
    Sp: Bildspeicher
    MV: Bewegungsvektoren
    MS: Bewegungsschätzer.
  • Das Grundprinzip des hybriden Coderkonzepts besteht in der Codierung eines Prädiktionsfehlersignals, welches sich aus der Differenz zwischen Eingangssignal und (quantisierter) bewegungskompensierter Rekonstruktion des vorherigen Bildes ergibt. Im Bezug auf die Berechnung der Prädiktion gibt es sehr viele Varianten, denen allen die zeitliche Prädiktion gemeinsam ist. Es ist allerdings auch möglich, dass von bereits codierten Bildteilen innerhalb des selben Bildes prädiziert wird.
  • Darüber hinaus erfolgt die Codierung des Prädiktionsfehlers vielfach nach Ausführung einer Transformation zur Dekorrelation (Ausnutzen örtlicher statistischer Abhängigkeiten). Um die für eine Videoübertragung erforderlichen Kompressionsraten zu erzielen, werden entweder die Intensitäten des Prädiktionsfehlersignals direkt im Ortsbereich oder aber die Transformationskoeffizienten quantisiert und anschließend über eine Entropiecodierung verlustlos komprimiert, sowie auf ein binäres Signal abgebildet.
  • Die Darstellung nach 1 zeigt in diesem Zusammenhang auf der linken Seite der gestrichelten Linie einen solchen Encoder, auf der rechten Seite den zugehörigen Decoder. Dem Encoder eingangsseitig beaufschlagte Videodaten durchlaufen eine Transformation T und eine Quantisierung Q. Dieses Signal wird zum einen einem Entropiecodierer EC zugeführt, der einen komprimierten Videodatenstrom bereitstellt. Zum anderen erfolgt Encoder intern eine inverse Quantisierung IQ und eine anschließende inverse Transformation IT. Dieses Signal gelangt in einen Bildspeicher Sp, dessen Ausgang einmal auf den Eingang rückgekoppelt ist, zum anderen negativ auf den Eingang der Transformation T gelangt.
  • Der Bildspeicher Sp steuert einen Bewegungsschätzer ME, der seinerseits eingangsseitig mit den Videoeingangsdaten beaufschlagt wird und Bewegungsvektoren MV bereitstellt zur Ansteuerung des Bildspeichers SP im Encoder. Außerdem werden diese Bewegungsvektoren auch zum Decoder übertragen und dienen dort ebenfalls zur Ansteuerung eines decoderseitigen Bildspeichers Sp.
  • Decoderseitig erfolgt zunächst eine Entropiedecodierung ED der komprimierten Videodaten, anschließend eine inverse Quantisierung IQ und eine inverse Transformation IT. Die so ermittelten decodierten Videodaten addiert mit den Daten des Bildspeichers stellen den Ausgang des Decoders dar. Dieses Summensignal wird außerdem dem decoderseitigen Bildspeicher Sp zugeführt, dessen Ausgang auf den Eingang des Addierers zurückgeführt ist.
  • Die Darstellung nach 2 zeigt nun eine neue Anordnung gemäß einer Ausführungsform der Erfindung, welche aus drei Codier- und Decodierzweigen mit Encodern bzw. Decodern besteht, deren Signale miteinander verknüpft sind. Die Anzahl der Encoder und damit auch die Anzahl der Decoder kann allerdings variiert werden. Die drei Encoder, die auf der linken Seite des Blockschaltbildes übereinander angeordnet sind, erzeugen drei Datenströme D1, D2 und D3, die zum Decoder übertragen werden.
  • Encoder 1 codiert die Videodaten in einer niedrigen Qualitätsstufe, Encoder 2 in mittlerer Qualitätsstufe und Encoder 3 in hoher Qualitätsstufe.
  • Die Signale in 2 bedeuten:
    X: Eingangsbildsignal
    P: Prädiktionsfehlersignal
    P': transformiertes Prädiktionsfehlersignal
    Li: Repräsentant des quantisierten Transformationssignals, i = 1; 2; 3
    ai: die Faktoren, mit denen die Transformationssignale Li multipliziert werden, i = 2; 3
    Li': die Transformationssignale multipliziert mit den Faktoren ai, i = 2; 3
    Di': die der Entropiecodierung in jedem Codierzweig zugeführten Signale bzw. die decodierten Signale nach Durchführung der Entropiedecodierung.
    XDi: die in jedem Decodierzweig nach Durchführung der inversen Quantisierung erhaltenen Signale, i = 1; 2; 3
  • Das Eingangsbildsignal X wird zunächst einem Bewegungsschätzer ME (ME = Motion Estimation) zugeführt, der Bewegungsvektoren MV (MV = Motion Vector) ermittelt. Die Bewegungsvektoren MV werden einem Bewegungskompensator MC (MC = Motion Compensation) zugeführt, in dem eine Bewegungskompensation durchgeführt wird. Der Bewegungsschätzer und Bewegungskompensator werden von einem Bildspeicher FB (FB = Frame Buffer) angesteuert. Das durch die Bewegungsschätzung und Bewegungskompensation prädizierte Signal wird negativ mit dem Eingangssignal X verknüpft, so dass als Differenzsignal ein Prädiktionsfehlersignal P erhalten wird. Ferner wird das prädizierte Signal auf den Eingang des Bildspeichers FB rückgekoppelt. Das Prädiktionsfehlersignal wird anschließend einer Transformation T unterzogen und das transformierte Prädiktionsfehlersignal P' wird allen drei Encodern zugeleitet. Dadurch, dass die Bewegungsschätzung und Bewegungskompensation nicht mehr in den einzelnen Codierzweigen durchgeführt wird, ist auf der Codierseite nur noch ein einzelner Bewegungsschätzer, Bewegungskompensator und Bildspeicher erforderlich, so dass der Aufbau des Codierers weniger komplex ist.
  • In jedem Encoder erfolgt eine Quantisierung Qi , woraus die quantisierten Transformationssignale Li erhalten werden. Das Signal Li wird nur bei Encoder 1 (niedrige Qualitätsstufe) direkt einer Entropiecodierung EC1 zugeführt wird, aus der der erste komprimierte Datenstrom D1 resultiert.
  • Nur im Encoder 3 erfolgt eine Rückführung von L3 über eine inverse Quantisierung IQ3 und inverse Transformation IT an den Bildspeicher FB, wobei das rückgeführte Signal am Eingang des Bildspeichers mit dem durch den Bewegungskompensator MC ermittelten prädizierten Signal gekoppelt wird.
  • Die quantisierten Transformationssignale Li werden zu einer Prädiktion verwendet, bei der das quantisierte Transformationssignal der nächsthöheren Auflösungsebene prädiziert wird. Hierzu wird das Signal L1 bzw. L2 mit dem Faktor a2 bzw, a3 multipliziert, wobei dieser Faktor vorzugsweise das Verhältnis der Stufenhöhen des Quantisierungen Q1 und Q2 bzw. Q2 und Q3 ist. Es werden somit Prädiktionssignale L2' bzw. L3' erzeugt, die dann mit den Signalen L2 bzw. L3 verknüpft werden. Die Verknüpfung besteht darin, dass die Differenz D2' bzw. D3' zwischen L2 und L2' bzw. L3 und L3' gebildet wird. Diese Differenz wird dann den Entropiecodierungen EC2 bzw. EC3 unterworfen. Da das Differenzsignal eine geringere Entropie als die quantisierten Transformationssignale aufweist, ergibt sich eine gegenüber dem Stand der Technik effizientere Codierung. Ferner sind die Quantisierer der unterschiedlichen Qualitätsstufen keiner Beschränkung mehr unterworfen.
  • Bei der Multiplikation von Li-1 mit dem Faktor ai werden die Transformationssignale vorzugsweise mit einer Integerzahl multipliziert und einer nachfolgenden Rechtsschiebeoperation unterworfen. Diese Multiplikation mit anschließender Rechtsverschiebung wird auch decoderseitig eingesetzt, wodurch Driftprobleme zwischen Encoder und Decoder vermieden werden.
  • Rechts der in 2 dargestellten strichpunktierten Linie ist der Decoder dargestellt. Diesem Decoder werden die im Encoder codierten Signale Di zugeführt. Diese Signale werden jeweils Entropiedecodierungen EDi unterworfen, so dass ausgangsseitig der Entropiedecodierungen die decodierten Signale L1, D2' bzw. D3' erhalten werden. Anschließend wird das Signal L1 einer inversen Quantisierung IQ1 unterworfen, wohingegen zu den Differenzsignalen D2' bzw. D3' wieder ein Prädiktionssignal L2' bzw. L3' hinzuaddiert wird, welches analog zur Encoderseite durch Multiplikation des Signals L1 bzw. L2 mit den Faktoren a2 bzw. a3 erhalten wurde. Als Ergebnis werden wiederum die quantisierten Transformationskoeffizienten Li erhalten, die anschließend jeweils einer inversen Quantisierung IQi unterworfen werden. Schließlich werden die resultierenden Signale XD1, XD2 und XD3 einem Schalter S zugeführt, über welchen die erwünschte Qualitätsstufe für das decodierte Signal ausgewählt wird. Das ausgewählte Signal wird dann einer inversen Transformation IT unterworfen, und anschließend wird eine Bewegungskompensation MC in einer decoderseitigen Prädiktionsschleife mit Bildspeicher FB durchgeführt.
  • Der Vorteil der Datenratenersparnis ergibt sich nun daraus, dass nicht mehr wie bei dem herkömmlichen skalierbaren Videocdierverfahren die quantisierten Transformationskoeffizienten, die durch „Level" L repräsentiert werden, einer Entropiecodierung unterzogen werden, sondern statt dessen die quantisierten Differenzsignale Di', die eine geringere Entropie aufweisen als die Level Li.
  • Das erfindungsgemäße Verfahren ist kompatibel mit anwendungsspezifischen Videostandards, wie zum Beispiel MPEG2, MPEG-4, H.263 (Quantisierung und Codierung der DCT-Koeffizienten des Prädiktionsfehlersignals) oder Videostandard H.26L (Quanti sierung und Codierung der IT-Koeffizienten (Integer-Transform) des Prädiktionsfehlersignals).
  • Literaturverzeichnis
    • [1] ITU-T Rec. H.263 "Video Coding for low bit rate communication", Annex O: "Temporal, SNR, and spatial scalability"
    • [2] ISO/IEC JTC1/5C29/WG11 "Generic coding of moving pictures and associated audio", ISO/IEC 13818-2 Draft International Standard
    • [3] DE 10121259 A1

Claims (18)

  1. Verfahren zur skalierbaren Videocodierung eines Videobildsignals mit den Verfahrensschritten: – Bestimmung eines Prädiktionsfehlersignals (P) aus der Differenz eines Eingangssignals (X) und eines mittels einer Bewegungsschätzungs-Einrichtung und einer Bewegungskompensations-Einrichtung (ME, MC, FB) ermittelten Prädiktionssignals; – Bestimmung eines Transformationssignals (P') durch Transformation des Prädiktionsfehlersignals (P); – Zuführen des Transformationssignals (P') zu einer Mehrzahl (i) von Codierzweigen umfassend je einen Encoder, wobei in den Codierzweigen das Transformationssignal (P') jeweils auf unterschiedlichen Qualitätsstufen (1, 2,..., i) unter Verwendung von Quantisierungsparametern (Qi) quantisiert wird und anschließend eine Entropiecodierung (ECi) durchgeführt wird, wodurch auf den unterschiedlichen Qualitätsstufen quantisierte und entropiecodierte Ausgangssignale (Di) erhalten werden; – Rückkopplung eines in einem vorbestimmten Codierzweig (3) nach der Quantisierung erhaltenen Transformationssignals (L3) mit der Bewegungsschätzungs-Einrichtung und der Bewegungskompensations-Einrichtung (ME, MC, FB) .
  2. Verfahren zur skalierbaren Videocodierung nach Anspruch 1, bei dem der Codierzweig, dessen quantisiertes Transformationssignal (L3) rückgekoppelt wird, der Codierzweig mit der höchsten Qualitätsstufe ist.
  3. Verfahren zur skalierbaren Videocodierung nach einem der vorhergehenden Ansprüche, bei dem die Encoder untereinander derart verkoppelt sind, dass in wenigstens einem Enco der quantisierte Differenzsignale (Di') von Transformationssignalen einer Entropiecodierung unterzogen werden.
  4. Verfahren zur skalierbaren Videocodierung nach einem der vorhergehenden Ansprüche, bei dem in wenigstens einem Codierzweig eine Entropiecodierung (ECi) der Differenz (Di') aus einem ersten quantisierten Transformationssignal (Li) und einem zweiten quantisierten Transformationssignal (Li') erfolgt, wobei das erste quantisierte Transformationssignal (Li) das nach der Quantisierung (Qi) in dem Codierzweig erhaltene Transformationssignal ist und das zweite quantisierte Transformationssignal (Li') durch eine Prädiktion des ersten quantisierten Transformationssignals (Li) erhalten wird.
  5. Verfahren zur skalierbaren Videocodierung nach Anspruch 4, bei dem die Prädiktion mithilfe eines quantisierten Transformationssignals (Li–1) einer niedrigeren als der für das erste Transformationssignal (Li) verwendeten Qualitätsstufe durchgeführt wird.
  6. Verfahren zur skalierbaren Videocodierung nach Anspruch 5, bei dem das zweite quantisierte Transformationssignal (Li') durch Multiplikation des quantisierten Transformationssignals (Li–1) der niedrigeren Qualitätsstufe (i-1) mit einem Faktor (ai) zur Anpassung des Transformationssignals (Li–1) der niedrigeren Qualitätsstufe (i-1) an das erste quantisierte Transformationssignal (Li) erhalten wird.
  7. Verfahren zur skalierbaren Videocodierung nach Anspruch 6, bei dem der Faktor (ai) der Quotient aus den Quantisierungsparametern (Qi–1, Qi) der niedrigeren und der für das erste Transformationssignal (Li) verwendeten Qualitätsstufe ist.
  8. Verfahren zur skalierbaren Videocodierung nach Anspruch 6 oder 7, bei dem bei der Multiplikation mit dem Faktor (ai) Festkommaarithmetik verwendet wird.
  9. Verfahren zur skalierbaren Videocodierung nach Anspruch 8, bei dem die Multiplikation mit Festkommaarithmetik gemäß folgender Gleichung erfolgt:
    Figure 00180001
    wobei n eine natürliche Zahl ist, i der Index für die Qualitätsstufe ist, ai der Faktor zur Anpassung des Transformationssignals der niedrigeren Qualitätsstufe i-1 an das Transformationssignal der Qualitätsstufe i ist, Li–1 das Transformationssignal der niedrigeren Qualitätsstufe i-1 ist, Li' das mit ai multiplizierte Transformationssignal Li–1 ist, sign(x) die Signumfunktion ist, und [x] der Integerteil von x ist, d.h. die größte ganze Zahl, die kleiner gleich x ist.
  10. Verfahren zur Decodierung von nach einem der vorhergehenden Ansprüche codierten Videosignalen, bei dem die codierten Eingangssignale (Di) mit auf den unterschiedlichen Qualitätsstufen quantisierten Videosignalen in jeweiligen Decodierzweigen einem Verarbeitungsschritt umfassend eine separate Entropiedecodierung (EDi) und inverse Quantisierung (IQi) unterzogen werden.
  11. Verfahren zur Decodierung nach Anspruch 10, bei dem der Verarbeitungsschritt derart abläuft, dass in wenigstens einem Decodierzweig das nach der separaten Entropiedecodierung (EDi) erhaltene Signal (Di') zu einem Prädiktionssignal (Li') addiert wird, welches durch eine Prädiktion des im entsprechenden Encoder quantisierten Transformationssignals (Li) erhalten wird, und die addierten Signale einer inversen Quantisierung (IQi) zugeführt werden.
  12. Verfahren zur Decodierung nach Anspruch 11, bei dem die Prädiktion mithilfe des der inversen Quantisierung zugeführten Signals (Li–1) einer niedrigeren als der in dem Decodierzweig verwendeten Qualitätsstufe durchgeführt wird.
  13. Verfahren zur Decodierung nach Anspruch 11 oder 12, bei dem die Prädiktion in gleicher Weise wie in einem der Ansprüche 4 bis 9 durchgeführt wird.
  14. Verfahren zur Decodierung nach einem der Ansprüche 10 bis 13, bei dem aus den jeweils nach dem Verarbeitungsschritt erhaltenen Signalen (XDi) ein Signal ausgewählt wird und das ausgewählte Signal einer inversen Transformation (IT) unterzogen wird.
  15. Verfahren zur skalierbaren Videocodierung und Videodecodierung, wobei eine Videocodierung nach einem der Ansprüche 1 bis 9 und eine Videodecodierung nach einem der Ansprüche 10 bis 14 erfolgt.
  16. Vorrichtung zur skalierbaren Videocodierung mit einer Mehrzahl (i) von Encodern, denen jeweils ein Eingangssignal mit Videobildinformation zugeführt wird, und durch die das Videosignal auf unterschiedlichen Qualitätsstufen (1, 2,..., i) unter Verwendung von Quantisierungsparame tern (Qi) quantisierbar (Q) und anschließend Entropiecodierbar ist, wobei die Vorrichtung derart ausgestaltet ist, dass ein Verfahren zur skalierbaren Videocodierung nach einem der Ansprüche 1 bis 9 durchführbar ist.
  17. Vorrichtung zur Videodecodierung mit einer Mehrzahl (i) von Decodern, denen jeweils ein Signal mit codierter Videobildinformation zugeführt wird, und durch die das Signal auf unterschiedlichen Qualitätsstufen (1, 2,..., i) decodierbar ist, wobei die Vorrichtung derart ausgestaltet ist, dass ein Verfahren zur Decodierung nach einem der Ansprüche 10 bis 14 durchführbar ist.
  18. Codec zur skalierbaren Videocodierung und Videodecodierung mit einer Mehrzahl (i) von Encodern, denen jeweils Videobildinformation als Eingangssignal dient, durch die das Videosignal auf unterschiedlichen Qualitätsstufen (1, 2,..., i) unter Verwendung von Quantisierungsparametern (Qi) quantisierbar (Q) und anschließend Entropiecodierbar ist, sowie einer Mehrzahl von Decodern, durch die ein codiertes Signal auf den unterschiedlichen Qualitätsstufen (1, 2,..., i) decodierbar ist, wobei der Codec derart ausgestaltet ist, dass ein Verfahren zur Codierung und Decodierung von Videosignalen nach Anspruch 15 durchführbar ist.
DE2002143568 2002-09-19 2002-09-19 Verfahren zur skalierbaren Videocodierung eines Videobildsignals sowie ein zugehöriger Codec Ceased DE10243568A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE2002143568 DE10243568A1 (de) 2002-09-19 2002-09-19 Verfahren zur skalierbaren Videocodierung eines Videobildsignals sowie ein zugehöriger Codec

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE2002143568 DE10243568A1 (de) 2002-09-19 2002-09-19 Verfahren zur skalierbaren Videocodierung eines Videobildsignals sowie ein zugehöriger Codec

Publications (1)

Publication Number Publication Date
DE10243568A1 true DE10243568A1 (de) 2004-01-29

Family

ID=29796636

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2002143568 Ceased DE10243568A1 (de) 2002-09-19 2002-09-19 Verfahren zur skalierbaren Videocodierung eines Videobildsignals sowie ein zugehöriger Codec

Country Status (1)

Country Link
DE (1) DE10243568A1 (de)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19702048A1 (de) * 1996-02-22 1997-08-28 Ibm Skalierbarer Videocodierer gemäß MPEG2-Standard
US6426974B2 (en) * 1994-06-08 2002-07-30 Matsushita Electric Industrial Co., Ltd. Image conversion apparatus for transforming compressed image data of different resolutions wherein side information is scaled

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6426974B2 (en) * 1994-06-08 2002-07-30 Matsushita Electric Industrial Co., Ltd. Image conversion apparatus for transforming compressed image data of different resolutions wherein side information is scaled
DE19702048A1 (de) * 1996-02-22 1997-08-28 Ibm Skalierbarer Videocodierer gemäß MPEG2-Standard

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Fernseh- und Kino-Technik, 48. Jg., Nr. 3/1994, S. 99-107 *

Similar Documents

Publication Publication Date Title
DE69432142T2 (de) Verfahren und vorrichtung zur effizienten transkodierung
DE60031230T2 (de) Skalierbares videokodierungssystem und verfahren
DE69524141T2 (de) Adaptiver Bildkodierer mit dynamischer Bitzuteilung
DE10190285B4 (de) Verfahren und System zur Verarbeitung von komprimierten Videosignalen
DE69607696T2 (de) Vorrichtung und verfahren zur transkodierung von videosignalen
EP0682454B1 (de) Verfahren und Vorrichtung zur Transcodierung von Bitströmen mit Videodaten
DE69605117T2 (de) Verfahren zur aufteilung und kodierung von daten
DE60027955T2 (de) Verfahren und Vorrichtung zur kontextbasierten Inter/Intra Kodierungsmodeauswahl
DE102016125353A1 (de) Kodierratensteuerung von echtzeitvideos unter verwendung einer dynamischen auflösungsumschaltung
WO2006056531A1 (de) Verfahren zur transcodierung sowie transcodiervorrichtung
DE69932429T2 (de) Verfahren und gerät für die inverse quantisierung von mpeg-4 video
EP1025708A1 (de) Verfahren und vorrichtung zur verarbeitung eines digitalisierten bildes
EP1472888B1 (de) Kontextsensitive kodierung und dekodierung eines videodatenstroms
DE69928494T2 (de) Videosignalkompression
EP1285537B1 (de) Verfahren und eine anordnung zur codierung bzw. decodierung einer folge von bildern
DE10200901B4 (de) Effiziente Codierung von Videosignalen für skalierbare Simul-cast-Speicherung und -Übertragung sowie zugehöriger Codec
WO2002054774A2 (de) Optimale snr-skalierbare videocodierung
DE10121259C2 (de) Optimale SNR-skalierbare Videocodierung
DE10243568A1 (de) Verfahren zur skalierbaren Videocodierung eines Videobildsignals sowie ein zugehöriger Codec
WO2003026310A2 (de) Effiziente videocodierung für skalierbare simul-cast-speicherung und -übertragung
DE10219640A1 (de) Verfahren zum Codieren und Decodieren von Videosequenzen und Computerprogrammprodukt
EP1869890A1 (de) Verfahren und vorrichtung zur reduktion eines quantisierungsfehlers
EP1913780B1 (de) Verfahren zum korrigieren eines quantisierten datenwerts sowie eine dazugehörige vorrichtung
EP1157557A1 (de) Verfahren und anordnung zur transformation eines bildbereichs
DE102004063902B4 (de) Computerprogramm mit einem Verfahren zum Verarbeiten einer Gruppe von Bildern und mit einem Verfahren zum Verarbeiten eines Basisbildes und eines oder mehrerer Erweiterungsbilder

Legal Events

Date Code Title Description
OAV Applicant agreed to the publication of the unexamined application as to paragraph 31 lit. 2 z1
OP8 Request for examination as to paragraph 44 patent law
8131 Rejection