WO2011023464A1 - Verfahren und vorrichtungen zum erzeugen, decodieren und transcodieren eines codierten videodatenstroms - Google Patents

Verfahren und vorrichtungen zum erzeugen, decodieren und transcodieren eines codierten videodatenstroms Download PDF

Info

Publication number
WO2011023464A1
WO2011023464A1 PCT/EP2010/060403 EP2010060403W WO2011023464A1 WO 2011023464 A1 WO2011023464 A1 WO 2011023464A1 EP 2010060403 W EP2010060403 W EP 2010060403W WO 2011023464 A1 WO2011023464 A1 WO 2011023464A1
Authority
WO
WIPO (PCT)
Prior art keywords
image block
coded
image
reconstructed
video data
Prior art date
Application number
PCT/EP2010/060403
Other languages
English (en)
French (fr)
Inventor
Wenrong Weng
Andreas Hutter
Original Assignee
Siemens Aktiengesellschaft
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Aktiengesellschaft filed Critical Siemens Aktiengesellschaft
Priority to US13/392,850 priority Critical patent/US20120155538A1/en
Priority to EP10739317A priority patent/EP2420064A1/de
Priority to CN201080036798.5A priority patent/CN102474616B/zh
Publication of WO2011023464A1 publication Critical patent/WO2011023464A1/de

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Definitions

  • the invention relates to methods and apparatus for generating, decoding and transcoding a coded video data stream.
  • a standard ITU H.264 / AVC Advanced Video Coding
  • AVC Advanced Video Coding
  • SVC Scalable Video Coding
  • the scaling can be configured locally, in time and as SNR (Signal to Noise Ratio) scalability.
  • the object is to provide a method and a device that enables a simple transcoding of an SVC-compliant coded video data stream into an AVC-compliant coded video data stream for local scalability.
  • This object is solved by the independent claims. Further developments of the invention can be found in the dependent claims.
  • the invention relates to a method for generating a coded video data stream, wherein
  • the coded video data stream comprises an image sequence coded by means of a first layer and by means of at least one second layer,
  • the first layer represents the image sequence with first images in a first image resolution and the second layer (L1, L2) represents the image sequence with second images in a second image resolution
  • the respective images each have a plurality of image blocks
  • one of the image blocks of the second images is encoded as an encoded first image block by means of an inter-layer prediction
  • a respective image block may occupy an arbitrary position within the associated image.
  • the reference to the reconstructed second image block can be changed.
  • the respective coding modes of image blocks to be coded refer to the reconstructed first image area instead of the reconstructed first image area by reference to the reconstructed second image blocks, thereby creating a transcoded video data stream of very low complexity, i. Computing power, and very low delay time is enabled.
  • the identifier is extended such that it displays at least one parameter which is used in the coding of the reconstructed first image block in the coded second image block.
  • the method can also be used for the case in which only one subscreen area is referenced. This enables an increase in coding efficiency.
  • an INTRA coding mode when generating the coded second image block, an INTRA coding mode, an INTRA prediction mode or a PCM coding method can be used.
  • the transcoding is considerably simplified since only references to image areas produced by decoding reconstructed second images.
  • the invention further relates to an apparatus for generating a coded video data stream, wherein
  • the encoded video data stream comprises an image sequence encoded by means of a first layer and by means of at least a second layer,
  • the image sequence with first images in a first image resolution is represented by the first layer and the image sequence with second images is represented by the second layer in a second image resolution
  • the respective images each have a plurality of image blocks
  • one of the image blocks of the second images is coded by means of an inter-layer prediction as the first coded image block
  • the apparatus may further comprise a fifth unit configured to encode one of the image blocks of the second images encoded by a coding mode that references the reconstructed first image block that is changed to the reconstructed second image block.
  • the fourth unit may be configured such that the identifier is expandable to indicate at least one parameter usable in encoding the reconstructed first image block into the coded second image block.
  • the fifth unit is further configured such that if the coding of the coded image block only refers to a partial area of the reconstructed first image block as a reference, an image area of the reconstructed second image block representing the partial image area is to be selected as the reference.
  • the fifth unit may be further configured such that an INTRA coding mode, an INTRA prediction mode or a PCM coding method is used in generating the coded second picture block.
  • part of the invention is a method for decoding a coded video data stream, wherein the coded video data stream is generated according to the method of generating, wherein the following steps are performed: Generating a reconstructed image block in the presence of the identifier in the encoded video data stream by decoding the encoded image block of the second layer which references the reconstructed first image block using as reference the reconstructed second image block for decoding.
  • a terminal may decode and encode the encoded video data stream comprising at least two layers at an output device, e.g. a display.
  • the invention also includes an apparatus for decoding a coded video data stream, wherein the coded video data stream is generated by the apparatus for generating a sixth unit configured to generate a reconstructed image block in the presence of the identifier in the coded video data stream by decoding the coded image block second layer which references the reconstructed first image block, wherein the reconstructed second image block can be used as a reference for decoding.
  • the method for decoding can be implemented by means of the sixth unit, the advantages being analogous to the method for decoding.
  • the invention comprises a method of generating a transcoded video data stream from a coded video data stream generated according to the method of generating in which, in the presence of the identifier in the encoded video data stream, the steps of:
  • the invention is possible to transcode the coded video data stream comprising at least two layers into a transcoded video data stream comprising a single layer. Due to the specific coding of the image blocks, which originally refer to the reconstructed first image block, the transcoded video data stream can be generated with very little effort. Furthermore, it is advantageous that a drift in the images of the transcoded video data stream is avoided by the specific steps.
  • part of the invention is a transcoding device for generating a transcoded video data stream from a coded video data stream which can be generated by the device for generating in which, if the identifier is present in the coded video data stream, the following steps are carried out:
  • FIG. 1 shows an image sequence that can be displayed in two image resolutions
  • Figure 2 is a flow chart and apparatus for generating a coded video data stream
  • FIG. 3 shows a section of a coded video data stream
  • Figure 4 is a flow chart and apparatus for decoding the encoded video data stream
  • Figure 5 is a flow chart and apparatus for transcoding a coded video data stream with two layers into a transcoded video data stream with a layer.
  • the first image resolution BA1 is represented by a first image sequence with first images PI1, P12, P13, which reduces the image sequence BS in a reduced manner.
  • the first image resolution BA1 is coded in two image resolutions BA1, BA2, ie quality grades Image resolution, for example in QCIF (QCIF - Quarter Common In termediate format) with 176x144 pixels.
  • this first image sequence is coded in a first layer L1, which is also referred to as the base layer.
  • a second image resolution BA2 which is improved with respect to the first image resolution BA1 is represented by a second image sequence with second images P21, P22, P23.
  • This second image sequence displays the images of the image sequence with a 352 ⁇ 288 pixels CIF (CIF) image size increased compared to the first image sequence.
  • CIF CIF
  • the image information of the second image sequence is stored in the coded video data stream in a second layer L2, which also serves as enhancement layer is coded. It should be noted that the image information of the second image sequence is often coded precedictively as a function of the first image sequence, as a result of which an amount of data of the second image sequence is coded
  • the second image sequence is reconstructed by decoding the first and second layers L1, L2.
  • the images PI1, P12, P13, P21, P22, P23 are divided into image blocks BB, BBl, for example, in a size of 4x4 or 8x8 pixels.
  • the image blocks can take any shape, with the sizes mentioned being used in the H.264 standard.
  • the images are coded block by block, whereby the coding results in a reduction in the amount of data.
  • INTRA an image block is coded without reference to at least one other image block
  • INTER prediction the coding of an image block of an image is done by prediction on an image area, wherein the
  • Image area is located in a past image or past image. This image area is referred to as a reference image area or reference RF. Furthermore, that is Image and the past or subsequent image both part of the first or second image sequence. A prediction between image information of the first and the second image sequence does not take place here.
  • INTERLAY Prediction the coding of an image block of an image is done by prediction on an image area, the image area, i. the reference is in a different image than the image block and the image and the other image are encoded in different layers.
  • a prediction between the layers, i. between the layers instead.
  • the image is part of the second image sequence and the other image is part of the first image sequence.
  • the standard H.264 uses the terms "interlayer-intra” and "interlayer-residual-predicted", which terms describe special INTER-layer prediction modes.
  • INTRA prediction the coding of an image block of an image is done by prediction on an image area, the image area, i. the reference is in the same picture as the picture block.
  • the INTER-layer prediction is used as the coding mode.
  • a reference image area can be found in one of the images of the first layer, an image size of the reference image block enlarged, for example.
  • a difference between the reference image area and the first image block as a difference signal, the difference signal by means of a DCT (DCT - discrete cosine transformation) and subsequent quantization in the form of a coded first image block CBl be coded.
  • the invention is applicable to any coding of the difference signal.
  • a first unit El In a first step S1, a first unit El generates a reconstructed first image block RBB1 by decoding the coded first image block CB1.
  • the decoding takes place in an inverse manner to the coding. Due to the quantization in the coding, there are differences between the first image block and the reconstructed first image block.
  • a coded second image block CB2 is generated by coding the reconstructed first image block RBB1 by a second unit E2.
  • the coding mode used can be the INTER prediction mode which, for example, takes into account as a reference image area an image area from an image of the second image sequence which precedes the second image in time.
  • a reconstructed second image block RBB2 is generated by decoding the coded second image block CB2 by a third unit E3.
  • the coded first image block CB1 and an identifier KEY are inserted into the coded video data stream VDS by a fourth unit E4, see also FIG. 3.
  • a fifth unit E5 encodes one of the picture blocks of one of the pictures of the second picture sequence by one of the coding modes which references the reconstructed first picture block, in this case the reconstructed second picture block is used as a reference instead of the reconstructed first picture block used. If a partial image region of the reconstructed first image block is referenced, the image region of the reconstructed second image block which uses the partial image region of the reconstructed second image block is used as a reference instead of this partial region. represents the first image block. If, for example, the subarea with 1x4 pixels in each dimension is enlarged (up-sampled) by a factor of two, the image area comprises 2x8 pixels.
  • the identifier KEY indicates that, when decoding a coded picture block CB of the second layer, which points to the reconstructed first picture block RBB1 as a reference picture block, the reconstructed second picture block RBB1 is not the reconstructed first picture block RBB1 as the reference RF
  • RBB2 is to be used. Analogously, use the identifier KEY for the subarea.
  • the identifier KEY may be extended to indicate parameters used in encoding the reconstructed first image block into the coded second image block. This includes, for example, the coding mode such as the INTER prediction coding, the quantization parameter and the motion vector which identifies the reference picture block used for the coding. This extension can be done by the fourth unit E4.
  • a device for decoding DVOR receives the encoded video data stream VDS and tries to find the identifier KEY in step EE. If this was detected, see arrow J, the coded first image block CB1 is read from the coded video data stream VDS and decoded by the first unit in the reconstructed first image block RBBl. By means of the second unit E2, the reconstructed first image block RBB1 is coded in the coded second image block CB2, wherein optionally parameters for carrying out this coding can be taken from the identifier KEY.
  • the encoded second image block CB2 is transferred by decoding into the reconstructed second image block RBB2. This reconstructed second image block serves as a reference image area RF for decoding the coded image block CB through a sixth unit into a reconstructed image block.
  • a transcoding device TVOR receives the coded video data stream VDS and analyzes the identifier the identifier KEY in step EE. If this was detected, see arrow J, the coded first image block CB1 is read from the coded video data stream VDS and decoded by the first unit in the reconstructed first image block RBBl. By means of the second unit E2, the reconstructed first image block RBB1 is coded in the coded second image block CB2, wherein optionally parameters for carrying out this coding can be taken from the identifier KEY.
  • a seventh unit E7 inserts into the transcoded video data stream TVDS the coded second image block CB2 and the coded image block CB.
  • the coded picture block CB has been coded by means of a coding mode which references the second picture block RBB2 reconstructed by decoding the coded second picture block CB2.
  • the encoded second image block CB2 is encoded by encoding the reconstructed first image block RBB1 using the
  • Prediction mode generated generated.
  • the INTRA coding mode instead of the INTER prediction mode, the INTRA coding mode, the INTRA prediction mode or a PCM (Pulse Code Modulation) coding method can be used.
  • This has the advantage that only the reconstructed first image block RBB1 must be taken into account for coding the encoded second image block CB2. This significantly reduces both a complexity and a storage volume for carrying out the respective method.
  • This alternative relates to the use of the identifier KEY, in which instead of the INTER prediction mode, the INTRA coding mode, the INTRA prediction mode or the PCM coding method is signaled, depending on which coding mode was used in the coding.
  • the units E1 to E7 may be implemented and executed in hardware, software, or a combination of hardware and software, such as a computer or processor with attached memory module. Furthermore, the method steps that execute these units can be stored in the form of a program code on a storage medium.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Die Erfindung betrifft Verfahren und Vorrichtungen zum Erzeugen, Decodieren und Transcodieren eines skalierbaren codierten Videodatenstroms. Hierbei wird ein Bildblock mittels einer INTER-Layer-Prädiktion in einen codierten ersten BiIdblock codiert. Der codierte erste Bildblock wird in einen rekonstruierten ersten Bildblock decodiert und dieser auf Basis eines Codiermodus, der eine INTER-Layer-Prädiktion ausschließt, in einen codierten zweiten Bildblock codiert. Schließlich wird der codierte zweite Bildblock in einen rekonstruierten zweiten Bildblock decodiert. Der codierte erste Bildblock wird in den codierten Videodatenstrom eingefügt. Bei der Codierung von Bildblöcken mittels eines der Codiermodi, der auf den rekonstruierten ersten Bildblock referenziert, wird die Referenz auf den rekonstruierten zweiten Bildblock geändert. Der hierbei codierte Bildblock wird in den codierten Videodatenstrom eingefügt. Durch diese Vorgehensweise wird erreicht, dass der codierte Videodatenstrom sowohl eine hohe Kompressionsrate bei hoher Bildqualität als auch eine gering Komplexität bei einer Transcodierung ermöglicht. Die Verfahren und Vorrichtungen sind einsetzbar für Anwendungen, die mittels des skalierbaren codierten Videodatenstroms eine Vielzahl von unterschiedlichen Endgeräten bedienen müssen, wie bspw. bei einem Video-on-Demand Service.

Description

Beschreibung
Verfahren und Vorrichtungen zum Erzeugen, Decodieren und Transcodieren eines codierten Videodatenstroms
Die Erfindung betrifft Verfahren und Vorrichtungen zum Erzeugen, Decodieren und Transcodieren eines codierten Videodatenstroms . Ein Standard ITU H.264/AVC (AVC - Advanced Video Coding) wurde kürzlich mit einer Ergänzung erweitert, die eine skalierbare Codierung einer Videosequenz ermöglicht. Diese Ergänzung ist als SVC (SVC - Scalable Video Coding) bekannt. Hierbei kann die Skalierung örtlich, zeitlich und als SNR- Skalierbarkeit (SNR - Signal to Noise Ratio) ausgestaltet sein .
Es existiert derzeit eine Vielzahl von Implementierungen des Standards H.264, die nur den AVC Teil des Standards unter- stützen. Daher müssen kodierte Videodatenströme, die mittels SVC codiert sind, in einen AVC-konformen codierten Videodatenstrom umgewandelt, d.h. transcodiert, werden. Eine bekannte Methode zur Transcodierung besteht darin, den SVC codierten Videodatenstrom vollständig zu decodieren und anschlie- ßend in einen AVC-konformen codierten Videodatenstrom zu codieren. Diese Vorgehensweise ist sehr komplex und zeitaufwendig. Daher wurde in den SVC eine Rewriter-Funktionalität aufgenommen, die eine einfache Transcodierung ermöglicht. Aus einem Dokument [1] ist beispielsweise eine Verbesserung Rew- riter-Funktionalität bekannt Die Rewriter-Funktionalität, wie beispielweise auch die Verbesserung gemäß [1], bezieht sich auf die SNR-Skalierbarkeit .
Die Aufgabe ist ein Verfahren und eine Vorrichtung anzugeben, die eine einfache Transcodierung eines SVC-konform codierten Videodatenstroms in einen AVC-konform codierten Videodatenstrom für örtliche Skalierbarkeit ermöglicht. Diese Aufgabe wird durch die unabhängigen Ansprüche gelöst. Weiterbildungen der Erfindung sind den abhängigen Ansprüchen zu entnehmen. Die Erfindung betrifft ein Verfahren zum Erzeugen eines codierten Videodatenstroms, wobei
der codierte Videodatenstrom eine Bildsequenz codiert mittels einer ersten Schicht und mittels zumindest einer zweiten Schicht umfasst,
- die erste Schicht die Bildsequenz mit ersten Bildern in einer ersten Bildauflösung und die zweite Schicht (Ll, L2) die Bildsequenz mit zweiten Bildern in einer zweiten Bildauflösung darstellen,
die jeweiligen Bilder jeweils eine Mehrzahl an Bildblöcken aufweisen,
einer der Bildblöcke der zweiten Bilder mittels einer In- ter-Layer Prädiktion als codierter erster Bildblock codiert ist,
bei dem folgende Schritte durchlaufen werden:
- Erzeugen eines rekonstruierten ersten Bildblocks durch Decodieren des codierten ersten Bildblocks;
Erzeugen eines codierten zweiten Bildblocks durch Codieren des rekonstruierten ersten Bildblocks auf Basis eines Codiermodus, der eine Inter-Layer Prädiktion unterbindet; - Erzeugen eines rekonstruierten zweiten Bildblocks durch Decodieren des codierten zweiten Bildblocks;
Einfügen des codierten ersten Bildblocks und einer Kennung in die zweite Schicht, wobei die Kennung anzeigt, dass bei der Codierung eines Bildblocks einer der zweiten Bilder in einen codierten Bildblock, dessen Codierung den rekonstruierten ersten Bildblock als Referenz anzeigt, als Referenz der rekonstruierte zweite Bildblock verwendet wird.
Durch die Codierung des Bildblocks mit der INTER-Layer- Prädiktion wird eine hohe Kompressionsrate erreicht. Durch den Einsatz des rekonstruierten zweiten Bildblocks als Referenzbildblock für weitere Bildblöcke eines der zweiten Bilder wird eine Codierung der weiteren Bildblöcke ohne Referenz auf Bilder der ersten Schicht erreicht, wodurch eine einfache Transcodierung des zumindest zwei Schichten umfassenden codierten Videodatenstroms in einen eine Schicht umfassenden transcodierten Videodatenstrom erzielbar ist, da die weiteren Bildblöcke in ihrer codierten Form, d.h. als codierte Bildblöcke, lediglich in den transcodierten Videodatenstrom kopiert werden müssen. Ferner wird durch die oben aufgezählten Verarbeitungsschritte erreicht, dass eine Drift in dem transcodierten Videodatenstrom unterbunden wird. Ein jeweiliger Bildblock kann eine beliebige Lage innerhalb des dazugehörigen Bildes einnehmen.
Zudem kann bei der Codierung einer der Bildblöcke der zweiten Bilder, der mittels eines Codiermodus kodiert wird, der auf den rekonstruierten ersten Bildblock referenziert, die Referenz auf den rekonstruierten zweiten Bildblock geändert werden. Dabei referenziert der jeweilige Codiermodi von zu codierenden Bildblöcken anstelle auf den rekonstruierten ersten Bildbereich mittels einer Referenz auf die rekonstruierten zweiten Bildblöcke, wodurch ein Erstellen des transcodierten Videodatenstrom mit sehr geringer Komplexität, d.h. Rechenleistung, und sehr geringer Verzögerungszeit ermöglicht wird.
In einer alternativen Weiterbildung der Erfindung wird die Kennung derart erweitert, dass sie zumindest einen Parameter anzeigt, der bei der Codierung des rekonstruierten ersten Bildblocks in den codierten zweiten Bildblock verwendet wird. Durch diese Erweiterung des Verfahrens wird eine Vereinfachung bei der Erstellung des codierten zweiten Bildblocks ge- währleistet, da Codierregeln direkt aus dem Parameter ablesbar sind.
Verzugsweise wird durch die Codierung des codierten Bildblocks nur auf einen Teilbereich des rekonstruierten ersten Bildblocks als Referenz verwiesen, so wird als Referenz ein Bildbereich des rekonstruierten zweiten Bildblocks ausgewählt, der den Teilbildbereich repräsentiert. Durch diese Weiterbildung kann das Verfahren auch für den Fall eingesetzt werden, bei dem nur ein Teilbildbereich referenziert wird. Dies ermöglicht eine Erhöhung der Codiereffizienz.
Ferner kann bei dem Erzeugen des codierten zweiten Bildblocks ein INTRA-Codiermodus, ein INTRA-Prädiktionsmodus oder ein PCM-Codierverfahren eingesetzt werden. Hierdurch wird die Transcodierung erheblich vereinfacht, da nur noch Referenzen auf Bildbereiche durch Decodierung erzeugter rekonstruierter zweiter Bilder vorliegen.
Die Erfindung betrifft des Weiteren eine Vorrichtung zum Erzeugen eines codierten Videodatenstroms, wobei
- der codierte Videodatenstrom eine Bildsequenz codiert mittels einer ersten Schicht und mittels zumindest einer zwei- ten Schicht umfasst,
- durch die erste Schicht die Bildsequenz mit ersten Bildern in einer ersten Bildauflösung und durch die zweite Schicht die Bildsequenz mit zweiten Bildern in einer zweiten Bildauflösung dargestellt ist,
- die jeweiligen Bilder jeweils eine Mehrzahl an Bildblöcken aufweisen,
- einer der Bildblöcke der zweiten Bilder mittels einer In- ter-Layer Prädiktion als erster codierter Bildblock codiert ist,
mit folgenden Einheiten:
- Eine erste Einheit zum Erzeugen eines rekonstruierten ersten Bildblocks durch Decodieren des codierten ersten Bildblocks;
- Eine zweite Einheit zum Erzeugen eines codierten zweiten Bildblocks durch Codieren des rekonstruierten ersten Bildblocks auf Basis eines Codiermodus, der eine Inter-Layer Prädiktion unterbindet;
- Eine dritte Einheit zum Erzeugen eines rekonstruierten zweiten Bildblocks durch Decodieren des codierten zweiten Bildblocks;
- Eine vierte Einheit zum Erzeugen der zweiten Schicht durch Einfügen des codierten ersten Bildblocks und einer Kennung, wobei die Kennung anzeigt, dass bei der Codierung eines Bildblocks einer der zweiten Bilder in einen codierten Bildblock, dessen Codierung den rekonstruierten ersten Bildblock als Referenz anzeigt, als Referenz der rekonstruierte zweite Bildblock zu verwenden ist.
Die Vorrichtung kann ferner eine fünfte Einheit aufweisen, die ausgestaltet ist zur Codierung einer der Bildblöcke der zweiten Bilder, der mittels eines Codiermodus kodiert wird, der auf den rekonstruierten ersten Bildblock referenziert, die auf den rekonstruierten zweiten Bildblock geändert ist.
Ferner kann die vierte Einheit derart ausgestaltet sein, dass die Kennung derart erweiterbar ist, dass sie zumindest einen Parameter anzeigt, der bei der Codierung des rekonstruierten ersten Bildblocks in den codierten zweiten Bildblock verwendbar ist.
Vorzugsweise ist die fünfte Einheit ferner derart ausgestaltet ist, dass falls die Codierung des codierten Bildblocks nur auf einen Teilbereich des rekonstruierten ersten Bildblocks als Referenz weist als Referenz ein Bildbereich des rekonstruierten zweiten Bildblocks auszuwählen ist, der den Teilbildbereich repräsentiert. In einer Erweiterung der Vorrichtung kann die fünfte Einheit ferner derart ausgestaltet ist, dass bei dem Erzeugen des codierten zweiten Bildblocks ein INTRA-Codiermodus, ein INTRA- Prädiktionsmodus oder ein PCM-Codierverfahren verwendet ist. Vorteile der einzelnen Ausgestaltungen der Vorrichtung sind analog zu den jeweiligen Vorteilen des Verfahrens. Mit Hilfe der Einheiten ist eine Realisierung des Verfahrens zum
Erstellen des codierten Videodatenstroms implementierbar. Ferner ist Teil der Erfindung ein Verfahren zum Decodieren eines codierten Videodatenstroms, wobei der codierte Videodatenstrom gemäß dem Verfahren zum Erzeugen erzeugt wird, bei dem folgende Schritte durchgeführt werden: Erzeugen eines rekonstruierten Bildblocks bei Vorhandensein der Kennung in dem codierten Videodatenstrom durch Decodieren des codierten Bildblocks der zweiten Schicht, der auf den rekonstruierten ersten Bildblock referenziert, wobei zum Deco- dieren als Referenz der rekonstruierte zweite Bildblock verwendet wird.
Hiermit ist ein Anwenden der Erfindung auch bei einer Deco- dierung des codierten Videodatenstroms möglich ohne eine Transcodierung durchführen zu müssen. So kann ein Endgerät den mindestens zwei Schichten umfassenden codierten Videodatenstrom decodieren und an einem Ausgabegerät, z.B. einem Display, wiedergeben. Auch umfasst die Erfindung eine Vorrichtung zum Decodieren eines codierten Videodatenstroms, wobei der codierte Videodatenstrom durch die Vorrichtung zum Erzeugen erzeugt ist, bei der eine sechste Einheit ausgebildet ist zum Erzeugen eines rekonstruierten Bildblocks bei Vorhandensein der Kennung in dem codierten Videodatenstrom durch Decodieren des codierten Bildblocks der zweiten Schicht, der auf den rekonstruierten ersten Bildblock referenziert, wobei zum Decodieren als Referenz der rekonstruierte zweite Bildblock verwendbar ist. Hierbei kann das Verfahren zum Decodieren mittels der sechsten Einheit implementiert werden, wobei die Vorteile analog zum Verfahren zum Decodieren sind.
Als weiteres umfasst die Erfindung ein Verfahren zum Erzeugen eines transcodierten Videodatenstroms aus einem codierten Videodatenstrom, der nach dem Verfahren zum Erzeugen erzeugt wird, bei dem bei Vorhandensein der Kennung in dem codierten Videodatenstrom folgende Schritte durchgeführt werden:
- Erzeugen eines rekonstruierten ersten Bildblocks durch De- codieren des codierten ersten Bildblocks;
- Erzeugen eines codierten zweiten Bildblocks durch Codieren des rekonstruierten ersten Bildblocks auf Basis eines Codiermodus, der eine Inter-Layer Prädiktion unterbindet; - Erzeugen des transcodierten Videodatenstroms durch Einfügen des codierten zweiten Bildblocks und eines codierten Bildblocks in den transcodierten Videodatenstrom, wobei der codierte Bildblock mittels eines Codiermodus codiert wurde, der auf den durch Decodierung des codierten zweiten Bildblocks rekonstruierten zweiten Bildblock referenziert .
Mittels dieser Verfahrensschritte ist die Erfindung auf eine Transcodierung des codierten Videodatenstroms umfassend zu- mindest zwei Schichten in einen transcodierten Videodatenstrom umfassend eine einzige Schicht möglich. Durch die spezifische Codierung der Bildblöcke, die ursprünglich den rekonstruierten ersten Bildblock referenzieren, kann mit sehr geringem Aufwand der transcodierte Videodatenstrom erzeugt werden. Ferner ist vorteilhaft, dass durch die spezifischen Schritte eine Drift in den Bildern des transcodierten Videodatenstroms vermieden wird.
Schließlich ist Teil der Erfindung eine Transcodiervorrich- tung zum Erzeugen eines transcodierten Videodatenstroms aus einem codierten Videodatenstrom, der durch die Vorrichtung zum Erzeugen erzeugbar ist, bei der bei Vorhandensein der Kennung in dem codierten Videodatenstrom folgende Schritte durchgeführt werden:
- Eine erste Einheit zum Erzeugen eines rekonstruierten ersten Bildblocks durch Decodieren des codierten ersten Bildblocks;
- Eine zweite Einheit zum Erzeugen eines codierten zweiten Bildblocks durch Codieren des rekonstruierten ersten BiId- blocks (RBBl) auf Basis eines Codiermodus, der eine Inter- Layer Prädiktion unterbindet;
- Eine siebte Einheit zum Erzeugen des transcodierten Videodatenstroms durch Einfügen des codierten zweiten Bildblocks und eines codierten Bildblocks in den transcodierten Video- datenstrom, wobei der codierte Bildblock mittels eines Codiermodus codiert wurde, der auf den durch Decodierung des codierten zweiten Bildblocks rekonstruierten zweiten Bildblock referenziert . Diese Transcodiervorrichtung ermöglicht eine Implementierung des Transcodierverfahrens, wobei mittels der genannten Einheiten einzelne Verfahrensschritte durchführbar sind. Die Vorteile sind dabei analog zum Transcodierverfahren.
Die Erfindung und ihre Weiterbildungen werden anhand von Figuren näher erläutert. Es zeigen: Figur 1 eine Bildsequenz, die in zwei Bildauflösungen darstellbar ist
Figur 2 ein Ablaufdiagramm und eine Vorrichtung zum Erzeugen eines codierten Videodatenstroms
Figur 3 ein Ausschnitt eines codierten Videodatenstroms
Figur 4 ein Ablaufdiagramm und eine Vorrichtung zum Decodieren des codierten Videodatenstroms
Figur 5 ein Ablaufdiagramm und eine Vorrichtung zum Trans- codieren eines codierten Videodatenstroms mit zwei Schichten in eine transcodierten Videodatenstrom mit einer Schicht.
Elemente mit gleicher Funktion und Wirkungsweise sind in den
Figuren mit denselben Bezugszeichen versehen.
Bei einem skalierbaren Videocodierverfahren, wie beispiels- weise dem Standard SVC (SVC - Scalable Video Coding) , der eine Erweiterung eines bestehenden Standards ITU-T H.264 (ITU - International Telecommunications Union) ist, wird eine Bildsequenz BS, die mehrere Bilder Pl, P2, P3 aufweist, in zwei Bildauflösungen BAl, BA2, d.h. Qualitätsstufen, codiert, sie- he Figur 1. Die erste Bildauflösung BAl wird durch eine erste Bildsequenz mit ersten Bildern PIl, P12, P13 repräsentiert, die die Bildsequenz BS in einer reduzierten Bildauflösung wiedergibt, beispielsweise in QCIF (QCIF - Quarter Common In- termediate Format) mit 176x144 Bildpunkten. In einem codierten Videodatenstrom VDS wird diese erste Bildsequenz in einer ersten Schicht Ll, die auch als Basis-Layer bezeichnet wird, codiert. Eine zweite, gegenüber der ersten Bildauflösung BAl verbesserte, Bildauflösung BA2 wird durch eine zweite Bildsequenz mit zweiten Bildern P21, P22, P23 repräsentiert. Diese zweite Bildsequenz stellt die Bilder der Bildsequenz mit einer gegenüber der ersten Bildsequenz erhöhten Bildgröße CIF (CIF - Common Intermediate Format) mit 352x288 Bildpunkten dar. Die Bildinformation der zweiten Bildsequenz wird in dem codierten Videodatenstrom in einer zweiten Schicht L2, die auch als Enhancement Layer bezeichnet wird, codiert. Hierbei ist anzumerken, dass die Bildinformation der zweiten Bildsequenz oftmals in Abhängigkeit von der ersten Bildsequenz prä- diktiv codiert wird, wodurch eine Datenmenge der zweiten
Schicht erheblich reduzierbar ist. Somit wird in der Praxis die zweite Bildsequenz durch Decodierung der ersten und zweiten Schicht Ll, L2 rekonstruiert. Die Bilder PIl, P12, P13, P21, P22, P23 werden in Bildblöcke BB, BBl bspw. in einer Größe von 4x4 oder 8x8 Bildpunkten aufgeteilt. Im Allgemeinen können die Bildblöcke beliebige Formen annehmen, wobei die genannten Größen in dem Standard H.264 verwendet werden. Mittels eines Videocoders werden die Bilder blockweise codiert, wobei durch die Codierung eine Reduktion der Datenmenge erreicht wird.
Bei der Codierung von Bildblöcken sind allgemein folgende vier Codiermodi bekannt:
INTRA: ein Bildblock wird ohne Referenz auf zumindest einen anderen Bildblock codiert;
INTER-Prädiktion : die Codierung eines Bildblocks eines Bildes erfolgt durch Prädiktion auf einen Bildbereich, wobei der
Bildbereich in einem zum Bild zeitlich zurückliegenden oder nachfolgenden Bild liegt. Dieser Bildbereich wird als Referenzbildbereich oder Referenz RF bezeichnet. Ferner sind das Bild und das zeitlich zurückliegende oder nachfolgende Bild beide entweder Teil der ersten oder zweiten Bildsequenz. Eine Prädiktion zwischen Bildinformationen der ersten und der zweiten Bildsequenz findet hierbei nicht statt.
INTER-Layer-Prädiktion (ILP) : die Codierung eines Bildblocks eines Bildes erfolgt durch Prädiktion auf einen Bildbereich, wobei der Bildbereich, d.h. die Referenz, in einem anderen Bild als der Bildblock liegt und das Bild und das andere Bild in verschiedenen Schichten codiert werden. Somit findet eine Prädiktion zwischen den Schichten, d.h. zwischen den Layern, statt. Beispielsweise ist das Bild Teil der zweiten Bildsequenz und das andere Bild Teil der ersten Bildsequenz. Der Standard H.264 benutzt die Begriffe „interlayer-intra" und „interlayer-residual-predicted", wobei diese Begriffe spezielle INTER-Layer-Prädiktionsmodi beschreiben.
INTRA-Prädiktion : die Codierung eines Bildblocks eines Bildes erfolgt durch Prädiktion auf einen Bildbereich, wobei der Bildbereich, d.h. die Referenz, in demselben Bild wie der Bildblock liegt.
Mit Hilfe von Figur 2 werden die Schritte zur Durchführung des Verfahrens zum Erzeugen des codierten Videodatenstroms, soweit es die Erfindung betrifft, beispielhaft erläutert.
Bei der Codierung des ersten Bildblocks BBl des zweiten Bildes P22 wird als Codiermodus die INTER-Layer-Prädiktion eingesetzt. So kann ein Referenzbildbereich in einem der Bilder der ersten Schicht gefunden, eine Bildgröße des Referenzbildblocks vergrößert, bspw. in vertikaler und horizontaler Richtung jeweils um den Faktor 2, eine Differenz zwischen dem Referenzbildbereich und dem ersten Bildblock als Differenzsignal gebildet, das Differenzsignal mittels einer DCT (DCT - Diskrete Cosinus Transformation) und anschließender Quantisierung in Form eines codierten ersten Bildblocks CBl codiert werden. Die Erfindung ist auf beliebige Codierungen des Differenzsignals anwendbar. In einem ersten Schritte Sl wird durch eine erste Einheit El ein rekonstruierter erster Bildblock RBBl durch Decodieren des codierten ersten Bildblocks CBl erzeugt. Die Dekodierung erfolgt dabei in inverser Weise zur Codierung. Aufgrund der Quantisierung bei der Codierung gibt es Unterschiede zwischen dem ersten Bildblock und dem rekonstruierten ersten Bildblock. In einem zweiten Schritt S2 wird durch eine zweite Einheit E2 ein codierter zweiter Bildblock CB2 durch Codieren des rekonstruierten ersten Bildblocks RBBl erzeugt. Hierbei ist darauf zu achten, dass zum Codieren nur diejenigen Codiermodi berücksichtigt werden, die keine INTER-Layer-Prädiktion ermög- liehen, also die INTER-Layer-Prädiktion unterbinden. So kann als Codiermodus der INTER-Prädiktionsmodus eingesetzt werden, der bspw. als Referenzbildbereich einen Bildbereich aus einem zum zweiten Bild zeitlich vorangehenden Bild der zweiten Bildsequenz berücksichtigt.
In einem dritten Schritt S3 wird durch eine dritte Einheit E3 ein rekonstruierter zweiter Bildblock RBB2 durch Decodieren des codierten zweiten Bildblocks CB2 generiert. In einem vierten Schritt S4 wird durch eine vierte Einheit E4 der codierte erste Bildblock CBl und eine Kennung KEY in den codierten Videodatenstrom VDS eingefügt, siehe auch Figur 3.
Wird in einem fünften Schritt S5 durch eine fünfte Einheit E5 einer der Bildblöcke eines der Bilder der zweiten Bildsequenz durch einen der Codiermodi codiert, welcher auf den rekonstruierten ersten Bildblock referenziert, so wird in diesem Fall anstelle des rekonstruierten ersten Bildblocks der rekonstruierte zweite Bildbildblock als Referenz verwendet. Wird ein Teilbildbereich des rekonstruierten ersten Bildblocks referenziert, so wird anstelle dieses Teilbereichs als Referenz derjenige Bildbereich des rekonstruierten zweiten Bildblocks benutzt, der den Teilbildbereich des rekonstruier- ten ersten Bildblocks repräsentiert. Wird bspw. der Teilbereich mit 1x4 Bildpunkten in jeder Dimension um einen Faktor zwei vergrößert (up-sampling) , so umfasst der Bildbereich 2x8 Bildpunkte .
Hierbei zeigt die Kennung KEY an, dass bei einer Decodierung eines codierten Bildblocks CB der zweiten Schicht, der als Referenzbildblock auf den rekonstruierten ersten Bildblock RBBl zeigt, als Referenz RF nicht der rekonstruierte erste Bildblock RBBl sondern der rekonstruierte zweite Bildblock
RBB2 zu verwenden ist. Analog die Kennung KEY für den Teilbereich anzuwenden.
Ferner kann die Kennung KEY derart erweitert werden, dass sie Parameter anzeigt, die bei der Codierung des rekonstruierten ersten Bildblocks in den codierten zweiten Bildblock verwendet worden sind. Dies umfasst bspw. den Codiermodus wie die INTER-Prädiktion-Codierung, den Quantisierungsparameter und den Bewegungsvektor, der den zur Codierung verwendeten Refe- renzbildblock identifiziert. Diese Erweiterung kann durch die vierte Einheit E4 erfolgen.
Mit Hilfe von Figur 4 wird im Folgenden ein Verfahren zum Decodieren näher erläutert. Hierbei empfängt eine Vorrichtung zum Decodieren DVOR den codierten Videodatenstrom VDS und versucht im Schritt EE die Kennung KEY zu finden. Falls diese erkannt wurde, siehe Pfeil J, wird der codierte erste Bildblock CBl aus dem codierten Videodatenstrom VDS ausgelesen und mittels der ersten Einheit in den rekonstruierten ersten Bildblock RBBl decodiert. Mittels der zweiten Einheit E2 wird der rekonstruierte erste Bildblock RBBl in den codierten zweiten Bildblock CB2 codiert, wobei optional Parameter zur Durchführung dieser Codierung aus der Kennung KEY entnehmbar sind. Der codierte zweite Bildblock CB2 wird durch Decodie- rung in den rekonstruierten zweiten Bildblock RBB2 überführt. Dieser rekonstruierte zweite Bildblock dient als Referenzbildbereich RF zur Decodierung des codierten Bildbocks CB durch eine sechste Einheit in einen rekonstruierten Bildblock.
Mit Hilfe von Figur 5 wird im Folgenden ein Verfahren zum Transcodierung des codierten Videodatenstroms VDS in den transcodierten Videodatenstrom TVDS näher erläutert. Hierbei empfängt eine Transcodiervorrichtung TVOR den codierten Videodatenstrom VDS und analysiert die Kennung die Kennung KEY im Schritt EE. Falls diese erkannt wurde, siehe Pfeil J, wird der codierte erste Bildblock CBl aus dem codierten Videodatenstrom VDS ausgelesen und mittels der ersten Einheit in den rekonstruierten ersten Bildblock RBBl decodiert. Mittels der zweiten Einheit E2 wird der rekonstruierte erste Bildblock RBBl in den codierten zweiten Bildblock CB2 codiert, wobei optional Parameter zur Durchführung dieser Codierung aus der Kennung KEY entnehmbar sind. Eine siebte Einheit E7 fügt in den transcodierten Videodatenstrom TVDS den codierten zweiten Bildblock CB2 und den codierten Bildblock CB ein. Der codierte Bildblock CB wurde mittels eines Codiermodus codiert, der auf den durch Decodierung des codierten zweiten Bildblocks CB2 rekonstruierten zweiten Bildblock RBB2 referenziert .
In den bisherigen Ausführungsbeispielen wird der codierte zweite Bildblock CB2 mittels Codieren des rekonstruierten ersten Bildblocks RBBl unter Verwendung des INTER-
Prädiktionsmodus erzeugt. Alternativ kann anstelle des INTER- Prädiktionsmodus der INTRA-Codiermodus, der INTRA- Prädiktionsmodus oder ein PCM-Codierverfahren (PCM - Pulse Code Modulation) eingesetzt werden. Dies hat den Vorteil, dass zur Codierung des codierten zweiten Bildblocks CB2 nur der rekonstruierte erste Bildblock RBBl in Betracht gezogen werden muss. Dies reduziert sowohl eine Komplexität als auch ein Speichervolumen zur Durchführung des jeweiligen Verfahrens erheblich. Diese Alternative betrifft den Einsatz der Kennung KEY, bei der anstelle des INTER-Prädiktionsmodus der INTRA-Codiermodus, der INTRA-Prädiktionsmodus oder das PCM- Codierverfahren signalisiert wird - je nachdem, welcher Codiermodus bei der Codierung verwendet wurde. Die Einheiten El bis E7 können in Hardware, Software oder in einer Kombination aus Hard- und Software implementiert und ausgeführt werden, wie bspw. durch einen Rechner oder einen Prozessor mit angefügtem Speichermodul. Ferner können die Verfahrensschritte, die diese Einheiten ausführen in Form eines Programmcodes auf einem Speichermedium abgelegt werden.
Die einzelnen Ausführungsbeispiele sind kombinierbar.
Literaturangäbe
[1] Jan De Cock et al . , „Advanced Bistream Rewriting From H.264/AVC to SVC", ICIP 2008, p. 2472-2475

Claims

Patentansprüche
1. Verfahren zum Erzeugen eines codierten Videodatenstroms (VDS), wobei
- der codierte Videodatenstrom (VDS) eine Bildsequenz (BS) codiert mittels einer ersten Schicht (Ll) und mittels zumindest einer zweiten Schicht (L2) umfasst,
- die erste Schicht (Ll) die Bildsequenz (BS) mit ersten Bildern (PIl, P12, P13) in einer ersten Bildauflösung (BAl) und die zweite Schicht (Ll, L2) die Bildsequenz (BS) mit zweiten Bildern (P21, P22, P23) in einer zweiten Bildauflösung (BA2) darstellen,
- die jeweiligen Bilder (PIl, P12, P13, P21, P22, P23) jeweils eine Mehrzahl an Bildblöcken (BB) aufweisen,
- einer der Bildblöcke (BBl) der zweiten Bilder mittels einer Inter-Layer Prädiktion als codierter erster Bildblock (CBl) codiert ist,
bei dem folgende Schritte durchlaufen werden:
- Erzeugen eines rekonstruierten ersten Bildblocks (RBBl) durch Decodieren des codierten ersten Bildblocks (CBl);
- Erzeugen eines codierten zweiten Bildblocks (CB2) durch Codieren des rekonstruierten ersten Bildblocks (RBBl) auf Basis eines Codiermodus (IAP, IRP), der eine Inter-Layer Prädiktion (ILP) unterbindet;
- Erzeugen eines rekonstruierten zweiten Bildblocks (RBB2) durch Decodieren des codierten zweiten Bildblocks (CB2);
- Einfügen des codierten ersten Bildblocks (CBl) und einer Kennung (KEY) in die zweite Schicht (L2), wobei die Kennung
(KEY) anzeigt, dass bei der Codierung eines Bildblocks (BB) einer der zweiten Bilder (P23) in einen codierten Bildblock (CB) , dessen Codierung den rekonstruierten ersten Bildblock (RBBl) als Referenz (RF) anzeigt, als Referenz (RF) der rekonstruierte zweite Bildblock (RBB2) verwendet wird.
2. Verfahren nach Anspruch 1, bei dem
bei der Codierung einer der Bildblöcke (BB) der zweiten Bilder (P22), der mittels eines Codiermodus (IRP) kodiert wird, der auf den rekonstruierten ersten Bildblock (RBBl) referen- ziert, die Referenz (RF) auf den rekonstruierten zweiten Bildblock (RBB2) geändert wird.
3. Verfahren nach Anspruch 1 oder 2, bei dem
die Kennung (KEY) derart erweitert wird, dass sie zumindest einen Parameter anzeigt, der bei der Codierung des rekonstruierten ersten Bildblocks (RBBl) in den codierten zweiten Bildblock (CB2) verwendet wird.
4. Verfahren nach einem der Ansprüche 1 bis 3, bei dem durch die Codierung des codierten Bildblocks (CB) nur auf einen Teilbereich des rekonstruierten ersten Bildblocks (RBBl) als Referenz (RF) verwiesen wird, wird als Referenz (RF) ein Bildbereich des rekonstruierten zweiten Bildblocks (RBB2) ausgewählt, der den Teilbildbereich repräsentiert.
5. Verfahren nach einem der Ansprüche 1 bis 4, bei dem bei dem Erzeugen des codierten zweiten Bildblocks (CB2) ein INTRA-Codiermodus, ein INTRA-Prädiktionsmodus oder ein PCM- Codierverfahren eingesetzt wird.
6. Vorrichtung (VOR) zum Erzeugen eines codierten Videodatenstroms (VDS) , wobei
- der codierte Videodatenstrom (VDS) eine Bildsequenz (BS) codiert mittels einer ersten Schicht (Ll) und mittels zumindest einer zweiten Schicht (L2) umfasst,
- durch die erste Schicht (Ll) die Bildsequenz (BS) mit ersten Bildern (PIl, P12, P13) in einer ersten Bildauflösung (BAl) und durch die zweite Schicht (Ll, L2) die Bildsequenz (BS) mit zweiten Bildern (P21, P22, P23) in einer zweiten Bildauflösung (BA2) dargestellt ist,
- die jeweiligen Bilder (PIl, P12, P13, P21, P22, P23) jeweils eine Mehrzahl an Bildblöcken (BB) aufweisen,
- einer der Bildblöcke (BBl) der zweiten Bilder mittels einer Inter-Layer Prädiktion als erster codierter Bildblock (CBl) codiert ist,
mit folgenden Einheiten: - Eine erste Einheit (El) zum Erzeugen eines rekonstruierten ersten Bildblocks (RBBl) durch Decodieren des codierten ersten Bildblocks (CBl);
- Eine zweite Einheit (E2) zum Erzeugen eines codierten zwei- ten Bildblocks (CB2) durch Codieren des rekonstruierten ersten Bildblocks (RBBl) auf Basis eines Codiermodus (IAP, IRP), der eine Inter-Layer Prädiktion (ILP) unterbindet;
- Eine dritte Einheit (E3) zum Erzeugen eines rekonstruierten zweiten Bildblocks (RBB2) durch Decodieren des codierten zweiten Bildblocks (CB2);
- Eine vierte Einheit (E4) zum Erzeugen der zweiten Schicht
(L2) durch Einfügen des codierten ersten Bildblocks (CBl) und einer Kennung (KEY) , wobei die Kennung (KEY) anzeigt, dass bei der Codierung eines Bildblocks (BB) einer der zweiten Bilder (P23) in einen codierten Bildblock (CB) , dessen Codierung den rekonstruierten ersten Bildblock
(RBBl) als Referenz (RF) anzeigt, als Referenz (RF) der rekonstruierte zweite Bildblock (RBB2) zu verwenden ist.
7. Vorrichtung (VOR) nach Anspruch 5, bei der
die Vorrichtung (VOR) ferner eine fünfte Einheit (E5) aufweist, die ausgestaltet ist zur Codierung einer der Bildblöcke (BB) der zweiten Bilder (P22), der mittels eines Codiermodus (IRP) kodiert wird, der auf den rekonstruierten ersten Bildblock (RBBl) referenziert, die Referenz (RF) auf den rekonstruierten zweiten Bildblock (RBB2) geändert ist.
8. Vorrichtung (VOR) nach Anspruch 6 oder 7, bei der
die vierte Einheit (E4) ferner derart ausgestaltet ist, dass die Kennung (KEY) derart erweiterbar ist, dass sie zumindest einen Parameter anzeigt, der bei der Codierung des rekonstruierten ersten Bildblocks (RBBl) in den codierten zweiten Bildblock (CB2) verwendbar ist.
9. Vorrichtung (VOR) nach einem der Ansprüche 6 bis 8, bei der
die fünfte Einheit (E5) ferner derart ausgestaltet ist, dass falls die Codierung des codierten Bildblocks (CB) nur auf ei- nen Teilbereich des rekonstruierten ersten Bildblocks (RBBl) als Referenz (RF) weist als Referenz (RF) ein Bildbereich des rekonstruierten zweiten Bildblocks (RBB2) auszuwählen ist, der den Teilbildbereich repräsentiert.
10. Vorrichtung (VOR) nach einem der Ansprüche 6 bis 9, bei der
die fünfte Einheit (E5) ferner derart ausgestaltet ist, dass bei dem Erzeugen des codierten zweiten Bildblocks (CB2) ein INTRA-Codiermodus, ein INTRA-Prädiktionsmodus oder ein PCM- Codierverfahren verwendet ist.
11. Verfahren zum Decodieren eines codierten Videodatenstroms (VDS), wobei der codierte Videodatenstrom (VDS) nach einem der Ansprüche 1 bis 5 erzeugt wird,
bei dem folgende Schritte durchgeführt werden:
- Erzeugen eines rekonstruierten Bildblocks (RBB) bei Vorhandensein der Kennung (KEY) in dem codierten Videodatenstrom (VDS) durch Decodieren des codierten Bildblocks (CB) der zweiten Schicht (L2), der auf den rekonstruierten ersten
Bildblock (RBBl) referenziert, wobei zum Decodieren als Referenz (RF) der rekonstruierte zweite Bildblock (RBB2) verwendet wird.
12. Vorrichtung (DVOR) zum Decodieren eines codierten Videodatenstroms (VDS) , wobei der codierte Videodatenstrom (VDS) nach einem der Ansprüche 6 bis 10 erzeugt ist,
bei der eine sechste Einheit (E6) ausgebildet ist zum Erzeugen eines rekonstruierten Bildblocks (RBB) bei Vorhandensein der Kennung (KEY) in dem codierten Videodatenstrom (VDS) durch Decodieren des codierten Bildblocks (CB) der zweiten Schicht (L2), der auf den rekonstruierten ersten Bildblock (RBBl) referenziert, wobei zum Decodieren als Referenz (RF) der rekonstruierte zweite Bildblock (RBB2) verwendbar ist.
13. Verfahren zum Erzeugen eines transcodierten Videodatenstroms (TVDS) aus einem codierten Videodatenstrom (VDS) , der nach einem der Ansprüche 1 bis 5 erzeugt wird, bei dem bei Vorhandensein der Kennung (KEY) in dem codierten Videodatenstrom (VDS) folgende Schritte durchgeführt werden:
- Erzeugen eines rekonstruierten ersten Bildblocks (RBBl) durch Decodieren des codierten ersten Bildblocks (CBl); - Erzeugen eines codierten zweiten Bildblocks (CB2) durch Codieren des rekonstruierten ersten Bildblocks (RBBl) auf Basis eines Codiermodus (IAP, IRP), der eine Inter-Layer Prädiktion (ILP) unterbindet;
- Erzeugen des transcodierten Videodatenstroms (TVDS) durch Einfügen des codierten zweiten Bildblocks (CB2) und eines codierten Bildblocks (CB) in den transcodierten Videodatenstrom (TVDS) , wobei der codierte Bildblock (CB) mittels eines Codiermodus codiert wurde, der auf den durch Decodie- rung des codierten zweiten Bildblocks (CB2) rekonstruierten zweiten Bildblock (RBB2) referenziert .
14. Transcodiervorrichtung (TVOR) zum Erzeugen eines transcodierten Videodatenstroms (TVDS) aus einem codierten Videodatenstrom (VDS) , der nach einem der Ansprüche 6 bis 10 erzeug- bar ist, bei der bei Vorhandensein der Kennung (KEY) in dem codierten Videodatenstrom (VDS) folgende Schritte durchgeführt werden:
- Eine erste Einheit (El) zum Erzeugen eines rekonstruierten ersten Bildblocks (RBBl) durch Decodieren des codierten ersten Bildblocks (CBl);
- Eine zweite Einheit (E2) zum Erzeugen eines codierten zweiten Bildblocks (CB2) durch Codieren des rekonstruierten ersten Bildblocks (RBBl) auf Basis eines Codiermodus (IAP, IRP), der eine Inter-Layer Prädiktion (ILP) unterbindet; - Eine siebte Einheit (E7) zum Erzeugen des transcodierten
Videodatenstroms (TVDS) durch Einfügen des codierten zweiten Bildblocks (CB2) und eines codierten Bildblocks (CB) in den transcodierten Videodatenstrom (TVDS) , wobei der codierte Bildblock (CB) mittels eines Codiermodus codiert wurde, der auf den durch Decodierung des codierten zweiten Bildblocks (CB2) rekonstruierten zweiten Bildblock (RBB2) referenziert .
PCT/EP2010/060403 2009-08-27 2010-07-19 Verfahren und vorrichtungen zum erzeugen, decodieren und transcodieren eines codierten videodatenstroms WO2011023464A1 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US13/392,850 US20120155538A1 (en) 2009-08-27 2010-07-19 Methods and devices for creating, decoding and transcoding an encoded video data stream
EP10739317A EP2420064A1 (de) 2009-08-27 2010-07-19 Verfahren und vorrichtungen zum erzeugen, decodieren und transcodieren eines codierten videodatenstroms
CN201080036798.5A CN102474616B (zh) 2009-08-27 2010-07-19 用于生成、解码和转码经编码的视频数据流的方法和装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102009039095.2 2009-08-27
DE102009039095A DE102009039095A1 (de) 2009-08-27 2009-08-27 Verfahren und Vorrichtung zum Erzeugen, Decodieren und Transcodieren eines codierten Videodatenstroms

Publications (1)

Publication Number Publication Date
WO2011023464A1 true WO2011023464A1 (de) 2011-03-03

Family

ID=42712606

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2010/060403 WO2011023464A1 (de) 2009-08-27 2010-07-19 Verfahren und vorrichtungen zum erzeugen, decodieren und transcodieren eines codierten videodatenstroms

Country Status (5)

Country Link
US (1) US20120155538A1 (de)
EP (1) EP2420064A1 (de)
CN (1) CN102474616B (de)
DE (1) DE102009039095A1 (de)
WO (1) WO2011023464A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9943565B2 (en) 2009-07-28 2018-04-17 Sangamo Therapeutics, Inc. Methods and compositions for treating trinucleotide repeat disorders

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130022114A1 (en) * 2008-06-23 2013-01-24 Mediatek Inc. Method and related apparatuses for decoding multimedia data
KR20140087971A (ko) 2012-12-26 2014-07-09 한국전자통신연구원 계층적 비디오 부호화에서 다중참조계층을 적용한 화면간 부/복호화 방법 및 그 장치
AU2014288482A1 (en) * 2013-07-12 2015-02-26 Sony Corporation Image coding device and method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008007792A1 (en) * 2006-07-10 2008-01-17 Sharp Kabushiki Kaisha Methods and systems for combining layers in a multi-layer bitstream
WO2008146892A1 (ja) * 2007-05-29 2008-12-04 Nec Corporation 動画像変換装置、動画像変換方法、および動画像変換プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100679018B1 (ko) * 2004-09-07 2007-02-05 삼성전자주식회사 다계층 비디오 코딩 및 디코딩 방법, 비디오 인코더 및디코더
DE102004061906A1 (de) * 2004-12-22 2006-07-13 Siemens Ag Bildencodierverfahren, sowie dazugehöriges Bilddecodierverfahren, Encodiervorrichtung und Decodiervorrichtung
KR100878812B1 (ko) * 2005-05-26 2009-01-14 엘지전자 주식회사 영상신호의 레이어간 예측에 대한 정보를 제공하고 그정보를 이용하는 방법
KR100725407B1 (ko) * 2005-07-21 2007-06-07 삼성전자주식회사 방향적 인트라 잔차 예측에 따라 비디오 신호를 인코딩하고디코딩하는 방법 및 장치
WO2007044556A2 (en) * 2005-10-07 2007-04-19 Innovation Management Sciences, L.L.C. Method and apparatus for scalable video decoder using an enhancement stream
KR100809296B1 (ko) * 2006-02-22 2008-03-04 삼성전자주식회사 타입이 일치하지 않는 하위 계층의 정보를 사용하여인터레이스 비디오 신호를 인코딩/디코딩 하는 방법 및장치
WO2007107170A1 (en) * 2006-03-22 2007-09-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding scheme enabling precision-scalability
US8320450B2 (en) * 2006-03-29 2012-11-27 Vidyo, Inc. System and method for transcoding between scalable and non-scalable video codecs
US7535383B2 (en) * 2006-07-10 2009-05-19 Sharp Laboratories Of America Inc. Methods and systems for signaling multi-layer bitstream data
US8422555B2 (en) * 2006-07-11 2013-04-16 Nokia Corporation Scalable video coding
US8432968B2 (en) * 2007-10-15 2013-04-30 Qualcomm Incorporated Scalable video coding techniques for scalable bitdepths

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008007792A1 (en) * 2006-07-10 2008-01-17 Sharp Kabushiki Kaisha Methods and systems for combining layers in a multi-layer bitstream
WO2008146892A1 (ja) * 2007-05-29 2008-12-04 Nec Corporation 動画像変換装置、動画像変換方法、および動画像変換プログラム

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
ANDREW SEGALL ET AL: "Bit stream rewriting for SVC-to-AVC conversion", IMAGE PROCESSING, 2008. ICIP 2008. 15TH IEEE INTERNATIONAL CONFERENCE, IEEE, PISCATAWAY, NJ, USA, 12 October 2008 (2008-10-12), pages 2776 - 2779, XP031374617, ISBN: 978-1-4244-1765-0 *
HUI LIU ET AL: "Spatial transcoding from Scalable Video Coding to H.264/AVC", MULTIMEDIA AND EXPO, 2009. ICME 2009. IEEE INTERNATIONAL CONFERENCE ON, IEEE, PISCATAWAY, NJ, USA, 28 June 2009 (2009-06-28), pages 29 - 32, XP031510684, ISBN: 978-1-4244-4290-4 *
JAN DE COCK ET AL.: "Advanced Bistream Rewriting From H.264/AVC to SVC", ICIP, 2008, pages 2472 - 2475, XP031374541
LIN C-W ET AL: "Digital Video Transcoding", PROCEEDINGS OF THE IEEE, IEEE. NEW YORK, US LNKD- DOI:10.1109/JPROC.2004.839623, vol. 93, no. 1, 1 January 2005 (2005-01-01), pages 84 - 97, XP011123855, ISSN: 0018-9219 *
SEGALL A: "CE8: SVC-to-AVC bitstream rewriting for CGS", ITU STUDY GROUP 16 - VIDEO CODING EXPERTS GROUP -ISO/IEC MPEG & ITU-T VCEG(ISO/IEC JTC1/SC29/WG11 AND ITU-T SG16 Q6), XX, XX, no. JVT-U043, 22 October 2006 (2006-10-22), XP030006689 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9943565B2 (en) 2009-07-28 2018-04-17 Sangamo Therapeutics, Inc. Methods and compositions for treating trinucleotide repeat disorders

Also Published As

Publication number Publication date
DE102009039095A1 (de) 2011-03-10
US20120155538A1 (en) 2012-06-21
CN102474616B (zh) 2014-12-31
CN102474616A (zh) 2012-05-23
EP2420064A1 (de) 2012-02-22

Similar Documents

Publication Publication Date Title
DE60031230T2 (de) Skalierbares videokodierungssystem und verfahren
EP2198610B1 (de) Verfahren und vorrichtung zum erstellen eines kodierten ausgangsvideostroms aus mindestens zwei kodierten eingangsvideoströmen, sowie verwendung der vorrichtung
DE69735838T2 (de) Videokodierer mit Transformationskoeffizientenprädiktion
DE69924102T2 (de) Skalierung komprimierter bilder
EP1815690A1 (de) Verfahren zur transcodierung sowie transcodiervorrichtung
DE112019004696T5 (de) Verfahren zum Verarbeiten eines projektionsbasierten Rahmens
WO2012095490A1 (de) Kompression und dekompression von referenzbildern in einem videokoder
WO2010020592A1 (de) Verfahren zum codieren einer folge von digitalisierten bildern
WO2006024584A1 (de) Verfahren und vorrichtung zum codieren und decodieren
DE69937833T2 (de) Verfahren und vorrichtung zur skalierbaren formkodierung
DE69915843T2 (de) Teilbandkodierung/-dekodierung
DE69630297T2 (de) Weiterentwickeltes fernsehsystem
WO2006015947A1 (de) Verfahren und vorrichtung zum codieren und decodieren
EP2420064A1 (de) Verfahren und vorrichtungen zum erzeugen, decodieren und transcodieren eines codierten videodatenstroms
DE112018002432T5 (de) Verfahren und Vorrichtung zum Reduzieren von Artefakten in einem projektionsbasierten Rahmen
DE60107149T2 (de) Digitales Bildausgabegerät
DE19907132B4 (de) Videodecoder für einen Digitalfernseher
DE102011006036B4 (de) Verfahren und Vorrichtungen zur Bildung eines Prädiktionswertes
DE69909880T2 (de) Dekodierung eines komprimierten digitalen Bildsignals
EP1285537B1 (de) Verfahren und eine anordnung zur codierung bzw. decodierung einer folge von bildern
WO2000011874A1 (de) Verfahren und anordnung zur codierung eines digitalisierten bildes mit anwendung eines objektgesamtbewegungsvektors
WO2001062009A1 (de) Verfahren und anordnung zur kodierung bzw. zur kodierung und dekodierung einer zahlenfolge
DE102012200136A1 (de) AVC-SVC-Transcoder
EP1913780B1 (de) Verfahren zum korrigieren eines quantisierten datenwerts sowie eine dazugehörige vorrichtung
DE102004019339A1 (de) Prädiktionsverfahren, sowie zugehöriges Verfahren zur Decodierung eines Prädiktionsverfahrens, zugehörige Encodiervorrichtung und Decodiervorrichtung

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201080036798.5

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10739317

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2010739317

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 13392850

Country of ref document: US