DE102012212068A1 - Method for generating and transcoding encoded video data stream (VDS) of sequence of images, involves carrying out encoding mode for image frames of VDS, based on comparison result, for encoding image blocks with selected coding mode - Google Patents

Method for generating and transcoding encoded video data stream (VDS) of sequence of images, involves carrying out encoding mode for image frames of VDS, based on comparison result, for encoding image blocks with selected coding mode Download PDF

Info

Publication number
DE102012212068A1
DE102012212068A1 DE201210212068 DE102012212068A DE102012212068A1 DE 102012212068 A1 DE102012212068 A1 DE 102012212068A1 DE 201210212068 DE201210212068 DE 201210212068 DE 102012212068 A DE102012212068 A DE 102012212068A DE 102012212068 A1 DE102012212068 A1 DE 102012212068A1
Authority
DE
Germany
Prior art keywords
data stream
image
video data
vds
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE201210212068
Other languages
German (de)
Inventor
Peter Amon
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE201210212068 priority Critical patent/DE102012212068A1/en
Publication of DE102012212068A1 publication Critical patent/DE102012212068A1/en
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

The method involves comparing transformation coefficients of image blocks (BB1,BB2) of sequence of images (BS) in encoded video data stream (VDS), based on an error metric. The sequence of images in encoded VDS is provided with interdependent images (P11,P12,P21,P22). The images (P11,P12) serve as respective image frames (SP1,SP2). An encoding mode is carried out for image frames, based on comparison result, for encoding image blocks (BB11,BB12) with selected coding mode. An independent claim is included for a device for generating and transcoding encoded video data stream (VDS) of sequence of images.

Description

Die Erfindung betrifft ein Verfahren und Vorrichtungen zum Erzeugen und Transcodieren eines codierten Videodatenstroms. The invention relates to a method and apparatus for generating and transcoding a coded video data stream.

Die Umwandlung codierter Daten eines ersten Formats in codierte Daten eines zweiten Formats wird als Transcodierung bezeichnet. Die Transcodierung wird beispielsweise bei codierten Videodatenströmen, die in einem ersten Format codiert sind, angewandt, um diese in einen codierten Videodatenstrom eines anderen Formats zu wandeln. Bei einer Transcodierung von Videodaten, die in einzelnen Bildern (beispielsweise im JPEG-Format oder im H.264/AVC-Format mit INTRA-Codierung) vorliegen, in einen Videodatenstrom unter Nutzung von Prädiktion in zeitlicher Hinsicht erfolgt üblicherweise eine Decodierung der codierten Bilddaten und eine Neu-Encodierung in das gewünschte Videoformat. Beispielsweise wird der Bilddatenstrom vollständig decodiert und anschließend neu durch einen H.264/AVC-Encoder codiert. Diese Vorgehensweise ist sehr komplex und zeitaufwändig. Conversion of encoded data of a first format into encoded data of a second format is referred to as transcoding. The transcoding is applied, for example, to encoded video data streams encoded in a first format to convert it into a different format encoded video data stream. In a transcoding of video data, which are present in individual images (for example in JPEG format or in H.264 / AVC format with INTRA coding) into a video data stream using prediction in terms of time, usually a decoding of the coded image data and a re-encoding into the desired video format. For example, the image data stream is completely decoded and then re-encoded by an H.264 / AVC encoder. This approach is very complex and time consuming.

Die Aufgabe der Erfindung besteht darin, ein Verfahren und Vorrichtungen anzugeben, bei denen die Transcodierung eines codierten Bilddatenstroms in einen codierten Videodatenstrom schneller und im Vergleich zum oben beschriebenen Vorgehen mit geringerer Rechenleistung ermöglicht wird. The object of the invention is to provide a method and devices in which the transcoding of a coded image data stream into a coded video data stream is enabled faster and in comparison with the above-described procedure with lower processing power.

Diese Aufgaben werden durch die unabhängigen Patentansprüche gelöst. Weiterbildungen der Erfindung sind in den abhängigen Ansprüchen enthalten. These objects are achieved by the independent claims. Further developments of the invention are contained in the dependent claims.

Die Erfindung schlägt ein Verfahren zum Erzeugen eines codierten Videodatenstroms aus einer Folge von ersten Bildern vor, wobei die ersten Bilder codierte Einzelbilder (SP1, SP2) sind, die keine (direkte) Datenabhängigkeit zueinander aufweisen und als Bilddatenstrom bereitgestellt sind. Der codierte Videodatenstrom umfasst eine Bildsequenz mit voneinander abhängigen zweiten Bildern (P21, P22). Die jeweiligen Bilder weisen jeweils eine Mehrzahl an Bildblöcken mit einer Mehrzahl an jeweiligen Transformationskoeffizienten auf. The invention proposes a method for generating a coded video data stream from a sequence of first pictures, wherein the first pictures are coded individual pictures (SP1, SP2) which have no (direct) data dependency and are provided as picture data stream. The encoded video data stream comprises an image sequence with interdependent second images (P21, P22). The respective images each have a plurality of image blocks having a plurality of respective transformation coefficients.

Bei dem Verfahren werden erfindungsgemäß folgende Schritte durchgeführt: Es erfolgt ein Vergleich der Transformationskoeffizienten zumindest eines Bildblocks eines als Referenzbild dienenden ersten Einzelbilds mit den Transformationskoeffizienten eines Bildblocks gleichen Orts (englisch: co-located) eines zweiten, zu codierenden Einzelbilds basierend auf einer Fehlermetrik. Anschließend erfolgt eine Auswahl eines Codiermodus für das zu codierende zweite Einzelbild in ein zweites Bild des Videodatenstroms basierend auf dem Vergleichsergebnis. Anschließend erfolgt das Codieren des Bildblocks des zu codierenden zweiten Einzelbilds mit dem ausgewählten Codiermodus. In the method, the following steps are performed according to the invention: The transformation coefficients of at least one image block of a first frame serving as a reference image are compared with the transformation coefficients of a picture block of the same location (co-located) of a second frame to be coded based on an error metric. Subsequently, a selection of a coding mode for the second individual image to be encoded is performed in a second image of the video data stream based on the comparison result. Subsequently, the coding of the image block of the second individual image to be coded with the selected coding mode ensues.

Im Gegensatz zum Stand der Technik ist es zum Transcodieren eines Bilddatenstroms in einem Videodatenstrom nicht mehr erforderlich, zunächst den Bilddatenstrom zu decodieren und anschließend neu zu encodieren. Vielmehr erfolgt die Transcodierung unter direkter Verarbeitung der codierten Bilddaten. Eine Entscheidung, auf welche Weise eine Codierung in dem Videodatenstrom erfolgen soll, erfolgt hierbei auf Basis der in den codierten Einzelbildern (SP1, SP2) enthaltenen Transformationskoeffizienten. Hierdurch ist es möglich, die Entscheidung, welcher Codiermodus idealerweise verwendet wird, schneller durchzuführen. Hierdurch wird für die Transcodierung auch eine im Vergleich geringere Rechenleistung benötigt. Darüber hinaus sorgt das Vorgehen für eine höhere Bildqualität aufgrund der direkten Verarbeitung der Transformationskoeffizienten der codierten ersten Bilder. Es ist keine inverse Transformation und Neu-Transformation der Koeffizienten aus der Pixel-Domain erforderlich. Schließlich weist das vorgeschlagene Vorgehen eine geringe Komplexität auf, da die Codiermodus-Auswahl basierend auf in der Transformationsdomäne enthaltenen Informationen basiert. In contrast to the prior art, for transcoding an image data stream in a video data stream, it is no longer necessary to first decode and then re-encode the image data stream. Rather, transcoding is done by directly processing the encoded image data. A decision as to how a coding should take place in the video data stream takes place here on the basis of the transform coefficients contained in the coded individual pictures (SP1, SP2). This makes it possible to make the decision as to which coding mode is ideally used faster. As a result, a comparatively lower computing power is needed for the transcoding. In addition, the approach provides for higher image quality due to the direct processing of the transform coefficients of the coded first images. There is no inverse transformation and re-transformation of the coefficients from the pixel domain required. Finally, the proposed approach has a low complexity because the coding mode selection is based on information contained in the transformation domain.

Als erstes und als zweites Einzelbild können zwei zeitlich benachbarte erste Bilder für den Vergleich der Transformationskoeffizienten ausgewählt werden. As a first and a second single image, two temporally adjacent first images can be selected for the comparison of the transformation coefficients.

In einer Weiterbildung des Verfahrens wird als Codierungsmodus in Abhängigkeit von dem Vergleichsergebnis der Skip-Codiermodus oder der INTER-Codiermodus oder der INTRA-Codiermodus verwendet. Dabei wird in Abhängigkeit des Vergleichsergebnisses immer der für einen betrachteten Bildblock optimale Codiermodus ausgewählt. In a development of the method, the coding mode used in dependence on the comparison result is the skip coding mode or the INTER coding mode or the INTRA coding mode. In this case, depending on the result of the comparison, the optimum coding mode for a particular picture block is always selected.

In einer Weiterbildung der Erfindung können die Transformationskoeffizienten auch durch ihren Level und eine Quantisierungsschrittgröße (englisch: quantization step size) repräsentiert sein. Werden die Transformationskoeffizienten durch ihre Level repräsentiert, lassen sich die zur Durchführung des Verfahrens erforderlichen Rechenschritte auf besonders einfache und effiziente Weise durchführen. In one development of the invention, the transformation coefficients may also be represented by their level and a quantization step size. If the transformation coefficients are represented by their levels, the computation steps required to carry out the method can be carried out in a particularly simple and efficient manner.

Als Fehlermetrik wird wahlweise der mittlere quadratische Fehler (Mean Squared Error, MSE) oder die Summe der quadrierten Differenzen (Sum of Squared Differences, SSD) verarbeitet. Prinzipiell können auch andere Fehlermetriken zum Einsatz kommen. As an error metric, either the mean squared error (MSE) or the sum of squared differences (SSD) is processed. In principle, other error metrics can also be used.

Gemäß einer Variante wird als Codiermodus Skip gewählt, wenn das Ergebnis der Fehlermetrik kleiner als ein erster Schwellwert ist. In einer alternativen Variante wird, wenn das Ergebnis der Fehlermetrik kleiner als ein erster Schwellwert und gleichzeitig der implizit bestimmte Bewegungsvektor des gerade verarbeiteten Bildblocks ungleich Null ist, als Codiermodus INTER gewählt, wobei hier ein den Bewegungsvektor repräsentierender Parameter explizit zu Null gewählt wird. According to a variant, the coding mode Skip is selected if the result of the error metric is smaller than a first threshold value. In an alternative variant, if the result of the error metric is smaller than a first threshold and at the same time the implicitly determined motion vector of the picture block being processed is not equal to zero, then the coding mode INTER is selected, in which case a parameter representing the motion vector is explicitly selected to be zero.

Dies bedeutet, die Koeffizienten des codierten Differenzbilds werden explizit zu Null gesetzt und an den Decodierer in dem codierten Videodatenstrom übertragen. That is, the coefficients of the coded difference image are explicitly zeroed and transmitted to the decoder in the coded video stream.

Ist das Ergebnis der Fehlermetrik größer oder gleich dem ersten Schwellwert, so kommt als Codiermodus INTER oder INTRA in Betracht. Die Entscheidung kann beispielsweise nach dem aus dem Stand der Technik bekannten Rate Distorsion Optimization-Verfahren, wie dieses beispielsweise in [1] beschrieben ist, erfolgen. If the result of the error metric is greater than or equal to the first threshold value, then the coding mode INTER or INTRA is possible. The decision can be made, for example, by the rate distortion optimization method known from the prior art, as described for example in [1].

Gemäß einer weiteren Ausgestaltung wird, wenn das Ergebnis der Fehlermetrik kleiner als ein erster Schwellwert und gleichzeitig der implizit bestimmte Bewegungsvektor des gerade verarbeiteten Bildblocks ungleich Null ist, als Codiermodus INTER gewählt, wobei ein den Bewegungsvektor repräsentierender Parameter explizit zu Null gewählt wird. Dies bedeutet, die entsprechenden Parameter des codierten Differenzbilds werden zu Null gesetzt. Durch diese Vorgehensweise wird der Codiermodus Skip gewählt, wenn der Bewegungsvektor des betrachteten Bildblocks Null ist, wodurch der zu codierende Block auf einfache Weise kopiert werden kann. Ergibt sich in dem Fall, in dem aufgrund des Ergebnisses der Fehlermetrik der Skip-Codiermodus gewählt wird, dass der implizit bestimmte Bewegungsvektor ungleich Null ist (wobei dies abgeleitet aus den benachbarten Bildblöcken des zweiten Einzelbilds ermittelt werden kann), so wird zur Nachahmung des Skip-Codiermodus der INTER-Codiermodus gewählt. Um den Skip-Codiermodus entsprechend nachahmen zu können, wird bei diesem der Bewegungsvektor explizit zu Null gewählt, um der Bedingung des Bildblocks gleichen Orts zu entsprechen. According to a further embodiment, if the result of the error metric is smaller than a first threshold value and at the same time the implicitly determined motion vector of the image block being processed is not equal to zero, then the coding mode INTER is selected, wherein a parameter representing the motion vector is explicitly selected to be zero. This means that the corresponding parameters of the coded difference image are set to zero. By doing so, the coding mode Skip is selected when the motion vector of the picture block under consideration is zero, whereby the block to be coded can be easily copied. If, in the case in which the skip coding mode is selected on the basis of the result of the error metric, it results that the implicitly determined motion vector is not equal to zero (this can be derived from the neighboring picture blocks of the second frame), then the skip is copied Coding mode the INTER coding mode is selected. In order to be able to mimic the skip coding mode accordingly, the motion vector is explicitly selected to be zero in this case in order to correspond to the condition of the image block of the same location.

In einer weiteren Ausgestaltung ist ein zweiter Schwellwert vorgegeben, der größer als der erste Schwellwert ist. Als Codiermodus wird in einer Variante a) INTER gewählt, wenn das Ergebnis der Fehlermetrik größer als der erste Schwellwert und kleiner als der zweite Schwellwert ist. In einer Variante b) wird als Codiermodus INTRA oder INTER mit einem Bewegungsvektor ungleich Null gewählt, wenn das Ergebnis der Fehlermetrik größer als der zweite Schwellwert ist. In dem in Variante a) genannten Fall werden ein oder mehrere den Bewegungsvektor repräsentierende Parameter des INTER-Codiermodus explizit so gewählt, dass der Bewegungsvektor der INTER-Codierung Null ist. In a further embodiment, a second threshold value is predetermined which is greater than the first threshold value. In a variant, a) INTER is chosen as the coding mode if the result of the error metric is greater than the first threshold value and smaller than the second threshold value. In a variant b), the coding mode INTRA or INTER is selected with a motion vector not equal to zero if the result of the error metric is greater than the second threshold value. In the case mentioned in variant a), one or more parameters of the INTER coding mode representing the motion vector are explicitly selected such that the motion vector of the INTER coding is zero.

Die Entscheidung im Fall b) zwischen den Codiermodi INTRA oder INTER (wobei der Bewegungsvektor ungleich Null ist) kann beispielsweise basierend auf dem bereits erwähnten Rate Distorsion-Kriterium des in [1] beschriebenen Algorithmus erfolgen. The decision in case b) between the coding modes INTRA or INTER (where the motion vector is not equal to zero) can be made, for example, based on the already mentioned rate distortion criterion of the algorithm described in [1].

Der erste und der zweite Schwellwert werden abhängig von der Qualität des Ausgangsdatenstroms, d.h. des codierten Videodatenstroms, gewählt. Insbesondere kann dies, sofern die Transformationskoeffizienten durch ihre Level repräsentiert sind, in Abhängigkeit der gewählten Quantisierungsschrittgröße erfolgen. The first and second thresholds will vary depending on the quality of the output data stream, i. of the encoded video data stream. In particular, if the transformation coefficients are represented by their levels, this can be done as a function of the selected quantization step size.

In einer weiteren Ausgestaltung wird bei ausgewähltem INTER-Codiermodus in der Transformationsebene ein Residuum, das für das zu codierende Einzelbild in dem Videodatenstrom zu codieren ist, aus der Differenz der Transformationskoeffizienten der Bildblöcke gleichen Orts des ersten und des zweiten Einzelbilds ermittelt. Hierdurch lässt sich die Transcodierung auf besonders einfache Weise realisieren, da in der Transformationsdomain gearbeitet werden kann. In a further refinement, with the INTER-coding mode selected in the transformation plane, a residual to be coded for the single image to be coded in the video data stream is determined from the difference of the transformation coefficients of the image blocks of the same location of the first and the second individual image. As a result, the transcoding can be realized in a particularly simple manner, since it is possible to work in the transformation domain.

Es ist weiterhin zweckmäßig, wenn in dem codierten Videodatenstrom ein Flag gesetzt wird, welches ein Filtern der Bilddaten des Videodatenstroms beim Decodieren unterdrückt. Zusätzliche Operationen, wie z.B. ein Deblocking-Filtering oder ein Adaptive-Loop-Filtering können zu einer Verschlechterung der Bildqualität führen. Durch das Setzen des Flags können diese Filtermechanismen deaktiviert werden, wodurch die Qualität der Transcodierung hoch bleibt. It is also expedient if a flag is set in the encoded video data stream which suppresses filtering of the video data stream image data during decoding. Additional operations, such as deblocking filtering or adaptive loop filtering may degrade image quality. By setting the flag, these filter mechanisms can be deactivated, which keeps the quality of the transcoding high.

In einer weiteren zweckmäßigen Ausgestaltung wird für die Verarbeitung der Fehlermetrik zur Auswahl des Codiermodus und/oder zur Berechnung des Residuums ein Transformationskoeffizient, der einen Differenzwert eines DC-Wertes umfasst oder repräsentiert, auf einen absoluten Wert des DC-Wertes zurückgerechnet. Der DC-Wert entspricht einem Gleichanteil, wie z.B. der mittleren Helligkeit, in einem der Bildblöcke der ersten Bilder. Teilweise werden bei einer INTRA-Codierung, welche bei JPEG-Bildern angewandt ist, DC-Wertekoeffizienten geschätzt, um die Datenrate zu reduzieren. Typischerweise wird hierfür eine differenzielle Puls-Code-Modulation (DPCM) verwendet, d.h. der DC-Transformationskoeffizient des betrachteten Bildblocks wird als die Differenz codiert in Bezug auf den entsprechenden Wert des vorangegangenen Blocks im gleichen Bild. Hieraus resultiert eine Schätzkette, welche vom ersten Bildblock in dem betrachteten Einzelbild startet. Um den Wert der Fehlermetrik für die Codiermodus-Entscheidung ermitteln zu können und/oder die Transformationskoeffizienten des Residuums korrekt ermitteln zu können, wird dieses Vorgehen erfindungsgemäß umgekehrt. Dies bedeutet, die DC-Werte werden aus den Differenzwerten des DC-Wertes ermittelt. In a further expedient refinement, for processing the error metric for selecting the coding mode and / or for calculating the residual, a transformation coefficient which comprises or represents a difference value of a DC value is calculated back to an absolute value of the DC value. The DC value corresponds to a DC component, such as the average brightness, in one of the picture blocks of the first pictures. In part, with INTRA coding applied to JPEG images, DC value coefficients are estimated to reduce the data rate. Typically, a differential pulse code modulation (DPCM) is used for this, ie the DC transformation coefficient of the considered image block is coded as the difference with respect to the corresponding value of the previous block in the same image. This results in an estimation chain which starts from the first image block in the viewed frame. In order to be able to determine the value of the error metric for the coding mode decision and / or to correctly determine the transformation coefficients of the residual, this procedure is reversed according to the invention. This means that the DC values are determined from the difference values of the DC value.

In einer weiteren zweckmäßigen Ausgestaltung erfolgt für die Verarbeitung der Fehlermetrik zur Auswahl des Codiermodus und/oder zur Berechnung des Residuums eine Normierung der Quantisierungsschrittgröße, wenn die Quantisierungsschrittgröße zwischen dem ersten und dem zweiten Einzelbild variiert. In a further expedient refinement, for the processing of the error metric for the selection of the coding mode and / or for the calculation of the residual, the quantization step size is normalized when the quantization step size varies between the first and the second individual image.

Die Erfindung schafft des Weiteren eine Vorrichtung zum Erzeugen eines codierten Videodatenstroms aus einer Folge von ersten Bildern, wobei

  • – die ersten Bilder codierte Einzelbilder (SP1, SP2) sind, die keine Datenabhängigkeit zueinander aufweisen und als Bilddatenstrom bereitgestellt sind;
  • – der codierte Videodatenstrom eine Bildsequenz mit voneinander abhängigen zweiten Bildern (P21, P22) umfasst;
  • – die jeweiligen Bilder jeweils eine Mehrzahl an Bildblöcken mit einer Mehrzahl an jeweiligen Transformationskoeffizienten aufweisen;
umfassend die folgenden Einheiten:
  • – ein erste Einheit zum Vergleich der Transformationskoeffizienten zumindest eines Bildblocks eines als Referenz dienenden ersten Einzelbilds mit den Transformationskoeffizienten eines Bildblocks gleichen Orts eines zweiten, zu codierenden Einzelbilds basierend auf einer Fehlermetrik;
  • – eine zweite Einheit zur Auswahl eines Codiermodus für das zu codierende zweite Einzelbild in ein zweites Bild des Videodatenstroms basierend auf dem Vergleichsergebnis;
  • – eine dritte Einheit Codieren des Bildblocks des zu codierenden zweiten Einzelbilds mit dem ausgewählten Codiermodus.
The invention further provides an apparatus for generating a coded video data stream from a sequence of first images, wherein
  • The first images are coded individual images (SP1, SP2) which have no data dependency on one another and are provided as an image data stream;
  • - the coded video data stream comprises an image sequence with interdependent second images (P21, P22);
  • The respective images each have a plurality of image blocks having a plurality of respective transformation coefficients;
comprising the following units:
  • A first unit for comparing the transformation coefficients of at least one image block of a reference frame of the first frame with the transformation coefficients of an image block same location of a second frame to be encoded based on an error metric;
  • A second unit for selecting a coding mode for the second frame to be encoded into a second frame of the video stream based on the comparison result;
  • A third unit coding the picture block of the second frame to be coded with the selected coding mode.

Schließlich umfasst die Erfindung eine Transcodiervorrichtung zum Erzeugen eines transcodierten Videodatenstroms aus einem codierten Bilddatenstrom, der nach dem oben beschriebenen Verfahren erzeugbar ist, umfassend die folgenden Einheiten:

  • – ein erste Einheit zum Vergleich der Transformationskoeffizienten zumindest eines Bildblocks eines als Referenz dienenden ersten Einzelbilds mit den Transformationskoeffizienten eines Bildblocks gleichen Orts eines zweiten, zu codierenden Einzelbilds basierend auf einer Fehlermetrik;
  • – eine zweite Einheit zur Auswahl eines Codiermodus für das zu codierende zweite Einzelbild in ein zweites Bild des Videodatenstroms basierend auf dem Vergleichsergebnis;
  • – eine vierte Einheit zum Erzeugen des transcodierten Videodatenstroms durch Einfügen des mit dem ausgewählten Codiermodus codierten Bildblocks des zu codierenden zweiten Einzelbilds in den transcodierten Videodatenstrom.
Finally, the invention comprises a transcoding device for generating a transcoded video data stream from a coded image data stream which can be generated according to the method described above, comprising the following units:
  • A first unit for comparing the transformation coefficients of at least one image block of a reference frame of the first frame with the transformation coefficients of an image block same location of a second frame to be encoded based on an error metric;
  • A second unit for selecting a coding mode for the second frame to be encoded into a second frame of the video stream based on the comparison result;
  • - A fourth unit for generating the transcoded video data stream by inserting the encoded with the selected encoding mode image block of the second frame to be encoded in the transcoded video data stream.

Die Transcodiervorrichtung ermöglicht eine Implementierung des Transcodierverfahrens, wobei mittels der genannten Einheiten die einzelnen Verfahrensschritte durchführbar sind. Die Vorteile sind dabei analog zum Transcodierverfahren. The transcoding device enables an implementation of the transcoding method, wherein the individual method steps can be carried out by means of the units mentioned. The advantages are analogous to the transcoding method.

Die Erfindung und ihre Weiterbildungen werden nachfolgend näher anhand eines Ausführungsbeispiels in der Zeichnung erläutert. Es zeigen: The invention and its developments are explained in more detail below with reference to an embodiment in the drawing. Show it:

1 eine Folge codierter Einzelbilder (SP1, SP2), die keine Datenabhängigkeit zueinander aufweisen und aus denen ein codierter Videodatenstrom erzeugbar ist, und 1 a sequence of coded frames (SP1, SP2) which have no data dependence on each other and from which a coded video data stream can be generated, and

2 ein Ablaufdiagramm und eine Vorrichtung zum Erzeugen eines codierten Videodatenstroms. 2 a flow chart and an apparatus for generating a coded video data stream.

Elemente mit gleicher Funktion und Wirkungsweise sind in den Figuren mit denselben Bezugszeichen versehen. Elements with the same function and mode of operation are provided with the same reference numerals in the figures.

Bei einem Videocodierverfahren, wie beispielsweise dem Standard ITU H.264/AVC (ITU – International Telecommunications Union, AVC – Advanced Video Coding) wird eine Bildsequenz BS, die mehrere Bilder P21, P22 aufweist, in einen Videodatenstrom VDS codiert. In dem codierten Videodatenstrom VDS wird diese Bildsequenz BS codiert. In a video coding method such as ITU H.264 / AVC (Advanced Telecommunication Union AVC), a picture sequence BS having plural pictures P21, P22 is encoded into a video data stream VDS. In the encoded video data stream VDS this image sequence BS is encoded.

Die Bilder P21, P22 werden durch Transcodierung aus Bildern P11, P12 erzeugt. Die Bilder P11, P12 sind codierte Einzelbilder (SP1, SP2) SP1, SP2, die keine Datenabhängigkeit zueinander aufweisen und als Bilddatenstrom BDS bereitgestellt sind. The images P21, P22 are generated by transcoding from images P11, P12. The images P11, P12 are coded frames (SP1, SP2) SP1, SP2, which have no data dependency on each other and are provided as image data stream BDS.

Die Bilder P11, P12, P21, P22 sind in Bildblöcke BB in einer Größe von 4 × 4 oder 8 × 8 Bildpunkten aufgeteilt. Im Allgemeinen können die Bildblöcke beliebige Formen annehmen, wobei die genannten Größen in dem Standard H.264 verwendet werden. Die Codierung der Bilder erfolgt blockweise, wobei durch die Codierung eine Reduktion der Datenmenge erreicht ist. The images P11, P12, P21, P22 are divided into image blocks BB having a size of 4 × 4 or 8 × 8 pixels. In general, the image blocks may take on arbitrary forms, the sizes mentioned in the US Pat Standard H.264 be used. The coding of the images is block by block, whereby a reduction of the amount of data is achieved by the coding.

Bei der Codierung von Bildblöcken sind allgemein folgende Codiermodi bekannt:
INTRA: Ein Bildblock wird ohne Referenz auf zumindest einen anderen Bildblock codiert.
When encoding image blocks, the following coding modes are generally known:
INTRA: An image block is coded without reference to at least one other image block.

INTER-Prädiktion: Die Codierung eines Bildblocks eines Bildes erfolgt durch Prädiktion auf einen Bildbereich, wobei der Bildbereich in einem zum Bild zeitlich zurückliegenden oder nachfolgenden Bild liegt. Dieser Bildbereich wird als Referenzbildbereich oder Referenz bezeichnet. INTER Prediction: The coding of an image block of an image takes place by prediction on an image area, wherein the image area lies in an image past or behind the image. This image area is called a reference image area or reference.

INTRA-Prädiktion: Die Codierung eines Bildblocks eines Bildes erfolgt durch Prädiktion auf einen Bildbereich, wobei der Bildbereich, d.h. die Referenz, in demselben Bild wie der Bildblock liegt. INTRA Prediction: The coding of an image block of an image is done by prediction on an image area, the image area, i. the reference is in the same picture as the picture block.

Die erfindungsgemäß vorgeschlagene Transcodierung der Einzelbilder (SP1, SP2) SP1, SP2 in eine Bildsequenz BS des codierten Videodatenstroms VDS mit den Bildern P21, P22 erfolgt durch einen Vergleich von Transformationskoeffizienten eines Bildblocks BB11 des als Referenz dienenden ersten Einzelbilds SP1 mit den Transformationskoeffizienten eines Bildblocks BB2 gleichen Orts des zweiten, zu codierenden Einzelbilds SP2. Der Vergleich erfolgt dabei basierend auf einer Fehlermetrik. Dieser erste Schritt S1 wird durch eine erste Einheit E1 durchgeführt, vgl. 2. Basierend auf dem Vergleichsergebnis erfolgt in Schritt S2 durch eine zweite Einheit E2 eine Auswahl eines Codiermodus für den zu codierenden Bildblock BB2 in einen entsprechenden Bildblock B21 des Bildes P22 des Videodatenstroms VDS. In einem Schritt S3 erfolgt durch eine Einheit E3 ein Codieren des Bildblocks des zu codierenden Einzelbilds SP2 mit dem ausgewählten Codiermodus. Der codierte Bildblock wird anschließend in einem Schritt S4 durch eine Einheit E4 in den Videodatenstrom VDS eingefügt. The transcoding of the individual images (SP1, SP2) SP1, SP2 proposed in accordance with the invention into an image sequence BS of the coded video data stream VDS with the images P21, P22 is effected by a comparison of transformation coefficients of an image block BB11 of the reference frame SP1 with the transformation coefficients of an image block BB2 same location of the second, to be coded frame SP2. The comparison is based on an error metric. This first step S1 is performed by a first unit E1, cf. 2 , Based on the comparison result, in step S2, a second unit E2 selects a coding mode for the image block BB2 to be coded into a corresponding image block B21 of the image P22 of the video data stream VDS. In a step S3, a unit E3 codes the image block of the individual image SP2 to be coded with the selected coding mode. The coded image block is then inserted into the video data stream VDS by a unit E4 in a step S4.

Als Codiermodi werden in Abhängigkeit von dem Vergleichsergebnis wahlweise der Skip-Codiermodus, der INTER-Codiermodus oder der INTRA-Codiermodus verwendet. Depending on the result of the comparison, optionally the skip coding mode, the INTER coding mode or the INTRA coding mode are used as coding modes.

Bei den Einzelbildern (SP1, SP2) SP1, SP2 handelt es sich bevorzugt um zwei zeitlich benachbarte erste Bilder. Prinzipiell können jedoch auch nicht zeitlich benachbarte Bilder für den Vergleich der Transformationskoeffizienten ausgewählt werden. Der Vergleich der Transformationskoeffizienten der Bildblöcke gleichen Ortes (sog. co-located Bildblöcke) erfolgt mittels einer Fehlermetrik. Hierzu kann beispielsweise der mittlere quadratische Fehler (Mean Squared Error, MSE) verwendet werden. Der MSE zwischen Bildblöcken gleichen Ortes in zwei Bildern wird gemäß

Figure DE102012212068A1_0002
berechnet. Darin repräsentieren ci und ci,Ref die Koeffizienten i eines Blocks im gegenwärtigen Bild und in dem Referenzbild. N repräsentiert die Anzahl der Koeffizienten in dem Bildblock BB. The individual images (SP1, SP2) SP1, SP2 are preferably two temporally adjacent first images. In principle, however, temporally adjacent images can not be selected for the comparison of the transformation coefficients. The comparison of the transformation coefficients of the image blocks of the same location (so-called co-located image blocks) takes place by means of an error metric. For example, the mean squared error (MSE) can be used for this purpose. The MSE between image blocks of the same place in two images is according to
Figure DE102012212068A1_0002
calculated. Therein, c i and c i, Ref represent the coefficients i of a block in the current picture and in the reference picture. N represents the number of coefficients in the image block BB.

Der Codiermodus für den betrachteten Bildblock, der auch Ausgangsdaten (Bilddatenstrom BDS) wird entsprechend des Werts von MSE gewählt. Für den Fall, dass MSE unterhalb eines ersten Schwellwerts th1,MSE ist, wird der Skip-Codiermodus ohne Versatz gewählt. Der Begriff „ohne Versatz“ bedeutet, dass die Bewegungsvektoren der Bildblöcke implizit zu Null bestimmt werden. Dies bedeutet, wenn der Ausgangsdatenstrom, d.h. der codierte Videodatenstrom, decodiert wird, wird der betreffende Bildblock des Referenzbildes in den Bildblock gleichen Ortes des gerade aktuellen Bildes codiert, ohne weitere Verfeinerung der Pixelwerte. The coding mode for the considered image block, which also output data (image data stream BDS) is selected according to the value of MSE. In the case where MSE is below a first threshold th 1, MSE , the skip coding mode is selected without offset. The term "without offset" means that the motion vectors of the image blocks are implicitly determined to be zero. This means if the output data stream, that is, the encoded video data stream is decoded, the relevant image block of the reference image is encoded in the image block of the same location of the current image, without further refinement of the pixel values.

Im anderen Fall, d.h. wenn MSE größer oder gleich dem ersten Schwellwert th1,MSE ist, wird der INTER- oder INTRA-Codiermodus gewählt:

Figure DE102012212068A1_0003
In the other case, ie when MSE is greater than or equal to the first threshold th 1, MSE , the INTER or INTRA encoding mode is selected:
Figure DE102012212068A1_0003

Die Entscheidung, ob INTER oder INTRA als Codiermodus gewählt wird, erfolgt nach den bekannten Verfahren der Rate Distorsion Optimization, wie diese in [1] beschrieben ist. The decision as to whether INTER or INTRA is chosen as the coding mode is made according to the known methods of rate distortion optimization as described in [1].

Für den Fall, dass es nicht möglich ist, den Skip-Codiermodus mit implizit bestimmten Bewegungsvektoren (MV, Motion Vector) = 0 auszuwählen, wird dieser durch einen INTER-Codiermodus nachgeahmt, bei dem die den Bewegungsvektor festlegenden Parameter explizit so gesetzt werden, dass der Bewegungsvektor Null ist, und ohne dass Transformationskoeffizienten codiert werden. Dieser Fall kann auftreten, da Bewegungsvektoren ungleich Null implizit von benachbarten Bildblöcken abgeleitet werden oder aufgrund von anderen Restriktionen des Videoformats. In the event that it is not possible to select the skip coding mode with implicitly determined motion vectors (MV) = 0, this is mimicked by an INTER coding mode in which the parameters specifying the motion vector are explicitly set so that the motion vector is zero, and without encoding transform coefficients. This case can occur because nonzero motion vectors are implicitly derived from adjacent image blocks or due to other video format restrictions.

Anstelle der Verwendung des MSE kann auch die Summe der quadrierten Differenzen (Sum of Squared Differences, SSD) als Fehlermetrik verwendet werden. Die Entscheidung erfolgt dann gemäß

Figure DE102012212068A1_0004
Instead of using the MSE, the sum of squared differences (SSD) can also be used as the error metric. The decision is then made according to
Figure DE102012212068A1_0004

SSD errechnet sich gemäß

Figure DE102012212068A1_0005
wobei th1,SSD = N·th1,MSE gilt. Dies erleichtert die Berechnung der Entscheidungsparameter, da eine Divisions-Berechnung vermieden werden kann. SSD is calculated according to
Figure DE102012212068A1_0005
where th 1, SSD = N · th 1, MSE holds. This facilitates the calculation of the decision parameters, since a division calculation can be avoided.

In einem codierten Videodatenstrom werden die Transformationskoeffizienten durch den sog. Level li repräsentiert. Um SSD anzunähern, kann nachfolgende Formel verwendet werden:

Figure DE102012212068A1_0006
wobei li und li,Ref die Level der Transformationskoeffizienten und k ein konstanter Multiplikator sind. Für eine gleichförmige Quantisierung mit dem Vielfachen einer Quantisierungsschrittgröße sind SSD und SSDlevel identisch. In diesem Fall ist der Faktor k die quadratische Quantisierungsschrittgröße q, welche abhängig ist von einem Quantisierungsparameter QP, d.h. k = q2 = [q(QP)]2 =: k(QP). In an encoded video data stream, the transform coefficients are represented by the so-called level l i . To approximate SSD, the following formula can be used:
Figure DE102012212068A1_0006
where l i and l i, Ref are the levels of the transform coefficients and k is a constant multiplier. For uniform quantization with the multiple of a quantization step size, SSD and SSD levels are identical. In this case, the factor k is the quadratic quantization step size q, which depends on a quantization parameter QP, ie k = q 2 = [q (QP)] 2 =: k (QP).

Hierbei ist q die Quantisierungsschrittgröße in dem Bildblock des Bilds P11, P12 des Bilddatenstroms und QP der entsprechende Quantisierungsparameter. Um eine geringe Komplexität bei der Implementierung zu erreichen, kann k(QP) in einer Tabelle für unterschiedliche QP-Werte für eine schnelle Kalkulation von SSDlevel gespeichert sein. Here, q is the quantization step size in the image block of the image P11, P12 of the image data stream, and QP is the corresponding quantization parameter. To achieve a low implementation complexity, k (QP) can be stored in a table for different QP values for fast calculation of SSD level .

Der Entscheidungsprozess kann weiterhin vereinfacht werden durch

Figure DE102012212068A1_0007
wobei
Figure DE102012212068A1_0008
die Summe der quadrierten Differenzen der Level (SSLD) und
Figure DE102012212068A1_0009
ist. The decision process can be further simplified by
Figure DE102012212068A1_0007
in which
Figure DE102012212068A1_0008
the sum of the squared differences of the levels (SSLD) and
Figure DE102012212068A1_0009
is.

Ebenso kann der Schwellwert th1,SSLD(QP) in einer Tabelle gespeichert sein, um eine geringere Komplexität zu erreichen. Likewise, the threshold th 1, SSLD (QP) may be stored in a table for less complexity.

Die Schwellwerte th1,MSE, th1,SSD oder th1,SSLD können von der Qualität des Ausgangsdatenstroms, d.h. des codierten Videodatenstroms, abhängen. Insbesondere besteht eine Abhängigkeit von dem Quantisierungsparameter in dem zu codierenden Bildblock. Je größer der Quantisierungsparameter ist, d.h. je größer die Quantisierungsschrittgröße, desto größer wird der Schwellwert gewählt. Für eine geringere Qualität des Ausgangsdatenstroms kann daher der Skip-Codiermodus häufiger gewählt werden. The thresholds th 1, MSE , th 1, SSD or th 1, SSLD may depend on the quality of the output data stream , ie the encoded video data stream . In particular, there is a dependence on the quantization parameter in the image block to be coded. The larger the quantization parameter, ie the larger the quantization step size, the greater the threshold value is selected. For a lower quality of the output data stream, therefore, the skip coding mode can be selected more frequently.

Die Wahl zwischen dem INTER- und dem INTRA-Codiermodus erfolgt ebenfalls in Abhängigkeit des Ergebnisses der verwendeten Fehlermetrik, beispielsweise MSE, SSD oder SSLD. Wenn das Ergebnis der Fehlermetrik (z.B. MSE) unterhalb eines zweiten Schwellwerts th2,MSE liegt, wobei der zweite Schwellwert th2,MSE größer als der erste Schwellwert th1,MSE ist, dann wird der INTER-Codiermodus ohne Versatz (Displacement) ausgewählt. Dies bedeutet, die den Bewegungsvektor repräsentierenden Parameter werden implizit oder explizit zu Null gesetzt. In diesem Fall kann eine weitere Verfeinerung der Transformationskoeffizienten durchgeführt werden. Dies ist nicht möglich, wenn in Abhängigkeit des Vergleichsergebnisses der Skip-Codiermodus ausgewählt wurde. The choice between the INTER and the INTRA coding mode also takes place depending on the result of the error metric used, for example MSE, SSD or SSLD. If the result of the error metric (eg MSE) is below a second threshold th 2, MSE , where the second threshold is th 2, MSE greater than the first threshold th 1, MSE , then the INTER coding mode is selected without displacement , This means that the parameters representing the motion vector are implicitly or explicitly set to zero. In this case, further refinement of the transform coefficients can be performed. This is not possible if the skip coding mode has been selected as a function of the comparison result.

Ist das Ergebnis der Fehlermetrik größer oder gleich dem zweiten Schwellwert th2,MSE, so wird der INTRA-Codiermodus ausgewählt. Dann erfolgt keine Prädiktion von einem Bildblock gleichen Ortes des Bilds. If the result of the error metric is greater than or equal to the second threshold value th 2, MSE , the INTRA coding mode is selected. Then, no prediction is made of an image block of the same location of the image.

Der Entscheidungsprozess kann durch die folgenden Formeln für MSE, SSD und SSLD ausgedrückt werden:

Figure DE102012212068A1_0010
The decision process can be expressed by the following formulas for MSE, SSD and SSLD:
Figure DE102012212068A1_0010

Die Entscheidung zwischen den Codiermodi INTRA oder INTER mit einem Bewegungsvektor ungleich Null (MV ≠ 0) kann beispielsweise basierend auf dem Rate-Distorsion-Kriterium erfolgen, mit dem die verschiedenen Codieroptionen analysiert werden können. The decision between the coding modes INTRA or INTER with a motion vector not equal to zero (MV ≠ 0) can for example be based on the rate distortion criterion with which the various coding options can be analyzed.

Ähnlich zur Festlegung des Absolutwertes des ersten Schwellwertes kann der zweite Schwellwert (th2,MSE, th2,SSD oder th2,SSLD) in Abhängigkeit der Qualität des Ausgangsdatenstroms, d.h. des codierten Videodatenstroms gewählt werden. Similar to determining the absolute value of the first threshold value, the second threshold value (th 2, MSE , th 2, SSD or th 2, SSLD ) can be selected depending on the quality of the output data stream , ie the coded video data stream .

Für den Fall, dass der INTER-Codiermodus ausgewählt ist, können die Pixelwerte eines Bildblocks durch die Codierung von Transformationskoeffizienten verfeinert werden. Die Berechnung dieser Residuums-Information kann wahlweise in der Pixel- oder der Transformationsdomäne erfolgen. Da die Berechnung in der Transformationsdomäne weniger aufwändig ist, ist dies bevorzugt. In the case where the INTER coding mode is selected, the pixel values of an image block can be refined by the coding of transform coefficients. The computation of this residual information can optionally take place in the pixel or the transformation domain. Since the computation in the transformation domain is less expensive, this is preferred.

Die üblicherweise verwendete diskrete Kosinus-Transformation (Discrete Cosine Transform, DCT) bei der Codierung von Bildern und Videos ist eine lineare Operation. Grundsätzlich ist es daher möglich, die Transformationskoeffizienten des Residuums (R ~) in der Transformationsdomäne zu berechnen. In dem Eingangs-Bilddatenstrom BDS sind die folgenden Signale vorhanden: I ~ = T(I) und I ~Ref = T(IRef), welche jeweils INTRA-codiert sind. In dieser Notation repräsentiert I das im gegenwärtigen Schritt zu transcodierende Bild, während IRef als Referenzbild dient, welches in einem vorhergehenden Schritt transcodiert wurde. The commonly used discrete cosine transform (DCT) in the encoding of images and video is a linear operation. Basically, it is therefore possible to calculate the transformation coefficients of the residual (R ~) in the transformation domain. The following signals are present in the input image data stream BDS: I ~ = T (I) and I ~ Ref = T (I Ref ), which are each INTRA coded. In this notation, I represents the image to be transcoded in the current step, while I Ref serves as the reference image transcoded in a previous step.

In dem Ausgangs-Videodatenstrom VDS müssen die nachfolgenden Signale encodiert werden:
I ~ = T(I) für INTRA-codierte Bildblöcke sowie das transformierte Residuum R ~ = T(R) für INTER-codierte Bildblöcke. Der temporäre Prädiktionsprozess bei einem Videodecoder wird in der Pixeldomäne durchgeführt. Nachdem das Residuum R in der Transformationsdomäne encodiert wird (und damit in Gestalt des Signals R ~ vorliegt), muss eine inverse Transformation ausgeführt werden. Daher ergibt sich der Prädiktionsprozess zu I = P + T–1(R ~).
In the output video data stream VDS, the following signals must be encoded:
I ~ = T (I) for INTRA coded picture blocks as well as the transformed residual R ~ = T (R) for INTER coded picture blocks. The temporary prediction process on a video decoder is performed in the pixel domain. After the residue R is encoded in the transform domain (and thus in the form of the signal R ~), an inverse transformation must be performed. Therefore, the prediction process becomes too I = P + T -1 (R ~).

Durch die Anwendung einer Transformation ergibt sich: T(I) = T(P + T–1(R ~)) = T(P) + T(T–1(R ~)) = T(P) + R ~. By applying a transformation results: T (I) = T (P + T -1 (R -)) = T (P) + T (T -1 (R -)) = T (P) + R -.

Es ist zu beachten, dass für lineare Operationen f die Entsprechung f(a·A + b·B) = a·f(A) + b·f(B) gilt, wobei in der Ableitung f ≡ T, a = 1 und b = 1 gilt. It should be noted that for linear operations f, the correspondence f (a * A + b * B) = a * f (A) + b * f (B) holds, where in the derivative f ≡ T, a = 1 and b = 1 applies.

Obige Gleichung kann umformuliert werden zu: R ~ = T(I) – T(P) = I ~ – P ~. The above equation can be reworded to: R ~ = T (I) - T (P) = I ~ - P ~.

Nachdem der Prädiktor des gegenwärtigen Bildes äquivalent zu dem Bildblock gleichen Orts in dem Referenzbild ist (P = IRef), kann dies umformuliert werden zu: R ~ = I ~ – I ~Ref. Since the predictor of the current image is equivalent to the same block image block in the reference image (P = I Ref ), this can be rewritten as: R ~ = I ~ - I ~ Ref .

Daher kann das zu codierende Residuum in dem Ausgangs-Videodatenstrom VDS von der codierten Information des Eingangsdatenstroms errechnet werden, wie die obige Herleitung zeigt. Therefore, the residual to be coded in the output video data stream VDS can be calculated from the coded information of the input data stream, as the above derivation shows.

Die hierbei verwendeten Symbole sind wie folgt:

I:
Pixelwerte des Bildblocks des im gegenwärtigen Schritt zu codierenden Bildes,
IRef:
Pixelwerte des Bildblocks gleichen Orts im Referenzbild,
P:
Pixelwerte des Prädiktors für das gegenwärtige Bild, welche von dem Referenzbild errechnet sind,
R:
Pixelwerte des Residuum-Blocks im gegenwärtigen Bild,
I ~,I ~Ref, P ~, R ~:
Transformationskoeffizienten der entsprechenden Signale I, IRef, P, R,
T(·):
Transformationsoperation, beispielsweise diskrete Kosinus-Transformation (DCT).
The symbols used here are as follows:
I:
Pixel values of the image block of the image to be encoded in the current step,
I Ref :
Pixel values of the image block same location in the reference image,
P:
Pixel values of the predictor for the current image calculated from the reference image,
R:
Pixel values of the residual block in the current image,
I ~, I ~ Ref , P ~, R ~:
Transformation coefficients of the corresponding signals I, I Ref , P, R,
T (·):
Transformation operation, for example discrete cosine transformation (DCT).

Für den Fall, dass der INTRA-Codiermodus für den betrachteten Bildblock ausgewählt in dem Ausgangs-Videodatenstrom ist, können die Koeffizienten des Eingangs-Bilddatenstroms zur Berechnung der Koeffizienten des Videodatenstroms verwendet werden, ohne dazwischen die Pixelwerte für den betrachteten Bildblock zu decodieren. Im speziellen Fall, dass das Ausgangs-Codierformat ein Superset des Eingangs-Codierformats ist, können die gleichen Codierparameter in dem Ausgangs-Videodatenstrom gewählt werden. Dies ist beispielsweise beim Transcodieren von einem H.264/AVC INTRA-Profil in ein H.264/AVC INTER-Profil der Fall. In the event that the INTRA encoding mode for the frame of interest is selected in the output video stream, the coefficients of the input image stream can be used to compute the coefficients of the video stream without decoding the pixel values for the frame of interest considered. In the specific case that the output coding format is a superset of the input coding format, the same coding parameters can be chosen in the output video data stream. This is the case, for example, when transcoding from an H.264 / AVC INTRA profile to an H.264 / AVC INTER profile.

Wenn in der Codierschleife zusätzliche Operationen, wie z.B. ein Deblocking-Filtering oder ein Adaptive-Loop-Filtering, ausgeführt werden, kann die Ermittlung des Residuums in der komprimierten Domäne zu einer Degradation der Bildqualität führen, v.a., wenn diese Operationen bei der Decodierung des Einzelbildstroms nicht durchgeführt werden. Ebenso könnten decodierte Pixelwerte des Ausgangs-Videodatenstroms durch diese Operationen verändert werden. Daher ist es zweckmäßig, die Durchführung von Filteroperationen zu deaktivieren, was beispielsweise durch die entsprechende Codierung eines entsprechenden Flags, welches die Handhabung des Filterns für den Decoder anzeigt, möglich ist. If in the coding loop additional operations, e.g. deblocking filtering or adaptive loop filtering, determining the residual in the compressed domain may result in image quality degradation, particularly if these operations are not performed in decoding the frame stream. Likewise, decoded pixel values of the output video data stream could be altered by these operations. Therefore, it is expedient to deactivate the execution of filter operations, which is possible, for example, by the corresponding coding of a corresponding flag which indicates the handling of the filtering for the decoder.

Einige INTRA-Codierverfahren, wie z.B. JPEG, verwenden eine Prädiktion eines DC-Koeffizienten, um die Datenrate zu reduzieren. Typischerweise wird hierfür eine einfache differentielle Puls-codierte Modulation (Differential Pulse Coding Modulation, DPCM) verwendet. Hierbei wird der DC-Transformationskoeffizient des gegenwärtigen Bildblocks als Differenz zu einem entsprechenden Wert des vorhergehenden Bildblocks im gleichen Bild codiert. Hieraus resultiert eine Prädiktionskette, die im ersten Block in dem Bild startet. Der DC-Koeffizient umfasst beispielsweise einen Gleichanteil der mittleren Helligkeit des Bildes. Some INTRA coding methods, such as e.g. JPEG, use a prediction of a DC coefficient to reduce the data rate. Typically, a simple differential pulse-coded modulation (DPCM) is used for this purpose. Here, the DC transformation coefficient of the current image block is coded as a difference to a corresponding value of the previous image block in the same image. This results in a prediction chain that starts in the first block in the image. The DC coefficient includes, for example, a DC component of the average brightness of the image.

Um das Ergebnis der Fehlermetrik für die Auswahl des Codiermodus und die Transformationskoeffizienten des Residuums (R ~) korrekt berechnen zu können, muss diese Operation umgekehrt werden. Dies bedeutet, die DC-Transformationskoeffizienten müssen von den Differenzwerten der DC-Werte berechnet werden. Dies kann gemäß nachfolgenden Formeln Schritt für Schritt erfolgen: DCBlk2 = DCBlk1 + ΔDCBlk2, DCBlk3 = DCBlk2 + ΔDCBlk3 .... In order to be able to correctly calculate the result of the error metric for the selection of the coding mode and the transformation coefficients of the residual (R ~), this operation must be reversed. This means that the DC transformation coefficients must be calculated from the difference values of the DC values. This can be done step by step according to the following formulas: DC Blk2 = DC Blk1 + ΔDC Blk2 , DC Blk3 = DC Blk2 + ΔDC Blk3 ....

Wird in der Fehlermetrik der SSLD berechnet, dann ist es zweckmäßig, eine Skalierung (Normierung) auf die Transformationskoeffizienten-Level anzuwenden, um korrekte Werte des SSLD für die Codiermodus-Auswahl und die Transformationskoeffizienten des Residuums zu berechnen. Dies ist von Bedeutung, wenn die Quantisierungsparameter QP und daher die Quantisierungsschrittgröße von Bild zu Bild variiert oder sogar von dem Bildblock des Referenzbildes zu dem Bildblock des betrachteten Bildes. Daher werden die Transformationskoeffizienten-Level des Referenzbildblocks mit dem Faktor s,

Figure DE102012212068A1_0011
multipliziert, bevor der SSLD und unter Umständen die Transformationskoeffizienten-Level des Residuums ermittelt werden. stepsizeRef und stepsizeCur sind die Quantisierungsschrittgrößen, die in dem Referenz- und dem gegenwärtigen Bildblock verwendet werden. Der SSLD kann dann nach folgender Formel ermittelt werden:
Figure DE102012212068A1_0012
When computing the SSLD in the error metric, it is convenient to apply a scaling (normalization) to the transform coefficient levels to compute correct values of the SSLD for the encoding mode selection and the transformation coefficients of the residual. This is important if the quantization parameters QP and therefore the quantization step size vary from image to image or even from the image block of the reference image to the image block of the viewed image. Therefore, the transform coefficient levels of the reference picture block become s,
Figure DE102012212068A1_0011
multiplied before the SSLD and possibly the transformation coefficient levels of the residuum are determined. stepsize Ref and stepsize Cur are the quantization step sizes used in the reference and current image blocks. The SSLD can then be determined using the following formula:
Figure DE102012212068A1_0012

Darüber hinaus ist es möglich, eine Aggregation, beispielsweise eine einfache Mittelwertbildung, von MSE bzw. SSD bzw. SSLD für eine Mehrzahl von Bildblöcken vor der Grundentscheidung, welcher Codiermodus verwendet wird, auszuführen. Der zu codierende Bildblock in dem Ausgangs-Videodatenstrom könnte mehrere Bildblöcke und/oder Teilblöcke in dem bereichsgleichen Ort des Eingangs-Bitdatenstroms umfassen. Dies könnte beispielsweise der Fall sein bei der Verwendung verschiedener Bildblockgrößen im Eingangs- und Ausgangsdatenstrom. In diesem Fall kann die Auswahl des Codiermodus durch die Aggregation von MSE oder SSD oder SSLD von mehreren Bildblöcken erfolgen. Im Fall, dass ein Bildblock im Eingangs-Bilddatenstrom lediglich teilweise den Bildblock des Ausgangs-Videodatenstroms umfasst, kann sein Gewicht proportional zu dem Bereich, d.h. der Anzahl der Pixel, gesetzt werden. Moreover, it is possible to perform an aggregation, for example a simple averaging, of MSE or SSD or SSLD for a plurality of image blocks before the basic decision as to which coding mode is used. The image block to be encoded in the output video data stream could comprise a plurality of image blocks and / or sub-blocks in the same location of the input bitstream. This could for example be the case when using different image block sizes in the input and output data stream. In this case, the encoding mode selection can be done by aggregating MSE or SSD or SSLD from multiple image blocks. In the case of an image block in the input image data stream only partially covers the image block of the output video data stream, its weight may be set proportional to the range, ie the number of pixels.

Literaturverzeichnis bibliography

  • [1] Thomas Wiegand et al., „Lagrange Multiplier Selection in Hybrid Video Coder Control“, ICIP 2001, Thessaloniki, Greece, p. 1–4. [1] Thomas Wiegand et al., "Lagrange Multiplier Selection in Hybrid Video Coder Control", ICIP 2001, Thessaloniki, Greece, p. 1-4.

ZITATE ENTHALTEN IN DER BESCHREIBUNG QUOTES INCLUDE IN THE DESCRIPTION

Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of the documents listed by the applicant has been generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.

Zitierte Nicht-PatentliteraturCited non-patent literature

  • Standard H.264 [0032] Standard H.264 [0032]

Claims (15)

Verfahren zum Erzeugen eines codierten Videodatenstroms (VDS) aus einer Folge von ersten Bildern (P11, P12), wobei – die ersten Bilder (P11, P12) codierte Einzelbilder (SP1, SP2) sind, die keine Datenabhängigkeit zueinander aufweisen und als Bilddatenstrom (BDS) bereitgestellt sind; – der codierte Videodatenstrom (VDS) eine Bildsequenz (BS) mit voneinander abhängigen zweiten Bildern (P21, P22) umfasst; – die jeweiligen Bilder jeweils eine Mehrzahl an Bildblöcken (BB) mit einer Mehrzahl an jeweiligen Transformationskoeffizienten (ci, li) aufweisen; bei dem folgende Schritte durchgeführt werden: – Vergleich der Transformationskoeffizienten (ci, li) zumindest eines Bildblocks (BB11) eines als Referenz dienenden ersten Einzelbilds (SP1) mit den Transformationskoeffizienten (ci, li) eines Bildblocks (BB12) gleichen Orts eines zweiten, zu codierenden Einzelbilds (SP2) basierend auf einer Fehlermetrik; – Auswahl eines Codiermodus für das zu codierende zweite Einzelbild (SP2) in ein zweites Bild (P22) des Videodatenstroms (VDS) basierend auf dem Vergleichsergebnis; – Codieren des Bildblocks (BB12) des zu codierenden zweiten Einzelbilds (SP2) mit dem ausgewählten Codiermodus. Method for generating a coded video data stream (VDS) from a sequence of first pictures (P11, P12), wherein - the first pictures (P11, P12) are coded individual pictures (SP1, SP2) which have no data dependency on one another and are used as picture data stream (BDS ) are provided; - the coded video data stream (VDS) comprises an image sequence (BS) with interdependent second images (P21, P22); - The respective images each have a plurality of image blocks (BB) having a plurality of respective transformation coefficients (c i , l i ); in which the following steps are performed: - comparison of the transformation coefficients (c i , l i ) of at least one image block (BB11) of a reference frame (SP1) with the transformation coefficients (c i , l i ) of an image block (BB 12) of the same location a second frame to be encoded (SP2) based on an error metric; Selecting a coding mode for the second frame (SP2) to be encoded into a second frame (P22) of the video data stream (VDS) based on the comparison result; - Coding the image block (BB12) of the second frame to be coded (SP2) with the selected coding mode. Verfahren nach Anspruch 1, bei dem als erstes und als zweites Einzelbild (SP1, SP2) zwei zeitlich benachbarte erste Bilder (P11, P12) für den Vergleich der Transformationskoeffizienten (ci, li) ausgewählt werden. Method according to Claim 1, in which two temporally adjacent first images (P11, P12) are selected as the first and second individual image (SP1, SP2) for the comparison of the transformation coefficients (c i , l i ). Verfahren nach Anspruch 1 oder 2, bei dem als Codierungsmodi in Abhängigkeit von dem Vergleichsergebnis der Skip-Codiermodus oder der INTER-Codiermodus oder der INTRA-Codiermodus verwendet wird. Method according to Claim 1 or 2, in which the skip coding mode or the INTER coding mode or the INTRA coding mode is used as the coding modes as a function of the comparison result. Verfahren nach einem der vorhergehenden Ansprüche, bei dem die Transformationskoeffizienten (ci, li) durch ihre Level (l) und eine Quantisierungsschrittgröße (q) repräsentiert sind. Method according to one of the preceding claims, in which the transformation coefficients (c i , l i ) are represented by their level (l) and a quantization step size (q). Verfahren nach einem der vorhergehenden Ansprüche, bei dem als Fehlermetrik der mittlere quadratische Fehler (MSE) oder die Summe der quadrierten Differenzen (SSD) der Transformationskoeffizienten (ci, li) verarbeitet wird. Method according to one of the preceding claims, in which the mean square error (MSE) or the sum of the squared differences (SSD) of the transformation coefficients (c i , l i ) is processed as an error metric. Verfahren nach einem der Ansprüche 1 bis 5, bei dem als Codiermodus Skip gewählt wird, wenn das Ergebnis der Fehlermetrik kleiner als ein erster Schwellwert ist. Method according to one of Claims 1 to 5, in which Skip is selected as the coding mode if the result of the error metric is smaller than a first threshold value. Verfahren nach einem der Ansprüche 1 bis 5, bei dem, wenn das Ergebnis der Fehlermetrik kleiner als ein erster Schwellwert (th1,MSE, th1,SSD, th1,SSLD) und der implizit bestimmte Bewegungsvektor (MV) des gerade verarbeiteten Bildblocks ungleich Null ist, als Codiermodus INTER gewählt wird, wobei ein den Bewegungsvektor (MV) repräsentierender Parameter explizit zu Null gewählt wird. Method according to one of claims 1 to 5, wherein when the result of the error metric is smaller than a first threshold (th 1, MSE , th 1, SSD , th 1, SSLD ) and the implicitly determined motion vector (MV) of the image block being processed is not equal to zero, is selected as the encoding mode INTER, wherein a parameter representing the motion vector (MV) is explicitly set to zero. Verfahren nach einem der vorhergehenden Ansprüche, bei dem ein zweiter Schwellwert (th2,MSE, th2,SSD, th2,SSLD) vorgegeben ist, der größer als der erste Schwellwert (th1,MSE, th1,SSD, th1,SSLD) ist, wobei a) als Codiermodus INTER gewählt wird, wenn das Ergebnis der Fehlermetrik größer als der erste Schwellwert (th1,MSE, th1,SSD, th1,SSLD) und kleiner als der zweite Schwellwert (th2,MSE, th2,SSD, th2,SSLD) ist, b) als Codiermodus INTRA oder INTER mit einem Bewegungsvektor ungleich Null gewählt wird, wenn das Ergebnis der Fehlermetrik größer als der zweite Schwellwert (th2,MSE, th2,SSD, th2,SSLD) ist. Method according to one of the preceding claims, in which a second threshold value (th 2, MSE , th 2, SSD , th 2, SSLD ) which is greater than the first threshold value (th 1, MSE , th 1, SSD , th 1 , SSLD ), where a) is selected as the encoding mode INTER, if the result of the error metric is greater than the first threshold value (th 1, MSE , th 1, SSD , th 1, SSLD ) and smaller than the second threshold value (th 2, MSE , th 2, SSD , th 2, SSLD ), b) is selected as the encoding mode INTRA or INTER with a motion vector not equal to zero, if the result of the error metric is greater than the second threshold (th 2, MSE , th 2, SSD , th 2, SSLD ). Verfahren nach Anspruch 8, bei dem in Variante a) ein oder mehrere den Bewegungsvektor (MV) repräsentierender Parameter des INTER-Codiermodus explizit zu Null gewählt werden.  Method according to Claim 8, in which, in variant a), one or more parameters of the INTER coding mode which represent the motion vector (MV) are explicitly selected to be zero. Verfahren nach Anspruch 8 oder 9, bei dem bei ausgewähltem INTER-Codiermodus in der Transformationsebene ein Residuum, das für das zu codierende Einzelbild in dem Videodatenstrom zu codieren ist, aus der Differenz der Transformationskoeffizienten (ci, li) der Bildblöcke (BB11, BB12) gleichen Orts des ersten und des zweiten Einzelbilds (SP1, SP2) ermittelt wird. Method according to Claim 8 or 9, in which, with the INTER-coding mode selected in the transformation plane, a residual to be coded for the single picture to be coded in the video data stream is calculated from the difference of the transformation coefficients (c i , l i ) of the picture blocks (BB 11, BB12) same location of the first and the second frame (SP1, SP2) is determined. Verfahren nach einem der vorhergehenden Ansprüche, bei dem in dem codierten Videodatenstrom (VDS) ein Flag gesetzt wird, welches ein Filtern der Bilddaten des Videodatenstroms (VDS) beim Decodieren unterdrückt. Method according to one of the preceding claims, in which a flag is set in the coded video data stream (VDS) which suppresses filtering of the video data stream (VDS) image data during decoding. Verfahren nach einem der vorhergehenden Ansprüche, bei dem für die Verarbeitung der Fehlermetrik zur Auswahl des Codiermodus und/oder zur Berechnung des Residuums ein Transformationskoeffizient, der einen Differenzwert eines DC-Wertes umfasst oder repräsentiert, auf einen absoluten Wert des DC-Wertes zurückgerechnet wird. Method according to one of the preceding claims, wherein for the processing of the error metric for the selection of the coding mode and / or for the calculation of the residual a transformation coefficient, the includes or represents a difference value of a DC value, is calculated back to an absolute value of the DC value. Verfahren nach einem der vorhergehenden Ansprüche, bei dem für die Verarbeitung der Fehlermetrik zur Auswahl des Codiermodus und/oder zur Berechnung des Residuums eine Normierung der Quantisierungsschrittgröße (q) erfolgt, wenn die Quantisierungsschrittgröße (q) zwischen dem ersten und dem zweiten Einzelbild (SP1, SP2) variiert. Method according to one of the preceding claims, in which the quantization step size (q) between the first and the second individual image (SP1, SP2) varies. Vorrichtung zum Erzeugen eines codierten Videodatenstroms (VDS) aus einer Folge von ersten Bildern (P11, P12), wobei – die ersten Bilder (P11, P12) codierte Einzelbilder (SP1, SP2) sind, die keine Datenabhängigkeit zueinander aufweisen und als Bilddatenstrom (BDS) bereitgestellt sind; – der codierte Videodatenstrom (VDS) eine Bildsequenz (BS) mit voneinander abhängigen zweiten Bildern (P21, P22) umfasst; – die jeweiligen Bilder jeweils eine Mehrzahl an Bildblöcken (BB) mit einer Mehrzahl an jeweiligen Transformationskoeffizienten (ci, li) aufweisen; umfassend die folgenden Einheiten: – ein erste Einheit (E1) zum Vergleich der Transformationskoeffizienten (ci, li) zumindest eines Bildblocks (BB11) eines als Referenz dienenden ersten Einzelbilds (SP1) mit den Transformationskoeffizienten (ci, li) eines Bildblocks (BB12) gleichen Orts eines zweiten, zu codierenden Einzelbilds (SP2) basierend auf einer Fehlermetrik; – eine zweite Einheit (E2) zur Auswahl eines Codiermodus für das zu codierende zweite Einzelbild (Sp2) in ein zweites Bild (P22) des Videodatenstroms basierend auf dem Vergleichsergebnis; – eine dritte Einheit (E3) zum Codieren des Bildblocks des zu codierenden zweiten Einzelbilds (SP2) mit dem ausgewählten Codiermodus. Device for generating a coded video data stream (VDS) from a sequence of first images (P11, P12), wherein - the first images (P11, P12) are coded individual images (SP1, SP2) which have no data dependency on one another and are used as image data stream (BDS ) are provided; - the coded video data stream (VDS) comprises an image sequence (BS) with interdependent second images (P21, P22); - The respective images each have a plurality of image blocks (BB) having a plurality of respective transformation coefficients (c i , l i ); comprising the following units: a first unit (E1) for comparing the transformation coefficients (c i , l i ) of at least one image block (BB11) of a reference frame (SP1) with the transformation coefficients (c i , l i ) of an image block (BB12) same location of a second frame to be encoded (SP2) based on an error metric; A second unit (E2) for selecting a coding mode for the second frame (Sp2) to be encoded into a second frame (P22) of the video stream based on the comparison result; A third unit (E3) for coding the image block of the second frame (SP2) to be coded with the selected coding mode. Transcodiervorrichtung (TVOR) zum Erzeugen eines transcodierten Videodatenstroms (TVDS) aus einem codierten Videodatenstrom (VDS), der nach einem der Ansprüche 1 bis 14 erzeugbar ist, umfassend die folgenden Einheiten: – ein erste Einheit (E1) zum Vergleich der Transformationskoeffizienten (ci, li) zumindest eines Bildblocks eines als Referenz dienenden ersten Einzelbilds mit den Transformationskoeffizienten (ci, li) eines Bildblocks gleichen Orts eines zweiten, zu codierenden Einzelbilds basierend auf einer Fehlermetrik; – eine zweite Einheit (E2) zur Auswahl eines Codiermodus für das zu codierende zweite Einzelbild in ein zweites Bild des Videodatenstroms basierend auf dem Vergleichsergebnis; – eine vierte Einheit (E4) zum Erzeugen des transcodierten Videodatenstroms (VDS) durch Einfügen des mit dem ausgewählten Codiermodus codierten Bildblocks des zu codierenden zweiten Einzelbilds (SP2) in den transcodierten Videodatenstrom (VDS). Transcoding device (TVOR) for generating a transcoded video data stream (TVDS) from a coded video data stream (VDS), which can be generated according to one of claims 1 to 14, comprising the following units: - a first unit (E1) for comparing the transformation coefficients (c i , l i ) at least one image block of a first single frame serving as reference with the transformation coefficients (c i , l i ) of an image block same location of a second frame to be coded based on an error metric; A second unit (E2) for selecting an encoding mode for the second frame to be encoded into a second frame of the video stream based on the comparison result; - A fourth unit (E4) for generating the transcoded video data stream (VDS) by inserting the encoded with the selected encoding mode image block of the second frame to be encoded (SP2) in the transcoded video data stream (VDS).
DE201210212068 2012-07-11 2012-07-11 Method for generating and transcoding encoded video data stream (VDS) of sequence of images, involves carrying out encoding mode for image frames of VDS, based on comparison result, for encoding image blocks with selected coding mode Withdrawn DE102012212068A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE201210212068 DE102012212068A1 (en) 2012-07-11 2012-07-11 Method for generating and transcoding encoded video data stream (VDS) of sequence of images, involves carrying out encoding mode for image frames of VDS, based on comparison result, for encoding image blocks with selected coding mode

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE201210212068 DE102012212068A1 (en) 2012-07-11 2012-07-11 Method for generating and transcoding encoded video data stream (VDS) of sequence of images, involves carrying out encoding mode for image frames of VDS, based on comparison result, for encoding image blocks with selected coding mode

Publications (1)

Publication Number Publication Date
DE102012212068A1 true DE102012212068A1 (en) 2014-01-16

Family

ID=49781480

Family Applications (1)

Application Number Title Priority Date Filing Date
DE201210212068 Withdrawn DE102012212068A1 (en) 2012-07-11 2012-07-11 Method for generating and transcoding encoded video data stream (VDS) of sequence of images, involves carrying out encoding mode for image frames of VDS, based on comparison result, for encoding image blocks with selected coding mode

Country Status (1)

Country Link
DE (1) DE102012212068A1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110103468A1 (en) * 2009-11-04 2011-05-05 Qualcomm Incorporated Controlling video encoding using audio information

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110103468A1 (en) * 2009-11-04 2011-05-05 Qualcomm Incorporated Controlling video encoding using audio information

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
PENG, Y.; TOURAPIS, H.-Y.C.; TOURAPIS, A.M.; BOYCE, J.: "Fast mode decision and motion estimation for JVT/H.264," Image Processing, 2003. ICIP 2003. Proceedings. 2003 International Conference on , vol.3, no., pp. III- 853-6 vol.2, 14-17 Sept. 2003doi: 10.1109/ICIP.2003.1247379 *
SMITH, B.C.; ROWE, L.A.: "Algorithms for manipulating compressed images," Computer Graphics and Applications, IEEE , vol.13, no.5, pp.34-42, Sept. 1993doi: 10.1109/38.232097 *
Standard H.264
Thomas Wiegand et al., "Lagrange Multiplier Selection in Hybrid Video Coder Control", ICIP 2001, Thessaloniki, Greece, p. 1-4.
Wiegand, T.; Girod, B.; , "Lagrange multiplier selection in hybrid video coder control," Image Processing, 2001. Proceedings. 2001 International Conference on , vol.3, no., pp.542-545 vol.3, 2001doi: 10.1109/ICIP.2001.958171 *
WU, J.-L. Et al.: "An efficient JPEG to MPEG-1 transcoding algorithm," Consumer Electronics, IEEE Transactions on , vol.42, no.3, pp.447-457, Aug 1996 doi: 10.1109/30.536142 *

Similar Documents

Publication Publication Date Title
DE60001896T2 (en) QUANTIZER FOR VIDEO COMPRESSION
DE60215241T2 (en) Method and device for reducing interference in decoded images with postfiltering
EP1635578B1 (en) Method and device for video coding, the video coding comprising texture analysis, texture synthesis and texture warping, a corresponding computer program and a corresponding computer-readable storage medium
DE19638632B4 (en) Method and apparatus for moving picture coding
EP1774790B1 (en) Coding and decoding method and device
DE112012006541B4 (en) Video compression method
EP2521357A1 (en) Method and device for filtering of coded image partitions
EP2373030A1 (en) Method for compressing image data
DE10296787B4 (en) Selective predication for intra-coding a video data block
DE19717608B4 (en) Perception error handling method and picture coding apparatus using this method
EP2777017B1 (en) Method for processing an image sequence and tester for a car
DE10218541A1 (en) Context-adaptive binary arithmetic video coding, e.g. for prediction error matrix spectral coefficients, uses specifically matched context sets based on previously encoded level values
DE19753976A1 (en) Adaptive video decoder for video transmission system
DE19643907B4 (en) Method and apparatus for moving picture coding
EP0414017A2 (en) Method for object-oriented movement compensation of picture information for the reproduction of coded moving picture sequences
DE102006003168A1 (en) A coding apparatus, method for adjusting a decoding calculation and computer program product therefor
DE102012212068A1 (en) Method for generating and transcoding encoded video data stream (VDS) of sequence of images, involves carrying out encoding mode for image frames of VDS, based on comparison result, for encoding image blocks with selected coding mode
EP1869890B1 (en) Method and device for minimising a quantisation error
DE102015010412B3 (en) A method, apparatus and computer program product for compressing an input data set
DE19737835C2 (en) Method for compressing image information
EP2229781B1 (en) Method and device for determining image quality
DE10219640A1 (en) Video coding and decoding method and computer program product
DE10225434B4 (en) Video coding method and apparatus
DE102018110383A1 (en) Method and device for coding image data
WO2001063939A1 (en) Method and device for encoding a video signal and an audio signal, computer-readable storage medium and computer program element

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: H04N0007500000

Ipc: H04N0019610000

Effective date: 20131205

R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee

Effective date: 20150203