WO2003026310A2 - Effiziente videocodierung für skalierbare simul-cast-speicherung und -übertragung - Google Patents

Effiziente videocodierung für skalierbare simul-cast-speicherung und -übertragung Download PDF

Info

Publication number
WO2003026310A2
WO2003026310A2 PCT/DE2002/003454 DE0203454W WO03026310A2 WO 2003026310 A2 WO2003026310 A2 WO 2003026310A2 DE 0203454 W DE0203454 W DE 0203454W WO 03026310 A2 WO03026310 A2 WO 03026310A2
Authority
WO
WIPO (PCT)
Prior art keywords
signal
transformation
signals
video coding
decoding
Prior art date
Application number
PCT/DE2002/003454
Other languages
English (en)
French (fr)
Other versions
WO2003026310A3 (de
Inventor
Peter Amon
Gero BÄSE
Klaus Illgner-Fehns
Jürgen PANDEL
Original Assignee
Siemens Aktiengesellschaft
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from DE10200901A external-priority patent/DE10200901B4/de
Application filed by Siemens Aktiengesellschaft filed Critical Siemens Aktiengesellschaft
Publication of WO2003026310A2 publication Critical patent/WO2003026310A2/de
Publication of WO2003026310A3 publication Critical patent/WO2003026310A3/de

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation

Definitions

  • the invention relates to a method for scalable video coding, in which an input signal with video image information is fed to a plurality of encoders comprising quantizers, the encoders quantize the video signal at different resolution levels in different quality levels and then perform entropy coding, as well as one corresponding device.
  • Application scenarios are, in particular, mobile devices on which image sequences that were actually coded for desktop applications should be reproducible. Video conferences between participants with desktop and mobile devices also require skillful adjustment of the quality levels.
  • a participant is a mobile
  • the sender / initiator is not necessarily aware of a subscriber who, in particular, does not have the same capability as a fixed subscriber.
  • variable network quality bandwidth, error rate, etc.
  • a service provider who can also be a private individual provides video material for retrieval.
  • a client requests the compressed video data while the decoded image material is already being displayed.
  • the provider has to take very different customer requirements into account.
  • SNR signal-to-noise ratio
  • local and temporal scalability common to all methods is that by varying certain coding parameters, the same picture sequence is coded at different bit rates. In the case of SNR scaling, different quality levels and bit rates are achieved by varying the quantization.
  • Local scalability describes methods that code the image sequence with different spatial resolutions (image sizes).
  • image sequences with different image frequencies are scalable over time. It should be noted that any combination of the three types is possible.
  • the video content has been provided either by encoding the video data in a scalable format or by keeping a separate data stream available for each quality level (simulstore) or sending it out (simulcast).
  • So-called simulcast coding in which the desired bit streams are generated with differently parameterized parallel and independently operating codecs, has so far achieved better quality at the same bit rate.
  • Si ulcast coding method a not inconsiderable redundancy between the individual bit streams is retained. This is because this process is very wasteful of network resources.
  • the required storage capacity for the different currents is much larger. Scalable coding methods are therefore significantly more efficient.
  • the object of the present invention is therefore to create a more efficient coding of video signals for scalable simulcast storage and transmission. Another The task is to efficiently decode such signals.
  • the method named input is further developed in that the encoders are coupled to one another in such a way that in one or more encoders, instead of entropy coding of quantized transformation signals, quantized difference signals from transformation signals are subjected to entropy coding, as a result of which output signals quantized at the different resolution levels be preserved.
  • this can be achieved in a particularly advantageous manner by quantization and entropy coding of the difference between a transformation signal before the assigned quantization and a transformation signal of a lower quality level after assigned quantization and inverse quantization. This is especially true when the quantizers are embedded in one another.
  • the quantization parameters of successive quality levels have a certain ratio.
  • the ratio of the quantization parameter of a first quality level to a quantization parameter of a second, subsequent quality level must be a natural number.
  • a quantization parameter is to be understood as the step height of a quantizer.
  • entropy coding of the difference between a first transformation signal and a second transformation signal is carried out in a second embodiment of the invention, the first transformation signal being the transformation signal after the assigned quantization and the second transformation signal by prediction of the first transformation signal is obtained.
  • the prediction is preferably carried out with the aid of the transformation signal of a lower quality level after assigned quantization.
  • the prediction error of a prediction of a quantized transformation signal is thus subjected to entropy coding.
  • the second transformation signal is preferably obtained by multiplying the transformation signal of the lower quality level after assigned quantization by a factor for adapting the transformation signal of the lower quality level after assigned quantization to the first transformation signal.
  • the factor is in particular the quotient of the quantization parameters of the lower and the quality level used for the first transformation signal. In this way, a value for the first transformation signal can be predicted in a simple manner.
  • M t [2 n xa t ], where n is a natural number, i is the index for the quality level, oti is the factor for adapting the transformation signal of the lower quality level i-1 to the transformation signal of quality level i,
  • Li-i is the lower quality level transformation signal i-1
  • sign (x) is the signum function
  • [x] is the integer part of x, i.e. the biggest whole
  • the encoders work synchronized.
  • an encoder preferably works as a master, followed by the other encoders as slaves, by determining an optimal coding mode for the master encoder, which is transmitted to the slave encoders.
  • a motion estimation is preferably carried out at a medium or the highest quality level.
  • a major advantage of the method according to the present invention is the possibility of making a selection of the master encoder based on the application using the best coding parameters.
  • a decoding of encoded video signals in this manner is preferably accomplished by the encoded input signals with quantized at different resolution levels video signals each having a Swisssschrit 't comprising a separate entropy decoding and inverse quantization are subjected.
  • a method is used in particular in which the signals obtained after the processing step are combined and the resulting overall signal is subjected to a common inverse transformation.
  • the signals obtained by the respective processing step are preferably linked by summation.
  • a method is used in particular in which the processing step proceeds in such a way that in all but the lowest resolution level, the signal obtained after the separate entropy decoding is added to a prediction signal which is predicted of the transformation signal quantized in the corresponding encoder is obtained, and the added signals are fed to an inverse quantization.
  • the prediction is preferably carried out with the aid of the signal of the lower resolution level supplied to the inverse quantization.
  • the prediction proceeds analogously to the prediction carried out during coding, the first transformation signal now being the transformation signal quantized in the corresponding encoder and the second transformation signal is the signal of a lower resolution level supplied to the inverse quantization.
  • a signal is also selected from the signals obtained after the processing step, and the selected signal is subjected to an inverse transformation.
  • the coding method according to the invention is combined with the decoding method according to the invention to form a common method.
  • the invention also relates to a device for scalable video coding with a plurality of encoders comprising quantizers, each of which is supplied with an input signal with video image information and by means of which the video signal can be quantified at different resolution levels in different quality levels, with the Device the inventive method for scalable video coding can be carried out.
  • the invention comprises a device for decoding video signals coded according to the coding method according to the invention, with which the decoding method according to the invention can be carried out.
  • the invention relates to a codec for scalable video coding and video decoding with a plurality of encoders comprising quantizers, each of which uses video image information as an input signal, and by means of which the video signal can be quantized at different resolution levels in different quality levels using quantization parameters and subsequently entropy coded, the Codec is designed in such a way that the methods according to the invention for coding and decoding video signals can be carried out.
  • FIG. 1 shows a simplified block diagram of a hybrid video encoder and decoder according to the prior art
  • codec a first embodiment of the device according to the invention comprising three encoders and decoders
  • codec shows a block diagram of a second embodiment of the device according to the invention (codec) comprising three encoders and decoders 4 shows a schematic diagram for the synchronization of several encoders according to the invention.
  • codec a “codec”, also referred to in the literature as a coder / decoder or as a compression and decompression algorithm, coded (synonymously compressed) ) and decodes (synonymously decompressed) different types of data.
  • codec also referred to in the literature as a coder / decoder or as a compression and decompression algorithm, coded (synonymously compressed) ) and decodes (synonymously decompressed) different types of data.
  • Such coding / decoding is particularly necessary in connection with data that would otherwise require a large amount of storage space and / or transmission bandwidth, such as video and audio data.
  • Commonly used codecs are such which convert digital or digitized analog video signals into compressed video data (e.g. MPEG) or digitized analog or digital audio signals into compressed audio data (e.g. MP3, RealAudio)
  • codecs can be used in real time (e.g. communication) or based on storage files (e
  • the methods according to the invention detailed below are based on a method for optimal SNR scalability, but can also be applied to other existing coding schemes. Differences essentially relate to the design of the quantizers.
  • the advantage over conventional simulcast methods is a significant reduction in the required data rate by coupling the entropy coding of the transformation coefficients.
  • the process is characterized by the fact that it is based on the hybrid coder concept and is therefore fundamentally compatible with existing standards for video coding. The objection often made that new processes are not compatible with existing processes does not apply here.
  • FIG. 1 shows a simplified block diagram of a hybrid video encoder.
  • n such encoders with corresponding quantization parameters or other parameters are required.
  • FIG 1 mean:
  • T transformation unit (e.g. DCT, integer
  • IQ unit for performing inverse quantization
  • the basic principle of the hybrid coder concept is the coding of a prediction error signal, which results from the difference between the input signal and (quantized) motion-compensated reconstruction of the previous picture.
  • a prediction error signal results from the difference between the input signal and (quantized) motion-compensated reconstruction of the previous picture.
  • the prediction there are very many variants that all have the temporal prediction in common. However, it is also possible that already co- predicted parts of the picture within the same picture is predicted.
  • the prediction error is often coded after a transformation for decorrelation (exploitation of local statistical dependencies) has been carried out.
  • the intensities of the prediction error signal are quantized directly in the spatial region or else the transformation coefficients are quantified and then compressed losslessly via entropy coding, and onto one . binary signal mapped.
  • Video data applied to the encoder on the input side undergo a transformation T and a quantization Q.
  • this signal is fed to an entropy encoder EC, which provides a compressed video data stream.
  • the encoder internally performs an inverse quantization IQ and a subsequent inverse transformation IT.
  • This signal arrives in an image memory Sp, the output of which is fed back to the input and, on the other hand, reaches the input of the transformation T negatively.
  • the image memory Sp controls a motion estimator MS, which in turn receives the video input data on the input side and provides motion vectors MV to control the image memory SP in the encoder. In addition, these motion vectors are also transmitted to the decoder and are also used there to control a decoder-side image memory Sp.
  • entropy decoding ED of the compressed video data is carried out, followed by inverse quantization IQ and inverse transformation IT.
  • the so average decoded video data added to the data of the image memory represent the output of the decoder.
  • This sum signal is also fed to the image memory Sp on the decoder side, the output of which is fed back to the input of the adder.
  • FIG. 2 now shows a new arrangement according to a first embodiment of the invention, which consists of three encoders and decoders, the signals of which are linked to one another.
  • the three encoders which are arranged one above the other on the left side of the block diagram, generate three data streams D1, D2 and D3, which are transmitted to the decoder.
  • Encoder 1 encodes the video data in a low quality level, encoder 2 in a medium quality level and encoder 3 in a high quality level.
  • the signals in FIG. 2 mean:
  • the input image signal X is fed to all three encoders.
  • a transformation T takes place in each encoder, from which Xi is obtained as a transformation signal before the quantization Q.
  • Li is obtained from the quantization, which is directly entropy encoded only with encoder 1 (low quality level) ECi is supplied, from which the first compressed data stream Dj . results.
  • Li is returned via an inverse quantization IQi and inverse transformation IT and an image memory Sp to the input of encoder 1, as shown in FIG. 1.
  • Such negative feedback also occurs with the other encoders.
  • the output-side signal Xi 'of the inverse quantization IQi from encoder 1 now additionally serves to link the transformation signal before the quantization X 2 from encoder 2.
  • this difference signal ⁇ X 2 is entropy encoded after prior quantization Q 2 to the compressed output signal D 2 .
  • the coding for the third encoder is analogous to encoder 2, with the corresponding signals from encoder 2 being accessed.
  • the data stream Di is now subjected to entropy decoding EDi and a subsequent inverse quantization IQ ⁇ , from which a signal X D ⁇ is recovered.
  • ⁇ Xi ' is obtained as a signal after quantization and inverse quantization of ⁇ Xi.
  • the signal ⁇ X 2 ' is added to X D1 , which results in X D2 , which in turn together with the signal ⁇ x 3 ' gives the signal X D3 .
  • an inverse transformation exclusively of the signal X D3 which results in the decoded output signal, is now carried out particularly easily and thus very effectively. In the case of motion compensation, this passes through an image memory Sp on the decoder side by additionally serves as an input signal, the output of which is added to the signal X D3 .
  • a quantization process (quantization and subsequent inverse quantization) can be carried out in general
  • Q x is preferably an integer and represents the step height of the respective quantizer and the ⁇ ⁇ are quantizer-dependent rounding parameters with 0 ⁇ a ⁇ 1.
  • the decoder only requires one unit for carrying out the inverse transformation IT and only one image memory SP. Only entropy decoding EDi and inverse quantization IQi have to be carried out separately for each data stream.
  • step heights of the respective quantizers of the first embodiment of the invention are limited in that the ratio of successive step heights is a natural number.
  • the quantizers are no longer limited in their step heights.
  • FIG. 3 shows the second embodiment of the invention, modules and signals which correspond to the modules or signals of FIG. 2 being given the same designations.
  • D_ ' the respective signals supplied to the entropy coding or the decoded signals after the entropy decoding has been carried out.
  • Three encoders are shown, each of which is supplied with the same input signal X comprising video data.
  • the data each undergo a transformation T and quantizations Q_.
  • the signal obtained after the quantization is on the one hand forwarded to an entropy coding EC_ and on the other hand subjected to an inverse quantization IQj_ with a subsequent inverse transformation IT.
  • the signal obtained after the inverse transformation then arrives negatively at the input of the transformation T via respective memories Spj_ and is also fed back again positively to the input of the memory Sp ⁇ .
  • the movement compensation is carried out in the memories with the aid of movement vectors MV, which were determined during the movement estimation.
  • the quantized transformation signals L_ are used for a prediction in which the quantized transformation signal of the next higher resolution level is predicted.
  • the signal L] _ or L2 is multiplied by the factor a2 or a3, this factor preferably being the ratio of the step heights of the quantizations Q] _ and Q2 or Q2 and Q3.
  • Prediction signals L2 'or L3 1 are thus generated, which are then linked to the signals L2 or L3.
  • the link is that the difference D 'or 03 "is formed between L2 and L2' or L3 and L3 1.
  • This difference is then subjected to the entropy codes EC2 or EC3. Since the difference signal has a lower entropy than the quantized transformation signals the coding is more efficient compared to the prior art, and the quantizers of the different quality levels are no longer subject to any restrictions.
  • the transformation signals are preferably multiplied by an integer and subjected to a subsequent right shift operation. This multiplication with subsequent shift to the right is also used on the decoder side, thereby avoiding drift problems between the encoder and decoder.
  • the decoder is shown to the right of the dash-dotted line shown in FIG.
  • the signals Dj_ encoded in the encoder are fed to this decoder. These signals are each subjected to entropy decodings ED_, so that the decoded signals L_, D2 'and D3' are obtained on the output side of the entropy decodings.
  • the signal L] _ is then subjected to an inverse quantization IQ] _, whereas a prediction signal L2 'or L3 1 is again added to the difference signals D2' or 03 ', which is analogous to the encoder side by multiplying the signal L ⁇ or L2 was obtained with the factors a2 and a3.
  • the quantized transformation coefficients Lj_ are again obtained, which are then each subjected to an inverse quantization IQ_.
  • the resulting signals X D1 , X D2 and X D3 are fed to a switch S, via which the desired quality level for the decoded signal is selected.
  • the selected signal is then subjected to an inverse transformation IT, and then motion compensation is carried out in a decoder-side prediction loop with image memory SP.
  • the data rate saving is particularly effective when all encoders synchronized use the same coding modes (e.g. prediction modes for intra-coding, macroblock decomposition for inter-coding) and the same motion vectors. For efficient coding, these are often selected according to a rate distortion criterion. Without synchronization, however, different coding modes and motion vectors also result in different quality levels.
  • coding modes e.g. prediction modes for intra-coding, macroblock decomposition for inter-coding
  • the encoders work according to a so-called “master-slave principle”, as shown in FIG. 4.
  • a “master encoder” ME is determined by the three encoders and the optimum coding modes and Motion vectors determined. These coding modes and motion vectors are then transferred to the other encoders, the “slave encoders” SE.
  • the disadvantage that the slave encoders now work less than optimally is more than offset by the advantage of the higher data rate savings due to the synchronization.
  • the best coding parameters can: * be selected depending on the application either at low, medium or high data rate.
  • the method according to the invention is compatible with application-specific video standards, such as MPEG2, MPEG-4, H.263 (quantization and coding of the DCT coefficients of the prediction error signal) or video standard H.26L (quantization and coding of the IT coefficients (integer transform) of the prediction error signal).

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur skalierbaren Videocodierung, bei dem ein Eingangssignal mit Videobildinformation je einer Mehrzahl von Encodern, die Quantisierer umfassen, zugeführt wird, wobei die Encoder das Videosignal auf unterschiedlichen mit unterschiedlichen Qualitätsstufen unter Verwendung von Quantisierungsparametern quantisieren und anschließend eine Entropiecodierung (ECi) durchführen, wobei die Encoder untereinander derart verkoppelt sind, dass in wenigstens einem oder mehreren Encodern anstelle einer Entropiecodierung von quantisierten Transformationssignalen (Li) quantisierte Differenzsignale (ΔXi) von Transformationssignalen einer Entropiecodierung unterzogen werden, wodurch auf den unterschiedlichen Auflösungsebenen quantisierte Ausgangssignale (Di) erhalten werden.

Description

Beschreibung
Effiziente Codierung von Videosignalen für skalierbare Simul- cast-Speicherung und -Übertragung sowie zugehöriger Codec
Die Erfindung bezieht sich auf ein Verfahren zur skalierbaren Videocodierung, bei dem ein Eingangssignal mit Videobildinformation je einer Mehrzahl von Encodern umfassend Quantisie- rer zugeführt wird, wobei die Encoder das Videosignal auf unterschiedlichen Auflösungsebenen in unterschiedlichen Qualitätsstufen quantisieren und anschließend eine Entropiecodierung durchführen, sowie auf eine korrespondierende Vorrichtung.
Für viele Anwendungen sind heutzutage Videosignale in unterschiedlichen Qualitätsstufen bereitzustellen, denn in immer mehr Anwendungen ist es erforderlich, codierte Videosequenzen so aufzubereiten, dass diese mit Geräten sehr unterschiedlicher Leistungsfähigkeit decodiert werden können. Beispiele dafür sind:
- Digitales TV in mehreren Qualitätsstufen für unterschiedliche Empfänger (Heim-TV-Geräte, PC, Organizer, multimediafähige Mobilfunkendgeräte) ;
- Individuelle Videodienste für unterschiedliche Endgeräte und Zugangsnetze (Breitband-Kabel, xDSL, ISDN, UMTS);
- Pay-TV und andere Videodienste für unterschiedliche Gebührenklassen;
- Verteildienste für Videoinhalte auf unterschiedlichen Endgeräten und Netzen.
AnwendungsSzenarien sind im Besonderen mobile Endgeräte, auf denen Bildsequenzen, die eigentlich für Desktop-Applikationen codiert wurden, wiedergebbar sein sollen. Auch Videokonferenzen zwischen Teilnehmern mit Desktop und mobilen Endgeräten erfordern eine geschickte Anpassung der Qualitätsstufen. Hierbei ist die Information, dass ein Teilnehmer ein mobiler Teilnehmer ist, der insbesondere nicht die gleiche Leistungsfähigkeit wie ein fester Teilnehmer aufweist, dem Sender / Initiator nicht notwendigerweise bekannt.
Darüber hinaus ist es bei variabler Netzgüte (Bandbreite, Fehlerrate etc.) hilfreich, mehrere Datenraten für Videoanwendungen bereitzustellen, damit bei reduzierter Netzgüte die Qualität nur graduell abnimmt und wenigstens eine Min- destbildqualität eingehalten werden kann. Aus technischer Sicht muss in einem solchen Szenario deshalb eine schnelle Adaption der generierten bzw. übertragenen Bitrate an sehr unterschiedliche Übertragungsbandbreiten (z.B. Übertragung im Festnetz im Gegensatz zu drahtloser Übertragung) möglich sein.
Ein zunehmend wichtiges Szenario stellen sogenannte Streaming-Applikationen dar (sowohl im Festnetz als auch im drahtlosen Netz) . Hierbei stellt ein Service-Provider (der auch eine private Einzelperson sein kann) Videomaterial zum Abruf bereit. Ein Client fordert die komprimierten Videodaten an, während das decodierte Bildmaterial bereits dargestellt wird. Auch hierbei muss der Provider sehr unterschiedlichen Kundenanforderungen Rechnung tragen.
Prinzipiell erfordern solche Problemstellungen skalierbare Codierverfahren. Solche Verfahren finden sich beispielsweise in:
- ITU-T Rec. H.263 λVideo Coding for low bit rate com unica- tion", Annex 0: * Temporal, SNR, and spatial scalability" .
- ISO/IEC JTC1/5C29/WG11 ,Generic coding of moving pictures and associated audio", ISO/IEC 13818-2 Draft International Standard.
Bei skalierbaren Codierverfahren wird senderseitig (server- seitig) nur ein einziger Bitstrom generiert, aus dem auch Bildsequenzen geringerer Qualität und / oder Auflösung decodiert werden können. Damit kann der Client (Empfänger) für Streaming-Applikationen entscheiden, mit welcher Auflösungsqualität er die Applikation dargestellt haben möchte. Im Fall variierender Terminaleigenschaften decodiert der Client nur den relevanten Teil, der darstellbar ist. Im Bereich mobiler Applikationen mit zeitlich stark schwankenden Kanaleigenschaften ergibt sich die Möglichkeit einer sehr schnellen A- daption des Senders, bzw. eine elegante Schnittstelle für UEP (unequal error protection) .
Grundsätzlich kann zwischen SNR (signal-to-noise ratio) , örtlicher und zeitlicher Skalierbarkeit unterschieden werden. Allen Verfahren gemeinsam ist, dass durch Variation bestimmter Codierparameter die gleiche Bildsequenz bei verschiedenen Bitraten codiert wird. Im Fall der SNR-Skalierung werden durch Va: ation der Quantisierung unterschiedliche Qualitätsstufen und Bitraten erzielt. Örtliche Skalierbarkeit beschreibt Verfahren, die die Bildsequenz mit unterschiedlichen Ortsauflösungen (Bildgrößen) codieren. Eine zeitliche Skalierbarkeit schließlich stellt die Bildsequenzen mit unterschiedlichen Bildfrequenzen zur Verfügung. Es sei darauf hingewiesen, dass durchaus beliebige Kombinationen der drei Arten möglich sind.
Bisher erfolgt die Bereitstellung der Videoinhalte dadurch, dass entweder die Videodaten in einem skalierbaren Format codiert werden oder dass für jede Qualitätsstufe ein eigener Datenstrom bereitgehalten wird (Simulstore) bzw. ausgesendet wird (Simulcast) .
Eine sogenannte Simulcast-Codierung, bei der die gewünschten Bitströme mit unterschiedlich parametrisierten parallelen und unabhängig voneinander arbeitenden Codecs generiert werden, erreicht bisher eine bessere Qualität bei gleicher Bitrate. Im Fall des Si ulcast-Codierverfahrens bleibt eine nicht unerhebliche Redundanz zwischen den einzelnen Bitströmen erhalten. Dieses Verfahren geht nämlich sehr verschwenderisch mit Netzressourcen um. Werden z.B. drei Qualitätsstufen benötigt, die Datenraten von 48kbit/s, 64kbit/s und 128kbit/s entsprechen, so beträgt die erforderliche Netzkapazität bei gleich¬ zeitiger Übertragung aller Ströme 240 kbit/s. Außerdem ist die erforderliche Speicherkapazität für die unterschiedlichen Ströme wesentlich größer. Deutlich effizienter sind deshalb skalierbare Codierverfahren.
Skalierbare Videocodierverfahren wurden in der wissenschaftlichen Literatur bereits vielfach untersucht, allerdings häufig mit einer Ausrichtung auf bestehende oder in der Entwicklung befindliche Standards (MPEG-2, MPEG-4, H.263, H.26L). Auch wenn die Verfahren Eingang in die Standards gefunden haben, so finden diese Verfahren bislang keine breite Anwendung, da deren Performance (erzielbares peak signal-to-noise ratio (PSNR) bei gegebener Bitrate) sehr unbefriedigend ist.
Hierbei wird bei niedriger Datenrate im Basislayer eine Mindestqualität bereitgestellt, mit dem Empfang und Decodierung der Enhance ent-Layer kann die Bildqualität stufenweise verbessert werden. Besonders effizient ist in diesem Zusammenhang ein Verfahren zur optimalen SNR-Skalierbarkeit wie es von der Anmelderin in der deutschen Patentanmeldung 10121259.3 vorgeschlagen worden ist. Weitere Verfahren existieren zur feingranularen Skalierbarkeit, die zwar die Möglichkeit zu einer feinstufigen Einstellung der Qualität bieten, jedoch ist allen diesen bekannten Verfahren zueigen, dass diese noch relativ ineffizient bzgl. der Kompressionseigenschaften sind.
Aufgabe der vorliegenden Erfindung ist es daher, eine effizientere Codierung von Videosignalen für skalierbare Simul- cast-Speicherung und -Übertragung zu schaffen. Eine weitere Aufgabe besteht in der effizienten Decodierung solcher Signale.
Diese Aufgabe wird gemäß den Merkmalen der unabhängigen Patentansprüche gelöst. Weiterbildungen der Erfindung ergeben sich auch aus den abhängigen Ansprüchen.
Gemäß der Erfindung wird das Eingangs genannte Verfahren dadurch weitergebildet wird, dass die Encoder untereinander derart verkoppelt sind, dass in einem oder in mehreren Encodern anstelle einer Entropiecodierung von quantisierten Transformationssignalen quantisierte Differenzsignale von Transformationssignalen einer Entropiecodierung unterzogen werden, wodurch auf den unterschiedlichen Au lösungsebenen quantisierte AusgangsSignale erhalten werden.
Dies lässt sich in einer ersten Ausführungsform der Erfindung auf besonders vorteilhafte Weise erreichen, indem eine Quantisierung und eine Entropiecodierung der Differenz aus einem Transfor ationssignal vor der zugeordneten Quantisierung und einem Transformationssignal einer niedrigeren Qualitätsstufe nach zugeordneter Quantisierung und inverser Quantisierung erfolgt. Dies gilt vor allem dann, wenn die Quantisierer ineinander eingebettet sind.
Wie in der detaillierten Beschreibung der Anmeldung noch gezeigt wird, ist es für die Umsetzung der- ersten Ausführungsform der Erfindung vorteilhaft, wenn die Quantisierungsparameter von aufeinander folgenden Qualitätsstufen ein bestimmtes Verhältnis aufweisen. Insbesondere muss das Verhältnis des Quantisierungsparameters einer ersten Qualitätsstufe zu einem Quantisierungsparameter einer zweiten, darauf folgenden Qualitätsstufe eine natürliche Zahl sein. Hier und im Folgenden ist unter einem Quantisierungsparameter die Stufenhöhe eines Quantisierers zu verstehen. Um eine Beschränkung der Quantisierungen in den Encodern zu umgehen, wird in einer zweiten Ausführungsform der Erfindung eine Entropiecodierung der Differenz aus einem ersten Transformationssignal und einem zweiten Transformationssignal durchgeführt, wobei das erste Transformationssignal das Transformationssignal nach der zugeordneten Quantisierung ist und das zweite Transformationssignal durch eine Prädiktion des ersten Transformationssignals erhalten wird. Vorzugsweise wird die Prädiktion mit Hilfe des Transformationssignals einer niedrigeren Qualitätsstufe nach zugeordneter Quantisierung durchgeführt. Es wird somit der Prädiktionsfehler einer Prädiktion eines quantisierten Transformationssignals einer Entropiecodierung unterzogen.
Das zweite Transformationssignal wird hierbei vorzugsweise durch die Multiplikation des Transformationssignals der niedrigeren Qualitätsstufe nach zugeordneter Quantisierung mit einem Faktor zur Anpassung des Transformationssignals der niedrigeren Qualitätsstufe nach zugeordneter Quantisierung an das erste Transformationssignal erhalten. Der Faktor ist insbesondere der Quotient aus den Quantisierungsparametern der niedrigeren und der für das erste Transformationsignal verwendeten Qualitätsstufe. Hierdurch kann auf einfache Weise ein Wert für das erste Transformationssignal prädiziert werden.
Da bei der Decodierung der codierten Signale ebenfalls wieder eine Prädiktion durchgeführt wird, sollte sichergestellt werden, dass die Multiplikation des Transformationssignals der niedrigeren Qualitätsstufe mit dem Faktor mit einer vorgegebenen Genauigkeit erfolgt. Dies wird durch die Verwendung von Festkommaarithmetik erreicht. Die Multiplikation erfolgt insbesondere gemäß folgender Gleichung:
Figure imgf000008_0001
mit Mt = [2n x at ] , wobei n eine natürliche Zahl ist, i der Index für die Qualitätsstufe ist, oti der Faktor zur Anpassung des Transformationssignals der niedrigeren Qualitätsstufe i-1 an das Transformationssignal der Qualitätsstufe i ist,
Li' das zweite Transformationssignal ist ,
Li-i das Transformationssignal der niedrigeren Qualitätsstufe i-1 ist, sign(x) die Signumfunktion ist, und [x] der Integerteil von x ist, d.h. die größte ganze
Zahl, die kleiner gleich x ist.
Nach einer weiteren vorteilhaften Ausgestaltung arbeiten die Encoder synchronisiert. Zur Synchronisierung arbeitet vorzugsweise ein Encoder als Master, dem die übrigen Encoder als Slaves folgen, indem für den Master-Encoder ein optimaler Codiermodus ermittelt wird, der auf die Slave-Encoder übertragen wird.
Weitere Vorteile ergeben sich, wenn in jedem Encoder eine Bewegungskompensation durchgeführt wird aufgrund von Bewegungs- vektσren, die durch eine Bewegungsschätzung ermittelt werden. Vorzugsweise findet eine Bewegungsschätzung auf einer mittleren oder der höchsten Qualitätsstufe statt .
Dabei hat es sich als vorteilhaft erwiesen, wenn zur Bewegungskompensation auf allen Auflösungsebenen dieselben geschätzten Bewegungsvektoren verwendet werden.
Weitere Vorteile ergeben sich, wenn die Bewegungsschätzung beim Master-Encoder stattfindet und für diesen optimale Bewegungsvektoren ermittelt werden, die im Rahmen der Synchronisierung auf die Slave-Encoder übertragen werden. Dabei besteht ein großer Vorteil des Verfahrens nach der vorliegenden Erfindung in der Möglichkeit, eine Auswahl des Master-Encoders anwendungsbezogen anhand der besten Codierparameter vorzunehmen.
Eine Decodierung von auf diese Weise codierten Videosignalen erfolgt vorzugsweise, indem die codierten Eingangssignale mit auf den unterschiedlichen Auflösungsebenen quantisierten Videosignalen jeweils einem Verarbeitungsschrit't umfassend eine separate Entropiedecodierung und inverse Quantisierung unterzogen werden.
Zur Decodierung von Videosignalen, die gemäß der ersten Aus- führungsform der erfindungsgemäßen Codierverfahrens codiert wurden, wird insbesondere ein Verfahren eingesetzt, bei dem die nach dem Verarbeitungsschritt erhaltenen Signale verknüpft werden und das resultierende Gesamtsignal einer gemeinsamen inversen Transformation unterzogen wird. Vorzugsweise erfolgt die Verknüpfung der durch jeweils den Verarbeitungsschritt erhaltenen Signale durch Summierung.
Wenn Videosignale gemäß der zweiten Ausführungsform des erfindungsgemäßen Codierverfahrens codiert wurden, wird insbesondere ein Verfahren eingesetzt, bei dem der Verarbeitungsschritt derart abläuft, dass in allen außer der niedrigsten Auflösungsebene jeweils das nach der separaten Entropiedecodierung erhaltene Signal zu einem Prädiktionssignal addiert wird, welches durch eine Prädiktion des im entsprechenden Encoder quantisierten Transformationssignals erhalten wird, und die addierten Signale einer inversen Quantisierung zugeführt werden. Die Prädiktion wird hierbei vorzugsweise mit Hilfe des der inversen Quantisierung zugeführten Signals einer niedrigeren Auflösungsebene durchgeführt. Um eine ordnungsgemäße Decodierung zu gewährleisten, läuft die Prädiktion analog zu der bei der Codierung durchgeführten Prädiktion ab, wobei das erste Transformationssignal nunmehr das im entsprechenden Encoder quantisierte Transformationssignal ist und das zweite Transformationssignal das der inversen Quantisierung zugeführte Signal einer niedrigeren Auflösungsebene ist. In einer besonders bevorzugten Ausgestaltung wird ferner aus den jeweils nach dem Verarbeitungsschritt erhaltenen Signalen ein Signal ausgewählt, und das ausgewählte Signal einer inversen Transformation unterzogen wird.
In einer weiteren Ausgestaltung der Erfindung wird das erfindungsgemäße Codierverfahren mit dem erfindungsgemäßen Deco- dierverfahren zu einem gemeinsamen Verfahren kombiniert.
Die Erfindung betrifft neben den oben beschriebenen Verfahren auch eine Vorrichtung zur skalierbaren Videocodierung mit einer Mehrzahl von Encodern umfassend Quantisierer, denen jeweils ein Eingangssignal mit Videobildinformation zugeführt wird, und durch die das Videosignal auf unterschiedlichen Auflösungsebenen in unterschiedlichen Qualitätsstufen quanti- sierbar ist, wobei mit der Vorrichtung das erfindungsgemäße Verfahren zur skalierbaren Videocodierung durchführbar ist.
Ferner umfasst die Erfindung eine Vorrichtung zur Decodierung von nach dem erfindungsgemäßen Codierverfahren codierten Videosignalen, mit der das erfindungsgemäße Decodierverfahren durchführbar ist.
Darüber hinaus betrifft die Erfindung einen Codec zur skalierbaren Videocodierung und Videodecodierung mit einer Mehrzahl von Encodern umfassend Quantisierer, denen jeweils Videobildinformation als Eingangssignal dient, und durch die das Videosignal auf unterschiedlichen Auflösungsebenen in unterschiedlichen Qualitätsstufen unter Verwendung von Quantisierungsparametern quantisierbar und anschließend Entropiecodierbar ist, wobei der Codec derart ausgestaltet ist, dass die erfindungsgemäßen Verfahren zur Codierung und Decodierung von Videosignalen durchführbar sind. Wesentliche Vorteile der Erfindung ergeben sich somit aus den folgenden Maßnahmen:
- Verkopplung von mehreren Videoencodern für die Entropiecodierung der quantisierten Transformationskoeffizienten
- Anwendung von eingebetteten Quantisierern
- Verwendung eines einfachen Decoders für mehrere Qualitätsstufen
- Die Encoder unterliegen keinen Beschränkungen hinsichtlich der Wahl der Quantisierungsparameter
- Synchronisation von mehreren Encodern nach dem Master-
Slave-Prinzip
- Anwendungsspezifische Auswahl des Master-Encoders
Insbesondere die Synchronisation und Verkopplung von mehreren Videoencodern führt zu einer erheblichen Reduktion der Ge- samtdatenrate .
Weitere Vorteile und Details der Erfindung ergeben sich anhand von im Folgenden beschriebenen vorteilhaften Ausführungsbeispielen und in Verbindung mit den Figuren. Dabei sind Elemente mit gleicher Funktionalität mit den gleichen Bezugszeichen gekennzeichnet. Es zeigt jeweils in Prinzipdarstellung:
FIG 1 ein vereinfachtes Blockschaltbild eines hybriden Video-Encoders und -Decoders nach dem Stand der Technik,
FIG 2 ein Blockschaltbild einer ersten Ausführungs orm der erfindungsgemäßen Vorrichtung (Codec) aus drei Encodern und Decodern,
FIG 3 ein Blockschaltbild einer zweiten Ausführungsform der erfindungsgemäßen Vorrichtung (Codec) aus drei Encodern und Decodern FIG 4 eine Prinzipskizze zur Synchronisierung mehrerer Encoder gemäß der Erfindung.
Bevor näher auf das Ausführungsbeispiel eingegangen wird, sei hier noch kurz erwähnt, was unter dem Ausdruck Codec zu verstehen ist: Ein „Codec", in der Literatur auch als Coder/Decoder oder als Kompressions- und Dekompressionsalgo- rithmus bezeichnet, codiert (synonym komprimiert) und decodiert (synonym dekomprimiert) verschiedene Arten von Daten. Solche Codierung/Decodierung ist besonders im Zusammenhang mit Daten notwendig, die ansonsten sehr viel Speicherplatz und/oder Transmissionsbandbreite beanspruchen würden, wie zum Beispiel Video- und Audiodaten. Allgemein gebräuchliche Codecs sind solche, die digitale oder digitalisierte analoge Videosignale in komprimierte Videodaten (z.B. MPEG) oder digitalisierte analoge oder digitale Audiosignale in komprimierte Audiodaten (z.B. MP3, RealAudio) umwandeln. Grundsätzlich können Codecs in Echtzeit (z.B. Kommunikation) oder auf Grundlage von Speicherdateien (z.B. Streaming) verwendet werden.
Die im Folgenden detailliert dargestellten Verfahren gemäß der Erfindung lehnen sich an ein Verfahren zur optimalen SNR- Skalierbarkeit an, können jedoch auch auf andere existierende Codierschemata angewendet werden. Unterschiede beziehen sich im wesentlichen auf die Gestaltung der Quantisierer. Der Vorteil gegenüber den herkömmlichen Simulcastverfahren ist eine deutliche Reduktion der erforderlichen Datenrate durch Verkopplung der Entropiecodierung der Transformationskoeffizienten.
Dieser Vorteil gilt insbesondere dann, wenn die Quantisierer wie bei der optimalen SNR-Skalierbarkeit in der deutschen Patentanmeldung 10121259.3 vorgeschlagen ineinander eingebettet sind. Prinzipiell könnten einige Codierschemata auch ohne Modifizierung der Quantisierer eingesetzt werden, jedoch ergibt sich dann nicht mehr unbedingt eine deutliche Reduktion der Datenrate.
Das Verfahren zeichnet sich dadurch aus, dass es auf dem hybriden Coderkonzept aufbaut, und damit grundsätzlich kompatibel zu existierenden Standards zur Videocodierung ist. Der oft gemachte Einwurf, dass neue Verfahren nicht kompatibel zu existierenden Verfahren sind, trifft hier nicht zu.
Die Darstellung gemäß FIG 1 zeigt ein vereinfachtes Blockschaltbild eines hybriden Videocoders.
Beim herkömmlichen Simulcastverfahren mit n Qualitätsstufen werden n solche Coder mit entsprechenden Quantisierungsparametern bzw. anderweitigen Parametern benötigt. In FIG 1 bedeuten:
T: Transformationseinheit (z.B. DCT, Integer-
Transformation)
IT: Einheit zur Durchführung der inversen Transformation
Q: Quantisierer
IQ: Einheit zur Durchführung der inversen Quantisierung
EC: Entropiecoder
ED: Entropiedecoder
Sp: Bildspeicher
MV: Bewegungsvektoren
MS: Bewegungsschätzer.
Das Grundprinzip des hybriden Coderkonzepts besteht in der Codierung eines Prädiktionsfehlersignals, welches sich aus der Differenz zwischen Eingangssignal und (quantisierter) be- wegungskompensierter Rekonstruktion des vorherigen Bildes ergibt. Im Bezug auf die Berechnung der Prädiktion gibt es sehr viele Varianten, denen allen die zeitliche Prädiktion gemeinsam ist. Es ist allerdings auch möglich, dass von bereits co- dierten Bildteilen innerhalb des selben Bildes prädiziert wird.
Darüber hinaus erfolgt die Codierung des Prädiktionsfehlers vielfach nach Ausführung einer Transformation zur Dekorrelation (Ausnutzen örtlicher statistischer Abhängigkeiten) . Um die für eine Videoübertragung erforderlichen Kompressionsraten zu erzielen, werden entweder die Intensitäten des Prädik- tionsfehlersignals direkt im Ortsbereich oder aber die Transformationskoeffizienten quantisiert und anschließend über eine Entropiecodierung verlustlos komprimiert, sowie auf ein. binäres Signal abgebildet.
Die Darstellung nach FIG 1 zeigt in diesem Zusammenhang auf der linken Seite der gestrichelten Linie einen solchen Encoder, auf der rechten Seite den zugehörigen Decoder. Dem Encoder eingangsseitig beaufschlagte Videodaten durchlaufen eine Transformation T und eine Quantisierung Q. Dieses Signal wird zum einen einem Entropiecodierer EC zugeführt, der einen komprimierten Videodatenstrom bereitstellt. Zum anderen erfolgt Encoder intern eine inverse Quantisierung IQ und eine anschließende inverse Transformation IT. Dieses Signal gelangt in einen Bildspeicher Sp, dessen Ausgang einmal auf den Eingang rückgekoppelt ist, zum anderen negativ auf den Eingang der Transformation T gelangt.
Der Bildspeicher Sp steuert einen Bewegungsschätzer MS, der seinerseits eingangsseitig mit den Videoeingangsdaten beaufschlagt wird und Bewegungsvektoren MV bereitstellt zur An- steuerung des Bildspeichers SP im Encoder. Außerdem werden diese Bewegungsvektoren auch zum Decoder übertragen und dienen dort ebenfalls zur Ansteuerung eines decoderseitigen Bildspeichers Sp.
Decoderseitig erfolgt zunächst eine Entropiedecodierung ED der komprimierten Videodaten, anschließend eine inverse Quantisierung IQ und eine inverse Transformation IT. Die so er- mittelten decodierten Videodaten addiert mit den Daten des Bildspeichers stellen den Ausgang des Decoders dar. Dieses Summensignal wird außerdem dem decoderseitigen Bildspeicher Sp zugeführt, dessen Ausgang auf den Eingang des Addierers zurückgeführt ist.
Die Darstellung nach FIG 2 zeigt nun eine neue Anordnung gemäß einer ersten Ausführungsform der Erfindung, welche aus drei Encodern- und Decodern besteht, deren Signale miteinander verknüpft sind. Die Anzahl der Encoder und damit auch die Anzahl der Decoder kann allerdings variiert werden. Die drei Encoder, die auf der linken Seite des Blockschaltbildes übereinander angeordnet sind, erzeugen drei Datenströme Dl, D2 und D3, die zum Decoder übertragen werden.
Encoder 1 codiert die Videodaten in einer niedrigen Quali- tätsstufe, Encoder 2 in mittlerer Qualitätsstufe und Encoder 3 in hoher Qualitätsstufe.
Die Signale in FIG 2 bedeuten:
X: Eingangsbildsignal
Xj.: Transformationssignal vor der Quantisierung, i=l;2;3
Lj.: Repräsentant des quantisierten Transformationssignals, i=l;2;3
Xif: Transformationssignal nach Quantisierung und inverser
Quantisierung, i=l;2;3
ΔXj.: Differenz aus X± und X^ ' mit i=2;3
ΔXi ' : Signal nach Quantisierung und inverser Quantisierung
Figure imgf000016_0001
XDi: Summe der Signale ΔXi'und XDI-I- i=2;3
Das Eingangsbildsignal X wird allen drei Encodern zugeleitet. In jedem Encoder erfolgt eine Transformation T, woraus Xi als Transformationssignal vor der Quantisierung Q erhalten wird. Aus der Quantisierung erhält man Li, welches nur bei Encoder 1 (niedrige Qualitätsstufe) direkt einer Entropiecodierung ECi zugeführt wird, aus der der erste komprimierte Datenstrom Dj. resultiert.
Im übrigen erfolgt für Encoder 1 eine Rückführung von Li über eine inverse Quantisierung IQi und inverse Transformation IT und einen Bildspeicher Sp auf den Eingang von Encoder 1 wie in FIG 1 gezeigt. Eine solche negative Rückkopplung erfolgt auch bei den weiteren Encodern.
Das ausgangsseitige Signal Xi' der inversen Quantisierung IQi von Encoder 1 dient nun aber zusätzlich einer Verknüpfung mit dem Transformationssignal vor der Quantisierung X2 von Encoder 2. Das Signal Xχ f wird negativ mit X2 verknüpft zu ΔX2 als der Differenz aus Xj. und Xi-i' für i=2. Anders als bei Encoder 1 erfolgt eine Entropiecodierung dieses Differenzsignales ΔX2 nach vorheriger Quantisierung Q2 zum komprimierten Ausgangssignal D2. Für den dritten Encoder erfolgt die Codierung analog zum Encoder 2, wobei auf die entsprechenden Signale von Encoder 2 zugegriffen wird.
Decoderseitig (rechte Seite in FIG 2) wird nun der Datenstrom Di einer Entropiedecodierung EDi und einer darauffolgenden inversen Quantisierung IQα unterzogen, woraus ein Signal XDι wiedergewonnen wird.
Für die Encoder 2 und 3 erfolgt ebenfalls jeweils eine Entropiedecodierung EDi und eine darauffolgende inverse Quantisierung IQi für i=2 oder i=3. Daraus erhält man jeweils ΔXi' als Signal nach Quantisierung und inverser Quantisierung von ΔXi. Das Signal ΔX2' wird zu XD1 addiert, woraus XD2 resultiert, welches seinerseits mit dem Signal Δx3' addiert das Signal XD3 ergibt. Decoderseitig erfolgt nun besonders einfach und damit sehr effektiv eine inverse Transformation ausschließlich des Signals XD3, welches das decodierte Ausgangssignal ergibt. Dieses durchläuft im Fall einer Bewegungskompensation einen decoderseitigen Bildspeicher Sp, indem es diesem zu- sätzlich als Eingangssignal dient, dessen Ausgang dem Signal XD3 hinzuaddiert wird.
Aus FIG 2 ist ersichtlich, dass
Figure imgf000018_0001
gilt; ferner lässt sich im Folgenden zeigen, dass Xoι= i ' , i=2;3 gilt. In den folgenden Gleichungen bedeutet die rechteckige Klammer angewandt auf eine gebrochene Zahl die Schneideoperation auf die nächst niedrige ganze Zahl, also z.B. [2,9] = 2 und [-2,1] = -3.
Ein Quantisierungsprozess (Quantisierung und nachfolgende inverse Quantisierung) lässt sich allgemein durch
Figure imgf000018_0002
beschreiben .
Hierbei ist Qx vorzugsweise ganzzahlig und stellt die Stufenhöhe des j eweiligen Quantisierers dar und die α^ sind quanti- siererabhängige Rundungsparameter mit 0 ≤ a < 1 . Für AX2 und
AX2 ' erhält man :
Figure imgf000018_0003
M Mii +t- H d oerτr , N = Menge der na-
Figure imgf000018_0004
türlichen Zahlen, folgt :
Figure imgf000019_0001
Daraus folgt
X2'= 2' -X,
Daraus lässt sich nun wie folgt bestimmen :
Figure imgf000019_0002
Analog dazu, ergibt sich auch, dass XD3=X3' gilt.
Aufgrund dieser Eigenschaften ist es möglich, mit einem einfachen Decoder aus dem Empfang des Datenstroms Di das Videosignal der untersten Qualitätsstufe zu decodieren, beim Empfang der Datenströme Di und D2 das Videosignal der mittleren Qualitätsstufe zu decodieren und bei Empfang der Datenströme Di, D2 und D3 das Videosignal der oberen Qualitätsstufe zu decodieren.
Bemerkenswert ist, dass der Decoder nur eine Einheit zur Durchführung der inversen Transformation IT und nur einen Bildspeicher SP benötigt. Lediglich Entropiedecodierung EDi und inverse Quantisierung IQi müssen für jeden Datenstrom separat durchgeführt werden.
Wie oben gezeigt wurde, unterliegen die Stufenhöhen der jeweiligen Quantisierer- er ersten Ausführungsform der Erfindung einer Beschränkung dahingehend, dass das Verhältnis von aufeinanderfolgenden Stufenhöhen eine natürliche Zahl ist. In der nachfolgend beschriebenen zweiten Ausführungsform der Erfindung sind die Quantisierer nicht mehr hinsichtlich ihrer Stufenhöhen beschränkt. Die Figur 3 zeigt die zweite Ausführungsform der- Erfindung, wobei Bausteine und Signale, die den Bausteinen bzw. Signalen der Figur 2 entsprechen, mit gleichen Bezeichnungen versehen sind.
Zusätzlich in Figur 3 bedeuten:
a^: die Faktoren, mit denen die Transformationssignale Lj_ multipliziert werden, i = 2; 3
Lj_': die Transformationssignale multipliziert mit den Faktoren a , i = 2; 3
D_': die jeweiligen der Entropiecodierung zugeführten Signale bzw. die decodierten Signale nach Durchführung der Entropiedecodierung .
Es sind drei Encoder gezeigt, die jeweils mit dem gleichen Eingangssignal X umfassend Videodaten beaufschlagt werden. Die Daten durchlaufen jeweils eine Transformation T und Quantisierungen Q_. Das nach der Quantisierung erhaltene Signal wird zum einen an eine Entropiecodierung EC_ weitergeleitet und zum anderen einer inversen Quantisierung IQj_ mit anschließender inverser Transformation IT unterworfen. Das nach der inversen Transformation erhaltene Signal gelangt dann ü- ber jeweilige Speicher Spj_ negativ auf den Eingang der Transformation T und wird ferner nochmals positiv an den Eingang des Speichers Sp^ rückgekoppelt. In den Speichern wird die Bewegungskompensation mit Hilfe von Bewegungsvektoren MV durchgeführt, die bei der Bewegungsschätzung ermittelt wurden.
Im Unterschied zur Ausführungsform der Figur 2 werden die quantisierten Transformationsignale L_ zu einer Prädiktion verwendet, bei der das quantisierte Transformationssignal der nächsthöheren Auflösungsebene prädiziert wird. Hierzu wird das Signal L]_ bzw. L2 mit dem Faktor a2 bzw. a3 multipliziert, wobei dieser Faktor vorzugsweise das Verhältnis der Stufenhöhen des Quantisierungen Q]_ und Q2 bzw. Q2 und Q3 ist. Es werden somit Prädiktionssignale L2 ' bzw. L31 erzeugt, die dann mit den Signalen L2 bzw. L3 verknüpft werden. Die Verknüpfung besteht darin, dass die Differenz D ' bzw. 03" zwischen L2 und L2 ' bzw. L3 und L31 gebildet wird. Diese Differenz wird dann den Entropiecodierungen EC2 bzw. EC3 unterworfen. Da das Differenzsignal eine geringere Entropie als die quantisierten Transformationssignale aufweist, ergibt sich eine gegenüber dem Stand der Technik effizientere Codierung. Ferner sind die Quantisierer der unterschiedlichen Qualitätsstufen keiner Beschränkung mehr unterworfen.
Bei der Multiplikation von T->±-i mit dem Faktor ai werden die Transformationssignale vorzugsweise mit einer Integerzahl multipliziert und einer nachfolgenden Rechtsschiebeoperation unterworfen. Diese Multiplikation mit anschließender Rechts- verschiebung wird auch decoderseitig eingesetzt, wodurch Driftprobleme zwischen Encoder und Decoder vermieden werden.-
Rechts der in Figur 3 dargestellten strichpunktierten Linie ist der Decoder dargestellt. Diesem Decoder werden die im Encoder codierten Signale Dj_ zugeführt. Diese Signale werden jeweils Entropiedecodierungen ED_ unterworfen, so dass aus- gangsseitig der Entropiedecodierungen die decodierten Signale L_, D2 ' bzw. D3 ' erhalten werden. Anschließend wird das Signal L]_ einer inversen Quantisierung IQ]_ unterworfen, wohingegen zu den Differenzsignalen D2 ' bzw. 03' wieder ein Prädiktionssignal L2 ' bzw. L31 hinzuaddiert wird, welches analog zur Encoderseite durch Multiplikation des Signals L^ bzw. L2 mit den Faktoren a2 bzw. a3 erhalten wurde. Als Ergebnis werden wiederum die quantisierten Transformationskoeffizienten Lj_ erhalten, die anschließend jeweils einer inversen Quantisierung IQ_ unterworfen werden. Schließlich werden die resultierenden Signale XD1, XD2 und XD3 einem Schalter S zugeführt, über welchen die erwünschte Qualitätsstufe für das decodierte Signal ausgewählt wird. Das ausgewählte Signale wird dann einer inversen Transformation IT unterworfen, und anschließend wird eine Bewegungskompensation in einer decoderseitigen Prädiktionsschleife mit Bildspeicher SP durchgeführt.
Der Vorteil der Datenratenersparnis ergibt sich nun daraus, dass nicht mehr wie bei dem herkömmlichen Simulcastverfahren die quantisierten- Transformationskoeffizienten Xi, die durch „Level" L repräsentiert werden, einer Entropiecodierung unterzogen werden, sondern statt dessen die quantisierten Dif- terenzsignale ΔXi bzw.-Dj.1, die eine geringere Entropie aufweisen als die Level Li .
Die Datenratenersparnis kommt vor allem dann zur Wirkung, wenn alle Encoder synchronisiert die gleichen Codiermodi (z.B. Prädiktionsmodi bei der Intra-Codierung, Makroblockzerlegung bei der Inter-Codierung) und die gleichen Bewegungsvektoren verwenden. Für eine effiziente Codierung werden diese vielfach nach einem Rate-Distortion-Kriterium ausgewählt. Ohne Synchronisierung ergeben sich aber bei unterschiedlichen Qualitätsstufen auch unterschiedliche Codiermodi und Bewegungsvektoren.
Dies wird dadurch vermieden, dass die Encoder nach einem sogenannten „Master-Slave-Prinzip" arbeiten, wie es in der FIG 4 dargestellt ist. Hierbei wird von den drei Encodern ein „MasterEncoder" ME bestimmt und es werden bei diesem die optimalen Codiermodi und Bewegungsvektoren ermittelt. Diese Codiermodi und Bewegungsvektoren werden dann auf die übrigen Encoder, die „Slave-Encoder" SE, übertragen. Der Nachteil, dass die Slave-Encoder nun suboptimal arbeiten, wird durch den Vorteil der höheren Datenratenersparnis durch die Synchronisierung mehr als ausgeglichen.
Ein weiterer Vorteil ergibt sich aus der freien Auswahl des Master-Encoders. Die besten Codierparameter können:*anwen- dungsbezogen entweder bei niedriger, mittlerer oder hoher Datenrate ausgewählt werden. Das erfindungsgemäße Verfahren ist kompatibel mit anwendungsspezifischen Videostandards, wie zum Beispiel MPEG2, MPEG-4, H.263 (Quantisierung und Codierung der DCT-Koeffizienten des Prädiktionsfehlersignals) oder Videostandard H.26L (Quantisierung und Codierung der IT-Koeffizienten (Integer- Transform) des Prädiktionsfehlersignals) .
Abkürzungsglossar :
SNR signal-to-noise ratio
PSNR peak signal-to-noise ratio
UEP unequal error protection
VLC variable length code
MPEG moving picture experts group
ME motion esti ation unit
MC motion compensation
DCT diskrete Cosinus-Transformation
IT Integer Transform

Claims

Patentansprüche
1. Verfahren zur skalierbaren Videocodierung, bei dem ein Eingangssignal mit Videobildinformation je einer Mehrzahl
(i) von Encodern, die Quantisierer umfassen, zugeführt wird, wobei die Encoder das Videosignal auf unterschiedlichen Auflösungsebenen (1,2, ..., i) mit unterschiedlichen Qualitätsstufen unter Verwendung von Quantisierungsparametern ( Q) r quantisieren und anschließend eine Entropiecodie- rung (ECD durchführen, d a d u r c h g e k e n n z e i c h n e t, dass die Encoder untereinander derart verkoppelt sind, dass in wenigstens einem oder mehreren Encodern anstelle einer Entropiecodierung von quantisierten
Transformationssignalen (Li) quantisierte Differenzsignale (ΔXi; Di') von Transformationssignalen einer Entropiecodierung unterzogen werden, wodurch auf den unterschiedlichen Auflösungsebenen quantisierte und entropiecodierte Ausgangssignale (Di) erhalten werden.
2. Verfahren zur skalierbaren Videocodierung nach Anspruch 1, d a d u r c h g e k e n n z e i c h n e t, dass in dem oder den Encodern eine Quantisierung (Qi) und eine Entropiecodierung (ECi) der Differenz (ΔXi) aus einem Transformationssignal (XJ) vor der zugeordneten Quantisierung (Qi) und einem Transformationssignal (Xi-i' ) einer niedrigeren Qualitätsstufe (i-1) nach zugeordneter Quantisierung (Qi-i) und inverser Quantisierung (IQi-i) erfolgt.
3. Verfahren zur skalierbaren Videocodierung nach Anspruch 1, d a d u r c h g e k e n n z e i c h n e t, dass in dem oder den Encodern eine Entropiecodierung (ECi) der Differenz (Di') aus einem ersten quantisierten Transformationssignal (Li) und einem zweiten quantisierten Transformationssignal (Li') erfolgt, wobei das erste quantisierte Transformationssignal (L ) das Transformationssignal nach der zugeordneten Quantisierung (Qi) ist und das zweite quantisierte Transformationssignal (L' ) durch eine Prädiktion des ersten quantisierten Transformationssignals (Li) erhalten wird.
4. Verfahren zur skalierbaren Videocodierung nach Anspruch 3, d a d u r c h g e k. e n n z e i c h n e t, dass die Prädiktion ithilfe des Transformationssignals (Li_ι) einer niedrigeren Qualitätsstufe (i-1) nach zugeordneter Quantisierung (Qi-i) durchgeführt wird.
S.Verfahren zur skalierbaren Videocodierung nach Anspruch 4, d a d u r c h g e k e n n z e i c h n e t, dass das zweite Transformationssignal (Li' ) durch Multiplikation des Transformationssignal (Lj.-ι) der niedrigeren Qualitätsstufe (i-1) nach zugeordneter Quantisierung (Qi-i) mit einem Faktor (ai) zur Anpassung des Transformationssignals (Li_ι) der niedrigeren Qualitätsstufe (i-1) nach zugeordneter Quantisierung (Qi_ι) an das erste Transformationssignal (Li) erhalten wird.
6. Verfahren zur skalierbaren Videocodierung nach Anspruch 5, d a d u r c h g e k e n n z e i c h n e t, dass der Faktor (ai) der Quotient aus den Quantisierungsparametern (Q-i Q) der niedrigeren und der für das erste Transformationsignal (Li) verwendeten Qualitätsstufe ist.
7. Verfahren zur skalierbaren Videocodierung nach Anspruch 5 oder 6, d a d u r c h g e k e n n z e i c h n e t, dass bei der Multiplikation mit dem Faktor (ai) Festkommaarithmetik verwendet wird.
8. Verfahren zur skalierbaren Videocodierung nach Anspruch 7, d a d u r c h g e k e n n z e i c h n e t, dass die Multiplikation mit Festkommaarithmetik gemäß folgender Gleichung erfolgt:
Figure imgf000027_0001
mit
,. = [2"xα , wobei n eine natürliche Zahl ist, i der Index für die Qualitätsstufe ist, ai der Faktor zur Anpassung des Transformationssignals der niedrigeren Qualitätsstufe i-1 an das Transformationssignal der Qualitätsstufe i ist, Li' das zweite Transformationssignal ist, Li_ι das Transformationssignal der niedrigeren Qualitätsstufe i-1 ist, sign(x) die Signumfunktion ist, und [x] der Integerteil von x ist, d.h. die größte ganze Zahl, die kleiner gleich x ist.
9. Verfahren zur skalierbaren Videocodierung nach einem der vorhergehenden Ansprüche, d a d u r c h g e k e n n z e i c h n e t, dass die Quantisierer der Encoder ineinander eingebettet sind.
10. Verfahren zur skalierbaren Videocodierung nach einem der vorhergehenden Ansprüche, d a d u r c h g e k e n n z e i c h n e t, dass die Encoder synchronisiert arbeiten.
11. Verfahren zur skalierbaren Videocodierung nach Anspruch 10, d a d u r c h g e k e n n z e i c h n e t, dass zur Synchronisierung ein Encoder als Master (ME) arbeitet, dem die übrigen Encoder als Slaves folgen, indem für den Master-Encoder (ME) ein optimaler Codiermodus ermittelt wird, der auf die. Slave-Encoder übertragen wird.
12. Verfahren zur skalierbaren Videocodierung nach einem der vorhergehenden Ansprüche, d a d u r c h g e k e n n z e i c h n e t, dass in jedem Encoder eine Bewegungskompensation durchgeführt wird aufgrund von Bewegungsvektoren (MV) , die durch eine Bewegungsschätzung ermittelt werden.
13. Verfahren zur skalierbaren Videocodierung nach Anspruch 12, d a d u r c h g e k e n n z e i c h n e t, dass die Bewegungsschätzung auf einer mittleren oder der' höchsten Qualitätsstufe stattfindet.
14. Verfahren zur skalierbaren Videocodierung nach Anspruch 12 oder 13, d a d u r c h g e k e n n z e i c h n e t, dass zur Bewegungskompensation auf allen Auflösungsebenen dieselben geschätzten Bewegungsvektoren (MV) verwendet werden.
15. Verfahren zur skalierbaren Videocodierung nach Anspruch 11 und 12, d a d u r c h g e k e n n z e i c h n e t, dass die Bewegungsschätzung beim Master-Encoder (ME) stattfindet und für diesen (ME) optimale Bewegungsvektoren (MV) ermittelt werden, die im Rahmen der Synchronisierung auf die Slave-Encoder (SE) übertragen werden.
16. Verfahren zur skalierbaren Videocodierung nach einem der Ansprüche 11 bis 15, d a d u r c h g e k e n n z e i c h n e t, dass eine Auswahl des Master-Encoders (ME) anwendungsbezogen anhand der besten Codierparameter erfolgt.
17. Verfahren zur Decodierung von nach einem der vorhergehenden Ansprüche codierten Videosignalen, d a d u r c h g e k e n n z e i c h n e t, dass die codierten Eingangssignale (Di) mit auf den unterschiedlichen Auflösungsebenen quantisierten Videosignalen jeweils einem Verarbeitungsschritt umfassend eine separate Entropiedecodierung (EDi) und inverse Quantisierung (IQi) unterzogen werden.
18. Verfahren zur Decodierung nach Anspruch 17, insbesondere zur Decodierung von Videosignalen, die nach Anspruch 2 o- der nach einem der Ansprüche 4 bis 16 in Abhängigkeit von Anspruch 2 codiert wurden, d a d u r c h g e k e n n z e i c h n e t, dass die jeweils nach dem Verarbeitungsschritt erhaltenen Signale (XDi) verknüpft werden und das resultierende Gesamtsignal (XD3) einer gemeinsamen inversen Transformation (IT) unterzogen wird.
19. Verfahren zur Decodierung nach Anspruch 18, d a d u r c h. g e k e n n z e i c h n e t, dass die Verknüpfung der durch jeweils den Verarbeitungsschritt erhaltenen Signale (XDI) durch Summierung (+) erfolgt.
20. Verfahren zur Decodierung nach Anspruch 17, insbesondere zur Decodierung von Videosignalen, die nach Anspruch 3 o- der nach einem der Ansprüche 4 bis 16 in Abhängigkeit von Anspruch 3 codiert wurden, d a d u r c h g e k e n n z e i c h n e t, dass der Verarbeitungsschritt derart abläuft, dass in allen außer der niedrigsten Auflösungsebene jeweils das nach der separaten Entropiedecodierung (EDi) erhaltene Signal (Di') zu einem Prädiktionssignal (Li' ) addiert wird, welches durch eine Prädiktion des im entsprechenden Encoder quantisierten Transformationssignals (Li) erhalten wird, und die addierten Signale einer inversen Quantisierung (IQi) zugeführt werden.
21. Verfahren zur Decodierung nach Anspruch 20, d a d u r c h g e k e n n z e i c h n e t, dass die Prädiktion mithilfe des der inversen Quantisierung zugeführten Signals (Li-i) einer niedrigeren Auflösungsebene (i-1) durchgeführt wird.
22. Verfahren zur Decodierung nach Anspruch 20 oder 21, d a d u r c h g e k e n n z e i c h n e t, dass die Prädiktion in gleicher Weise wie in einem der Ansprüche 4 bis 8 durchgeführt wird.
23. Verfahren zur Decodierung nach einem der Ansprüche 20 bis 22, d a d u r c h g e k e n n z e i c h n e t, dass aus den jeweils nach dem Verarbeitungsschritt erhaltenen Signalen (XDI) ein Signal ausgewählt wird und das ausgewählte Signal einer inversen Transformation (IT) unterzogen wird.
24. Verfahren zur skalierbaren Videocodierung und Videodeco- dierung, wobei eine Videocodierung nach einem der Ansprüche 1 bis 16 und eine Videodecodierung nach einem der Ansprüche 17 bis 23 erfolgt.
25. Vorrichtung zur skalierbaren Videocodierung mit einer Mehrzahl (i) von Encodern umfassend Quantisierer, denen jeweils ein Eingangssignal mit Videobildinformation zugeführt wird, und durch die das Videosignal auf unterschiedlichen Auflösungsebenen (1,2, ..., i) in unterschiedlichen Qualitätsstufen quantisierbar (Q) ist, d a d u r c h g e k e n n z e i c h n e t, dass die Vorrichtung derart ausgestaltet ist, dass ein Verfahren zur skalierbaren Videocodierung nach einem der Ansprüche 1 bis 16 durchführbar ist.
26. Vorrichtung zur Decodierung von Videosignalen, insbesondere von mit einer Vorrichtung zur Videocodierung nach An- spruch 25 codierten Videosignalen, d a d u r c h g e k e n n z e i c h n e t, dass die Vorrichtung derart ausgestaltet ist, dass ein Verfahren zur Decodierung von Videosignalen nach einem der Ansprüche 17 bis 23 durchführbar.
27. Codec zur skalierbaren Videocodierung und Videodecodie- rung mit einer Mehrzahl (i) von Encodern umfassend Quantisierer, denen jeweils Videobildinformation als Eingangssignal dient, und durch die das Videosignal auf unterschiedlichen Auflösungsebenen (1,2, ..., i) in unterschiedlichen Qualitätsstufen unter Verwendung von Quantisierungsparametern ( Q) quantisierbar (Q) und anschließend Entropie-codierbar ist, d a d u r c h g e k e n n z e i c h n e t, dass der Codec derart ausgestaltet ist, dass ein Verfahren zur Codierung und Decodierung von Videosignalen nach Anspruch 24 durchführbar ist.
PCT/DE2002/003454 2001-09-14 2002-09-16 Effiziente videocodierung für skalierbare simul-cast-speicherung und -übertragung WO2003026310A2 (de)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
DE10145377.9 2001-09-14
DE10145377 2001-09-14
DE10146220 2001-09-19
DE10146220.4 2001-09-19
DE10200901.5 2002-01-11
DE10200901A DE10200901B4 (de) 2001-09-14 2002-01-11 Effiziente Codierung von Videosignalen für skalierbare Simul-cast-Speicherung und -Übertragung sowie zugehöriger Codec

Publications (2)

Publication Number Publication Date
WO2003026310A2 true WO2003026310A2 (de) 2003-03-27
WO2003026310A3 WO2003026310A3 (de) 2003-12-18

Family

ID=27214601

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/DE2002/003454 WO2003026310A2 (de) 2001-09-14 2002-09-16 Effiziente videocodierung für skalierbare simul-cast-speicherung und -übertragung

Country Status (1)

Country Link
WO (1) WO2003026310A2 (de)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006056529A1 (de) * 2004-11-23 2006-06-01 Siemens Aktiengesellschaft Codierverfahren und decodierverfahren, sowie codiervorrichtung und decodiervorrichtung
US8270470B2 (en) 2004-11-23 2012-09-18 Siemens Aktiengesellschaft Transcoding method and device
US11272181B2 (en) * 2012-05-14 2022-03-08 V-Nova International Limited Decomposition of residual data during signal encoding, decoding and reconstruction in a tiered hierarchy

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0644695A2 (de) * 1993-09-21 1995-03-22 AT&T Corp. Räumliche skalierbare Bildkodierung und -dekodierung
US6233283B1 (en) * 1998-06-23 2001-05-15 Lucent Technologies Inc. Layered video coding using perceptual coding criteria for error resilience in packet networks

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0644695A2 (de) * 1993-09-21 1995-03-22 AT&T Corp. Räumliche skalierbare Bildkodierung und -dekodierung
US6233283B1 (en) * 1998-06-23 2001-05-15 Lucent Technologies Inc. Layered video coding using perceptual coding criteria for error resilience in packet networks

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GAO C ET AL: "TWO-LAYER VIDEO CODING AND PRIORITY STATISTICAL MULTIPLEXING OVER ATM NETWORKS" 1996 IEEE INTERNATIONAL CONFERENCE ON COMMUNICATIONS (ICC). CONVERGING TECHNOLOGIES FOR TOMORROW'S APPLICATIONS. DALLAS, JUNE 23 - 27, 1996, IEEE INTERNATIONAL CONFERENCE ON COMMUNICATIONS (ICC), NEW YORK, IEEE, US, Bd. 1, 23. Juni 1996 (1996-06-23), Seiten 127-136, XP000625655 ISBN: 0-7803-3251-2 *
GHANBARI M: "AN ADAPTED H.261 TWO-LAYER VIDEO CODEC FOR ATM NETWORKS" IEEE TRANSACTIONS ON COMMUNICATIONS, IEEE INC. NEW YORK, US, Bd. 40, Nr. 9, 1. September 1992 (1992-09-01), Seiten 1481-1490, XP000331080 ISSN: 0090-6778 *
WU F ET AL: "DCT-prediction based progressive fine granularity scalable coding" PROCEEDINGS. INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, 10. September 2000 (2000-09-10), Seiten 556-559, XP002165186 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006056529A1 (de) * 2004-11-23 2006-06-01 Siemens Aktiengesellschaft Codierverfahren und decodierverfahren, sowie codiervorrichtung und decodiervorrichtung
CN102438138A (zh) * 2004-11-23 2012-05-02 西门子公司 编码方法和解码方法以及编码装置和解码装置
US8270470B2 (en) 2004-11-23 2012-09-18 Siemens Aktiengesellschaft Transcoding method and device
KR101227579B1 (ko) 2004-11-23 2013-01-29 지멘스 악티엔게젤샤프트 인코딩 및 디코딩 방법 및 인코딩 및 디코딩 장치
US9462284B2 (en) 2004-11-23 2016-10-04 Siemens Aktiengesellschaft Encoding and decoding method and encoding and decoding device
US11272181B2 (en) * 2012-05-14 2022-03-08 V-Nova International Limited Decomposition of residual data during signal encoding, decoding and reconstruction in a tiered hierarchy

Also Published As

Publication number Publication date
WO2003026310A3 (de) 2003-12-18

Similar Documents

Publication Publication Date Title
DE60031230T2 (de) Skalierbares videokodierungssystem und verfahren
DE10190285B4 (de) Verfahren und System zur Verarbeitung von komprimierten Videosignalen
EP0201679B1 (de) Verfahren zur Bilddatenreduktion für digitale Fernsehsignale
DE60109423T2 (de) Videokodierung mit prädiktiver bitebenenkodierung und progressiver fein-granularitätsskalierung (pfgs)
DE60009159T2 (de) Video kompression für mehrfachsendeverteilungen unter verwendung von räumlicher skalierbarkeit und gleichwellenfunkkodierung
DE69633129T2 (de) Waveletbaum-bildcoder mit überlappenden bildblöcken
DE102016125353A1 (de) Kodierratensteuerung von echtzeitvideos unter verwendung einer dynamischen auflösungsumschaltung
WO2006056531A1 (de) Verfahren zur transcodierung sowie transcodiervorrichtung
DE4416967A1 (de) Verfahren und Vorrichtung zur Transcodierung von Bitströmen mit Videodaten
EP1025708B1 (de) Verfahren und vorrichtung zur verarbeitung eines digitalisierten bildes
DE69932429T2 (de) Verfahren und gerät für die inverse quantisierung von mpeg-4 video
DE10204617B4 (de) Verfahren und Vorrichtungen zur Kompression und Dekompression eines Videodatenstroms
DE10200901B4 (de) Effiziente Codierung von Videosignalen für skalierbare Simul-cast-Speicherung und -Übertragung sowie zugehöriger Codec
WO2003026310A2 (de) Effiziente videocodierung für skalierbare simul-cast-speicherung und -übertragung
EP2583461A1 (de) Verfahren und vorrichtung zum mischen von videoströmen auf der makroblock-ebene
EP1285537B1 (de) Verfahren und eine anordnung zur codierung bzw. decodierung einer folge von bildern
EP1413142A2 (de) Optimale snr-skalierbare videocodierung
DE10121259C2 (de) Optimale SNR-skalierbare Videocodierung
DE10219640B4 (de) Verfahren zum Codieren und Decodieren von Videosequenzen und Computerprogrammprodukt
EP1869890B1 (de) Verfahren und vorrichtung zur reduktion eines quantisierungsfehlers
DE10243568A1 (de) Verfahren zur skalierbaren Videocodierung eines Videobildsignals sowie ein zugehöriger Codec
DE102004011421B4 (de) Vorrichtung und Verfahren zum Erzeugen eines skalierten Datenstroms
WO2000046998A1 (de) Verfahren und anordnung zur transformation eines bildbereichs
EP1913780B1 (de) Verfahren zum korrigieren eines quantisierten datenwerts sowie eine dazugehörige vorrichtung
WO2001028252A1 (de) Progressive fehlertolerante codierung bzw. decodierung einer folge von bildern

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A2

Designated state(s): JP

AL Designated countries for regional patents

Kind code of ref document: A2

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FR GB GR IE IT LU MC NL PT SE SK TR

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
122 Ep: pct application non-entry in european phase
NENP Non-entry into the national phase

Ref country code: JP

WWW Wipo information: withdrawn in national office

Country of ref document: JP