DE10022520A1 - Verfahren zur örtlichen skalierbaren Bewegtbildcodierung - Google Patents

Verfahren zur örtlichen skalierbaren Bewegtbildcodierung

Info

Publication number
DE10022520A1
DE10022520A1 DE10022520A DE10022520A DE10022520A1 DE 10022520 A1 DE10022520 A1 DE 10022520A1 DE 10022520 A DE10022520 A DE 10022520A DE 10022520 A DE10022520 A DE 10022520A DE 10022520 A1 DE10022520 A1 DE 10022520A1
Authority
DE
Germany
Prior art keywords
image signal
resolution
coding
motion
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE10022520A
Other languages
English (en)
Inventor
Mathias Wien
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Priority to DE10022520A priority Critical patent/DE10022520A1/de
Priority to GB0111024A priority patent/GB2363274B/en
Priority to JP2001140361A priority patent/JP2001320715A/ja
Publication of DE10022520A1 publication Critical patent/DE10022520A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets

Abstract

Zur örtlichen skalierbaren Bewegtbildcodierung wird die Bewegungsschätzung (ME) für eine Stufe (EL) erhöhter Auflösung anhand interpolierter Versionen eines aktuellen und eines Referenzbildsignals durchgeführt, welches aus einem zeitlich zuvor ermittelten Bildsignal ermittelt wurde. DOLLAR A Bei dem Verfahren nach der Erfindung ist es nicht notwendig, für die Stufe (EL) erhöhter Auflösung Displacement-Vektoren zu übertragen. Nahezu die gesamte Datenrate kann für die Codierung des Prädiktionsfehlers verwendet werden.

Description

Stand der Technik
Die Erfindung geht aus von einem Verfahren zur örtlich skalierbaren Bewegtbildcodierung in mindestens zwei Stufen unterschiedlicher örtlicher Auflösung.
Skalierbare Bildcodierverfahren ermöglichen die Decodierung eines codierten Signals in verschiedenen Auflösungen. Üblicherweise verdoppelt sich die Auflösung zwischen den Skalierungsstufen. Zur Decodierung einer höheren Auflösung sind alle niedrigeren Auflösungen notwendig (hierarchische Struktur). Die Stufen werden in separaten Bitströmen codiert.
Die bisher standardisierten örtlich skalierbaren Verfahren [1, 2] basieren auf dem hybriden Codierkonzept. Sie haben eine Pyramiden-Struktur, in der das Base-Layer, d. h. eine Stufe mit niedriger örtlicher Auflösung, und das Enhancement-Layer, d. h. eine Stufe mit erhöhter örtlicher Auflösung, codiert werden. Zur Codierung des Enhancement- Layers verwenden sie die Enhanced Intra-Prädiktion, bei der keine Informationen aus vorhergehenden Frames, wohl aber aus dem aktuellen Base-Layer, verwendet werden, und die Enhanced-Inter-Prädiktion, bei der für das Enhancement-Layer Bewegungsvektoren und der Prädiktionsfehler übertragen werden. Hierbei muß die für das Enhancement-Layer zur Verfügung stehende Rate zwischen den Bewegungsvektoren (Displacement-Vektoren) und dem Prädiktionsfehler aufgeteilt werden.
In [3] wird ein örtlich skalierbares Verfahren vorgestellt, das ohne die Übertragung von Bewegungsvektoren auskommt. Hier wird die Schätzung zwischen zwei vorangegangenen Frames durchgeführt und die Bewegungsvektoren dann für den aktuellen Frame extrapoliert. Für dieses Verfahren wird der Begriff Rückwärts-Bewegungskompensation verwendet.
In [4] und [5] werden hierarchische Codierverfahren vorgestellt, die auf der diskreten Wavelettransformation (DWT) aufsetzten. Hierbei wird eine hierarchische Bewegungsschätzung auf den bisher codierten Zerlegungsstufen der DWT des aktuellen und des Referenz-Frames durchgeführt. Da diese dem Sender wie dem Empfänger bekannt sind, können diese Verfahren auf eine Übertragung von Bewegungsvektoren verzichten.
Eine einstufige DWT zerlegt einen Frame in Zeilen- und in Spaltenrichtung jeweils in eine Tiefpaß- (L) und eine Hochpaß-Komponente (H). Es resultieren vier Teilbänder LL, HL, LH und HH, die jeweils die halbe Zeilen- und Spaltenzahl haben; die Gesamtzahl der Koeffizienten enspricht also der Anzahl der Pixel im Frame. Bei einer mehrstufigen DWT wird diese Zerlegung jeweils auf das LL-Band der aktuellen Zerlegungsstufe angewendet. Im folgenden wird das LL-Band Tiefpaß-Band und die anderen Bänder HL, LH und HH, Hochpaß- Bänder genannt.
In der in [4] vorgeschlagenen Variante werden die auf den Tiefpaßbändern der groben Zerlegungsstufe des aktuellen und des Referenzframes geschätzten Displacement-Vektoren auf die Hochpaßbänder derselben Zerlegungsstufe angewendet. Bei [5] werden beide Tiefpaß-Bänder der groben Zerlegungsstufe des aktuellen und des Referenzframes überabgetastet und hochinterpoliert. Das geschätzte Displacement-Vektorfeld wird dann auf das Tiefpaß-Band der feineren Zerlegungsstufe angewendet. Die einstufige Zerlegung dieser bewegungskompensierten Prädiktion (BKP) wird dann als Prädiktion für die Hochpaß-Komponenten des aktuellen Frames verwendet. In beiden Verfahren werden also Prädiktionen für die Hochpaß-Bänder der groberen Stufe erstellt.
Vorteile der Erfindung
Das Verfahren der Erfindung nach Anspruch 1 und den Weiterbildungen gemäß den Unteransprüchen verbessert die Codiereffizienz von hybriden Bewegtbildcodierverfahren mit örtlicher Skalierbarkeit. Dieses Verfahren hat den Vorteil, daß auf die Übertragung von Displacement-Vektoren für die Stufe mit erhöhter örtlicher Auflösung verzichtet werden kann. Die in der Stufe erhöhter örtlicher Auflösung EL (Enhancement-Layer) zur bewegungskompensierten Prädiktion benötigten Displacement-Vektoren brauchen nicht als Seiteninformation zum Empfänger übertragen werden, sondern werden beim Sender (Encoder) und beim Empfänger (Decoder) aus bereits bekannten Informationen ermittelt.
Durch Anwendung der Rückwärts-Bewegungskompensation bei der Codierung des Enhancement-Layers wird eine Aufteilung der Rate zwischen den Displacement-Vektoren und dem Prädiktionsfehler vermieden. Die Begungsschätzung wird auf interpolierten Versionen des aktuellen und des Referenz- Frame durchgeführt. Da diese sowohl beim Sender als auch beim Empfänger bekannt sind, ist eine Übertragung der geschätzten Displacement-Vektoren als Seiteninformation nicht notwendig, so daß nahezu die gesamte Datenrate für die Codierung des Prädiktionsfehlers verwendet werden kann.
Die bisher standardisierten örtlich skalierbaren Verfahren können zeitliche Korrespondenzen nur durch Übertragung von Displacement-Vektoren ausnutzen. Gegenüber Verfahren, die die Displacement-Vektoren aus vorhergehenden Frames extrapolieren, hat das erfindungsgemäße Verfahren den Vorteil der besseren Übereinstimmung mit der im aktuellen Frame vorhandenen Bewegung. Gleichzeitig kann das Verfahren gut in vorhandene und zukünftige Standardcodierer eingebaut werden, da gegenüber Verfahren auf Basis der DWT keine wesentliche Änderung der Coderstruktur vorgenommen werden muß.
Im Gegensatz zu den eingangs vorgestellten DWT-basierten Konzepten wird im erfindungsgemäßen Verfahren das Enhancement-Layer zur Prädiktion der Displacement-Vektoren herangezogen. Dieses kann zur Schätzung optional tiefpaßgefiltert werden. Das Verfahren eignet sich zur blockbasierten Anwendung, insbesondere kann es hierbei parallel zu den zuvor beschriebenen Enhanced-Intra- und Enhanced-Inter-Prädiktionsverfahren eingesetzt werden. Bei Verfahren, die zur bewegungskompensierten Prädiktion eine Unterteilung der Blöcke in Unterblöcke zulassen, kann optional die optimale Block-Aufteilung vom Encoder als Seiteninformation übermittelt werden.
Die DWT-basierten Verfahren eignen sich nicht zur Anwendung in blockbasierten Codierkonzepten, da Blockstrukturen im Prädiktionsbild bei der DWT zu teuer zu codierenden Hochpaßinformationen führen.
Zeichnungen
Anhand der Zeichnungen werden Ausführungsbeispiele der Erfindung näher erläutert. Es zeigen
Fig. 1 ein Blockschaltbild mit Codierung des Base-Layers und den Möglichkeiten zur Codierung des Enhancement-Layers,
Fig. 2 die Suche des Displacement-Vektors zur Bewegungsschätzung im Enhancement-Layer,
Fig. 3 mögliche Teilungen eines Macroblockes,
Fig. 4 die Teilung von vier Macroblöcken des Enhancement- Layers.
Beschreibung von Ausführungsbeispielen
Im Folgenden wird eine Skalierung in zwei Stufen beschrieben; das erfindungsgemäße Verfahren kann auch entsprechend auf mehrere Skalierungsstufen angewendet werden. Die Stufe mit erhöhter örtlicher Auflösung wird mit Enhancement-Layer (EL) bezeichnet, die Stufe mit geringerer Auflösung heißt Base-Layer (BL).
Im erfindungsgemäßen Verfahren wird der bereits übertragene aktuelle BL-Frame durch Erhöhung der Abtastrate und Interpolationsfilterung auf die Größe und Auflösung der EL- Frames gebracht. Als Referenz wird der vorangegangene Bildframe des EL verwendet, welcher bei Encoder und Decoder bereits vorliegt. Optional kann der Referenz-Frame tiefpaßgefiltert werden, so daß er keine höheren Frequenzanteile enthält als der entsprechend hochinterpolierte BL-Frame. Zwischen dem hochinterpolierten BL-Frame und dem Referenz-Frame wird eine Bewegungsschätzung durchgeführt. Da die verwendeten Frames dem Sender (Encoder) als auch dem Empfänger (Decoder) bekannt sind, kann die Bewegungsschätzung sowohl beim Encoder als auch beim Decoder durchgeführt werden, so daß eine Übertragung der geschätzten Displacement-Vektoren nicht notwendig ist. Die Displacement- Vektoren werden zur bewegungskompensierten Prädiktion BKP des aktuellen, zu codierenden EL-Frames verwendet. Als Referenz bei der bewegungskompensierten Prädiktion BKP wird wiederum der vorangegangene EL-Frame verwendet, welcher ebenfalls optional vorher tiefpaßgefiltert werden kann. Bei solchen Codierverfahren, die bei der bewegungskompensierten Prädiktion BKP die Unterteilung eines Blockes in Unterblöcke verschiedener Größen zulassen, kann optional die optimale Aufteilung der EL-Blöcke in Unterblöcke beim Encoder ermittelt und als Seiteninformation zum Empfänger übertragen werden.
Das Verfahren der Erfindung kann optional entweder für alle Blöcke des zu codierenden EL-Frames verwendet, oder alternativ zu den bereits im Codierverfahren vorgesehenen BKP-Modi verwendet werden.
Das erfindungsgemäße Verfahren wird im folgenden am Ausführungsbeispiel der Luminanzkomponente einer Bildsequenz erläutert. Die Codierung soll blockorientiert auf Basis von sogenannten Makroblöcken (MB) mit 16 × 16 Pixeln erfolgen.
Das Verfahren nach der Erfindung soll mit EBP (enhanced backward prediction) bezeichnet werden. Die bisher verwendete Inter-Prädiktion wird mit EFP (enhanced forward prediction), die Intra-Prädiktion mit EIP bezeichnet. Das Enhancement-Layer soll in horizontaler und vertikaler Richtung um den Faktor 2 größer sein als das Base-Layer. Dieses Größenverhältnis wird üblicherweise verwendet; andere Größenverhältnisse können ebenso realisiert werden.
Mit Fn wird der n-te-Frame einer Bildsequenz bezeichnet. Für das Bewegungsvektorfeld wird das Symbol Vn verwendet, der quantisierte Prädiktionsfehler ist Dn. Mit n wird eine Prädiktion für Fn bezeichnet, während die Rekonstruktion mit n dargestellt wird. Die Indices B und E kennzeichnen jeweils das Base-Layer und das Enhancement-Layer des entsprechenden Frames. Ein Macroblock wird mit MB, ein Unterblock des Macroblocks mit B bezeichnet.
Die hochinterpolierte Version des Frames wird mit F'n und die skalierte Version des Bewegungsvektorfeldes mit V'n bezeichnet. n ist eine tiefpaßgefilterte Version von Fn.
In der Beschreibung wird der Referenzframe mit Fn-1 gekennzeichnet, was auf den zeitlich vorhergehenden Frame hindeutet. Es kann ebenso ein Frame in anderem zeitlichen Abstand oder eine Auswahl von vorhergehenden Frames als Referenz zur Prädiktion herangezogen werden.
Mit C D|n C V|n und C MB|n werden die codierten Prädiktionsfehler, die Bewegungsvektoren und die Information zur Aufteilung eines Macroblocks MB bezeichnet. Die Kosten KME, die bei der Bewegungsschätzung entstehen, setzen sich aus der Summe der absoluten Differenzen SAD zwischen aktuellem und verschobenem Referenzblock und optional den Kosten für die Codierung, z. B. Vektoren, Block-Aufteilung zusammen.
In Fig. 1 ist ein vereinfachtes Blockschaltbild mit Base- Layer und Enhancement-Layer-Codierung dargestellt. Die Codierung des Base-Layers entspricht dem bekannten hybriden Codierkonzept, wie es prinzipiell in den etablierten Standards verwendet wird; sie wird hier kurz erläutert, um die verwendeten Bezeichnungen einzuführen. Für den aktuellen Base-Layer-Frame FBn wird durch Bewegungsschätzung ME und Bewegungskompensation MC aus dem Referenz-Frame Bn-1 eine Vorwärtsprädiktion Bn erstellt. Das resultierende Bewegungsvektorfeld VBn wird entropie-codiert EC und an den Empfänger übertragen. Der Suchbereich bei Kompensation mit 16 × 16 Blöcken kann z. B. auf 16 Pixel in jede Richtung festgelegt werden.
Der Prädiktionsfehler zwischen FBn und Bn wird transformiert (TR, z. B. mit der diskreten Cosinus- Transformation DCT) und quantisiert. Dieses quantisierte Differenzsignal DBn wird zum einen codiert und zum Empfänger übertragen, zum anderen mittels TR-1 rücktransformiert und zur Prädiktion Bn addiert, so daß sich der am Empfänger rekonstruierte Frame Bn ergibt. Dieser wird in einem Buffer T zwischengespeichert, um als Referenz Bn-1 für den nächsten Frame zu dienen. Mit Q ist der Quantisierer bezeichnet.
Das Verfahren wird macroblockweise angewendet. Falls für die Macroblöcke verschiedene Modi, z. B. Intra oder Inter, oder Aufteilungen vorgesehen sind, müssen diese zusätzlich als Seiteninformation C MB|n übertragen werden. Die mögliche Entropie-Codierung für C MB|n wurde ebenso wie die Wahl zwischen Intra- und Intercodierung aus Gründen der Übersichtlichkeit nicht im Blockschaltbild dargestellt.
Basisverfahren
Zunächst stehen in Fig. 1 die Schalter wie folgt:
S1 = offen, S2 = b, S3 = a, S4 = a. Da Schalter S5 und S3 gekoppelt sind, werden hier keine Displacement-Vektoren übertragen. Die Schalterstellungen seien fest. Die Schätzung von VEn erfolgt zwischen den durch Überabtastung und Filterung mit dem Interpolationsfilter G (z) hochinterpolierten Base-Layer-Frame 'Bn und dem Enhancement-Layer-Referenz-Frame En-1.
Die Bewegungsschätzung ME schätzt die Bewegung für den aktuellen Block. Dies kann in Form eines dichten Displacement-Vektorfeldes oder blockbasiert durchgeführt werden. Ein Displacement-Vektorfeld heißt dicht, wenn für jedes Pixel des kompensierten Bereiches ein eigener Vektor existiert. Bei blockbasierten Verfahren wird einem Block, z. B. 8 × 8 Pixel, ein gemeinsamer Vektor zugewiesen. Es werden keine Vektoren und im blockbasierten Fall keine Informationen über die Blockteilung übertragen.
Filterung des Referenz-Frames
Hierzu wird der Schalter S2 in Stellung a gebracht. Die Schalterstellungen seien fest wie im Basisverfahren. Die Schätzung von VEn erfolgt nun zwischen dem hochinterpolierten Base-Layer-Frame 'Bn und dem mit L(z) tiefpaßgefilteren Enhancement-Layer-Frame *|En-1. Die Filterung dient dazu, den Frequenzgang des Referenz- Frames dem des hochinterpolierten Base-Layer-Frames anzupassen.
Vereinfachte Vektorsuche
Hierzu wird Schalter S1 geschlossen. Dadurch liegt V'Bn am Bewegungsschätzungsblock ME des Enhanced-Layer EL an und dient zur Initialisierung der Vektorschätzung. Das Prädiktions-Vektorfeld V'Bn entsteht durch Skalierung von VBn um den Faktor 2 und ist damit der Größe des Enhancement- Layers angepaßt. Die Suche wird in einem verkleinerten Suchbereich um den skalierten Base-Layer-Vektor herum durchgeführt, z. B. zwei Pixel, um den Suchaufwand zu minimieren. Dies ist in Fig. 2 dargestellt. Um den skalierten Bewegungsvektor V'Bn (i,j) wird die Suche auf dem interpolierten Frame 'Bn mit verkleinertem Suchbereich RE durchgeführt.
Übertragung der Block-Aufteilung
Um den Suchaufwand zur Bewegungsschätzung auf der Decoder- Seite zu minimieren, kann bei blockbasierten Verfahren, die Unterteilungen der Macroblöcke MB zulassen, C MB|En als Seiteninformation übertragen werden. Die Suche nach den Vektoren muß dann nur noch für die bereits übertragene Block-Aufteilung durchgeführt werden.
Wahl des Prädiktions-Modus
In dieser Betriebsart wird das erfindungsgemäße Verfahren parallel zu den bekannten Prädiktions-Modi verwendet. Dazu werden die Codierungs-Kosten für EIP (S1 = offen, S2 = b, S3 = a, S4 = b), EFP (S1 = offen, S2 = b, S3 = b, S4 = a) und EBP (Schalterstellungen wie zuvor beschrieben) verglichen und für jeden Macroblock MB das günstigste Verfahren gewählt.
Verwendung verschiedener Blockgrößen
Die möglichen Unterteilungen des Macroblocks sind an die im Testmodell TML-3 zum Videocodierstandard H.26L vorgeschlagenen Unterteilungen angelehnt [6]. Der Macroblock kann auf die in Fig. 3 dargestellten Weisen in Unterblöcke zerlegt werden, so daß sich Unterblöcke der Größen 16 × 16, 16 × 8, 8 × 16, 8 × 8, 8 × 4, 4 × 8 und 4 × 4 Pixeln ergeben. Im Enhancement-Layer korrespondieren vier Macroblöcke mit einem hochinterpolierten Base-Layer- Macroblock. Die im Base-Layer verwendete Teilung der Macroblöcke wird durch die Interpolation in 'Bn um den Faktor 2 vergrößert. Die Größe der Unterblöcke der Enhancement-Layer-Macroblöcke darf diese Base-Layer-Teilung nicht überschreiten, da sonst Blockartefakte innerhalb der Enhancement-Layer-Blöcke auftreten können.
In Fig. 4, die die Teilung von vier Makroblöcken MBEn (i,j) mit i,j = {0,1} des Enhancement-Layer in Abhängigkeit von der Teilung des korrespondierenden interpolierten Base- Layer-Macroblocks MB'Bn schematisch zeigt, sind vier mögliche Teilungen für Enhancement-Layer-Macroblöcke dargestellt, wenn im korrespondierenden Base-Layer- Macroblock die Teilung 6 aus Fig. 3 gewählt wurde.
Die Teilung für die Enhancement-Layer-Macroblöcke soll so gewählt werden, daß der zu codierende Prädiktionsfehler möglichst klein wird. Dazu werden die ermittelten Bewegungsvektoren auf das nicht gefilterte Enhancement- Layer-Signal En-1 angewendet, und die günstigste Blockteilung als Vorwärts-Information an den Empfänger übertragen.
Das Verfahren nach der Erfindung eignet sich zur Anwendung in der örtlich skalierbaren Bildsequenzcodierung mit H.26L.
Für Macroblöcke, die mit EBP codiert wurden, muß dieses im Macroblock-Header signalisiert werden, außerdem werden keine Bewegungsvektoren codiert.
Literatur
[1] ISO/IEC JTC1 IS 14496-2 (MPEG-4). "Information technology - generic coding of audio-visual objects (final draft of international standard)", Oct. 1998.
[2] Telecom. Standardization Sector of ITU, "Video coding for low bitrate communication (H.263 Version 2)", Sept. 1997.
[3] T. Naveen and J. W. Woods, "Motion compensated multiresolution transmission of high definition video", IEEE Trans. on Circuits and Systems for Video Technology, vol 4, pp 29-41, Feb. 1994.
[4] A. Nosratinia and M. T. Orchard; "Multiresolution backward video coding", in Proc. IEEE Int. Conf. Image Processing ICIP '95, vol. 2, pp. 563-566, Oct. 1995.
[5] X. Yang and K. Ramchandran, "Hierarchical backward motion compensation for wavelet video coding optimized interpolation filters", in Proc. IEEE Int. Conf. Image Processing ICIP '97, vol. 1, pp. 85-88, Oct. 1997.
[6] Telecom. Standardization Sector of ITU, "H.26L test model long term 3", in Study Group 16, Question 15, Meeting J. (Osaka, Japan), ITU, Mar. 2000.

Claims (10)

1. Verfahren zur örtlichen skalierbaren Bewegtbildcodierung in mindestens zwei Stufen (EL, BL) unterschiedlicher örtlicher Auflösung mit folgender Maßnahme:
die Bewegungsschätzung (ME) wird für eine Stufe (EL) erhöhter örtlicher Auflösung anhand interpolierter Versionen eines aktuellen Bildsignals und eines Referenzbildsignals durchgeführt, wobei als Referenzbildsignal ein zeitlich zuvor ermitteltes oder übertragenes Bildsignal verwendet wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Displacement-Vektoren für die Stufe erhöhter örtlicher Auslösung encoder- und decoderseitig aus bereits bekannten Informationen ermittelt werden und somit nicht als Seiteninformation zum Decoder übertragen werden müssen.
3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß der durch Nichtübertragung der Seiteninformation eingesparte Codieraufwand im wesentlichen zur Codierung des Prädiktionsfehlers verwendet wird.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß ein bereits übertragenes aktuelles Bildsignal der Stufe (BL) niedriger örtlicher Auflösung durch Erhöhung der Abtastrate und Interpolationsfilterung auf die Größe und Auflösung der Stufe (EL) erhöhter Auflösung gebracht wird und mit dem Referenzbildsignal der Stufe (EL) erhöhter Auflösung zur Bewegungsschätzung verglichen wird.
5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß das Referenzbildsignal tiefpaßgefiltert wird.
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß die Displacement-Vektoren zur bewegungskompensierten Prädiktion (BKP) des aktuellen zu codierenden Bildsignals erhöhter Auflösung verwendet werden.
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß als Referenz zur bewegungskompensierten Prädiktion ein zeitlich zuvor ermitteltes oder übertragenes Bildsignal verwendet wird.
8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß die Bewegungsschätzung (ME) blockbasiert vorgenommen wird.
9. Verfahren nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, daß eine parallele Anwendung mit Enhanced- Intra und/oder Enhanced-Inter-Prädiktionsverfahren vorgenommen wird.
10. Verfahren nach Anspruch 8 oder 9, dadurch gekennzeichnet, daß bei einer Unterteilung von Blöcken in Unterblöcke die optimale Blockaufteilung als Seiteninformation zum Empfänger übermittelt wird.
DE10022520A 2000-05-10 2000-05-10 Verfahren zur örtlichen skalierbaren Bewegtbildcodierung Withdrawn DE10022520A1 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE10022520A DE10022520A1 (de) 2000-05-10 2000-05-10 Verfahren zur örtlichen skalierbaren Bewegtbildcodierung
GB0111024A GB2363274B (en) 2000-05-10 2001-05-04 Spatial scalable moving-picture encoding method
JP2001140361A JP2001320715A (ja) 2000-05-10 2001-05-10 動画の局所的階層符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10022520A DE10022520A1 (de) 2000-05-10 2000-05-10 Verfahren zur örtlichen skalierbaren Bewegtbildcodierung

Publications (1)

Publication Number Publication Date
DE10022520A1 true DE10022520A1 (de) 2001-11-15

Family

ID=7641280

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10022520A Withdrawn DE10022520A1 (de) 2000-05-10 2000-05-10 Verfahren zur örtlichen skalierbaren Bewegtbildcodierung

Country Status (3)

Country Link
JP (1) JP2001320715A (de)
DE (1) DE10022520A1 (de)
GB (1) GB2363274B (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8290058B2 (en) 2004-08-27 2012-10-16 Siemens Aktiengesellschaft Method and device for coding and decoding
EP1679900A3 (de) * 2005-01-07 2016-04-27 NTT DoCoMo, Inc. Gerät und Verfahren für Dekodierung und Kodierung mit mehrfachen Auflösungen

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3944225B2 (ja) 2002-04-26 2007-07-11 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム及び画像復号プログラム
JP2007510213A (ja) 2003-10-28 2007-04-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 小さな高速移動物体を追跡するための動きベクトル場の改良
JP4891234B2 (ja) * 2004-06-23 2012-03-07 エージェンシー フォー サイエンス, テクノロジー アンド リサーチ グリッド動き推定/補償を用いたスケーラブルビデオ符号化
JP4835855B2 (ja) 2004-10-07 2011-12-14 日本電気株式会社 動画像符号化の装置、方法及びプログラムと、動画像復号の装置方法及びプログラム
JP2008517498A (ja) * 2004-10-15 2008-05-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 中間レイヤ動きデータ予測を用いて符号化されたビデオシーケンスを生成するための装置および方法
DE102004059993B4 (de) 2004-10-15 2006-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer codierten Videosequenz unter Verwendung einer Zwischen-Schicht-Bewegungsdaten-Prädiktion sowie Computerprogramm und computerlesbares Medium
KR100656645B1 (ko) * 2004-12-22 2006-12-11 엘지전자 주식회사 동영상 부호화 장치와 방법
EP1977612A2 (de) * 2006-01-09 2008-10-08 Nokia Corporation Fehlerrobuste modusentscheidung bei der skalierbaren videocodierung
WO2014141964A1 (ja) * 2013-03-14 2014-09-18 ソニー株式会社 画像処理装置および方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2702917B1 (fr) * 1993-03-16 1995-04-21 Thomson Csf Codeur-décodeur pour un codage compatible sous-bande d'images de télévision, et son application au codage de mouvement hiérarchique par des structures arborescentes .
CA2126467A1 (en) * 1993-07-13 1995-01-14 Barin Geoffry Haskell Scalable encoding and decoding of high-resolution progressive video
JPH07212761A (ja) * 1994-01-17 1995-08-11 Toshiba Corp 階層符号化装置及び階層復号化装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8290058B2 (en) 2004-08-27 2012-10-16 Siemens Aktiengesellschaft Method and device for coding and decoding
EP1679900A3 (de) * 2005-01-07 2016-04-27 NTT DoCoMo, Inc. Gerät und Verfahren für Dekodierung und Kodierung mit mehrfachen Auflösungen

Also Published As

Publication number Publication date
JP2001320715A (ja) 2001-11-16
GB0111024D0 (en) 2001-06-27
GB2363274B (en) 2002-07-17
GB2363274A (en) 2001-12-12

Similar Documents

Publication Publication Date Title
DE102004059978B4 (de) Vorrichtung und Verfahren zum Erzeugen einer codierten Videosequenz und zum Decodieren einer codierten Videosequenz unter Verwendung einer Zwischen-Schicht-Restwerte-Prädiktion sowie ein Computerprogramm und ein computerlesbares Medium
DE69535228T2 (de) Bildumsetzungsvorrichtung
DE60027955T2 (de) Verfahren und Vorrichtung zur kontextbasierten Inter/Intra Kodierungsmodeauswahl
EP0359094B1 (de) Übertragungssystem für ein zeitlich und örtlich hochaufgelöstes Bildsignal
DE10190285B4 (de) Verfahren und System zur Verarbeitung von komprimierten Videosignalen
DE60215241T2 (de) Verfahren und Vorrichtung zur Reduzierung von Störungen in dekodierten Bildern mit Nachfilterung
DE69836696T2 (de) Verfahren und vorrichtung zur durchführung einer hierarchischen bewegungsschätzung unter verwendung einer nicht-linearen pyramide
DE10022331A1 (de) Verfahren zur Transformationscodierung von Bewegtbildsequenzen
DE69915843T2 (de) Teilbandkodierung/-dekodierung
WO1999004574A1 (de) Interpolationsfilterungsverfahren für sub-pelgenauigkeit-bewegungsschätzung
DE10022520A1 (de) Verfahren zur örtlichen skalierbaren Bewegtbildcodierung
DE69637008T2 (de) Verfahren zur Videokompression mittels Teilbandzerlegung
EP1025704B1 (de) Verfahren zur bewegungskompensierenden prädiktion von bewegtbildfolgen
DE102004041664A1 (de) Verfahren zum Codieren und Decodieren, sowie Codier- und Decodiervorrichtung zur Videocodierung
WO2006042612A1 (de) Vorrichtung und verfahren zum erzeugen einer codierten videosequenz und zum decodieren einer codierten videosequenz unter verwendung einer zwischen-schicht-restwerte-praediktion
DE19951341B4 (de) Verfahren zur bewegungskompensierenden Prädiktion von Bewegtbildern sowie Einrichtung hierzu
DE60210757T2 (de) Vorrichtung zur videokodierung und -aufzeichnung
EP1285537B1 (de) Verfahren und eine anordnung zur codierung bzw. decodierung einer folge von bildern
EP0346636A2 (de) Verfahren zur Aufbereitung und Übertragung einer Bildsequenz
DE102004063902B4 (de) Computerprogramm mit einem Verfahren zum Verarbeiten einer Gruppe von Bildern und mit einem Verfahren zum Verarbeiten eines Basisbildes und eines oder mehrerer Erweiterungsbilder
DE102004011421B4 (de) Vorrichtung und Verfahren zum Erzeugen eines skalierten Datenstroms
DE102004011422B4 (de) Vorrichtung und Verfahren zum Verarbeiten einer Gruppe von Bildern und Vorrichtung und Verfahren zum Verarbeiten eines Basisbildes und eines oder mehrerer Erweiterungsbilder
WO2000046998A1 (de) Verfahren und anordnung zur transformation eines bildbereichs
DE10340407A1 (de) Vorrichtung und Verfahren zum Codieren einer Gruppe von aufeinanderfolgenden Bildern und Vorrichtung und Verfahren zum Decodieren eines codierten Bildsignals
WO2000049525A1 (de) Verfahren und anordnung zum abspeichern von mindestens einem bild mit zugehöriger relationalen information

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
R016 Response to examination communication
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee

Effective date: 20121201