DE19749604A1

DE19749604A1 - Verfahren zum Kodieren eines Modus beim Kodieren binärer Formen

Info

Publication number: DE19749604A1
Application number: DE1997149604
Authority: DE
Inventors: Seok-Won Han
Original assignee: Daewoo Electronics Co Ltd
Current assignee: WiniaDaewoo Co Ltd
Priority date: 1997-10-14
Filing date: 1997-11-10
Publication date: 1999-04-15
Also published as: KR100256022B1; GB9723483D0; FR2769784A1; FR2769784B1; CN1214597A; US6049567A; KR19990031654A; CN1130920C; JPH11177990A; GB2330472B; GB2330472A

Description

Die vorliegende Erfindung betrifft ein Verfahren zum Kodieren eines Modus bzw. ein Moduskodierverfahren, insbesondere ein Verfahren zum Kodieren eines Modus beim Kodieren binärer Formen (sog. Binärformkodieren oder "Binary shape encoding").

In digitalen Videosystemen, wie Video-Telefon- und Telekonferenz-Systemen ist eine große Anzahl digitaler Daten erforderlich, jedes Videobildsignal bzw. Videohalbbildsignal bzw. Videoteilbildsignal zu definieren, da das Videobildsignal eine Folge digitaler Daten umfaßt, die als Pixelwerte bezeichnet werden.

Unter dem Begriff "Bild" soll in den gesamten Unterlagen entweder ein Voll-, ein Halb- oder ein Teilbild verstanden werden.

Da jedoch die verfügbare Frequenzbandbreite eines herkömmlichen Übertragungskanals begrenzt ist, um die erhebliche Anzahl digitaler Daten darüber zu übertragen, ist es erforderlich, das Datenvolumen unter Verwendung zahlreicher Datenkomprimierungs techniken zu komprimieren oder zu reduzieren, insbesondere in dem Fall solcher Videosignalkodierer niedriger Bitrate, wie Video-Telefon- und Telekonferenz-Systemen.

Eine von diesen Techniken zum Kodieren von Videosignalen für ein Kodiersystem niedriger Bitrate ist eine objekt-orientierte Analyse-Synthese-Kodiertechnik, bei welcher ein Eingangsvideobild in Objekte aufgeteilt wird, und drei Sätze an Parametern zum Definieren der Bewegungs-, der Kontur- und der Pixeldaten jedes Objektes über verschiedene Kodierkanäle verarbeitet werden.

Ein Beispiel eines solchen objekt-orientierten Kodierschemas ist das sogenannte MPEG (Moving Picture Experts Group) Phase bzw. Standard 4 (MPEG-4), das entworfen wurde, um einen audio visuellen Kodierstandard zur Verfügung zu stellen, der inhalts basierende Interaktivität, verbesserte Kodiereffizienz und/oder universelle Zugriffsmöglichkeit in solchen Anwendungen wie einer Kommunikation bei niedriger Bitrate, interaktives Multi media (z. B. Spiele, interaktives TV, etc.) und Gebietsüber wachung ermöglicht.

Gemäß dem MPEG-4 wird ein Eingangsvideobild in eine Vielzahl an Videoobjektebenen (VOE's) aufgeteilt, die Dingen bzw. Gesamtheiten in einem Bitstrom entsprechen, auf die ein Teilnehmer Zugriff haben und sie manipulieren kann. Eine VOE kann als ein Objekt bezeichnet werden und durch ein Umfangs rechteck dargestellt werden, dessen Breite und Höhe das kleinste Vielfache von 16 Pixeln (eine Makroblockgröße) sein kann, das jedes Objekt derart umrandet, daß der Kodierer das Eingangsvideobild auf einer VOE-zu-VOE-Basis, d. h., einer Objekt-zu-Objekt-Basis, verarbeiten kann.

Eine in dem MPEG-4 beschriebene VOE enthält Forminformation und Farbinformation, bestehend aus Luminanz- und Chrominanzdaten, wobei die Forminformation beispielsweise durch eine binäre Maske dargestellt ist und sich auf die Luminanzdaten bezieht. In der binären Maske wird ein binärer Wert, z.B 0, verwendet, um einen Pixel zu bezeichnen, d. h., einen außerhalb des Objektes in der VOE angeordneten Hintergrundpixel, und der andere binäre Wert, z. B. 1, wird verwendet, um einen Pixel zu bezeichnen, d. h., einen Objektpixel innerhalb des Objektes.

Ein binäres Formsignal, das den Ort und die Form der Objekte darstellt, kann als ein binärer Alphablock (BAB) innerhalb eines Bildes oder einer VOE, z. B. ein Block aus 16×16 binären Pixeln, ausgedrückt werden, wobei jeder binäre Pixel einen binären Wert aufweist, z. B. 0 oder 1, der entweder einen Objektpixel oder einen Hintergrundpixel darstellt.

Ein BAB kann unter Anwendung eines herkömmlichen bit-map basierenden Formkodierverfahrens, wie einem kontext-basierenden arithmetischen Kodierverfahren (CAE-Verfahren = "context-based arithmetic encoding"-Verfahren) (siehe MPEG-4 Video Verification Model Version 7.0, International Organization for Standardization, Coding of Moving And Associated Audio Information, ISO/IEC JTC1/5C29/WG11 MPEG97/N1642, Bristol, April 1997) kodiert werden.

Beispielsweise wird in einem Intra-Modus ein BAB unter Anwendung eines herkömmlichen CAE-Verfahrens kodiert, um dadurch einen kodierten BAB zu erzeugen. In einem Inter-Modus wird ein Bewegungsvektor, der die Verschiebung zwischen einem BAB innerhalb eines aktuellen Bildes (oder VOE) und seinem ähnlichsten BAB innerhalb eines vorhergehenden Bildes (oder VOE) darstellt, zusammen mit Fehlerdaten, welche die Differenz zwischen diesen darstellen, über eine Bewegungsabschätzung und -kompensation ermittelt. Die Fehlerdaten werden unter Anwendung eines herkömmlichen CAE-Verfahrens kodiert, um dadurch kodierte Fehlerdaten zu erzeugen. Dann werden die kodierten Fehlerdaten und der Bewegungsvektor kombiniert, um dadurch einen kodierten BAB zu erzeugen.

Jedoch wird der wie oben erhaltene kodierte BAB bei einem Dekodierer in ein rekonstruiertes Bild dekodiert, das lediglich eine vorgegebene Auflösung hat. Daher wird der BAB herkömm licherweise mit einer darin implementierten Skalierbarkeit kodiert, welche die Auflösung des dekodierten Bildes für den BAB graduell ansteigen läßt, falls ein Bild für einen BAB mit einer höheren Auflösung gewünscht wird. Das heißt, daß eine Basisschicht, die ein Bild für einen BAB mit einer niedrigeren Auflösung darstellt, kodiert wird; und basierend auf der Basis schicht zusätzliche Information hinzugefügt wird, um eine Anreicherungsschicht für den BAB zu erzeugen, die anschließend kodiert wird.

Es werden bereits gemäß einem herkömmlichen Kodierverfahren für binäre Formen, z. B. einem CAE-Verfahren zum Verbessern ihrer Kodiereffizienz, zahlreiche Modus-Signale für entsprechende BAB's kodiert, um dadurch jeweils entsprechende kodierte Modus-Signale bereitzustellen, die an einen Dekodierer über einen Transmitter auf einer BAB-zu-BAB-Basis übertragen werden sollen, anstatt all die binären Pixelwerte innerhalb des BAB's zu kodieren und die entsprechenden kodierten binären Pixelwerte zu übertragen.

Genauer gesagt, gibt es beispielsweise einhundert BAB's aus 16×16 binären Pixeln, und jeder BAB enthält eine Anzahl an 256 binären Pixeln, falls eine Bildebene aus 160×160 binären Pixeln innerhalb eines Bildes (oder einer VOE) vorliegt. Daher ist eine Anzahl an 256 Datenbits pro BAB erforderlich, um eine binäre Forminformation zu übertragen, die angibt, ob jeder binäre Pixel innerhalb eines BAB ein Objektpixel oder ein Hintergrundpixel ist, ohne daß dort ein Datenverlust vorliegt. Dies ist hinsichtlich der Kodiereffizienz sehr ineffektiv. Daher ist es erforderlich, die Kodiereffizienz für einen BAB unter Verwendung zeitlicher und/oder räumlicher Korrelationen zwischen binären Pixeln innerhalb des BAB zu verbessern.

Jedoch ist es wünschenswert, da es beim Verbessern oder Erhöhen der Kodiereffizienz beim Kodieren binärer Pixel innerhalb eines BAB unter Verwendung zeitlicher und/oder räumlicher Korrelationen zwischen den binären Pixeln innerhalb des BAB Einschränkungen gibt, die Kodiereffizienz durch Kodieren eines Modus-Signals zu verbessern, das eine entsprechende Kodierbedingung für den BAB darstellt oder charakterisiert, um dadurch ein entsprechendes kodiertes Modus-Signal zu erzeugen und anschließend zu übertragen.

Falls beispielsweise alle binären Pixel innerhalb eines BAB Objektpixel sind, wird, anstatt alle binären Pixelwerte zum Erzeugen von zu übertragenden kodierten binären Pixelwerten zu kodieren, ein Modus-Signal kodiert, das darüber informiert oder anzeigt, daß all die binären Pixel innerhalb des BAB Objektpixel sind, und dadurch ein entsprechendes zu übertragendes kodiertes Modus-Signal erzeugt wird. Unter Anwendung des oben beschriebenen Verfahrens ist es möglich, die Kodiereffizienz durch Übertragen des entsprechenden kodierten Modus-Signals als binäre Forminformation für den BAB zu erhöhen, das eine Anzahl an 256 binären Pixeln innerhalb des BAB repräsentiert. Hierfür wird ein herkömmliches Modus-Kodierverfahren nachfolgend beschrieben.

Gemäß einem herkömmlichen Modus-Kodierverfahren wird beim Kodieren eines BAB ein Modus-Signal unter einer Anzahl an sieben nachfolgend beschriebenen Modus-Signalen in ein ent sprechendes zu übertragendes kodiertes Modus-Signal kodiert. Die sieben Modus-Signale werden nachfolgend beschrieben.

Ein erstes Modus-Signal zeigt an, daß in einem Inter-Modus ein Bewegungsvektor gleich Null ist und ein Kodieren durchgeführt wurde; ein zweites Modus-Signal zeigt an, daß in dem Inter-Modus der Bewegungsvektor nicht gleich Null ist und das Kodieren durchgeführt wurde; ein drittes Modus-Signal zeigt an, daß in dem Inter-Modus der Bewegungsvektor gleich Null ist und das Kodieren nicht durchgeführt wurde; ein viertes Modus-Signal zeigt an, daß in dem Inter-Modus der Bewegungsvektor nicht gleich Null ist und das Kodieren nicht durchgeführt wurde; ein fünftes Modus-Signal zeigt an, daß in einem Intra-Modus das Kodieren durchgeführt wurde; ein sechstes Modus-Signal zeigt an, daß alle binären Pixel innerhalb des BAB jeweils Objektpixel sind; und ein siebtes Modus-Signal zeigt an, daß all die binären Pixel innerhalb des BAB jeweils Hintergrundpixel sind (siehe MPEG-4 Video Verification Model Version 7.0, International Organization for Standardization, Coding of Moving And Associated Audio Information, ISO/IEC, JTCI/SC29/WG11 MPEG97/N1642, Bristol, April 1997, S. 20-21).

In Fig. 1 ist eine intra-kodierte VOE und eine inter-kodierte VOE zum Beschreiben eines herkömmlichen Modus-Kodierverfahrens beim Kodieren einer binären Form gezeigt. In Fig. 1 sind eine intra-kodierte VOE 100 und nach Vorhersagen kodierte VOE's 110 und 120 gezeigt. Die VOE 110 enthält BAB's 111, 112 und 113; und die VOE 120 enthält BAB's 121, 122 und 123, wobei ein gestrichelter Bereich und ein ungestrichelter Bereich innerhalb jeder VOE ein Objekt bzw. einen Hintergrund darstellt.

Das fünfte Modus-Signal wird jedem BAB innerhalb der VOE 100 zugewiesen oder bereitgestellt, da die VOE 100 eine intra kodierte VOE ist. Das siebte und das sechste Modus-Signal werden dem BAB 111 bzw. dem BAB 113 innerhalb der VOE 110 zugewiesen, da der BAB 111 und der BAB 113 lediglich Objekt pixel bzw. lediglich Hintergrundpixel enthalten.

Falls ein entsprechender Bewegungsvektor, der die Verschiebung zwischen dem BAB 112 innerhalb der VOE 110 und einem dem BAB 112 innerhalb der VOE 100, die eine vorhergehende VOE zu der VOE 110 ist, ähnlichsten BAB (der unten als ein erster vorhergesagter BAB bezeichnet wird) darstellt, gleich Null ist und falls Differenzen zwischen den binären Pixelwerten des BAB 112 und den entsprechenden binären Pixelwerten des ersten vorhergesagten BAB vorliegen und folglich die Differenzen kodiert werden, wird das erste Modus-Signal dem BAB 112 zugewiesen.

Falls ein entsprechender Bewegungsvektor, der die Verschiebung zwischen dem BAB 121 innerhalb der VOE 120 und einem dem BAB 121 innerhalb der VOE 110, die eine vorhergehende VOE zu der VOE 120 ist, ähnlichsten BAB (der unten als ein zweiter vorhergesagter BAB bezeichnet wird) darstellt, nicht gleich Null ist und falls Differenzen zwischen den binären Pixelwerten des BAB 121 und den entsprechenden binären Pixelwerten des zweiten vorhergesagten BAB vorliegen und folglich die Differenzen kodiert werden, wird das zweite Modus-Signal dem BAB 121 zugewiesen.

Wenn ein entsprechender Bewegungsvektor, der die Verschiebung zwischen dem BAB 122 innerhalb der VOE 120 und einem BAB (der unten als ein dritter vorhergesagter BAB bezeichnet wird) darstellt, der dem BAB 122 innerhalb der VOE 110 am ähnlichsten ist, gleich Null ist und wenn keine Differenz zwischen den binären Pixelwerten des BAB 122 und den entsprechenden binären Pixelwerten des dritten vorhergesagten BAB vorliegt und damit die Differenz nicht kodiert wird, wird das dritte Modus-Signal dem BAB 121 zugewiesen.

Wenn ein entsprechender Bewegungsvektor, der die Verschiebung zwischen dem BAB 123 innerhalb der VOE 120 und einem BAB (der unten als ein vierter vorhergesagter BAB bezeichnet wird) darstellt, der dem BAB 123 innerhalb der VOE 110 am ähnlichsten ist, nicht gleich Null ist und wenn Differenzen zwischen den binären Pixelwerten des BAB 123 und den entsprechenden binären Pixelwerten des vierten vorhergesagten BAB vorliegen und folglich die Differenzen kodiert werden, wird das vierte Modus-Signal dem BAB 121 zugewiesen.

Obwohl ein wie oben beschriebenes herkömmliches Modus-Kodierverfahren eine beträchtliche Leistungssteigerung ver wirklichen kann, wenn es für das Kodieren einer Basisschicht angewendet wird, gibt es beim Verbessern der Kodiereffizienz Einschränkungen, wenn es für das Kodieren einer Anreicherungs schicht angewandt wird, da es nicht die Eigenschaften des Kodierens der Anreicherungsschicht wiedergibt.

Es ist Aufgabe der Erfindung, ein Modus-Kodierverfahren bei einem Kodieren binärer Formen zu schaffen, welches die Kodiereffizienz weiter erhöhen kann.

Die Erfindung löst diese Aufgabe mit dem Gegenstand des Anspruchs 1. Weitere bevorzugte Ausführungsbeispiele der Erfindung sind in den Unteransprüchen 2 bis 12 beschrieben.

Nach Anspruch 1 ist ein Modus-Kodierverfahren zum Kodieren eines binären Alphablocks (BAB) aus M×N binären Pixeln innerhalb eines aktuellen Bildes geschaffen, basierend auf dem aktuellen Bild und einem vorhergehenden Bild, die eine Mehrzahl an BAB's enthalten, wobei M und N jeweils positive ganze Zahlen sind, jeder binäre Pixel einen binären Wert aufweist, der entweder einen Objektpixel oder einen Hintergrundpixel darstellt, bei welchem: (a) ein Sub-Abtasten auf dem BAB innerhalb des aktuellen Bildes gemäß einer vorgegebenen Sub-Abtastregel durchgeführt wird, um dadurch einen Abtastblock aus (M/K)×(N/K) binären Pixeln innerhalb des aktuellen Bildes zu erzeugen, wobei M und N jeweils Vielfache von K sind, und K eine vorgegebene positive ganze Zahl ist; (b) ein rekonstruierter BAB aus M×N binären Pixeln gemäß einer vorgegebenen Rekonstruktionsregel erzeugt wird, basierend auf dem Abtastblock innerhalb des aktuellen Bildes; (c) die Differenz zwischen dem rekonstruierten BAB und dem BAB innerhalb des aktuellen Bildes berechnet wird, und falls keine Differenz zwischen diesen vorliegt, ein erstes Modus-Signal erzeugt wird, das darüber informiert, daß keine Differenz zwischen diesen vorliegt und folglich die Differenz nicht kodiert wird, und falls eine Differenz zwischen diesen vorliegt, ein zweites Modus-Signal erzeugt wird, das darüber informiert, daß eine Differenz zwischen diesen vorliegt, und gleichzeitig ein zweiter Fehlerdatenblock aus M×N binären Pixeln erzeugt wird, der die zu kodierende Differenz als ein kodierter zweiter Fehlerdatenblock darstellt; (d) in einem Inter-Modus ein Sub-Abtasten auf den BAB's innerhalb des vorhergehenden Bildes gemäß der vorgegebenen Sub-Abtastregel durchgeführt wird, um dadurch eine Mehrzahl entsprechender Abtastblöcke aus (M/K)×(N/K) binären Pixeln innerhalb des vorhergehenden Bildes zu erzeugen; (e) in dem Inter-Modus der Abtast-Block innerhalb des aktuellen Bildes mit den entsprechenden Abtastblöcken innerhalb des vorhergehenden Bildes verglichen wird und anschließend unter den entsprechenden Abtastblöcken innerhalb des vorhergehenden Bildes ein dem Abtastblock innerhalb des aktuellen Bildes ähnlichster entsprechender zweiter Abtastblock als ein vorhergesagter Abtastblock erfaßt wird, um dadurch einen Bewegungsvektor mit vertikaler und horizontaler Komponente zu erzeugen, der die Verschiebung zwischen dem Abtastblock innerhalb des aktuellen Bildes und dem vorhergesagten Abtastblock darstellt; (f) in dem Inter-Modus, basierend auf dem Bewegungsvektor, unter den BAB's innerhalb des vorhergehenden Bildes ein dem BAB innerhalb des aktuellen Bildes ähnlichster BAB als ein vorhergesagter BAB erfaßt wird, die Differenz zwischen dem BAB innerhalb des aktuellen Bildes und dem vorhergesagten BAB berechnet wird, und falls dann keine Differenz zwischen diesen vorliegt ein drittes Modus-Signal erzeugt wird, das darüber informiert, daß keine Differenz zwischen diesen vorliegt und folglich die Differenz nicht kodiert wird, und falls eine Differenz zwischen diesen vorliegt, ein viertes Modus-Signal erzeugt wird, das darüber informiert, daß eine Differenz zwischen diesen vorliegt, und gleichzeitig ein vierter Fehlerdatenblock aus M×N binären Pixeln erzeugt wird, der die zu kodierende Differenz als ein kodierter vierter Fehlerdatenblock darstellt; und (g) falls der BAB innerhalb des aktuellen Bildes in einem Intra-Modus kodiert wird, falls (während) entweder das erste oder das zweite Modus-Signal in dem Schritt (c) erzeugt wurde, das in dem Schritt (c) erzeugte Modus-Signal als ein ausgewähltes Modus-Signal bereitgestellt wird, und falls der BAB innerhalb des aktuellen Bildes in dem Inter-Modus kodiert wird, falls eines der Modus-Signale unter den ersten bis vierten Modus-Signalen in den Schritten (c) und (f) erzeugt wurde, das in den Schritten (c) und (f) erzeugte Modus-Signal als ein ausgewähltes Modus-Signal bereitgestellt wird, und falls zwei Modus-Signale unter den ersten bis vierten Modus-Signalen gleichzeitig in den Schritten (c) und (f) erzeugt wurden, eines der beiden in den Schritten (c) und (f) erzeugten Modus-Signale als ein ausgewähltes Modus-Signal gemäß einer ersten vorgegebenen Auswahlregel bereitgestellt wird.

Weitere Vorteile und bevorzugte Ausführungsbeispiele der Erfindung werden nunmehr anhand der Figurenbeschreibung mit Bezug auf die beigefügte Zeichnung näher erläutert. In der Zeichnung zeigen:

Fig. 1 eine intra-kodierte Bildebene und inter kodierte Bildebenen zum Beschreiben eines herkömmlichen Modus-Kodierverfahrens beim Kodieren einer binären Form;

Fig. 2 ein aktuelles Bild mit einer Vielzahl an binären Alphablöcken zum Erläutern eines Modus-Kodierverfahrens beim Kodieren binärer Formen gemäß der vorliegenden Erfindung;

Fig. 3A bis 3I Blöcke und Blöcke bildende Liniensätze zum Beschreiben eines Sub-Abtastprozesses für das Erzeugen einer Basisschicht eines BAB, eines Rekonstruktionsprozesses für das Erzeugen eines rekonstruierten BAB, basierend auf der Basisschicht, und eines Modus-Kodierprozesses gemäß der vorliegenden Erfindung; und

Fig. 4 intra-kodierte Bilder und inter-kodierte Bilder zum Beschreiben eines Modus-Kodier verfahrens beim Kodieren einer binären Form gemäß der vorliegenden Erfindung.

Gemäß der vorliegenden Erfindung ist ein Modus-Kodierverfahren beim Kodieren einer binären Form bzw. Binärformkodieren geschaffen. In Fig. 2 ist ein aktuelles Bild 200 mit mehreren binären Alphablöcken (BAB's) 1 bis 16 darstellt, um ein Modus-Kodierverfahren beim Kodieren einer binären Form gemäß der vorliegenden Erfindung zu erläutern, wobei die gestrichelten und nicht-gestrichelten Bereiche dort ein Objekt bzw. einen Hintergrund darstellen. Kurz gesagt, wird beim Durchführen eines Modus-Kodierens beim Kodieren eines binären Formsignals, z. B. des aktuellen Bildes mit den BAB's 1 bis 16, ein Modus-Signal (oder jedes durch Kodieren der Modus-Signale erzeugte kodierte Modus-Signal) jeweils entsprechenden BAB's der BAB's 1 bis 16 zugewiesen oder bereitgestellt.

In den Fig. 3A bis 3H sind Blöcke und Blöcke bildende Liniensätze zum Beschreiben eines Sub-Abtastprozesses für das Erzeugen einer Basisschicht eines BAB und eines Rekonstruk tionsprozesses für das Erzeugen eines rekonstruierten BAB, basierend auf der Basisschicht, dargestellt, wobei die schwarzen Bereiche Objektpixel und die weißen Bereiche Hinter grundpixel darstellen. Fig. 3I zeigt einen Fehlerdatenblock 380 zum Beschreiben eines Modus-Kodierverfahrens gemäß der vor liegenden Erfindung. In Fig. 4 sind intra-kodierte Bilder und inter-kodierte Bilder zum Beschreiben eines Modus-Kodierver fahrens beim Kodieren einer binären Form gemäß der vorliegenden Erfindung beschrieben. Nachfolgend wird mit Bezug auf Fig. 2, Fig. 3A bis 3I und Fig. 4 ein Modus-Kodierverfahren beim Kodieren einer binären Form gemäß bevorzugter Ausführungs beispiele der vorliegenden Erfindung beschrieben.

Gemäß der vorliegenden Erfindung wird ein Modus-Kodierverfahren zum Kodieren eines BAB aus M×N binären Pixeln innerhalb eines aktuellen Bildes bereitgestellt, basierend auf dem aktuellen Bild und einem vorhergehenden Bild mit einer Mehrzahl an BAB's, wobei M und N jeweils positive ganze Zahlen sind, jeder binäre Pixel einen binären Wert aufweist, der entweder einen Objektpixel oder einen Hintergrundpixel darstellt. Es sei angemerkt, daß das aktuelle und das vorhergehende Bild durch eine aktuelle Videoobjektebene (VOE) bzw. eine vorhergehende VOE ersetzt werden können. Einfachheitshalber wird hier lediglich ein Modus-Kodierverfahren zum Kodieren eines BAB innerhalb eines aktuellen Bildes beschrieben.

Zuerst wird ein Sub-Abtasten auf dem BAB innerhalb des aktuellen Bildes gemäß einer vorgegebenen Sub-Abtastregel durchgeführt, um dadurch einen Abtastblock aus (M/K)×(N/K) binären Pixeln als eine Basisschicht innerhalb des aktuellen Bildes zu erzeugen, wobei M und N jeweils Vielfache von K sind, und K eine vorgegebene positive ganze Zahl ist. Im allgemeinen wird (1/K) ein Umwandlungsverhältnis genannt. Wird beispiels weise ein in Fig. 3A gezeigter BAB 300, dessen Höhe (M) und Breite (N) jeweils 16 ist, innerhalb des aktuellen Bildes mit einem Umwandlungsverhältnis von (1/2) sub-abgetastet oder abwärts-abgetastet, so wird ein in Fig. 3B gezeigter Abtastblock 310, dessen Höhe (M) und Breite (N) jeweils 8 ist, innerhalb des aktuellen Bildes erzeugt.

Danach wird ein rekonstruierter BAB aus M×N binären Pixeln innerhalb des aktuellen Bildes gemäß einer vorgegebenen Rekonstruktions- oder Aufwärts-Abtastregel erzeugt, basierend auf dem Abtastblock innerhalb des aktuellen Bildes. Beispiels weise wird ein in Fig. 3H gezeigter rekonstruierter BAB 370 aus 16×16 binären Pixeln gemäß einer vorgegebenen Rekonstruk tionsregel erzeugt, basierend auf dem Abtastblock 310 innerhalb des aktuellen Bildes.

Zahlreiche Sub-Abtastverfahren können als ein vorgegebenes Sub-Abtastverfahren angewendet werden, z. B. ein Abwärts-Ab tastverfahren, dessen Umwandlungsverhältnis gleich 1/2 ist. Für das Rekonstruktionsverfahren sind mehrere Verfahren bekannt, so auch ein Rasterdurchschuß-Verfahren ("scan interleaving method"), das ein kontext-basierendes arithmetisches Kodierverfahren anwendet (CAE-method = context based arithmetic encoding method, d. h. CAE-Verfahren). Mit Bezug auf Fig. 3A bis 3H werden nachfolgend ein Sub-Abtastverfahren und ein Rekonstruktionsverfahren gemäß einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung beschrieben. Zuerst wird ein horizontaler Sub-Abtastschritt durchgeführt. Dabei wird jede zweite horizontale Linie eines BAB innerhalb eines aktuellen Bildes, z. B. des BAB 300, abgetastet, indem entweder von einer ersten oder einer zweiten horizontalen Linie des BAB gestartet wird, um einen ersten Block aus (M/2)×N binären Pixeln zu erzeugen, wobei M und N jeweils positive ganze Zahlen sind, und die erste horizontale Linie die oberste horizontale Linie des BAB ist.

Anschließend wird ein vertikaler Sub-Abtastschritt durch geführt. Dabei wird jede zweite vertikale Linie des ersten Blocks abgetastet, indem entweder von einer ersten oder einer zweiten vertikalen Linie des ersten Blocks gestartet wird, um dadurch einen Abtastblock aus (M/2)×(N/2) binären Pixeln zu erzeugen, z. B. den in Fig. 3B gezeigten Abtastblock 310 aus 8×8 binären Pixeln als eine Basisschicht, wobei die erste vertikale Linie die am weitesten links liegende Linie des ersten Blockes ist.

Danach kann ein rekonstruierter erster Block aus (M/2)×N binären Pixeln durch sequentielles Einfügen einer Anzahl an (N/2) rekonstruierter vertikaler Linien an Positionen von nicht in dem vertikalen Sub-Abtastschritt abgetasteten vertikalen Linien unter der Bedingung erzeugt werden, daß die Anzahl an (N/2) vertikaler Linien des Abtastblockes an Positionen der in dem vertikalen Sub-Abtastschritt abgetasteten vertikalen Linien liegen, wobei die rekonstruierten vertikalen Linien gemäß einer vorgegebenen Interpolationsregel erzeugt werden, basierend auf den vertikalen Linien des Abtastblockes.

Anschließend kann ein rekonstruierter erster BAB aus M×N binären Pixeln durch sequentielles Einfügen einer Anzahl an (M/2) rekonstruierter horizontaler Linien an Positionen von in dem horizontalen Sub-Abtastschritt nicht abgetasteter horizontaler Linien unter der Bedingung erzeugt werden, daß die Anzahl an (M/2) horizontaler Linien des rekonstruierten ersten Blockes an Positionen der in dem horizontalen Sub-Abtastschritt abgetasteten horizontalen Linien liegen, wobei die rekonstruierten horizontalen Linien gemäß einer vorgegebenen Interpolationsregel erzeugt werden, basierend auf den horizontalen Linien des rekonstruierten ersten Blockes.

Mit Bezug auf Fig. 3C bis 3H sind Blöcke und Blöcke bildende Liniensätze zum Beschreiben eines Rekonstruktionsprozesses für das Erzeugen des rekonstruierten BAB 370 gemäß einer vorgegebenen Interpolationsregel dargestellt, basierend auf dem Abtastblock 310, der die Basisschicht des BAB 300 ist. Fig. 3C zeigt einen vertikalen Liniensatz 320 mit einer Anzahl an 8 vertikalen Linien des Abtastblockes 310 als eine Anzahl an 8 gradzahligen vertikalen Linien V2, V4 . . ., V16. Fig. 3D zeigt einen vertikalen Liniensatz 330 mit einer Anzahl an 8 ungradzahligen vertikalen Linien V1, V3 . . ., V15, die gemäß der vorgegebenen Interpolationsregel, basierend auf dem vertikalen Liniensatz 320, rekonstruiert wurden.

Fig. 3E zeigt einen rekonstruierten ersten Block 340 aus 8×16 binären Pixeln, der durch sequentielles Einfügen der 8 vertikalen Linien des vertikalen Liniensatzes 330 gemäß den ihnen zugeordneten Indices, wie in Fig. 3D gezeigt, an ungrad zahligen vertikalen Linienpositionen unter der Bedingung erzeugt wird, daß die 8 vertikalen Linien des vertikalen Liniensatzes 320 sequentiell gemäß der ihnen zugeordneten Indices, wie in Fig. 3C gezeigt, an gradzahligen vertikalen Linienpositionen angeordnet werden.

Fig. 3F zeigt einen horizontalen Liniensatz 350 mit 8 horizontalen Linien des rekonstruierten ersten Blockes 340 als 8 gradzahlige horizontale Linien H2, H4 . . ., H16. Fig. 3G stellt einen horizontalen Liniensatz 360 mit 8 ungradzahligen horizontalen Linien H1, H3 . . ., H15 dar, der gemäß der vorgegebenen Interpolationsregel rekonstruiert wird, basierend auf dem horizontalen Liniensatz 350.

Fig. 3H zeigt den rekonstruierten BAB 370 aus 16×16 binären Pixeln, der durch sequentielles Einfügen der 8 horizontalen Linien des horizontalen Liniensatzes 360 gemäß der ihnen zugeordneten Indices, wie in Fig. 3G gezeigt, an ungrad zahligen horizontalen Linienpositionen unter der Bedingung erzeugt wird, daß die 8 horizontalen Linien des horizontalen Liniensatzes 350 sequentiell gemäß der ihnen zugeordneten Indices, wie in Fig. 3F gezeigt, an gradzahligen horizontalen Linienpositionen angeordnet werden.

Anschließend wird die Differenz zwischen dem rekonstruierten BAB und dem BAB innerhalb des aktuellen Bildes berechnet. Falls dann keine Differenz zwischen diesen vorliegt, wird ein erstes Modus-Signal erzeugt, wobei das erste Modus-Signal darüber informiert, daß keine Differenz zwischen diesen vorliegt und folglich die Differenz nicht kodiert wird. Falls eine Differenz zwischen diesen vorliegt, wird ein zweites Modus-Signal erzeugt, wobei das zweite Modus-Signal darüber informiert, daß eine Differenz zwischen diesen vorliegt. Gleichzeitig wird ein die Differenz darstellender zweiter Fehlerdatenblock aus M×N binären Pixeln erzeugt und der zweite Fehlerdatenblock als ein kodierter zweiter Fehlerdatenblock kodiert.

Im Detail ist mit Bezug auf Fig. 3I ein zweiter Fehler datenblock 380 gezeigt, der die Differenz zwischen dem BAB 300 innerhalb des aktuellen Bildes und dem rekonstruierten BAB 370 angibt. In Fig. 3I stellen schwarze Bereiche binäre Pixelwerte dar, z. B. 1, die darüber informieren, daß Differenzen zwischen Pixeln in dem BAB 300 und jeweils an denselben Positionen in dem rekonstruierten BAB 370 angeordneten entsprechenden Pixeln vorliegen, und die weißen Bereiche stellen binäre Pixelwerte dar, z. B. 0, die darüber informieren, daß keine Differenzen zwischen Pixeln in dem BAB 300 und jeweils bei denselben Positionen in dem rekonstruierten BAB 370 angeordneten entsprechenden Pixeln vorliegen.

Zwischenzeitlich wird in einem Inter-Modus der unten beschriebene Prozeß weiterverfolgt, um das Modus-Kodieren beim Kodieren der binären Form gemäß den bevorzugten Ausführungs beispielen der vorliegenden Erfindung durchzuführen. Zuerst wird ein sub-Abtasten auf den BAB's innerhalb des vorhergehenden Bildes gemäß der vorgegebenen Sub-Abtastregel durchgeführt, um dadurch eine Mehrzahl entsprechender Abtastblöcke aus (M/K)×(N/K) binären Pixeln innerhalb des vorhergehenden Bildes zu erzeugen.

Danach wird der Abtastblock innerhalb des aktuellen Bildes mit den entsprechenden Abtastblöcken innerhalb des vorhergehenden Bildes verglichen und anschließend unter den entsprechenden Abtastblöcken ein dem Abtastblock innerhalb des aktuellen Bildes ähnlichster entsprechender Abtastblock als ein vorhergesagter Abtastblock erfaßt, um dadurch einen Bewegungsvektor mit einer vertikalen und einer horizontalen Komponente zu erzeugen, der die Verschiebung zwischen dem Abtastblock innerhalb des aktuellen Bildes und dem vorhergesagten Abtastblock darstellt.

In dem Inter-Modus wird unter den BAB's innerhalb des vorhergehenden Bildes, basierend auf dem Bewegungsvektor, ein dem BAB innerhalb des aktuellen Bildes ähnlichster BAB als ein vorhergesagter BAB erfaßt und anschließend die Differenz zwischen dem BAB innerhalb des aktuellen Bildes und dem vorher gesagten BAB berechnet. Gemäß den bevorzugten Ausführungs beispielen der vorliegenden Erfindung sind die erzeugten horizontalen und vertikalen Distanzen zwischen dem BAB innerhalb des aktuellen Bildes und dem vorhergesagten BAB das Zweifache der horizontalen bzw. der vertikalen Komponente des Bewegungsvektors.

Danach wird das dritte Modus-Signal erzeugt, falls keine Differenz zwischen diesen vorliegt, wobei das dritte Modus signal darüber informiert, daß keine Differenz zwischen diesen vorliegt und folglich die Differenz nicht kodiert wird. Falls eine Differenz zwischen diesen vorliegt, wird ein viertes Modus-Signal erzeugt, wobei das vierte Modus-Signal darüber informiert, daß eine Differenz zwischen diesen vorliegt. Gleichzeitig wird ein die Differenz darstellender vierter Fehlerdatenblock aus M×N binären Pixeln erzeugt und der vierte Fehlerdatenblock als ein kodierter vierter Fehlerdatenblock kodiert.

Beim Modus-Kodieren wird das erzeugte Modus-Signal als ein ausgewähltes Modus-Signal bereitgestellt, falls der BAB innerhalb des aktuellen Bildes in einem Intra-Modus kodiert wird, da entweder das erste oder das zweite Modus-Signal erzeugt wird. Falls der BAB innerhalb des aktuellen Bildes in dem Inter-Modus kodiert wird, wird das erzeugte Modus-Signal als ein ausgewähltes Modus-Signal bereitgestellt, sofern ein Modus-Signal unter den ersten bis vierten Modus-Signalen erzeugt wird; und falls zwei Modus-Signale unter den ersten bis vierten Modus-Signalen gleichzeitig erzeugt werden, wird eines der zwei erzeugten Modus-Signale als ein ausgewähltes Modus-Signal gemäß einer ersten vorgegebenen Auswahlregel ausgewählt und bereitgestellt.

Die erste vorgegebene Auswahlregel gemäß einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung wird nachfolgend beschrieben. Falls das erste und das dritte Modus-Signal gleichzeitig erzeugt werden, wird entweder das erste oder das dritte Modus-Signal als ein ausgewähltes Modus-Signal gemäß einer zweiten vorgegebenen Auswahlregel, z. B. einer das dritte Modus-Signal auswählenden Regel, ausgewählt. Falls das erste Modus-Signal erzeugt wird und das dritte Modus-Signal nicht erzeugt wird, wird das erste Modus-Signal als ein ausgewähltes Modus-Signal ausgewählt, selbst wenn das vierte Modus-Signal gleichzeitig erzeugt wird.

Falls das dritte Modus-Signal erzeugt wird und das erste Modus-Signal nicht erzeugt wird, wird das dritte Modus-Signal als ein ausgewähltes Modus-Signal ausgewählt, selbst wenn das zweite Modus-Signal gleichzeitig erzeugt wird. Falls das zweite und das vierte Modus-Signal gleichzeitig erzeugt werden, wird entweder das zweite oder das vierte Modus-Signal als ein ausgewähltes Modus-Signal gemäß einer dritten vorgegebenen Auswahlregel ausgewählt.

Die dritte vorgegebene Auswahlregel ist wie folgt. Zuerst werden das zweite und das vierte Modus-Signal kodiert, um dadurch ein kodiertes zweites bzw. ein kodiertes viertes Modus-Signal zu erzeugen, und der zweite und der vierte Fehlerdaten block werden kodiert, um dadurch einen kodierten zweiten bzw. einen kodierten vierten Fehlerdatenblock zu erzeugen. Das kodierte zweite und das kodierte vierte Modus-Signal und der kodierte zweite und der kodierte vierte Fehlerdatenblock werden kombiniert, um dadurch kodierte zweite bzw. kodierte vierte Anreicherungsschichtdaten zu erzeugen.

Anschließend wird eine zweite und eine vierte Anzahl an Datenbits für die kodierten zweiten bzw. die kodierten vierten Anreicherungsschichtdaten berechnet; danach wird die zweite Anzahl an Datenbits mit der vierten Anzahl an Datenbits verglichen, um dadurch das zweite Modus-Signal als ein ausgewähltes Modus-Signal auszuwählen, falls die zweite Anzahl an Datenbits gleich oder kleiner der vierten Anzahl an Datenbits ist, und das vierte Modus-Signal als ein ausgewähltes Modus-Signal auszuwählen, falls die zweite Anzahl an Datenbits größer als die vierte Anzahl an Datenbits ist.

Gemäß dem Modus-Kodierverfahren des bevorzugten Aus führungsbeispiels der vorliegenden Erfindung wird beispiels weise jedes ausgewählte Modus-Signal (oder jedes kodierte ausgewählte Modus-Signal, das durch Kodieren des entsprechenden ausgewählten Modus-Signals erhalten wird) jeweils einem ent sprechenden BAB der BAB's 1 bis 16 innerhalb des aktuellen Bildes, wie in Fig. 2 gezeigt, bereitgestellt oder zugewiesen.

Danach werden das erste und das dritte Modus-Signal jeweils als ausgewählte Modus-Signale ausgewählt, das erste und das dritte Modus-Signal als ein kodiertes erstes bzw. ein kodiertes drittes Modus-Signal kodiert und anschließend das kodierte erste und das kodierte dritte Modus-Signal als eine kodierte erste bzw. eine kodierte dritte Anreicherungsschicht bereitgestellt. Falls das zweite und das vierte Modus-Signal jeweils als ausgewählte Modus-Signale ausgewählt werden, werden die kodierten zweiten und die kodierten vierten Anreicherungs schichtdaten jeweils als kodierte Anreicherungsschichtdaten bereitgestellt.

Oben wurde das Modus-Kodierverfahren gemäß dem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung beschrieben. Es sei bemerkt, daß das Modus-Kodierverfahren für ein Kodieren binärer Formen, d. h., für ein Kodieren einer Anreicherungsschicht ohne Berücksichtigung der Verfahrensart, z. B. einem Sub-Abtastverfahren und einem Rekonstruktionsver fahren beim Kodieren der binären Form, angewendet werden kann.

Fig. 4 zeigt intra-kodierte Bilder und inter-kodierte Bilder zum Beschreiben des Modus-Kodierverfahrens gemäß dem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung. Mit Bezug auf Fig. 4 wird das dort angewandte Modus-Kodier verfahren nachfolgend beschrieben. In Fig. 4 stellen I ein intra-kodiertes Bild als eine Basisschicht dar; P1 ein intra kodiertes Bild als eine Anreicherungsschicht; P2 und P3 intra kodierte Bilder jeweils als Basisschichten; und B1 und B2 inter-kodierte Bilder jeweils als Anreicherungsschichten. In Fig. 4 ist das Bild I die Basisschicht des Bildes P1; die Bilder P2 und P3 sind Basisschichten der Bilder B1 bzw. B2.

Das Modus-Kodierverfahren gemäß dem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung bezieht sich auf das Kodieren des BAB innerhalb der Bilder P1, B1 und B2. Daher wird nachfolgend beschrieben, welches Modus-Signal jeweils den BAB's innerhalb der Bilder P1, B1 und B2 zugewiesen wird. Es sei bemerkt, daß anstelle des Modus-Signals die kodierten Modus-Signale den BAB's innerhalb der Bilder P1, B1 und B2 zugewiesen werden können. Einfachheitshalber wird nachfolgend lediglich der Fall beschrieben, daß ihnen die Modus-Signale zugewiesen werden.

In einem Intra-Modus wird entweder das erste Modus-Signal oder das dritte Modus-Signal erzeugt, da das Bild P1 basierend auf dem Bild I (bezieht sich auf den in Fig. 4 gezeigten Weg 1) rekonstruiert wird. Folglich wird entweder das erste Modus signal oder das dritte Modus-Signal jedem BAB innerhalb des Bildes P1 bei deren Modus-Kodieren zugewiesen. Ein jeweils den BAB's innerhalb des Bildes B1 zugewiesenes Modus-Signal wird als deren ausgewähltes Modus-Signal aus den ersten bis vierten Modus-Signalen ausgewählt, da das Bild B1 entweder basierend auf dem Bild P2 (bezieht sich auf den in Fig. 4 gezeigten Weg 3) oder dem Bild P1, das ein vorhergehendes Bild des Bildes B1 ist (bezieht sich auf den in Fig. 4 gezeigten Weg 2), rekonstruiert werden kann.

Eines der ersten bis vierten Modus-Signale wird jedem BAB innerhalb des Bildes B2 bei deren Modus-Kodieren zugewiesen, da das Bild B2, basierend auf entweder dem Bild P3 (bezieht sich auf den in Fig. 4 gezeigten Weg 5) oder dem Bild B1, das ein vorhergehendes Bild des Bildes B2 ist (bezieht sich auf den in Fig. 4 gezeigten Weg 4), rekonstruiert werden kann.

Wie oben beschrieben, kann beim Kodieren eines binären Formsignals, z. B. eines BAB innerhalb eines Bildes (oder einer VOE), insbesondere beim Kodieren der Anreicherungsschicht des binären Formsignals, das Modus-Kodierverfahren gemäß der vorliegenden Erfindung die Kodiereffizienz signifikant verbessern.

Während die vorliegende Erfindung lediglich anhand bevorzugter Ausführungsbeispiele beschrieben wurde, können weitere Modifikationen und Änderungen vorgenommen werden, wie sie in den Ansprüchen beschrieben sind, ohne die Erfindungsidee zu verlassen.

Claims

1. Modus-Kodierverfahren zum Kodieren eines binären Alpha-Blocks (BAB) aus M×N binären Pixeln innerhalb eines aktuellen Bildes, basierend auf dem aktuellen Bild und einem vorhergehenden Bild, die eine Mehrzahl an BAB's enthalten, wobei M und N jeweils positive ganze Zahlen sind, jeder binäre Pixel einen binären Wert aufweist, der entweder einen Objektpixel oder einen Hintergrundpixel darstellt, bei welchem:

(a) ein Sub-Abtasten auf dem BAB innerhalb des aktuellen Bildes gemäß einer vorgegebenen Sub-Abtastregel durchgeführt wird, um dadurch einen Abtastblock aus (M/K)×(N/K) binären Pixeln innerhalb des aktuellen Bildes zu erzeugen, wobei M und N jeweils Vielfache von K sind, und K eine vorgegebene positive ganze Zahl ist;
(b) ein rekonstruierter BAB aus M×N binären Pixeln gemäß einer vorgegebenen Rekonstruktionsregel erzeugt wird, basierend auf dem Abtastblock innerhalb des aktuellen Bildes;
(c) die Differenz zwischen dem rekonstruierten BAB und dem BAB innerhalb des aktuellen Bildes berechnet wird, und falls keine Differenz zwischen diesen vorliegt, ein erstes Modus-Signal erzeugt wird, das darüber informiert, daß es keine Differenz zwischen diesen gibt und folglich die Differenz nicht kodiert wird, und falls eine Differenz zwischen diesen vorliegt, ein zweites Modus-Signal erzeugt wird, das darüber informiert, daß eine Differenz zwischen diesen vorliegt, und gleichzeitig ein zweiter Fehlerdatenblock aus M×N binären Pixeln erzeugt wird, der die zu kodierende Differenz als ein kodierter zweiter Fehlerdatenblock darstellt;
(d) in einem Inter-Modus ein Sub-Abtasten auf den BAB's innerhalb des vorhergehenden Bildes gemäß der vorgegebenen Sub-Abtastregel durchgeführt wird, um dadurch eine Mehrzahl entsprechender Abtastblöcke aus (M/K)×(N/K) binären Pixeln innerhalb des vorhergehenden Bildes zu erzeugen;
(e) in dem Inter-Modus der Abtast-Block innerhalb des aktuellen Bildes mit den entsprechenden Abtastblöcken innerhalb des vorhergehenden Bildes verglichen wird und anschließend unter den entsprechenden Abtastblöcken innerhalb des vorhergehenden Bildes ein dem Abtastblock innerhalb des aktuellen Bildes ähnlichster entsprechender zweiter Abtastblock als ein vorhergesagter Abtastblock erfaßt wird, um dadurch einen Bewegungsvektor mit vertikaler und horizontaler Komponente zu erzeugen, der die Verschiebung zwischen dem Abtastblock innerhalb des aktuellen Bildes und dem vorhergesagten Abastblock darstellt;
(f) in dem Inter-Modus, basierend auf dem Bewegungsvektor, unter den BAB'S innerhalb des vorhergehenden Bildes ein dem BAB innerhalb des aktuellen Bildes ähnlichster BAB als ein vorhergesagter BAB erfaßt wird, die Differenz zwischen dem BAB innerhalb des aktuellen Bildes und dem vorhergesagten BAB berechnet wird, und falls dann keine Differenz zwischen diesen vorliegt, ein drittes Modus-Signal erzeugt wird, das darüber informiert, daß keine Differenz zwischen diesen vorliegt und folglich die Differenz nicht kodiert wird, und falls eine Differenz zwischen diesen vorliegt, ein viertes Modus-Signal erzeugt wird, das darüber informiert, daß eine Differenz zwischen diesen vorliegt, und gleichzeitig ein vierter Fehlerdatenblock aus M×N binären Pixeln erzeugt wird, der die zu kodierende Differenz als ein kodierter vierter Fehlerdatenblock darstellt; und
(g) falls der BAB innerhalb des aktuellen Bildes in einem Intra-Modus kodiert wird, falls entweder das erste oder das zweite Modus-Signal in dem Schritt (c) erzeugt wurde, das in dem Schritt (c) erzeugte Modus-Signal als ein ausgewähltes Modus-Signal bereitgestellt wird, und falls der BAB innerhalb des aktuellen Bildes in dem Inter-Modus kodiert wird, falls eines der Modus-Signale unter den ersten bis vierten Modus-Signalen in den Schritten (c) und (f) erzeugt wurde, das in den Schritten (c) und (f) erzeugte Modus-Signal als ein ausgewähltes Modus-Signal bereitgestellt wird, und falls zwei Modus-Signale unter den ersten bis vierten Modus-Signalen gleichzeitig in den Schritten (c) und (f) erzeugt wurden, eines der beiden in den Schritten (c) und (f) erzeugten Modus-Signale als ein ausgewähltes Modus-Signal gemäß einer ersten vorgegebenen Auswahlregel bereitgestellt wird.

2. Verfahren nach Anspruch 1, bei welchem das aktuelle und das vorhergehende Bild durch eine aktuelle Videoobjekt ebene (VOE) bzw. eine vorhergehende VOE ersetzt werden.

3. Verfahren nach Anspruch 1 oder 2, bei welchem die erste Auswahlregel wie folgt ist: falls das erste und das dritte Modus-Signal gleichzeitig erzeugt werden, wird entweder das erste oder das dritte Modus-Signal als das ausgewählte Modus-Signal gemäß einer zweiten vorgegebenen Auswahlregel ausgewählt; falls das erste Modus-Signal erzeugt wird und das dritte Modus-Signal nicht erzeugt wird, wird das erste Modus-Signal als das ausgewählte Modus-Signal ausgewählt, selbst wenn das vierte Modus-Signal gleichzeitig erzeugt wird; und falls das dritte Modus-Signal erzeugt wird und das erste Modus-Signal nicht erzeugt wird, wird das dritte Modus-Signal als das ausgewählte Modus-Signal ausgewählt, selbst wenn das zweite Modus-Signal gleichzeitig erzeugt wird; falls das zweite und das vierte Modus-Signal gleichzeitig erzeugt werden, wird entweder das zweite oder das vierte Modus-Signal als das ausgewählte Modus-Signal gemäß einer dritten vorgegebenen Auswahlregel ausgewählt.

4. Verfahren nach Anspruch 3, bei welchem die dritte vorgegebene Auswahlregel wie folgt ist: das zweite und das vierte Modus-Signal werden kodiert, um dadurch ein kodiertes zweites bzw. ein kodiertes viertes Modus-Signal zu erzeugen und der zweite und der vierte Fehlerdaten block werden kodiert, um dadurch einen kodierten zweiten bzw. einen kodierten vierten Fehlerdatenblock zu erzeugen; und das kodierte zweite und das kodierte vierte Modus-Signal und der kodierte zweite und der kodierte vierte Fehlerdatenblock werden kombiniert, um dadurch eine kodierte zweite bzw. eine kodierte vierte Anreicherungsschicht zu erzeugen; und anschließend wird eine zweite und eine vierte Anzahl an Datenbits für die kodierten zweiten bzw. die kodierten vierten Anreicherungsschichtdaten berechnet; danach wird die zweite Anzahl an Datenbits mit der vierten Anzahl an Datenbits verglichen, um dadurch das zweite Modus-Signal als das ausgewählte Modus-Signal auszuwählen, falls die zweite Anzahl an Datenbits gleich oder kleiner der vierten Anzahl an Datenbits ist, und das vierte Modus-Signal als das ausgewählte Modus-Signal auszuwählen, falls die zweite Anzahl an Datenbits größer als die vierte Anzahl an Datenbits ist.

5. Verfahren nach Anspruch 3 oder 4, bei welchem die zweite vorgegebene Auswahlregel derart ist, daß das dritte Modus-Signal als das ausgewählte Modus-Signal ausgewählt wird, falls das erste und das dritte Modus-Signal gleichzeitig erzeugt werden.

6. Verfahren nach einem der vorhergehenden Ansprüche, bei welchem, falls das erste und das dritte Modus-Signal jeweils als die ausgewählten Modus-Signale ausgewählt werden, das erste und das dritte Modus-Signal als das kodierte erste bzw. das kodierte dritte Modus-Signal kodiert werden, und anschließend das kodierte erste und das kodierte dritte Modus-Signal jeweils als kodierte Anreicherungsschichten bereitgestellt werden; und falls das zweite und das vierte Modus-Signal jeweils als die ausgewählten Modus-Signale ausgewählt werden, die kodierten zweiten und die kodierten vierten Anreicherungsschichtdaten jeweils als kodierte Anreicherungsschicht bereitgestellt werden.

7. Verfahren nach einem der vorhergehenden Ansprüche, bei welchem im Verfahrensschritt (a):
(a1) jede zweite horizontale Linie des BAB abgetastet wird, um einen ersten Block aus (M/2)×N binären Pixeln zu erzeugen, der entweder von einer ersten oder einer zweiten horizontalen Linie des BAB startet, wobei die erste horizontale Linie die oberste horizontale Linie des BAB ist; und
(a2) jede zweite vertikale Linie des ersten Blocks abgetastet wird, um den Abtastblock aus (M/2)×(N/2) binären Pixeln als eine Basisschicht zu erzeugen, die entweder von einer ersten oder einer zweiten vertikalen Linie des ersten Blockes startet, wobei die erste vertikale Linie die am weitesten links liegende Linie des ersten Blockes ist.

8. Verfahren nach einem der vorhergehenden Ansprüche, bei welchem im Schritt (b):
(b1) ein rekonstruierter erster Block aus (M/2)×N binären Pixeln durch sequentielles Einfügen einer Anzahl an (N/2) rekonstruierter vertikaler Linien bei Positionen von nicht in dem Schritt (a2) abgetasteter vertikaler Linien unter der Bedingung erzeugt wird, daß die Anzahl an (N/2) vertikaler Linien des Abtastblockes an Positionen der in dem Schritt (a2) abgetasteter vertikaler Linien angeordnet werden, wobei die rekonstruierten vertikalen Linien gemäß einer vorgegebenen Interpolationsregel erzeugt werden, basierend auf den vertikalen Linien des Abtastblockes; und
(b2) der rekonstruierte BAB aus M×N binären Pixeln durch sequentielles Einfügen einer Anzahl an (M/2) rekonstruierter horizontaler Linien an Positionen von nicht in dem Schritt (a1) abgetasteter horizontaler Linien unter der Bedingung erzeugt wird, daß die Anzahl an (M/2) horizontaler Linien des rekonstruierten ersten Blockes an Positionen von in dem Schritt (a1) abgetasteter horizontaler Linien angeordnet werden, wobei die rekonstruierten horizontalen Linien gemäß einer vorgegebenen Interpolationsregel erzeugt werden, basierend auf den horizontalen Linien des rekonstruierten ersten Blockes.

9. Verfahren nach einem der vorhergehenden Ansprüche, bei welchem horizontale und vertikale Distanzen zwischen dem BAB innerhalb des aktuellen Bildes und dem in Schritt (f) erzeugten vorhergesagten BAB das zweifache der horizontalen bzw. der vertikalen Komponente des Bewegungsvektors sind.

10. Verfahren nach einem der Ansprüche 7 bis 9, bei welchem der Verfahrensschritt (a1) der Schritt zum Abtasten gradzahliger horizontaler Linien des BAB für das Erzeugen des ersten Blockes ist, und der Schritt (a2) der Schritt zum Abtasten gradzahliger vertikaler Linien des ersten Blockes für das Erzeugen des Abtastblockes ist.

11. Verfahren nach einem der vorhergehenden Ansprüche, bei welchem M gleich N ist.

12. Verfahren nach einem der vorhergehenden Ansprüche, bei welchem sowohl M als auch N gleich 16 sind.