DE19749604A1 - Verfahren zum Kodieren eines Modus beim Kodieren binärer Formen - Google Patents
Verfahren zum Kodieren eines Modus beim Kodieren binärer FormenInfo
- Publication number
- DE19749604A1 DE19749604A1 DE1997149604 DE19749604A DE19749604A1 DE 19749604 A1 DE19749604 A1 DE 19749604A1 DE 1997149604 DE1997149604 DE 1997149604 DE 19749604 A DE19749604 A DE 19749604A DE 19749604 A1 DE19749604 A1 DE 19749604A1
- Authority
- DE
- Germany
- Prior art keywords
- bab
- mode signal
- mode
- block
- generated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/20—Contour coding, e.g. using detection of edges
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/20—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
Description
Die vorliegende Erfindung betrifft ein Verfahren zum Kodieren
eines Modus bzw. ein Moduskodierverfahren, insbesondere ein
Verfahren zum Kodieren eines Modus beim Kodieren binärer Formen
(sog. Binärformkodieren oder "Binary shape encoding").
In digitalen Videosystemen, wie Video-Telefon- und
Telekonferenz-Systemen ist eine große Anzahl digitaler Daten
erforderlich, jedes Videobildsignal bzw. Videohalbbildsignal
bzw. Videoteilbildsignal zu definieren, da das Videobildsignal
eine Folge digitaler Daten umfaßt, die als Pixelwerte
bezeichnet werden.
Unter dem Begriff "Bild" soll in den gesamten Unterlagen
entweder ein Voll-, ein Halb- oder ein Teilbild verstanden
werden.
Da jedoch die verfügbare Frequenzbandbreite eines herkömmlichen
Übertragungskanals begrenzt ist, um die erhebliche Anzahl
digitaler Daten darüber zu übertragen, ist es erforderlich, das
Datenvolumen unter Verwendung zahlreicher Datenkomprimierungs
techniken zu komprimieren oder zu reduzieren, insbesondere in
dem Fall solcher Videosignalkodierer niedriger Bitrate, wie
Video-Telefon- und Telekonferenz-Systemen.
Eine von diesen Techniken zum Kodieren von Videosignalen für
ein Kodiersystem niedriger Bitrate ist eine objekt-orientierte
Analyse-Synthese-Kodiertechnik, bei welcher ein
Eingangsvideobild in Objekte aufgeteilt wird, und drei Sätze an
Parametern zum Definieren der Bewegungs-, der Kontur- und der
Pixeldaten jedes Objektes über verschiedene Kodierkanäle
verarbeitet werden.
Ein Beispiel eines solchen objekt-orientierten Kodierschemas
ist das sogenannte MPEG (Moving Picture Experts Group) Phase
bzw. Standard 4 (MPEG-4), das entworfen wurde, um einen audio
visuellen Kodierstandard zur Verfügung zu stellen, der inhalts
basierende Interaktivität, verbesserte Kodiereffizienz und/oder
universelle Zugriffsmöglichkeit in solchen Anwendungen wie
einer Kommunikation bei niedriger Bitrate, interaktives Multi
media (z. B. Spiele, interaktives TV, etc.) und Gebietsüber
wachung ermöglicht.
Gemäß dem MPEG-4 wird ein Eingangsvideobild in eine Vielzahl an
Videoobjektebenen (VOE's) aufgeteilt, die Dingen bzw.
Gesamtheiten in einem Bitstrom entsprechen, auf die ein
Teilnehmer Zugriff haben und sie manipulieren kann. Eine VOE
kann als ein Objekt bezeichnet werden und durch ein Umfangs
rechteck dargestellt werden, dessen Breite und Höhe das
kleinste Vielfache von 16 Pixeln (eine Makroblockgröße) sein
kann, das jedes Objekt derart umrandet, daß der Kodierer das
Eingangsvideobild auf einer VOE-zu-VOE-Basis, d. h., einer
Objekt-zu-Objekt-Basis, verarbeiten kann.
Eine in dem MPEG-4 beschriebene VOE enthält Forminformation und
Farbinformation, bestehend aus Luminanz- und Chrominanzdaten,
wobei die Forminformation beispielsweise durch eine binäre
Maske dargestellt ist und sich auf die Luminanzdaten bezieht.
In der binären Maske wird ein binärer Wert, z.B 0, verwendet,
um einen Pixel zu bezeichnen, d. h., einen außerhalb des
Objektes in der VOE angeordneten Hintergrundpixel, und der
andere binäre Wert, z. B. 1, wird verwendet, um einen Pixel zu
bezeichnen, d. h., einen Objektpixel innerhalb des Objektes.
Ein binäres Formsignal, das den Ort und die Form der Objekte
darstellt, kann als ein binärer Alphablock (BAB) innerhalb
eines Bildes oder einer VOE, z. B. ein Block aus 16×16 binären
Pixeln, ausgedrückt werden, wobei jeder binäre Pixel einen
binären Wert aufweist, z. B. 0 oder 1, der entweder einen
Objektpixel oder einen Hintergrundpixel darstellt.
Ein BAB kann unter Anwendung eines herkömmlichen bit-map
basierenden Formkodierverfahrens, wie einem kontext-basierenden
arithmetischen Kodierverfahren (CAE-Verfahren = "context-based
arithmetic encoding"-Verfahren) (siehe MPEG-4 Video
Verification Model Version 7.0, International Organization for
Standardization, Coding of Moving And Associated Audio
Information, ISO/IEC JTC1/5C29/WG11 MPEG97/N1642, Bristol,
April 1997) kodiert werden.
Beispielsweise wird in einem Intra-Modus ein BAB unter
Anwendung eines herkömmlichen CAE-Verfahrens kodiert, um
dadurch einen kodierten BAB zu erzeugen. In einem Inter-Modus
wird ein Bewegungsvektor, der die Verschiebung zwischen einem
BAB innerhalb eines aktuellen Bildes (oder VOE) und seinem
ähnlichsten BAB innerhalb eines vorhergehenden Bildes (oder
VOE) darstellt, zusammen mit Fehlerdaten, welche die Differenz
zwischen diesen darstellen, über eine Bewegungsabschätzung und
-kompensation ermittelt. Die Fehlerdaten werden unter Anwendung
eines herkömmlichen CAE-Verfahrens kodiert, um dadurch kodierte
Fehlerdaten zu erzeugen. Dann werden die kodierten Fehlerdaten
und der Bewegungsvektor kombiniert, um dadurch einen kodierten
BAB zu erzeugen.
Jedoch wird der wie oben erhaltene kodierte BAB bei einem
Dekodierer in ein rekonstruiertes Bild dekodiert, das lediglich
eine vorgegebene Auflösung hat. Daher wird der BAB herkömm
licherweise mit einer darin implementierten Skalierbarkeit
kodiert, welche die Auflösung des dekodierten Bildes für den
BAB graduell ansteigen läßt, falls ein Bild für einen BAB mit
einer höheren Auflösung gewünscht wird. Das heißt, daß eine
Basisschicht, die ein Bild für einen BAB mit einer niedrigeren
Auflösung darstellt, kodiert wird; und basierend auf der Basis
schicht zusätzliche Information hinzugefügt wird, um eine
Anreicherungsschicht für den BAB zu erzeugen, die anschließend
kodiert wird.
Es werden bereits gemäß einem herkömmlichen Kodierverfahren für
binäre Formen, z. B. einem CAE-Verfahren zum Verbessern ihrer
Kodiereffizienz, zahlreiche Modus-Signale für entsprechende
BAB's kodiert, um dadurch jeweils entsprechende kodierte
Modus-Signale bereitzustellen, die an einen Dekodierer über einen
Transmitter auf einer BAB-zu-BAB-Basis übertragen werden
sollen, anstatt all die binären Pixelwerte innerhalb des BAB's
zu kodieren und die entsprechenden kodierten binären Pixelwerte
zu übertragen.
Genauer gesagt, gibt es beispielsweise einhundert BAB's aus
16×16 binären Pixeln, und jeder BAB enthält eine Anzahl an 256
binären Pixeln, falls eine Bildebene aus 160×160 binären Pixeln
innerhalb eines Bildes (oder einer VOE) vorliegt. Daher ist
eine Anzahl an 256 Datenbits pro BAB erforderlich, um eine
binäre Forminformation zu übertragen, die angibt, ob jeder
binäre Pixel innerhalb eines BAB ein Objektpixel oder ein
Hintergrundpixel ist, ohne daß dort ein Datenverlust vorliegt.
Dies ist hinsichtlich der Kodiereffizienz sehr ineffektiv.
Daher ist es erforderlich, die Kodiereffizienz für einen BAB
unter Verwendung zeitlicher und/oder räumlicher Korrelationen
zwischen binären Pixeln innerhalb des BAB zu verbessern.
Jedoch ist es wünschenswert, da es beim Verbessern oder Erhöhen
der Kodiereffizienz beim Kodieren binärer Pixel innerhalb eines
BAB unter Verwendung zeitlicher und/oder räumlicher
Korrelationen zwischen den binären Pixeln innerhalb des BAB
Einschränkungen gibt, die Kodiereffizienz durch Kodieren eines
Modus-Signals zu verbessern, das eine entsprechende
Kodierbedingung für den BAB darstellt oder charakterisiert, um
dadurch ein entsprechendes kodiertes Modus-Signal zu erzeugen
und anschließend zu übertragen.
Falls beispielsweise alle binären Pixel innerhalb eines BAB
Objektpixel sind, wird, anstatt alle binären Pixelwerte zum
Erzeugen von zu übertragenden kodierten binären Pixelwerten zu
kodieren, ein Modus-Signal kodiert, das darüber informiert oder
anzeigt, daß all die binären Pixel innerhalb des BAB
Objektpixel sind, und dadurch ein entsprechendes zu
übertragendes kodiertes Modus-Signal erzeugt wird. Unter
Anwendung des oben beschriebenen Verfahrens ist es möglich, die
Kodiereffizienz durch Übertragen des entsprechenden kodierten
Modus-Signals als binäre Forminformation für den BAB zu
erhöhen, das eine Anzahl an 256 binären Pixeln innerhalb des
BAB repräsentiert. Hierfür wird ein herkömmliches
Modus-Kodierverfahren nachfolgend beschrieben.
Gemäß einem herkömmlichen Modus-Kodierverfahren wird beim
Kodieren eines BAB ein Modus-Signal unter einer Anzahl an
sieben nachfolgend beschriebenen Modus-Signalen in ein ent
sprechendes zu übertragendes kodiertes Modus-Signal kodiert.
Die sieben Modus-Signale werden nachfolgend beschrieben.
Ein erstes Modus-Signal zeigt an, daß in einem Inter-Modus ein
Bewegungsvektor gleich Null ist und ein Kodieren durchgeführt
wurde; ein zweites Modus-Signal zeigt an, daß in dem
Inter-Modus der Bewegungsvektor nicht gleich Null ist und das
Kodieren durchgeführt wurde; ein drittes Modus-Signal zeigt an,
daß in dem Inter-Modus der Bewegungsvektor gleich Null ist und
das Kodieren nicht durchgeführt wurde; ein viertes Modus-Signal
zeigt an, daß in dem Inter-Modus der Bewegungsvektor nicht
gleich Null ist und das Kodieren nicht durchgeführt wurde; ein
fünftes Modus-Signal zeigt an, daß in einem Intra-Modus das
Kodieren durchgeführt wurde; ein sechstes Modus-Signal zeigt
an, daß alle binären Pixel innerhalb des BAB jeweils
Objektpixel sind; und ein siebtes Modus-Signal zeigt an, daß
all die binären Pixel innerhalb des BAB jeweils
Hintergrundpixel sind (siehe MPEG-4 Video Verification Model
Version 7.0, International Organization for Standardization,
Coding of Moving And Associated Audio Information, ISO/IEC,
JTCI/SC29/WG11 MPEG97/N1642, Bristol, April 1997, S. 20-21).
In Fig. 1 ist eine intra-kodierte VOE und eine inter-kodierte
VOE zum Beschreiben eines herkömmlichen Modus-Kodierverfahrens
beim Kodieren einer binären Form gezeigt. In Fig. 1 sind eine
intra-kodierte VOE 100 und nach Vorhersagen kodierte VOE's 110
und 120 gezeigt. Die VOE 110 enthält BAB's 111, 112 und 113;
und die VOE 120 enthält BAB's 121, 122 und 123, wobei ein
gestrichelter Bereich und ein ungestrichelter Bereich innerhalb
jeder VOE ein Objekt bzw. einen Hintergrund darstellt.
Das fünfte Modus-Signal wird jedem BAB innerhalb der VOE 100
zugewiesen oder bereitgestellt, da die VOE 100 eine intra
kodierte VOE ist. Das siebte und das sechste Modus-Signal
werden dem BAB 111 bzw. dem BAB 113 innerhalb der VOE 110
zugewiesen, da der BAB 111 und der BAB 113 lediglich Objekt
pixel bzw. lediglich Hintergrundpixel enthalten.
Falls ein entsprechender Bewegungsvektor, der die Verschiebung
zwischen dem BAB 112 innerhalb der VOE 110 und einem dem BAB
112 innerhalb der VOE 100, die eine vorhergehende VOE zu der
VOE 110 ist, ähnlichsten BAB (der unten als ein erster
vorhergesagter BAB bezeichnet wird) darstellt, gleich Null ist
und falls Differenzen zwischen den binären Pixelwerten des BAB
112 und den entsprechenden binären Pixelwerten des ersten
vorhergesagten BAB vorliegen und folglich die Differenzen
kodiert werden, wird das erste Modus-Signal dem BAB 112
zugewiesen.
Falls ein entsprechender Bewegungsvektor, der die Verschiebung
zwischen dem BAB 121 innerhalb der VOE 120 und einem dem BAB
121 innerhalb der VOE 110, die eine vorhergehende VOE zu der
VOE 120 ist, ähnlichsten BAB (der unten als ein zweiter
vorhergesagter BAB bezeichnet wird) darstellt, nicht gleich
Null ist und falls Differenzen zwischen den binären Pixelwerten
des BAB 121 und den entsprechenden binären Pixelwerten des
zweiten vorhergesagten BAB vorliegen und folglich die
Differenzen kodiert werden, wird das zweite Modus-Signal dem
BAB 121 zugewiesen.
Wenn ein entsprechender Bewegungsvektor, der die Verschiebung
zwischen dem BAB 122 innerhalb der VOE 120 und einem BAB (der
unten als ein dritter vorhergesagter BAB bezeichnet wird)
darstellt, der dem BAB 122 innerhalb der VOE 110 am ähnlichsten
ist, gleich Null ist und wenn keine Differenz zwischen den
binären Pixelwerten des BAB 122 und den entsprechenden binären
Pixelwerten des dritten vorhergesagten BAB vorliegt und damit
die Differenz nicht kodiert wird, wird das dritte Modus-Signal
dem BAB 121 zugewiesen.
Wenn ein entsprechender Bewegungsvektor, der die Verschiebung
zwischen dem BAB 123 innerhalb der VOE 120 und einem BAB (der
unten als ein vierter vorhergesagter BAB bezeichnet wird)
darstellt, der dem BAB 123 innerhalb der VOE 110 am ähnlichsten
ist, nicht gleich Null ist und wenn Differenzen zwischen den
binären Pixelwerten des BAB 123 und den entsprechenden binären
Pixelwerten des vierten vorhergesagten BAB vorliegen und
folglich die Differenzen kodiert werden, wird das vierte
Modus-Signal dem BAB 121 zugewiesen.
Obwohl ein wie oben beschriebenes herkömmliches
Modus-Kodierverfahren eine beträchtliche Leistungssteigerung ver
wirklichen kann, wenn es für das Kodieren einer Basisschicht
angewendet wird, gibt es beim Verbessern der Kodiereffizienz
Einschränkungen, wenn es für das Kodieren einer Anreicherungs
schicht angewandt wird, da es nicht die Eigenschaften des
Kodierens der Anreicherungsschicht wiedergibt.
Es ist Aufgabe der Erfindung, ein Modus-Kodierverfahren bei
einem Kodieren binärer Formen zu schaffen, welches die
Kodiereffizienz weiter erhöhen kann.
Die Erfindung löst diese Aufgabe mit dem Gegenstand des
Anspruchs 1. Weitere bevorzugte Ausführungsbeispiele der
Erfindung sind in den Unteransprüchen 2 bis 12 beschrieben.
Nach Anspruch 1 ist ein Modus-Kodierverfahren zum Kodieren
eines binären Alphablocks (BAB) aus M×N binären Pixeln
innerhalb eines aktuellen Bildes geschaffen, basierend auf dem
aktuellen Bild und einem vorhergehenden Bild, die eine Mehrzahl
an BAB's enthalten, wobei M und N jeweils positive ganze Zahlen
sind, jeder binäre Pixel einen binären Wert aufweist, der
entweder einen Objektpixel oder einen Hintergrundpixel
darstellt, bei welchem: (a) ein Sub-Abtasten auf dem BAB
innerhalb des aktuellen Bildes gemäß einer vorgegebenen
Sub-Abtastregel durchgeführt wird, um dadurch einen Abtastblock aus
(M/K)×(N/K) binären Pixeln innerhalb des aktuellen Bildes zu
erzeugen, wobei M und N jeweils Vielfache von K sind, und K
eine vorgegebene positive ganze Zahl ist; (b) ein
rekonstruierter BAB aus M×N binären Pixeln gemäß einer
vorgegebenen Rekonstruktionsregel erzeugt wird, basierend auf
dem Abtastblock innerhalb des aktuellen Bildes; (c) die
Differenz zwischen dem rekonstruierten BAB und dem BAB
innerhalb des aktuellen Bildes berechnet wird, und falls keine
Differenz zwischen diesen vorliegt, ein erstes Modus-Signal
erzeugt wird, das darüber informiert, daß keine Differenz
zwischen diesen vorliegt und folglich die Differenz nicht
kodiert wird, und falls eine Differenz zwischen diesen
vorliegt, ein zweites Modus-Signal erzeugt wird, das darüber
informiert, daß eine Differenz zwischen diesen vorliegt, und
gleichzeitig ein zweiter Fehlerdatenblock aus M×N binären
Pixeln erzeugt wird, der die zu kodierende Differenz als ein
kodierter zweiter Fehlerdatenblock darstellt; (d) in einem
Inter-Modus ein Sub-Abtasten auf den BAB's innerhalb des
vorhergehenden Bildes gemäß der vorgegebenen Sub-Abtastregel
durchgeführt wird, um dadurch eine Mehrzahl entsprechender
Abtastblöcke aus (M/K)×(N/K) binären Pixeln innerhalb des
vorhergehenden Bildes zu erzeugen; (e) in dem Inter-Modus der
Abtast-Block innerhalb des aktuellen Bildes mit den
entsprechenden Abtastblöcken innerhalb des vorhergehenden
Bildes verglichen wird und anschließend unter den
entsprechenden Abtastblöcken innerhalb des vorhergehenden
Bildes ein dem Abtastblock innerhalb des aktuellen Bildes
ähnlichster entsprechender zweiter Abtastblock als ein
vorhergesagter Abtastblock erfaßt wird, um dadurch einen
Bewegungsvektor mit vertikaler und horizontaler Komponente zu
erzeugen, der die Verschiebung zwischen dem Abtastblock
innerhalb des aktuellen Bildes und dem vorhergesagten
Abtastblock darstellt; (f) in dem Inter-Modus, basierend auf dem
Bewegungsvektor, unter den BAB's innerhalb des vorhergehenden
Bildes ein dem BAB innerhalb des aktuellen Bildes ähnlichster
BAB als ein vorhergesagter BAB erfaßt wird, die Differenz
zwischen dem BAB innerhalb des aktuellen Bildes und dem
vorhergesagten BAB berechnet wird, und falls dann keine
Differenz zwischen diesen vorliegt ein drittes Modus-Signal
erzeugt wird, das darüber informiert, daß keine Differenz
zwischen diesen vorliegt und folglich die Differenz nicht
kodiert wird, und falls eine Differenz zwischen diesen
vorliegt, ein viertes Modus-Signal erzeugt wird, das darüber
informiert, daß eine Differenz zwischen diesen vorliegt, und
gleichzeitig ein vierter Fehlerdatenblock aus M×N binären
Pixeln erzeugt wird, der die zu kodierende Differenz als ein
kodierter vierter Fehlerdatenblock darstellt; und (g) falls der
BAB innerhalb des aktuellen Bildes in einem Intra-Modus kodiert
wird, falls (während) entweder das erste oder das zweite
Modus-Signal in dem Schritt (c) erzeugt wurde, das in dem Schritt (c)
erzeugte Modus-Signal als ein ausgewähltes Modus-Signal
bereitgestellt wird, und falls der BAB innerhalb des aktuellen
Bildes in dem Inter-Modus kodiert wird, falls eines der
Modus-Signale unter den ersten bis vierten Modus-Signalen in den
Schritten (c) und (f) erzeugt wurde, das in den Schritten (c)
und (f) erzeugte Modus-Signal als ein ausgewähltes Modus-Signal
bereitgestellt wird, und falls zwei Modus-Signale unter den
ersten bis vierten Modus-Signalen gleichzeitig in den Schritten
(c) und (f) erzeugt wurden, eines der beiden in den Schritten
(c) und (f) erzeugten Modus-Signale als ein ausgewähltes
Modus-Signal gemäß einer ersten vorgegebenen Auswahlregel
bereitgestellt wird.
Weitere Vorteile und bevorzugte Ausführungsbeispiele der
Erfindung werden nunmehr anhand der Figurenbeschreibung mit
Bezug auf die beigefügte Zeichnung näher erläutert. In der
Zeichnung zeigen:
Fig. 1 eine intra-kodierte Bildebene und inter
kodierte Bildebenen zum Beschreiben eines
herkömmlichen Modus-Kodierverfahrens
beim Kodieren einer binären Form;
Fig. 2 ein aktuelles Bild mit einer Vielzahl an
binären Alphablöcken zum Erläutern eines
Modus-Kodierverfahrens beim Kodieren binärer
Formen gemäß der vorliegenden Erfindung;
Fig. 3A bis 3I Blöcke und Blöcke bildende Liniensätze
zum Beschreiben eines Sub-Abtastprozesses
für das Erzeugen einer Basisschicht eines
BAB, eines Rekonstruktionsprozesses für das
Erzeugen eines rekonstruierten BAB,
basierend auf der Basisschicht, und eines
Modus-Kodierprozesses gemäß der vorliegenden
Erfindung; und
Fig. 4 intra-kodierte Bilder und inter-kodierte
Bilder zum Beschreiben eines Modus-Kodier
verfahrens beim Kodieren einer binären Form
gemäß der vorliegenden Erfindung.
Gemäß der vorliegenden Erfindung ist ein Modus-Kodierverfahren
beim Kodieren einer binären Form bzw. Binärformkodieren
geschaffen. In Fig. 2 ist ein aktuelles Bild 200 mit mehreren
binären Alphablöcken (BAB's) 1 bis 16 darstellt, um ein
Modus-Kodierverfahren beim Kodieren einer binären Form gemäß der
vorliegenden Erfindung zu erläutern, wobei die gestrichelten
und nicht-gestrichelten Bereiche dort ein Objekt bzw. einen
Hintergrund darstellen. Kurz gesagt, wird beim Durchführen
eines Modus-Kodierens beim Kodieren eines binären Formsignals,
z. B. des aktuellen Bildes mit den BAB's 1 bis 16, ein
Modus-Signal (oder jedes durch Kodieren der Modus-Signale erzeugte
kodierte Modus-Signal) jeweils entsprechenden BAB's der BAB's
1 bis 16 zugewiesen oder bereitgestellt.
In den Fig. 3A bis 3H sind Blöcke und Blöcke bildende
Liniensätze zum Beschreiben eines Sub-Abtastprozesses für das
Erzeugen einer Basisschicht eines BAB und eines Rekonstruk
tionsprozesses für das Erzeugen eines rekonstruierten BAB,
basierend auf der Basisschicht, dargestellt, wobei die
schwarzen Bereiche Objektpixel und die weißen Bereiche Hinter
grundpixel darstellen. Fig. 3I zeigt einen Fehlerdatenblock
380 zum Beschreiben eines Modus-Kodierverfahrens gemäß der vor
liegenden Erfindung. In Fig. 4 sind intra-kodierte Bilder und
inter-kodierte Bilder zum Beschreiben eines Modus-Kodierver
fahrens beim Kodieren einer binären Form gemäß der vorliegenden
Erfindung beschrieben. Nachfolgend wird mit Bezug auf Fig. 2,
Fig. 3A bis 3I und Fig. 4 ein Modus-Kodierverfahren beim
Kodieren einer binären Form gemäß bevorzugter Ausführungs
beispiele der vorliegenden Erfindung beschrieben.
Gemäß der vorliegenden Erfindung wird ein Modus-Kodierverfahren
zum Kodieren eines BAB aus M×N binären Pixeln innerhalb eines
aktuellen Bildes bereitgestellt, basierend auf dem aktuellen
Bild und einem vorhergehenden Bild mit einer Mehrzahl an BAB's,
wobei M und N jeweils positive ganze Zahlen sind, jeder binäre
Pixel einen binären Wert aufweist, der entweder einen
Objektpixel oder einen Hintergrundpixel darstellt. Es sei
angemerkt, daß das aktuelle und das vorhergehende Bild durch
eine aktuelle Videoobjektebene (VOE) bzw. eine vorhergehende
VOE ersetzt werden können. Einfachheitshalber wird hier
lediglich ein Modus-Kodierverfahren zum Kodieren eines BAB
innerhalb eines aktuellen Bildes beschrieben.
Zuerst wird ein Sub-Abtasten auf dem BAB innerhalb des
aktuellen Bildes gemäß einer vorgegebenen Sub-Abtastregel
durchgeführt, um dadurch einen Abtastblock aus (M/K)×(N/K)
binären Pixeln als eine Basisschicht innerhalb des aktuellen
Bildes zu erzeugen, wobei M und N jeweils Vielfache von K sind,
und K eine vorgegebene positive ganze Zahl ist. Im allgemeinen
wird (1/K) ein Umwandlungsverhältnis genannt. Wird beispiels
weise ein in Fig. 3A gezeigter BAB 300, dessen Höhe (M) und
Breite (N) jeweils 16 ist, innerhalb des aktuellen Bildes mit
einem Umwandlungsverhältnis von (1/2) sub-abgetastet oder
abwärts-abgetastet, so wird ein in Fig. 3B gezeigter
Abtastblock 310, dessen Höhe (M) und Breite (N) jeweils 8 ist,
innerhalb des aktuellen Bildes erzeugt.
Danach wird ein rekonstruierter BAB aus M×N binären Pixeln
innerhalb des aktuellen Bildes gemäß einer vorgegebenen
Rekonstruktions- oder Aufwärts-Abtastregel erzeugt, basierend
auf dem Abtastblock innerhalb des aktuellen Bildes. Beispiels
weise wird ein in Fig. 3H gezeigter rekonstruierter BAB 370
aus 16×16 binären Pixeln gemäß einer vorgegebenen Rekonstruk
tionsregel erzeugt, basierend auf dem Abtastblock 310 innerhalb
des aktuellen Bildes.
Zahlreiche Sub-Abtastverfahren können als ein vorgegebenes
Sub-Abtastverfahren angewendet werden, z. B. ein Abwärts-Ab
tastverfahren, dessen Umwandlungsverhältnis gleich 1/2 ist.
Für das Rekonstruktionsverfahren sind mehrere Verfahren
bekannt, so auch ein Rasterdurchschuß-Verfahren ("scan
interleaving method"), das ein kontext-basierendes
arithmetisches Kodierverfahren anwendet (CAE-method = context
based arithmetic encoding method, d. h. CAE-Verfahren). Mit
Bezug auf Fig. 3A bis 3H werden nachfolgend ein
Sub-Abtastverfahren und ein Rekonstruktionsverfahren gemäß einem
bevorzugten Ausführungsbeispiel der vorliegenden Erfindung
beschrieben. Zuerst wird ein horizontaler Sub-Abtastschritt
durchgeführt. Dabei wird jede zweite horizontale Linie eines
BAB innerhalb eines aktuellen Bildes, z. B. des BAB 300,
abgetastet, indem entweder von einer ersten oder einer zweiten
horizontalen Linie des BAB gestartet wird, um einen ersten
Block aus (M/2)×N binären Pixeln zu erzeugen, wobei M und N
jeweils positive ganze Zahlen sind, und die erste horizontale
Linie die oberste horizontale Linie des BAB ist.
Anschließend wird ein vertikaler Sub-Abtastschritt durch
geführt. Dabei wird jede zweite vertikale Linie des ersten
Blocks abgetastet, indem entweder von einer ersten oder einer
zweiten vertikalen Linie des ersten Blocks gestartet wird, um
dadurch einen Abtastblock aus (M/2)×(N/2) binären Pixeln zu
erzeugen, z. B. den in Fig. 3B gezeigten Abtastblock 310 aus
8×8 binären Pixeln als eine Basisschicht, wobei die erste
vertikale Linie die am weitesten links liegende Linie des
ersten Blockes ist.
Danach kann ein rekonstruierter erster Block aus (M/2)×N
binären Pixeln durch sequentielles Einfügen einer Anzahl an
(N/2) rekonstruierter vertikaler Linien an Positionen von nicht
in dem vertikalen Sub-Abtastschritt abgetasteten vertikalen
Linien unter der Bedingung erzeugt werden, daß die Anzahl an
(N/2) vertikaler Linien des Abtastblockes an Positionen der in
dem vertikalen Sub-Abtastschritt abgetasteten vertikalen Linien
liegen, wobei die rekonstruierten vertikalen Linien gemäß einer
vorgegebenen Interpolationsregel erzeugt werden, basierend auf
den vertikalen Linien des Abtastblockes.
Anschließend kann ein rekonstruierter erster BAB aus M×N
binären Pixeln durch sequentielles Einfügen einer Anzahl an
(M/2) rekonstruierter horizontaler Linien an Positionen von in
dem horizontalen Sub-Abtastschritt nicht abgetasteter
horizontaler Linien unter der Bedingung erzeugt werden, daß die
Anzahl an (M/2) horizontaler Linien des rekonstruierten ersten
Blockes an Positionen der in dem horizontalen Sub-Abtastschritt
abgetasteten horizontalen Linien liegen, wobei die
rekonstruierten horizontalen Linien gemäß einer vorgegebenen
Interpolationsregel erzeugt werden, basierend auf den
horizontalen Linien des rekonstruierten ersten Blockes.
Mit Bezug auf Fig. 3C bis 3H sind Blöcke und Blöcke bildende
Liniensätze zum Beschreiben eines Rekonstruktionsprozesses für
das Erzeugen des rekonstruierten BAB 370 gemäß einer
vorgegebenen Interpolationsregel dargestellt, basierend auf dem
Abtastblock 310, der die Basisschicht des BAB 300 ist. Fig. 3C
zeigt einen vertikalen Liniensatz 320 mit einer Anzahl an 8
vertikalen Linien des Abtastblockes 310 als eine Anzahl an 8
gradzahligen vertikalen Linien V2, V4 . . ., V16. Fig. 3D
zeigt einen vertikalen Liniensatz 330 mit einer Anzahl an 8
ungradzahligen vertikalen Linien V1, V3 . . ., V15, die gemäß
der vorgegebenen Interpolationsregel, basierend auf dem
vertikalen Liniensatz 320, rekonstruiert wurden.
Fig. 3E zeigt einen rekonstruierten ersten Block 340 aus 8×16
binären Pixeln, der durch sequentielles Einfügen der 8
vertikalen Linien des vertikalen Liniensatzes 330 gemäß den
ihnen zugeordneten Indices, wie in Fig. 3D gezeigt, an ungrad
zahligen vertikalen Linienpositionen unter der Bedingung
erzeugt wird, daß die 8 vertikalen Linien des vertikalen
Liniensatzes 320 sequentiell gemäß der ihnen zugeordneten
Indices, wie in Fig. 3C gezeigt, an gradzahligen vertikalen
Linienpositionen angeordnet werden.
Fig. 3F zeigt einen horizontalen Liniensatz 350 mit 8
horizontalen Linien des rekonstruierten ersten Blockes 340 als
8 gradzahlige horizontale Linien H2, H4 . . ., H16. Fig. 3G
stellt einen horizontalen Liniensatz 360 mit 8 ungradzahligen
horizontalen Linien H1, H3 . . ., H15 dar, der gemäß der
vorgegebenen Interpolationsregel rekonstruiert wird, basierend
auf dem horizontalen Liniensatz 350.
Fig. 3H zeigt den rekonstruierten BAB 370 aus 16×16 binären
Pixeln, der durch sequentielles Einfügen der 8 horizontalen
Linien des horizontalen Liniensatzes 360 gemäß der ihnen
zugeordneten Indices, wie in Fig. 3G gezeigt, an ungrad
zahligen horizontalen Linienpositionen unter der Bedingung
erzeugt wird, daß die 8 horizontalen Linien des horizontalen
Liniensatzes 350 sequentiell gemäß der ihnen zugeordneten
Indices, wie in Fig. 3F gezeigt, an gradzahligen horizontalen
Linienpositionen angeordnet werden.
Anschließend wird die Differenz zwischen dem rekonstruierten
BAB und dem BAB innerhalb des aktuellen Bildes berechnet. Falls
dann keine Differenz zwischen diesen vorliegt, wird ein erstes
Modus-Signal erzeugt, wobei das erste Modus-Signal darüber
informiert, daß keine Differenz zwischen diesen vorliegt und
folglich die Differenz nicht kodiert wird. Falls eine Differenz
zwischen diesen vorliegt, wird ein zweites Modus-Signal
erzeugt, wobei das zweite Modus-Signal darüber informiert, daß
eine Differenz zwischen diesen vorliegt. Gleichzeitig wird ein
die Differenz darstellender zweiter Fehlerdatenblock aus M×N
binären Pixeln erzeugt und der zweite Fehlerdatenblock als ein
kodierter zweiter Fehlerdatenblock kodiert.
Im Detail ist mit Bezug auf Fig. 3I ein zweiter Fehler
datenblock 380 gezeigt, der die Differenz zwischen dem BAB 300
innerhalb des aktuellen Bildes und dem rekonstruierten BAB 370
angibt. In Fig. 3I stellen schwarze Bereiche binäre Pixelwerte
dar, z. B. 1, die darüber informieren, daß Differenzen zwischen
Pixeln in dem BAB 300 und jeweils an denselben Positionen in
dem rekonstruierten BAB 370 angeordneten entsprechenden Pixeln
vorliegen, und die weißen Bereiche stellen binäre Pixelwerte
dar, z. B. 0, die darüber informieren, daß keine Differenzen
zwischen Pixeln in dem BAB 300 und jeweils bei denselben
Positionen in dem rekonstruierten BAB 370 angeordneten
entsprechenden Pixeln vorliegen.
Zwischenzeitlich wird in einem Inter-Modus der unten
beschriebene Prozeß weiterverfolgt, um das Modus-Kodieren beim
Kodieren der binären Form gemäß den bevorzugten Ausführungs
beispielen der vorliegenden Erfindung durchzuführen. Zuerst
wird ein sub-Abtasten auf den BAB's innerhalb des
vorhergehenden Bildes gemäß der vorgegebenen Sub-Abtastregel
durchgeführt, um dadurch eine Mehrzahl entsprechender
Abtastblöcke aus (M/K)×(N/K) binären Pixeln innerhalb des
vorhergehenden Bildes zu erzeugen.
Danach wird der Abtastblock innerhalb des aktuellen Bildes mit
den entsprechenden Abtastblöcken innerhalb des vorhergehenden
Bildes verglichen und anschließend unter den entsprechenden
Abtastblöcken ein dem Abtastblock innerhalb des aktuellen
Bildes ähnlichster entsprechender Abtastblock als ein
vorhergesagter Abtastblock erfaßt, um dadurch einen
Bewegungsvektor mit einer vertikalen und einer horizontalen
Komponente zu erzeugen, der die Verschiebung zwischen dem
Abtastblock innerhalb des aktuellen Bildes und dem
vorhergesagten Abtastblock darstellt.
In dem Inter-Modus wird unter den BAB's innerhalb des
vorhergehenden Bildes, basierend auf dem Bewegungsvektor, ein
dem BAB innerhalb des aktuellen Bildes ähnlichster BAB als ein
vorhergesagter BAB erfaßt und anschließend die Differenz
zwischen dem BAB innerhalb des aktuellen Bildes und dem vorher
gesagten BAB berechnet. Gemäß den bevorzugten Ausführungs
beispielen der vorliegenden Erfindung sind die erzeugten
horizontalen und vertikalen Distanzen zwischen dem BAB
innerhalb des aktuellen Bildes und dem vorhergesagten BAB das
Zweifache der horizontalen bzw. der vertikalen Komponente des
Bewegungsvektors.
Danach wird das dritte Modus-Signal erzeugt, falls keine
Differenz zwischen diesen vorliegt, wobei das dritte Modus
signal darüber informiert, daß keine Differenz zwischen diesen
vorliegt und folglich die Differenz nicht kodiert wird. Falls
eine Differenz zwischen diesen vorliegt, wird ein viertes
Modus-Signal erzeugt, wobei das vierte Modus-Signal darüber
informiert, daß eine Differenz zwischen diesen vorliegt.
Gleichzeitig wird ein die Differenz darstellender vierter
Fehlerdatenblock aus M×N binären Pixeln erzeugt und der vierte
Fehlerdatenblock als ein kodierter vierter Fehlerdatenblock
kodiert.
Beim Modus-Kodieren wird das erzeugte Modus-Signal als ein
ausgewähltes Modus-Signal bereitgestellt, falls der BAB
innerhalb des aktuellen Bildes in einem Intra-Modus kodiert
wird, da entweder das erste oder das zweite Modus-Signal
erzeugt wird. Falls der BAB innerhalb des aktuellen Bildes in
dem Inter-Modus kodiert wird, wird das erzeugte Modus-Signal
als ein ausgewähltes Modus-Signal bereitgestellt, sofern ein
Modus-Signal unter den ersten bis vierten Modus-Signalen
erzeugt wird; und falls zwei Modus-Signale unter den ersten bis
vierten Modus-Signalen gleichzeitig erzeugt werden, wird eines
der zwei erzeugten Modus-Signale als ein ausgewähltes
Modus-Signal gemäß einer ersten vorgegebenen Auswahlregel ausgewählt
und bereitgestellt.
Die erste vorgegebene Auswahlregel gemäß einem bevorzugten
Ausführungsbeispiel der vorliegenden Erfindung wird nachfolgend
beschrieben. Falls das erste und das dritte Modus-Signal
gleichzeitig erzeugt werden, wird entweder das erste oder das
dritte Modus-Signal als ein ausgewähltes Modus-Signal gemäß
einer zweiten vorgegebenen Auswahlregel, z. B. einer das dritte
Modus-Signal auswählenden Regel, ausgewählt. Falls das erste
Modus-Signal erzeugt wird und das dritte Modus-Signal nicht
erzeugt wird, wird das erste Modus-Signal als ein ausgewähltes
Modus-Signal ausgewählt, selbst wenn das vierte Modus-Signal
gleichzeitig erzeugt wird.
Falls das dritte Modus-Signal erzeugt wird und das erste
Modus-Signal nicht erzeugt wird, wird das dritte Modus-Signal als ein
ausgewähltes Modus-Signal ausgewählt, selbst wenn das zweite
Modus-Signal gleichzeitig erzeugt wird. Falls das zweite und
das vierte Modus-Signal gleichzeitig erzeugt werden, wird
entweder das zweite oder das vierte Modus-Signal als ein
ausgewähltes Modus-Signal gemäß einer dritten vorgegebenen
Auswahlregel ausgewählt.
Die dritte vorgegebene Auswahlregel ist wie folgt. Zuerst
werden das zweite und das vierte Modus-Signal kodiert, um
dadurch ein kodiertes zweites bzw. ein kodiertes viertes
Modus-Signal zu erzeugen, und der zweite und der vierte Fehlerdaten
block werden kodiert, um dadurch einen kodierten zweiten bzw.
einen kodierten vierten Fehlerdatenblock zu erzeugen. Das
kodierte zweite und das kodierte vierte Modus-Signal und der
kodierte zweite und der kodierte vierte Fehlerdatenblock werden
kombiniert, um dadurch kodierte zweite bzw. kodierte vierte
Anreicherungsschichtdaten zu erzeugen.
Anschließend wird eine zweite und eine vierte Anzahl an
Datenbits für die kodierten zweiten bzw. die kodierten vierten
Anreicherungsschichtdaten berechnet; danach wird die zweite
Anzahl an Datenbits mit der vierten Anzahl an Datenbits
verglichen, um dadurch das zweite Modus-Signal als ein
ausgewähltes Modus-Signal auszuwählen, falls die zweite Anzahl
an Datenbits gleich oder kleiner der vierten Anzahl an
Datenbits ist, und das vierte Modus-Signal als ein ausgewähltes
Modus-Signal auszuwählen, falls die zweite Anzahl an Datenbits
größer als die vierte Anzahl an Datenbits ist.
Gemäß dem Modus-Kodierverfahren des bevorzugten Aus
führungsbeispiels der vorliegenden Erfindung wird beispiels
weise jedes ausgewählte Modus-Signal (oder jedes kodierte
ausgewählte Modus-Signal, das durch Kodieren des entsprechenden
ausgewählten Modus-Signals erhalten wird) jeweils einem ent
sprechenden BAB der BAB's 1 bis 16 innerhalb des aktuellen
Bildes, wie in Fig. 2 gezeigt, bereitgestellt oder zugewiesen.
Danach werden das erste und das dritte Modus-Signal jeweils als
ausgewählte Modus-Signale ausgewählt, das erste und das dritte
Modus-Signal als ein kodiertes erstes bzw. ein kodiertes
drittes Modus-Signal kodiert und anschließend das kodierte
erste und das kodierte dritte Modus-Signal als eine kodierte
erste bzw. eine kodierte dritte Anreicherungsschicht
bereitgestellt. Falls das zweite und das vierte Modus-Signal
jeweils als ausgewählte Modus-Signale ausgewählt werden, werden
die kodierten zweiten und die kodierten vierten Anreicherungs
schichtdaten jeweils als kodierte Anreicherungsschichtdaten
bereitgestellt.
Oben wurde das Modus-Kodierverfahren gemäß dem bevorzugten
Ausführungsbeispiel der vorliegenden Erfindung beschrieben. Es
sei bemerkt, daß das Modus-Kodierverfahren für ein Kodieren
binärer Formen, d. h., für ein Kodieren einer
Anreicherungsschicht ohne Berücksichtigung der Verfahrensart,
z. B. einem Sub-Abtastverfahren und einem Rekonstruktionsver
fahren beim Kodieren der binären Form, angewendet werden kann.
Fig. 4 zeigt intra-kodierte Bilder und inter-kodierte Bilder
zum Beschreiben des Modus-Kodierverfahrens gemäß dem
bevorzugten Ausführungsbeispiel der vorliegenden Erfindung. Mit
Bezug auf Fig. 4 wird das dort angewandte Modus-Kodier
verfahren nachfolgend beschrieben. In Fig. 4 stellen I ein
intra-kodiertes Bild als eine Basisschicht dar; P1 ein intra
kodiertes Bild als eine Anreicherungsschicht; P2 und P3 intra
kodierte Bilder jeweils als Basisschichten; und B1 und B2
inter-kodierte Bilder jeweils als Anreicherungsschichten. In
Fig. 4 ist das Bild I die Basisschicht des Bildes P1; die
Bilder P2 und P3 sind Basisschichten der Bilder B1 bzw. B2.
Das Modus-Kodierverfahren gemäß dem bevorzugten
Ausführungsbeispiel der vorliegenden Erfindung bezieht sich auf
das Kodieren des BAB innerhalb der Bilder P1, B1 und B2. Daher
wird nachfolgend beschrieben, welches Modus-Signal jeweils den
BAB's innerhalb der Bilder P1, B1 und B2 zugewiesen wird. Es
sei bemerkt, daß anstelle des Modus-Signals die kodierten
Modus-Signale den BAB's innerhalb der Bilder P1, B1 und B2
zugewiesen werden können. Einfachheitshalber wird nachfolgend
lediglich der Fall beschrieben, daß ihnen die Modus-Signale
zugewiesen werden.
In einem Intra-Modus wird entweder das erste Modus-Signal oder
das dritte Modus-Signal erzeugt, da das Bild P1 basierend auf
dem Bild I (bezieht sich auf den in Fig. 4 gezeigten Weg 1)
rekonstruiert wird. Folglich wird entweder das erste Modus
signal oder das dritte Modus-Signal jedem BAB innerhalb des
Bildes P1 bei deren Modus-Kodieren zugewiesen. Ein jeweils den
BAB's innerhalb des Bildes B1 zugewiesenes Modus-Signal wird
als deren ausgewähltes Modus-Signal aus den ersten bis vierten
Modus-Signalen ausgewählt, da das Bild B1 entweder basierend
auf dem Bild P2 (bezieht sich auf den in Fig. 4 gezeigten Weg
3) oder dem Bild P1, das ein vorhergehendes Bild des Bildes B1
ist (bezieht sich auf den in Fig. 4 gezeigten Weg 2),
rekonstruiert werden kann.
Eines der ersten bis vierten Modus-Signale wird jedem BAB
innerhalb des Bildes B2 bei deren Modus-Kodieren zugewiesen, da
das Bild B2, basierend auf entweder dem Bild P3 (bezieht sich
auf den in Fig. 4 gezeigten Weg 5) oder dem Bild B1, das ein
vorhergehendes Bild des Bildes B2 ist (bezieht sich auf den in
Fig. 4 gezeigten Weg 4), rekonstruiert werden kann.
Wie oben beschrieben, kann beim Kodieren eines binären
Formsignals, z. B. eines BAB innerhalb eines Bildes (oder einer
VOE), insbesondere beim Kodieren der Anreicherungsschicht des
binären Formsignals, das Modus-Kodierverfahren gemäß der
vorliegenden Erfindung die Kodiereffizienz signifikant
verbessern.
Während die vorliegende Erfindung lediglich anhand bevorzugter
Ausführungsbeispiele beschrieben wurde, können weitere
Modifikationen und Änderungen vorgenommen werden, wie sie in
den Ansprüchen beschrieben sind, ohne die Erfindungsidee zu
verlassen.
Claims (12)
1. Modus-Kodierverfahren zum Kodieren eines binären
Alpha-Blocks (BAB) aus M×N binären Pixeln innerhalb eines
aktuellen Bildes, basierend auf dem aktuellen Bild und
einem vorhergehenden Bild, die eine Mehrzahl an BAB's
enthalten, wobei M und N jeweils positive ganze Zahlen
sind, jeder binäre Pixel einen binären Wert aufweist, der
entweder einen Objektpixel oder einen Hintergrundpixel
darstellt, bei welchem:
- (a) ein Sub-Abtasten auf dem BAB innerhalb des aktuellen Bildes gemäß einer vorgegebenen Sub-Abtastregel durchgeführt wird, um dadurch einen Abtastblock aus (M/K)×(N/K) binären Pixeln innerhalb des aktuellen Bildes zu erzeugen, wobei M und N jeweils Vielfache von K sind, und K eine vorgegebene positive ganze Zahl ist;
- (b) ein rekonstruierter BAB aus M×N binären Pixeln gemäß einer vorgegebenen Rekonstruktionsregel erzeugt wird, basierend auf dem Abtastblock innerhalb des aktuellen Bildes;
- (c) die Differenz zwischen dem rekonstruierten BAB und dem BAB innerhalb des aktuellen Bildes berechnet wird, und falls keine Differenz zwischen diesen vorliegt, ein erstes Modus-Signal erzeugt wird, das darüber informiert, daß es keine Differenz zwischen diesen gibt und folglich die Differenz nicht kodiert wird, und falls eine Differenz zwischen diesen vorliegt, ein zweites Modus-Signal erzeugt wird, das darüber informiert, daß eine Differenz zwischen diesen vorliegt, und gleichzeitig ein zweiter Fehlerdatenblock aus M×N binären Pixeln erzeugt wird, der die zu kodierende Differenz als ein kodierter zweiter Fehlerdatenblock darstellt;
- (d) in einem Inter-Modus ein Sub-Abtasten auf den BAB's innerhalb des vorhergehenden Bildes gemäß der vorgegebenen Sub-Abtastregel durchgeführt wird, um dadurch eine Mehrzahl entsprechender Abtastblöcke aus (M/K)×(N/K) binären Pixeln innerhalb des vorhergehenden Bildes zu erzeugen;
- (e) in dem Inter-Modus der Abtast-Block innerhalb des aktuellen Bildes mit den entsprechenden Abtastblöcken innerhalb des vorhergehenden Bildes verglichen wird und anschließend unter den entsprechenden Abtastblöcken innerhalb des vorhergehenden Bildes ein dem Abtastblock innerhalb des aktuellen Bildes ähnlichster entsprechender zweiter Abtastblock als ein vorhergesagter Abtastblock erfaßt wird, um dadurch einen Bewegungsvektor mit vertikaler und horizontaler Komponente zu erzeugen, der die Verschiebung zwischen dem Abtastblock innerhalb des aktuellen Bildes und dem vorhergesagten Abastblock darstellt;
- (f) in dem Inter-Modus, basierend auf dem Bewegungsvektor, unter den BAB'S innerhalb des vorhergehenden Bildes ein dem BAB innerhalb des aktuellen Bildes ähnlichster BAB als ein vorhergesagter BAB erfaßt wird, die Differenz zwischen dem BAB innerhalb des aktuellen Bildes und dem vorhergesagten BAB berechnet wird, und falls dann keine Differenz zwischen diesen vorliegt, ein drittes Modus-Signal erzeugt wird, das darüber informiert, daß keine Differenz zwischen diesen vorliegt und folglich die Differenz nicht kodiert wird, und falls eine Differenz zwischen diesen vorliegt, ein viertes Modus-Signal erzeugt wird, das darüber informiert, daß eine Differenz zwischen diesen vorliegt, und gleichzeitig ein vierter Fehlerdatenblock aus M×N binären Pixeln erzeugt wird, der die zu kodierende Differenz als ein kodierter vierter Fehlerdatenblock darstellt; und
- (g) falls der BAB innerhalb des aktuellen Bildes in einem Intra-Modus kodiert wird, falls entweder das erste oder das zweite Modus-Signal in dem Schritt (c) erzeugt wurde, das in dem Schritt (c) erzeugte Modus-Signal als ein ausgewähltes Modus-Signal bereitgestellt wird, und falls der BAB innerhalb des aktuellen Bildes in dem Inter-Modus kodiert wird, falls eines der Modus-Signale unter den ersten bis vierten Modus-Signalen in den Schritten (c) und (f) erzeugt wurde, das in den Schritten (c) und (f) erzeugte Modus-Signal als ein ausgewähltes Modus-Signal bereitgestellt wird, und falls zwei Modus-Signale unter den ersten bis vierten Modus-Signalen gleichzeitig in den Schritten (c) und (f) erzeugt wurden, eines der beiden in den Schritten (c) und (f) erzeugten Modus-Signale als ein ausgewähltes Modus-Signal gemäß einer ersten vorgegebenen Auswahlregel bereitgestellt wird.
2. Verfahren nach Anspruch 1, bei welchem das aktuelle und
das vorhergehende Bild durch eine aktuelle Videoobjekt
ebene (VOE) bzw. eine vorhergehende VOE ersetzt werden.
3. Verfahren nach Anspruch 1 oder 2, bei welchem die erste
Auswahlregel wie folgt ist: falls das erste und das
dritte Modus-Signal gleichzeitig erzeugt werden, wird
entweder das erste oder das dritte Modus-Signal als das
ausgewählte Modus-Signal gemäß einer zweiten vorgegebenen
Auswahlregel ausgewählt; falls das erste Modus-Signal
erzeugt wird und das dritte Modus-Signal nicht erzeugt
wird, wird das erste Modus-Signal als das ausgewählte
Modus-Signal ausgewählt, selbst wenn das vierte
Modus-Signal gleichzeitig erzeugt wird; und falls das dritte
Modus-Signal erzeugt wird und das erste Modus-Signal
nicht erzeugt wird, wird das dritte Modus-Signal als das
ausgewählte Modus-Signal ausgewählt, selbst wenn das
zweite Modus-Signal gleichzeitig erzeugt wird; falls das
zweite und das vierte Modus-Signal gleichzeitig erzeugt
werden, wird entweder das zweite oder das vierte
Modus-Signal als das ausgewählte Modus-Signal gemäß einer
dritten vorgegebenen Auswahlregel ausgewählt.
4. Verfahren nach Anspruch 3, bei welchem die dritte
vorgegebene Auswahlregel wie folgt ist: das zweite und
das vierte Modus-Signal werden kodiert, um dadurch ein
kodiertes zweites bzw. ein kodiertes viertes Modus-Signal
zu erzeugen und der zweite und der vierte Fehlerdaten
block werden kodiert, um dadurch einen kodierten zweiten
bzw. einen kodierten vierten Fehlerdatenblock zu
erzeugen; und das kodierte zweite und das kodierte vierte
Modus-Signal und der kodierte zweite und der kodierte
vierte Fehlerdatenblock werden kombiniert, um dadurch
eine kodierte zweite bzw. eine kodierte vierte
Anreicherungsschicht zu erzeugen; und anschließend wird
eine zweite und eine vierte Anzahl an Datenbits für die
kodierten zweiten bzw. die kodierten vierten
Anreicherungsschichtdaten berechnet; danach wird die
zweite Anzahl an Datenbits mit der vierten Anzahl an
Datenbits verglichen, um dadurch das zweite Modus-Signal
als das ausgewählte Modus-Signal auszuwählen, falls die
zweite Anzahl an Datenbits gleich oder kleiner der
vierten Anzahl an Datenbits ist, und das vierte
Modus-Signal als das ausgewählte Modus-Signal auszuwählen,
falls die zweite Anzahl an Datenbits größer als die
vierte Anzahl an Datenbits ist.
5. Verfahren nach Anspruch 3 oder 4, bei welchem die zweite
vorgegebene Auswahlregel derart ist, daß das dritte
Modus-Signal als das ausgewählte Modus-Signal ausgewählt
wird, falls das erste und das dritte Modus-Signal
gleichzeitig erzeugt werden.
6. Verfahren nach einem der vorhergehenden Ansprüche, bei
welchem, falls das erste und das dritte Modus-Signal
jeweils als die ausgewählten Modus-Signale ausgewählt
werden, das erste und das dritte Modus-Signal als das
kodierte erste bzw. das kodierte dritte Modus-Signal
kodiert werden, und anschließend das kodierte erste und
das kodierte dritte Modus-Signal jeweils als kodierte
Anreicherungsschichten bereitgestellt werden; und falls
das zweite und das vierte Modus-Signal jeweils als die
ausgewählten Modus-Signale ausgewählt werden, die
kodierten zweiten und die kodierten vierten
Anreicherungsschichtdaten jeweils als kodierte
Anreicherungsschicht bereitgestellt werden.
7. Verfahren nach einem der vorhergehenden Ansprüche, bei
welchem im Verfahrensschritt (a):
(a1) jede zweite horizontale Linie des BAB abgetastet wird, um einen ersten Block aus (M/2)×N binären Pixeln zu erzeugen, der entweder von einer ersten oder einer zweiten horizontalen Linie des BAB startet, wobei die erste horizontale Linie die oberste horizontale Linie des BAB ist; und
(a2) jede zweite vertikale Linie des ersten Blocks abgetastet wird, um den Abtastblock aus (M/2)×(N/2) binären Pixeln als eine Basisschicht zu erzeugen, die entweder von einer ersten oder einer zweiten vertikalen Linie des ersten Blockes startet, wobei die erste vertikale Linie die am weitesten links liegende Linie des ersten Blockes ist.
(a1) jede zweite horizontale Linie des BAB abgetastet wird, um einen ersten Block aus (M/2)×N binären Pixeln zu erzeugen, der entweder von einer ersten oder einer zweiten horizontalen Linie des BAB startet, wobei die erste horizontale Linie die oberste horizontale Linie des BAB ist; und
(a2) jede zweite vertikale Linie des ersten Blocks abgetastet wird, um den Abtastblock aus (M/2)×(N/2) binären Pixeln als eine Basisschicht zu erzeugen, die entweder von einer ersten oder einer zweiten vertikalen Linie des ersten Blockes startet, wobei die erste vertikale Linie die am weitesten links liegende Linie des ersten Blockes ist.
8. Verfahren nach einem der vorhergehenden Ansprüche, bei
welchem im Schritt (b):
(b1) ein rekonstruierter erster Block aus (M/2)×N binären Pixeln durch sequentielles Einfügen einer Anzahl an (N/2) rekonstruierter vertikaler Linien bei Positionen von nicht in dem Schritt (a2) abgetasteter vertikaler Linien unter der Bedingung erzeugt wird, daß die Anzahl an (N/2) vertikaler Linien des Abtastblockes an Positionen der in dem Schritt (a2) abgetasteter vertikaler Linien angeordnet werden, wobei die rekonstruierten vertikalen Linien gemäß einer vorgegebenen Interpolationsregel erzeugt werden, basierend auf den vertikalen Linien des Abtastblockes; und
(b2) der rekonstruierte BAB aus M×N binären Pixeln durch sequentielles Einfügen einer Anzahl an (M/2) rekonstruierter horizontaler Linien an Positionen von nicht in dem Schritt (a1) abgetasteter horizontaler Linien unter der Bedingung erzeugt wird, daß die Anzahl an (M/2) horizontaler Linien des rekonstruierten ersten Blockes an Positionen von in dem Schritt (a1) abgetasteter horizontaler Linien angeordnet werden, wobei die rekonstruierten horizontalen Linien gemäß einer vorgegebenen Interpolationsregel erzeugt werden, basierend auf den horizontalen Linien des rekonstruierten ersten Blockes.
(b1) ein rekonstruierter erster Block aus (M/2)×N binären Pixeln durch sequentielles Einfügen einer Anzahl an (N/2) rekonstruierter vertikaler Linien bei Positionen von nicht in dem Schritt (a2) abgetasteter vertikaler Linien unter der Bedingung erzeugt wird, daß die Anzahl an (N/2) vertikaler Linien des Abtastblockes an Positionen der in dem Schritt (a2) abgetasteter vertikaler Linien angeordnet werden, wobei die rekonstruierten vertikalen Linien gemäß einer vorgegebenen Interpolationsregel erzeugt werden, basierend auf den vertikalen Linien des Abtastblockes; und
(b2) der rekonstruierte BAB aus M×N binären Pixeln durch sequentielles Einfügen einer Anzahl an (M/2) rekonstruierter horizontaler Linien an Positionen von nicht in dem Schritt (a1) abgetasteter horizontaler Linien unter der Bedingung erzeugt wird, daß die Anzahl an (M/2) horizontaler Linien des rekonstruierten ersten Blockes an Positionen von in dem Schritt (a1) abgetasteter horizontaler Linien angeordnet werden, wobei die rekonstruierten horizontalen Linien gemäß einer vorgegebenen Interpolationsregel erzeugt werden, basierend auf den horizontalen Linien des rekonstruierten ersten Blockes.
9. Verfahren nach einem der vorhergehenden Ansprüche, bei
welchem horizontale und vertikale Distanzen zwischen dem
BAB innerhalb des aktuellen Bildes und dem in Schritt (f)
erzeugten vorhergesagten BAB das zweifache der
horizontalen bzw. der vertikalen Komponente des
Bewegungsvektors sind.
10. Verfahren nach einem der Ansprüche 7 bis 9, bei welchem
der Verfahrensschritt (a1) der Schritt zum Abtasten
gradzahliger horizontaler Linien des BAB für das Erzeugen
des ersten Blockes ist, und der Schritt (a2) der Schritt
zum Abtasten gradzahliger vertikaler Linien des ersten
Blockes für das Erzeugen des Abtastblockes ist.
11. Verfahren nach einem der vorhergehenden Ansprüche, bei
welchem M gleich N ist.
12. Verfahren nach einem der vorhergehenden Ansprüche, bei
welchem sowohl M als auch N gleich 16 sind.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019970052446A KR100256022B1 (ko) | 1997-10-14 | 1997-10-14 | 이진형상신호부호화에있어서의모드부호화방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19749604A1 true DE19749604A1 (de) | 1999-04-15 |
Family
ID=19522659
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE1997149604 Ceased DE19749604A1 (de) | 1997-10-14 | 1997-11-10 | Verfahren zum Kodieren eines Modus beim Kodieren binärer Formen |
Country Status (7)
Country | Link |
---|---|
US (1) | US6049567A (de) |
JP (1) | JPH11177990A (de) |
KR (1) | KR100256022B1 (de) |
CN (1) | CN1130920C (de) |
DE (1) | DE19749604A1 (de) |
FR (1) | FR2769784B1 (de) |
GB (1) | GB2330472B (de) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100535631B1 (ko) * | 1997-09-29 | 2006-07-10 | 주식회사 팬택앤큐리텔 | 적응적 비월주사 모양정보 부호화/복호화 장치및 방법 |
KR100281462B1 (ko) * | 1998-03-30 | 2001-02-01 | 전주범 | 격행 부호화에서 이진 형상 신호의 움직임 벡터 부호화 방법 |
JP2000050258A (ja) * | 1998-07-31 | 2000-02-18 | Toshiba Corp | 映像検索方法および映像検索装置 |
KR100639048B1 (ko) * | 1998-08-04 | 2006-10-27 | 스미또모 가가꾸 가부시키가이샤 | 티탄-함유 산화규소 촉매, 이의 제조 방법 및 당해 촉매를 사용하는 프로필렌 옥사이드의 제조방법 |
TWI273778B (en) * | 2003-11-10 | 2007-02-11 | Sunplus Technology Co Ltd | Method to merge the system data in image memory system |
KR101075722B1 (ko) * | 2004-08-13 | 2011-10-21 | 삼성전자주식회사 | 이동통신시스템에서의 패킷 처리 결과 통보방법 |
US7889789B2 (en) * | 2006-04-07 | 2011-02-15 | Microsoft Corporation | Making interlace frame level coding mode decisions |
KR101508599B1 (ko) | 2008-03-18 | 2015-04-03 | 삼성전자주식회사 | 2×2 블록 기반 이진 영상 압축 방법 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01500236A (ja) * | 1986-03-19 | 1989-01-26 | ブリティッシュ・ブロードキャスティング・コーポレーション | 帯域巾圧縮ビデオ信号の受信再生装置 |
US5883977A (en) * | 1996-12-30 | 1999-03-16 | Daewoo Electronics Co., Ltd. | Method and apparatus for encoding a video signal of a contour of an object |
US5969764A (en) * | 1997-02-14 | 1999-10-19 | Mitsubishi Electric Information Technology Center America, Inc. | Adaptive video coding method |
US5974184A (en) * | 1997-03-07 | 1999-10-26 | General Instrument Corporation | Intra-macroblock DC and AC coefficient prediction for interlaced digital video |
US5978510A (en) * | 1997-03-20 | 1999-11-02 | Hyundai Electronics Industries Co., Ltd. | Method and apparatus for predictively coding contour of video signal |
-
1997
- 1997-10-14 KR KR1019970052446A patent/KR100256022B1/ko not_active IP Right Cessation
- 1997-10-27 US US08/958,806 patent/US6049567A/en not_active Expired - Lifetime
- 1997-11-06 GB GB9723483A patent/GB2330472B/en not_active Expired - Fee Related
- 1997-11-07 CN CN97121616A patent/CN1130920C/zh not_active Expired - Fee Related
- 1997-11-07 FR FR9714060A patent/FR2769784B1/fr not_active Expired - Fee Related
- 1997-11-10 DE DE1997149604 patent/DE19749604A1/de not_active Ceased
- 1997-11-10 JP JP30694197A patent/JPH11177990A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
KR100256022B1 (ko) | 2000-05-01 |
GB9723483D0 (en) | 1998-01-07 |
FR2769784A1 (fr) | 1999-04-16 |
FR2769784B1 (fr) | 2004-08-27 |
CN1214597A (zh) | 1999-04-21 |
US6049567A (en) | 2000-04-11 |
KR19990031654A (ko) | 1999-05-06 |
CN1130920C (zh) | 2003-12-10 |
JPH11177990A (ja) | 1999-07-02 |
GB2330472B (en) | 2001-12-05 |
GB2330472A (en) | 1999-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69839100T2 (de) | Verbesserte Videokodierung unter Verwendung von adaptiven Blockparametern für kodierte/unkodierte Blöcke | |
DE69733007T2 (de) | Vorrichtung zur codierung und decodierung von bewegtbildern | |
DE19739266B4 (de) | Verfahren und Vorrichtung zum Kodieren binärer Formen | |
DE69636277T2 (de) | Verfahren und Vorrichtung zur Erzeugung von Farbart-Forminformation einer Video-Objektebene in einem Videosignal | |
DE69836470T2 (de) | Überträger, empfänger und medium für progressives bildsignal | |
DE69630297T2 (de) | Weiterentwickeltes fernsehsystem | |
DE19743202A1 (de) | Verfahren und Vorrichtung zum Codieren eines Bewegungsvektors | |
DE19816898B4 (de) | Vorrichtung und Verfahren zum adaptiven Codieren eines Bildsignals | |
DE69636529T2 (de) | Verfahren zum Kodieren und Dekodieren von Bewegtbildsignalen | |
DE19744859B4 (de) | Verfahren zum Codieren eines binären Formsignals | |
DE69910695T2 (de) | Verfahren und Apparat zum Filtern von Bildfarbsignalen | |
WO1997043863A1 (de) | Verfahren zur speicherung oder übertragung von stereoskopischen videosignalen | |
DE19749604A1 (de) | Verfahren zum Kodieren eines Modus beim Kodieren binärer Formen | |
DE69737711T2 (de) | Verfahren und Vorrichtung zur Kodierung einer Objektkontur unter Verwendung ihrer Zeitkorrelation | |
EP0346637B1 (de) | Verfahren zur Aufbereitung und Übertragung einer Bildsequenz | |
EP1110407B1 (de) | Verfahren und anordnung zur codierung und decodierung eines digitalisierten bildes mit anwendung eines gesamtbewegungsvektors | |
EP0581808B1 (de) | Verfahren zur kompatiblen übertragung, decodierung oder aufzeichnung von progressiv abgetasteten bildsignalen im zwischenzeilenformat | |
EP0533675B1 (de) | Übertragungssystem | |
DE3828908A1 (de) | Bilduebertragungssystem | |
WO2000019373A1 (de) | Verfahren und anordnung zur bearbeitung eines digitalisierten bildes mit bildpunkten | |
DE3726601C2 (de) | ||
DE69923725T2 (de) | Verfahren und Gerät für die Herausziehung von Farbkonturinformation aus Videohalbbildern | |
DE19644769B4 (de) | Vorrichtung und Verfahren zum formadaptiven Codieren von Bildsignalen | |
DE19717453C2 (de) | Verfahren zum Einblenden eines neuen Bildabschnittes an einer vorbestimmten Stelle eines datenreduzierten Video-Datenstromes | |
EP0346636A2 (de) | Verfahren zur Aufbereitung und Übertragung einer Bildsequenz |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8127 | New person/name/address of the applicant |
Owner name: DAEWOO ELECTRONICS CORP., SEOUL/SOUL, KR |
|
8110 | Request for examination paragraph 44 | ||
R002 | Refusal decision in examination/registration proceedings | ||
R003 | Refusal decision now final |
Effective date: 20111014 |