-
Erfindungsgebiet
-
Die vorliegende Erfindung betrifft
eine Datenstruktur zur Bildübertragung,
ein Bild-Kodierungsverfahren,
ein Bild-Dekodierungsverfahren, ein Bild-Kodiergerät, ein Bild-Dekodiergerät, ein Daten-Speichermedium,
das ein Programm zur Umsetzung eines Bild-Dekodierungsprozesses enthält und ein
Daten-Speichermedium, das ein kodiertes Bildsignal enthält.
-
Insbesondere betrifft die Erfindung
eine Datenstruktur zur Bildübermittlung,
die kodierte Bildsignale durch Dekodierungsprozesse, dekodierbar macht,
die zu einem einzigen Kodierungsverfahren korrespondieren, dessen
kodierte Bildsignale unterschiedliche Datenstrukturen haben, die
sie beim Kodieren der digitalen Bildsignale nach unterschiedlichen
Programmen erhalten. Im Weiteren bezieht sich die vorliegende Erfindung
auf ein Bild-Kodierungsverfahren sowie ein Bild-Kodiergerät zur Erzeugung eines
kodierten Bildsignals, das die oben beschriebene Datenstruktur zur
Bildübertragung
aufweist, und ein Bild-Dekodierungsverfahren sowie ein Bild-Dekodiergerät zum Dekodieren
eines kodierten Bildsignals, das die Datenstruktur zur Bildübertragung
aufweist.
-
Außerdem betrifft die Erfindung
ein Datenspeichermedium, das ein Programm zur Umsetzung des Dekodierungsprozesses
nach dem oben beschriebenen Bild-Dekodierungsverfahren
enthält, und
ein Datenspeichermedium, das ein kodiertes Bildsignal mit der oben
beschriebenen Datenstruktur zur Bildübertragung enthält.
-
Hintergrund der Erfindung
-
Um digitale Bildinformationen mit
hoher Effizienz zu speichern oder zu übertragen, ist eine Kompressionskodierung
der digitalen Bildinformationen notwendig. Ein typisches Verfahren
zur Kompressionskodierung digitaler Bildinformationen ist die DCT (Discrete
Cosine Transformation) vertreten durch JPEG (Joint Photographic
Experts Group) und MPEG (Moving Pictures Expert Group). Außerdem gibt
es Wellenform-Kodierungsverfahren, wie z. B. die Subband-Kodierung,
die Wavelet-Kodierung und die Fraktal-Kodierung.
-
Im Weiteren wird zum Entfernen redundanter Informationen
zwischen Displaybildern, wie z. B. bei aufeinander folgenden Einzelbildern,
eine Inter-Rahmen-Vorhersage unter Verwendung einer Bewegungskompensation
ausgeführt.
Das heißt,
der Wert eines Pixels in dem vorliegenden Rahmen wird bestimmt durch
eine Differenz zwischen diesem Pixelwert und einem Pixelwert eines
Pixels im vorherigen Rahmen, und dieses Differenzsignal wird in
einer Wellenform-Kodierung bearbeitet.
-
Im Besonderen wird – wie in 22(a) dargestellt – ein arithmetischer
Kodierer 10a zum Kodieren eines binären Bildsignals S2 verwendet,
das ein Binärinformations-Displaybild repräsentiert
und von einem Scanner eines Fax-Apparats oder dergleichen erhalten
wurde. Zum Dekodieren eines kodierten Binärsignals E2 wird – wie in 22(b) dargestellt – ein arithmetischer
Dekoder 10b verwendet. Der arithmetische Kodierer 10a kodiert
das binäre
Bildsignal S2 mit Hilfe eines arithmetischen Kodierungsprozess, der
bei Übermittlung
eines Fax-Signals verwendet wird, so z. B. mit MMR (Modified Modified
Reed) oder JBIG (Joint Bilevel Image Coding Expert Group), und erzeugt
damit ein kodiertes Binärsignal
E2. Das arithmetische Dekodiergerät 10b dekodiert das
kodierte Binärsignal
E2 mit Hilfe eines arithmetischen Dekodierungsprozesses, der zum
arithmetischen Kodierungsprozess gehört, und stellt so ein dekodiertes
Binärsignal
D2 wieder her.
-
Wie in 22(c) dargestellt
ist, umfasst ein zu einem Displaybild gehörendes kodiertes Binärsignal 600a (E2)
ein Synchronsignal 601 am Anfang, einen an das Signal 601 anschließenden Datenkopf 603 und
an den Datenkopf 603 anschließende Formdaten 604.
-
Im Weiteren wird ein in 23(a) dargestelltes Bild-Kodiergerät 20 zum
Kodieren des in MPEG2 bearbeiteten digitalen Bildsignal St verwendet,
und ein in 23(b) dargestelltes
Bild-Dekodiergerät 25 wird
zum Dekodieren des kodierten Bildsignals Et verwendet. Das in MPEG2
bearbeitete digitale Bildsignal St ist ein Rechteck-Bildsignal,
das ein Leuchtdichtesignal und ein Farbdifferenzsignal zur Farbdarstellung
(Gradationsdarstellung) sowie Informationen umfasst, die die horizontale
und vertikale Größe eines
Displaybildes (einen Rahmen) anzeigen. Das Bild-Kodiergerät 20 umfasst
eine Informationsquellen-Kodierer 20a,
durch den das digitale Bildsignal (Rechteck-Bildsignal) St einer
Informationsquellen-Kodierung unterworfen wird, und einen Längenvariant-Kodierer 20b,
der die Ausgabedaten aus dem Kodierer 20a längenvariant
kodiert, um ein kodiertes Bildsignal (kodiertes Pixelwertsignal
Et) zu erzeugen. Das Bild-Dekodiergerät 25 umfasst einen
Längenvariant-Dekoder 25b,
der das kodierte Bildsignal Et längenvariant
dekodiert, und einen Informationsquellen-Dekoder 25a, der
für die
Ausgabedaten des Dekoders 25b eine Informationsquellen-Dekodierung ausführt, um
ein dekodiertes Bildsignal (dekodiertes Pixelwertsignal) Dt zu erzeugen.
-
Der Informationsquellen-Kodierer 20a umfasst
einen DCT-Prozessor 21, der an jedem von mehreren Blöcken, in
die das Displaybild (ein Rahmen) unterteilt ist, eine DCT (Diskrete
Kosinus-Transformation) ausführt,
und einen Quantisierer 22, der die Ausgabedaten vom DCT-Prozessor 21 quantisiert.
Der Informationsquellen-Dekoder 25a umfasst einen Invers-Quantisierer 26,
der die Ausgabedaten vom Längenvariant-Dekoder 25b invers quantisiert,
und einen IDCT-Prozessor 27, welcher an den Ausgabedaten
des Dekoders 25b eine Umkehr-DCT ausführt. Wie in 23(c) dargestellt ist, enthält ein zu
einem Displaybild gehörendes
kodiertes Bildsignal 700a (Et) am Anfang ein 32-Bit-Synchronsignal 701;
einen auf das Signal 701 folgenden Datenkopf 703 und
kodierte Pixelwert-Bitströme
(kodierte Textur-Bitströme) 71C1, 71C2, 71C3,
..., die jeweils zu den Blöcken
C1, C2, C3, ... gehören,
in die das Displaybild unterteilt ist. Die kodierten Textur-Bitströme 71C1, 71C2 und 71C3 enthalten
jeweils zugeordnete 5-Bit-Quantisierungsskalen 704, 707 und 710,
längenvariante
Textur-Bewegungsvektoren (BV) 705, 708 und 711 sowie
längenvariante
Textur-DCT-Koeffizienten 706, 709 und 712.
-
In den letzten Jahren wurde ein auf
dem individuellen Objekt basierendes Verfahren zur Kompressionskodierung
und zur Übertragung
eines Bildsignals in die praktische Nutzung überführt. Genauer gesagt wird ein
Bild, das zu einem Displaybild gehört und aus mehreren Objekten
besteht, in einer objektweisen Form kompressiv kodiert und übermittelt,
wodurch das Daten-Kompressionsverhältnis erhöht und eine separate Dekodierung/Reproduktion
der Objekte ermöglicht
wird. In diesem Verfahren werden auf der Reproduktionsseite die
kodierten, zu den jeweiligen Objekten gehörenden Bildsignale dekodiert
und reproduziert, und die reproduzierten Bildsignale werden zusammengesetzt,
um ein Bild wiederzugeben, das zu einem Displaybild korrespondiert.
Dieses Objekt-zu-Objekt-Kodieren erlaubt dem Nutzer, Bilder von
darzustellenden Objekten frei zu kombinieren, wodurch die Bearbeitung
eines Films erleichtert wird. Außerdem ist es bei diesem Verfahren
in Abhängigkeit
von der Auslastung der Übertragungsstrecke, der
Leistungsfähigkeit
des Wiedergabegeräts
und den Wünschen
des Betrachters möglich,
einen Film wiederzugeben, ohne die Bilder von relativ unwichtigen
Objekten zu reproduzieren. Mit anderen Worten wird eine Skalierbarkeit
in Objekteinheiten, d. h. ein Wechsel in der Kontraktionsskala bei
der Bilddarstellung fürjedes
Objekt, erreicht.
-
Da die entsprechenden Objekte unterschiedliche
Formen aufweisen, wird beim Objekt-zu-Objekt-Kompressionskodieren
eines Bildsignals so vorgegangen, dass ein Bildsignal eines Bildes
beliebiger Form (im Weiteren als Beliebigform-Bildsignal bezeichnet)
kompressionskodiert wird. Das Beliebigform-Bildsignal umfasst ein
Textursignal (Pixelwertsignal), das zur Farbdarstellung eines Objekts
(Gradationsdarstellung) dient und ein Leuchtdichtesignal sowie ein
Farbdifferenzsignal enthält,
und ein Signal, das die Form eines Bildes wiedergibt. Das Formsignal
zeigt für
jedes Pixel an, ob es als eine Komponente eines Abbildungsbereiches
außerhalb
oder innerhalb des Objekts liegt, und es wird durch eine Binärziffer
ausgedrückt.
-
Ferner gibt es den Fall, dass das
Beliebigform-Bildsignal zusätzlich
zum Textursignal und zum Formsignal Transparenz-Informationen umfasst,
welche die Transparenz eines Objekts kennzeichnen, wenn das Objekt
als Vordergrundbild vor einem Hintergrundbild angeordnet ist. Die
Transparenz-Informationen werden gewöhnlich durch ein mehrwertiges
Transparenzsignal mit mindestens drei Bits ausgedrückt. Eine
Kombination des binären
Formsignals (binäres
Transparenzsignal) und des mehrwertigen Transparenzsignals wird
als ein Transparenzsignal bezeichnet. Das mehrwertige Transparenzsignal
im Transparenzsignal wird genau gleich wie ein Textursignal im nachfolgenden
Kodierungsprozess behandelt.
-
Wenn ein Beliebigform-Bildsignal,
das sowohl ein Textursignal als auch ein binäres Formsignal umfasst, kodiert
wird, dann wird zunächst
das Formsignal und danach das Textursignal kodiert. In MPEG4 werden
Kodierung, Übertragung
und Dekodierung eines solchen Beliebigform-Bildsignals standardisiert,
und 24(a) ist ein Blockschema
zur Darstellung eines Bild-Kodiergeräts, das einen Kodierungsprozess
ausführt,
der gegenwärtig
gerade als MPEG4 standardisiert wird.
-
In 24(a) bezeichnet
die Bezugsziffer 200a ein Bild-Kodiergerät, welches
ein Beliebigform-Bildsignal Sp erfasst, das zu je einem von mehreren
Objekten gehört,
aus denen ein Displaybild – entsprechend
einem Ausgangs-Videosignal Sv einer Kamera oder eines Bildaufzeichnungs/-wiedergabe-Gerätes (VTR) – besteht,
und welches das Beliebigform-Bildsignal kodiert.
-
Das Bild-Kodiergerät 200a enthält einen Chroma-Key-Prozessor 201,
der am Vidosignal Sv einen Chroma-Key-Prozess wie folgt ausführt. Zunächst trennt
der Chroma-Key-Prozessor 201 ein
Beliebigform-Bildsignal, das zu jedem Objekt gehört, von einem Hintergrund-Bildsignal
ab und erhält
ein Formsignal Spk, das die Form des Objekts als eine Binärinformation
darstellt, und ein Textursignal (Pixelwertsignal) Spt für die Farbdarstellung
des Objekts, das ein Leuchtdichtesignal und ein Farbdifferenzsignal
umfasst. Dann gibt der Chroma-Key-Prozessor 201 die Signale
Spk und Spt für
jeden aus einer Anzahl von Blöcken
aus, in die ein Darstellungsgebiet entsprechend den zugehörigen Objekten
auf dem Displaybild unterteilt ist. Bei der Ausgabe der Signale
Spk und Spt gibt der Chroma-Key-Prozessor 201 ein
Schalttaktsignal Ts aus, das den Zeitpunkt des Umschaltens zwischen
dem Formsignal Spk und dem Textursignal Spt angibt. Außerdem enthält das Bild-Kodiergerät 200a einen
arithmetischen Kodierer 120a, der das Formsignal Spk blockweise
durch arithmetisches Kodieren kodiert (vgl. JBIG); einen Informationsquellen-Kodierer 130a,
der blockweise eine DCT und eine Quantisierung des Texursignals Spt
ausführt;
und einen Längenvariant-Kodierer 139, der
das längenvariante
Kodieren der Ausgabedaten vom Informationsquellen-Kodierer 130a ausführt.
-
Außerdem enthält das Bild-Kodiergerät 200a einen
Schalter 202, der in Abhängigkeit von einem Schalttaktsignal
Ts den Ausgang des Chroma-Key-Prozessors 201 mit dem Eingang
des arithmetischen Kodierers 120a oder mit dem Eingang
des Informationsquellen-Kodierers 130a verbindet;
und einen Multiplexer 150, der einen vom arithmetischen Kodierer 120a ausgegebenen
kodierten Form-Bitstrom Epk und einen vom Längenvariant-Kodierer 139 ausgegebenen
kodierten Textur-Bitstrom Ept mit anderen benötigten Signalen multiplext.
Wie in 24(c) dargestellt
ist, wird vom Multiplexer 150 ein kodiertes Beliebigformsignal
Ep (500a) ausgegeben, in dem kodierte Form-Bitströme (Epk) 51A1,
51A2 und 51A3,
kodierte Textur-Bitströme
(Ept) 52A1, 52A2, und 52A3 sowie andere
benötigte
Signale in vorgeschriebener Anordnung zusammengestellt sind.
-
Der oben dargestellte arithmetische
Kodierungsprozess ist in ein Verfahren zur Übermittlung eines Fax-Signals,
wie z. B. MMR oder JBIG, übernommen
worden, und der oben beschriebene DCT-Prozess wird im MPEG-Standard
eingesetzt. Wie in 24(c) dargestellt
ist, bestehen die kodierten Daten eines jeden Blocks A1, A2 und
A3 aus dem kodierten Form-Bitstrom Epk und dem kodierten Textur-Bitstrom
Ept.
-
In dem so konstruierten Kodiergerät 200a wird
das Videosignal Sv durch den Chroma-Key-Prozessor 201 bearbeitet,
und vom Chroma-Key-Prozessor 201 wird ein zu einem jeden
Objekt gehörendes
Beliebigform-Bildsignal Sp ausgegeben. Das in dem Beliebigform-Bildsignal
Sp enthaltene Formsignal Spk wird über den vom Schalttaktsignal
Ts gesteuerten Schalter 202 in den arithmetischen Kodierer 120a eingegeben,
durch den Kodierer 120a kodiert, und als ein kodierter
Form-Bitstrom Epk zum Multiplexer 150 hin ausgegeben. Andererseits
wird das im Beliebigform-Bildsignal Sp enthaltene Textursignal Spt über den
vom Schalttaktsignal Ts gesteuerten Schalter 202 in den
Informationsquellen-Kodierer 130a eingegeben,
im Kodierer 130a einer DCT und einer Quantisierung unterworfen
und als ein kodierter Textur-Bitstrom Ept zum Multiplexer 150 hin ausgegeben.
Das Kodieren des Formsignals Spk und das Kodieren des Textursignals
Spt erfolgen blockweise.
-
Im Multiplexer 150 werden
der kodierte Form-Bitstrom Epk, der kodierte Textur-Bitstrom Ept und
andere erforderliche Signale in der vorgeschriebenen Anordnung zusammengestellt,
und diese Ströme
und Signale werden vom Multiplexer 150 als ein kodiertes
Beliebigformsignal Ep ausgegeben.
-
Das in 24(b) dargestellte
Bild-Dekodiergerät 200b wird
zur Dekodierung des Beliebigformsignals Ep verwendet, das vom Bild-Kodiergerät 200a kodiert
wurde.
-
Das Bild-Dekodiergerät 200b umfasst:
einen Datenanalysator 160, der das kodierte Beliebigformsignal
Ep analysiert und ein Steuersignal Swb ausgibt; einen arithmetischen
Dekoder 170a, der eine blockweise arithmetisches Dekodierung
des im kodierten Beliebigformsignal Ep enthaltenen kodierten Form-Bitstroms
Epk ausführt
und ein Abschlusszeitsignal Te erzeugt, wenn die arithmetische Dekodierung
eines Block beendet ist; einen Informationsquellen-Dekoder 180a,
welcher an dem kodierten Textur-Bitstrom Ept, der im kodierten Beliebigformsignal Ep
enthalten ist, die Informationsquellen-Dekodierung, d. h. die Umkehr-DCT
und die inverse Quantisierung, ausführt; einen Schalter 101b,
der das vom Datenanalysator 160 ausgegebene kodierte Beliebigformsignal
Ep in Abhängigkeit
vom Schaltsteuersignal SWb und dem Abschlusszeitsignal Te entweder
an den arithmetischen Dekoder 170a oder den Informationsquellen-Dekoder 180a ausgibt;
und einen Synthesizer
190, der eine Synthese der Ausgabedaten
Dpk und Dpt von den Dekodern 170a und 180a ausführt und
das synthetisierte Signal als ein dekodiertes Beliebigformsignal
Dp ausgibt.
-
In dem so aufgebauten Bild-Dekodiergerät 200b analysiert
der Datenanalysator 160 beim Eingang des kodierten Beliebigformsignals
Ep die in diesem Signal enthaltenen Informationen und gibt dann das
Steuersignal SWb an den Schalter 101b aus, wenn er das
letzte Bit des Textur-Bitstroms Ept auffindet. In Reaktion auf das
Steuersignal SWb leitet der Schalter 101b die Ausgabedaten
des Datenanalysators 160 an den arithmetischen Dekoder 170a weiter. Der
arithmetische Dekoder 170a dekodiert den kodierten Form-Bitstrom
Epk und gibt ein Abschlusszeitsignal Te aus, wenn die Dekodierung
des zu einem jeden Block gehörenden
kodierten Form-Bitstroms Epk abgeschlossen ist. Bei der Eingabe
des Abschlusszeitsignals Te in den Datenanalysator 160 gibt
der Datenanalysator 160 das Steuersignal SWb an den Schalter 101b aus,
und der Schalter 101b verbindet den Ausgang des Datenanalysators 160 mit
dem Informationsquellen-Dekoder 180a. Der Informationsquellen-Dekoder 180a dekodiert
einen Block des im kodierten Beliebigformsignal Ep enthaltenen kodierten
Textursignals Ept. Der Synthesizer 190 führt eine
Synthese der Ausgabedaten des arithmetischen Dekoders 170a mit
den Ausgabedaten des Informationsquellen-Dekoders 180a aus
und gibt das dekodierte Beliebigformsignal Dp als ein reproduziertes
Signal aus. Wenn der oben erwähnte
Dekodierungsprozess des zu einem Objekt gehörenden kodierten Beliebigformsignals
Ep abgeschlossen und so das zum Objekt gehörende dekodierte Beliebigformsignals
Dp erzeugt ist, dann ist die Bildwiedergabe des Objekts möglich.
-
Obwohl mit Bezug auf die 24(a)–24(c) keine
Beschreibung der Bearbeitung eines Beliebigform-Bildsignals gegeben
wird, das ein mehrwertiges Transparenzsignals (Beliebigform-Bildsignal
mit Transparenz-Informationen) enthält, erfolgt die Bearbeitung
des mehrwertigen Transparenzsignals in derselben Weise wie die des
Textursignals (Pixelwertsignals), wenn das Beliebigform-Bildsignal
ein mehrwertiges Transparenzsignal enthält.
-
Wie oben dargestellt wurde, wird
in dem konventionellen Verfahren zur Kodierung eines Bildsignals
das in JBIG oder ähnlichen
Standards verwendete arithmetische Kodierungsverfahren für die Kodierung
eines binären
Bildsignals, d. h. eines binären Formsignals,
eingesetzt, während
das in MPEG2 oder ähnlichen
Standards verwendete Informationsquellen-Kodierungsverfahren für die Kodierung
eines digitalen Bildsignals zur Farbdarstellung eines Bildes, d.
h. eines Textursignals, eingesetzt wird. Ferner wird das Kodierungsverfahren
von MPEG4, d. h. eine Kombination von arithmetischer und Informationsquellen-Kodierung,
zur Kodierung eines Bildsignals verwendet, das ein binäres Formsignal
und ein Textursignal enthält.
-
Es ist selbstverständlich,
dass zur Dekodierung von kodierten Signalen, die mit unterschiedlichen
Kodierungsverfahren erhalten wurden, die den jeweils verwendeten
Kodierungsverfahren entsprechenden unterschiedlichen Dekodierungsverfahren eingesetzt
werden sollten. Mit anderen Worten müssen unterschiedliche Datenanalyseverfahren
im Dekodierungsprozess der kodierten Signale verwendet werden, weil
im konventionellen Kodierungsprozess unterschiedliche Kodierungsverfahren
zur Kodierung unterschiedlicher Arten von Bildsignalen eingesetzt werden.
-
Das auf MPEG4 aufbauende Bild-Dekodiergerät kann zwar
ein beliebiges kodiertes Signal aus der Gruppe der binären Bildsignale
(JBIG), digitalen Bildsignale (MPEG2) und Beliebigform-Bildsignale (MPEG4)
dekodieren, weist aber die folgenden Mängel auf.
-
In einem durch blockweise Kodierung
eines Beliebigform-Bildsignals erhaltenen kodierten Beliebigformsignal
sind die zum jeweiligen Block gehörenden kodierten Form-Bitströme und die
zum jeweiligen Blöcken
gehörenden
Textur-Bitströme
alternierend angeordnet. Andererseits sind in einem kodierten Binärsignal,
das durch blockweise Kodierung eines binären Bildsignals erhalten wurde,
die zu den jeweiligen Blöcken
gehörenden
kodierten Form-Bitströme nacheinander
angeordnet. Deshalb lässt
sich beim Datenanalyseverfahren (Datenanalysator) gemäß MPEG4
das oben beschriebene Steuersignal SWb nicht ausgehend von einer
Analyse des kodierten binären
Bildsignals, das keinen kodierten Textur-Bitstrom enthält, erzeugen,
so dass die kodierten Form-Bitströme zu den jeweiligen Blöcken im
kodierten Binärsignal
nicht nacheinander an den arithmetischen Dekoder 170a übergeben
werden können.
Genauer gesagt wird im Bild-Dekodiergerät 200b nach Abschluss
der Bearbeitung eines zu einem der Blöcke gehörenden kodierten Form-Bitstroms das Abschlusszeitsignal
Te vom arithmetischen Dekoder 170a an den Schalter 101b übertragen,
wonach der Schalter 101b den Bitstrom vom Datenanalysator 160 an
den Informationsquellen-Dekoder 180a übergibt. Da jedoch kein kodierter
Textur-Bitstrom im kodierten Binärsignal
enthalten ist, kann der Datenanalysator 160 nicht das Steuersignal
Swb erzeugen, um den Schalter 101b so zu steuern, dass
der Bitstrom in den arithmetischen Dekoder 170a eingegeben wird,
und es wird ein kodierter Form-Bitstrom, der zum nächsten Block
gehört,
in den Informationsquellen-Dekoder 180a eingegeben.
-
Um eine Kodierung des binären Bildsignals mit
dem üblichen
Verfahren zu unterstützen,
wird somit ein dem Block zugeordneter Blind-Textur-Bitstrom im Anschluss
an den Form-Bitstrom eines jeden Blocks hinzugefügt, wodurch offensichtlich
die Datenstruktur des kodierten Binärsignals völlig gleich der Datenstruktur
des kodierten Beliebigformsignals wird. In diesem Falle kann das
kodierte Binärsignal durch
das auf MPEG4 aufbauende Datenanalyseverfahren analysiert und durch
den auf MPEG4 aufbauenden Bild-Dekodierungsprozess
dekodiert werden.
-
Da jedoch bei der Ausgabe des kodierten
binären
Bildsignals der kodierte Blind-Textur-Bitstrom zum
kodierten Form-Bitstrom hinzugefügt
wird, wird beim Kodierungsprozess die Bitzahl nicht ausgenutzt,
was zu einer Abnahme der Kodierungseftizienz führt.
-
In dem auf MPEG4 aufbauenden Dekodierungsprozess
ist ein kodiertes Bildsignal (kodiertes Pixelwertsignal), das durch
Kodierung eines nur ein Textursignal umfassenden digitalen Bildsignals (Rechteck-Bildsignal)
gemäß MPEG2
erhalten wurde, ebenso dekodierbar wie ein kodiertes Beliebigformsignal,
das durch Kodieren eines Beliebigform-Bildsignals erhalten wurde. Der Grund
ist der folgende. Da der Anfangs- und der Endpunkt des zu jedem
Block gehörenden
kodierten Textur-Bitstroms detektierbar sind, kann in einem kodierten
Bildsignal, das kodierte Textur-Bitströme enthält, der Schalter 101b durch
das Steuersignal SWb so gesteuert werden, dass immer der kodierte
Textur-Bitstrom in den Informationsquellen-Dekoder 180b eingegeben
wird.
-
Ferner könnten bei dem Dekodierungsprozess,
der zu dem auf MPEG4 aufbauenden Kodierungsprozess gehört, die
zu je einem Block gehörenden
kodierten Form- und Textur-Bitströme sich
nicht beide in einer im Voraus festgelegten Wiedergabezeit dekodieren
lassen, wenn bei der Dekodierung eines kodierten Beliebigformsignals,
das durch Kodieren eines Beliebigform-Bildsignals erhalten wurde, eine
Prozessüberlastung
auftritt, so dass die Bildbewegung bei der Wiedergabe nicht ausreichend
stetig ist oder abbricht.
-
Das Dokument „The MPEG-4 video standard verification
mode" in IEEE transactions
on circuits and systems for video technology, US, IEEE, Inc. New
York, Bd. 7, Nr. 1, 1. Februar 1997 (1997-02-01 ), S. 19–31, XP000678877,
ISSN: 1051–8215
von T. Sikora bezieht sich auf eine Kodierungs-/Dekodierungstechnik
eines Bildsignals und legt offen, dass die mehreren in einem Bildsignal
enthaltenen Objekte in jeweils mehrere VOPs unterteilt werden, dass die
betreffenden VOPs einzeln kodiert werden und dass das kodierte Bildsignal
einschließlich
der betreffenden kodierten VOPs empfangen und dekodiert wird. Die
betreffenden VOPs enthalten Form-, Bewegungs- und Texturinformationen.
Zu Beginn wird die Kodierung der in den betreffenden VOPs enthaltenen Forminformationen,
dann die Kodierung der Bewegungs- und Texturinformationen ausgeführt, und
das bearbeitete Bildsignal enthält
alle drei Informationstypen. Zwei Kodierungsverfahren für Binärinformationen
und Grauskalen-Forminformationen sind verfügbar. Die Forminformationen
enthalten binäre
Forminformationen zur Anzeige der binären Formsignaldaten und Grauskalen-Forminformationen,
welche mehrwertige Formsignaldaten einschließlich Transparenzinformationen
sind.
-
Die Patentschrift EP-A-0707427 legt
die Kodierung eines Bildsignals mit einer beliebigen Form unter
Verwendung zweier Wege, d. h. der Formsignaldaten und der Pixelwertsignaldaten,
offen. Deshalb hat es Strukturen einer Formkodiereinheit und einer Pixelwertkodiereinheit.
Zunächst
wird die Kodierung eines Formsignals ausgeführt. Im ersten Rahmen wird
eine Intrarahmen-Kodierung ausgeführt, da es dort kein Bild gibt,
auf das Bezug zu nehmen ist. Ferner ist es offensichtlich, dass
eine zum Pixelwertsignal gehörende
kodierte Bitsequenz erzeugt und dass Formsignal sowie Pixelwertsignal
kodiert wurden, wenn bei der Modenprüfung die Mode als eine andere
als die Intrarahmen-Kodierungsmode erkannt wurde, weil ein Bewegungsvektor
des Pixelwertsignals kodiert wurde.
-
Das Dokument „Object-oriented analysis-synthesis,
coding of moving images signal processing", IMAGE COMMUNICATION, NL, ELSEVIER
SCIENCE PUBLISHERS, AMSTERDAM, Bd. 1, Nr. 2, 1.Oktober 1989 (1989-10-01
), S. 117–138. XP000234864,
ISSN: 0923–5965
von H. G. MUSMAN et al. legt ein Verfahren zur Ausführung des
Kodierens/Dekodierens offen, wobei als Parameter für jedes
Objekt Informationen bezüglich
Form, Farbe und Bewegung zugewiesen werden.
-
Darstellung
der Erfindung
-
Die vorliegende Erfindung betrifft
somit ein Bild-Dekodierungsverfahren und ein zugehöriges Bild-Dekodiergerät, wie sie
in den beigefügten
Ansprüchen
definiert sind.
-
Kurze Beschreibung der
Zeichnungen
-
1(a) und 1(b) sind schematische Darstellungen
einer Datenstruktur eines kodierten Beliebigformsignals bzw. einer
Datenstruktur eines kodierten Binärsignals, die gemäß einer
ersten Ausführungsform,
die nicht Teil der Erfindung ist, Datenstrukturen zur Bildübertragung
sind.
-
2(a) und 2(b) sind schematische Darstellungen
einer Datenstruktur eines kodierten Beliebigformsignals bzw. einer
Datenstruktur eines kodierten Binärsignals, die gemäß einer
Modifikation der ersten Ausführungsform
Datenstrukturen zur Bildübertragung
sind.
-
3 ist
ein Blockschema zur Darstellung eines Bild-Kodiergeräts gemäß einer
zweiten Ausführungsform,
die nicht Teil der Erfindung ist.
-
4 ist
ein Flussdiagramm zur Erläuterung eines
Kodierungsprozesses durch das Bild-Kodiergerät gemäß der zweiten Ausführungsform.
-
5 ist
ein Blockschema zur Darstellung eines Bild-Dekodiergeräts gemäß einer
dritten, dem Verständnis
der Erfindung dienlichen Ausführungsform.
-
6 ist
ein Flussdiagramm zur Erläuterung eines
Dekodierungsprozesses durch das Bild-Dekodiergerät gemäß der dritten Ausführungsform.
-
7(a) ist
ein Blockschema zur Darstellung einer im Bild-Kodiergerät enthaltenen
Bild-Eingabeeinheit gemäß der zweiten
Ausführungsform,
und 7(b) ist ein Blockschema zur
Darstellung eines Datenanalysators, der im Bild-Dekodiergerät gemäß der dritten
Ausführungsform
enthalten ist.
-
8 ist
ein Blockschema zur Darstellung eines Bild-Dekodiergeräts gemäß einer
vierten Ausführungsform,
die kein Teil der Erfindung ist.
-
9 ist
ein Blockschema zur Darstellung eines Bild-Dekodiergeräts gemäß einer
fünften
Ausführungsform,
die kein Teil der Erfindung ist.
-
10(a), 10(b) und 10(c) sind schematische Darstellungen,
die Datenstrukturen von je einem kodierten Beliebigformsignal, kodierten
Binärsignal
und kodierten Rechtecksignal zeigen, welche gemäß einer sechsten Ausführungsform
der Erfindung Datenstrukturen zur Bildübertragung sind.
-
11 ist
ein Blockschema zur Darstellung eines Bild-Dekodiergeräts gemäß einer
siebenten, dem Verständnis
der Erfindung dienlichen Ausführungsform.
-
12 ist
ein Flussdiagramm zur Erläuterung
eines Dekodierungsprozesses durch das Bild-Dekodiergerät gemäß der siebenten
Ausführungsform.
-
13(a) und 13(b) sind schematische Darstellungen,
die eine Datenstruktur eines kodierten Beliebigformsignals bzw.
eine Datenstruktur eines kodierten Binärsignals zeigen, die Datenstrukturen zur
Bildübertragung
gemäß einer
achten Ausführungsform
der Erfindung sind.
-
14(a) und 14(b) sind schematische Darstellungen,
die eine Datenstruktur eines kodierten Rechtecksignals bzw. eine
Datenstruktur eines kodierten Beliebigformsignals mit Transparenzinformationen
zeigen, die Datenstrukturen zur Bildübertragung gemäß der achten
Ausführungsform
sind.
-
15 ist
ein Blockschema zur Darstellung eines Bild-Dekodiergeräts gemäß einer
neunten Ausführungsform
der Erfindung.
-
16 ist
ein Flussdiagramm zur Erläuterung
eines Dekodierungsprozesses durch das Bild-Dekodiergerät gemäß der neunten
Ausführungsform.
-
17(a), 17(b) und 17(c) sind jeweils Datenstrukturen eines
kodierten Beliebigformsignals, kodierten Binärsignals und kodierten Rechtecksignals,
die Datenstrukturen zur Bildübertragung
gemäß einer
zehnten Ausführungsform
sind, die kein Teil der Erfindung ist.
-
18(a) und 18(b) sind schematische Darstellungen,
die eine Datenstruktur eines kodierten Beliebigformsignals mit Transparenzinformationen bzw.
eine Datenstruktur eines kodierten Transparenzsignals zeigen, die
Datenstrukturen zur Bildübertragung
gemäß der zehnten
Ausführungsform
sind.
-
19 ist
ein Blockschema zur Darstellung eines Bild-Dekodiergeräts gemäß einer
elften Ausführungsform
der Erfindung.
-
20 ist
ein Flussdiagramm zur Erläuterung
eines Dekodierungsprozesses durch das Bild-Dekodiergerät gemäß der elften
Ausführungsform.
-
21(a)–21(c) sind schematische Darstellungen
zur Erläuterung
eines Datenspeichermediums (21(a), 21(b)), das ein Programm
zur Realisierung eines Bild-Kodiergeräts oder
eines Bild-Dekodiergeräts
nach einer der oben erwähnten
Ausführungsformen
enthält,
wobei ein Computersystem (21(c))
verwendet wird.
-
22(a) – 22(c) sind schematische Darstellungen
zur Erläuterung
eines Kommunikationssystems, in dem ein Datenkompressions-Kodierungsprozess
basierend auf JBIG verwendet wird, und genauer gesagt zeigen die 22(a) und 22(b) ein im System enthaltenes Bild-Kodiergerät bzw. Bild-Dekodiergerät, und die 22(c) zeigt eine im System
verwendete Datenstruktur eines kodierten Bildsignals.
-
23(a)–23(c) sind schematische Darstellungen
zur Erläuterung
eines Kommunikationssystems, in dem der Datenkompressions-Kodierungsprozess
basierend auf MPEG2 verwendet wird, und genauer gesagt zeigen die 23(a) und 23(b) ein im System enthaltenes Bild-Kodiergerät bzw. Bild-Dekodiergerät, und die 23(c) zeigt eine im System
verwendete Datenstruktur eines kodierten Bildsignals.
-
24(a)–24(c) sind schematische Darstellungen
zur Erläuterung
eines Kommunikationssystems, in dem der Datenkompressions-Kodierungsprozess
basierend auf MPEG4 verwendet wird, und genauer gesagt zeigen die 24(a) und 24(b) ein im System enthaltenes Bild-Kodiergerät bzw. Bild-Dekodiergerät, und die 24(c) zeigt eine im System
verwendete Datenstruktur eines kodierten Bildsignals.
-
Ausführliche Beschreibung der bevorzugten
Ausführungsformen
-
[Ausführungsform 1]
-
Die 1(a) und 1(b) sind schematische Darstellungen,
die Datenstrukturen zur Bildübertragung
entsprechend einer ersten Ausführungsform zeigen. 1(a) zeigt eine Datenstruktur
eines kodierten Beliebigformsignals, das zu je einem von mehreren
Objekten gehört,
aus denen ein Displaybild besteht. Die Datenstruktur zur Bildübertragung
gemäß der ersten
Ausführungsform
wird in einem Kodierungs- und Dekodierungssystem verwendet, in dem
ein Beliebigform-Bildsignal kompressiv kodiert sowie übertragen
wird und das kodierte Signal schließlich dekodiert und wiedergegeben
wird. Das heißt,
dass in diesem System Bild-Kodierungsverfahren und -gerät vor allem
dafür ausgelegt
sind, einen Kodierungsprozess für
das Beliebigform-Bildsignal auszuführen, während das Bild-Dekodierungsverfahren
und -gerät
vor allem dafür
ausgelegt sind, einen Dekodierungsprozess für das kodierte Beliebigformsignal
auszuführen.
-
In 1(a) bezeichnet
die Bezugsziffer 500 ein kodiertes Beliebigformsignal,
das durch Kodieren eines Beliebigform-Bildsignals erhalten wurde,
welches zu je einem von mehreren Objekten gehört, aus denen sich ein Bild
eines Displaybildes zusammensetzt. Das kodierte Beliebigformsignal 500 umfasst ein
32-Bit-Synchronsignal 501 am Anfang, einen auf das Signal 501 folgenden
1-Bit-Form-Identifikator (Bild-Identifikator) 502 und einen
auf den Identifikator 502 folgenden zusätzlichen Datenkopf 503.
In der Figur wird der Form-Identifikator 502 durch „SID" gekennzeichnet.
-
Im Weiteren umfasst das kodierte
Formsignal 500 kodierte Form-Bitströme 51A, die durch
Kodieren eines Formsignals erhalten wurden, das als ein Bestandteil
des Beliebigform-Bildsignals die Form eines jeden Objekts darstellt,
und kodierte Textur-Bitströme (kodierte
Pixelwert-Bitströme) 52A,
die durch Kodieren eines Textursignals (Pixelwertsignals) erhalten
wurden, das als ein Bestandteil des Beliebigform-Bildsignals ein
Leuchtdichtesignal und ein Farbdifferenzsignal zur Farbdarstellung
eines jeden Objekts enthält.
Im Einzelnen sind im kodierten Beliebigformsignal 500 für jeden
der Blöcke,
in die eine Objektregion, welche ein Objekt auf einem Displaybild
umfasst, unterteilt ist, ein kodierter Form-Bitstrom 51a und
ein kodierter Textur-Bitstrom 52A in dieser Reihenfolge
angeordnet.
-
Genauer gesagt sind anschließend an
den Datenkopf 503 ein kodierter Form-Bitstrom 51A1 sowie ein kodierter
Textur-Bitstrom 52A1, die zu einem Block A1 gehören, ein
kodierter Form-Bitstrom 51A2 sowie ein kodierter Textur-Bitstrom 52A2,
die zu einem Block A2 gehören,
und ein kodierter Form-Bitstrom 51A3 sowie ein kodierter
Textur-Bitstrom 52A3, die zu einem Block A3 gehören, angeordnet.
-
Im Weiteren umfassen die kodierten Form-Bitströme 51A1, 51A2 und 51A3 jeweils
längenvariant
kodierte Daten 504, 509 und 514, die
zu Form-Bewegungsvektoren (in 1(a) „Form-BV") gehören und
längenvariant
kodierte Daten 505, 510 und 515, die
zu binären
Formsignalen gehören,
von denen jedes anzeigt, ob Pixel im Block innerhalb des Objekts
oder außerhalb
des Objekts liegen (in der Figur „Formdaten").
-
Die kodierten Textur-Bitströme 52A1, 52A2 und 52A3 umfassen
jeweils 5-Bit-kodierte Daten 506, 511 und 516,
die zu den Quantisierungsskalen gehören (in 1(a) „Quantisierungsskala"), längenvariant
kodierte Daten 507, 512 und 517, die
zu den Textur-Bewegungsvektoren
gehören
(in der Figur „Textur-BV") und längenvariant
kodierte Daten 508, 513 und 518, die
zu quantisierten Signalen gehören,
welche aus dem Textursignal durch Ausführen von DCT und Quantisierung
erhalten wurden (in der Figur „Textur-DCT-Koeffizienten").
-
Das Synchronsignal 501 ist
ein Signal, das den Kopf eines zu einem Objekt gehörenden kodierten
Beliebigformsignals anzeigt, und es ist ein einmalig kodiertes Signal.
Der Form-Identifikator (SID) 502 ist ein Signal zur Anzeige,
ob sowohl kodierte Form-Bitströme als auch
als auch kodierte Textur-Bitströme
im kodierten Bildsignal enthalten sind oder nicht. Ist der Wert
des Form-Identifikators (SID) gleich 0,dann wird angezeigt, dass sowohl
kodierte Form-Bitströme
als auch kodierte Textur-Bitströme im
kodierten Bildsignal vorliegen. Bei SID = 1 zeigt der Form-Identifikator
an, dass nur die kodierten Form-Bitströme im kodierten Signal vorliegen.
Deshalb ist in der Datenstruktur von 1(a) der Form-Identifikator (SID) 502 gleich
0. Der Datenkopf 503 enthält Informationen z. B. über den
Wiedergabezeitpunkt des Bildes eines zugehörigen Objekts, zum Attribut
des Bildes und zum Vorhersagemodus für die Kodierung. Diese Daten
haben jedoch keinen Bezug zur vorliegenden Erfindung und erfordern
deshalb keine ausführliche
Beschreibung.
-
Der Form-BV besteht aus den kodierten
Daten eines Bewegungsvektors, der die Bewegung eines Bildes in einem
Block zwischen dem vorliegenden und dem vorhergehenden Rahmen darstellt
und zur Vorhersage eines Formsignals eines bestimmten Blocks im
vorliegenden Rahmen aus dem Formsignal des entsprechenden Blocks
im vorhergehenden Rahmen verwendet wird. Ferner werden die Formdaten
durch arithmetisches Kodieren eines Formsignals erhalten, und die
Quantisierungsskala ist ein Parameter für das inverse Quantisieren
von DCT-Koeffizienten, die aus einem Textursignal mittels DCT und Quantisierung
erhalten werden. Der Textur-BV besteht aus den kodierten Daten eines
Textur-Bewegungsvektors, der die Bewegung eines Bildes in einem
Block zwischen dem vorliegenden und dem vorhergehenden Rahmen darstellt
und zur Vorhersage eines Textursignals im vorliegenden Rahmen aus
einem Textursignal im vorhergehenden Rahmen verwendet wird. Ferner
werden die Textur-DCT-Koefizienten durch längenvariante Kodierung des
quantisierten Textursignals erhalten.
-
Obwohl diese Daten in der Figur nicht
dargestellt sind, werden im kodierten Beliebigformsignal 500 vor
den Textur-DCT-Koeffizienten auch viele Nebeninformationen (Daten)
untergebracht, und diese Nebendaten erfordern manchmal eine große Anzahl von
Bits.
-
1(b) zeigt
eine Datenstruktur eines kodierten Binärsignals, das durch Kodieren
eines binären
Bildsignals erhalten wurde. Die Bezugsziffer 600 in 1(b) kennzeichnet ein kodiertes
Binärsignal, das
durch Kodieren eines binären
Bildsignals S2 erhalten wurde, welches die Bildinformation auf einem Displaybild
als ein Binärsignal
repräsentiert.
Das kodierte Binärsignal 600 enthält am Anfang
ein 32-Bit-Synchronsignal 601, einen auf das Synchronsignal 601 folgenden
1-Bit-Form-Identifikator 602 und einen auf den Form-Identifikator 602 folgenden zusätzlichen
Datenkopf 603. Im Weiteren enthält das kodierte Binärsignal 600 kodierte
Form-Bitströme 61B,
die durch Kodieren der Formsignale erhalten wurden, welche das binäre Bildsignal
S2 bilden. In 1(b) wird
der Form-Identifikator durch SID gekennzeichnet.
-
Im Einzelnen sind – entsprechend
den jeweiligen Blöcken,
in die das Displaybild unterteilt ist – die kodierten Form-Bitströme 61B im
kodierten binären Formsignal 600 nacheinander
angeordnet. Genauer gesagt sind die kodierten Form-Bitströme 61B1, 61B2,
61B3, 61B4, 61B5,
..., die jeweils den Blöcken B1,
B2, B3, B4, B5, ... zugeordnet sind, in dieser Reihenfolge angeordnet.
-
Im Weiteren enthalten die kodierten Form-Bitströme 61B1–61B5 längenvariant
kodierte Daten 604, 606, 608, 610 und 612,
die zu den Form-Bewegungsvektoren (in der Figur „Form-BV") gehören bzw. längenvariant kodierte Daten 605, 607, 609, 611 und 613,
die zu den Formsignalen gehören, welche
das Bild im Displaybild durch Binärsignale repräsentieren
(in der Figur „Formdaten").
-
Das Synchronsignal 601,
der Form-Identifikator (SID) 602 und der Datenkopf 603 sind
jeweils identisch mit dem Synchronsignal 501, dem Form-Identifikator
(SID) 502 und dem Datenkopf 503 im kodierten Beliebigformsignal 500,
und die Daten der Blöcke
B1–B5
... sind nur die kodierten Form-Bitströme. Da das kodierte Binärsignal 600 keine
kodierten Textur-Bitströme
enthält,
ist der Form-Identifikator (SID) 602 gleich 1.
-
In dieser ersten Ausführungsform
sind der Form-Identifikator (SID) 502 im kodierten Beliebigformsignal 500 und
der Form-Identifikator 602 im kodierten Binärsignal 600 für jeden
Rahmen jeweils in den kodierten Signalen 500 bzw. 600 angeordnet.
-
Wie in den 1(a) und 1(b) dargestellt,
ist die Bitzahl der kodierten Daten von Form- oder Textursignal
variabel, weil die zur Kodierung erforderliche Bitzahl je nach dem
Bild, das im Displaybild oder im Block des Displaybilds enthalten
ist, unterschiedlich ist. Deshalb ist es unmöglich, die Lage der Quantisierungsskala 506,
d. h. die Zahl der Bits zwischen dem Kopf der Formdaten 505 und
der Quantisierungsskala 506, vorherzusagen. Ferner kann
nicht ohne den Form-Identifikator 502 entschieden werden,
ob der kodierte Textur-Bitstrom 52A nach dem kodierten
Form-Bitstrom 51A angeordnet ist oder nicht. Deshalb ist
es bei einer Kodierung und Übertragung
des Formsignals ohne den Form-Identifikator unumgänglich,
einen kodierten Blind-Textur-Bitstrom zwischen die kodierten Form-Bitströme angrenzender
Blöcke
einzufügen,
aber das Einfügen
das kodierten Blind-Textur-Bitstroms
erhöht
die Bitzahl bei der Kodierung des Formsignals. Übrigens kann ein Form-Identifikator
auch am Kopf der gesamten Bildsequenz angeordnet werden, statt ihn
dem Datenkopf eines jeden Bildes zuzuordnen, oder er kann einer
Anzahl von Bildern zugeordnet werden.
-
In MPEG4 können außer dem Beliebigform-Bildsignal
und dem binären
Bildsignal Transparenz-Informationen verarbeitet werden, welche
die Transparenz eines jeden Pixels wiedergeben. Derartige Transparenz-Informationen
werden gewöhnlich durch
ein Signal von 3 oder mehr Bits ausgedrückt, und dieses kann in ein
Binärsignal
als Form-Information (binäres
Transparenzsignal) und ein mehrwertiges Transparenzsignal zerlegt
werden, das die Transparenz-Informationen unter Ausschluss der Form-Information
wiedergibt. In diesem Falle kann das mehrwertige Transparenzsignal
in der gleichen Weise wie ein Textursignal behandelt werden.
-
Im Weiteren wird ein Prozess zur
Kodierung eines Formsignals und eines Textursignals beschrieben,
wobei die Signale Komponenten eines Beliebigform-Bildsignals sind.
-
Zu Beginn wird mit Bezug auf ein
Formsignal eine Objektregion, die ein Objekt auf dem Displaybild umfasst,
in eine Anzahl von Blöcken
(Formblöcke) unterteilt,
und das Formsignal wird blockweise kodiert. In dieser ersten Ausführungsform
ist jeder Formblock ein Abbildungsbereich, der 16 × 16 Muster
(Pixel) umfasst, und ein zu jedem Block gehörendes Formsignal wird durch
das in JBIG verwendete arithmetische Kodierungsverfahren kodiert.
-
Mit Bezug auf ein Textursignal wird – wie oben
beschrieben – eine
Objektregion, die ein Objekt auf dem Displaybild enthält, in eine
Anzahl von Blöcken
(Texturblöcke)
unterteilt, und das Textursignal wird blockweise kompressiv kodiert.
In dieser ersten Ausführungsform
ist jeder Texturblock ein Abbildungsbereich, der 16 × 16 Muster
(Pixel) umfasst. Im kompressiven Kodierungsprozess werden DCT und Quantisierung
wie folgt ausgeführt.
Der Texturblock wird in vier Abbildungsbereiche (Unterblöcke) unterteilt,
von denen jeder 8 × 8
Muster (Pixel) umfasst, und für
das Textursignal werden DCT und Quantisierung – Unterblock auf Unterblock
folgend – ausgeführt. Dann
werden die vom oben beschriebenen Prozess gelieferten quantisierten
Signale längenvariant
kodiert, um kodierte Textur-Bitströme zu erzeugen.
-
Die so erzeugten kodierten Form-
und Textur-Bitströme
werden zusammen mit anderen benötigten
Signalen gemultiplext, wodurch ein kodiertes Beliebigformsignal 500 erzeugt
wird, das die in 1(a) dargestellte
Datenstruktur hat.
-
Im Weiteren ist ein Prozess zur Kodierung
eines Formsignals – als
eines Bestandteils eines binären
Bildsignals – in
JBIG nahezu identisch mit dem oben beschriebenen Signalkodierungsverfahren,
das für
MPEG4 eingesetzt wird.
-
Das heißt, ein Displaybild wird in
eine Anzahl von Blöcken
(Formblöcke)
unterteilt, und das Formsignal wird blockweise kodiert, wodurch
ein kodiertes Binärsignal 600 erzeugt
wird, das eine in 1(b) dargestellte
Datenstruktur aufweist. In dieser ersten Ausführungsform ist der Formblock
ein 16 × 16
Muster (Pixel) umfassender Abbildungsbereich. Ein zu jedem Formblock
zugehöriges
Formsignal wird mit dem in JBIG verwendeten arithmetischen Kodierungsverfahren
kodiert.
-
Wie oben beschrieben wurde, enthält in der ersten
Ausführungsform
das zu einem binären
Bildsignal gehörende
kodierte Binärsignal
die kodierten Form-Bitströme 61B,
die durch Kodieren des ein Binärinformations-Displaybild
repräsentierenden
Formsignals erhalten wurden, und den Form-Identifikator 602 für die Anzeige,
dass nur die kodierten Form-Bitströme als Wiedergabedaten enthalten
sind, so dass eine Analyse eines keine kodierten Textur-Bitströme enthaltenden
kodierten Binärsignals
durch Bezugnahme auf den Bild-Identifikator möglich ist, wobei ein Datenanalyseverfahren
verwendet wird, das für ein
kodiertes Signal geeignet ist, welches kodierte Textur-Bitströme enthält.
-
Genauer gesagt kann ein kodiertes
Signal eines binären
Bildsignals (kodiertes Binärsignal),
das nur ein Formsignal als Wiedergabeinformation enthält, unter
Verwendung eines Datenanalyseverfahrens analysiert werden, das für die Analyse
von einem kodierten Signal eines Beliebigform-Bildsignals (kodiertes
Beliebigformsignal) vorgesehen ist, das sowohl ein Formsignal als
auch Textursignal (Pixelwertsignal) enthält. Deshalb kann selbst dann,
wenn beim Kodieren des binären
Bildsignals nicht jedem kodierten Form-Bitstrom ein kodierter Blind-Pixelwert-Bitstrom
hinzugefügt
wird, der kodierte Form-Bitstrom des Binärsignals mit dem auf MPEG4 basierenden
Dekodierungsprozess dekodiert werden. Das heißt, sowohl das binäre Bildsignal
als auch das Beliebigform-Bildsignal können ohne eine Vergrößerung der
Anzahl der Bits im Kodierungsprozess mit Hilfe eines Bild-Dekodiergeräts dekodiert
werden, das einem einzigen Kodierungsverfahren angepasst ist.
-
Wie oben beschrieben wurde, verwendet
die erste Ausführungsform
das kodierte Beliebigformsignal 500 und das kodierte Binärsignal 600,
die durch eine Inter-Rahmen-Vorhersagekodierung
erhalten wurden, als ein kodiertes Beliebigformsignal bzw. ein kodiertes
Binärsignal.
Es braucht nicht betont zu werden, das ein mittels Intra-Rahmen-Kodierung erzeugtes
kodiertes Beliebigformsignal eine Datenstruktur aufweist, bei der
die Form- und Textur-Bewegungsvektoren aus dem kodierten Beliebigformsignal 500 ausgeschlossen
sind, während
ein mittels Intea-Rahmen-Kodierung erzeugtes kodiertes Binärsignal
eine Datenstruktur hat, bei der die Form-Bewegungsvektoren aus dem
kodierten Binärsignal 600 ausgeschlossen
sind.
-
Im Weiteren verwendet die erste Ausführungsform
das kodierte Beliebigformsignal 500, in dem für jeden
Block ein kodierter Form-Bitstrom und ein kodierter Textur-Bitstrom
vorhanden sind, und das kodierte Binärsignal 600, in dem
für jeden
Block ein kodierter Form-Bitstrom vorhanden ist, als ein kodiertes
Beliebigformsignal bzw. ein kodiertes Binärsignal. Jedoch ist ein kodiertes
Signal mit einer Datenstruktur zur Bildübertragung gemäß der Erfindung nicht
auf die in 1(a) und 1(b) dargestellten Strukturen
beschränkt.
-
Zum Beispiel kann ein kodiertes Beliebigformsignal 500b mit
einer in 2(a) dargestellten Datenstruktur
verwendet werden, wobei die Datenstruktur für jeden Rahmen ein Synchronsignal 501, einen
Form-Identifikator (SID) 502, einen zusätzlichen Datenkopf 503,
ein Formdatenteil 51 und ein Texturdatenteil 52 umfasst.
Ferner kann ein kodiertes Binärsignal 600b mit
einer in 2(b) dargestellten Datenstruktur
verwendet werden, wobei die Datenstruktur für jeden Rahmen ein Synchronsignal 601, einen
Form-Identifikator (SID) 602, einen zusätzlichen Datenkopf 603 und
ein Formdatenteil 61 umfasst.
-
Wie in 1(a) dargestellt
ist, wird der Formdatenteil 51 für einen Rahmen durch Sammeln
der zu den jeweiligen Blöcken
im kodierten Beliebigformsignal gehörenden Form- Bitströme gebildet. Wie in 1(a) dargestellt ist, wird
der Texturdatenteil 52 für einen Rahmen durch Sammeln
der zu den jeweiligen Blöcken
im kodierten Beliebigformsignal gehörenden Textur-Bitströme gebildet.
Ferner wird, wie in 1(b) dargestellt
ist, der Formdatenteil 61 für einen Rahmen durch Sammeln
der zu den jeweiligen Blöcken
im kodierten Binärsignal
gehörenden Form-Bitströme gebildet.
-
[Ausführungsform 2]
-
3 ist
ein Blockschema zur Darstellung eines Bild-Kodiergeräts nach
einer zweiten Ausführungsform.
Die Bezugsziffer 100a in 3 bezeichnet
ein Bild-Kodiergerät,
das ein kodiertes Bildsignal mit einer Datenstruktur zur Bildübertragung
gemäß der ersten
Ausführungsform
erzeugt. Dieses Gerät 100a ist
wie folgt aufgebaut. Wenn das Gerät 100a als ein Eingangs-Bildsignal
Sin ein binäres
Bildsignal S2 zur Darstellung eines Binärbildes von einem Scanner eines
Fax-Gerätes
empfängt,
dann gibt es ein in 1(b) dargestelltes
kodiertes Binärsignal (E2) 600 als
ein kodiertes Bildsignal Eo aus. Wenn das Gerät 100a aber als ein
Eingangs-Bildsignal Sin ein binäres
Bildsignal Sp von einer Videokamera oder einem Bildreproduktionsgerät empfängt, dann gibt
es ein in 1(a) dargestelltes
kodiertes Beliebigformsignal (Ep) 500 als ein kodiertes
Bildsignal Eo für
jedes Objekt aus.
-
Das Bild-Kodiergerät 100a umfasst
eine Bild-Eingabeeinheit 110, welche einen Vorkodierungsprozess
am einlaufenden Bildsignal Sin ausführt, um ein binäres Formsignal
und ein Textursignal zu erzeugen, und ein Schaltsteuersignal Swa
ausgibt; eine Form-Kodiereinheit
(erste Kodierungshilfsmittel) 120, die für das Formsignal
einen arithmetischen Kodierungsprozess ausführt; eine Textur-Kodiereinheit
(zweite Kodierungshilfsmittel) 130, die für das Textursignal
einen Kodierungsprozess einschließlich DCT ausführt; einen
Schalter 101a, der die Ausgabedaten aus der Bild-Eingabeeinheit 110 entsprechend
dem Schaltsteuersignal SWa an eine der Kodiereinheiten 120 und 130 weiterleitet;
und einen Rahmen-Speichermodul 102, der ein Vorhersage-Formsignal
und ein Vorhersage-Textursignal
speichert.
-
Die Bild-Eingabeeinheit 110 ist
wie folgt aufgebaut. Die Bild-Eingabeeinheit 110 unterscheidet zwischen
einem binären
Bildsignal von einem Scanner oder dergleichen und einem digitalen
Videosignal von einer Kamera oder einer Bildaufzeichnungs-/wiedergabeeinheit
(VTR), und das binäre
Bildsignal wird einem Schwellwertvergleich unterzogen, um ein Formsignal
zu erzeugen, wohingegen das digitale Videosignal einem Chroma-Key-Prozess
unterzogen wird, um ein Textursignal zu erzeugen. Im Chroma-Key-Prozess wird ein
zu jedem Objekt eines Displaybildes gehörendes Beliebigform-Bildsignal
von einem Bildsignal eines Hintergrundbildes separiert. Das separierte
Beliebigform-Bildsignal
wird verarbeitet, um ein die Form des Objekts darstellendes Formsignal
und ein Textursignal für
die Gradations-Farbdarstellung des Bildes zu erzeugen, das ein Leuchtdichte-
und ein Farbdifferenzsignal einschließt. Im Weiteren gibt die Bild- Eingabeeinheit 110 ein
Identifikatorsignal (Bild-Identifikator) Sdis aus, das anzeigt, welches
Signal – das
binäre
Bildsignal oder das Beliebigform-Bildsignal – bearbeitet wird.
-
Im Einzelnen umfasst, wie in 7(a) dargestellt ist, die
Bild-Eingabeeinheit 110 eine Identifikator-Einheit 111,
die entscheidet, ob der digitale Bild-Eingang Sin aus einem binären Bildsignal
oder einem Beliebigform-Bildsignal besteht, und dieses Signal separiert;
eine Schwellwert-Vergleichseinheit 112, die für jeden
der Blöcke,
in die das Displaybild unterteilt ist, einen Schwellwertvergleich
für das
binäre
Bildsignal ausführt
und somit ein binäres
Formsignal erzeugt; eine Chroma-Key-Einheit 113, die für jede Objektregion,
die jedem Objekt auf dem Displaybild zugeordnet ist, den Chroma-Key-Prozess
für das Beliebigform-Bildsignal ausführt und
somit ein binäres
Formsignal und ein mehrwertiges Textursignal erzeugt sowie ein Zeitsignal
T ausgibt, wenn die Bearbeitung des Textursignals abgeschlossen
ist; und einen Schaltersteuerungs-Schaltkreis 114, der
den Schalter 101a mit Hilfe des Schaltsteuersignals SWa – basierend
auf dem Identifikatorsignal Sdis von der Identifikator-Einheit 111 und
dem Zeitsignal T von der Chroma-Key-Einheit 113 – steuert.
-
Die Form-Kodiereinheit 120 umfasst:
einen Form-Bewegungsdetektor 121, der das zum Binärbild gehörende Formsignal
S2k oder das zum Beliebigform-Bild gehörende Formsignal Spk empfängt und
für jeden
Block einen Form-Bewegungsvektor Skv mittels Blockabstimmung oder
dergleichen erzeugt, wobei er sich auf das Formsignal eines Rahmens
bezieht, der vor dem gerade bearbeiteten Rahmen liegt; und einen
Form-Bewegungskompensator 123,
der den Form-Bewegungsvektor Skv auf eine Adresse des Rahmen-Speichermoduls 102a hin transformiert
und – auf
dieser Adresse basierend – ein
Vorhersage-Formsignal Ekm aus dem Form-Speichermodul 102a erhält. Ferner
umfasst die Form-Kodiereinheit 120 einen arithmetischen
Kodierer 122, der das Formsignal Sk aus dem Schalter 101a blockweise
mit Hilfe eines arithmetischen Kodierungsprozesses unter Verwendung
des Vorhersage-Formsignals Ekm kodiert, wodurch er zu jedem Block
einen dazugehörigen
kodierten Form-Bitstrom Ek erzeugt, und einen arithmetischen Dekoder 124, der
den kodierten Form-Bitstrom Ek mit einem arithmetischen Dekodierungsprozess
unter Verwendung des Vorhersage-Formsignals Ekm dekodiert. Die Ausgabedaten
Ekd des arithmetischen Dekoders 124 werden im Speichermodul 102a gespeichert.
-
Die Textur-Kodiereinheit 130 umfasst:
einen Textur-Bewegungsdetektor 131, der das Textursignal Spt
empfängt
und durch Blockabstimmung oder dergleichen für jeden Block einen Textur-Bewegungsvektor
Stv erzeugt, wobei er sich auf das Textursignal eines Rahmens bezieht,
der vor dem jeweils gerade bearbeiteten Rahmen liegt; und einen
Textur-Bewegungskompensator 132,
der den Textur-Bewegungsvektor Stv auf eine Adresse des Rahmen-Speichermoduls 102a hin
transformiert und basierend auf dieser Adresse ein Vorhersage-Textursignal
Epm aus dem Speichermodul 102a erhält. Im Weiteren umfasst die
Textur-Kodiereinheit 130 einen ersten Addierer 133,
der das Textursignal Spt und das Vorhersage-Textursignal Epm zusammenfügt; einen
Kosinus-Transformator 134, der an den Ausgabedaten Sad1
des Addierers 133 eine blockweise DCT ausführt, wodurch
die DCT-Koeffizienten
Edct erzeugt werden; und einen Quantisierer 135 zur blockweisen Quantisierung
der DCT-Koeffizienten Edct.
-
Außerdem enthält die Textur-Kodiereinheit 130 einen
Längenvariant-Kodierer 139,
der die Ausgabedaten Eq vom Quantisierer 135 blockweise
längenvariant
kodiert, wodurch er zu jedem Block einen zugehörigen kodierten Textur-Bitstrom
Ep erzeugt; einen Invers-Quantisierer 136,
der eine inverse Quantisierung der Ausgabedaten Eq vom Quantisierer 135 ausführt; einen
Umkehr-Kosinus-Transformator 137, der eine Umkehr-DCT der
Ausgabedaten Eiq des Invers-Quantisierers 136 ausführt; und
einen zweiten Addierer 138, der die Ausgabedaten Eidct des
Umkehr-Kosinus-Transformators 137 und das Vorhersage-Textursignal Epm
zusammenfügt.
Die Ausgabedaten Sad2 des zweiten Addierers 138 werden
im Rahmen-Speichermodul 102a als ein Vorhersage-Textursignal
gespeichert. Die Bild-Kodiergerät 100a enthält ferner
einen Multiplexer 150, der den Form-Identifikator Sdis von der Bild-Eingabeeinheit 110,
den Form-Bewegungsvektor Skv sowie den kodierten Form-Bitstrom Ek
von der Form-Kodiereinheit 120, und den Textur-Bewegungsvektor Stv
sowie den kodierten Textur-Bitstrom Ept von der Textur-Kodiereinheit 130 zusammen
mit anderen benötigten
Daten multiplext. Der Multiplexer 150 ist wie folgt aufgebaut. Bei
einer Eingabe eines binären
Bildsignals S2 multiplext der Multiplexer 150 den Form-Identifikator
Sdis und den kodierten Form-Bitstrom aus der Form-Kodiereinheit 120 zusammen
mit anderen benötigten Daten
und gibt das in 1(b) dargestellte
kodierte Binärsignal
(E2) 600 aus. Bei einer Eingabe des Beliebigform-Bildsignals Sp
multiplext der Multiplexer 150 den Form-Identifikator Sdis,
den kodierten Form-Bitstrom aus der Form-Kodiereinheit 120 und den kodierten
Textur-Bitsstrom aus der Textur-Kodiereinheit 130 zusammen
mit anderen benötigten Daten
und gibt das in 1(a) dargestellte
kodierte Beliebigformsignal (Ep) 500 aus.
-
Eine Beschreibung der Arbeitsweise
des Bild-Kodiergeräts 100a wird
gegeben.
-
4 ist
ein Flussdiagramm zur Darstellung des Kodierungsprozesses durch
das Bild-Kodiergerät
gemäß der zweiten
Ausführungsform.
-
Bei der Eingabe eines digitalen Bildsignals Sin
in das Bild-Kodiergerät 100a (Schritt
Sa1) entscheidet die Bild-Eingabeeinheit 110, ob die digitale Bildeingabe
Sin ein binäres
Bildsignal ist, das nur ein Formsignal enthält und das von einem Scanner
ausgegeben wurde, oder ob es ein digitales Videosignal ist, das
sowohl ein Formsignal als auch ein Textursignal enthält und das
von einer Kamera oder einem Bildaufzeichnungs-/wiedergabegerät (VTR)
stammt (Schritt Sa2).
-
Ist die digitale Bildeingabe Sin
ein binäres Bildsignal,
dann erzeugt die Bild-Eingabeeinheit 110 als
Bild-Identifikator (SID) ein 1-Bit-Identifikatorsignal mit einem
Wert „1" (Schritt Sa3) und
gewinnt durch Schwellwertvergleich der digitalen Bildeingabeinformation
Sin ein binäres
Formsignal Sk2. Zu diesem Zeitpunkt wird der Schalter 101a durch
das Schaltsteuersignal SWa so gesteuert, dass das Formsignal S2k
in die Form-Kodiereinheit 120 eingegeben wird und die Form-Kodiereinheit 120 ein
arithmetisches Kodieren des Formsignals S2k ausführt (Schritt Sa4).
-
Das heißt, der Form-Bewegungsdetektor 121 in
der Form-Kodiereinheit 120 erzeugt aus dem Formsignal S2k
für jeden
Block einen Form-Bewegungsvektor Skv. Genauer gesagt wird das gerade bearbeitete
Formsignal des vorliegenden Rahmens mittels Blockabstimmung mit
dem Formsignal des vorhergehenden Rahmens verglichen, wodurch eine Bewegung
des Bildes zwischen dem vorliegenden und dem vorhergehenden Rahmen
erkannt wird, und die Bewegungsinformation wird als Bewegungsvektor
Skv bereitgestellt. Diese Bewegungsdetektion wird ausführlicher
z. B. in USP (US Patent) Nr. 4897720 beschrieben. Bei der Eingabe
des Form-Bewegungsvektors Skv in den Form-Bewegungskompensator 123 transformiert
der Kompensator 123 den Form-Bewegungsvektor Skv auf eine Adresse
des Rahmen-Speichermoduls 102a und ruft entsprechend der
Adresse aus dem Rahmen-Speichermodul 102a ein Vorhersage-Formsignal Ekm ab. Bei
der Eingabe des Vorhersage-Formsignals Ekm und des Formsignals Sk2
aus der Bild-Eingabeeinheit 110 in den arithmetischen Kodierer 122 führt der arithmetische
Kodierer 122 einen arithmetischen Kodierungsprozess am
Formsignal S2k aus, der auf dem Vorhersage-Formsignal Ekm basiert,
und gibt Formdaten (kodierter Form-Bitstrom 61B) E2k aus, die
durch Kodieren des Formsignals S2k erhalten wurden. Das arithmetische
Kodierungsverfahren wird ausführlicher
in der Beschreibung des JBIG-Standards
dargestellt. Zu dieser Zeit werden im arithmetischen Dekoder 124 in
einem arithmetischen Dekodierungsprozess unter Verwendung des Vorhersage-Formsignals
Ekm die Formdaten E2k als dekodierte Formdaten Ekd reproduziert
und die dekodierten Formdaten Ekd werden im Rahmen-Speichermodul 102a gespeichert.
-
Danach werden der Form-Identifikator
Sdis, der Form-Bewegungsvektor Skv und die Formdaten E2k im Multiplexer 150 gemultiplext
und die Multiplex-Daten vom Ausgabeterminal 150a einer
Datenübertragungseinheit übergeben
(Schritt Sa5).
-
Im Bild-Kodiergerät 100a entscheidet
eine Steuereinheit (nicht dargestellt) darüber, ob die in den Schritten
Sa2–Sa5
verarbeiteten Daten die Daten des letzten Blocks im letzten Rahmen
sind oder nicht (Schritt Sa10), wobei dann, wenn die verarbeiteten
Daten nicht die Daten des letzten Blocks im letzten Rahmen sind,
der Prozess durch das Bild-Kodiergerät 100a zum
Schritt Sa2 zurück
verwiesen wird. Sind es die Daten des letzten Blocks im letzten Rahmen,
dann ist der Bild-Kodierungsprozess beendet.
-
Wird jedoch im Schritt Sa2 entschieden, dass
die digitale Bildeingangsinformation Sin ein Beliebigform-Bildsignal
Sp ist, das ein Form- und ein Textursignal enthält, so wird ein 1- Bit-Identifikatorsignal
Sdis mit dem Wert „0" als ein Form-Identifikator (SID)
in der Bild-Eingabeeinheit 110 erzeugt
(Schritt Sa6), und außerdem
werden durch den Chroma-Key-Prozess
der digitalen Bildeingabeinformation Sin ein Formsignal Spk und
ein Textursignal Spt erzeugt. Zu dieser Zeit wird der Schalter 101a durch das
von der Bild-Eingabeeinheit 110 ausgegebene Schaltsteuersignal
SWa so gesteuert, dass das Formsignal Spk in die Form-Kodiereinheit 120 eingegeben
wird, während
das Textursignal Spt in die Textur-Kodiereinheit 130 eingegeben
wird.
-
Dadurch wird in der Form-Kodiereinheit 120 das
Formsignal Spk des Beliebigform-Bildsignals
Sp in der gleichen Weise arithmetisch kodiert, wie es oben für das Formsignal
S2k des binären
Bildsignals S2 beschrieben wurde (Schritt Sa7). In der Textur-Kodiereinheit 130 wird
die Kodierung des Textursignals Spt ausgeführt (Schritt Sa8).
-
Genauer gesagt extrahiert der Textur-Bewegungsdetektor 131 in
der Textur-Kodiereinheit 130 einen
Textur-Bewegungsvektor Stv aus dem Textursignal Spt, und der Textur-Bewegungskompensator 132 erhält aus dem
Rahmen-Speichermodul 102a entsprechend dem Bewegungsvektor
Stv ein Vorhersage-Textursignal Epm. Der erste Addierer 133 empfängt die
Differenzdaten Sad1 zwischen dem Vorhersage-Textursignal Epm und
dem Textursignal Spt des einlaufenden Beliebigform-Bildsignals.
Diese Differenzdaten werden durch den Kosinus-Transformator 134 in
einem Frequenzbereich in DCT-Koeffizienten Edct transformiert, und
die DCT-Koeffizienten Edct werden durch den Quantisierer 135 quantisiert.
Im Weiteren werden die quantisierten DCT-Koeffizienten Eq durch
den Längenvariant-Kodierer 139 längenvariant
kodiert und dem Multiplexer 150 zugeführt. In den Multiplexer 150 wird
auch der Textur-Bewegungsvektor Stv des entsprechenden Blocks eingegeben.
-
Die quantisierten DCT-Koeffizienten
Eq werden vom Invers-Quantisierer 136 invers quantisiert, und
an den Ausgabedaten Eiq des Invers-Quantisierers 136 wird
durch den Umkehr-Kosinus-Transformator 137 eine Umkehr-Kosinus-Transformation ausgeführt, wonach
sie als ein reproduziertes Textursignal Eidct dem zweiten Addierer 138 zugeführt werden.
In dem zweiten Addierer 138 werden das reproduzierte Texturdignal
Eidct und das Vorhersage-Textursignal Epm zusammengefügt, und
die Summe Sad2 wird im Rahmen-Speichermodul 102a gespeichert.
-
Ist die digitale Bildeingabeinformation
ein Beliebigform-Bildsignal, dann wird der Multiplexer 150 gespeist
mit dem Form-Identifikator Sdis von der Bild-Eingabeeinheit 110,
dem Form-Bewegungsvektor Skv und den Formdaten Epk von der Form-Kodiereinheit 120,
dem Textur-Bewegungsvektor Stv und den Textur-DCT-Koeffizienten
Ept von der Textur-Kodiereinheit 130 und
mit weiteren benötigten
Signalen. Diese Daten sind im Multiplexer 150 in einer vorgeschriebenen
Reihenfolge angeordnet, und das in 1(a) dargestellte
kodierte Beliebigformsignal (Ep) 500 wird vom Multiplexer 150 ausgegeben (Schritt
Sa9).
-
Wie mit Bezug auf das binäre Bildsignal
beschrieben wurde, entscheidet außerdem eine Steuereinheit (nicht
dargestellt) im Bild-Kodiergerät 100a, ob
die in den Schritten Sa6– Sa9
verarbeiteten die Daten des letzten Blocks im letzten Rahmen gewesen
sind (Schritt Sa10). Waren die verarbeiteten Daten nicht die des
letzten Blocks im letzten Rahmen, dann werden für ein Form- und ein Textursignal,
die zum nächsten
Block gehören,
die Schritte Sa6–Sa9 ausgeführt. Waren
die verarbeiteten Daten (Form- und Textursignal) die des letzten
Blocks im letzten Rahmen, dann ist der Kodierungsprozess durch das Bild-Kodiergerät 100a abgeschlossen.
-
Das Ausgabeterminal 150a des
Multiplexers 150 ist mit einer Übertragungseinheit zur Übertragung
der kodierten Daten oder mit einer Speichereinheit zur Speicherung
der kodierten Daten verbunden, obwohl diese Einheiten in der Figur
nicht dargestellt sind.
-
Wie oben mit Bezug auf die zweite
Ausführungsform
beschrieben wurde, ist das Bild-Kodiergerät 100a zur
Kodierung einer digitalen Bildeingabe so ausgelegt, dass es entscheidet,
ob die digitale Bildeingabe ein binäres Bildsignal oder ein Beliebigform-Bildsignal ist, und
entsprechend dem Ergebnis dieser Entscheidung gibt es zusammen mit
dem kodierten Bildsignal ein Identifikatorsignal (Form-Identifikator)
Sdis aus. Deshalb wird in einem Dekodiergerät zur Dekodierung eines kodierten
Signals – von
einem binären
Bildsignal oder einem Beliebigformsignal – durch den oben beschriebenen
Form-Identifikator festgestellt, ob ein einlaufendes kodiertes Signal ein
kodiertes Binärsignal
ist, das keine kodierten Textur-Bitströme enthält, und der Dekodierungsprozesses
kann in seiner Form so verändert
werden, dass er von einem Prozess ausgehend, der für ein kodiertes
Beliebigformsignal mit sowohl kodierten Form-Bitströmen als
auch kodierten Textur-Bitströmen geeignet
ist, zu einem Prozess wird, der für das kodierte Binärsignal
geeignet ist.
-
Deshalb ist es bei der Kodierung
eines binären
Bildsignals, das nur ein Formsignal enthält, nicht erforderlich, jedem
kodierten Form-Bitstrom einen kodierten Blind-Textur-Bitstrom hinzuzufügen, wobei der
Blindstrom eine Dekodierung des binären Formsignals mit einem Dekodierungsverfahren
erlaubt, das für
ein Beliebigformsignal eingesetzt wird. Im Ergebnis lässt sich
ein kodiertes Bildsignal mit einer Datenstruktur erzeugen, die eine
Dekodierung der nach unterschiedlichen Kodierungsverfahren kodierten
Signale mit einem Bild-Dekodiergerät ermöglicht, das nur ein einziges
Kodierungsverfahren einsetzt, ohne den für den Kodierungsprozess erforderlichen Kodeumfang
zu erhöhen.
-
[Ausführungsform 3]
-
5 ist
ein Blockschema zur Darstellung eines Bild-Dekodiergeräts nach
einer dritten Ausführungsform.
Die Bezugsziffer 100b in 5 kennzeichnet
ein Bild-Dekodiergerät, das eine
Dekodierung von kodierten Daten ausführt, die eine Datenstruktur
zur Bildübertragung
gemäß der ersten
Ausführungsform
aufweisen. Dieses Gerät 100b ist
wie folgt aufgebaut. Wenn das Gerät 100b als kodierte Daten
Eo ein in 1(b) dargestelltes
kodiertes Binärsignal
(E2) 600 empfängt,
dann gibt es als dekodierte Binärdaten
Dsyn ein dekodiertes Binärsignal D2
aus. Empfängt
das Gerät 100b jedoch
als kodierte Daten Eo ein in 1(a) dargestelltes
kodiertes Beliebigformsignal (Ep) 500, dann gibt es als
dekodierte Bilddaten Dsyn für
jedes Objekt ein dekodiertes Beliebigformsignal Dp aus.
-
Im Einzelnen umfasst das Dekodiergerät 100b einen
Datenanalysator 160, der die in das Eingabeterminal 160a einlaufenden
kodierten Daten Eo analysiert und entsprechend dem Analyseresultat
ein Schaltsteuersignal SWb ausgibt; eine Form-Dekodiereinheit (erste Dekodierhilfsmittel) 170,
die einen arithmetischen Dekodierungsprozess an den Formdaten (an
dem durch Kodierung des Formsignals erhaltenen kodierten Form-Bitstrom)
ausführt;
eine Textur-Dekodiereinheit (zweite Dekodierhilfsmittel) 180,
die für
die Textur-DCT-Koeffizienten Ept einen Dekodierungsprozess einschließlich einer
Umkehr-DCT ausführt;
einen Schalter 101b, der entsprechend dem Schaltsteuersignal
das vom Datenanalysator 160 analysierte und ausgegebene
kodierte Signal zu einer der Dekodiereinheiten 170 bzw. 180 weiterleitet;
und einen Rahmen-Speichermodul 102, der ein Vorhersage-Formsignal
und ein Vorhersage-Textursignal
speichert.
-
Ist die Dekodierung des zu einem
Block gehörenden
kodierten Form-Bitstroms abgeschlossen, dann erkennt die Form-Dekodiereinheit 170 das Ende
des zum Block gehörenden
Form-Bitstroms Ek (E2k oder Epk) und gibt ein zum Block gehörendes Abschlussnachweissignal
Te an den Daten-Analysator 160 aus.
-
Außerdem analysiert der Datenanalysator 160 die
kodierten Eingabedaten zur Überprüfung des auf
das 32-Bit-Synchronsignal am Kopf folgenden 1-Bit-Form-Identifikators, wobei
dieser der Form-Identifikator 502 im kodierten Beliebigformsignal 500 von 1(a) oder der Form-Identifikator 602 im
kodierten Binärsignal 600 von 1(b) ist. Ist der gesetzte
Wert des Form-Identifikators (SID) gleich 0, dann steuert der Datenanalysator 160 den
Schalter 101b mit Hilfe des Schaltsteuersignals SWb so,
dass der kodierte Form-Bitstrom im einlaufenden kodierten Signal
in die Form-Dekodiereinheit 170 und der kodierte Textur-Bitstrom
im kodierten Signal in die Textur-Dekodiereinheit (180)
eingegeben wird. Ist der gesetzte Wert des Form-Identifikators (SID)
gleich 1, dann steuert der Datenanalysator 160 den Schalter 101b über das
Schaltsteuersignal SWb so, dass die einlaufenden kodierten Daten
in die Form-Dekodiereinheit 170 eingegeben werden.
-
Im Einzelnen umfasst der Datenanalysator 160,
wie in 7(b) dargestellt
ist, eine Tabellen-Speichereinheit 162, die eine Dekodier-Referenztabelle
enthält;
einen Komparator 161, der den Bitstrom des einlaufenden
kodierten Signals mit dem Bitstrom der Dekodier-Referenztabelle vergleicht, wodurch
der in den kodierten Daten enthaltene Form-Identifikator, der kodierte Form-Bitstrom
und der kodierte Textur-Bitstrom identifiziert werden; und ein Schalter-Steuerkreis 163 zur
Steuerung des Schalters 101b über ein Schaltsteuersignal
SWb in Abhängigkeit
vom Vergleichsergebnis des Komparators 161 und vom Abschlussnachweissignal
Te.
-
Die Form-Dekodiereinheit (erste Dekodierhilfsmittel) 170 enthält einen
Form-Bewegungskompensator 172,
der den zum Binärbild
gehörenden Form-Bewegungsvektor
oder einen zum Beliebigform-Bild gehörenden Beliebigform-Bewegungsvektor
empfängt,
eine Adresse des im Rahmen-Speichermodul 102b gespeicherten
Vorhersage-Formsignals entsprechend dem Bewegungsvektor erzeugt und
das Vorhersage-Formsignal Emk aus dem Rahmen-Speichermodul 102b empfängt; und
einen arithmetischen Dekoder 171 zur Dekodierung der Eingangs-Formdaten
Ek mit Bezugnahme auf das Vorhersage-Formsignal Emk, um ein reproduziertes Formsignal
(dekodiertes Formsignal) Dk zu erzeugen. Das reproduzierte Formsignal
Dk wird im Rahmen-Speichermodul 102b gespeichert. Nach
Abschluss der Dekodierung eines zu einem Block gehörenden Form-Bitstroms
detektiert der arithmetische Dekoder 171 das Ende des zum
Block gehörenden kodierten
Form-Bitstroms Ek
(E2k oder Epk) und gibt ein Abschlussnachweissignal Te aus. Die
Bewegungskompensation wird ausführlicher
im USP (US Patent) Nr. 5157742 beschrieben, und die arithmetische
Dekodierung wird in der Beschreibung von JBIG dargestellt.
-
Die Textur-Dekodiereinheit (zweite
Dekodierhilfsmittel) 180 enthält einen Textur-Bewegungskompensator 184,
der entsprechend dem Textur-Bewegungsvektor eine Adresse des Vorhersage-Textursignals
erzeugt und unter Verwendung der Adresse das Vorhersage-Textursignal Emp
aus dem Rahmen-Speichermodul 102b empfängt; einen Invers-Quantisierer 181,
der die Quantisierungsskala sowie die DCT-Koeffizienten im kodierten
Textur-Bitstrom empfängt
und die DCT-Koeffizienten invers quantisiert; einen Umkehr-Kosinus-Transformator 182,
der für
die invers quantisierten DCT-Koeffizienten Diq eine Umkehr-Kosinus-Transformation
ausführt;
und einen Addierer 183, der das Vorhersage-Textursignal Emp
und das umkehr-kosinus-transformierte Signal Didct zusammenfügt sowie
ein reproduziertes Textursignal (dekodiertes Textursignal) Dpt ausgibt.
Das reproduzierte Textursignal Dpt aus dem Addierer 183 wird
im Rahmen-Speichermodul 102b gespeichert.
-
Das Bild-Dekodiergerät 100b umfasst
ferner einen Synthesizer 190, der eine Synthese des reproduzierten
Textursignals Dpt bzw. des entsprechenden reproduzierten Formsignals
Dk mit gewünschten Bilddaten
erzeugt und an die Wiedergabeeinheit 104 synthetisierte
Bilddaten Dsyn ausgibt, welche das zum kodierten Beliebigformsignal
Ep gehörende
reproduzierte Beliebigformsignal Dp enthalten. Im Weiteren gibt
der Synthesizer 190 das zum kodierten Binärsignal
E2 gehörende
reproduzierte Binärsignal
D2 aus. Die Ausgabesignale vom Synthesizer 190 werden zwar
in die Wiedergabeeinheit 104 eingegeben, die Signale können aber
auch in einen Drucker (nicht dargestellt) eingegeben werden. Außerdem kann
das reproduzierte Binärsignal
D2 im Synthesizer 190 mit einem weiteren Beliebigform-Bildsignal
synthetisiert werden.
-
In dieser dritten Ausführungsform
werden bei der Dekodierung eines Beliebigform-Bildsignals für Pixel, für die das reproduzierte Formsignal
gleich Null ist, die Pixelwerte im reproduzierten Textursignal durch
Pixelwerte eines vorgeschriebenen Bildes ersetzt. Das vorgeschriebene
Bild ist ein Bild, das im Voraus an der Empfangsstation hergestellt
wurde, oder es ist ein von einem anderen Bild-Dekodiergerät reproduziertes
Bild.
-
Es wird eine Beschreibung der Arbeitsweise des
so aufgebauten Bild-Dekodiergeräts
gegeben.
-
6 ist
ein Flussdiagramm des Dekodierungsprozesses durch das Bild-Dekodiergerät 100b entsprechend
der dritten Ausführungsform.
Wird ein kodiertes Bildsignal mit einer in 1(a) oder 1(b) dargestellten
Datenstruktur in das Bild-Dekodiergerät 100b eingegeben,
dann analysiert der Datenanalysator 160 den auf das 32-Bit-Synchronsignal
folgenden 1-Bit-Form-Identifikator und entscheidet, ob der Wert des
Form-Identifikators (SID)1 ist oder nicht (Schritt Sb1).
-
Ist das Ergebnis der Entscheidung
SID = 1, dann ist das einlaufende kodierte Bildsignal Eo ein kodiertes
Binärsignal
E2, das als Bildinformation nur kodierte Form-Bitströme enthält. Dann steuert der Datenanalysator 160 den
Schalter 101b über
das Schaltsteuersignal SWb so, dass der zu jedem Block des kodierten
Binärsignals
gehörende
Form-Bitstrom immer in die Form-Dekodiereinheit 170 eingegeben wird.
Damit werden in der Form-Dekodiereinheit 170 die kodierten
Form-Bitströme
im kodierten Binärsignal
dekodiert (Schritt Sb2).
-
Genauer gesagt wird der Form-Bewegungsvektor
BV in den Form-Bewegungskompensator 172 und
den arithmetischen Dekoder 171 eingegeben. Dann erzeugt
der Form-Bewegungskompensator 172 entsprechend dem Form-Bewegungsvektor
BV eine Adresse des im Rahmen-Speichermodul 102b gespeicherten
Vorhersage-Formsignals
und erhält vom
Rahmen-Speichermodul 102b das Vorhersage-Formsignal Emk.
Wird das Vorhersage-Formsignal Emk in den arithmetischen Dekoder 171 eingegeben,
dann führt
der arithmetische Dekoder 171 eine arithmetische Dekodierung
des kodierten Form-Bitstroms E2k mit Bezugnahme auf das Vorhersage-Formsignal
Emk aus, wodurch ein dekodiertes Binärsignal D2k erzeugt wird. Das
dekodierte Binärsignal
D2k wird an den Rahmen-Speichermodul 102b und den Synthesizer 190 ausgegeben
und vom Synthesizer 190 an die Wiedergabeeinheit 104 zur
Bildwiedergabe weitergeleitet (Schritt Sb6). Die Wiedergabe des
dekodierten Binärsignals
kann nach einer Synthese mit einem anderen Beliebigform-Bildsignal erfolgen.
-
Danach wird entschieden, ob das dekodierte Binärsignal
aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt
Sb7). Besteht das kodierte Binärsignal
nicht aus den Daten des letzten Blocks im letzten Rahmen, dann werden
an einem zum nächsten
Block gehörigen
binären
Signal die Schritte Sb1, Sb2 und Sb6 ausgeführt. Besteht das kodierte Binärsignal
aus den Daten des letzten Blocks im letzten Rahmen, dann ist die
Dekodierung des kodierten Binärsignals
beendet.
-
Andererseits enthält das einlaufende kodierte
Eingabe-Bildsignal dann, wenn das Ergebnis der Entscheidung im Schritt
Sb1 SID = 0 ist, als Bildinformation kodierte Form-Bitströme und kodierte
Textur-Bitströme.
Deshalb steuert der Datenanalysator 160 den Schalter 101b über das
Schaltsteuersignal SWb so, dass der zu jedem Block des kodierten
Beliebigformsignals gehörende
kodierte Form-Bitstrom in die Form-Dekodiereinheit 170 eingegeben
wird, während
der zu jedem Block gehörende
kodierte Textur-Bitstrom in die Textur-Dekodiereinheit 180 eingegeben
wird. Dadurch werden der kodierte Form-Bitstrom und der kodierte
Textur-Bitstrom voneinander separiert (Schritt Sb3), und der kodierte
Form-Bitstrom wird
durch die Form-Dekodiereinheit 170 dekodiert, während der
kodierte Textur-Bitstrom
durch die Textur-Dekodiereinheit 180 dekodiert wird (Schritte Sb4
und Sb5).
-
Genauer gesagt wird der kodierte
Form-Bitstrom Epk -ähnlich
wie der kodierte Form-Bitstrom E2k
des binären
Bildsignals – durch
den Form-Dekoder 170 dekodiert. Ist die Dekodierung des
zu einem Block gehörenden
kodierten Form-Bitstroms Epk abgeschlossen, dann stellt der arithmetische
Dekoder 171 das Ende des zu einem Block gehörenden kodierten
Form-Bitstroms Epk fest und gibt ein Abschlussnachweissignal Te
an den Datenanalysator 160 aus. Beim Empfang des Abschlussnachweissignals
Te steuert der Datenanalysator 160 den Schalter 101b über das
Schaltsteuersignal SWb so, dass das einlaufende kodierte Bildsignal
in die Textur-Dekodiereinheit 180 eingegeben wird.
-
Dadurch wird der kodierte Textur-Bitstrom Ept
vom Datenanalysator 160 zur Textur-Dekodiereinheit 180 übermittelt.
In der Dekodiereinheit 180 werden die Quantisierungsskala
und die DCT-Koeffizienten im Bitstrom in den Invers-Quantisierer 181 eingegeben,
und für
die DCT-Koeffizienten wird eine inverse Quantisierung ausgeführt. Danach
wird vom Umkehr-Kosinus-Transformator 182 für die invers quantisierten
Signale Diq eine Umkehr-Kosinus-Transformation
ausgeführt.
-
Unterdessen wird der Textur-Bewegungsvektor
BV in den Textur-Bewegungskompensator 184 eingegeben.
Der Kompensator 184 erzeugt eine Adresse zur Versorgung
mit einem dem Textur-Bewegungsvektor BV entsprechenden Vorhersage-Textursignal, und
empfängt
das Vorhersage-Textursignal Emp vom Rahmen-Speichermodul 102b unter
Verwendung der Adresse.
-
Der Addierer 183 führt eine
Addition der Ausgabedaten Didct vom Umkehr-Kosinus-Transformator 182 und
des Vorhersage-Textursignals Emp durch und gibt das dekodierte Textursignal
Dpt aus. Das dekodierte Textursignal Dpt wird in den Rahmen-Speichermodul 102b und
den Synthesizer 190 eingegeben. Der Synthesizer 190 führt eine
Synthese des dekodierten und reproduzierten Textursignals Dpt und des
dazugehörigen
dekodierten und reproduzierten Formsignals Dk mit einem gewünschten
Bild zur Erzeugung synthetisierter Bilddaten Dsyn aus. Beim Abschluss
der Dekodierung des kodierten Textur-Bitstroms stellt der Datenanalysator 160 das
Ende des kodierten Textur-Bitstroms fest und steuert den Schalter 101b über das
Schaltsteuersignal SWb so, dass das einlaufende kodierte Bildsignal
in die Form-Dekodiereinheit 170 eingegeben wird.
-
Außerdem werden die reproduzierten
und synthetisierten Daten vom Synthesizer 190 an die Wiedergabeeinheit 104 zur
Bildwiedergabe ausgegeben (Schritt Sb6).
-
Danach wird entschieden, ob das dekodierte Beliebigformsignal
aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt
Sb7). Besteht das kodierte Beliebigformsignal nicht aus den Daten
des letzten Blocks im letzten Rahmen, dann werden an einem kodierten
Beliebigformsignal des nächsten Blocks
die Schritte Sb3–Sb7
ausgeführt.
Besteht das kodierte Beliebigformsignal aus den Daten des letzten
Blocks im letzten Rahmen, dann ist die Dekodierung des kodierten
Beliebigformsignals beendet.
-
In dieser dritten Ausführungsform
werden für Pixel,
für die
das reproduzierte Formsignal gleich Null ist, die Pixelwerte in
dem dekodierten und reproduzierten Textursignal durch Pixelwerte
eines vorgeschriebenen Bildes ersetzt. Das vorgeschriebene Bild
ist ein Bild, das im Voraus an der Empfangsstation hergestellt wurde,
oder es ist ein von einem anderen Bild-Dekodiergerät reproduziertes
Bild.
-
Wie oben beschrieben wurde, enthält das Bild-Dekodiergerät 100b gemäß der dritten
Ausführungsform
den Datenanalysator 160, der die kodierten Eingabedaten
analysiert. Der Datenanalysator 160 detektiert einen Form-Identifikator,
der anzeigt, ob das einlaufende kodierte Bildsignal ein kodiertes Binärsignal
ist, das als Bildinformation nur kodierte Form-Bitströme enthält, oder ob es ein kodiertes
Beliebigformsignal ist, das sowohl kodierte Form-Bitströme als auch kodierte Textur-Bitströme umfasst, und
in Abhängigkeit
vom Wert des Form-Identifikators steuert der Datenanalysator 160 den
Schalter 101b so, dass der Bitstrom des einlaufenden kodierten
Signals in die Form-Dekodiereinheit 170 bzw. die Textur-Dekodiereinheit 180 eingegeben
wird. Selbst dann, wenn. bei der Erzeugung eines kodierten Binärsignals
nicht zu jedem kodierten Form-Bitstrom ein kodierter Blind-Textur-Bitstrom hinzugefügt wird, kann
so eine Dekodierung des kodierten Binärsignals durch ein Dekodierungsverfahren
erfolgen, das zu einem kodierten Beliebigformsignal gehört. Wenn
sowohl ein binäres
Bildsignal als auch ein Beliebigform-Bildsignal, die unterschiedliche
Datenstrukturen haben, durch ein einziges Kodierungsverfahren kodiert
und diese kodierten Signale durch ein einziges Dekodierungsverfahren
dekodiert werden, dann ist es folglich möglich, Kodierung, Übertragung
und Dekodierung des binären
Bildsignals effizient mit verminderter Bitzahl auszuführen.
-
[Ausführungsform 4]
-
8 ist
ein Blockschema zur Darstellung eines Bild-Dekodiergeräts nach
einer vierten Ausführungsform.
Die Bezugsziffer 100c in 8 kennzeichnet
ein Bild-Dekodiergerät nach dieser
vierten Ausführungsform.
Das Bild-Dekodiergerät 100c enthält einen
Controller 105 zusätzlich
zu den Bauelementen des Bild-Dekodiergeräts 100b gemäß der dritten
Ausführungsform.
Der Controller 105 überwacht
die Beanspruchung des Dekodierungsprozesses der Textur-Dekodiereinheit 180 entsprechend dem
Betriebszustand des Synthesizers 190c und gibt ein Überlastnachweissignal
Lov aus, wenn die Last über
einem vorgeschriebenen Wert liegt.
-
Ferner enthält das Bild-Dekodiergerät 100c an
Stelle des zur dritten Ausführungsform
gehörenden
Datenanalysators 160 einen Datenanalysator 166,
der entsprechend dem Abschlussnachweissignal Te und dem Überlastnachweissignal
Lov ein Schaltsteuersignal SWc erzeugt. Der weitere Aufbau des Datenanalysators 166 entspricht
dem des Datenanalysators 160. Ferner enthält das Dekodiergerät 100c an
Stelle des zur dritten Ausführungsform
gehörenden
Schalters 101b einen Schalter 101c mit einem Eingabeterminal
Cin, in den ein kodiertes Bildsignal vom Datenanalysator 166 eingegeben
wird, und mit drei Ausgangskontakten Co1, Co2 und Co3, wobei er
einen der drei Kontakte abhängig
vom Schaltsteuersignal SWc auswählt.
Der Ausgangskontakt Co1 ist mit dem Eingang des arithmetischen Dekoders 171 verbunden,
der Ausgangskontakt Co2 ist geerdet, und der Ausgangskontakt Co3
ist mit dem Eingang des Invers-Quantisierers 181 und dem
Eingang des Bewegungskompensators 184 verbunden.
-
Außerdem verfügt der Controller 105 über eine
Anzahl von Funktionen zur Steuerung des gesamten Dekodiergeräts. Eine
dieser Funktionen ist die folgende. Wenn das Zusammenstellen eines
zu einem Rahmen gehörenden
Bildes innerhalb eines Zeitintervalls zur Bildwiedergabe eines Rahmens nicht
abgeschlossen ist, wobei das Zeitintervall im Voraus festgelegt
wird, dann stellt der Controller 105 fest, dass die Beanspruchung
Lde des Dekodierungsprozesses in der Dekodiereinheit 180 stark
ist und gibt das Schaltsteuersignal SWc aus.
-
Beim Eingang des Überlastnachweissignals Lov
steuert der Datenanalysator 166 den Schalter 101c über das
Schaltsteuersignal SWc so, dass das Eingabeterminal Cin zwischen
den ersten Ausgangskontakt Co1 und den zweiten Ausgangskontakt Co2 geschaltet
wird. Genauer gesagt wird der Schalter 101c so gesteuert,
dass der kodierte Textur-Bitstrom Ept des kodierten Beliebigformsignals
Ep in den geerdeten Kontakt eingegeben wird, wohingegen der kodierte
Form-Bitstrom Ekt des kodierten Beliebigformsignals Ep in den arithmetischen
Dekoder 171 geleitet wird.
-
Außerdem hat in dieser vierten
Ausführungsform
der Synthesizer 190c zusätzlich zu der Funktion des
Synthesizers 190 in der dritten Ausführungsform die folgende Funktion.
Ist der Dekodierungsprozess des kodierten Textursignals – wie oben
beschrieben wurde – stark überlastet,
dann synthetisiert der Synthesizer 190c das zum vorliegenden,
gerade bearbeiteten Rahmen gehörende
dekodierte Formsignal mit dem dekodierten Textursignal des vorhergehenden
Rahmens anstatt mit dem zum vorliegenden Rahmen gehörenden dekodierten
Textursignal.
-
Wird in den Datenanalysator 166 kein Überlastnachweissignal
Lov eingegeben, d. h., ist der Bild-Dekodierungsprozess nicht stark überlastet, dann
steuert der Datenanalysator 166 den Schalter 101c über ein
Schaltsteuersignal SWc so, dass das Eingabeterminal Cin mit dem
ersten Ausgangskontakt Co1 bzw. dem dritten Ausgangskontakt Co3
verbunden wird. Dadurch führt
das Bild-Dekodiergerät 100c gemäß der vierten
Ausführungsform
einen Bild-Dekodierungsprozess aus, der mit dem übereinstimmt, den das Bild-Dekodiergerät 100b gemäß der dritten
Ausführungsform
ausführt.
-
Es wird eine Beschreibung der Wirkungsweise
des Bild-Dekodiergeräts 100c gemäß der vierten Ausführungsform
gegeben.
-
Da das Wirkprinzip des Bild-Dekodiergeräts 100c mit
dem des Bild-Dekodiergeräts 100b gemäß der dritten
Ausführungsform übereinstimmt,
wird im Weiteren nur die Wirkungsweise mit Bezug auf den Controller 105 beschrieben.
-
Ist z. B. bei der Dekodierung des
kodierten Beliebigformsignals Ep in der Textur-Dekodiereinheit 180 die Synthese
des zum gerade bearbeiteten Rahmen gehörenden dekodierten Bildsignals
zu dem Zeitpunkt noch nicht abgeschlossen, wenn das Bild zu diesem
Rahmen wiederzugeben ist, dann stellt der Controller 105 fest,
dass der Bild-Dekodierungsprozess
stark überlastet
ist, und gibt das Überlastnachweissignal
Lov an den Datenanalysator 166 aus. Dann wird der Schalter 101c durch
das Schaltsteuersignal SWc vom Datenanalysator 166 so gesteuert,
dass der kodierte Form-Bitstrom Epk des kodierten Beliebigformsignals
Ep vom Datenanalysator 166 über den ersten Ausgangskontakt
Co1 des Schalters 101c an die Form-Dekodiereinheit 170 übergeben
wird, während
der kodierte Textur-Bitstrom Ept des kodierten Beliebigformsignals
Ep über den
zweiten Ausgangskontakt Co2 des Schalters 101c geerdet
wird.
-
Außerdem wird nicht das zum vorliegenden, gerade
bearbeiteten Rahmen gehörende
dekodierte Textursignal sondern das dekodierte Textursignal vom
vorhergehenden Rahmen mit dem zum vorliegenden Rahmen gehörenden dekodierten
Formsignal synthetisiert.
-
Wie oben beschrieben wurde, wird
gemäß der vierten
Ausführungsform
die Beanspruchung des arithmetischen Prozessors im Bild-Dekodiergerät überwacht,
und dann, wenn die Dekodierung des zu jedem Rahmen gehörenden Beliebigform-Bildsignals zu
spät für die rechtzeitige
Wiedergabe des zu jedem Rahmen gehörenden Bildes ist, wird nur
der kodierte Form-Bitstrom im kodierten Beliebigformsignal reproduziert,
und die Bildwiedergabe erfolgt unter Verwendung eines vorher reproduzierten
kodierten Textur-Bitstroms. Deshalb ist es selbst bei einer starken Überlastung
des Dekodierungsprozesses möglich, eine Bildwiedergabe
zu realisieren, in der das wiedergegebene Bild keine Sprünge aufweist
und der Bildfluss stetig ist.
-
In dieser vierten Ausführungsform
gilt es als ein Nachweis der Beanspruchung des Dekodierungsprozesses,
wenn das zu jedem Rahmen gehörende
dekodierte Bildsignal zu spät
für eine
rechtzeitige Wiedergabe des zum Rahmen gehörenden Bildes ist, wonach entschieden
wird, dass der Dekodierungsprozess stark überlastet ist. Das Belastungsnachweisverfahren
ist jedoch nicht darauf beschränkt.
-
Außerdem wird in dieser vierten
Ausführungsform
bei einer Überlastung
des Dekodierungsprozesses nur der kodierte Form-Bitstrom im kodierten
Beliebigformsignal und nicht der kodierte Textur-Bitstrom im kodierten
Beliebigformsignal dekodiert. Es kann jedoch auch nur der kodierte
Textur-Bitstrom ohne eine Dekodierung des kodierten Form-Bitstroms
dekodiert werden.
-
In diesem Falle wird an Stelle des
zum vorliegenden, gerade bearbeiteten Rahmen gehörenden dekodierten Formsignals
das zum vorhergehenden Rahmen gehörende dekodierte Formsignal
mit dem zum vorliegenden Rahmen gehörenden dekodierten Textursignal
synthetisiert.
-
[Ausführungsform 5]
-
9 ist
ein Blockschema zur Darstellung eines Bild-Dekodiergeräts nach
einer fünften
Ausführungsform.
Die Bezugsziffer 100d in 9 kennzeichnet
das Bild-Dekodiergerät gemäß dieser
fünften
Ausführungsform.
Das Bild-Dekodiergerät 100d enthält an Stelle
des Controllers 105, der im Bild-Dekodiergerät 100c gemäß der vierten
Ausführungsform
zum Nachweis der Beanspruchung des Dekodierungsprozesses vorgesehen
ist, ein Eingabeterminal 106, wie z. B. eine Maus oder
eine Fernsteuerung, zur Eingabe eines manuellen Steuersignals Min
von außen
in das Bild-Dekodiergerät 100d.
An Stelle des Überlastnachweissignals
Lov wird das manuelle Steuersignal Min vom Eingabeterminal 106 in den
Datenanalysator 165 eingegeben. Die anderen Teile stimmen
mit den in der vierten Ausführungsform beschriebenen überein.
-
Bei Eingang des manuellen Steuersignals Min
steuert der Datenanalysator 165 den Schalter 101c über das
Schaltsteuersignal SWc so, dass das Eingabeterminal Cin mit dem
ersten Ausgangskontakt Co1 bzw. dem zweiten Ausgangskontakt Co2 verbunden
wird. Genauer gesagt wird der Schalter 101c so gesteuert,
dass der kodierte Textur-Bitstrom Ept des kodierten Beliebigformsignals
Ep geerdet wird, wohingegen der kodierte Form-Bitstrom Ekt des kodierten
Beliebigformsignals Ep in den arithmetischen Dekoder 171 eingegeben
wird.
-
Wie in der vierten Ausführungsform
wird auch in dieser fünften
Ausführungsform
dann, wenn das manuelle Steuersignal Min zum Datenanalysator 165 hin
ausgegeben wird, an Stelle des zum vorliegenden, gerade bearbeiteten
Rahmen gehörenden dekodierten Textursignals
das zum vorhergehenden Rahmen gehörende dekodierte Textursignal
mit dem zum vorliegenden Rahmen gehörenden dekodierten Formsignal
synthetisiert.
-
Empfängt der Datenanalysator 165 kein
manuelles Steuersignal Min, dann steuert er den Schalter 101c mit
Hilfe des Schaltsteuersignals SWc so, dass das Eingangsterminal
Cin mit dem ersten Ausgangskontakt Co1 bzw. dem dritten Ausgangskontakt Co3
verbunden wird. Dadurch führt
das Bild-Dekodiergerät 100d nach
der fünften
Ausführungsform
einen Bild-Dekodierungsprozess aus, der mit dem Prozess übereinstimmt,
der vom Bild-Dekodiergerät 100b nach
der dritten Ausführungsform
ausgeführt wird.
-
Wie oben beschrieben wurde, verfügt das Bild-Dekodiergerät 100d gemäß der fünften Ausführungsform über das
Eingabeterminal 106 zur Eingabe des manuellen Steuersignals
Min von außen,
wie z. B. eine Maus oder eine Fernsteuerung, und die Steuerung des
Schalters 101c durch den Datenanalysator 165 wird
gemäß dem manuellen
Steuersignal Min vom Eingabeterminal 106 her geändert. Deshalb kann – bis der
Benutzer eigengesteuert ein reproduziertes Bild empfängt – lediglich
der kodierte Form-Bitstrom dekodiert werden, ohne den kodierten Textur-Bitstrom
zu dekodieren, und das ermöglicht
es dem Benutzer, bei der Reproduktion eines in einem Aufzeichnungsmedium
aufgezeichneten kodierten Signals schnell den Kopf des Objektbilds
aufzufinden.
-
In der zweiten bis zur fünften Ausführungsform
werden der Kodierungs- oder der Dekodierungsprozess für das kodierte
Beliebigformsignal 500 (1(a))
und für
das kodierte Binärsignal 600 (1(b)) eingesetzt, was dem
Inter-Rahmen-Vorhersage-Kodierungsverfahren
entspricht. Jedoch kann das Grundprinzip der vorliegenden Erfindung, das
darin besteht, einen Bild-Identifikator zur Identifizierung von
Bildsignalen mit unterschiedlichen Datenstrukturen, wie z. B. von
einem Beliebigform-Bildsignal und einem binäres Bildsignal, dann hinzuzufügen, wenn
diese Bildsignale für
die Übermittlung
kodiert werden, und den Bild-Identifikator bei der Dekodierung dieser
kodierten Signale zu detektieren, so dass der Dekodierungsprozess
den kodierten Signalen, wie z. B. einem kodierten Beliebigformsignal
und einem kodierten Binärsignal,
angepasst ist, auch für das
kodierte Beliebigformsignal 500b mit der in 2(a) dargestellten Datenstruktur
und das kodierte Binärsignal 600b mit
der in 2(b) dargestellten Datenstruktur
verwendet werden.
-
Ferner werden in der ersten bis zur
fünften Ausführungsform
als Bild-Identifikatoren zur Identifizierung kodierter Bildsignale
mit unterschiedlichen Datenstrukturen Form-Identifikatoren (SID = 0 oder 1) verwendet,
von denen jeder einen 1-Bit-Kode zur Identifizierung eines kodierten
Beliebigformsignals oder eines kodierten Binärsignals umfasst. Es können jedoch
Bild-Identifikatoren mit 2-Bit-Kodes (SID = 00, 01, 10 oder 11)
oder 3-Bit-Kodes verwendet werden. In diesem Falle ist es möglich, mehrere
kodierte Bildsignale durch Bild-Identifikatoren zu identifizieren.
-
Wird eine Anzahl von kodierten Bildsignalen mit
den Bild-Identifikatoren identifiziert, dann kann für ein vorgeschriebenes
kodiertes Bildsignal ein Bild-Identifikator verwendet werden, dessen
Bitzahl sich von der Bitzahl der Bild-Identifikatoren der anderen
kodierten Bildsignale unterscheidet. Zum Beispiel kann ein kodiertes
Bildsignal mit einem Bild-Identifikator,
der einen 2-Bit-Kode enthält,
und ein kodiertes Bildsignal mit einem Bild-Identifikator, der einen 3-Bit-Kode
enthält,
mit einem System behandelt werden, das zu einem einzigen Kodierungsverfahren korrespondiert.
In diesem Fall kann die Kode-Zuordnung
zu jedem Bild-Identifikator mit hoher Effizienz ausgeführt werden.
-
Im Folgenden werden eine Datenstruktur
zur Bildübertragung
und ein Bild-Dekodierungsverfahren beschrieben,
in denen Bild-Identifikatoren mit Kodes von zwei oder mehr Bits
verwendet werden.
-
[Ausführungsform 6]
-
10(a)–10(c) sind schematische Darstellungen
zur Erläuterung
der Datenstrukturen für
die Bildübertragung
gemäß einer
sechsten Ausführungsform
der vorliegenden Erfindung. 10(a) zeigt eine
Datenstruktur eines kodierten Beliebigformsignals, das durch Kodierung
eines Beliebigform-Bildsignals erhalten wurde, welches zu einem
von mehreren Objekten gehört,
aus denen ein Displaybild besteht. 10(b) zeigt
eine Datenstruktur eines kodierten Binärsignals, das durch Kodierung
eines binären
Bildsignals erhalten wurde. 10(c) zeigt eine
Datenstruktur eines kodierten Rechtecksignals (kodiertes Pixelwertsignal),
das durch Kodierung eines Rechteck-Bildsignals erhalten wurde, das als Wiedergabedaten
nur ein Textursignal (Pixelwertsignal) zur Farbwiedergabe eines
Bildes enthält.
-
Diese Datenstrukturen zur Bildübertragung gemäß der sechsten
Ausführungsform
werden für
ein System eingesetzt, in dem ein Rechteck-Bildsignal, das als Wiedergabedaten
nur ein Textursignal (d. h. Leuchtdichte- und Farbdifferenzsignal)
enthält,
kompressiv kodiert und übertragen
wird, und in dem außerdem
das kodierte Rechteck-Bildsignal dekodiert und wiedergegeben wird.
Das heißt,
in diesem System sind Bild-Kodierungsverfahren und -gerät so ausgelegt,
dass sie einen Kodierungsprozess für ein Rechteck-Bildsignal ausführen, während das Bild-Dekodierungsverfahren
und -gerät
so ausgelegt sind, dass sie einen Dekodierungsprozess für ein kodiertes
Rechteck-Bildsignal (kodiertes Pixelwertsignal) ausführen.
-
In 10(a) bezeichnet
die Bezugsziffer 1500 ein kodiertes Beliebigformsignal,
das durch Kodierung eines Beliebigform-Bildsignals erhalten wurde,
welches zu einem jeden von mehreren Objekten gehört, aus denen ein Bild eines
Displaybilds besteht. Dieses kodierte Beliebigformsignal 1500 stimmt
mit dem kodierten Beliebigformsignal 500 gemäß der ersten
Ausführungsform überein,
außer
dass ein Zwei-Bit-Bild-Identifikator 1502 statt des 1-Bit-Bild-Identifikators 502 verwendet
wurde.
-
In 10(b) bezeichnet
die Bezugsziffer 1600 ein kodiertes Binärsignal, das durch Kodierung eines
binären
Bildsignals erhalten wurde, das eine Bildinformation auf einem Displaybild
mit einem Binärsignal
repräsentiert.
Das kodierte Binärsignal 1600 stimmt
mit dem kodierten binären
Formsignal 600 gemäß der ersten
Ausführungsform überein,
außer
dass ein Zwei-Bit-Bild-Identifikator 1602 statt des 1-Bit-Identifikators 602 verwendet
wurde.
-
In 10(c) bezeichnet
die Bezugsziffer 1700 ein kodiertes Pixelwertsignal, das
ein kodiertes Rechtecksignal ist, welches durch Kodierung eines Rechtecksignals
erhalten wurde, das Informationen über die vertikale und horizontale
Größe eines
Displaybilds (eines Rahmens) enthält. Dieses kodierte Pixelwertsignal
(kodiertes Rechtecksignal) 1700 stimmt mit dem in 23(c) dargestellten kodierten Pixelwertsignal 700a überein,
außer
dass ein Zwei-Bit-Bild-Identifikator 1702 zwischen dem
Synchronsignal 701 und dem Datenkopf 703 eingefügt wurde.
-
Die 2-Bit-Bild-Identifikatoren (SID) 1502, 1602 und 1702 haben
die entsprechenden Werte 01, 10 und 00, und die kodierten Signale 1500, 1600 und 1700 werden
anhand der Werte dieser Bild-Identifikatoren identifiziert.
-
Es wird eine Beschreibung der Funktions- und
der Wirkungsweise gegeben.
-
In der so aufgebauten sechsten Ausführungsform
enthält
das zum rechteckigen Bildsignal gehörende kodierte Pixelwertsignal 1700 kodierte Textur-Bitströme 71C,
die durch Kodierung eines Textursignals erhalten wurden, und einen Zwei-Bit-Bild-Identifikator 1702 zur
Anzeige, dass das Signal 1700 nur die kodierten Textur-Bitströme als Wiedergabedaten
enthält.
Somit kann durch Bezugnahme auf den Bild-Identifikator 1702 zwischen den
drei kodierten Signalen, d. h. dem kodierten Beliebigformsignal 1500,
dem kodierten Binärsignal 1600 und
dem kodierten Pixelwertsignal 1700, unterschieden werden,
und das kodierte Pixelwertsignal 1700 kann von den anderen
Signalen 1500 und 1600 unterschieden werden.
-
Im Einzelnen können in einem Bild-Dekodiergerät, das zu
MPEG2 passt und für
die Dekodierung des kodierten Pixelwertsignals 1700 vorgesehen
ist, selbst bei Eingabe des kodierten Beliebigformsignals 1500 oder
des kodierten Binärsignals 1600 diese
Signale mit Hilfe des Bild-Identifikators als Signale erkannt werden,
die sich vom kodierten Pixelwertsignal 1700 unterscheiden.
Somit kann vermieden werden, dass das kodierte Beliebigformsignal 1500 oder
das kodierte Binärsignal 1600 mit
dem an MPEG2 angepassten Dekodierungsprozess bearbeitet werden und
der Dekodierungsbetrieb abreißt. Außerdem kann
bei einer Eingabe dieser kodierten Signale die Tatsache, dass diese
Signale nicht dekodierbar sind, auf dem Displaybild dargestellt
werden.
-
In dieser sechsten Ausführungsform
der Erfindung haben das kodierte Beliebigformsignal 1500, das
kodierte Binärsignal 1600 und
das kodierte Rechtecksignal (kodiertes Pixelwertsignal) 1700 die Datenstrukturen,
die durch Inter-Rahmen-Vorhersage-Kodierung von einem zugehörigen Beliebigform-Bildsignal,
binären
Bildsignal bzw.
-
Rechteck-Bildsignal erhalten wurden.
Diese kodierten Signale können
jedoch auch Datenstrukturen haben, die durch Intra-Rahmen-Kodierung
der zugehörigen
Bildsignale erhalten wurden.
-
Außerdem werden bei den in der
sechsten Ausführungsform
verwendeten zugehörigen
kodierten Signalen einem jeden Block der kodierte Form-Bitstrom
und der kodierte Textur-Bitstrom – entweder beide oder einer
von beiden – zugeordnet.
In jedem kodierten Signal können
auch für
jeden Rahmen vorgeschriebene kodierte Bitströme angeordnet werden.
-
[Ausführungsform 7]
-
11 ist
ein Blockschema zur Veranschaulichung eines Bild-Dekodiergeräts nach
einer siebenten Ausführungsform.
Die Bezugsziffer 100e in 11 kennzeichnet
ein Bild-Dekodiergerät für die Dekodierung
kodierter Daten mit Datenstrukturen zur Bildübertragung gemäß der sechsten
Ausführungsform
der Erfindung. Dieses Bild-Dekodiergerät 100e ist wie folgt
aufgebaut. Wenn das Gerät 100e als
kodierte Daten Eo das in 10(a) dargestellte
kodierte Beliebigformsignal (Ep) 1500 und das in 10(b) dargestellte kodierte
Binärsignal
(E2) 1600 empfängt,
dann dekodiert es diese kodierten Signale nicht, sondern zeigt an,
dass diese gerade einlaufenden kodierten Daten nicht dekodierbar
sind. Empfängt
das Gerät 100e andererseits
als kodierte Daten Eo das in 10(c) dargestellte
kodierte Rechtecksignal Et (1700), dann gibt es ein dekodiertes
Rechtecksignal Dt als dekodierte Bilddaten aus.
-
Genauer gesagt enthält das Bild-Dekodiergerät 100e einen
Datenanalysator 160e, welcher die in das Eingabeterminal 160a einlaufenden
kodierten Daten Eo analysiert und entsprechend dem Analyseergebnis
ein Schaltsteuersignal SWe ausgibt; eine Textur-Dekodiereinheit 180e, die an
dem kodierten Rechtecksignal (kodiertes Pixelwertsignal) Et einen Dekodierungsprozess
einschließlich
Umkehr-DCT ausführt;
einen Schalter 101e, welcher das vom Datenanalysator 160e analysierte
und ausgegebene kodierte Signal der Dekodiereinheit 180e bzw.
der Erdleitung zuführt;
und einen Rahmen-Speichermodul 102e, der ein Vorhersage-Textursignal
speichert.
-
Der Datenanalysator 160e analysiert
die einlaufenden kodierten Daten zur Überprüfung des auf das 32-Bit-Synchronsignal
am Kopf folgenden Zwei-Bit-Bild-Identifikators,
wobei der Bild-Identifikator entweder der in 10(a) dargestellte Bild-Identifikator (SID
= 01) 1502 im kodierten Beliebigformsignal 1500 oder der
in 10(b) dargestellte Bild-Identifikator
(SID = 10) 1602 im kodierten Binärsignal oder der in 10(c) dargestellte Bild-Identifikator
(SID = 00) 1702 im kodierten Rechtecksignal ist. Ist der
gesetzte Wert des Bild-Identifikators (SID) gleich 01 oder 10, dann
steuert der Datenanalysator 160e den Schalter 101e über das
Schaltsteuersignal SWe so, dass das einlaufende kodierte Signal
auf Erdleitung gelegt wird. Wenn der gesetzte Wert des Bild- Identifikators (SID)
gleich 00 ist, dann steuert der Datenanalysator 160e den
Schalter 101e über
das Schaltsteuersignal SWe so, dass die einlaufenden kodierten Daten
in die Dekodiereinheit 180e eingegeben werden.
-
Im Weiteren stimmt die Struktur des
Datenanalysators 160e mit der des Datenanalysators 160 von
der in 7(b) dargestellten
dritten Ausführungsform überein,
und die Struktur der Textur-Dekodiereinheit 180e stimmt
mit der Struktur der Dekodiereinheit 180 von der dritten
Ausführungsform überein.
-
Im Bild-Dekodiergerät 100e wird
das dekodierte (reproduzierte ) Textursignal Dt, d. h. die Ausgabe
der Dekodiereinheit 180e, unmittelbar in den Rahmen-Speichermodul 102e und
die Wiedergabeeinheit 104 eingegeben. Es kann jedoch ein
Synthesizer, der mit dem in der dritten Ausführungsform verwendeten Synthesizer 190 (siehe 5) übereinstimmt, vor der Wiedergabeeinheit 104 angeordnet werden,
so dass das dekodierte Textursignal Dt mit einem anderen dekodierten
Beliebigformsignal synthetisiert wird.
-
Es wird eine Beschreibung der Arbeitsweise des
Bild-Dekodiergeräts 100e gegeben.
-
12 ist
ein Flussdiagramm des Dekodierungsprozesses durch das Bild-Dekodiergerät 100e nach
der siebenten Ausführungsform.
Wird ein kodiertes Bildsignal mit einer Datenstruktur, die in einer der 10(a), 10(b) oder 10(c) dargestellt
ist, in das Bild-Dekodiergerät 100e eingegeben,
dann analysiert der Datenanalysator 160e den auf das 32-Bit-Synchronsignal
folgenden 2-Bit-Bild-Identifikator und entscheidet, ob der Wert
des Bild-Identifikators (SID) 00 ist oder nicht (Schritt Se1).
-
Ist das Ergebnis der Entscheidung
nicht SID = 00, sondern SID = 01 oder SID = 10, weil das einlaufende
kodierte Bildsignal Eo ein kodiertes Beliebigformsignal Ep oder
ein kodiertes Binärsignal
E2 ist, dann steuert der Datenanalysator 160e den Schalter 101e über das
Schaltsteuersignal SWe so, dass das kodierte Signal der Erdleitung
zugeführt wird.
Dadurch wird das kodierte Beliebigformsignal Ep oder das kodierte
Binärsignal
E2 gelöscht
(Schritt Se3). Somit wird das kodierte Bildsignal E2 oder Ep, das
kodierte Form-Bitströme
enthält,
nie durch die Dekodiereinheit 180e bearbeitet.
-
Bei einer Eingabe des kodierten Beliebigformsignals
Ep oder des kodierten Binärsignals
E2 in das Gerät 100e zeigt
das Gerät 100e eine
Nachricht an, dass das gerade eingegebene kodierte Signal durch
dieses Dekodiergerät 100e nicht
verarbeitet werden kann (Schritt Se4).
-
Danach wird entschieden, ob das einlaufende
kodierte Signal aus den Daten des letzten Blocks im letzten Rahmen
besteht (Schritt Se6). Besteht das einlaufende kodierte Signal nicht
aus den Daten des letzten Blocks im letzten Rahmen, dann werden
an einem zum nächsten
Block gehörenden
kodierten Eingangssignal die Schritte Se1, Se3, Se4 und Se6 ausgeführt. Besteht
das Eingangssignal jedoch aus den Daten des letzten Blocks im letzten
Rahmen, dann ist die Dekodierung des Eingangssignals beendet.
-
Ist andererseits im Schritt Se1 das
Ergebnis der Entscheidung SID = 00, weil die einlaufenden kodierten
Daten Eo aus einem kodierten Rechtecksignal Et bestehen, dann steuert
der Datenanalysator 160e den Schalter 101e über das
Schaltsteuersignal SWe so, dass das kodierte Signal in die Dekodiereinheit 180e eingegeben
wird. Somit dekodiert die Textur-Dekodiereinheit 180e den
im kodierten Rechtecksignal Et enthaltenen kodierten Textur-Bitstrom (Schritt
Se2).
-
Im Einzelnen werden in der Dekodiereinheit 180e die
Quantisierungsskala und die DCT-Koeffizienten, die im Bitstrom enthalten
sind, in den Invers-Quantisierer 181 eingegeben, und die
DCT-Koeffizienten werden invers quantisiert. Danach wird für das invers
quantisierte Signal Diq durch den Umkehr-Kosinus-Transformator 182 eine
Umkehr-Kosinus-Transformation
ausgeführt.
-
Inzwischen wird der Textur-Bewegungsvektor
BV in den Textur-Bewegungskompensator 184 eingegeben.
Der Kompensator 184 erzeugt eine Adresse, um ein dem Textur-Bewegungsvektor
BV zugeordnetes Vorhersage-Textursignal zu erhalten, und empfängt das
Vorhersage-Textursignal Emp vom Rahmen-Speichermodul 102e unter
Verwendung der Adresse.
-
Der Addierer 183 fügt die Ausgabedaten Didct
des Umkehr-Kosinus-Transformators 182 und das Vorhersage-Textursignal
Emp zusammen und gibt das dekodierte Textursignal Dpt (dekodiertes Rechtecksignal)
an die Wiedergabeeinheit 104 aus (Schritt Se5). Gleichzeitig
wird das dekodierte Textursignal Dt in den Rahmen-Speichermodul 102e eingegeben.
Für die
Wiedergabe kann nach der Dekodiereinheit ein Synthesizer vorgesehen
werden, um das dekodierte Rechtecksignal mit einem weiteren Beliebigform-Bildsignal zu synthetisieren.
-
Danach wird entschieden, ob das kodierte Rechtecksignal
Et aus Daten des letzten Blocks im letzten Rahmen besteht (Schritt
Se6). Besteht das Signal Et nicht aus den Daten des letzten Blocks
im letzten Rahmen, dann werden die Schritte Se1, Se2, Se5 und Se6
an einem kodierten Rechtecksignal des nächsten Blocks ausgeführt. Besteht
das Signal Et aus den Daten des letzten Blocks im letzten Rahmen, dann
ist die Dekodierung des kodierten Rechtecksignals beendet.
-
Wie oben beschrieben wurde, enthält das Bild-Dekodiergerät 100e nach
der sechsten Ausführungsform
der Erfindung den Datenanalysator 160e, der die einlaufenden
kodierten Daten analysiert. Der Datenanalysator 160e stellt
mit Hilfe des Zwei-Bit-Bild-Identifikators fest, ob das in das Gerät einlaufende
kodierte Bildsignal ein kodiertes Signal ist, das als Bildinformation
kodierte Form-Bitströme (d.
h. das kodierte Binärsignal
E2 oder das kodierte Beliebigformsignal Ep) enthält, oder ob es ein kodiertes
Rechtecksignal Et ohne kodierte Form-Bitströme ist, und im Ergebnis der
Entscheidung steuert der Analysator 160e den Schalter 101e so,
dass das einlaufende kodierte Signal in die Erdleitung oder die Dekodiereinheit 180e eingegeben
wird. Deshalb werden selbst dann, wenn das kodierte Beliebigformsignal
Ep oder das kodierte Binärsignal
E2 in das Bild-Dekodiergerät 100e eingegeben
wird, welches für
das kodierte Rechtecksignal Et vorgesehen ist, diese kodierten Signale
nicht dekodiert, wodurch verhindert wird, dass es zu einem Abbruch
des Dekodierungsprozesses kommt.
-
Diese siebente Ausführungsform
ist besonders auf das Bild-Dekodiergerät 100e zugeschnitten, das
entsprechend einem Bild-Identifikator ein kodiertes Signal, das
kodierte Form-Bitströme
enthält,
aus den kodierten Signalen mit Datenstrukturen gemäß der sechsten
Ausführungsform
auswählt,
d. h. dem kodierten Beliebigformsignal 1500, dem kodierten
Binärsignal 1600 und
dem kodierten Rechtecksignal 1700. Wenn jedoch die Bild-Eingabeeinheit 110 im Bild-Kodiergerät 100a gemäß der zweiten
Ausführungsform
(vgl. 3) so aufgebaut
ist, dass es ein Beliebigform-Bildsignal, ein binäres Bildsignal
und ein Rechteck-Bildsignal identifizieren kann, dann kann ein Bild-Kodiergerät so aufgebaut
werden, dass es die Kodierung dieser Bildsignale mit Bild-Identifikatoren
zur Identifizierung der zu diesen Bildsignalen gehörenden kodierten
Signale ausführt.
-
[Ausführungsform 8]
-
13(a) und 13(b) sowie 14(a) und 14(b) sind
schematische Darstellungen zur Erläuterung von Datenstrukturen
zur Bildübertragung
entsprechend einer achten Ausführungsform
der vorliegenden Erfindung. Im Einzelnen zeigt 13(a) eine Datenstruktur eines kodierten
Beliebigformsignals (erstes kodiertes Beliebigformsignal ) 2500,
das durch Kodieren eines Beliebigform-Bildsignals mit sowohl kodierten
Form-Bitströmen als
auch kodierten Textur-Bitströmen
erhalten wurde, und 13(b) zeigt
eine Datenstruktur eines kodierten Binärsignals 2600, das
durch Kodieren eines binären
Bildsignals erhalten wurde. 14(b) zeigt
die Datenstruktur eines kodierten Rechtecksignals (kodiertes Pixelwertsignal) 2700,
das durch Kodieren eines. Rechteck-Bildsignals erhalten wurde, und 14(b) zeigt eine Datenstruktur
eines kodierten Beliebigformsignals mit Transparenz-Informationen
(zweites kodiertes Beliebigformsignal) 2800, das durch
Kodieren eines Beliebigform-Bildsignals erhalten wurde, das Transparenz-Informationen enthält.
-
Diese Datenstrukturen zur Bildübertragung gemäß der achten
Ausführungsform
werden in einem System eingesetzt, in welchem das Transparenz-Informationen
enthaltende Beliebigform-Bildsignal kompressiv kodiert und übertragen
wird, und im Weiteren wird das durch kompressives Kodieren erhaltene
zweite kodierte Beliebigformsignal dekodiert und wiedergegeben.
Das heißt,
in diesem System sind Bild-Kodierungsverfahren und -gerät so aufgebaut, dass
sie einen Kodierungsprozess für
das Transparenz-Informationen umfassende Beliebigform-Bildsignal
ausführen,
während
Bild-Dekodierungsverfahren und – gerät für die Ausführung eines
Dekodierungsprozesses für
das zweite kodierte Beliebigformsignal ausgelegt sind.
-
Das in 13(a) dargestellte
erste kodierte Beliebigformsignal 2500 stimmt mit dem in 10(a) dargestellten kodierten
Beliebigformsignal 1500 nach der sechsten Ausführungsform überein,
d. h., es wird erhalten, indem der 1-Bit-Form-Identifikator 502 im kodierten
Beliebigformsignal 500 gemäß der ersten Ausführungsform
durch einen Zwei-Bit-Bild-Identifikator 2502 ersetzt
wird.
-
Das in 13(b) dargestellte
kodierte binäre Formsignal 2600 stimmt
mit dem in 10(b) dargestellten
kodierten binären
Formsignal 1600 nach der sechsten Ausführungsform überein, d. h., es wird erhalten,
indem der 1-Bit-Form-Identifikator 602 im kodierten binären Formsignal 600 gemäß der ersten Ausführungsform
durch einen Zwei-Bit-Bild-Identifikator 2602 ersetzt wird.
-
Das in 14(a) dargestellte
kodierte Pixelwertsignal 2700 stimmt mit dem in 10(c) dargestellten kodierten
Pixelwertsignal 1700 nach der sechsten Ausführungsform überein,
d. h., es wird erhalten, indem ein Zwei-Bit-Bild-Identifikator 2702 zwischen
dem Synchronsignal 701 und dem Datenkopf 703 in
das in 23(c) dargestellte
kodierte Pixelwertsignal 700a eingefügt wird.
-
Das in 14(b) dargestellte
zweite kodierte Beliebigformsignal 2800 enthält am Anfang
ein 32-Bit-Synchronsignal 801, einen auf das Synchronsignal 801 folgenden
Zwei-Bit-Bild-Identifikator
(SID) 2802 und einen auf den Bild-Identifikator 2802 folgenden
zusätzlichen
Datenkopf 803.
-
Außerdem enthält das zweite kodierte Beliebigformsignal 2800 kodierte
Form-Bitströme 81D, welche
durch Kodierung eines Formsignals (binäres Transparenzsignal) erhalten
wurden, das die Form eines jeden Objekts als ein Bestandteil des
Beliebigform-Bildsignals
mit Transparenzinformationen darstellt; kodierte Textur-Bitströme (kodierte
Pixelwertströme) 82D,
welche durch Kodierung eines Textursignals (Pixelwertsignal) erhalten
wurden, das ein Leuchtdichtesignal und ein Farbdifferenzsignal zur Farbdarstellung
eines jeden Objekts umfasst und das ein Bestandteil des Beliebigform-Bildsignals
mit Transparenz-Informationen ist; und kodierte Transparenz-Bitströme 83D,
welche durch Kodierung eines mehrwertigen Transparenzsignals erhalten
wurden, das die Transparenz eines jeden Objekts als ein Bestandteil
des Beliebigform-Bildsignals mit Transparenz-Informationen wiedergibt.
-
Im Einzelnen sind in dem kodierten
Beliebigformsignal 2800 für jeden der Blöcke, in
die eine ein Objekt auf einem Displaybild umfassende Objektregion
unterteilt ist, ein kodierter Form-Bitstrom 81D, ein kodierter
Textur-Bitstrom 82D und ein kodierter Transparenz-Bitstrom 83D in
dieser Reihenfolge angeordnet.
-
Genauer gesagt sind auf den Datenkopf 803 folgend
angeordnet: ein kodierter Form-Bitstrom 81D1,
ein kodierter Textur-Bitstrom 82D1 und ein kodierter Transparenz-Bitstrom 83D1,
die zu einem Block D1 gehören;
ein kodierter Form-Bitstrom 81D2, ein kodierter Textur-Bitstrom 82D2 und
ein kodierter Transparenz-Bitstrom 83D2, die zu einem Block
D2 gehören;
und ein kodierter Form-Bitstrom 81D3, ein kodierter Textur-Bitstrom 82D3 und
ein kodierter Transparenz-Bitstrom 83D3, die zu einem Block
D3 gehören.
-
Außerdem enthalten, wie in 14(b) dargestellt ist, die
kodierten Form-Bitströme 81D1, 81D2 und 81D3 jeweils
längenvariant
kodierte Daten 804, 812 und 820, die
Form-Bewegungsvektoren
(in der Figur einfach als Form-BV bezeichnet) entsprechen; und längenvariant
kodierte Daten 805, 813 und 821, die
binären
Formsignalen (binären
Transparenzsignalen) entsprechen, wobei jedes Signal anzeigt, ob die
Pixel im Block innerhalb oder außerhalb des Objekts liegen
(in der Figur: Formdaten).
-
Die kodierten Textur-Bitströme 82D1, 82D2 und 82D3 enthalten
jeweils 5-Bit-kodierte Daten 806, 814 und 822,
die Quantisierungsskalen (in der Figur: Quantisierungsskala) entsprechen;
längenvariabal kodierte
Daten 807, 815 und 823, die Textur-Bewegungsvektoren
(in der Figur: Textur-BV) entsprechen; und längenvariant kodierte Daten 808, 816 und 824, die
quantisierten Signalen entsprechen, die aus dem Textursignal durch
Ausführen
von DCT und Quantisierung erhalten wurden (in der Figur: Textur-DCT-Koeffizienten).
-
Die kodierten Transparenz-Bitströme 83D1, 83D2 und 83D3 enthalten
jeweils 5-Bitkodierte Daten 809, 817 und 825,
die Quantisierungsskalen entsprechen (in der Figur: Quantisierungsskala);
längenvariant
kodierte Daten 810, 818 und 826, die
Transparenz-Bewegungsvektoren
(in der Figur: Transparenz-BV) entsprechen; und längenvariant
kodierte Daten 811, 819 und 827, die
quantisierten Signalen entsprechen, die aus dem mehrwertigen Transparenzsignal
durch Ausführen
von DCT und Quantisierung erhalten wurden (in der Figur: Transparenz-DCT-Koeffizienten).
-
Das Synchronsignal 801 ist
ein Signal zur Anzeige des Kopfes eines zu einem Objekt gehörenden kodierten
Beliebigformsignals, und es ist ein einmalig kodiertes Signal. Der
Form-Identifikator (SID) 2802 ist ein Signal zur Anzeige,
welchen Typ von den oben beschriebenen vier Typen kodierter Bildsignale das
kodierte Bildsignal hat, d. h., es ist ein Signal zur Feststellung
der Art der im kodierten Bildsignal enthaltenen Bitströme. Ist
der Wert des Bild-Identifikators (SID) gleich 01, dann wird angezeigt,
dass im kodierten Bildsignal sowohl kodierte Form-Bitströme als auch
kodierte Textur-Bitströme
vorkommen. Bei SID = 10 zeigt der Bild-Identifikator an, dass nur
die kodierten Form-Bitströme
im kodierten Signal vorliegen. Bei SID = 00 zeigt der Bild-Identifikator
an, dass nur die kodierten Textur-Bitströme im kodierten Signal vorkommen.
Wenn SID gleich 11 ist, dann zeigt der Bild-Identifikator das Vorhandensein
der kodierten Form-Bitströmen,
der kodierten Textur-Bitströmen
und der kodierten Transparenz-Bitströmen im kodierten Signal an.
-
Der Datenkopf 803 enthält Informationen
z. B. über
den Wiedergabezeitpunkt des Bildes des zugehörigen Objekts, zum Bildattribut
und zum Vorhersagemodus für
die Kodierung. Diese Daten haben jedoch keinen Bezug zur vorliegenden
Erfindung und erfordern deshalb keine ausführliche Beschreibung.
-
Der Form-BV ist die kodierte Datenmenge
eines Bewegungsvektors, der die Bewegung eines Bildes innerhalb
eines Blocks zwischen dem vorliegenden und dem vorhergehenden Rahmen
aufzeigt, und er wird zur Vorhersage eines Formsignals eines bestimmten
Blocks im vorliegenden Rahmen aus einem Formsignal des entsprechenden
Blocks im vorhergehenden Rahmen verwendet. Ferner werden die Formdaten
durch arithmetische Kodierung eines Formsignals erhalten, und die
Quantisierungsskala (im kodierten Textur-Bitstrom) ist ein Parameter
für die
inverse Quantisierung der DCT-Koeffizienten,
die erhalten werden, indem an einem Textursignal DCT und Quantisierung
ausgeführt
werden. Der Textur-BV ist ein kodiertes Signal eines Textur-Bewegungsvektors,
der die Bewegung eines Bildes innerhalb eines Blocks zwischen dem
vorliegenden und dem vorhergehenden Rahmen aufzeigt, und er wird
zur Vorhersage eines Textursignals vom vorliegenden Rahmen aus einem
Textursignal vom vorhergehenden Rahmen verwendet. Ferner werden
die Textur-DCT-Koefffizienten erhalten, indem ein quantisiertes
Signal des Textursignals längenvariant
kodiert wird. Ferner ist der Transparenz-BV ein kodiertes Signal
eines Transparenz-Bewegungsvektors, der die Bewegung eines Bildes
innerhalb eines Blocks zwischen dem vorliegenden und dem vorhergehenden
Rahme aufzeigt, und er wird zur Vorhersage eines mehrwertigen Transparenzsignals
vom vorliegenden Rahmen aus einem mehrwertigen Transparenzsignal
vom vorhergehenden Rahmen verwendet. Außerdem ist die Quantisierungsskala
(im kodierten Transparenz-Bitstrom) ein Parameter für die inverse
Quantisierung der Transparenz-DCT-Koeffizienten, die erhalten werden,
indem an einem mehrwertigen Transparenzsignal DCT und Quantisierung
ausgeführt
werden. Die Transparenz-DCT-Koeffizienten werden erhalten, indem
ein quantisiertes Signal des Transparenzsignals längenvariant
kodiert wird.
-
Obwohl diese Daten in der Figur nicht
dargestellt sind, werden im kodierten Beliebigformsignal 2800 vor
den Textur-DCT-Koeffizienten verschiedene Arten von Nebeninformationen
(Daten) untergebracht, und diese Nebendaten erfordern manchmal eine
große
Anzahl von Bits.
-
Es wird eine Beschreibung der Funktions- und
Wirkungsweise gegeben.
-
In der so aufgebauten achten Ausführungsform
enthalten die vier kodierten Bildsignale – d. h. das zu einem Beliebigform-Bildsignal
gehörende
erste kodierte Beliebigformsignal 2500, das zu einem binären Bildsignal
gehörende
kodierte Binärsignal
2600,
das zu einem Rechteck-Bildsignal gehörende kodierte Pixelwertsignal
(kodiertes Rechtecksignal) 2700 und das zu einem Beliebigform-Bildsignal
mit Transparenz-Informationen
gehörende
zweite kodierte Beliebigformsignal 2800 – wegen
der unterschiedlichen Datenstrukturen die entsprechenden Zwei-Bit-Bild-Identifikatoren 2502, 2602, 2702 und 2802 zur
Identifizierung dieser kodierten Signale. Deshalb können diese
vier kodierten Signale durch Bezugnahme auf die Bild-Identifikatoren
auf der Dekodierungsseite identifiziert werden.
-
Im Einzelnen ermöglichen die Bild-Identifikatoren
in einem Bild-Dekodiergerät,
das MPEG4 angepasst und für
die Dekodierung des oben erwähnten
kodierten Beliebigformsignals ausgelegt ist, dem Gerät eine richtige
Dekodierung des kodierten Binärsignals
und des kodierten Rechtecksignals selbst dann, wenn das kodierte
Binärsignal
und das kodierte Rechtecksignal zusätzlich zu dem ersten und dem zweiten
kodierten Beliebigformsignal eingegeben werden. Folglich kann vermieden
werden, dass das kodierte Binärsignal
und das kodierte Rechtecksignal mit einem Dekodierungsprozess verarbeitet
werden, der an MPEG4 angepasst ist, und dass der Dekodierungsprozess
abbricht.
-
In dieser achten Ausführungsform
der Erfindung haben das erste und zweite kodierte Beliebigformsignal,
das kodierte Binärsignal
sowie das kodierte Rechtecksignal die Datenstrukturen, die durch Inter-Rahmen-Vorhersage-Kodierung
eines zugehörigen
Beliebigform-Bildsignals, Beliebigform-Bildsignals mit Transparenz-Informationen,
binären
Bildsignals oder Rechteck-Bildsignals erhalten wurden. Diese kodierten
Signale können
jedoch jedoch auch Datenstrukturen haben, die durch Intra-Rahmen-Kodierung
der entsprechenden Bildsignale erzeugt wurden.
-
Außerdem ist in den jeweiligen
kodierten Signalen, die in dieser achten Ausführungsform verwendet werden,
einem jeden Block mindestens einer von den kodierten Form-, Textur-
und Transparenz-Bitströmen
zugeordnet. In jedem kodierten Signal können aber auch jedem Rahmen
vorgeschriebene kodierte Bitströme
zugeordnet werden (vgl. 2(a) und 2(b)).
-
Außerdem enthält in der Datenstruktur des
in 14(b) dargestellten
zweiten kodierten Beliebigformsignals 2800 (kodiertes Signal
des Beliebigform-Bildsignals mit Transparenzinformationen) jeder
der kodierten Transparenz-Bitströme 83D – ähnlich wie
die kodierten Textur-Bitströme 82D – einen Transparenz-BV
und eine Quantisierungsskala. Es ist jedoch nicht immer nötig, dass
der kodierte Transparenz-Bitstrom 83D im zweiten kodierten
Beliebigformsignal 2800 den Transparenz-BV und die Quantisierungsskala
enthält.
-
Hat das kodierte Signal des Beliebigform-Bildsignals
mit Transparenz-Informationen die Datenstruktur, in der die kodierten
Transparenz-Bitströme 83D keine
Transparenz-BV und keine Quantisierungsskalen enthalten, dann wird
die Dekodierung der Transparenz- DCT-Koeffizienten
unter Verwendung der Textur-BV und der Quantisierungsskalen von
den kodierten Textur-Bitströmen 82D ausgeführt.
-
[Ausführungsform 9]
-
15 ist
ein Blockschema zur Darstellung eines Bild-Dekodiergeräts gemäß einer
neunten Ausführungsform
der vorliegenden Erfindung. Die Bezugsziffer 100f in 15 kennzeichnet ein Bild-Dekodiergerät, das kodierte
Daten mit der Datenstruktur zur Bildübertragung gemäß der achten
Ausführungsform
dekodiert. Das Bild-Dekodiergerät 100f ist
so aufgebaut, dass es einen Dekodierungs-Prozess ausführt, welcher
der Datenstruktur eines als kodierte Datenmenge einlaufenden kodierten
Signals angepasst ist.
-
Im Einzelnen ist das Gerät 100f wie
folgt aufgebaut. Empfängt
das Gerät 100f als
kodierte Daten Eo das in 13(b) dargestellte
kodierte Binärsignal (E2) 2600,
dann gibt es als dekodierte Bilddaten Dsyn ein dekodiertes Binärsignal
D2 aus. Empfängt das
Gerät 100f als
kodierte Daten Eo das in 13(a) dargestellte
erste kodierte Beliebigformsignal (Ep) 2500, dann gibt
es für
jedes Objekt als dekodierte Bilddaten Dsyn ein dekodiertes Beliebigformsignal
Dp aus. Empfängt
das Gerät 100f als
kodierte Daten Eo das in 14(a) dargestellte
kodierte Rechtecksignal (Et) 2700, dann gibt es als dekodierte
Bilddaten Dsyn ein dekodiertes Rechtecksignal Dt aus. Empfängt das
Gerät 100f als
kodierte Daten Eo das in 14(b) dargestellte
zweite kodierte Beliebigformsignal (Ex) 2800, dann gibt
es für
jedes Objekt als dekodierte Bilddaten Dsyn ein dekodiertes Beliebigformsignal
Dx mit Transparenz-Informationen aus.
-
Im Weiteren wird die Struktur des
Bild-Dekodiergeräts 100f ausführlich beschrieben.
-
Das Gerät 100f enthält einen
Datenanalysator 160f, der die in das Eingabeterminal 160a einlaufenden
kodierten Daten Eo analysiert und gemäß dem Analyseergebnis ein Schaltsteuersignal
SWf ausgibt; eine Form-Dekodiereinheit (erste Dekodierhilfsmittel) 170,
welche für
die Formdaten (kodiertes Formsignal) einen arithmetischen Dekodierungsprozess
ausführt;
eine Textur-Dekodiereinheit (zweite Dekodierhilfsmittel) 180f,
welche für
die Textur-DCT-Koeffizienten Ept und die Transparenz-DCT-Koeffizienten
Egt einen Dekodierungsprozess einschließlich Umkehr-DCT ausführt; einen Schalter 101f,
welcher entsprechend dem Schaltsteuersignal SWf das vom Datenanalysator 160f analysierte
und ausgegebene kodierte Signal einer der beiden Dekodiereinheiten 170 bzw. 180f zuführt; und
einen Rahmen-Speichermodul 102f, der ein Vorhersage-Formsignal,
ein Vorhersage-Textursignal und
ein Vorhersage-Transparenzsigrial speichert.
-
Der Datenanalysator 160f analysiert
das einlaufende kodierte Signal zur Überprüfung des auf das 32-Bit-Synchronsignal
am Kopf folgenden 2-Bit-Bild-Identifikators (einer der Bild-Identifikatoren 2502, 2602, 2702 und 2802 in
den kodierten Signalen, die jeweils in den 13(a), 13(b) 14(a) und 14(b) dargestellt sind), und steuert
den Schalter 101f entsprechend dem gesetzten Wert des Bild-Identifikators
(SID).
-
Bei SID = 01 wird der Schalter 101f durch das
Schaltsteuersignal SWf so gesteuert, dass die kodierten Form-Bitströme des einlaufenden
kodierten Signals in die Form-Dekodiereinheit 170 und
die kodierten Textur-Bitströme
des kodierten Signals in die Textur-Dekodiereinheit 180f eingegeben
werden. Bei SID = 10 wird der Schalter 101f durch das Schaltsteuersignal
SWf so gesteuert, dass die einlaufenden kodierten Daten in die Form-Dekodiereinheit 170 eingegeben
werden. Bei SID = 00 wird der Schalter 101f durch das Schaltsteuersignal
SWf so gesteuert, dass die kodierten Textur-Bitströme des einlaufenden
kodierten Signals in die Textur-Dekodierhilfsmittel 180f eingegeben
werden. Bei SID = 11 wird der Schalter 101f durch das Schaltsteuersignal
SWf so gesteuert, dass die kodierten Form-Bitströme des einlaufenden kodierten
Signals in die Form-Dekodiereinheit 170 und die kodierten
Textur- sowie Transparenz-Bitströme
in die Textur-Dekodiereinheit 180f eingegeben werden.
-
Ähnlich
dem Datenanalysator 160 nach der in 7(b) dargestellten dritten Ausführungsform enthält der Datenanalysator 160f eine
Tabellen-Speichereinheit 162, einen Komparator 161 und
einen Schalter-Steuerkreis 163. In dieser neunten Ausführungsform
vergleicht der Komparator 161 den Bitstrom des einlaufenden
kodierten Signals mit dem Bitstrom der Dekodier-Referenztabelle,
die in der Tabellen-Speichereinheit 162 gespeichert ist,
und identifiziert den Bild-Identifikator, den kodierten Form-Bitstrom,
den kodierten Textur-Bitstrom
und den kodierten Transparenz-Bitstrom, die in den kodierten Daten enthalten
sind. Entsprechend dem Ergebnis der Identifizierung gibt der Komparator 161 ein
Schaltsteuersignal SWf an den Schalter 101f aus.
-
Die Textur-Dekodiereinheit (zweite
Dekodierhilfsmittel) 180f enthält einen Textur-Bewegungskompensator 184f,
der entsprechend dem Textur-Bewegungsvektor oder dem Transparenz-Bewegungsvektor
eine Adresse erzeugt, um ein Vorhersage-Textursignal oder ein Vorhersage-Transparenzsignal
zu erhalten, und der unter Verwendung der Adresse ein Vorhersage-Textursignal
Emp oder ein Vorhersage-Transparenzsignal Emg aus dem Rahmen-Speichermodul 102b empfängt. Außerdem enthält die Textur-Dekodiereinheit 180f einen
Invers-Quantisierer 181f, der die Quantisierungsskala und
die DCT-Koeffizienten im kodierten Textur-Bitstrom oder im kodierten
Transparenz-Bitstrom empfängt
und die DCT-Koeftizienten
invers quantisierf; und einen Umkehr-Kosinus-Transformator 182f,
der an den invers quantisierten DCT-Koeffizienten Diq eine Umkehr-Kosinus-Transformation
ausführt.
Außerdem enthält die Textur-Dekodiereinheit 180f einen
Addierer 183, der das Vorhersage-Textursignal Emp oder das Vorhersage-Transparenzsignal
Emg zum umkehr-kosinustransformierten Signal Didct hinzufügt und ein
reproduziertes Textursignal (dekodiertes Textursignal) Dpt oder
ein reproduziertes Transparenzsignal (dekodiertes Transparenzsignal)
Dpg ausgibt. Das reproduzierte Textursignal Dpt oder das reproduzierte Transparenzsignal
Dpg aus dem Addierer 183 wird im Rahmen-Speichermodul 102f gespeichert.
-
Das Bild-Dekodiergerät 100f enthält im Weiteren
einen Synthesizer 190f, der eine Synthese der Ausgabedaten
des Dekodiergeräts 180f (entweder das
reproduzierte Textursignal Dpt und das reproduzierte Transparenzsignal
Dpg beide zusammen oder nur das reproduzierte Textursignal Dpt)
sowie der Ausgabedaten der Dekodiereinheit 170 (das reproduzierte
Formsignal Dk entsprechend der Ausgabe der Dekodiereinheit 180f)
mit gewünschten
Bilddaten ausführt
und an die Wiedergabeeinheit 104 synthetisierte Bilddaten
Dsyn ausgibt, die das reproduzierte Beliebigformsignal Dx mit Transparenz-Informationen
oder das reproduzierte Beliebigformsignal Dp enthalten. Obwohl der
Synthesizer 190f gemäß der neunten
Ausführungsform
das reproduzierte Binärsignal
D2 von der Dekodiereinheit 170 oder das reproduzierte Rechtecksignal
Dt von der Dekodiereinheit 180f unmittelbar zur Wiedergabeeinheit 104 übermittelt,
kann das Signal D2 oder Dt im Synthesizer 190f auch mit
einem anderen Beliebigform-Bildsignal synthetisiert werden. Obwohl
das vom Synthesizer 190f ausgegebene Signal in die Wiedergabeeinheit 104 eingegeben
wird, kann es auch in ein Informationsausgabegerät, wie z. B. einen Drucker
(nicht dargestellt), eingegeben werden.
-
In dieser neunten Ausführungsform
werden für
Pixel, in denen das reproduzierte Formsignal Null ist, die Pixelwerte
im reproduzierten Textursignal und im reproduzierten Transparenzsignal
durch Pixelwerte eines vorgeschriebenen Bildes ersetzt. Das vorgeschriebene
Bild ist ein im Voraus an der Empfangsstation hergestelltes Bild
oder ein Bild, das von einem anderen Bild-Dekodiergerät reproduziert
wurde.
-
Es wird eine Beschreibung der Arbeitsweise des
Bild-Dekodiergeräts 100f gemäß der neunten Ausführungsform
gegeben.
-
16 ist
ein Flussdiagramm des Dekodierungsprozesses durch das Bild-Dekodiergerät 100f. Wird
in das Bild-Dekodiergerät 100f ein
kodiertes Bildsignal mit einer Datenstruktur, die in einer der 13(a), 13(b), 14(a),
und 14(b) dargestellt
ist, eingegeben, dann analysiert der Datenanalysator 160f den
im kodierten Bildsignal auf das 32-Bit-Synchronsignal folgenden 2-Bit-Bild-Identifikator
und entscheidet, ob der Wert des Bild-Identifikators „SID = 00 bzw. SID = 11" oder ein anderer
ist (Schritt Sf1).
-
Ist das Ergebnis der Entscheidung
SID = 00 oder 11, dann wird entschieden, ob SID = 00 oder nicht
ist (Schritt Sf2). Ist das Ergebnis der Entscheidung in Schritt
Sf2 SID = 00, weil das einlaufende kodierte Bildsignal Eo das kodierte
Rechtecksignal Et ist, dann steuert der Datenanalysator 160f den
Schalter 101f über
das Schaltsteuersignal SWf so, dass das kodierte Signal immer in
die Textur-Dekodiereinheit 180f eingegeben wird. Somit
werden in der Textur-Dekodiereinheit 180f die kodierten
Textur-Bitströme
im kodierten Rechtecksignal dekodiert (Schritt Sf3). Der Dekodierungsprozess
in Schritt Sf3 stimmt mit dem Dekodierungsprozess Se2 gemäß der siebenten
Ausführungsform überein.
Dann wird das dekodierte Rechtecksignal durch den Synthesizer 190f der
Wiedergabeeinheit 104 zur Wiedergabe zugeführt (Schritt
Sf13). Im Synthesizer 190f kann das dekodierte Rechtecksignal
Dg mit einem anderen Beliebigform-Bildsignal synthetisiert werden.
-
Danach wird entschieden, ob das kodierte Rechtecksignal
Et aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt
Sf14). Besteht das kodierte Rechtecksignal nicht aus den Daten des letzten
Blocks im letzten Rahmen, dann werden an einem zum nächsten Block
gehörenden
kodierten Rechtecksignal die Schritte Sf1 – Sf3, Sf13 und Sf14 ausgeführt. Besteht
das kodierte Rechtecksignal jedoch aus den Daten des letzten Blocks
im letzten Rahmen, dann ist die Dekodierung des kodierten Rechtecksignals
beendet.
-
Ist hingegen das Ergebnis der Entscheidung in
Schritt Sf2 SID = 11, dann ist das einlaufende kodierte Bildsignal
das zweite kodierte Beliebigformsignal Ex, das als Bildinformation
die kodierten Form-Bitströme,
die kodierten Textur-Bitströme
und die kodierten Transparenz-Bitströme umfasst. Der Datenanalysator 160f steuert
dann den Schalter 101f über
das Schaltsteuersignal SWf so, dass der zu jedem Block des kodierten
Beliebigformsignals Ex mit Transparenzsignal gehörende kodierte Form-Bitstrom
in die Form-Dekodiereinheit 170 eingegeben wird, während die
zum Block gehörenden
kodierten Textur- und Transparenz-Bitströme in die Textur-Dekodiereinheit 180f eingegeben
werden. Somit wird im zweiten kodierten Beliebigformsignal Ex der
kodierte Form-Bitstrom vom kodierten Textur-Bitstrom sowie dem kodierten
Transparenz-Bitstrom separiert (Schritt Sf4), und der separierte
Form-Bitstrom wird durch die Form-Dekodiereinheit 170 dekodiert (Schritt
Sf5), während
die separierten Textur- und Transparenz-Bitströme durch die Textur-Dekodiereinheit 180f dekodiert
werden (Schritte Sf6 und Sf7).
-
Im Einzelnen wird der kodierte Form-Bitstrom
Epk – ähnlich wie
der kodierte Form-Bitstrom E2k
des binären
Bildsignals – durch
den Form-Dekoder 170 dekodiert. Nach Abschluss der Dekodierung des
zu einem Block gehörenden
kodierten Form-Bitstroms Epk stellt der arithmetische Dekoder 171 das Ende
des zu diesem Block gehörenden
kodierten Form-Bitstroms Epk fest und gibt ein Abschlusszeitsignal
Te an den Datenanalysator 160f aus. Beim Empfang des Abschlusszeitsignals
Te steuert der Datenanalysator 160f den Schalter 101b über das Schaltsteuersignal
SWb so, dass das einlaufende kodierte Bildsignal in die Textur-Dekodiereinheit 180f eingegeben
wird.
-
Somit werden der kodierte Textur-Bitstrom Ept
und der kodierte Transparenz-Bitstrom Epg vom Datenanalysator 160f zur
Textur-Dekodiereinheit 180f geleitet. In der Dekodiereinheit 180f werden
die Quantisierungsskala und die DCT-Koeffizienten eines jeden Bitstroms
in den Invers-Quantisierer 181f eingegeben, und die DCT-Koeffizienten
werden invers quantisiert. Danach wird am invers quantisierten Signal
Diq durch den Umkehr-Kosinus-Transformator 182f eine
Umkehr-Kosinus-Transformation ausgeführt.
-
Inzwischen werden der Textur-Bewegungsvektor
BV und der Transparenz-Bewegungsvektor BV
in den Textur-Bewegungskompensator 184f eingegeben. Der
Kompensator 184f erzeugt Adressen zur Versorgung mit einem
Vorhersage-Textursignal und einem Vorhersage-Transparenzsignal,
die diesen Bewegungsvektoren BV zugeordnet sind, und erhält aus dem
Rahmen-Speichermodul 102b unter Verwendung der Adressen
ein Vorhersage-Textursignal Emp sowie ein Vorhersage-Transparenzsignal Emg.
-
Der Addieren 183 führt eine
Addition der Ausgabedaten Didct vom Umkehr-Kosinus-Transformator 182f und
des Vorhersage-Textursignals Emp oder des Vorhersage-Transparenzsignals
Emg aus und gibt ein dekodiertes Textursignal Dpt oder ein dekodiertes
Transparenzsignal Dpg aus. Diese dekodierten Signale Dpt und Dpg
werden in den Rahmen-Speichermodul 102f und den Synthesizer 190f eingegeben.
Der Synthesizer 190f führt
eine Synthese des reproduzierten Textursignals Dpt, des reproduzierten
Transparenzsignals Dpg und des dazugehörigen reproduzierten Formsignals
Dk mit einem gewünschten
Bild zur Erzeugung synthetisierter Bilddaten Dsyn aus. Beim Abschluss
der Dekodierung des kodierten Transparenz-Bitstroms stellt der Datenanalysator 160f das
Ende des kodierten Transparenz-Bitstroms fest und steuert den Schalter 101f über das
Schaltsteuersignal SWb so, dass das einlaufende kodierte Bildsignal
in die Form-Dekodiereinheit 170 eingegeben
wird.
-
Außerdem werden die reproduzierten
und synthetisierten Daten (dekodiertes Beliebigformsignal mit Transparenz-Informationen)
Dx vom Synthesizer 190f an die Wiedergabeeinheit 104 zur
Bildwiedergabe ausgegeben (Schrit Sf13).
-
Danach wird entschieden, ob das zweite
kodierte Beliebigformsignal aus den Daten des letzten Blocks im
letzten Rahmen besteht (Schritt Sf14). Besteht es nicht aus den
Daten des letzten Blocks im letzten Rahmen, dann werden an einem
zum nächsten
Block gehörenden
zweiten kodierten Beliebigformsignal die Schritte Sf1, Sf2, Sf4 – Sf7, Sf13
und Sf14 ausgeführt.
Besteht es jedoch aus den Daten des letzten Blocks im letzten Rahmen,
dann ist die Dekodierung des zweiten kodierten Beliebigformsignals
beendet.
-
Wird im Schritt Sf1 entschieden,
dass der Wert des Bild-Identifikators nicht durch „SID =
00 oder 11" gegeben
ist, dann wird in Schritt Sf8 entschieden, ob SID = 10 ist oder
nicht. Ist das Ergebnis der Entscheidung in Schritt Sf8 SID = 10,
weil das einlaufende kodierte Bildsignal Eo das kodierte Binärsignal
E2 ist, das nur die kodierten Form-Bitströme als Bildinformation enthält, dann
steuert der Datenanalysator 160f den Schalter 101f über das Schaltsteuersignal
SWf so, dass der zu jedem Block im kodierten Binärsignal gehörende kodierte Form-Bitstrom
immer in die Form-Dekodiereinheit 170 eingegeben wird.
Somit werden in der Form-Dekodiereinheit 170 die kodierten
Form-Bitströme
im kodierten Binärsignal
dekodiert (Schritt Sf9). Der Dekodierungsprozess Sf9 stimmt mit
dem Dekodierungsprozess in Schritt Sb2 gemäß der dritten Ausführungsform überein.
Dann wird das dekodierte Binärsignal
D2 über
den Synthesizer 190f zur Wiedergabe an die Wiedergabeeinheit 104 geleitet
(Schritt Sf13). Im Synthesizer 190f kann das dekodierte
Binärsignal
D2 mit einem anderen Beliebigform-Bildsignal synthetisiert werden.
-
Danach wird entschieden, ob das kodierte Binärsignal
aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt
Sf14). Besteht es nicht aus den Daten des letzten Blocks im letzten
Rahmen, dann werden an einem zum nächsten Block gehörenden kodierten
Binärsignal
die Schritte Sf1, Sf8, Sf9, Sf13 und Sf14 ausgeführt. Besteht es jedoch aus
den Daten des letzten Blocks im letzten Rahmen, dann ist die Dekodierung
des kodierten Binärsignals
beendet.
-
Ist das Ergebnis der Entscheidung
in Schritt Sf8 jedoch SID = 01, dann ist das einlaufende kodierte
Bildsignal das erste kodierte Beliebigformsignal, welches als Bildinformation
die kodierten Form-Bitströme
und die kodierten Textur-Bitströme
enthält. Der
Datenanalysator 160f steuert dann den Schalter 101f über das
Schaltsteuersignal SWf so, dass der zu jedem Block des kodierten
Beliebigformsignals gehörende
kodierte Form-Bitstrom
in die Form-Dekodiereinheit 170 eingegeben wird, während der
zum Block gehörende
kodierte Textur-Bitstrom in die Textur-Dekodiereinheit 180f eingegeben
wird. Dadurch werden im ersten kodierten Beliebigformsignal der kodierte
Form-Bitstrom und der kodierte Textur-Bitstrom voneinander separiert
(Schritt Sf10), und der separierte Form-Bitstrom wird durch die Form-Dekodiereinheit 170 dekodiert
(Schritt Sf11), während
der separierte Textur-Bitstrom durch die Textur-Dekodiereinheit 180f dekodiert
wird (Schritt Sf12). Im Weiteren werden diese. Ströme durch
die Wiedergabeeinheit 104 dargestellt (Schritt Sf13). Die
Dekodierungsprozesse in den Schritten Sf11 bzw. Sf12 stimmen mit
den Dekodierungsprozessen in den Schritten Sb4 bzw. Sb5 gemäß der dritten
Ausführungsform überein,
und die Bildwiedergabe in Schritt Sf13 stimmt mit der Bildwiedergabe
in Schritt Sb6 nach der dritten Ausführungsform überein.
-
Danach wird entschieden, ob das erste
kodierte Beliebigformsignal Ep aus den Daten des letzten Blocks
im letzten Rahmen besteht (Schritt Sf14). Besteht es nicht aus den
Daten des letzten Blocks im letzten Rahmen, dann werden an einem
zum nächsten
Block gehörenden
ersten kodierten Beliebigformsignal Ep die Schritte Sf1, Sf8 und
Sf10 – Sf14
ausgeführt.
Besteht es jedoch aus den Daten des letzten Blocks im letzten Rahmen,
dann ist die Dekodierung des ersten kodierten Beliebigformsignals
Ep beendet.
-
In dem zu dieser neunten Ausführungsform gehörenden Dekodierungsprozess
werden bei der Dekodierung des ersten oder des zweiten kodierten Beliebigformsignals
für Pixel,
in denen das reproduzierte Formsignal Null ist, die Pixelwerte im
reproduzierten Textursignal und im reproduzierten Transparenzsignal
durch Pixelwerte eines vorgeschriebenen Bildes ersetzt. Das vorgeschriebene
Bild ist ein im Voraus an der Empfangsstation hergestelltes Bild oder
ein Bild, das von einem anderen Bild-Dekodiergerät reproduziert wurde.
-
Wie oben mit Bezug auf die neunte
Ausführungsform
der Erfindung beschrieben wurde, enthält das Bild-Dekodiergerät 100f einen
Datenanalysator 160f zur Analyse der einlaufenden kodierten
Daten. Der Datenanalysator 160f detektiert einen Bild-Identifikator,
der anzeigt, um welches kodierte Signal -das kodierte Binärsignal
E2, das erste kodierte Beliebigformsignal Ep, das zweite kodierte
Beliebigformsignal Ex oder das kodierte Rechtecksignal Eg – es sich beim
einlaufenden kodierten Signal handelt, und in Abhängigkeit
vom Wert des Bild-Identifikators steuert der Analysator 160f den
Schalter 101f so, dass die Bitströme im einlaufenden kodierten
Signal passend in die Form-Dekodiereinheit 170 bzw.
die Textur-Dekodiereinheit 180f eingegeben werden. Somit
können
die oben erwähnten
vier kodierten Bildsignale, die unterschiedliche Datenstrukturen
haben, mit Dekodierungsprozessen dekodiert werden, die zu einem
einzigen Kodierungsverfahren korrespondieren.
-
In dieser neunten Ausführungsform
der Erfindung wird der kodierte Form-Bitstrom durch ein arithmetisches
Dekodierungsverfahren (erstes Dekodierungsverfahren) in der Form-Dekodiereinheit 170 dekodiert,
und der kodierte Textur-Bitstrom sowie der dekodierte Transparenz-Bitstrom
werden durch dasselbe Dekodierungsverfahren einschließlich DCT
dekodiert. Mit anderen Worten, das Dekodierungsverfahren für den kodierten
Textur-Bitstrom
(zweites Dekodierungsverfahren) stimmt mit dem Dekodierungsverfahren
für den
kodierten Transparenz-Bitstrom (drittes Dekodierungsverfahren) überein.
Der kodierte Transparenz-Bitstrom kann jedoch auch durch ein Dekodierungsverfahren
dekodiert werden, das eine Wavelet-Bearbeitung oder dergleichen
enthält
(drittes Dekodierungsverfahren) und das sich von dem Dekodierungsverfahren
einschließlich
DCT (zweites Dekodierungsverfahren) unterscheidet.
-
Diese neunte Ausführungsform der Erfindung ist
besonders auf das Bild-Dekodiergerät 100f zugeschnitten,
welches die kodierten Signale mit der für die achte Ausführungsform
beschriebenen Datenstruktur, d. h. ein erstes und zweites kodiertes
Beliebigformsignal, ein kodiertes Binärsignal und ein kodiertes Rechtecksignal,
unter Verwendung ihrer Bild-Identifikatoren identifiziert und zu
den jeweiligen Datenstrukturen passend die Dekodierungsprozesse ausführt. Wenn
jedoch die Bild-Eingabeeinheit 110 im Bild-Kodiergerät 100a gemäß der in 3 dargestellten zweiten
Ausführungsform
so aufgebaut ist, dass es ein Beliebigform-Bildsignal, ein binäres Bildsignal,
ein Rechteck-Bildsignal
und ein Beliebigform-Bildsignal mit Transparenz-Informationen identifizieren
kann, dann kann ein Bild-Kodiergerät so aufgebaut werden, dass
es die Kodierung dieser Bildsignale mit Bild-Identifikatoren zur
Identifizierung der zu diesen Bildsignalen gehörenden kodierten Signale ausführt.
-
[Ausführungsform 10]
-
17(a)–17(c) sowie 18(a)–18(b) sind schematische
Darstellungen zur Erläuterung
von Datenstrukturen zur Bildübertragung
entsprechend einer zehnten Ausführungsform.
Im Einzelnen zeigt 17(a) eine
Datenstruktur eines kodierten Beliebigformsignals (erstes kodiertes
Beliebigformsignal) 3500, das durch Kodierung eines Beliebigform-Bildsignals
mit sowohl kodierten Form-Bitströmen
als auch kodierten Textur-Bitströmen erhalten
wurde, 17(b) zeigt eine
Datenstruktur eines kodierten Binärsignals 3600, das
durch Kodierung eines binären
Bildsignals erhalten wurde, und 17(c) zeigt eine
Datenstruktur eines kodierten Rechtecksignals (kodiertes Pixelwertsignal) 3700,
das durch Kodierung eines Rechteck-Bildsignals erhalten wurde, welches
als Wiedergabedatendaten nur ein Textursignal (Pixelwertsignal)
zur Farbwiedergabe eines Bildes enthält. Ferner zeigt 18(a) eine Datenstruktur
eines kodierten Beliebigformsignals mit Transparenz-Informationen
(zweites kodiertes Beliebigformsignal) 3800, das durch
Kodierung eines Beliebigform-Bildsignals erhalten wurde, das Transparenz-Informationen enthält, und 18(b) zeigt eine Datenstruktur
eines kodierten Transparenzsignals 3900, das durch Kodierung
eines Beliebigform-Transparenzsignals erhalten wurde, das sowohl
kodierte Form- als auch kodierte Transparenz-Bitströme enthält.
-
Diese Datenstrukturen zur Bildübertragung gemäß der zehnten
Ausführungsform
werden in einem System eingesetzt, in welchem das Transparenz-Informationen
enthaltende Beliebigform-Bildsignal kompressiv kodiert und übertragen
wird, und im Weiteren wird das durch kompressive Kodierung erhaltene
zweite kodierte Beliebigformsignal dekodiert und dargestellt. Das
heißt,
in diesem System sind Bild-Kodierungsverfahren und -gerät so aufgebaut, dass
sie einen Kodierungsprozess für
das Transparenz-Informationen enthaltende Beliebigform-Bildsignal
ausführen,
während
Bild-Dekodierungsverfahren und – gerät für die Ausführung eines
Dekodierungsprozesses für
das zweite kodierte Beliebigformsignal ausgelegt sind.
-
Das in 17(a) dargestellte
erste kodierte Beliebigformsignal 3500 stimmt mit dem in 13(a) dargestellten kodierten
Beliebigformsignal 2500 nach der achten Ausführungsform überein,
d. h., es wird erhalten, indem der 1-Bit-Form-Identifikator 502
im kodierten Beliebigformsignal 500 gemäß der ersten Ausführungsform
durch einen Zwei-Bit-Bild-Identifikator 3502 ersetzt
wird.
-
Das in 17(b) dargestellte
kodierte binäre Formsignal 3600 stimmt
mit dem in 13(b) dargestellten
kodierten binären
Formsignal 2600 nach der achten Ausführungsform überein, d. h., es wird erhalten,
indem der 1-Bit-Form-Identifikator 602 im kodierten binären Formsignal 600 gemäß der ersten
Ausführungsform
durch einen Zwei-Bit-Bild-Identifikator 3602 ersetzt wird.
-
Das in 17(c) dargestellte
kodierte Rechtecksignal (kodiertes Pixelwertsignal) 3700 stimmt
mit dem in 14(a) dargestellten
kodierten Rechtecksignal 2700 nach der achten Ausführungsform überein, d.
h., es wird erhalten, indem ein Zwei-Bit-Bild-Identifikator 3702 zwischen
dem Synchronsignal 701 und dem Datenkopf 703 in
das in 23(c) dargestellte kodierte
Pixelwertsignal 700a eingefügt wird.
-
Das in 18(a) dargestellte
zweite kodierte Beliebigformsignal 3800 stimmt mit dem
in 14(b) dargestellten
zweiten kodierten Beliebigformsignal 2800 nach der achten
Ausführungsform überein und enthält einen
Zwei-Bit-Bild-Identifikator 3802.
-
Außerdem enthält das in 18(b) dargestellte kodierte Transparenzsignal
am Anfang ein 32-Bit-Synchronsignal 901, einen auf das
Synchronsignal 901 folgenden 3-Bit-Bild-Identifikator (SID) 3902 und
einen auf den Identifikator 3902 folgenden zusätzlichen
Datenkopf 903.
-
Außerdem enthält das kodierte Transparenzsignal 3900 kodierte
Form-Bitströme 91E,
die durch Kodierung eines Formsignals (binären Transparenzsignals) erhalten
wurden, welches als ein Bestandteil des Beliebigform-Transparenzsignals
die Form eines jeden Objekts darstellt; und kodierte Form-Bitströme 92E,
die durch Kodierung eines mehrwertigen Transparenzsignals erhalten
wurden, welches als ein Bestandteil des Beliebigform-Bildsignals für die Gradationswiedergabe
der Transparenz eines jeden Objekts verwendet wird. Im Einzelnen
sind in dem kodierten Transparenzsignal 3900 für jeden
der Blöcke, in
die eine ein Objekt auf einem Displaybild umfassende Objektregion
unterteilt ist, ein kodierter Form-Bitstrom 91E und ein
kodierter Transparenz-Bitstrom 92E in dieser Reihenfolge
angeordnet.
-
Genauer gesagt sind auf den Datenkopf 903 folgend
angeordnet: ein kodierter Form-Bitstrom 91E1 und
ein kodierter Transparenz-Bitstrom 92E1, die zu einem Block
E1 gehören;
ein kodierter Form-Bitstrom 91E2 und ein kodierter Transparenz-Bitstrom 92E2,
die zu einem Block E2 gehören; und
ein kodierter Form-Bitstrom 91E3 und ein kodierter Transparenz-Bitstrom 92E3,
die zu einem Block E3 gehören.
-
Außerdem enthalten, wie in 18(b) dargestellt ist, die
kodierten Form-Bitströme 91E1, 91E2 und 91E3 jeweils
längenvariant
kodierte Daten 904, 909 und 914, die
Form-Bewegungsvektoren
(in der Figur einfach als Form-BV bezeichnet) entsprechen; und längenvariant
kodierte Daten 905, 910 und 915, die
binären
Formsignalen (binären
Transparenzsignalen) entsprechen, wobei jedes Signal anzeigt, ob die
Pixel in dem Block innerhalb oder außerhalb des jeweiligen Objekts
liegen (in der Figur: Formdaten).
-
Die kodierten Transparenz-Bitströme 92E1, 92E2 und 92E3 enthalten
jeweils 5-Bitkodierte Daten 906, 911 und 916,
die Quantisierungsskalen entsprechen (in der Figur: Quantisierungsskala);
längenvariant
kodierte Daten 907, 912 und 917, die
Transparenz-Bewegungsvektoren
entsprechen (in der Figur: Transparenz-BV); und längenvariant
kodierte Daten 908, 913 und 918, die
quantisierten Signalen entsprechen, die aus dem mehrwertigen Transparenzsignal
durch Ausführen
von DCT und Quantisierung erhalten werden (in der Figur: Transparenz-DCT-Koeffizienten).
-
Das Synchronsignal 901 ist
ein Signal zur Anzeige des Kopfes eines zu einem Objekt gehörenden kodierten
Transparenzsignals, und es ist ein einmalig kodiertes Signal. Der
Form-Identifikator (SID) 3902 ist ein Signal zur Anzeige,
welchen Typ von den oben beschriebenen fünf Typen kodierter Bildsignale das
kodierte Bildsignal hat, d. h., es ist ein Signal zur Feststellung
der Art der im kodierten Bildsignal enthaltenen Bitströme. Ist
der Wert des Bild-Identifikators (SID) gleich 10, dann wird angezeigt,
dass im kodierten Bildsignal als Wiedergabedaten sowohl kodiere
Form-Bitströme
als auch kodierte Textur-Bitströme vorkommen.
Bei SID = 010 zeigt der Bild-Identifikator an, dass nur die kodierten
Form-Bitströme
im kodierten Signal vorliegen. Bei SID = 00 zeigt der Bild-Identifikator
an, dass nur die kodierten Textur-Bitströme im kodierten Signal vorkommen. Wenn
SID gleich 11 ist, dann zeigt der Bild-Identifikator das Vorhandensein
der kodierten Form-Bitströme, der
kodierten Textur-Bitströme
und der kodierten Transparenz-Bitströme im kodierten Signal an.
Gilt aber SID = 011, dann zeigt der Bild-Identifikator an, dass
im kodierten Signal die kodierten Form- und die kodierten Transparenz-Bitströme vorliegen.
-
Der Datenkopf 903 enthält Informationen
z. B. über
den Wiedergabezeitpunkt des Bildes des zugehörigen Objekts, zum Bildattribut
und zum Vorhersagemodus für
die Kodierung. Diese Daten haben jedoch keinen Bezug zur vorliegenden
Erfindung und erfordern deshalb keine ausführliche Beschreibung.
-
Der Form-BV ist die kodierte Datenmenge
eines Bewegungsvektors, der die Bewegung eines Bildes in einem Block
zwischen dem vorliegenden und dem vorhergehenden Rahmen aufzeigt,
und er wird zur Vorhersage eines Formsignals eines bestimmten Blocks
im vorliegenden Rahmen aus einem Formsignal des entsprechenden Blocks
im vorhergehenden Rahmen verwendet. Im Weiteren werden die Formdaten
durch arithmetisches Kodieren eines Formsignals erhalten, und die
Quantisierungsskala ist ein Parameter für die inverse Quantisierung
der DCT-Koeffizienten, die erhalten werden, indem an einem mehrwertigen
Transparenzsignal DCT und Quantisierung ausgeführt werden. Der Transparenz-BV
ist ein kodiertes Signal eines Transparenz-Bewegungsvektors, der
die Bewegung eines Bildes zwischen dem vorliegenden und dem vorhergehenden
Rahmen aufzeigt, und er wird zur Vorhersage eines mehrwertigen Transparenzsignals
des vorliegenden Rahmens aus einem mehrwertigen Transparenzsignal
des vorhergehenden Rahmen verwendet. Ferner werden die Transparenz-DCT-Koefffizienten
erhalten, indem ein quantisiertes Signal des mehrwertigen Transparenzsignals
längenvariant
kodiert wird.
-
Obwohl diese Daten in der Figur nicht
dargestellt sind, werden im kodierten Transparenzsignal 3900 vor
den Transparenz-DCT-Koeffizienten auch verschiedene Arten von Nebeninformationen
(Daten) untergebracht, und diese Nebendaten erfordern manchmal eine
große
Anzahl von Bits.
-
Es wird eine Beschreibung der Funktions- und
Wirkungsweise gegeben.
-
In der so aufgebauten zehnten Ausführungsform
enthalten die kodierten Bildsignale – d. h. das erste kodierte
Beliebigformsignal 3500, das kodierte Binärsignal 3600,
das kodierte Rechtecksignal 3700, das zweite kodierte Beliebigformsignal 3800 und
das kodierte Transparenzsignal 3900 – wegen ihrer unterschiedlichen
Datenstrukturen die zugehörigen Zwei-Bit-Bild-Identifikatoren 3502, 3602, 3702, 3802 und 3902 zur
Identifizierung dieser kodierten Signale. Deshalb können diese
fünf kodierten
Signale durch Bezugnahme auf die Bild-Identifikatoren auf der Dekodierungsseite
identifiziert werden.
-
Im Einzelnen ermöglichen die Bild-Identifikatoren
in einem Bild-Dekodiergerät,
das MPEG4 angepasst und für
die Dekodierung des oben erwähnten
kodierten Beliebigformsignals ausgelegt ist, dem Gerät ein richtiges
Dekodieren des kodierten Binärsignals
und des kodierten Rechtecksignals selbst dann, wenn das kodierte
Binärsignal
und das kodierte Rechtecksignal gemeinsam mit dem ersten und dem
zweiten kodierten Beliebigformsignal sowie dem Beliebigform-Transparenzsignal
eingegeben werden. Folglich kann vermieden werden, dass das kodierte
Binärsignal
und das kodierte Rechtecksignal mit einem an MPEG4 angepassten Dekodierungsprozess
verarbeitet werden und dass der Dekodierungsprozess abbricht.
-
In dieser zehnten Ausführungsform
werden die jeweiligen kodierten Signale mit unterschiedlichen Datenstrukturen
zwar durch Inter-Rahmen-Vorhersage-Kodierung erhalten, diese kodierten
Signale können
jedoch auch durch Intra-Rahmen-Kodierung erzeugt werden.
-
Außerdem ist in den zugehörigen kodierten Signalen,
die in dieser zehnten Ausführungsform
verwendet werden, einem jeden Block mindestens einer von den kodierten
Form-, Textur- und Transparenz-Bitströmen zugeordnet. In jedem kodierten
Signal können
aber auch in jedem Rahmen vorgeschriebene kodierte Bitströme angeordnet
werden.
-
Wie in der achten Ausführungsform
der Erfindung enthält
außerdem
jeder der kodierten Transparenz-Bitströme 83D in der Datenstruktur
des in 18(a) dargestellten
zweiten kodierten Beliebigformsignals 3800 (kodiertes Signal
des Beliebigform-Bildsignals mit Transparenzinformationen) einen
Transparenz-BV und eine Quantisierungsskala. Es ist jedoch nicht
immer nötig,
dass der kodierte Transparenz-Bitstrom 83D im zweiten kodierten
Beliebigformsignal 3800 den Transparenz-BV und die Quantisierungsskala
enthält,
und die Dekodierung der Transparenz-DCT-Koeffizienten kann unter
Verwendung von Textur-BV sowie Quantisierungsskala des kodierten
Textur-Bitstroms 82D ausgeführt werden.
-
[Ausführungsform 11]
-
19 ist
ein Blockschema zur Darstellung eines Bild-Dekodiergeräts gemäß einer
elften Ausführungsform
der vorliegenden Erfindung. Die Bezugsziffer 100g in 11 kennzeichnet ein Bild-Dekodiergerät, das kodierte
Daten mit der Datenstruktur zur Bildübertragung entsprechend der
zehnten Ausführungsform
dekodiert. Das Bild-Dekodiergerät 100g ist
so aufgebaut, dass es einen Dekodierungs-Prozess ausführt, welcher
der Datenstruktur eines als kodierte Datenmenge einlaufenden kodierten
Signals angepasst ist.
-
Im Einzelnen ist das Gerät 100g wie
folgt aufgebaut. Empfängt
das Gerät 100g als
kodierte Daten Eo das in 17(b) dargestellte
kodierte Binärsignal
(E2) 3600, dann gibt es als dekodierte Bilddaten Dsyn ein
dekodiertes Binärsignal
D2 aus. Empfängt
das Gerät 100g als
kodierte Daten Eo das in 17(a) dargestellte
erste kodierte Beliebigformsignal (Ep) 3500, dann gibt
es für
jedes Objekt als dekodierte Bilddaten Dsyn ein dekodiertes Beliebigformsignal
Dp aus. Empfängt
das Gerät 100g als
kodierte Daten Eo das in 17(c) dargestellte
kodierte Rechtecksignal (Et) 3700, dann gibt es als dekodierte
Bilddaten Dsyn ein dekodiertes Rechtecksignal Dt aus. Empfängt das
Gerät 100g als
kodierte Daten Eo das in 18(a) dargestellte
zweite kodierte Beliebigformsignal (Ex) 3800, dann gibt
es für
jedes Objekt als dekodierte Bilddaten Dsyn ein dekodiertes Beliebigformsignal
Dx mit Transparenz-Informationen aus. Empfängt das Gerät 100g das in 18(b) dargestellte kodierte
Transparenzsignal (Ep) 3900, dann gibt es als dekodierte
Bilddaten Dsyn ein dekodiertes Transparenzsignal Dg aus.
-
Im Weiteren wird die Struktur des
Bild-Dekodiergeräts 100g ausführlich beschrieben.
-
Das Gerät 100g enthält einen
Datenanalysator 160g, der die in das Eingabeterminal 160a einlaufenden
kodierten Daten Eo analysiert und gemäß dem Analyseergebnis ein Schaltsteuersignal
SWg ausgibt; eine Form-Dekodiereinheit (erste Dekodierhilfsmittel) 170,
welche für
die Formdaten (kodiertes Formsignal) einen arithmetischen Dekodierungsprozess
ausführt;
eine Textur-Dekodiereinheit (zweite Dekodierhilfsmittel) 180f,
welche für
die Textur-DCT-Koeffizienten Ept und die Transparenz-DCT-Koeffizienten
Egt einen Dekodierungsprozess einschließlich Umkehr-DCT ausführt; einen Schalter 101g,
welcher entsprechend dem Schaltsteuersignal das vom Datenanalysator 160g analysierte
und ausgegebene kodierte Signal einer der beiden Dekodiereinheiten 170 bzw. 180f zuführt; und einen
Rahmen-Speichermodul 102f, der ein Vorhersage-Formsignal,
ein Vorhersage-Textursignal
und ein Vorhersage-Transparenzsignal speichert.
-
Der Datenanalysator 160g analysiert
das einlaufende kodierte Signal zur Überprüfung des auf das 32-Bit-Synchronsignal
am Kopf folgenden 2-Bit-Bild-Identifikators (einer der Bild-Identifikatoren 3502, 3702 und 3802 in
den kodierten Signalen, die jeweils in den
17(a), 17(c) und 18(a) dargestellt sind),
und steuert den Schalter 101g entsprechend dem gesetzten
Wert des Bild-Identifikators (SID).
-
Bei SID = 10 wird der Schalter 101g durch das
Schaltsteuersignal SWg so gesteuert, dass die kodierten Form-Bitströme des einlaufenden
kodierten Signals in die Form-Dekodiereinheit 170 und
die kodierten Textur-Bitströme
des kodierten Signals in die Textur-Dekodiereinheit 180f eingegeben
werden. Bei SID = 010 wird der Schalter 101g durch das Schaltsteuersignal
SWg so gesteuert, dass die einlaufenden kodierten Daten in die Form-Dekodiereinheit 170 eingegeben
werden. Bei SID = 00 wird der Schalter 101g durch das Schaltsteuersignal
SWg so gesteuert, dass die kodierten Textur-Bitströme des einlaufenden
kodierten Signals in die Textur-Dekodierhilfsmittel 180f eingegeben
werden. Bei SID = 11 wird der Schalter 101g durch das Schaltsteuersignal SWg
so gesteuert, dass die kodierten Form-Bitströme des einlaufenden kodierten
Signals in die Form-Dekodiereinheit 170 und die kodierten
Textur- sowie Transparenz-Bitströme
in die Textur-Dekodiereinheit 180f eingegeben werden. Bei
SID = 011 wird der Schalter 101g durch das Schaltsteuersignal
SWg so gesteuert, dass die kodierten Form-Bitströme im einlaufenden kodierten
Signal in die Form-Dekodiereinheit 170, die kodierten Transparenz-Bitströme aber
in die Textur-Dekodiereinheit 180f eingegeben werden.
-
Ähnlich
dem Datenanalysator 160 gemäß der in 7(b) dargestellten dritten Ausführungsform enthält der Datenanalysator 160g eine
Tabellen-Speichereinheit 162, einen Komparator 161 und einen
Schalter-Steuerkreis 163. In dieser elften Ausführungsform
vergleicht der Komparator 161 den Bitstrom des einlaufenden
kodierten Signals mit dem Bitstrom der Dekodier-Referenztabelle,
die in der Tabellen-Speichereinheit 162 gespeichert ist,
und identifiziert den Bild-Identifikator, den kodierten Form-Bitstrom,
den kodierten Textur-Bitstrom
und den kodierten Transparenz-Bitstrom, die in den kodierten Daten enthalten
sind. Entsprechend dem Ergebnis der Identifizierung steuert der
Komparator 161 den Schalter 101 g über ein Schaltsteuersignal
SWg.
-
Das Bild-Dekodiergerät 100g enthält ferner einen
Synthesizer 190g, der eine Synthese der Ausgabedaten des
Dekodiergeräts 180f (entweder
das reproduzierte Textursignal Dpt und das reproduzierte Transparenzsignal
Dpg beide zusammen oder nur das reproduzierte Textursignal Dpt bzw.
das reproduzierte Transparenzsignal Dgt) sowie der Ausgabedaten
der Dekodiereinheit 170 (das reproduzierte Formsignal Dk
entsprechend der Ausgabe der Dekodiereinheit 180f) mit
gewünschten
Bilddaten ausführt
und an die Wiedergabeeinheit 104 synthetisierte Bilddaten
Dsyn ausgibt, die das reproduzierte Beliebigformsignal Dx mit Transparenz-Informationen
oder das reproduzierte Beliebigformsignal Dp bzw. das reproduzierte
Transparenzsignal Dg enthalten Obwohl der Synthesizer 190g gemäß der elften
Ausführungsform das
reproduzierte Binärsignal
D2 von der Dekodiereinheit 170 oder das reproduzierte Rechtecksignal
Dt von der Dekodiereinheit
180f unmittelbar an die Wiedergabeeinheit 104 ausgibt,
kann das Signal D2 oder Dt im Synthesizer 190g auch mit
einem anderen Beliebigform-Bildsignal synthetisiert werden. Obwohl das
vom Synthesizer 190g ausgegebene Signal in die Wiedergabeeinheit 104 eingegeben
wird, kann es auch in ein Informationsausgabegerät, wie z. B. einen Drucker
(nicht dargestellt), eingegeben werden. Die anderen Bestandteile
stimmen mit den bereits für die
neunte Ausführungsform
beschriebenen überein.
-
In dieser elften Ausführungsform
werden für Pixel,
in denen das reproduzierte Formsignal Null ist, die Pixelwerte im
reproduzierten Textursignal durch Pixelwerte eines vorgeschriebenen
Bildes ersetzt. Das vorgeschriebene Bild ist ein im Voraus an der Empfangsstation
hergestelltes Bild oder ein Bild, das von einem anderen Bild-Dekodiergerät reproduziert wurde.
-
Es wird eine Beschreibung der Arbeitsweise des
Bild-Dekodiergeräts 100g gemäß der elften
Ausführungsform
gegeben.
-
20 ist
ein Flussdiagramm des Dekodierungsprozesses durch das Bild-Dekodiergerät 100g. Wird
in das Bild-Dekodiergerät 100g ein
kodiertes Bildsignal mit einer Datenstruktur, die in einer der 17(a), 17(b), 17(c), 18(a) und 18(b) dargestellt ist, eingegeben, dann
analysiert der Datenanalysator 160g den auf das 32-Bit-Synchronsignal
im kodierten Bildsignal folgenden 2-Bit-Kode und entscheidet, ob dieser
2-Bit-Kode 01 ist oder nicht (Schritt Sg1). Ist der 2-Bit-Kode nicht
01, dann wird weiter entschieden, ob der den Wert des Bild-Identifikators
darstellende 2-Bit-Kode „SID
= 00 oder 01" ist
oder nicht (Schritt Sg2).
-
Ist das Ergebnis der Entscheidung
in Schritt Sg2 SID = 00 oder 11, dann wird entschieden, ob SID =
00 ist oder nicht (Schritt Sg3). Ist das Ergebnis der Entscheidung
in Schritt Sg3 SID = 00, weil das einlaufende kodierte Bildsignal
Eo das kodierte Rechtecksignal (kodiertes Pixelwertsignal) Et ist,
dann steuert der Datenanalysator 160g den Schalter 101g über das
Schaltsteuersignal SWg so, dass das kodierte Signal immer in die
Textur-Dekodiereinheit 180f eingegeben wird. Dadurch werden
in der Textur-Dekodiereinheit 180f die kodierten Textur-Bitströme (kodierte
Pixelwert-Bitströme)
im kodierten Rechtecksignal dekodiert (Schritt Sg4). Der Dekodierungsprozess
in Schritt Sg4 stimmt mit dem Dekodierungsprozess Se2 gemäß der siebenten
Ausführungsform überein.
Danach wird das dekodierte Rechtecksignal Dt über den Synthesizer 190g der Wiedergabeeinheit 104 übermittelt,
um als Bild wiedergegeben zu werden (Schritt Sg18). Im Synthesizer 190g kann
das dekodierte Rechtecksignal Dt mit einem anderen Beliebigform-Bildsignal
synthetisiert werden.
-
Danach wird entschieden, ob das kodierte Rechtecksignal
Et aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt
Sg19). Besteht das kodierte Rechtecksignal nicht aus den Daten des letzten
Blocks im letzten Rahmen, dann werden an einem zum nächsten Block
gehörenden
kodierten Rechtecksignal die Schritte Sg1 – Sg4, Sg18 und Sg19 ausgeführt. Besteht
das kodierte Rechtecksignal jedoch aus den Daten des letzten Blocks
im letzten Rahmen, dann ist die Dekodierung des kodierten Rechtecksignals
beendet.
-
Ist hingegen das Ergebnis der Entscheidung in
Schritt Sg3 SID = 11, dann ist das einlaufende kodierte Bildsignal
das zweite kodierte Beliebigformsignal, das als Bildinformation
die kodierten Form-Bitströme,
die kodierten Textur-Bitströme
und die kodierten Transparenz-Bitströme umfasst. Der Datenanalysator 160g steuert
dann den Schalter 101g über das
Schaltsteuersignal SWg so, dass der zu jedem Block des zweiten kodierten
Beliebigformsignals gehörende
kodierte Form-Bitstrom in die Form-Dekodiereinheit 170 eingegeben
wird, während
die zum Block gehörenden
kodierten Textur- und
Transparenz-Bitströme
in die Textur-Dekodiereinheit 180f eingegeben werden. Somit
werden im zweiten kodierten Beliebigformsignal der kodierte Form-Bitstrom
vom kodierten Textur-Bitstrom sowie dem kodierten Transparenz-Bitstrom
separiert (Schritt Sg5), und der separierte Form-Bitstrom wird durch
die Form-Dekodiereinheit 170 dekodiert (Schritt Sg6), während die
separierten Textur- und Transparenz-Bitströme durch die Textur-Dekodiereinheit 180f dekodiert
werden (Schritte Sg7 und Sg8). Die Prozesse in den Schritten Sg5 – Sg8 stimmen
mit denen in den Schritten Sf4–Sf7
nach der neunten Ausführungsform überein.
Das dekodierte Formsignal Dxk, das dekodierte Textursignal Dxt und
das dekodierte Transparenzsignal Dgt werden durch den Synthesizer 190g synthetisiert
und als synthetisiertes Signal Dsyn wird das dekodierte Beliebigformsignal
Dx zur Wiedergabe als Bild in die Wiedergabeeinheit 104 eingegeben
(Schritt Sg18) Danach wird entschieden, ob das zweite kodierte Beliebigformsignal
Ex aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt
Sg19). Besteht es nicht aus den Daten des letzten Blocks im letzten
Rahmen, dann werden an einem zum nächsten Block gehörenden zweiten
kodierten Beliebigformsignal Ex die Schritte Sg1–Sg3, Sg5– Sg8, Sg18 und Sg19 ausgeführt. Besteht
es jedoch aus den Daten des letzten Blocks im letzten Rahmen, dann
ist die Dekodierung des zweiten kodierten Beliebigformsignals beendet.
-
Ist das Ergebnis der Entscheidung
in Schritt Sg2 SID = 10, dann ist das einlaufende kodierte Bildsignal
Eo das erste kodierte Beliebigformsignal Ep, welches als Bildinformation
die kodierten Form-Bitströme
und die kodierten Textur-Bitströme
enthält. Der
Datenanalysator 160g steuert dann den Schalter 101g über das
Schaltsteuersignal SWg so, dass der zu jedem Block des kodierten
Beliebigformsignals gehörende
kodierte Form-Bitstrom
in die Form-Dekodiereinheit 170 eingegeben wird, während der
zum Block gehörende
kodierte Textur-Bitstrom in die Textur-Dekodiereinheit 180f eingegeben
wird. Dadurch werden im kodierten Beliebigformsignal der kodierte Form-Bitstrom
und der kodierte Textur-Bitstrom voneinander separiert (Schritt
Sg9), und der separierte Form-Bitstrom
wird durch die Form-Dekodiereinheit 170 dekodiert (Schritt
Sg10), während
der separierte Textur-Bitstrom durch die Textur-Dekodiereinheit 180f dekodiert
wird (Schritt Sg11). Die Dekodierungsprozesse in den Schritten Sg9–Sf11 stimmen
mit den Dekodierungsprozessen in den Schritten Sf10–Sf12 nach
der neunten Ausführungsform überein.
-
Das dekodierte Formsignal Dpk und
das dekodierte Textursignal Dpt werden durch den Synthesizer 190g synthetisiert
und als synthetisiertes Signal Dsyn wird das erste dekodierte Beliebigformsignal Dp
zur Bildwiedergabe in die Wiedergabeeinheit 104 eingegeben
(Schritt Sg18).
-
Danach wird entschieden, ob das erste
kodierte Beliebigformsignal Ep aus den Daten des letzten Blocks
im letzten Rahmen besteht (Schritt Sg19). Besteht es nicht aus den
Daten des letzten Blocks im letzten Rahmen, dann werden an einem
zum nächsten
Block gehörenden
ersten kodierten Beliebigformsignal Ep die Schritte Sg1, Sg2 und
Sg9–Sg11,
Sg18 und Sg19 ausgeführt.
Besteht es jedoch aus den Daten des letzten Blocks im letzten Rahmen,
dann ist die Dekodierung des ersten kodierten Beliebigformsignals
beendet.
-
Außerdem wird dann, wenn die
Entscheidung im Schritt Sg1 ergibt, dass der auf das Synchronsignal
folgende 2-Bit-Kode gleich 01 ist, im Schritt Sg12 entschieden,
ob der Wert des Bild-Identifikators (SID) gleich 010 ist oder nicht.
Ist SID = 010, weil das einlaufende kodierte Bildsignal Eo das kodierte
Binärsignal
E2 ist, das nur die kodierten Form-Bitströme als Bildinformation enthält, dann steuert
der Datenanalysator 160g den Schalter 101g über das
Schaltsteuersignal SWg so, dass der zu jedem Block im kodierten
Binärsignal
gehörende
kodierte Form-Bitstrom immer in die Form-Dekodiereinheit 170 eingegeben
wird. Somit werden die kodierten Form-Bitströme im kodierten Binärsignal
in der Form-Dekodiereinheit 170 dekodiert (Schritt Sg13). Der
Dekodierungsprozess Sg13 stimmt mit dem Dekodierungsprozess in Schritt
Sb2 gemäß der dritten Ausführungsform überein.
Danach wird das dekodierte Binärsignal
D2 über
den Synthesizer 190g zur Wiedergabe an die Wiedergabeeinheit 104 geleitet (Schritt
Sg18). Im Synthesizer 190g kann das dekodierte Binärsignal
D2 mit einem anderen Beliebigform-Bildsignal synthetisiert werden.
-
Danach wird entschieden, ob das kodierte Binärsignal
aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt
Sg19). Besteht es nicht aus den Daten des letzten Blocks im letzten
Rahmen, dann werden an einem zum nächsten Block gehörenden kodierten
Binärsignal
die Schritte Sg1, Sg12, Sg13, Sg18 und Sg19 ausgeführt. Besteht
es jedoch aus den Daten des letzten Blocks im letzten Rahmen, dann
ist die Dekodierung des kodierten Binärsignals beendet.
-
Wird jedoch im Schritt Sg12 entschieden, dass
SID nicht 010 ist, dann wird in Schritt Sg14 entschieden, ob SID
gleich 011 ist oder nicht. Wenn SID nicht 011 ist, dann kehrt der
Dekodierungsprozess des Bild-Dekodiergeräts 100g zum Schritt Sg1 zurück.
-
Ist das Ergebnis der Entscheidung
in Schritt Sg14 SID = 011, weil das einlaufende kodierte Bildsignal
Eo als Bildinformation die kodierten Form-Bitströme Egk und die kodierten Transparenz-Bitströme Egt enthält, dann
steuert der Datenanalysator 160g den Schalter 101g über das
Schaltsteuersignal SWg so, dass der zu jedem Blockdes kodierten
Beliebigformsignals gehörende
kodierte Form-Bitstrom Egk in die Form-Dekodiereinheit 170 eingegeben
wird, während
der zum Block gehörende
kodierte Transparenz-Bitstrom Egt in die Textur-Dekodiereinheit 180f eingegeben
wird. Damit werden im kodierten Transparenzsignal der kodierte Form-Bitstrom
Egk und der kodierte Textur-Bitstrom Egt voneinander separiert (Schritt
Sg15), und der separierte Form-Bitstrom Egk wird durch die Form-Dekodiereinheit 170 dekodiert (Schritt
Sg16), während
der separierte Transparenz-Bitstrom
Egt durch die Textur-Dekodiereinheit 180f dekodiert wird
(Schritt Sg17).
-
Das heißt, der kodierte Form-Bitstrom
Egk wird – ähnlich wie
der kodierte Form-Bitstrom
E2k des binären
Bildsignals – durch
die Form-Dekodiereinheit 170 dekodiert. Nach Abschluss
der Dekodierung des zu einem Block gehörenden kodierten Form-Bitstroms
Egk stellt der arithmetische Dekoder 171 das Ende des zu
diesem Block gehörenden
kodierten Form-Bitstroms Egk fest und gibt ein Abschlusszeitsignal
Te an den Datenanalysator 160g aus. Beim Empfang des Abschlusszeitsignals
Te steuert der Datenanalysator 160g den Schalter 101g über das
Schaltsteuersignal SWb so, dass das einlaufende kodierte Bildsignal
in die Textur-Dekodiereinheit 180f eingegeben wird.
-
Somit wird der kodierte Transparenz-Bitstrom
Egt vom Datenanalysator 160f zur Textur-Dekodiereinheit 180f geleitet.
In der Dekodiereinheit 180f werden die Quantisierungsskala
und die DCT-Koeffizienten in jedem Bitstroms in den Invers-Quantisierer 181f eingegeben,
und die DCT-Koeffizienten werden invers quantisiert. Danach wird am
invers quantisierten Signal Diq durch den Umkehr-Kosinus-Transformator 182f eine
Umkehr-Kosinus-Transformation ausgeführt.
-
Inzwischen wird der Transparenz-Bewegungsvektor
BV in den Textur-Bewegungskompensator 184f eingegeben.
Der Kompensator 184f erzeugt eine Adresse zur Versorgung
mit einem Vorhersage-Transparenzsignal, das dem Transparenz-Bewegungsvektor BV
zugeordnet ist, und erhält aus
dem Rahmen-Speichermodul 102f unter Verwendung der Adresse
das Vorhersage-Textursignal Emg.
-
Der Addierer 183 führt eine
Addition der Ausgabedaten Didct vom Umkehr-Kosinus-Transformator 182f und
des Vorhersage-Transparenzsignals Emg aus und gibt ein dekodiertes
Transparenzsignal Dgt aus. Das dekodierte Transparenzsignal Dgt
wird in den Rahmen-Speichermodul 102f und den Synthesizer 190g eingegeben.
Der Synthesizer 190g führt
eine Synthese des reproduzierten Transparenzsignals Dgt und des
dazugehörigen
reproduzierten Formsignals Dgk mit einem gewünschten Bild zur Erzeugung
synthetisierter Bilddaten Dsyn aus. Die synthetisierten Bilddaten
Dsyn werden zur Wiedergabe als ein Bild in die Wiedergabeeinheit 104 eingegeben (Schritt
Sg18). Beim Abschluss der Dekodierung des kodierten Transparenz-Bitstroms
stellt der Datenanalysator 160g das Ende des kodierten
Transparenz-Bitstroms fest und steuert den Schalter 101f über das
Schaltsteuersignal SWg so, dass das einlaufende kodierte Bildsignal
in die Form-Dekodiereinheit 170 eingegeben
wird.
-
Danach wird entschieden, ob das eingegebene
kodierte Signal aus den Daten des letzten Blocks im letzten Rahmen
besteht (Schritt Sg19). Besteht es nicht aus den Daten des letzten
Blocks im letzten Rahmen, dann werden an einlaufenden kodierten
Daten, die zum nächsten
Block gehören,
die Schritte Sg1, Sg12 und Sg14–Sg19
ausgeführt.
Besteht es jedoch aus den Daten des letzten Blocks im letzten Rahmen,
dann ist die Dekodierung des eingegebenen kodierten Signals beendet.
-
In dieser elften Ausführungsform
werden für Pixel,
in denen das reproduzierte Formsignal Null ist, die Pixelwerte im
reproduzierten ersten und zweiten Beliebigformsignal und im reproduzierten
Transparenzsignal durch Pixelwerte eines vorgeschriebenen Bildes
ersetzt. Das vorgeschriebene Bild ist ein im Voraus an der Empfangsstation
hergestelltes Bild oder ein Bild, das von einem anderen Bild-Dekodiergerät reproduziert
wurde.
-
Wie oben mit Bezug auf die elfte
Ausführungsform
der Erfindung beschrieben wurde, enthält das Bild-Dekodiergerät 100g einen
Datenanalysator 160g zur Analyse der einlaufenden kodierten
Daten. Der Datenanalysator 160g detektiert einen Bild-Identifikator,
der anzeigt, um welches kodierte Signal -das kodierte Binärsignal
E2, das erste und zweite kodierte Beliebigformsignal Ep und Ex,
das kodierte Rechtecksignal Et oder das kodierte Transparenzsignal
Eg – es
sich beim einlaufenden kodierten Signal handelt, und je nach Wert
des Bild-Identifikators steuert der Analysator 160g den
Schalter 101g so, dass das einlaufende kodierte Signal
richtig in die Form-Dekodiereinheit 170 bzw. die Textur-Dekodiereinheit 180f eingegeben
wird. Somit können
die oben erwähnten
fünf kodierten
Bildsignale, die unterschiedliche Datenstrukturen haben, mit Dekodierungsprozessen
dekodiert werden, die zu einem einzigen Kodierungsverfahren korrespondieren.
-
Außerdem werden in dieser elften
Ausführungsform
der kodierte Textur-Bitstrom und der kodierte Transparenz-Bitstrom
in der Textur-Dekodiereinheit 180f mit demselben Dekodierungsverfahren dekodiert.
Wie in der neunten Ausführungsform
beschrieben wurde, kann der kodierte Transparenz-Bitstrom jedoch
auch mit einem Dekodierungsverfahren dekodiert werden, das sich
von dem für
den kodierten Textur-Bitstrom verwendeten unterscheidet.
-
Diese elfte Ausführungsform der Erfindung ist
darüber
hinaus besonders auf das Bild-Dekodiergerät 100g ausgerichtet,
welches die kodierten Signale mit der für die zehnte Ausführungsform
beschriebenen Datenstruktur, d. h. ein erstes und zweites kodiertes
Beliebigformsignal, ein kodiertes Binärsignal, ein kodiertes Transparenzsignal
und ein kodiertes Rechtecksignal, unter Verwendung ihrer Bild-Identifikatoren
identifiziert und zu den jeweiligen Datenstrukturen passend die
Dekodierungsprozesse ausführt.
Wenn jedoch die Bild-Eingabeeinheit 110 im Bild-Kodiergerät 100a gemäß der in 3 dargestellten zweiten
Ausführungsform
so aufgebaut ist, dass es ein Beliebigform-Bildsignal, ein binäres Bildsignal,
ein Rechteck-Bildsignal, ein Beliebigform-Transparenzsignal und
ein Beliebigform-Bildsignal mit Transparenz-Informationen identifizieren kann,
dann kann ein Bild-Kodiergerät
so aufgebaut werden, dass es die Kodierung dieser Bildsignale mit Bild-Identifikatoren zur
Identifizierung der zu diesen Bildsignalen gehörenden kodierten Signale ausführt.
-
Wird ein Kodierungs- oder Dekodierungsprogramm
zur Verwirklichung einer der oben erwähnten Bildkodier- oder -dekodiergeräten bzw.
Bildkodierungs- oder – dekodierungsverfahren
in einem Datenspeichermedium (z. B. einer Diskette) gespeichert,
dann kann die Bildverarbeitung nach einer der oben erwähnten Ausführungsformen
einfach in einem unabhängigen
Computersystem ausgeführt werden.
-
21(a)–21(c) sind schematische Darstellungen
zur Erläuterung
des Bild-Kodierungsprozesses
nach der zweiten Ausführungsform
oder des Bild-Dekodierungsprozesses
nach der dritten, vierten, fünften,
siebenten, neunten oder elften Ausführungsform mit einem Computersystem
unter Verwendung einer Diskette, die das Kodierungs- oder Dekodierungsprogramm
enthält.
-
21(a) zeigt
eine Vorderansicht einer Diskette FD, deren Querschnittsansicht
und einen Diskettenkörper
D. 21(b) zeigt ein Beispiel
für ein physisches
Format des Diskettenkörpers
D.
-
Der Diskettenkörper D steckt in einer Hülle FC,
und beide bilden die Diskette FD. Auf der Oberfläche des Diskettenkörpers D
sind konzentrisch vom äußeren Durchmesser
der Diskette zum inneren Durchmesser hin eine Vielzahl von Spuren
Tr angebracht. Jede Spur ist in 16 Winkelsektoren unterteilt. Somit
werden in der Diskette FD, die das oben erwähnte Programm enthält, die
Programmdaten in zugewiesenen Sektoren auf dem Diskettenkörper D gespeichert.
-
21(c) zeigt
die Struktur zur Speicherung des Programms auf der Diskette FD und
zur Ausführung
der Bildverarbeitung unter Verwendung des auf der Diskette FD gespeicherten
Programms.
-
Im Einzelnen werden bei Speicherung
des Programms auf der Diskette FD Programmdaten vom Computersystem
Cs über
das Disketten-Laufwerk FDD auf die Diskette FD geschrieben. Wird
das oben erwähnte
Bild-Kodiergerät
oder das Bild-Dekodiergerät im Computersystem
Cs durch das in der Diskette FD gespeicherte Programm realisiert,
dann wird das Programm aus der Diskette FD mit Hilfe des Disketten-Laufwerks
FDD gelesen und dann in das Computersystem Cs geladen.
-
In der obigen Beschreibung wird zwar
eine Diskette als Speichermedium verwendet, es kann aber auch eine
Bildplatte verwendet werden. Auch in diesem Fall kann – in ähnlicher
Weise wie bei dem oben erwähnten
Einsatz der Diskette – die
Bild-Kodierung oder -Dekodierung mittels Software ausgeführt werden.
Das Speichermedium ist nicht auf eine Diskette oder eine Bildplatte
beschränkt,
sondern es kann ein beliebiges zur Speicherung des Programms geeignetes
Medium, so z. B. eine Karte mit integriertem Schaltkreis oder ein
Festwertspeicher, verwendet werden.
-
Außerdem gibt es den Fall, dass
kodierte Bildsignale mit unterschiedlichen Datenstrukturen, wie
z. B. ein kodiertes Binärsignal,
ein kodiertes Rechtecksignal, ein erstes und ein zweites kodiertes Beliebigformsignal
und ein kodiertes Transparenzsignal, in einem Datenspeichermedium,
wie z. B. einer Bildplatte, gespeichert werden.
-
Unter der Annahme, dass die in einem
Datenspeichermedium gespeicherten kodierten Bildsignale mit unterschiedlichen
Datenstrukturen solche kodierten Bildsignale sind, die Datenstrukturen
mit Bild-Identifikatoren gemäß der ersten,
sechsten, achten oder zehnten Ausführungsform aufweisen, können – beim Auslesen
dieser kodierten Bildsignale aus dem Medium und bei der Dekodierung – die jeweiligen
kodierten Signale mit Hilfe von Identifikatoren identifiziert und
angepasst an die Datenstrukturen der kodierten Signale mit einem
Bild-Dekodierungsverfahren oder einem Bild-Dekodiergerät dekodiert werden,
die zu einem einzigen Kodierungsverfahren korrespondieren. Zum Beispiel
können
kodierte Bildsignale mit unterschiedlichen Strukturen, wie z. B.
ein kodiertes Binärsignal
oder ein kodiertes Beliebigformsignal, dekodiert werden. In diesem
Falle kommt man mit Hinblick auf das kodierte Binärsignal
bei der Erzeugung des Binärsignals
ohne ein kodiertes Blind-Textursignal
aus, wodurch die unerwünschte Zunahme
der Kode-Bitzahl weitgehend vermieden wird.