DE69818523T2

DE69818523T2 - Bilddekodierungsverfahren und -gerät

Info

Publication number: DE69818523T2
Application number: DE1998618523
Authority: DE
Inventors: Choong Seng Shatomorioka 416 Boon
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1997-07-10
Filing date: 1998-07-08
Publication date: 2004-08-05
Anticipated expiration: 2018-07-09
Also published as: US6466697B1; EP1087623A1; EP1087624B1; CN1161967C; CN1312638A; US6735344B2; US6665445B1; DE69822002D1; EP0891093A3; ES2207455T3; DE69827173T2; TW417388B; CN1196318C; ES2214213T3; JPH1188881A; EP1087624A1; DE69808188T2; KR19990013748A; CN1174629C; EP1229739A2

Description

Erfindungsgebiet
Die vorliegende Erfindung betrifft eine Datenstruktur zur Bildübertragung, ein Bild-Kodierungsverfahren, ein Bild-Dekodierungsverfahren, ein Bild-Kodiergerät, ein Bild-Dekodiergerät, ein Daten-Speichermedium, das ein Programm zur Umsetzung eines Bild-Dekodierungsprozesses enthält und ein Daten-Speichermedium, das ein kodiertes Bildsignal enthält.
Insbesondere betrifft die Erfindung eine Datenstruktur zur Bildübermittlung, die kodierte Bildsignale durch Dekodierungsprozesse, dekodierbar macht, die zu einem einzigen Kodierungsverfahren korrespondieren, dessen kodierte Bildsignale unterschiedliche Datenstrukturen haben, die sie beim Kodieren der digitalen Bildsignale nach unterschiedlichen Programmen erhalten. Im Weiteren bezieht sich die vorliegende Erfindung auf ein Bild-Kodierungsverfahren sowie ein Bild-Kodiergerät zur Erzeugung eines kodierten Bildsignals, das die oben beschriebene Datenstruktur zur Bildübertragung aufweist, und ein Bild-Dekodierungsverfahren sowie ein Bild-Dekodiergerät zum Dekodieren eines kodierten Bildsignals, das die Datenstruktur zur Bildübertragung aufweist.
Außerdem betrifft die Erfindung ein Datenspeichermedium, das ein Programm zur Umsetzung des Dekodierungsprozesses nach dem oben beschriebenen Bild-Dekodierungsverfahren enthält, und ein Datenspeichermedium, das ein kodiertes Bildsignal mit der oben beschriebenen Datenstruktur zur Bildübertragung enthält.
Hintergrund der Erfindung
Um digitale Bildinformationen mit hoher Effizienz zu speichern oder zu übertragen, ist eine Kompressionskodierung der digitalen Bildinformationen notwendig. Ein typisches Verfahren zur Kompressionskodierung digitaler Bildinformationen ist die DCT (Discrete Cosine Transformation) vertreten durch JPEG (Joint Photographic Experts Group) und MPEG (Moving Pictures Expert Group). Außerdem gibt es Wellenform-Kodierungsverfahren, wie z. B. die Subband-Kodierung, die Wavelet-Kodierung und die Fraktal-Kodierung.
Im Weiteren wird zum Entfernen redundanter Informationen zwischen Displaybildern, wie z. B. bei aufeinander folgenden Einzelbildern, eine Inter-Rahmen-Vorhersage unter Verwendung einer Bewegungskompensation ausgeführt. Das heißt, der Wert eines Pixels in dem vorliegenden Rahmen wird bestimmt durch eine Differenz zwischen diesem Pixelwert und einem Pixelwert eines Pixels im vorherigen Rahmen, und dieses Differenzsignal wird in einer Wellenform-Kodierung bearbeitet.
Im Besonderen wird – wie in 22(a) dargestellt – ein arithmetischer Kodierer 10a zum Kodieren eines binären Bildsignals S2 verwendet, das ein Binärinformations-Displaybild repräsentiert und von einem Scanner eines Fax-Apparats oder dergleichen erhalten wurde. Zum Dekodieren eines kodierten Binärsignals E2 wird – wie in 22(b) dargestellt – ein arithmetischer Dekoder 10b verwendet. Der arithmetische Kodierer 10a kodiert das binäre Bildsignal S2 mit Hilfe eines arithmetischen Kodierungsprozess, der bei Übermittlung eines Fax-Signals verwendet wird, so z. B. mit MMR (Modified Modified Reed) oder JBIG (Joint Bilevel Image Coding Expert Group), und erzeugt damit ein kodiertes Binärsignal E2. Das arithmetische Dekodiergerät 10b dekodiert das kodierte Binärsignal E2 mit Hilfe eines arithmetischen Dekodierungsprozesses, der zum arithmetischen Kodierungsprozess gehört, und stellt so ein dekodiertes Binärsignal D2 wieder her.
Wie in 22(c) dargestellt ist, umfasst ein zu einem Displaybild gehörendes kodiertes Binärsignal 600a (E2) ein Synchronsignal 601 am Anfang, einen an das Signal 601 anschließenden Datenkopf 603 und an den Datenkopf 603 anschließende Formdaten 604.
Im Weiteren wird ein in 23(a) dargestelltes Bild-Kodiergerät 20 zum Kodieren des in MPEG2 bearbeiteten digitalen Bildsignal St verwendet, und ein in 23(b) dargestelltes Bild-Dekodiergerät 25 wird zum Dekodieren des kodierten Bildsignals Et verwendet. Das in MPEG2 bearbeitete digitale Bildsignal St ist ein Rechteck-Bildsignal, das ein Leuchtdichtesignal und ein Farbdifferenzsignal zur Farbdarstellung (Gradationsdarstellung) sowie Informationen umfasst, die die horizontale und vertikale Größe eines Displaybildes (einen Rahmen) anzeigen. Das Bild-Kodiergerät 20 umfasst eine Informationsquellen-Kodierer 20a, durch den das digitale Bildsignal (Rechteck-Bildsignal) St einer Informationsquellen-Kodierung unterworfen wird, und einen Längenvariant-Kodierer 20b, der die Ausgabedaten aus dem Kodierer 20a längenvariant kodiert, um ein kodiertes Bildsignal (kodiertes Pixelwertsignal Et) zu erzeugen. Das Bild-Dekodiergerät 25 umfasst einen Längenvariant-Dekoder 25b, der das kodierte Bildsignal Et längenvariant dekodiert, und einen Informationsquellen-Dekoder 25a, der für die Ausgabedaten des Dekoders 25b eine Informationsquellen-Dekodierung ausführt, um ein dekodiertes Bildsignal (dekodiertes Pixelwertsignal) Dt zu erzeugen.
Der Informationsquellen-Kodierer 20a umfasst einen DCT-Prozessor 21, der an jedem von mehreren Blöcken, in die das Displaybild (ein Rahmen) unterteilt ist, eine DCT (Diskrete Kosinus-Transformation) ausführt, und einen Quantisierer 22, der die Ausgabedaten vom DCT-Prozessor 21 quantisiert. Der Informationsquellen-Dekoder 25a umfasst einen Invers-Quantisierer 26, der die Ausgabedaten vom Längenvariant-Dekoder 25b invers quantisiert, und einen IDCT-Prozessor 27, welcher an den Ausgabedaten des Dekoders 25b eine Umkehr-DCT ausführt. Wie in 23(c) dargestellt ist, enthält ein zu einem Displaybild gehörendes kodiertes Bildsignal 700a (Et) am Anfang ein 32-Bit-Synchronsignal 701; einen auf das Signal 701 folgenden Datenkopf 703 und kodierte Pixelwert-Bitströme (kodierte Textur-Bitströme) 71C1, 71C2, 71C3, ..., die jeweils zu den Blöcken C1, C2, C3, ... gehören, in die das Displaybild unterteilt ist. Die kodierten Textur-Bitströme 71C1, 71C2 und 71C3 enthalten jeweils zugeordnete 5-Bit-Quantisierungsskalen 704, 707 und 710, längenvariante Textur-Bewegungsvektoren (BV) 705, 708 und 711 sowie längenvariante Textur-DCT-Koeffizienten 706, 709 und 712.
In den letzten Jahren wurde ein auf dem individuellen Objekt basierendes Verfahren zur Kompressionskodierung und zur Übertragung eines Bildsignals in die praktische Nutzung überführt. Genauer gesagt wird ein Bild, das zu einem Displaybild gehört und aus mehreren Objekten besteht, in einer objektweisen Form kompressiv kodiert und übermittelt, wodurch das Daten-Kompressionsverhältnis erhöht und eine separate Dekodierung/Reproduktion der Objekte ermöglicht wird. In diesem Verfahren werden auf der Reproduktionsseite die kodierten, zu den jeweiligen Objekten gehörenden Bildsignale dekodiert und reproduziert, und die reproduzierten Bildsignale werden zusammengesetzt, um ein Bild wiederzugeben, das zu einem Displaybild korrespondiert. Dieses Objekt-zu-Objekt-Kodieren erlaubt dem Nutzer, Bilder von darzustellenden Objekten frei zu kombinieren, wodurch die Bearbeitung eines Films erleichtert wird. Außerdem ist es bei diesem Verfahren in Abhängigkeit von der Auslastung der Übertragungsstrecke, der Leistungsfähigkeit des Wiedergabegeräts und den Wünschen des Betrachters möglich, einen Film wiederzugeben, ohne die Bilder von relativ unwichtigen Objekten zu reproduzieren. Mit anderen Worten wird eine Skalierbarkeit in Objekteinheiten, d. h. ein Wechsel in der Kontraktionsskala bei der Bilddarstellung fürjedes Objekt, erreicht.
Da die entsprechenden Objekte unterschiedliche Formen aufweisen, wird beim Objekt-zu-Objekt-Kompressionskodieren eines Bildsignals so vorgegangen, dass ein Bildsignal eines Bildes beliebiger Form (im Weiteren als Beliebigform-Bildsignal bezeichnet) kompressionskodiert wird. Das Beliebigform-Bildsignal umfasst ein Textursignal (Pixelwertsignal), das zur Farbdarstellung eines Objekts (Gradationsdarstellung) dient und ein Leuchtdichtesignal sowie ein Farbdifferenzsignal enthält, und ein Signal, das die Form eines Bildes wiedergibt. Das Formsignal zeigt für jedes Pixel an, ob es als eine Komponente eines Abbildungsbereiches außerhalb oder innerhalb des Objekts liegt, und es wird durch eine Binärziffer ausgedrückt.
Ferner gibt es den Fall, dass das Beliebigform-Bildsignal zusätzlich zum Textursignal und zum Formsignal Transparenz-Informationen umfasst, welche die Transparenz eines Objekts kennzeichnen, wenn das Objekt als Vordergrundbild vor einem Hintergrundbild angeordnet ist. Die Transparenz-Informationen werden gewöhnlich durch ein mehrwertiges Transparenzsignal mit mindestens drei Bits ausgedrückt. Eine Kombination des binären Formsignals (binäres Transparenzsignal) und des mehrwertigen Transparenzsignals wird als ein Transparenzsignal bezeichnet. Das mehrwertige Transparenzsignal im Transparenzsignal wird genau gleich wie ein Textursignal im nachfolgenden Kodierungsprozess behandelt.
Wenn ein Beliebigform-Bildsignal, das sowohl ein Textursignal als auch ein binäres Formsignal umfasst, kodiert wird, dann wird zunächst das Formsignal und danach das Textursignal kodiert. In MPEG4 werden Kodierung, Übertragung und Dekodierung eines solchen Beliebigform-Bildsignals standardisiert, und 24(a) ist ein Blockschema zur Darstellung eines Bild-Kodiergeräts, das einen Kodierungsprozess ausführt, der gegenwärtig gerade als MPEG4 standardisiert wird.
In 24(a) bezeichnet die Bezugsziffer 200a ein Bild-Kodiergerät, welches ein Beliebigform-Bildsignal Sp erfasst, das zu je einem von mehreren Objekten gehört, aus denen ein Displaybild – entsprechend einem Ausgangs-Videosignal Sv einer Kamera oder eines Bildaufzeichnungs/-wiedergabe-Gerätes (VTR) – besteht, und welches das Beliebigform-Bildsignal kodiert.
Das Bild-Kodiergerät 200a enthält einen Chroma-Key-Prozessor 201, der am Vidosignal Sv einen Chroma-Key-Prozess wie folgt ausführt. Zunächst trennt der Chroma-Key-Prozessor 201 ein Beliebigform-Bildsignal, das zu jedem Objekt gehört, von einem Hintergrund-Bildsignal ab und erhält ein Formsignal Spk, das die Form des Objekts als eine Binärinformation darstellt, und ein Textursignal (Pixelwertsignal) Spt für die Farbdarstellung des Objekts, das ein Leuchtdichtesignal und ein Farbdifferenzsignal umfasst. Dann gibt der Chroma-Key-Prozessor 201 die Signale Spk und Spt für jeden aus einer Anzahl von Blöcken aus, in die ein Darstellungsgebiet entsprechend den zugehörigen Objekten auf dem Displaybild unterteilt ist. Bei der Ausgabe der Signale Spk und Spt gibt der Chroma-Key-Prozessor 201 ein Schalttaktsignal Ts aus, das den Zeitpunkt des Umschaltens zwischen dem Formsignal Spk und dem Textursignal Spt angibt. Außerdem enthält das Bild-Kodiergerät 200a einen arithmetischen Kodierer 120a, der das Formsignal Spk blockweise durch arithmetisches Kodieren kodiert (vgl. JBIG); einen Informationsquellen-Kodierer 130a, der blockweise eine DCT und eine Quantisierung des Texursignals Spt ausführt; und einen Längenvariant-Kodierer 139, der das längenvariante Kodieren der Ausgabedaten vom Informationsquellen-Kodierer 130a ausführt.
Außerdem enthält das Bild-Kodiergerät 200a einen Schalter 202, der in Abhängigkeit von einem Schalttaktsignal Ts den Ausgang des Chroma-Key-Prozessors 201 mit dem Eingang des arithmetischen Kodierers 120a oder mit dem Eingang des Informationsquellen-Kodierers 130a verbindet; und einen Multiplexer 150, der einen vom arithmetischen Kodierer 120a ausgegebenen kodierten Form-Bitstrom Epk und einen vom Längenvariant-Kodierer 139 ausgegebenen kodierten Textur-Bitstrom Ept mit anderen benötigten Signalen multiplext. Wie in 24(c) dargestellt ist, wird vom Multiplexer 150 ein kodiertes Beliebigformsignal Ep (500a) ausgegeben, in dem kodierte Form-Bitströme (Epk) 51A1, 51A2 und 51A3, kodierte Textur-Bitströme (Ept) 52A1, 52A2, und 52A3 sowie andere benötigte Signale in vorgeschriebener Anordnung zusammengestellt sind.
Der oben dargestellte arithmetische Kodierungsprozess ist in ein Verfahren zur Übermittlung eines Fax-Signals, wie z. B. MMR oder JBIG, übernommen worden, und der oben beschriebene DCT-Prozess wird im MPEG-Standard eingesetzt. Wie in 24(c) dargestellt ist, bestehen die kodierten Daten eines jeden Blocks A1, A2 und A3 aus dem kodierten Form-Bitstrom Epk und dem kodierten Textur-Bitstrom Ept.
In dem so konstruierten Kodiergerät 200a wird das Videosignal Sv durch den Chroma-Key-Prozessor 201 bearbeitet, und vom Chroma-Key-Prozessor 201 wird ein zu einem jeden Objekt gehörendes Beliebigform-Bildsignal Sp ausgegeben. Das in dem Beliebigform-Bildsignal Sp enthaltene Formsignal Spk wird über den vom Schalttaktsignal Ts gesteuerten Schalter 202 in den arithmetischen Kodierer 120a eingegeben, durch den Kodierer 120a kodiert, und als ein kodierter Form-Bitstrom Epk zum Multiplexer 150 hin ausgegeben. Andererseits wird das im Beliebigform-Bildsignal Sp enthaltene Textursignal Spt über den vom Schalttaktsignal Ts gesteuerten Schalter 202 in den Informationsquellen-Kodierer 130a eingegeben, im Kodierer 130a einer DCT und einer Quantisierung unterworfen und als ein kodierter Textur-Bitstrom Ept zum Multiplexer 150 hin ausgegeben. Das Kodieren des Formsignals Spk und das Kodieren des Textursignals Spt erfolgen blockweise.
Im Multiplexer 150 werden der kodierte Form-Bitstrom Epk, der kodierte Textur-Bitstrom Ept und andere erforderliche Signale in der vorgeschriebenen Anordnung zusammengestellt, und diese Ströme und Signale werden vom Multiplexer 150 als ein kodiertes Beliebigformsignal Ep ausgegeben.
Das in 24(b) dargestellte Bild-Dekodiergerät 200b wird zur Dekodierung des Beliebigformsignals Ep verwendet, das vom Bild-Kodiergerät 200a kodiert wurde.
Das Bild-Dekodiergerät 200b umfasst: einen Datenanalysator 160, der das kodierte Beliebigformsignal Ep analysiert und ein Steuersignal Swb ausgibt; einen arithmetischen Dekoder 170a, der eine blockweise arithmetisches Dekodierung des im kodierten Beliebigformsignal Ep enthaltenen kodierten Form-Bitstroms Epk ausführt und ein Abschlusszeitsignal Te erzeugt, wenn die arithmetische Dekodierung eines Block beendet ist; einen Informationsquellen-Dekoder 180a, welcher an dem kodierten Textur-Bitstrom Ept, der im kodierten Beliebigformsignal Ep enthalten ist, die Informationsquellen-Dekodierung, d. h. die Umkehr-DCT und die inverse Quantisierung, ausführt; einen Schalter 101b, der das vom Datenanalysator 160 ausgegebene kodierte Beliebigformsignal Ep in Abhängigkeit vom Schaltsteuersignal SWb und dem Abschlusszeitsignal Te entweder an den arithmetischen Dekoder 170a oder den Informationsquellen-Dekoder 180a ausgibt; und einen Synthesizer 190, der eine Synthese der Ausgabedaten Dpk und Dpt von den Dekodern 170a und 180a ausführt und das synthetisierte Signal als ein dekodiertes Beliebigformsignal Dp ausgibt.
In dem so aufgebauten Bild-Dekodiergerät 200b analysiert der Datenanalysator 160 beim Eingang des kodierten Beliebigformsignals Ep die in diesem Signal enthaltenen Informationen und gibt dann das Steuersignal SWb an den Schalter 101b aus, wenn er das letzte Bit des Textur-Bitstroms Ept auffindet. In Reaktion auf das Steuersignal SWb leitet der Schalter 101b die Ausgabedaten des Datenanalysators 160 an den arithmetischen Dekoder 170a weiter. Der arithmetische Dekoder 170a dekodiert den kodierten Form-Bitstrom Epk und gibt ein Abschlusszeitsignal Te aus, wenn die Dekodierung des zu einem jeden Block gehörenden kodierten Form-Bitstroms Epk abgeschlossen ist. Bei der Eingabe des Abschlusszeitsignals Te in den Datenanalysator 160 gibt der Datenanalysator 160 das Steuersignal SWb an den Schalter 101b aus, und der Schalter 101b verbindet den Ausgang des Datenanalysators 160 mit dem Informationsquellen-Dekoder 180a. Der Informationsquellen-Dekoder 180a dekodiert einen Block des im kodierten Beliebigformsignal Ep enthaltenen kodierten Textursignals Ept. Der Synthesizer 190 führt eine Synthese der Ausgabedaten des arithmetischen Dekoders 170a mit den Ausgabedaten des Informationsquellen-Dekoders 180a aus und gibt das dekodierte Beliebigformsignal Dp als ein reproduziertes Signal aus. Wenn der oben erwähnte Dekodierungsprozess des zu einem Objekt gehörenden kodierten Beliebigformsignals Ep abgeschlossen und so das zum Objekt gehörende dekodierte Beliebigformsignals Dp erzeugt ist, dann ist die Bildwiedergabe des Objekts möglich.
Obwohl mit Bezug auf die 24(a)–24(c) keine Beschreibung der Bearbeitung eines Beliebigform-Bildsignals gegeben wird, das ein mehrwertiges Transparenzsignals (Beliebigform-Bildsignal mit Transparenz-Informationen) enthält, erfolgt die Bearbeitung des mehrwertigen Transparenzsignals in derselben Weise wie die des Textursignals (Pixelwertsignals), wenn das Beliebigform-Bildsignal ein mehrwertiges Transparenzsignal enthält.
Wie oben dargestellt wurde, wird in dem konventionellen Verfahren zur Kodierung eines Bildsignals das in JBIG oder ähnlichen Standards verwendete arithmetische Kodierungsverfahren für die Kodierung eines binären Bildsignals, d. h. eines binären Formsignals, eingesetzt, während das in MPEG2 oder ähnlichen Standards verwendete Informationsquellen-Kodierungsverfahren für die Kodierung eines digitalen Bildsignals zur Farbdarstellung eines Bildes, d. h. eines Textursignals, eingesetzt wird. Ferner wird das Kodierungsverfahren von MPEG4, d. h. eine Kombination von arithmetischer und Informationsquellen-Kodierung, zur Kodierung eines Bildsignals verwendet, das ein binäres Formsignal und ein Textursignal enthält.
Es ist selbstverständlich, dass zur Dekodierung von kodierten Signalen, die mit unterschiedlichen Kodierungsverfahren erhalten wurden, die den jeweils verwendeten Kodierungsverfahren entsprechenden unterschiedlichen Dekodierungsverfahren eingesetzt werden sollten. Mit anderen Worten müssen unterschiedliche Datenanalyseverfahren im Dekodierungsprozess der kodierten Signale verwendet werden, weil im konventionellen Kodierungsprozess unterschiedliche Kodierungsverfahren zur Kodierung unterschiedlicher Arten von Bildsignalen eingesetzt werden.
Das auf MPEG4 aufbauende Bild-Dekodiergerät kann zwar ein beliebiges kodiertes Signal aus der Gruppe der binären Bildsignale (JBIG), digitalen Bildsignale (MPEG2) und Beliebigform-Bildsignale (MPEG4) dekodieren, weist aber die folgenden Mängel auf.
In einem durch blockweise Kodierung eines Beliebigform-Bildsignals erhaltenen kodierten Beliebigformsignal sind die zum jeweiligen Block gehörenden kodierten Form-Bitströme und die zum jeweiligen Blöcken gehörenden Textur-Bitströme alternierend angeordnet. Andererseits sind in einem kodierten Binärsignal, das durch blockweise Kodierung eines binären Bildsignals erhalten wurde, die zu den jeweiligen Blöcken gehörenden kodierten Form-Bitströme nacheinander angeordnet. Deshalb lässt sich beim Datenanalyseverfahren (Datenanalysator) gemäß MPEG4 das oben beschriebene Steuersignal SWb nicht ausgehend von einer Analyse des kodierten binären Bildsignals, das keinen kodierten Textur-Bitstrom enthält, erzeugen, so dass die kodierten Form-Bitströme zu den jeweiligen Blöcken im kodierten Binärsignal nicht nacheinander an den arithmetischen Dekoder 170a übergeben werden können. Genauer gesagt wird im Bild-Dekodiergerät 200b nach Abschluss der Bearbeitung eines zu einem der Blöcke gehörenden kodierten Form-Bitstroms das Abschlusszeitsignal Te vom arithmetischen Dekoder 170a an den Schalter 101b übertragen, wonach der Schalter 101b den Bitstrom vom Datenanalysator 160 an den Informationsquellen-Dekoder 180a übergibt. Da jedoch kein kodierter Textur-Bitstrom im kodierten Binärsignal enthalten ist, kann der Datenanalysator 160 nicht das Steuersignal Swb erzeugen, um den Schalter 101b so zu steuern, dass der Bitstrom in den arithmetischen Dekoder 170a eingegeben wird, und es wird ein kodierter Form-Bitstrom, der zum nächsten Block gehört, in den Informationsquellen-Dekoder 180a eingegeben.
Um eine Kodierung des binären Bildsignals mit dem üblichen Verfahren zu unterstützen, wird somit ein dem Block zugeordneter Blind-Textur-Bitstrom im Anschluss an den Form-Bitstrom eines jeden Blocks hinzugefügt, wodurch offensichtlich die Datenstruktur des kodierten Binärsignals völlig gleich der Datenstruktur des kodierten Beliebigformsignals wird. In diesem Falle kann das kodierte Binärsignal durch das auf MPEG4 aufbauende Datenanalyseverfahren analysiert und durch den auf MPEG4 aufbauenden Bild-Dekodierungsprozess dekodiert werden.
Da jedoch bei der Ausgabe des kodierten binären Bildsignals der kodierte Blind-Textur-Bitstrom zum kodierten Form-Bitstrom hinzugefügt wird, wird beim Kodierungsprozess die Bitzahl nicht ausgenutzt, was zu einer Abnahme der Kodierungseftizienz führt.
In dem auf MPEG4 aufbauenden Dekodierungsprozess ist ein kodiertes Bildsignal (kodiertes Pixelwertsignal), das durch Kodierung eines nur ein Textursignal umfassenden digitalen Bildsignals (Rechteck-Bildsignal) gemäß MPEG2 erhalten wurde, ebenso dekodierbar wie ein kodiertes Beliebigformsignal, das durch Kodieren eines Beliebigform-Bildsignals erhalten wurde. Der Grund ist der folgende. Da der Anfangs- und der Endpunkt des zu jedem Block gehörenden kodierten Textur-Bitstroms detektierbar sind, kann in einem kodierten Bildsignal, das kodierte Textur-Bitströme enthält, der Schalter 101b durch das Steuersignal SWb so gesteuert werden, dass immer der kodierte Textur-Bitstrom in den Informationsquellen-Dekoder 180b eingegeben wird.
Ferner könnten bei dem Dekodierungsprozess, der zu dem auf MPEG4 aufbauenden Kodierungsprozess gehört, die zu je einem Block gehörenden kodierten Form- und Textur-Bitströme sich nicht beide in einer im Voraus festgelegten Wiedergabezeit dekodieren lassen, wenn bei der Dekodierung eines kodierten Beliebigformsignals, das durch Kodieren eines Beliebigform-Bildsignals erhalten wurde, eine Prozessüberlastung auftritt, so dass die Bildbewegung bei der Wiedergabe nicht ausreichend stetig ist oder abbricht.
Das Dokument „The MPEG-4 video standard verification mode" in IEEE transactions on circuits and systems for video technology, US, IEEE, Inc. New York, Bd. 7, Nr. 1, 1. Februar 1997 (1997-02-01 ), S. 19–31, XP000678877, ISSN: 1051–8215 von T. Sikora bezieht sich auf eine Kodierungs-/Dekodierungstechnik eines Bildsignals und legt offen, dass die mehreren in einem Bildsignal enthaltenen Objekte in jeweils mehrere VOPs unterteilt werden, dass die betreffenden VOPs einzeln kodiert werden und dass das kodierte Bildsignal einschließlich der betreffenden kodierten VOPs empfangen und dekodiert wird. Die betreffenden VOPs enthalten Form-, Bewegungs- und Texturinformationen. Zu Beginn wird die Kodierung der in den betreffenden VOPs enthaltenen Forminformationen, dann die Kodierung der Bewegungs- und Texturinformationen ausgeführt, und das bearbeitete Bildsignal enthält alle drei Informationstypen. Zwei Kodierungsverfahren für Binärinformationen und Grauskalen-Forminformationen sind verfügbar. Die Forminformationen enthalten binäre Forminformationen zur Anzeige der binären Formsignaldaten und Grauskalen-Forminformationen, welche mehrwertige Formsignaldaten einschließlich Transparenzinformationen sind.
Die Patentschrift EP-A-0707427 legt die Kodierung eines Bildsignals mit einer beliebigen Form unter Verwendung zweier Wege, d. h. der Formsignaldaten und der Pixelwertsignaldaten, offen. Deshalb hat es Strukturen einer Formkodiereinheit und einer Pixelwertkodiereinheit. Zunächst wird die Kodierung eines Formsignals ausgeführt. Im ersten Rahmen wird eine Intrarahmen-Kodierung ausgeführt, da es dort kein Bild gibt, auf das Bezug zu nehmen ist. Ferner ist es offensichtlich, dass eine zum Pixelwertsignal gehörende kodierte Bitsequenz erzeugt und dass Formsignal sowie Pixelwertsignal kodiert wurden, wenn bei der Modenprüfung die Mode als eine andere als die Intrarahmen-Kodierungsmode erkannt wurde, weil ein Bewegungsvektor des Pixelwertsignals kodiert wurde.
Das Dokument „Object-oriented analysis-synthesis, coding of moving images signal processing", IMAGE COMMUNICATION, NL, ELSEVIER SCIENCE PUBLISHERS, AMSTERDAM, Bd. 1, Nr. 2, 1.Oktober 1989 (1989-10-01 ), S. 117–138. XP000234864, ISSN: 0923–5965 von H. G. MUSMAN et al. legt ein Verfahren zur Ausführung des Kodierens/Dekodierens offen, wobei als Parameter für jedes Objekt Informationen bezüglich Form, Farbe und Bewegung zugewiesen werden.
Darstellung der Erfindung
Die vorliegende Erfindung betrifft somit ein Bild-Dekodierungsverfahren und ein zugehöriges Bild-Dekodiergerät, wie sie in den beigefügten Ansprüchen definiert sind.
Kurze Beschreibung der Zeichnungen
1(a) und 1(b) sind schematische Darstellungen einer Datenstruktur eines kodierten Beliebigformsignals bzw. einer Datenstruktur eines kodierten Binärsignals, die gemäß einer ersten Ausführungsform, die nicht Teil der Erfindung ist, Datenstrukturen zur Bildübertragung sind.
2(a) und 2(b) sind schematische Darstellungen einer Datenstruktur eines kodierten Beliebigformsignals bzw. einer Datenstruktur eines kodierten Binärsignals, die gemäß einer Modifikation der ersten Ausführungsform Datenstrukturen zur Bildübertragung sind.
3 ist ein Blockschema zur Darstellung eines Bild-Kodiergeräts gemäß einer zweiten Ausführungsform, die nicht Teil der Erfindung ist.
4 ist ein Flussdiagramm zur Erläuterung eines Kodierungsprozesses durch das Bild-Kodiergerät gemäß der zweiten Ausführungsform.
5 ist ein Blockschema zur Darstellung eines Bild-Dekodiergeräts gemäß einer dritten, dem Verständnis der Erfindung dienlichen Ausführungsform.
6 ist ein Flussdiagramm zur Erläuterung eines Dekodierungsprozesses durch das Bild-Dekodiergerät gemäß der dritten Ausführungsform.
7(a) ist ein Blockschema zur Darstellung einer im Bild-Kodiergerät enthaltenen Bild-Eingabeeinheit gemäß der zweiten Ausführungsform, und 7(b) ist ein Blockschema zur Darstellung eines Datenanalysators, der im Bild-Dekodiergerät gemäß der dritten Ausführungsform enthalten ist.
8 ist ein Blockschema zur Darstellung eines Bild-Dekodiergeräts gemäß einer vierten Ausführungsform, die kein Teil der Erfindung ist.
9 ist ein Blockschema zur Darstellung eines Bild-Dekodiergeräts gemäß einer fünften Ausführungsform, die kein Teil der Erfindung ist.
10(a), 10(b) und 10(c) sind schematische Darstellungen, die Datenstrukturen von je einem kodierten Beliebigformsignal, kodierten Binärsignal und kodierten Rechtecksignal zeigen, welche gemäß einer sechsten Ausführungsform der Erfindung Datenstrukturen zur Bildübertragung sind.
11 ist ein Blockschema zur Darstellung eines Bild-Dekodiergeräts gemäß einer siebenten, dem Verständnis der Erfindung dienlichen Ausführungsform.
12 ist ein Flussdiagramm zur Erläuterung eines Dekodierungsprozesses durch das Bild-Dekodiergerät gemäß der siebenten Ausführungsform.
13(a) und 13(b) sind schematische Darstellungen, die eine Datenstruktur eines kodierten Beliebigformsignals bzw. eine Datenstruktur eines kodierten Binärsignals zeigen, die Datenstrukturen zur Bildübertragung gemäß einer achten Ausführungsform der Erfindung sind.
14(a) und 14(b) sind schematische Darstellungen, die eine Datenstruktur eines kodierten Rechtecksignals bzw. eine Datenstruktur eines kodierten Beliebigformsignals mit Transparenzinformationen zeigen, die Datenstrukturen zur Bildübertragung gemäß der achten Ausführungsform sind.
15 ist ein Blockschema zur Darstellung eines Bild-Dekodiergeräts gemäß einer neunten Ausführungsform der Erfindung.
16 ist ein Flussdiagramm zur Erläuterung eines Dekodierungsprozesses durch das Bild-Dekodiergerät gemäß der neunten Ausführungsform.
17(a), 17(b) und 17(c) sind jeweils Datenstrukturen eines kodierten Beliebigformsignals, kodierten Binärsignals und kodierten Rechtecksignals, die Datenstrukturen zur Bildübertragung gemäß einer zehnten Ausführungsform sind, die kein Teil der Erfindung ist.
18(a) und 18(b) sind schematische Darstellungen, die eine Datenstruktur eines kodierten Beliebigformsignals mit Transparenzinformationen bzw. eine Datenstruktur eines kodierten Transparenzsignals zeigen, die Datenstrukturen zur Bildübertragung gemäß der zehnten Ausführungsform sind.
19 ist ein Blockschema zur Darstellung eines Bild-Dekodiergeräts gemäß einer elften Ausführungsform der Erfindung.
20 ist ein Flussdiagramm zur Erläuterung eines Dekodierungsprozesses durch das Bild-Dekodiergerät gemäß der elften Ausführungsform.
21(a)–21(c) sind schematische Darstellungen zur Erläuterung eines Datenspeichermediums (21(a), 21(b)), das ein Programm zur Realisierung eines Bild-Kodiergeräts oder eines Bild-Dekodiergeräts nach einer der oben erwähnten Ausführungsformen enthält, wobei ein Computersystem (21(c)) verwendet wird.
22(a) – 22(c) sind schematische Darstellungen zur Erläuterung eines Kommunikationssystems, in dem ein Datenkompressions-Kodierungsprozess basierend auf JBIG verwendet wird, und genauer gesagt zeigen die 22(a) und 22(b) ein im System enthaltenes Bild-Kodiergerät bzw. Bild-Dekodiergerät, und die 22(c) zeigt eine im System verwendete Datenstruktur eines kodierten Bildsignals.
23(a)–23(c) sind schematische Darstellungen zur Erläuterung eines Kommunikationssystems, in dem der Datenkompressions-Kodierungsprozess basierend auf MPEG2 verwendet wird, und genauer gesagt zeigen die 23(a) und 23(b) ein im System enthaltenes Bild-Kodiergerät bzw. Bild-Dekodiergerät, und die 23(c) zeigt eine im System verwendete Datenstruktur eines kodierten Bildsignals.
24(a)–24(c) sind schematische Darstellungen zur Erläuterung eines Kommunikationssystems, in dem der Datenkompressions-Kodierungsprozess basierend auf MPEG4 verwendet wird, und genauer gesagt zeigen die 24(a) und 24(b) ein im System enthaltenes Bild-Kodiergerät bzw. Bild-Dekodiergerät, und die 24(c) zeigt eine im System verwendete Datenstruktur eines kodierten Bildsignals.
Ausführliche Beschreibung der bevorzugten Ausführungsformen
[Ausführungsform 1]
Die 1(a) und 1(b) sind schematische Darstellungen, die Datenstrukturen zur Bildübertragung entsprechend einer ersten Ausführungsform zeigen. 1(a) zeigt eine Datenstruktur eines kodierten Beliebigformsignals, das zu je einem von mehreren Objekten gehört, aus denen ein Displaybild besteht. Die Datenstruktur zur Bildübertragung gemäß der ersten Ausführungsform wird in einem Kodierungs- und Dekodierungssystem verwendet, in dem ein Beliebigform-Bildsignal kompressiv kodiert sowie übertragen wird und das kodierte Signal schließlich dekodiert und wiedergegeben wird. Das heißt, dass in diesem System Bild-Kodierungsverfahren und -gerät vor allem dafür ausgelegt sind, einen Kodierungsprozess für das Beliebigform-Bildsignal auszuführen, während das Bild-Dekodierungsverfahren und -gerät vor allem dafür ausgelegt sind, einen Dekodierungsprozess für das kodierte Beliebigformsignal auszuführen.
In 1(a) bezeichnet die Bezugsziffer 500 ein kodiertes Beliebigformsignal, das durch Kodieren eines Beliebigform-Bildsignals erhalten wurde, welches zu je einem von mehreren Objekten gehört, aus denen sich ein Bild eines Displaybildes zusammensetzt. Das kodierte Beliebigformsignal 500 umfasst ein 32-Bit-Synchronsignal 501 am Anfang, einen auf das Signal 501 folgenden 1-Bit-Form-Identifikator (Bild-Identifikator) 502 und einen auf den Identifikator 502 folgenden zusätzlichen Datenkopf 503. In der Figur wird der Form-Identifikator 502 durch „SID" gekennzeichnet.
Im Weiteren umfasst das kodierte Formsignal 500 kodierte Form-Bitströme 51A, die durch Kodieren eines Formsignals erhalten wurden, das als ein Bestandteil des Beliebigform-Bildsignals die Form eines jeden Objekts darstellt, und kodierte Textur-Bitströme (kodierte Pixelwert-Bitströme) 52A, die durch Kodieren eines Textursignals (Pixelwertsignals) erhalten wurden, das als ein Bestandteil des Beliebigform-Bildsignals ein Leuchtdichtesignal und ein Farbdifferenzsignal zur Farbdarstellung eines jeden Objekts enthält. Im Einzelnen sind im kodierten Beliebigformsignal 500 für jeden der Blöcke, in die eine Objektregion, welche ein Objekt auf einem Displaybild umfasst, unterteilt ist, ein kodierter Form-Bitstrom 51a und ein kodierter Textur-Bitstrom 52A in dieser Reihenfolge angeordnet.
Genauer gesagt sind anschließend an den Datenkopf 503 ein kodierter Form-Bitstrom 51A1 sowie ein kodierter Textur-Bitstrom 52A1, die zu einem Block A1 gehören, ein kodierter Form-Bitstrom 51A2 sowie ein kodierter Textur-Bitstrom 52A2, die zu einem Block A2 gehören, und ein kodierter Form-Bitstrom 51A3 sowie ein kodierter Textur-Bitstrom 52A3, die zu einem Block A3 gehören, angeordnet.
Im Weiteren umfassen die kodierten Form-Bitströme 51A1, 51A2 und 51A3 jeweils längenvariant kodierte Daten 504, 509 und 514, die zu Form-Bewegungsvektoren (in 1(a) „Form-BV") gehören und längenvariant kodierte Daten 505, 510 und 515, die zu binären Formsignalen gehören, von denen jedes anzeigt, ob Pixel im Block innerhalb des Objekts oder außerhalb des Objekts liegen (in der Figur „Formdaten").
Die kodierten Textur-Bitströme 52A1, 52A2 und 52A3 umfassen jeweils 5-Bit-kodierte Daten 506, 511 und 516, die zu den Quantisierungsskalen gehören (in 1(a) „Quantisierungsskala"), längenvariant kodierte Daten 507, 512 und 517, die zu den Textur-Bewegungsvektoren gehören (in der Figur „Textur-BV") und längenvariant kodierte Daten 508, 513 und 518, die zu quantisierten Signalen gehören, welche aus dem Textursignal durch Ausführen von DCT und Quantisierung erhalten wurden (in der Figur „Textur-DCT-Koeffizienten").
Das Synchronsignal 501 ist ein Signal, das den Kopf eines zu einem Objekt gehörenden kodierten Beliebigformsignals anzeigt, und es ist ein einmalig kodiertes Signal. Der Form-Identifikator (SID) 502 ist ein Signal zur Anzeige, ob sowohl kodierte Form-Bitströme als auch als auch kodierte Textur-Bitströme im kodierten Bildsignal enthalten sind oder nicht. Ist der Wert des Form-Identifikators (SID) gleich 0,dann wird angezeigt, dass sowohl kodierte Form-Bitströme als auch kodierte Textur-Bitströme im kodierten Bildsignal vorliegen. Bei SID = 1 zeigt der Form-Identifikator an, dass nur die kodierten Form-Bitströme im kodierten Signal vorliegen. Deshalb ist in der Datenstruktur von 1(a) der Form-Identifikator (SID) 502 gleich 0. Der Datenkopf 503 enthält Informationen z. B. über den Wiedergabezeitpunkt des Bildes eines zugehörigen Objekts, zum Attribut des Bildes und zum Vorhersagemodus für die Kodierung. Diese Daten haben jedoch keinen Bezug zur vorliegenden Erfindung und erfordern deshalb keine ausführliche Beschreibung.
Der Form-BV besteht aus den kodierten Daten eines Bewegungsvektors, der die Bewegung eines Bildes in einem Block zwischen dem vorliegenden und dem vorhergehenden Rahmen darstellt und zur Vorhersage eines Formsignals eines bestimmten Blocks im vorliegenden Rahmen aus dem Formsignal des entsprechenden Blocks im vorhergehenden Rahmen verwendet wird. Ferner werden die Formdaten durch arithmetisches Kodieren eines Formsignals erhalten, und die Quantisierungsskala ist ein Parameter für das inverse Quantisieren von DCT-Koeffizienten, die aus einem Textursignal mittels DCT und Quantisierung erhalten werden. Der Textur-BV besteht aus den kodierten Daten eines Textur-Bewegungsvektors, der die Bewegung eines Bildes in einem Block zwischen dem vorliegenden und dem vorhergehenden Rahmen darstellt und zur Vorhersage eines Textursignals im vorliegenden Rahmen aus einem Textursignal im vorhergehenden Rahmen verwendet wird. Ferner werden die Textur-DCT-Koefizienten durch längenvariante Kodierung des quantisierten Textursignals erhalten.
Obwohl diese Daten in der Figur nicht dargestellt sind, werden im kodierten Beliebigformsignal 500 vor den Textur-DCT-Koeffizienten auch viele Nebeninformationen (Daten) untergebracht, und diese Nebendaten erfordern manchmal eine große Anzahl von Bits.
1(b) zeigt eine Datenstruktur eines kodierten Binärsignals, das durch Kodieren eines binären Bildsignals erhalten wurde. Die Bezugsziffer 600 in 1(b) kennzeichnet ein kodiertes Binärsignal, das durch Kodieren eines binären Bildsignals S2 erhalten wurde, welches die Bildinformation auf einem Displaybild als ein Binärsignal repräsentiert. Das kodierte Binärsignal 600 enthält am Anfang ein 32-Bit-Synchronsignal 601, einen auf das Synchronsignal 601 folgenden 1-Bit-Form-Identifikator 602 und einen auf den Form-Identifikator 602 folgenden zusätzlichen Datenkopf 603. Im Weiteren enthält das kodierte Binärsignal 600 kodierte Form-Bitströme 61B, die durch Kodieren der Formsignale erhalten wurden, welche das binäre Bildsignal S2 bilden. In 1(b) wird der Form-Identifikator durch SID gekennzeichnet.
Im Einzelnen sind – entsprechend den jeweiligen Blöcken, in die das Displaybild unterteilt ist – die kodierten Form-Bitströme 61B im kodierten binären Formsignal 600 nacheinander angeordnet. Genauer gesagt sind die kodierten Form-Bitströme 61B1, 61B2, 61B3, 61B4, 61B5, ..., die jeweils den Blöcken B1, B2, B3, B4, B5, ... zugeordnet sind, in dieser Reihenfolge angeordnet.
Im Weiteren enthalten die kodierten Form-Bitströme 61B1–61B5 längenvariant kodierte Daten 604, 606, 608, 610 und 612, die zu den Form-Bewegungsvektoren (in der Figur „Form-BV") gehören bzw. längenvariant kodierte Daten 605, 607, 609, 611 und 613, die zu den Formsignalen gehören, welche das Bild im Displaybild durch Binärsignale repräsentieren (in der Figur „Formdaten").
Das Synchronsignal 601, der Form-Identifikator (SID) 602 und der Datenkopf 603 sind jeweils identisch mit dem Synchronsignal 501, dem Form-Identifikator (SID) 502 und dem Datenkopf 503 im kodierten Beliebigformsignal 500, und die Daten der Blöcke B1–B5 ... sind nur die kodierten Form-Bitströme. Da das kodierte Binärsignal 600 keine kodierten Textur-Bitströme enthält, ist der Form-Identifikator (SID) 602 gleich 1.
In dieser ersten Ausführungsform sind der Form-Identifikator (SID) 502 im kodierten Beliebigformsignal 500 und der Form-Identifikator 602 im kodierten Binärsignal 600 für jeden Rahmen jeweils in den kodierten Signalen 500 bzw. 600 angeordnet.
Wie in den 1(a) und 1(b) dargestellt, ist die Bitzahl der kodierten Daten von Form- oder Textursignal variabel, weil die zur Kodierung erforderliche Bitzahl je nach dem Bild, das im Displaybild oder im Block des Displaybilds enthalten ist, unterschiedlich ist. Deshalb ist es unmöglich, die Lage der Quantisierungsskala 506, d. h. die Zahl der Bits zwischen dem Kopf der Formdaten 505 und der Quantisierungsskala 506, vorherzusagen. Ferner kann nicht ohne den Form-Identifikator 502 entschieden werden, ob der kodierte Textur-Bitstrom 52A nach dem kodierten Form-Bitstrom 51A angeordnet ist oder nicht. Deshalb ist es bei einer Kodierung und Übertragung des Formsignals ohne den Form-Identifikator unumgänglich, einen kodierten Blind-Textur-Bitstrom zwischen die kodierten Form-Bitströme angrenzender Blöcke einzufügen, aber das Einfügen das kodierten Blind-Textur-Bitstroms erhöht die Bitzahl bei der Kodierung des Formsignals. Übrigens kann ein Form-Identifikator auch am Kopf der gesamten Bildsequenz angeordnet werden, statt ihn dem Datenkopf eines jeden Bildes zuzuordnen, oder er kann einer Anzahl von Bildern zugeordnet werden.
In MPEG4 können außer dem Beliebigform-Bildsignal und dem binären Bildsignal Transparenz-Informationen verarbeitet werden, welche die Transparenz eines jeden Pixels wiedergeben. Derartige Transparenz-Informationen werden gewöhnlich durch ein Signal von 3 oder mehr Bits ausgedrückt, und dieses kann in ein Binärsignal als Form-Information (binäres Transparenzsignal) und ein mehrwertiges Transparenzsignal zerlegt werden, das die Transparenz-Informationen unter Ausschluss der Form-Information wiedergibt. In diesem Falle kann das mehrwertige Transparenzsignal in der gleichen Weise wie ein Textursignal behandelt werden.
Im Weiteren wird ein Prozess zur Kodierung eines Formsignals und eines Textursignals beschrieben, wobei die Signale Komponenten eines Beliebigform-Bildsignals sind.
Zu Beginn wird mit Bezug auf ein Formsignal eine Objektregion, die ein Objekt auf dem Displaybild umfasst, in eine Anzahl von Blöcken (Formblöcke) unterteilt, und das Formsignal wird blockweise kodiert. In dieser ersten Ausführungsform ist jeder Formblock ein Abbildungsbereich, der 16 × 16 Muster (Pixel) umfasst, und ein zu jedem Block gehörendes Formsignal wird durch das in JBIG verwendete arithmetische Kodierungsverfahren kodiert.
Mit Bezug auf ein Textursignal wird – wie oben beschrieben – eine Objektregion, die ein Objekt auf dem Displaybild enthält, in eine Anzahl von Blöcken (Texturblöcke) unterteilt, und das Textursignal wird blockweise kompressiv kodiert. In dieser ersten Ausführungsform ist jeder Texturblock ein Abbildungsbereich, der 16 × 16 Muster (Pixel) umfasst. Im kompressiven Kodierungsprozess werden DCT und Quantisierung wie folgt ausgeführt. Der Texturblock wird in vier Abbildungsbereiche (Unterblöcke) unterteilt, von denen jeder 8 × 8 Muster (Pixel) umfasst, und für das Textursignal werden DCT und Quantisierung – Unterblock auf Unterblock folgend – ausgeführt. Dann werden die vom oben beschriebenen Prozess gelieferten quantisierten Signale längenvariant kodiert, um kodierte Textur-Bitströme zu erzeugen.
Die so erzeugten kodierten Form- und Textur-Bitströme werden zusammen mit anderen benötigten Signalen gemultiplext, wodurch ein kodiertes Beliebigformsignal 500 erzeugt wird, das die in 1(a) dargestellte Datenstruktur hat.
Im Weiteren ist ein Prozess zur Kodierung eines Formsignals – als eines Bestandteils eines binären Bildsignals – in JBIG nahezu identisch mit dem oben beschriebenen Signalkodierungsverfahren, das für MPEG4 eingesetzt wird.
Das heißt, ein Displaybild wird in eine Anzahl von Blöcken (Formblöcke) unterteilt, und das Formsignal wird blockweise kodiert, wodurch ein kodiertes Binärsignal 600 erzeugt wird, das eine in 1(b) dargestellte Datenstruktur aufweist. In dieser ersten Ausführungsform ist der Formblock ein 16 × 16 Muster (Pixel) umfassender Abbildungsbereich. Ein zu jedem Formblock zugehöriges Formsignal wird mit dem in JBIG verwendeten arithmetischen Kodierungsverfahren kodiert.
Wie oben beschrieben wurde, enthält in der ersten Ausführungsform das zu einem binären Bildsignal gehörende kodierte Binärsignal die kodierten Form-Bitströme 61B, die durch Kodieren des ein Binärinformations-Displaybild repräsentierenden Formsignals erhalten wurden, und den Form-Identifikator 602 für die Anzeige, dass nur die kodierten Form-Bitströme als Wiedergabedaten enthalten sind, so dass eine Analyse eines keine kodierten Textur-Bitströme enthaltenden kodierten Binärsignals durch Bezugnahme auf den Bild-Identifikator möglich ist, wobei ein Datenanalyseverfahren verwendet wird, das für ein kodiertes Signal geeignet ist, welches kodierte Textur-Bitströme enthält.
Genauer gesagt kann ein kodiertes Signal eines binären Bildsignals (kodiertes Binärsignal), das nur ein Formsignal als Wiedergabeinformation enthält, unter Verwendung eines Datenanalyseverfahrens analysiert werden, das für die Analyse von einem kodierten Signal eines Beliebigform-Bildsignals (kodiertes Beliebigformsignal) vorgesehen ist, das sowohl ein Formsignal als auch Textursignal (Pixelwertsignal) enthält. Deshalb kann selbst dann, wenn beim Kodieren des binären Bildsignals nicht jedem kodierten Form-Bitstrom ein kodierter Blind-Pixelwert-Bitstrom hinzugefügt wird, der kodierte Form-Bitstrom des Binärsignals mit dem auf MPEG4 basierenden Dekodierungsprozess dekodiert werden. Das heißt, sowohl das binäre Bildsignal als auch das Beliebigform-Bildsignal können ohne eine Vergrößerung der Anzahl der Bits im Kodierungsprozess mit Hilfe eines Bild-Dekodiergeräts dekodiert werden, das einem einzigen Kodierungsverfahren angepasst ist.
Wie oben beschrieben wurde, verwendet die erste Ausführungsform das kodierte Beliebigformsignal 500 und das kodierte Binärsignal 600, die durch eine Inter-Rahmen-Vorhersagekodierung erhalten wurden, als ein kodiertes Beliebigformsignal bzw. ein kodiertes Binärsignal. Es braucht nicht betont zu werden, das ein mittels Intra-Rahmen-Kodierung erzeugtes kodiertes Beliebigformsignal eine Datenstruktur aufweist, bei der die Form- und Textur-Bewegungsvektoren aus dem kodierten Beliebigformsignal 500 ausgeschlossen sind, während ein mittels Intea-Rahmen-Kodierung erzeugtes kodiertes Binärsignal eine Datenstruktur hat, bei der die Form-Bewegungsvektoren aus dem kodierten Binärsignal 600 ausgeschlossen sind.
Im Weiteren verwendet die erste Ausführungsform das kodierte Beliebigformsignal 500, in dem für jeden Block ein kodierter Form-Bitstrom und ein kodierter Textur-Bitstrom vorhanden sind, und das kodierte Binärsignal 600, in dem für jeden Block ein kodierter Form-Bitstrom vorhanden ist, als ein kodiertes Beliebigformsignal bzw. ein kodiertes Binärsignal. Jedoch ist ein kodiertes Signal mit einer Datenstruktur zur Bildübertragung gemäß der Erfindung nicht auf die in 1(a) und 1(b) dargestellten Strukturen beschränkt.
Zum Beispiel kann ein kodiertes Beliebigformsignal 500b mit einer in 2(a) dargestellten Datenstruktur verwendet werden, wobei die Datenstruktur für jeden Rahmen ein Synchronsignal 501, einen Form-Identifikator (SID) 502, einen zusätzlichen Datenkopf 503, ein Formdatenteil 51 und ein Texturdatenteil 52 umfasst. Ferner kann ein kodiertes Binärsignal 600b mit einer in 2(b) dargestellten Datenstruktur verwendet werden, wobei die Datenstruktur für jeden Rahmen ein Synchronsignal 601, einen Form-Identifikator (SID) 602, einen zusätzlichen Datenkopf 603 und ein Formdatenteil 61 umfasst.
Wie in 1(a) dargestellt ist, wird der Formdatenteil 51 für einen Rahmen durch Sammeln der zu den jeweiligen Blöcken im kodierten Beliebigformsignal gehörenden Form- Bitströme gebildet. Wie in 1(a) dargestellt ist, wird der Texturdatenteil 52 für einen Rahmen durch Sammeln der zu den jeweiligen Blöcken im kodierten Beliebigformsignal gehörenden Textur-Bitströme gebildet. Ferner wird, wie in 1(b) dargestellt ist, der Formdatenteil 61 für einen Rahmen durch Sammeln der zu den jeweiligen Blöcken im kodierten Binärsignal gehörenden Form-Bitströme gebildet.
[Ausführungsform 2]
3 ist ein Blockschema zur Darstellung eines Bild-Kodiergeräts nach einer zweiten Ausführungsform. Die Bezugsziffer 100a in 3 bezeichnet ein Bild-Kodiergerät, das ein kodiertes Bildsignal mit einer Datenstruktur zur Bildübertragung gemäß der ersten Ausführungsform erzeugt. Dieses Gerät 100a ist wie folgt aufgebaut. Wenn das Gerät 100a als ein Eingangs-Bildsignal Sin ein binäres Bildsignal S2 zur Darstellung eines Binärbildes von einem Scanner eines Fax-Gerätes empfängt, dann gibt es ein in 1(b) dargestelltes kodiertes Binärsignal (E2) 600 als ein kodiertes Bildsignal Eo aus. Wenn das Gerät 100a aber als ein Eingangs-Bildsignal Sin ein binäres Bildsignal Sp von einer Videokamera oder einem Bildreproduktionsgerät empfängt, dann gibt es ein in 1(a) dargestelltes kodiertes Beliebigformsignal (Ep) 500 als ein kodiertes Bildsignal Eo für jedes Objekt aus.
Das Bild-Kodiergerät 100a umfasst eine Bild-Eingabeeinheit 110, welche einen Vorkodierungsprozess am einlaufenden Bildsignal Sin ausführt, um ein binäres Formsignal und ein Textursignal zu erzeugen, und ein Schaltsteuersignal Swa ausgibt; eine Form-Kodiereinheit (erste Kodierungshilfsmittel) 120, die für das Formsignal einen arithmetischen Kodierungsprozess ausführt; eine Textur-Kodiereinheit (zweite Kodierungshilfsmittel) 130, die für das Textursignal einen Kodierungsprozess einschließlich DCT ausführt; einen Schalter 101a, der die Ausgabedaten aus der Bild-Eingabeeinheit 110 entsprechend dem Schaltsteuersignal SWa an eine der Kodiereinheiten 120 und 130 weiterleitet; und einen Rahmen-Speichermodul 102, der ein Vorhersage-Formsignal und ein Vorhersage-Textursignal speichert.
Die Bild-Eingabeeinheit 110 ist wie folgt aufgebaut. Die Bild-Eingabeeinheit 110 unterscheidet zwischen einem binären Bildsignal von einem Scanner oder dergleichen und einem digitalen Videosignal von einer Kamera oder einer Bildaufzeichnungs-/wiedergabeeinheit (VTR), und das binäre Bildsignal wird einem Schwellwertvergleich unterzogen, um ein Formsignal zu erzeugen, wohingegen das digitale Videosignal einem Chroma-Key-Prozess unterzogen wird, um ein Textursignal zu erzeugen. Im Chroma-Key-Prozess wird ein zu jedem Objekt eines Displaybildes gehörendes Beliebigform-Bildsignal von einem Bildsignal eines Hintergrundbildes separiert. Das separierte Beliebigform-Bildsignal wird verarbeitet, um ein die Form des Objekts darstellendes Formsignal und ein Textursignal für die Gradations-Farbdarstellung des Bildes zu erzeugen, das ein Leuchtdichte- und ein Farbdifferenzsignal einschließt. Im Weiteren gibt die Bild- Eingabeeinheit 110 ein Identifikatorsignal (Bild-Identifikator) Sdis aus, das anzeigt, welches Signal – das binäre Bildsignal oder das Beliebigform-Bildsignal – bearbeitet wird.
Im Einzelnen umfasst, wie in 7(a) dargestellt ist, die Bild-Eingabeeinheit 110 eine Identifikator-Einheit 111, die entscheidet, ob der digitale Bild-Eingang Sin aus einem binären Bildsignal oder einem Beliebigform-Bildsignal besteht, und dieses Signal separiert; eine Schwellwert-Vergleichseinheit 112, die für jeden der Blöcke, in die das Displaybild unterteilt ist, einen Schwellwertvergleich für das binäre Bildsignal ausführt und somit ein binäres Formsignal erzeugt; eine Chroma-Key-Einheit 113, die für jede Objektregion, die jedem Objekt auf dem Displaybild zugeordnet ist, den Chroma-Key-Prozess für das Beliebigform-Bildsignal ausführt und somit ein binäres Formsignal und ein mehrwertiges Textursignal erzeugt sowie ein Zeitsignal T ausgibt, wenn die Bearbeitung des Textursignals abgeschlossen ist; und einen Schaltersteuerungs-Schaltkreis 114, der den Schalter 101a mit Hilfe des Schaltsteuersignals SWa – basierend auf dem Identifikatorsignal Sdis von der Identifikator-Einheit 111 und dem Zeitsignal T von der Chroma-Key-Einheit 113 – steuert.
Die Form-Kodiereinheit 120 umfasst: einen Form-Bewegungsdetektor 121, der das zum Binärbild gehörende Formsignal S2k oder das zum Beliebigform-Bild gehörende Formsignal Spk empfängt und für jeden Block einen Form-Bewegungsvektor Skv mittels Blockabstimmung oder dergleichen erzeugt, wobei er sich auf das Formsignal eines Rahmens bezieht, der vor dem gerade bearbeiteten Rahmen liegt; und einen Form-Bewegungskompensator 123, der den Form-Bewegungsvektor Skv auf eine Adresse des Rahmen-Speichermoduls 102a hin transformiert und – auf dieser Adresse basierend – ein Vorhersage-Formsignal Ekm aus dem Form-Speichermodul 102a erhält. Ferner umfasst die Form-Kodiereinheit 120 einen arithmetischen Kodierer 122, der das Formsignal Sk aus dem Schalter 101a blockweise mit Hilfe eines arithmetischen Kodierungsprozesses unter Verwendung des Vorhersage-Formsignals Ekm kodiert, wodurch er zu jedem Block einen dazugehörigen kodierten Form-Bitstrom Ek erzeugt, und einen arithmetischen Dekoder 124, der den kodierten Form-Bitstrom Ek mit einem arithmetischen Dekodierungsprozess unter Verwendung des Vorhersage-Formsignals Ekm dekodiert. Die Ausgabedaten Ekd des arithmetischen Dekoders 124 werden im Speichermodul 102a gespeichert.
Die Textur-Kodiereinheit 130 umfasst: einen Textur-Bewegungsdetektor 131, der das Textursignal Spt empfängt und durch Blockabstimmung oder dergleichen für jeden Block einen Textur-Bewegungsvektor Stv erzeugt, wobei er sich auf das Textursignal eines Rahmens bezieht, der vor dem jeweils gerade bearbeiteten Rahmen liegt; und einen Textur-Bewegungskompensator 132, der den Textur-Bewegungsvektor Stv auf eine Adresse des Rahmen-Speichermoduls 102a hin transformiert und basierend auf dieser Adresse ein Vorhersage-Textursignal Epm aus dem Speichermodul 102a erhält. Im Weiteren umfasst die Textur-Kodiereinheit 130 einen ersten Addierer 133, der das Textursignal Spt und das Vorhersage-Textursignal Epm zusammenfügt; einen Kosinus-Transformator 134, der an den Ausgabedaten Sad1 des Addierers 133 eine blockweise DCT ausführt, wodurch die DCT-Koeffizienten Edct erzeugt werden; und einen Quantisierer 135 zur blockweisen Quantisierung der DCT-Koeffizienten Edct.
Außerdem enthält die Textur-Kodiereinheit 130 einen Längenvariant-Kodierer 139, der die Ausgabedaten Eq vom Quantisierer 135 blockweise längenvariant kodiert, wodurch er zu jedem Block einen zugehörigen kodierten Textur-Bitstrom Ep erzeugt; einen Invers-Quantisierer 136, der eine inverse Quantisierung der Ausgabedaten Eq vom Quantisierer 135 ausführt; einen Umkehr-Kosinus-Transformator 137, der eine Umkehr-DCT der Ausgabedaten Eiq des Invers-Quantisierers 136 ausführt; und einen zweiten Addierer 138, der die Ausgabedaten Eidct des Umkehr-Kosinus-Transformators 137 und das Vorhersage-Textursignal Epm zusammenfügt. Die Ausgabedaten Sad2 des zweiten Addierers 138 werden im Rahmen-Speichermodul 102a als ein Vorhersage-Textursignal gespeichert. Die Bild-Kodiergerät 100a enthält ferner einen Multiplexer 150, der den Form-Identifikator Sdis von der Bild-Eingabeeinheit 110, den Form-Bewegungsvektor Skv sowie den kodierten Form-Bitstrom Ek von der Form-Kodiereinheit 120, und den Textur-Bewegungsvektor Stv sowie den kodierten Textur-Bitstrom Ept von der Textur-Kodiereinheit 130 zusammen mit anderen benötigten Daten multiplext. Der Multiplexer 150 ist wie folgt aufgebaut. Bei einer Eingabe eines binären Bildsignals S2 multiplext der Multiplexer 150 den Form-Identifikator Sdis und den kodierten Form-Bitstrom aus der Form-Kodiereinheit 120 zusammen mit anderen benötigten Daten und gibt das in 1(b) dargestellte kodierte Binärsignal (E2) 600 aus. Bei einer Eingabe des Beliebigform-Bildsignals Sp multiplext der Multiplexer 150 den Form-Identifikator Sdis, den kodierten Form-Bitstrom aus der Form-Kodiereinheit 120 und den kodierten Textur-Bitsstrom aus der Textur-Kodiereinheit 130 zusammen mit anderen benötigten Daten und gibt das in 1(a) dargestellte kodierte Beliebigformsignal (Ep) 500 aus.
Eine Beschreibung der Arbeitsweise des Bild-Kodiergeräts 100a wird gegeben.
4 ist ein Flussdiagramm zur Darstellung des Kodierungsprozesses durch das Bild-Kodiergerät gemäß der zweiten Ausführungsform.
Bei der Eingabe eines digitalen Bildsignals Sin in das Bild-Kodiergerät 100a (Schritt Sa1) entscheidet die Bild-Eingabeeinheit 110, ob die digitale Bildeingabe Sin ein binäres Bildsignal ist, das nur ein Formsignal enthält und das von einem Scanner ausgegeben wurde, oder ob es ein digitales Videosignal ist, das sowohl ein Formsignal als auch ein Textursignal enthält und das von einer Kamera oder einem Bildaufzeichnungs-/wiedergabegerät (VTR) stammt (Schritt Sa2).
Ist die digitale Bildeingabe Sin ein binäres Bildsignal, dann erzeugt die Bild-Eingabeeinheit 110 als Bild-Identifikator (SID) ein 1-Bit-Identifikatorsignal mit einem Wert „1" (Schritt Sa3) und gewinnt durch Schwellwertvergleich der digitalen Bildeingabeinformation Sin ein binäres Formsignal Sk2. Zu diesem Zeitpunkt wird der Schalter 101a durch das Schaltsteuersignal SWa so gesteuert, dass das Formsignal S2k in die Form-Kodiereinheit 120 eingegeben wird und die Form-Kodiereinheit 120 ein arithmetisches Kodieren des Formsignals S2k ausführt (Schritt Sa4).
Das heißt, der Form-Bewegungsdetektor 121 in der Form-Kodiereinheit 120 erzeugt aus dem Formsignal S2k für jeden Block einen Form-Bewegungsvektor Skv. Genauer gesagt wird das gerade bearbeitete Formsignal des vorliegenden Rahmens mittels Blockabstimmung mit dem Formsignal des vorhergehenden Rahmens verglichen, wodurch eine Bewegung des Bildes zwischen dem vorliegenden und dem vorhergehenden Rahmen erkannt wird, und die Bewegungsinformation wird als Bewegungsvektor Skv bereitgestellt. Diese Bewegungsdetektion wird ausführlicher z. B. in USP (US Patent) Nr. 4897720 beschrieben. Bei der Eingabe des Form-Bewegungsvektors Skv in den Form-Bewegungskompensator 123 transformiert der Kompensator 123 den Form-Bewegungsvektor Skv auf eine Adresse des Rahmen-Speichermoduls 102a und ruft entsprechend der Adresse aus dem Rahmen-Speichermodul 102a ein Vorhersage-Formsignal Ekm ab. Bei der Eingabe des Vorhersage-Formsignals Ekm und des Formsignals Sk2 aus der Bild-Eingabeeinheit 110 in den arithmetischen Kodierer 122 führt der arithmetische Kodierer 122 einen arithmetischen Kodierungsprozess am Formsignal S2k aus, der auf dem Vorhersage-Formsignal Ekm basiert, und gibt Formdaten (kodierter Form-Bitstrom 61B) E2k aus, die durch Kodieren des Formsignals S2k erhalten wurden. Das arithmetische Kodierungsverfahren wird ausführlicher in der Beschreibung des JBIG-Standards dargestellt. Zu dieser Zeit werden im arithmetischen Dekoder 124 in einem arithmetischen Dekodierungsprozess unter Verwendung des Vorhersage-Formsignals Ekm die Formdaten E2k als dekodierte Formdaten Ekd reproduziert und die dekodierten Formdaten Ekd werden im Rahmen-Speichermodul 102a gespeichert.
Danach werden der Form-Identifikator Sdis, der Form-Bewegungsvektor Skv und die Formdaten E2k im Multiplexer 150 gemultiplext und die Multiplex-Daten vom Ausgabeterminal 150a einer Datenübertragungseinheit übergeben (Schritt Sa5).
Im Bild-Kodiergerät 100a entscheidet eine Steuereinheit (nicht dargestellt) darüber, ob die in den Schritten Sa2–Sa5 verarbeiteten Daten die Daten des letzten Blocks im letzten Rahmen sind oder nicht (Schritt Sa10), wobei dann, wenn die verarbeiteten Daten nicht die Daten des letzten Blocks im letzten Rahmen sind, der Prozess durch das Bild-Kodiergerät 100a zum Schritt Sa2 zurück verwiesen wird. Sind es die Daten des letzten Blocks im letzten Rahmen, dann ist der Bild-Kodierungsprozess beendet.
Wird jedoch im Schritt Sa2 entschieden, dass die digitale Bildeingangsinformation Sin ein Beliebigform-Bildsignal Sp ist, das ein Form- und ein Textursignal enthält, so wird ein 1- Bit-Identifikatorsignal Sdis mit dem Wert „0" als ein Form-Identifikator (SID) in der Bild-Eingabeeinheit 110 erzeugt (Schritt Sa6), und außerdem werden durch den Chroma-Key-Prozess der digitalen Bildeingabeinformation Sin ein Formsignal Spk und ein Textursignal Spt erzeugt. Zu dieser Zeit wird der Schalter 101a durch das von der Bild-Eingabeeinheit 110 ausgegebene Schaltsteuersignal SWa so gesteuert, dass das Formsignal Spk in die Form-Kodiereinheit 120 eingegeben wird, während das Textursignal Spt in die Textur-Kodiereinheit 130 eingegeben wird.
Dadurch wird in der Form-Kodiereinheit 120 das Formsignal Spk des Beliebigform-Bildsignals Sp in der gleichen Weise arithmetisch kodiert, wie es oben für das Formsignal S2k des binären Bildsignals S2 beschrieben wurde (Schritt Sa7). In der Textur-Kodiereinheit 130 wird die Kodierung des Textursignals Spt ausgeführt (Schritt Sa8).
Genauer gesagt extrahiert der Textur-Bewegungsdetektor 131 in der Textur-Kodiereinheit 130 einen Textur-Bewegungsvektor Stv aus dem Textursignal Spt, und der Textur-Bewegungskompensator 132 erhält aus dem Rahmen-Speichermodul 102a entsprechend dem Bewegungsvektor Stv ein Vorhersage-Textursignal Epm. Der erste Addierer 133 empfängt die Differenzdaten Sad1 zwischen dem Vorhersage-Textursignal Epm und dem Textursignal Spt des einlaufenden Beliebigform-Bildsignals. Diese Differenzdaten werden durch den Kosinus-Transformator 134 in einem Frequenzbereich in DCT-Koeffizienten Edct transformiert, und die DCT-Koeffizienten Edct werden durch den Quantisierer 135 quantisiert. Im Weiteren werden die quantisierten DCT-Koeffizienten Eq durch den Längenvariant-Kodierer 139 längenvariant kodiert und dem Multiplexer 150 zugeführt. In den Multiplexer 150 wird auch der Textur-Bewegungsvektor Stv des entsprechenden Blocks eingegeben.
Die quantisierten DCT-Koeffizienten Eq werden vom Invers-Quantisierer 136 invers quantisiert, und an den Ausgabedaten Eiq des Invers-Quantisierers 136 wird durch den Umkehr-Kosinus-Transformator 137 eine Umkehr-Kosinus-Transformation ausgeführt, wonach sie als ein reproduziertes Textursignal Eidct dem zweiten Addierer 138 zugeführt werden. In dem zweiten Addierer 138 werden das reproduzierte Texturdignal Eidct und das Vorhersage-Textursignal Epm zusammengefügt, und die Summe Sad2 wird im Rahmen-Speichermodul 102a gespeichert.
Ist die digitale Bildeingabeinformation ein Beliebigform-Bildsignal, dann wird der Multiplexer 150 gespeist mit dem Form-Identifikator Sdis von der Bild-Eingabeeinheit 110, dem Form-Bewegungsvektor Skv und den Formdaten Epk von der Form-Kodiereinheit 120, dem Textur-Bewegungsvektor Stv und den Textur-DCT-Koeffizienten Ept von der Textur-Kodiereinheit 130 und mit weiteren benötigten Signalen. Diese Daten sind im Multiplexer 150 in einer vorgeschriebenen Reihenfolge angeordnet, und das in 1(a) dargestellte kodierte Beliebigformsignal (Ep) 500 wird vom Multiplexer 150 ausgegeben (Schritt Sa9).
Wie mit Bezug auf das binäre Bildsignal beschrieben wurde, entscheidet außerdem eine Steuereinheit (nicht dargestellt) im Bild-Kodiergerät 100a, ob die in den Schritten Sa6– Sa9 verarbeiteten die Daten des letzten Blocks im letzten Rahmen gewesen sind (Schritt Sa10). Waren die verarbeiteten Daten nicht die des letzten Blocks im letzten Rahmen, dann werden für ein Form- und ein Textursignal, die zum nächsten Block gehören, die Schritte Sa6–Sa9 ausgeführt. Waren die verarbeiteten Daten (Form- und Textursignal) die des letzten Blocks im letzten Rahmen, dann ist der Kodierungsprozess durch das Bild-Kodiergerät 100a abgeschlossen.
Das Ausgabeterminal 150a des Multiplexers 150 ist mit einer Übertragungseinheit zur Übertragung der kodierten Daten oder mit einer Speichereinheit zur Speicherung der kodierten Daten verbunden, obwohl diese Einheiten in der Figur nicht dargestellt sind.
Wie oben mit Bezug auf die zweite Ausführungsform beschrieben wurde, ist das Bild-Kodiergerät 100a zur Kodierung einer digitalen Bildeingabe so ausgelegt, dass es entscheidet, ob die digitale Bildeingabe ein binäres Bildsignal oder ein Beliebigform-Bildsignal ist, und entsprechend dem Ergebnis dieser Entscheidung gibt es zusammen mit dem kodierten Bildsignal ein Identifikatorsignal (Form-Identifikator) Sdis aus. Deshalb wird in einem Dekodiergerät zur Dekodierung eines kodierten Signals – von einem binären Bildsignal oder einem Beliebigformsignal – durch den oben beschriebenen Form-Identifikator festgestellt, ob ein einlaufendes kodiertes Signal ein kodiertes Binärsignal ist, das keine kodierten Textur-Bitströme enthält, und der Dekodierungsprozesses kann in seiner Form so verändert werden, dass er von einem Prozess ausgehend, der für ein kodiertes Beliebigformsignal mit sowohl kodierten Form-Bitströmen als auch kodierten Textur-Bitströmen geeignet ist, zu einem Prozess wird, der für das kodierte Binärsignal geeignet ist.
Deshalb ist es bei der Kodierung eines binären Bildsignals, das nur ein Formsignal enthält, nicht erforderlich, jedem kodierten Form-Bitstrom einen kodierten Blind-Textur-Bitstrom hinzuzufügen, wobei der Blindstrom eine Dekodierung des binären Formsignals mit einem Dekodierungsverfahren erlaubt, das für ein Beliebigformsignal eingesetzt wird. Im Ergebnis lässt sich ein kodiertes Bildsignal mit einer Datenstruktur erzeugen, die eine Dekodierung der nach unterschiedlichen Kodierungsverfahren kodierten Signale mit einem Bild-Dekodiergerät ermöglicht, das nur ein einziges Kodierungsverfahren einsetzt, ohne den für den Kodierungsprozess erforderlichen Kodeumfang zu erhöhen.
[Ausführungsform 3]
5 ist ein Blockschema zur Darstellung eines Bild-Dekodiergeräts nach einer dritten Ausführungsform. Die Bezugsziffer 100b in 5 kennzeichnet ein Bild-Dekodiergerät, das eine Dekodierung von kodierten Daten ausführt, die eine Datenstruktur zur Bildübertragung gemäß der ersten Ausführungsform aufweisen. Dieses Gerät 100b ist wie folgt aufgebaut. Wenn das Gerät 100b als kodierte Daten Eo ein in 1(b) dargestelltes kodiertes Binärsignal (E2) 600 empfängt, dann gibt es als dekodierte Binärdaten Dsyn ein dekodiertes Binärsignal D2 aus. Empfängt das Gerät 100b jedoch als kodierte Daten Eo ein in 1(a) dargestelltes kodiertes Beliebigformsignal (Ep) 500, dann gibt es als dekodierte Bilddaten Dsyn für jedes Objekt ein dekodiertes Beliebigformsignal Dp aus.
Im Einzelnen umfasst das Dekodiergerät 100b einen Datenanalysator 160, der die in das Eingabeterminal 160a einlaufenden kodierten Daten Eo analysiert und entsprechend dem Analyseresultat ein Schaltsteuersignal SWb ausgibt; eine Form-Dekodiereinheit (erste Dekodierhilfsmittel) 170, die einen arithmetischen Dekodierungsprozess an den Formdaten (an dem durch Kodierung des Formsignals erhaltenen kodierten Form-Bitstrom) ausführt; eine Textur-Dekodiereinheit (zweite Dekodierhilfsmittel) 180, die für die Textur-DCT-Koeffizienten Ept einen Dekodierungsprozess einschließlich einer Umkehr-DCT ausführt; einen Schalter 101b, der entsprechend dem Schaltsteuersignal das vom Datenanalysator 160 analysierte und ausgegebene kodierte Signal zu einer der Dekodiereinheiten 170 bzw. 180 weiterleitet; und einen Rahmen-Speichermodul 102, der ein Vorhersage-Formsignal und ein Vorhersage-Textursignal speichert.
Ist die Dekodierung des zu einem Block gehörenden kodierten Form-Bitstroms abgeschlossen, dann erkennt die Form-Dekodiereinheit 170 das Ende des zum Block gehörenden Form-Bitstroms Ek (E2k oder Epk) und gibt ein zum Block gehörendes Abschlussnachweissignal Te an den Daten-Analysator 160 aus.
Außerdem analysiert der Datenanalysator 160 die kodierten Eingabedaten zur Überprüfung des auf das 32-Bit-Synchronsignal am Kopf folgenden 1-Bit-Form-Identifikators, wobei dieser der Form-Identifikator 502 im kodierten Beliebigformsignal 500 von 1(a) oder der Form-Identifikator 602 im kodierten Binärsignal 600 von 1(b) ist. Ist der gesetzte Wert des Form-Identifikators (SID) gleich 0, dann steuert der Datenanalysator 160 den Schalter 101b mit Hilfe des Schaltsteuersignals SWb so, dass der kodierte Form-Bitstrom im einlaufenden kodierten Signal in die Form-Dekodiereinheit 170 und der kodierte Textur-Bitstrom im kodierten Signal in die Textur-Dekodiereinheit (180) eingegeben wird. Ist der gesetzte Wert des Form-Identifikators (SID) gleich 1, dann steuert der Datenanalysator 160 den Schalter 101b über das Schaltsteuersignal SWb so, dass die einlaufenden kodierten Daten in die Form-Dekodiereinheit 170 eingegeben werden.
Im Einzelnen umfasst der Datenanalysator 160, wie in 7(b) dargestellt ist, eine Tabellen-Speichereinheit 162, die eine Dekodier-Referenztabelle enthält; einen Komparator 161, der den Bitstrom des einlaufenden kodierten Signals mit dem Bitstrom der Dekodier-Referenztabelle vergleicht, wodurch der in den kodierten Daten enthaltene Form-Identifikator, der kodierte Form-Bitstrom und der kodierte Textur-Bitstrom identifiziert werden; und ein Schalter-Steuerkreis 163 zur Steuerung des Schalters 101b über ein Schaltsteuersignal SWb in Abhängigkeit vom Vergleichsergebnis des Komparators 161 und vom Abschlussnachweissignal Te.
Die Form-Dekodiereinheit (erste Dekodierhilfsmittel) 170 enthält einen Form-Bewegungskompensator 172, der den zum Binärbild gehörenden Form-Bewegungsvektor oder einen zum Beliebigform-Bild gehörenden Beliebigform-Bewegungsvektor empfängt, eine Adresse des im Rahmen-Speichermodul 102b gespeicherten Vorhersage-Formsignals entsprechend dem Bewegungsvektor erzeugt und das Vorhersage-Formsignal Emk aus dem Rahmen-Speichermodul 102b empfängt; und einen arithmetischen Dekoder 171 zur Dekodierung der Eingangs-Formdaten Ek mit Bezugnahme auf das Vorhersage-Formsignal Emk, um ein reproduziertes Formsignal (dekodiertes Formsignal) Dk zu erzeugen. Das reproduzierte Formsignal Dk wird im Rahmen-Speichermodul 102b gespeichert. Nach Abschluss der Dekodierung eines zu einem Block gehörenden Form-Bitstroms detektiert der arithmetische Dekoder 171 das Ende des zum Block gehörenden kodierten Form-Bitstroms Ek (E2k oder Epk) und gibt ein Abschlussnachweissignal Te aus. Die Bewegungskompensation wird ausführlicher im USP (US Patent) Nr. 5157742 beschrieben, und die arithmetische Dekodierung wird in der Beschreibung von JBIG dargestellt.
Die Textur-Dekodiereinheit (zweite Dekodierhilfsmittel) 180 enthält einen Textur-Bewegungskompensator 184, der entsprechend dem Textur-Bewegungsvektor eine Adresse des Vorhersage-Textursignals erzeugt und unter Verwendung der Adresse das Vorhersage-Textursignal Emp aus dem Rahmen-Speichermodul 102b empfängt; einen Invers-Quantisierer 181, der die Quantisierungsskala sowie die DCT-Koeffizienten im kodierten Textur-Bitstrom empfängt und die DCT-Koeffizienten invers quantisiert; einen Umkehr-Kosinus-Transformator 182, der für die invers quantisierten DCT-Koeffizienten Diq eine Umkehr-Kosinus-Transformation ausführt; und einen Addierer 183, der das Vorhersage-Textursignal Emp und das umkehr-kosinus-transformierte Signal Didct zusammenfügt sowie ein reproduziertes Textursignal (dekodiertes Textursignal) Dpt ausgibt. Das reproduzierte Textursignal Dpt aus dem Addierer 183 wird im Rahmen-Speichermodul 102b gespeichert.
Das Bild-Dekodiergerät 100b umfasst ferner einen Synthesizer 190, der eine Synthese des reproduzierten Textursignals Dpt bzw. des entsprechenden reproduzierten Formsignals Dk mit gewünschten Bilddaten erzeugt und an die Wiedergabeeinheit 104 synthetisierte Bilddaten Dsyn ausgibt, welche das zum kodierten Beliebigformsignal Ep gehörende reproduzierte Beliebigformsignal Dp enthalten. Im Weiteren gibt der Synthesizer 190 das zum kodierten Binärsignal E2 gehörende reproduzierte Binärsignal D2 aus. Die Ausgabesignale vom Synthesizer 190 werden zwar in die Wiedergabeeinheit 104 eingegeben, die Signale können aber auch in einen Drucker (nicht dargestellt) eingegeben werden. Außerdem kann das reproduzierte Binärsignal D2 im Synthesizer 190 mit einem weiteren Beliebigform-Bildsignal synthetisiert werden.
In dieser dritten Ausführungsform werden bei der Dekodierung eines Beliebigform-Bildsignals für Pixel, für die das reproduzierte Formsignal gleich Null ist, die Pixelwerte im reproduzierten Textursignal durch Pixelwerte eines vorgeschriebenen Bildes ersetzt. Das vorgeschriebene Bild ist ein Bild, das im Voraus an der Empfangsstation hergestellt wurde, oder es ist ein von einem anderen Bild-Dekodiergerät reproduziertes Bild.
Es wird eine Beschreibung der Arbeitsweise des so aufgebauten Bild-Dekodiergeräts gegeben.
6 ist ein Flussdiagramm des Dekodierungsprozesses durch das Bild-Dekodiergerät 100b entsprechend der dritten Ausführungsform. Wird ein kodiertes Bildsignal mit einer in 1(a) oder 1(b) dargestellten Datenstruktur in das Bild-Dekodiergerät 100b eingegeben, dann analysiert der Datenanalysator 160 den auf das 32-Bit-Synchronsignal folgenden 1-Bit-Form-Identifikator und entscheidet, ob der Wert des Form-Identifikators (SID)1 ist oder nicht (Schritt Sb1).
Ist das Ergebnis der Entscheidung SID = 1, dann ist das einlaufende kodierte Bildsignal Eo ein kodiertes Binärsignal E2, das als Bildinformation nur kodierte Form-Bitströme enthält. Dann steuert der Datenanalysator 160 den Schalter 101b über das Schaltsteuersignal SWb so, dass der zu jedem Block des kodierten Binärsignals gehörende Form-Bitstrom immer in die Form-Dekodiereinheit 170 eingegeben wird. Damit werden in der Form-Dekodiereinheit 170 die kodierten Form-Bitströme im kodierten Binärsignal dekodiert (Schritt Sb2).
Genauer gesagt wird der Form-Bewegungsvektor BV in den Form-Bewegungskompensator 172 und den arithmetischen Dekoder 171 eingegeben. Dann erzeugt der Form-Bewegungskompensator 172 entsprechend dem Form-Bewegungsvektor BV eine Adresse des im Rahmen-Speichermodul 102b gespeicherten Vorhersage-Formsignals und erhält vom Rahmen-Speichermodul 102b das Vorhersage-Formsignal Emk. Wird das Vorhersage-Formsignal Emk in den arithmetischen Dekoder 171 eingegeben, dann führt der arithmetische Dekoder 171 eine arithmetische Dekodierung des kodierten Form-Bitstroms E2k mit Bezugnahme auf das Vorhersage-Formsignal Emk aus, wodurch ein dekodiertes Binärsignal D2k erzeugt wird. Das dekodierte Binärsignal D2k wird an den Rahmen-Speichermodul 102b und den Synthesizer 190 ausgegeben und vom Synthesizer 190 an die Wiedergabeeinheit 104 zur Bildwiedergabe weitergeleitet (Schritt Sb6). Die Wiedergabe des dekodierten Binärsignals kann nach einer Synthese mit einem anderen Beliebigform-Bildsignal erfolgen.
Danach wird entschieden, ob das dekodierte Binärsignal aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt Sb7). Besteht das kodierte Binärsignal nicht aus den Daten des letzten Blocks im letzten Rahmen, dann werden an einem zum nächsten Block gehörigen binären Signal die Schritte Sb1, Sb2 und Sb6 ausgeführt. Besteht das kodierte Binärsignal aus den Daten des letzten Blocks im letzten Rahmen, dann ist die Dekodierung des kodierten Binärsignals beendet.
Andererseits enthält das einlaufende kodierte Eingabe-Bildsignal dann, wenn das Ergebnis der Entscheidung im Schritt Sb1 SID = 0 ist, als Bildinformation kodierte Form-Bitströme und kodierte Textur-Bitströme. Deshalb steuert der Datenanalysator 160 den Schalter 101b über das Schaltsteuersignal SWb so, dass der zu jedem Block des kodierten Beliebigformsignals gehörende kodierte Form-Bitstrom in die Form-Dekodiereinheit 170 eingegeben wird, während der zu jedem Block gehörende kodierte Textur-Bitstrom in die Textur-Dekodiereinheit 180 eingegeben wird. Dadurch werden der kodierte Form-Bitstrom und der kodierte Textur-Bitstrom voneinander separiert (Schritt Sb3), und der kodierte Form-Bitstrom wird durch die Form-Dekodiereinheit 170 dekodiert, während der kodierte Textur-Bitstrom durch die Textur-Dekodiereinheit 180 dekodiert wird (Schritte Sb4 und Sb5).
Genauer gesagt wird der kodierte Form-Bitstrom Epk -ähnlich wie der kodierte Form-Bitstrom E2k des binären Bildsignals – durch den Form-Dekoder 170 dekodiert. Ist die Dekodierung des zu einem Block gehörenden kodierten Form-Bitstroms Epk abgeschlossen, dann stellt der arithmetische Dekoder 171 das Ende des zu einem Block gehörenden kodierten Form-Bitstroms Epk fest und gibt ein Abschlussnachweissignal Te an den Datenanalysator 160 aus. Beim Empfang des Abschlussnachweissignals Te steuert der Datenanalysator 160 den Schalter 101b über das Schaltsteuersignal SWb so, dass das einlaufende kodierte Bildsignal in die Textur-Dekodiereinheit 180 eingegeben wird.
Dadurch wird der kodierte Textur-Bitstrom Ept vom Datenanalysator 160 zur Textur-Dekodiereinheit 180 übermittelt. In der Dekodiereinheit 180 werden die Quantisierungsskala und die DCT-Koeffizienten im Bitstrom in den Invers-Quantisierer 181 eingegeben, und für die DCT-Koeffizienten wird eine inverse Quantisierung ausgeführt. Danach wird vom Umkehr-Kosinus-Transformator 182 für die invers quantisierten Signale Diq eine Umkehr-Kosinus-Transformation ausgeführt.
Unterdessen wird der Textur-Bewegungsvektor BV in den Textur-Bewegungskompensator 184 eingegeben. Der Kompensator 184 erzeugt eine Adresse zur Versorgung mit einem dem Textur-Bewegungsvektor BV entsprechenden Vorhersage-Textursignal, und empfängt das Vorhersage-Textursignal Emp vom Rahmen-Speichermodul 102b unter Verwendung der Adresse.
Der Addierer 183 führt eine Addition der Ausgabedaten Didct vom Umkehr-Kosinus-Transformator 182 und des Vorhersage-Textursignals Emp durch und gibt das dekodierte Textursignal Dpt aus. Das dekodierte Textursignal Dpt wird in den Rahmen-Speichermodul 102b und den Synthesizer 190 eingegeben. Der Synthesizer 190 führt eine Synthese des dekodierten und reproduzierten Textursignals Dpt und des dazugehörigen dekodierten und reproduzierten Formsignals Dk mit einem gewünschten Bild zur Erzeugung synthetisierter Bilddaten Dsyn aus. Beim Abschluss der Dekodierung des kodierten Textur-Bitstroms stellt der Datenanalysator 160 das Ende des kodierten Textur-Bitstroms fest und steuert den Schalter 101b über das Schaltsteuersignal SWb so, dass das einlaufende kodierte Bildsignal in die Form-Dekodiereinheit 170 eingegeben wird.
Außerdem werden die reproduzierten und synthetisierten Daten vom Synthesizer 190 an die Wiedergabeeinheit 104 zur Bildwiedergabe ausgegeben (Schritt Sb6).
Danach wird entschieden, ob das dekodierte Beliebigformsignal aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt Sb7). Besteht das kodierte Beliebigformsignal nicht aus den Daten des letzten Blocks im letzten Rahmen, dann werden an einem kodierten Beliebigformsignal des nächsten Blocks die Schritte Sb3–Sb7 ausgeführt. Besteht das kodierte Beliebigformsignal aus den Daten des letzten Blocks im letzten Rahmen, dann ist die Dekodierung des kodierten Beliebigformsignals beendet.
In dieser dritten Ausführungsform werden für Pixel, für die das reproduzierte Formsignal gleich Null ist, die Pixelwerte in dem dekodierten und reproduzierten Textursignal durch Pixelwerte eines vorgeschriebenen Bildes ersetzt. Das vorgeschriebene Bild ist ein Bild, das im Voraus an der Empfangsstation hergestellt wurde, oder es ist ein von einem anderen Bild-Dekodiergerät reproduziertes Bild.
Wie oben beschrieben wurde, enthält das Bild-Dekodiergerät 100b gemäß der dritten Ausführungsform den Datenanalysator 160, der die kodierten Eingabedaten analysiert. Der Datenanalysator 160 detektiert einen Form-Identifikator, der anzeigt, ob das einlaufende kodierte Bildsignal ein kodiertes Binärsignal ist, das als Bildinformation nur kodierte Form-Bitströme enthält, oder ob es ein kodiertes Beliebigformsignal ist, das sowohl kodierte Form-Bitströme als auch kodierte Textur-Bitströme umfasst, und in Abhängigkeit vom Wert des Form-Identifikators steuert der Datenanalysator 160 den Schalter 101b so, dass der Bitstrom des einlaufenden kodierten Signals in die Form-Dekodiereinheit 170 bzw. die Textur-Dekodiereinheit 180 eingegeben wird. Selbst dann, wenn. bei der Erzeugung eines kodierten Binärsignals nicht zu jedem kodierten Form-Bitstrom ein kodierter Blind-Textur-Bitstrom hinzugefügt wird, kann so eine Dekodierung des kodierten Binärsignals durch ein Dekodierungsverfahren erfolgen, das zu einem kodierten Beliebigformsignal gehört. Wenn sowohl ein binäres Bildsignal als auch ein Beliebigform-Bildsignal, die unterschiedliche Datenstrukturen haben, durch ein einziges Kodierungsverfahren kodiert und diese kodierten Signale durch ein einziges Dekodierungsverfahren dekodiert werden, dann ist es folglich möglich, Kodierung, Übertragung und Dekodierung des binären Bildsignals effizient mit verminderter Bitzahl auszuführen.
[Ausführungsform 4]
8 ist ein Blockschema zur Darstellung eines Bild-Dekodiergeräts nach einer vierten Ausführungsform. Die Bezugsziffer 100c in 8 kennzeichnet ein Bild-Dekodiergerät nach dieser vierten Ausführungsform. Das Bild-Dekodiergerät 100c enthält einen Controller 105 zusätzlich zu den Bauelementen des Bild-Dekodiergeräts 100b gemäß der dritten Ausführungsform. Der Controller 105 überwacht die Beanspruchung des Dekodierungsprozesses der Textur-Dekodiereinheit 180 entsprechend dem Betriebszustand des Synthesizers 190c und gibt ein Überlastnachweissignal Lov aus, wenn die Last über einem vorgeschriebenen Wert liegt.
Ferner enthält das Bild-Dekodiergerät 100c an Stelle des zur dritten Ausführungsform gehörenden Datenanalysators 160 einen Datenanalysator 166, der entsprechend dem Abschlussnachweissignal Te und dem Überlastnachweissignal Lov ein Schaltsteuersignal SWc erzeugt. Der weitere Aufbau des Datenanalysators 166 entspricht dem des Datenanalysators 160. Ferner enthält das Dekodiergerät 100c an Stelle des zur dritten Ausführungsform gehörenden Schalters 101b einen Schalter 101c mit einem Eingabeterminal Cin, in den ein kodiertes Bildsignal vom Datenanalysator 166 eingegeben wird, und mit drei Ausgangskontakten Co1, Co2 und Co3, wobei er einen der drei Kontakte abhängig vom Schaltsteuersignal SWc auswählt. Der Ausgangskontakt Co1 ist mit dem Eingang des arithmetischen Dekoders 171 verbunden, der Ausgangskontakt Co2 ist geerdet, und der Ausgangskontakt Co3 ist mit dem Eingang des Invers-Quantisierers 181 und dem Eingang des Bewegungskompensators 184 verbunden.
Außerdem verfügt der Controller 105 über eine Anzahl von Funktionen zur Steuerung des gesamten Dekodiergeräts. Eine dieser Funktionen ist die folgende. Wenn das Zusammenstellen eines zu einem Rahmen gehörenden Bildes innerhalb eines Zeitintervalls zur Bildwiedergabe eines Rahmens nicht abgeschlossen ist, wobei das Zeitintervall im Voraus festgelegt wird, dann stellt der Controller 105 fest, dass die Beanspruchung Lde des Dekodierungsprozesses in der Dekodiereinheit 180 stark ist und gibt das Schaltsteuersignal SWc aus.
Beim Eingang des Überlastnachweissignals Lov steuert der Datenanalysator 166 den Schalter 101c über das Schaltsteuersignal SWc so, dass das Eingabeterminal Cin zwischen den ersten Ausgangskontakt Co1 und den zweiten Ausgangskontakt Co2 geschaltet wird. Genauer gesagt wird der Schalter 101c so gesteuert, dass der kodierte Textur-Bitstrom Ept des kodierten Beliebigformsignals Ep in den geerdeten Kontakt eingegeben wird, wohingegen der kodierte Form-Bitstrom Ekt des kodierten Beliebigformsignals Ep in den arithmetischen Dekoder 171 geleitet wird.
Außerdem hat in dieser vierten Ausführungsform der Synthesizer 190c zusätzlich zu der Funktion des Synthesizers 190 in der dritten Ausführungsform die folgende Funktion. Ist der Dekodierungsprozess des kodierten Textursignals – wie oben beschrieben wurde – stark überlastet, dann synthetisiert der Synthesizer 190c das zum vorliegenden, gerade bearbeiteten Rahmen gehörende dekodierte Formsignal mit dem dekodierten Textursignal des vorhergehenden Rahmens anstatt mit dem zum vorliegenden Rahmen gehörenden dekodierten Textursignal.
Wird in den Datenanalysator 166 kein Überlastnachweissignal Lov eingegeben, d. h., ist der Bild-Dekodierungsprozess nicht stark überlastet, dann steuert der Datenanalysator 166 den Schalter 101c über ein Schaltsteuersignal SWc so, dass das Eingabeterminal Cin mit dem ersten Ausgangskontakt Co1 bzw. dem dritten Ausgangskontakt Co3 verbunden wird. Dadurch führt das Bild-Dekodiergerät 100c gemäß der vierten Ausführungsform einen Bild-Dekodierungsprozess aus, der mit dem übereinstimmt, den das Bild-Dekodiergerät 100b gemäß der dritten Ausführungsform ausführt.
Es wird eine Beschreibung der Wirkungsweise des Bild-Dekodiergeräts 100c gemäß der vierten Ausführungsform gegeben.
Da das Wirkprinzip des Bild-Dekodiergeräts 100c mit dem des Bild-Dekodiergeräts 100b gemäß der dritten Ausführungsform übereinstimmt, wird im Weiteren nur die Wirkungsweise mit Bezug auf den Controller 105 beschrieben.
Ist z. B. bei der Dekodierung des kodierten Beliebigformsignals Ep in der Textur-Dekodiereinheit 180 die Synthese des zum gerade bearbeiteten Rahmen gehörenden dekodierten Bildsignals zu dem Zeitpunkt noch nicht abgeschlossen, wenn das Bild zu diesem Rahmen wiederzugeben ist, dann stellt der Controller 105 fest, dass der Bild-Dekodierungsprozess stark überlastet ist, und gibt das Überlastnachweissignal Lov an den Datenanalysator 166 aus. Dann wird der Schalter 101c durch das Schaltsteuersignal SWc vom Datenanalysator 166 so gesteuert, dass der kodierte Form-Bitstrom Epk des kodierten Beliebigformsignals Ep vom Datenanalysator 166 über den ersten Ausgangskontakt Co1 des Schalters 101c an die Form-Dekodiereinheit 170 übergeben wird, während der kodierte Textur-Bitstrom Ept des kodierten Beliebigformsignals Ep über den zweiten Ausgangskontakt Co2 des Schalters 101c geerdet wird.
Außerdem wird nicht das zum vorliegenden, gerade bearbeiteten Rahmen gehörende dekodierte Textursignal sondern das dekodierte Textursignal vom vorhergehenden Rahmen mit dem zum vorliegenden Rahmen gehörenden dekodierten Formsignal synthetisiert.
Wie oben beschrieben wurde, wird gemäß der vierten Ausführungsform die Beanspruchung des arithmetischen Prozessors im Bild-Dekodiergerät überwacht, und dann, wenn die Dekodierung des zu jedem Rahmen gehörenden Beliebigform-Bildsignals zu spät für die rechtzeitige Wiedergabe des zu jedem Rahmen gehörenden Bildes ist, wird nur der kodierte Form-Bitstrom im kodierten Beliebigformsignal reproduziert, und die Bildwiedergabe erfolgt unter Verwendung eines vorher reproduzierten kodierten Textur-Bitstroms. Deshalb ist es selbst bei einer starken Überlastung des Dekodierungsprozesses möglich, eine Bildwiedergabe zu realisieren, in der das wiedergegebene Bild keine Sprünge aufweist und der Bildfluss stetig ist.
In dieser vierten Ausführungsform gilt es als ein Nachweis der Beanspruchung des Dekodierungsprozesses, wenn das zu jedem Rahmen gehörende dekodierte Bildsignal zu spät für eine rechtzeitige Wiedergabe des zum Rahmen gehörenden Bildes ist, wonach entschieden wird, dass der Dekodierungsprozess stark überlastet ist. Das Belastungsnachweisverfahren ist jedoch nicht darauf beschränkt.
Außerdem wird in dieser vierten Ausführungsform bei einer Überlastung des Dekodierungsprozesses nur der kodierte Form-Bitstrom im kodierten Beliebigformsignal und nicht der kodierte Textur-Bitstrom im kodierten Beliebigformsignal dekodiert. Es kann jedoch auch nur der kodierte Textur-Bitstrom ohne eine Dekodierung des kodierten Form-Bitstroms dekodiert werden.
In diesem Falle wird an Stelle des zum vorliegenden, gerade bearbeiteten Rahmen gehörenden dekodierten Formsignals das zum vorhergehenden Rahmen gehörende dekodierte Formsignal mit dem zum vorliegenden Rahmen gehörenden dekodierten Textursignal synthetisiert.
[Ausführungsform 5]
9 ist ein Blockschema zur Darstellung eines Bild-Dekodiergeräts nach einer fünften Ausführungsform. Die Bezugsziffer 100d in 9 kennzeichnet das Bild-Dekodiergerät gemäß dieser fünften Ausführungsform. Das Bild-Dekodiergerät 100d enthält an Stelle des Controllers 105, der im Bild-Dekodiergerät 100c gemäß der vierten Ausführungsform zum Nachweis der Beanspruchung des Dekodierungsprozesses vorgesehen ist, ein Eingabeterminal 106, wie z. B. eine Maus oder eine Fernsteuerung, zur Eingabe eines manuellen Steuersignals Min von außen in das Bild-Dekodiergerät 100d. An Stelle des Überlastnachweissignals Lov wird das manuelle Steuersignal Min vom Eingabeterminal 106 in den Datenanalysator 165 eingegeben. Die anderen Teile stimmen mit den in der vierten Ausführungsform beschriebenen überein.
Bei Eingang des manuellen Steuersignals Min steuert der Datenanalysator 165 den Schalter 101c über das Schaltsteuersignal SWc so, dass das Eingabeterminal Cin mit dem ersten Ausgangskontakt Co1 bzw. dem zweiten Ausgangskontakt Co2 verbunden wird. Genauer gesagt wird der Schalter 101c so gesteuert, dass der kodierte Textur-Bitstrom Ept des kodierten Beliebigformsignals Ep geerdet wird, wohingegen der kodierte Form-Bitstrom Ekt des kodierten Beliebigformsignals Ep in den arithmetischen Dekoder 171 eingegeben wird.
Wie in der vierten Ausführungsform wird auch in dieser fünften Ausführungsform dann, wenn das manuelle Steuersignal Min zum Datenanalysator 165 hin ausgegeben wird, an Stelle des zum vorliegenden, gerade bearbeiteten Rahmen gehörenden dekodierten Textursignals das zum vorhergehenden Rahmen gehörende dekodierte Textursignal mit dem zum vorliegenden Rahmen gehörenden dekodierten Formsignal synthetisiert.
Empfängt der Datenanalysator 165 kein manuelles Steuersignal Min, dann steuert er den Schalter 101c mit Hilfe des Schaltsteuersignals SWc so, dass das Eingangsterminal Cin mit dem ersten Ausgangskontakt Co1 bzw. dem dritten Ausgangskontakt Co3 verbunden wird. Dadurch führt das Bild-Dekodiergerät 100d nach der fünften Ausführungsform einen Bild-Dekodierungsprozess aus, der mit dem Prozess übereinstimmt, der vom Bild-Dekodiergerät 100b nach der dritten Ausführungsform ausgeführt wird.
Wie oben beschrieben wurde, verfügt das Bild-Dekodiergerät 100d gemäß der fünften Ausführungsform über das Eingabeterminal 106 zur Eingabe des manuellen Steuersignals Min von außen, wie z. B. eine Maus oder eine Fernsteuerung, und die Steuerung des Schalters 101c durch den Datenanalysator 165 wird gemäß dem manuellen Steuersignal Min vom Eingabeterminal 106 her geändert. Deshalb kann – bis der Benutzer eigengesteuert ein reproduziertes Bild empfängt – lediglich der kodierte Form-Bitstrom dekodiert werden, ohne den kodierten Textur-Bitstrom zu dekodieren, und das ermöglicht es dem Benutzer, bei der Reproduktion eines in einem Aufzeichnungsmedium aufgezeichneten kodierten Signals schnell den Kopf des Objektbilds aufzufinden.
In der zweiten bis zur fünften Ausführungsform werden der Kodierungs- oder der Dekodierungsprozess für das kodierte Beliebigformsignal 500 (1(a)) und für das kodierte Binärsignal 600 (1(b)) eingesetzt, was dem Inter-Rahmen-Vorhersage-Kodierungsverfahren entspricht. Jedoch kann das Grundprinzip der vorliegenden Erfindung, das darin besteht, einen Bild-Identifikator zur Identifizierung von Bildsignalen mit unterschiedlichen Datenstrukturen, wie z. B. von einem Beliebigform-Bildsignal und einem binäres Bildsignal, dann hinzuzufügen, wenn diese Bildsignale für die Übermittlung kodiert werden, und den Bild-Identifikator bei der Dekodierung dieser kodierten Signale zu detektieren, so dass der Dekodierungsprozess den kodierten Signalen, wie z. B. einem kodierten Beliebigformsignal und einem kodierten Binärsignal, angepasst ist, auch für das kodierte Beliebigformsignal 500b mit der in 2(a) dargestellten Datenstruktur und das kodierte Binärsignal 600b mit der in 2(b) dargestellten Datenstruktur verwendet werden.
Ferner werden in der ersten bis zur fünften Ausführungsform als Bild-Identifikatoren zur Identifizierung kodierter Bildsignale mit unterschiedlichen Datenstrukturen Form-Identifikatoren (SID = 0 oder 1) verwendet, von denen jeder einen 1-Bit-Kode zur Identifizierung eines kodierten Beliebigformsignals oder eines kodierten Binärsignals umfasst. Es können jedoch Bild-Identifikatoren mit 2-Bit-Kodes (SID = 00, 01, 10 oder 11) oder 3-Bit-Kodes verwendet werden. In diesem Falle ist es möglich, mehrere kodierte Bildsignale durch Bild-Identifikatoren zu identifizieren.
Wird eine Anzahl von kodierten Bildsignalen mit den Bild-Identifikatoren identifiziert, dann kann für ein vorgeschriebenes kodiertes Bildsignal ein Bild-Identifikator verwendet werden, dessen Bitzahl sich von der Bitzahl der Bild-Identifikatoren der anderen kodierten Bildsignale unterscheidet. Zum Beispiel kann ein kodiertes Bildsignal mit einem Bild-Identifikator, der einen 2-Bit-Kode enthält, und ein kodiertes Bildsignal mit einem Bild-Identifikator, der einen 3-Bit-Kode enthält, mit einem System behandelt werden, das zu einem einzigen Kodierungsverfahren korrespondiert. In diesem Fall kann die Kode-Zuordnung zu jedem Bild-Identifikator mit hoher Effizienz ausgeführt werden.
Im Folgenden werden eine Datenstruktur zur Bildübertragung und ein Bild-Dekodierungsverfahren beschrieben, in denen Bild-Identifikatoren mit Kodes von zwei oder mehr Bits verwendet werden.
[Ausführungsform 6]
10(a)–10(c) sind schematische Darstellungen zur Erläuterung der Datenstrukturen für die Bildübertragung gemäß einer sechsten Ausführungsform der vorliegenden Erfindung. 10(a) zeigt eine Datenstruktur eines kodierten Beliebigformsignals, das durch Kodierung eines Beliebigform-Bildsignals erhalten wurde, welches zu einem von mehreren Objekten gehört, aus denen ein Displaybild besteht. 10(b) zeigt eine Datenstruktur eines kodierten Binärsignals, das durch Kodierung eines binären Bildsignals erhalten wurde. 10(c) zeigt eine Datenstruktur eines kodierten Rechtecksignals (kodiertes Pixelwertsignal), das durch Kodierung eines Rechteck-Bildsignals erhalten wurde, das als Wiedergabedaten nur ein Textursignal (Pixelwertsignal) zur Farbwiedergabe eines Bildes enthält.
Diese Datenstrukturen zur Bildübertragung gemäß der sechsten Ausführungsform werden für ein System eingesetzt, in dem ein Rechteck-Bildsignal, das als Wiedergabedaten nur ein Textursignal (d. h. Leuchtdichte- und Farbdifferenzsignal) enthält, kompressiv kodiert und übertragen wird, und in dem außerdem das kodierte Rechteck-Bildsignal dekodiert und wiedergegeben wird. Das heißt, in diesem System sind Bild-Kodierungsverfahren und -gerät so ausgelegt, dass sie einen Kodierungsprozess für ein Rechteck-Bildsignal ausführen, während das Bild-Dekodierungsverfahren und -gerät so ausgelegt sind, dass sie einen Dekodierungsprozess für ein kodiertes Rechteck-Bildsignal (kodiertes Pixelwertsignal) ausführen.
In 10(a) bezeichnet die Bezugsziffer 1500 ein kodiertes Beliebigformsignal, das durch Kodierung eines Beliebigform-Bildsignals erhalten wurde, welches zu einem jeden von mehreren Objekten gehört, aus denen ein Bild eines Displaybilds besteht. Dieses kodierte Beliebigformsignal 1500 stimmt mit dem kodierten Beliebigformsignal 500 gemäß der ersten Ausführungsform überein, außer dass ein Zwei-Bit-Bild-Identifikator 1502 statt des 1-Bit-Bild-Identifikators 502 verwendet wurde.
In 10(b) bezeichnet die Bezugsziffer 1600 ein kodiertes Binärsignal, das durch Kodierung eines binären Bildsignals erhalten wurde, das eine Bildinformation auf einem Displaybild mit einem Binärsignal repräsentiert. Das kodierte Binärsignal 1600 stimmt mit dem kodierten binären Formsignal 600 gemäß der ersten Ausführungsform überein, außer dass ein Zwei-Bit-Bild-Identifikator 1602 statt des 1-Bit-Identifikators 602 verwendet wurde.
In 10(c) bezeichnet die Bezugsziffer 1700 ein kodiertes Pixelwertsignal, das ein kodiertes Rechtecksignal ist, welches durch Kodierung eines Rechtecksignals erhalten wurde, das Informationen über die vertikale und horizontale Größe eines Displaybilds (eines Rahmens) enthält. Dieses kodierte Pixelwertsignal (kodiertes Rechtecksignal) 1700 stimmt mit dem in 23(c) dargestellten kodierten Pixelwertsignal 700a überein, außer dass ein Zwei-Bit-Bild-Identifikator 1702 zwischen dem Synchronsignal 701 und dem Datenkopf 703 eingefügt wurde.
Die 2-Bit-Bild-Identifikatoren (SID) 1502, 1602 und 1702 haben die entsprechenden Werte 01, 10 und 00, und die kodierten Signale 1500, 1600 und 1700 werden anhand der Werte dieser Bild-Identifikatoren identifiziert.
Es wird eine Beschreibung der Funktions- und der Wirkungsweise gegeben.
In der so aufgebauten sechsten Ausführungsform enthält das zum rechteckigen Bildsignal gehörende kodierte Pixelwertsignal 1700 kodierte Textur-Bitströme 71C, die durch Kodierung eines Textursignals erhalten wurden, und einen Zwei-Bit-Bild-Identifikator 1702 zur Anzeige, dass das Signal 1700 nur die kodierten Textur-Bitströme als Wiedergabedaten enthält. Somit kann durch Bezugnahme auf den Bild-Identifikator 1702 zwischen den drei kodierten Signalen, d. h. dem kodierten Beliebigformsignal 1500, dem kodierten Binärsignal 1600 und dem kodierten Pixelwertsignal 1700, unterschieden werden, und das kodierte Pixelwertsignal 1700 kann von den anderen Signalen 1500 und 1600 unterschieden werden.
Im Einzelnen können in einem Bild-Dekodiergerät, das zu MPEG2 passt und für die Dekodierung des kodierten Pixelwertsignals 1700 vorgesehen ist, selbst bei Eingabe des kodierten Beliebigformsignals 1500 oder des kodierten Binärsignals 1600 diese Signale mit Hilfe des Bild-Identifikators als Signale erkannt werden, die sich vom kodierten Pixelwertsignal 1700 unterscheiden. Somit kann vermieden werden, dass das kodierte Beliebigformsignal 1500 oder das kodierte Binärsignal 1600 mit dem an MPEG2 angepassten Dekodierungsprozess bearbeitet werden und der Dekodierungsbetrieb abreißt. Außerdem kann bei einer Eingabe dieser kodierten Signale die Tatsache, dass diese Signale nicht dekodierbar sind, auf dem Displaybild dargestellt werden.
In dieser sechsten Ausführungsform der Erfindung haben das kodierte Beliebigformsignal 1500, das kodierte Binärsignal 1600 und das kodierte Rechtecksignal (kodiertes Pixelwertsignal) 1700 die Datenstrukturen, die durch Inter-Rahmen-Vorhersage-Kodierung von einem zugehörigen Beliebigform-Bildsignal, binären Bildsignal bzw.
Rechteck-Bildsignal erhalten wurden. Diese kodierten Signale können jedoch auch Datenstrukturen haben, die durch Intra-Rahmen-Kodierung der zugehörigen Bildsignale erhalten wurden.
Außerdem werden bei den in der sechsten Ausführungsform verwendeten zugehörigen kodierten Signalen einem jeden Block der kodierte Form-Bitstrom und der kodierte Textur-Bitstrom – entweder beide oder einer von beiden – zugeordnet. In jedem kodierten Signal können auch für jeden Rahmen vorgeschriebene kodierte Bitströme angeordnet werden.
[Ausführungsform 7]
11 ist ein Blockschema zur Veranschaulichung eines Bild-Dekodiergeräts nach einer siebenten Ausführungsform. Die Bezugsziffer 100e in 11 kennzeichnet ein Bild-Dekodiergerät für die Dekodierung kodierter Daten mit Datenstrukturen zur Bildübertragung gemäß der sechsten Ausführungsform der Erfindung. Dieses Bild-Dekodiergerät 100e ist wie folgt aufgebaut. Wenn das Gerät 100e als kodierte Daten Eo das in 10(a) dargestellte kodierte Beliebigformsignal (Ep) 1500 und das in 10(b) dargestellte kodierte Binärsignal (E2) 1600 empfängt, dann dekodiert es diese kodierten Signale nicht, sondern zeigt an, dass diese gerade einlaufenden kodierten Daten nicht dekodierbar sind. Empfängt das Gerät 100e andererseits als kodierte Daten Eo das in 10(c) dargestellte kodierte Rechtecksignal Et (1700), dann gibt es ein dekodiertes Rechtecksignal Dt als dekodierte Bilddaten aus.
Genauer gesagt enthält das Bild-Dekodiergerät 100e einen Datenanalysator 160e, welcher die in das Eingabeterminal 160a einlaufenden kodierten Daten Eo analysiert und entsprechend dem Analyseergebnis ein Schaltsteuersignal SWe ausgibt; eine Textur-Dekodiereinheit 180e, die an dem kodierten Rechtecksignal (kodiertes Pixelwertsignal) Et einen Dekodierungsprozess einschließlich Umkehr-DCT ausführt; einen Schalter 101e, welcher das vom Datenanalysator 160e analysierte und ausgegebene kodierte Signal der Dekodiereinheit 180e bzw. der Erdleitung zuführt; und einen Rahmen-Speichermodul 102e, der ein Vorhersage-Textursignal speichert.
Der Datenanalysator 160e analysiert die einlaufenden kodierten Daten zur Überprüfung des auf das 32-Bit-Synchronsignal am Kopf folgenden Zwei-Bit-Bild-Identifikators, wobei der Bild-Identifikator entweder der in 10(a) dargestellte Bild-Identifikator (SID = 01) 1502 im kodierten Beliebigformsignal 1500 oder der in 10(b) dargestellte Bild-Identifikator (SID = 10) 1602 im kodierten Binärsignal oder der in 10(c) dargestellte Bild-Identifikator (SID = 00) 1702 im kodierten Rechtecksignal ist. Ist der gesetzte Wert des Bild-Identifikators (SID) gleich 01 oder 10, dann steuert der Datenanalysator 160e den Schalter 101e über das Schaltsteuersignal SWe so, dass das einlaufende kodierte Signal auf Erdleitung gelegt wird. Wenn der gesetzte Wert des Bild- Identifikators (SID) gleich 00 ist, dann steuert der Datenanalysator 160e den Schalter 101e über das Schaltsteuersignal SWe so, dass die einlaufenden kodierten Daten in die Dekodiereinheit 180e eingegeben werden.
Im Weiteren stimmt die Struktur des Datenanalysators 160e mit der des Datenanalysators 160 von der in 7(b) dargestellten dritten Ausführungsform überein, und die Struktur der Textur-Dekodiereinheit 180e stimmt mit der Struktur der Dekodiereinheit 180 von der dritten Ausführungsform überein.
Im Bild-Dekodiergerät 100e wird das dekodierte (reproduzierte ) Textursignal Dt, d. h. die Ausgabe der Dekodiereinheit 180e, unmittelbar in den Rahmen-Speichermodul 102e und die Wiedergabeeinheit 104 eingegeben. Es kann jedoch ein Synthesizer, der mit dem in der dritten Ausführungsform verwendeten Synthesizer 190 (siehe 5) übereinstimmt, vor der Wiedergabeeinheit 104 angeordnet werden, so dass das dekodierte Textursignal Dt mit einem anderen dekodierten Beliebigformsignal synthetisiert wird.
Es wird eine Beschreibung der Arbeitsweise des Bild-Dekodiergeräts 100e gegeben.
12 ist ein Flussdiagramm des Dekodierungsprozesses durch das Bild-Dekodiergerät 100e nach der siebenten Ausführungsform. Wird ein kodiertes Bildsignal mit einer Datenstruktur, die in einer der 10(a), 10(b) oder 10(c) dargestellt ist, in das Bild-Dekodiergerät 100e eingegeben, dann analysiert der Datenanalysator 160e den auf das 32-Bit-Synchronsignal folgenden 2-Bit-Bild-Identifikator und entscheidet, ob der Wert des Bild-Identifikators (SID) 00 ist oder nicht (Schritt Se1).
Ist das Ergebnis der Entscheidung nicht SID = 00, sondern SID = 01 oder SID = 10, weil das einlaufende kodierte Bildsignal Eo ein kodiertes Beliebigformsignal Ep oder ein kodiertes Binärsignal E2 ist, dann steuert der Datenanalysator 160e den Schalter 101e über das Schaltsteuersignal SWe so, dass das kodierte Signal der Erdleitung zugeführt wird. Dadurch wird das kodierte Beliebigformsignal Ep oder das kodierte Binärsignal E2 gelöscht (Schritt Se3). Somit wird das kodierte Bildsignal E2 oder Ep, das kodierte Form-Bitströme enthält, nie durch die Dekodiereinheit 180e bearbeitet.
Bei einer Eingabe des kodierten Beliebigformsignals Ep oder des kodierten Binärsignals E2 in das Gerät 100e zeigt das Gerät 100e eine Nachricht an, dass das gerade eingegebene kodierte Signal durch dieses Dekodiergerät 100e nicht verarbeitet werden kann (Schritt Se4).
Danach wird entschieden, ob das einlaufende kodierte Signal aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt Se6). Besteht das einlaufende kodierte Signal nicht aus den Daten des letzten Blocks im letzten Rahmen, dann werden an einem zum nächsten Block gehörenden kodierten Eingangssignal die Schritte Se1, Se3, Se4 und Se6 ausgeführt. Besteht das Eingangssignal jedoch aus den Daten des letzten Blocks im letzten Rahmen, dann ist die Dekodierung des Eingangssignals beendet.
Ist andererseits im Schritt Se1 das Ergebnis der Entscheidung SID = 00, weil die einlaufenden kodierten Daten Eo aus einem kodierten Rechtecksignal Et bestehen, dann steuert der Datenanalysator 160e den Schalter 101e über das Schaltsteuersignal SWe so, dass das kodierte Signal in die Dekodiereinheit 180e eingegeben wird. Somit dekodiert die Textur-Dekodiereinheit 180e den im kodierten Rechtecksignal Et enthaltenen kodierten Textur-Bitstrom (Schritt Se2).
Im Einzelnen werden in der Dekodiereinheit 180e die Quantisierungsskala und die DCT-Koeffizienten, die im Bitstrom enthalten sind, in den Invers-Quantisierer 181 eingegeben, und die DCT-Koeffizienten werden invers quantisiert. Danach wird für das invers quantisierte Signal Diq durch den Umkehr-Kosinus-Transformator 182 eine Umkehr-Kosinus-Transformation ausgeführt.
Inzwischen wird der Textur-Bewegungsvektor BV in den Textur-Bewegungskompensator 184 eingegeben. Der Kompensator 184 erzeugt eine Adresse, um ein dem Textur-Bewegungsvektor BV zugeordnetes Vorhersage-Textursignal zu erhalten, und empfängt das Vorhersage-Textursignal Emp vom Rahmen-Speichermodul 102e unter Verwendung der Adresse.
Der Addierer 183 fügt die Ausgabedaten Didct des Umkehr-Kosinus-Transformators 182 und das Vorhersage-Textursignal Emp zusammen und gibt das dekodierte Textursignal Dpt (dekodiertes Rechtecksignal) an die Wiedergabeeinheit 104 aus (Schritt Se5). Gleichzeitig wird das dekodierte Textursignal Dt in den Rahmen-Speichermodul 102e eingegeben. Für die Wiedergabe kann nach der Dekodiereinheit ein Synthesizer vorgesehen werden, um das dekodierte Rechtecksignal mit einem weiteren Beliebigform-Bildsignal zu synthetisieren.
Danach wird entschieden, ob das kodierte Rechtecksignal Et aus Daten des letzten Blocks im letzten Rahmen besteht (Schritt Se6). Besteht das Signal Et nicht aus den Daten des letzten Blocks im letzten Rahmen, dann werden die Schritte Se1, Se2, Se5 und Se6 an einem kodierten Rechtecksignal des nächsten Blocks ausgeführt. Besteht das Signal Et aus den Daten des letzten Blocks im letzten Rahmen, dann ist die Dekodierung des kodierten Rechtecksignals beendet.
Wie oben beschrieben wurde, enthält das Bild-Dekodiergerät 100e nach der sechsten Ausführungsform der Erfindung den Datenanalysator 160e, der die einlaufenden kodierten Daten analysiert. Der Datenanalysator 160e stellt mit Hilfe des Zwei-Bit-Bild-Identifikators fest, ob das in das Gerät einlaufende kodierte Bildsignal ein kodiertes Signal ist, das als Bildinformation kodierte Form-Bitströme (d. h. das kodierte Binärsignal E2 oder das kodierte Beliebigformsignal Ep) enthält, oder ob es ein kodiertes Rechtecksignal Et ohne kodierte Form-Bitströme ist, und im Ergebnis der Entscheidung steuert der Analysator 160e den Schalter 101e so, dass das einlaufende kodierte Signal in die Erdleitung oder die Dekodiereinheit 180e eingegeben wird. Deshalb werden selbst dann, wenn das kodierte Beliebigformsignal Ep oder das kodierte Binärsignal E2 in das Bild-Dekodiergerät 100e eingegeben wird, welches für das kodierte Rechtecksignal Et vorgesehen ist, diese kodierten Signale nicht dekodiert, wodurch verhindert wird, dass es zu einem Abbruch des Dekodierungsprozesses kommt.
Diese siebente Ausführungsform ist besonders auf das Bild-Dekodiergerät 100e zugeschnitten, das entsprechend einem Bild-Identifikator ein kodiertes Signal, das kodierte Form-Bitströme enthält, aus den kodierten Signalen mit Datenstrukturen gemäß der sechsten Ausführungsform auswählt, d. h. dem kodierten Beliebigformsignal 1500, dem kodierten Binärsignal 1600 und dem kodierten Rechtecksignal 1700. Wenn jedoch die Bild-Eingabeeinheit 110 im Bild-Kodiergerät 100a gemäß der zweiten Ausführungsform (vgl. 3) so aufgebaut ist, dass es ein Beliebigform-Bildsignal, ein binäres Bildsignal und ein Rechteck-Bildsignal identifizieren kann, dann kann ein Bild-Kodiergerät so aufgebaut werden, dass es die Kodierung dieser Bildsignale mit Bild-Identifikatoren zur Identifizierung der zu diesen Bildsignalen gehörenden kodierten Signale ausführt.
[Ausführungsform 8]
13(a) und 13(b) sowie 14(a) und 14(b) sind schematische Darstellungen zur Erläuterung von Datenstrukturen zur Bildübertragung entsprechend einer achten Ausführungsform der vorliegenden Erfindung. Im Einzelnen zeigt 13(a) eine Datenstruktur eines kodierten Beliebigformsignals (erstes kodiertes Beliebigformsignal ) 2500, das durch Kodieren eines Beliebigform-Bildsignals mit sowohl kodierten Form-Bitströmen als auch kodierten Textur-Bitströmen erhalten wurde, und 13(b) zeigt eine Datenstruktur eines kodierten Binärsignals 2600, das durch Kodieren eines binären Bildsignals erhalten wurde. 14(b) zeigt die Datenstruktur eines kodierten Rechtecksignals (kodiertes Pixelwertsignal) 2700, das durch Kodieren eines. Rechteck-Bildsignals erhalten wurde, und 14(b) zeigt eine Datenstruktur eines kodierten Beliebigformsignals mit Transparenz-Informationen (zweites kodiertes Beliebigformsignal) 2800, das durch Kodieren eines Beliebigform-Bildsignals erhalten wurde, das Transparenz-Informationen enthält.
Diese Datenstrukturen zur Bildübertragung gemäß der achten Ausführungsform werden in einem System eingesetzt, in welchem das Transparenz-Informationen enthaltende Beliebigform-Bildsignal kompressiv kodiert und übertragen wird, und im Weiteren wird das durch kompressives Kodieren erhaltene zweite kodierte Beliebigformsignal dekodiert und wiedergegeben. Das heißt, in diesem System sind Bild-Kodierungsverfahren und -gerät so aufgebaut, dass sie einen Kodierungsprozess für das Transparenz-Informationen umfassende Beliebigform-Bildsignal ausführen, während Bild-Dekodierungsverfahren und – gerät für die Ausführung eines Dekodierungsprozesses für das zweite kodierte Beliebigformsignal ausgelegt sind.
Das in 13(a) dargestellte erste kodierte Beliebigformsignal 2500 stimmt mit dem in 10(a) dargestellten kodierten Beliebigformsignal 1500 nach der sechsten Ausführungsform überein, d. h., es wird erhalten, indem der 1-Bit-Form-Identifikator 502 im kodierten Beliebigformsignal 500 gemäß der ersten Ausführungsform durch einen Zwei-Bit-Bild-Identifikator 2502 ersetzt wird.
Das in 13(b) dargestellte kodierte binäre Formsignal 2600 stimmt mit dem in 10(b) dargestellten kodierten binären Formsignal 1600 nach der sechsten Ausführungsform überein, d. h., es wird erhalten, indem der 1-Bit-Form-Identifikator 602 im kodierten binären Formsignal 600 gemäß der ersten Ausführungsform durch einen Zwei-Bit-Bild-Identifikator 2602 ersetzt wird.
Das in 14(a) dargestellte kodierte Pixelwertsignal 2700 stimmt mit dem in 10(c) dargestellten kodierten Pixelwertsignal 1700 nach der sechsten Ausführungsform überein, d. h., es wird erhalten, indem ein Zwei-Bit-Bild-Identifikator 2702 zwischen dem Synchronsignal 701 und dem Datenkopf 703 in das in 23(c) dargestellte kodierte Pixelwertsignal 700a eingefügt wird.
Das in 14(b) dargestellte zweite kodierte Beliebigformsignal 2800 enthält am Anfang ein 32-Bit-Synchronsignal 801, einen auf das Synchronsignal 801 folgenden Zwei-Bit-Bild-Identifikator (SID) 2802 und einen auf den Bild-Identifikator 2802 folgenden zusätzlichen Datenkopf 803.
Außerdem enthält das zweite kodierte Beliebigformsignal 2800 kodierte Form-Bitströme 81D, welche durch Kodierung eines Formsignals (binäres Transparenzsignal) erhalten wurden, das die Form eines jeden Objekts als ein Bestandteil des Beliebigform-Bildsignals mit Transparenzinformationen darstellt; kodierte Textur-Bitströme (kodierte Pixelwertströme) 82D, welche durch Kodierung eines Textursignals (Pixelwertsignal) erhalten wurden, das ein Leuchtdichtesignal und ein Farbdifferenzsignal zur Farbdarstellung eines jeden Objekts umfasst und das ein Bestandteil des Beliebigform-Bildsignals mit Transparenz-Informationen ist; und kodierte Transparenz-Bitströme 83D, welche durch Kodierung eines mehrwertigen Transparenzsignals erhalten wurden, das die Transparenz eines jeden Objekts als ein Bestandteil des Beliebigform-Bildsignals mit Transparenz-Informationen wiedergibt.
Im Einzelnen sind in dem kodierten Beliebigformsignal 2800 für jeden der Blöcke, in die eine ein Objekt auf einem Displaybild umfassende Objektregion unterteilt ist, ein kodierter Form-Bitstrom 81D, ein kodierter Textur-Bitstrom 82D und ein kodierter Transparenz-Bitstrom 83D in dieser Reihenfolge angeordnet.
Genauer gesagt sind auf den Datenkopf 803 folgend angeordnet: ein kodierter Form-Bitstrom 81D1, ein kodierter Textur-Bitstrom 82D1 und ein kodierter Transparenz-Bitstrom 83D1, die zu einem Block D1 gehören; ein kodierter Form-Bitstrom 81D2, ein kodierter Textur-Bitstrom 82D2 und ein kodierter Transparenz-Bitstrom 83D2, die zu einem Block D2 gehören; und ein kodierter Form-Bitstrom 81D3, ein kodierter Textur-Bitstrom 82D3 und ein kodierter Transparenz-Bitstrom 83D3, die zu einem Block D3 gehören.
Außerdem enthalten, wie in 14(b) dargestellt ist, die kodierten Form-Bitströme 81D1, 81D2 und 81D3 jeweils längenvariant kodierte Daten 804, 812 und 820, die Form-Bewegungsvektoren (in der Figur einfach als Form-BV bezeichnet) entsprechen; und längenvariant kodierte Daten 805, 813 und 821, die binären Formsignalen (binären Transparenzsignalen) entsprechen, wobei jedes Signal anzeigt, ob die Pixel im Block innerhalb oder außerhalb des Objekts liegen (in der Figur: Formdaten).
Die kodierten Textur-Bitströme 82D1, 82D2 und 82D3 enthalten jeweils 5-Bit-kodierte Daten 806, 814 und 822, die Quantisierungsskalen (in der Figur: Quantisierungsskala) entsprechen; längenvariabal kodierte Daten 807, 815 und 823, die Textur-Bewegungsvektoren (in der Figur: Textur-BV) entsprechen; und längenvariant kodierte Daten 808, 816 und 824, die quantisierten Signalen entsprechen, die aus dem Textursignal durch Ausführen von DCT und Quantisierung erhalten wurden (in der Figur: Textur-DCT-Koeffizienten).
Die kodierten Transparenz-Bitströme 83D1, 83D2 und 83D3 enthalten jeweils 5-Bitkodierte Daten 809, 817 und 825, die Quantisierungsskalen entsprechen (in der Figur: Quantisierungsskala); längenvariant kodierte Daten 810, 818 und 826, die Transparenz-Bewegungsvektoren (in der Figur: Transparenz-BV) entsprechen; und längenvariant kodierte Daten 811, 819 und 827, die quantisierten Signalen entsprechen, die aus dem mehrwertigen Transparenzsignal durch Ausführen von DCT und Quantisierung erhalten wurden (in der Figur: Transparenz-DCT-Koeffizienten).
Das Synchronsignal 801 ist ein Signal zur Anzeige des Kopfes eines zu einem Objekt gehörenden kodierten Beliebigformsignals, und es ist ein einmalig kodiertes Signal. Der Form-Identifikator (SID) 2802 ist ein Signal zur Anzeige, welchen Typ von den oben beschriebenen vier Typen kodierter Bildsignale das kodierte Bildsignal hat, d. h., es ist ein Signal zur Feststellung der Art der im kodierten Bildsignal enthaltenen Bitströme. Ist der Wert des Bild-Identifikators (SID) gleich 01, dann wird angezeigt, dass im kodierten Bildsignal sowohl kodierte Form-Bitströme als auch kodierte Textur-Bitströme vorkommen. Bei SID = 10 zeigt der Bild-Identifikator an, dass nur die kodierten Form-Bitströme im kodierten Signal vorliegen. Bei SID = 00 zeigt der Bild-Identifikator an, dass nur die kodierten Textur-Bitströme im kodierten Signal vorkommen. Wenn SID gleich 11 ist, dann zeigt der Bild-Identifikator das Vorhandensein der kodierten Form-Bitströmen, der kodierten Textur-Bitströmen und der kodierten Transparenz-Bitströmen im kodierten Signal an.
Der Datenkopf 803 enthält Informationen z. B. über den Wiedergabezeitpunkt des Bildes des zugehörigen Objekts, zum Bildattribut und zum Vorhersagemodus für die Kodierung. Diese Daten haben jedoch keinen Bezug zur vorliegenden Erfindung und erfordern deshalb keine ausführliche Beschreibung.
Der Form-BV ist die kodierte Datenmenge eines Bewegungsvektors, der die Bewegung eines Bildes innerhalb eines Blocks zwischen dem vorliegenden und dem vorhergehenden Rahmen aufzeigt, und er wird zur Vorhersage eines Formsignals eines bestimmten Blocks im vorliegenden Rahmen aus einem Formsignal des entsprechenden Blocks im vorhergehenden Rahmen verwendet. Ferner werden die Formdaten durch arithmetische Kodierung eines Formsignals erhalten, und die Quantisierungsskala (im kodierten Textur-Bitstrom) ist ein Parameter für die inverse Quantisierung der DCT-Koeffizienten, die erhalten werden, indem an einem Textursignal DCT und Quantisierung ausgeführt werden. Der Textur-BV ist ein kodiertes Signal eines Textur-Bewegungsvektors, der die Bewegung eines Bildes innerhalb eines Blocks zwischen dem vorliegenden und dem vorhergehenden Rahmen aufzeigt, und er wird zur Vorhersage eines Textursignals vom vorliegenden Rahmen aus einem Textursignal vom vorhergehenden Rahmen verwendet. Ferner werden die Textur-DCT-Koefffizienten erhalten, indem ein quantisiertes Signal des Textursignals längenvariant kodiert wird. Ferner ist der Transparenz-BV ein kodiertes Signal eines Transparenz-Bewegungsvektors, der die Bewegung eines Bildes innerhalb eines Blocks zwischen dem vorliegenden und dem vorhergehenden Rahme aufzeigt, und er wird zur Vorhersage eines mehrwertigen Transparenzsignals vom vorliegenden Rahmen aus einem mehrwertigen Transparenzsignal vom vorhergehenden Rahmen verwendet. Außerdem ist die Quantisierungsskala (im kodierten Transparenz-Bitstrom) ein Parameter für die inverse Quantisierung der Transparenz-DCT-Koeffizienten, die erhalten werden, indem an einem mehrwertigen Transparenzsignal DCT und Quantisierung ausgeführt werden. Die Transparenz-DCT-Koeffizienten werden erhalten, indem ein quantisiertes Signal des Transparenzsignals längenvariant kodiert wird.
Obwohl diese Daten in der Figur nicht dargestellt sind, werden im kodierten Beliebigformsignal 2800 vor den Textur-DCT-Koeffizienten verschiedene Arten von Nebeninformationen (Daten) untergebracht, und diese Nebendaten erfordern manchmal eine große Anzahl von Bits.
Es wird eine Beschreibung der Funktions- und Wirkungsweise gegeben.
In der so aufgebauten achten Ausführungsform enthalten die vier kodierten Bildsignale – d. h. das zu einem Beliebigform-Bildsignal gehörende erste kodierte Beliebigformsignal 2500, das zu einem binären Bildsignal gehörende kodierte Binärsignal 2600, das zu einem Rechteck-Bildsignal gehörende kodierte Pixelwertsignal (kodiertes Rechtecksignal) 2700 und das zu einem Beliebigform-Bildsignal mit Transparenz-Informationen gehörende zweite kodierte Beliebigformsignal 2800 – wegen der unterschiedlichen Datenstrukturen die entsprechenden Zwei-Bit-Bild-Identifikatoren 2502, 2602, 2702 und 2802 zur Identifizierung dieser kodierten Signale. Deshalb können diese vier kodierten Signale durch Bezugnahme auf die Bild-Identifikatoren auf der Dekodierungsseite identifiziert werden.
Im Einzelnen ermöglichen die Bild-Identifikatoren in einem Bild-Dekodiergerät, das MPEG4 angepasst und für die Dekodierung des oben erwähnten kodierten Beliebigformsignals ausgelegt ist, dem Gerät eine richtige Dekodierung des kodierten Binärsignals und des kodierten Rechtecksignals selbst dann, wenn das kodierte Binärsignal und das kodierte Rechtecksignal zusätzlich zu dem ersten und dem zweiten kodierten Beliebigformsignal eingegeben werden. Folglich kann vermieden werden, dass das kodierte Binärsignal und das kodierte Rechtecksignal mit einem Dekodierungsprozess verarbeitet werden, der an MPEG4 angepasst ist, und dass der Dekodierungsprozess abbricht.
In dieser achten Ausführungsform der Erfindung haben das erste und zweite kodierte Beliebigformsignal, das kodierte Binärsignal sowie das kodierte Rechtecksignal die Datenstrukturen, die durch Inter-Rahmen-Vorhersage-Kodierung eines zugehörigen Beliebigform-Bildsignals, Beliebigform-Bildsignals mit Transparenz-Informationen, binären Bildsignals oder Rechteck-Bildsignals erhalten wurden. Diese kodierten Signale können jedoch jedoch auch Datenstrukturen haben, die durch Intra-Rahmen-Kodierung der entsprechenden Bildsignale erzeugt wurden.
Außerdem ist in den jeweiligen kodierten Signalen, die in dieser achten Ausführungsform verwendet werden, einem jeden Block mindestens einer von den kodierten Form-, Textur- und Transparenz-Bitströmen zugeordnet. In jedem kodierten Signal können aber auch jedem Rahmen vorgeschriebene kodierte Bitströme zugeordnet werden (vgl. 2(a) und 2(b)).
Außerdem enthält in der Datenstruktur des in 14(b) dargestellten zweiten kodierten Beliebigformsignals 2800 (kodiertes Signal des Beliebigform-Bildsignals mit Transparenzinformationen) jeder der kodierten Transparenz-Bitströme 83D – ähnlich wie die kodierten Textur-Bitströme 82D – einen Transparenz-BV und eine Quantisierungsskala. Es ist jedoch nicht immer nötig, dass der kodierte Transparenz-Bitstrom 83D im zweiten kodierten Beliebigformsignal 2800 den Transparenz-BV und die Quantisierungsskala enthält.
Hat das kodierte Signal des Beliebigform-Bildsignals mit Transparenz-Informationen die Datenstruktur, in der die kodierten Transparenz-Bitströme 83D keine Transparenz-BV und keine Quantisierungsskalen enthalten, dann wird die Dekodierung der Transparenz- DCT-Koeffizienten unter Verwendung der Textur-BV und der Quantisierungsskalen von den kodierten Textur-Bitströmen 82D ausgeführt.
[Ausführungsform 9]
15 ist ein Blockschema zur Darstellung eines Bild-Dekodiergeräts gemäß einer neunten Ausführungsform der vorliegenden Erfindung. Die Bezugsziffer 100f in 15 kennzeichnet ein Bild-Dekodiergerät, das kodierte Daten mit der Datenstruktur zur Bildübertragung gemäß der achten Ausführungsform dekodiert. Das Bild-Dekodiergerät 100f ist so aufgebaut, dass es einen Dekodierungs-Prozess ausführt, welcher der Datenstruktur eines als kodierte Datenmenge einlaufenden kodierten Signals angepasst ist.
Im Einzelnen ist das Gerät 100f wie folgt aufgebaut. Empfängt das Gerät 100f als kodierte Daten Eo das in 13(b) dargestellte kodierte Binärsignal (E2) 2600, dann gibt es als dekodierte Bilddaten Dsyn ein dekodiertes Binärsignal D2 aus. Empfängt das Gerät 100f als kodierte Daten Eo das in 13(a) dargestellte erste kodierte Beliebigformsignal (Ep) 2500, dann gibt es für jedes Objekt als dekodierte Bilddaten Dsyn ein dekodiertes Beliebigformsignal Dp aus. Empfängt das Gerät 100f als kodierte Daten Eo das in 14(a) dargestellte kodierte Rechtecksignal (Et) 2700, dann gibt es als dekodierte Bilddaten Dsyn ein dekodiertes Rechtecksignal Dt aus. Empfängt das Gerät 100f als kodierte Daten Eo das in 14(b) dargestellte zweite kodierte Beliebigformsignal (Ex) 2800, dann gibt es für jedes Objekt als dekodierte Bilddaten Dsyn ein dekodiertes Beliebigformsignal Dx mit Transparenz-Informationen aus.
Im Weiteren wird die Struktur des Bild-Dekodiergeräts 100f ausführlich beschrieben.
Das Gerät 100f enthält einen Datenanalysator 160f, der die in das Eingabeterminal 160a einlaufenden kodierten Daten Eo analysiert und gemäß dem Analyseergebnis ein Schaltsteuersignal SWf ausgibt; eine Form-Dekodiereinheit (erste Dekodierhilfsmittel) 170, welche für die Formdaten (kodiertes Formsignal) einen arithmetischen Dekodierungsprozess ausführt; eine Textur-Dekodiereinheit (zweite Dekodierhilfsmittel) 180f, welche für die Textur-DCT-Koeffizienten Ept und die Transparenz-DCT-Koeffizienten Egt einen Dekodierungsprozess einschließlich Umkehr-DCT ausführt; einen Schalter 101f, welcher entsprechend dem Schaltsteuersignal SWf das vom Datenanalysator 160f analysierte und ausgegebene kodierte Signal einer der beiden Dekodiereinheiten 170 bzw. 180f zuführt; und einen Rahmen-Speichermodul 102f, der ein Vorhersage-Formsignal, ein Vorhersage-Textursignal und ein Vorhersage-Transparenzsigrial speichert.
Der Datenanalysator 160f analysiert das einlaufende kodierte Signal zur Überprüfung des auf das 32-Bit-Synchronsignal am Kopf folgenden 2-Bit-Bild-Identifikators (einer der Bild-Identifikatoren 2502, 2602, 2702 und 2802 in den kodierten Signalen, die jeweils in den 13(a), 13(b) 14(a) und 14(b) dargestellt sind), und steuert den Schalter 101f entsprechend dem gesetzten Wert des Bild-Identifikators (SID).
Bei SID = 01 wird der Schalter 101f durch das Schaltsteuersignal SWf so gesteuert, dass die kodierten Form-Bitströme des einlaufenden kodierten Signals in die Form-Dekodiereinheit 170 und die kodierten Textur-Bitströme des kodierten Signals in die Textur-Dekodiereinheit 180f eingegeben werden. Bei SID = 10 wird der Schalter 101f durch das Schaltsteuersignal SWf so gesteuert, dass die einlaufenden kodierten Daten in die Form-Dekodiereinheit 170 eingegeben werden. Bei SID = 00 wird der Schalter 101f durch das Schaltsteuersignal SWf so gesteuert, dass die kodierten Textur-Bitströme des einlaufenden kodierten Signals in die Textur-Dekodierhilfsmittel 180f eingegeben werden. Bei SID = 11 wird der Schalter 101f durch das Schaltsteuersignal SWf so gesteuert, dass die kodierten Form-Bitströme des einlaufenden kodierten Signals in die Form-Dekodiereinheit 170 und die kodierten Textur- sowie Transparenz-Bitströme in die Textur-Dekodiereinheit 180f eingegeben werden.
Ähnlich dem Datenanalysator 160 nach der in 7(b) dargestellten dritten Ausführungsform enthält der Datenanalysator 160f eine Tabellen-Speichereinheit 162, einen Komparator 161 und einen Schalter-Steuerkreis 163. In dieser neunten Ausführungsform vergleicht der Komparator 161 den Bitstrom des einlaufenden kodierten Signals mit dem Bitstrom der Dekodier-Referenztabelle, die in der Tabellen-Speichereinheit 162 gespeichert ist, und identifiziert den Bild-Identifikator, den kodierten Form-Bitstrom, den kodierten Textur-Bitstrom und den kodierten Transparenz-Bitstrom, die in den kodierten Daten enthalten sind. Entsprechend dem Ergebnis der Identifizierung gibt der Komparator 161 ein Schaltsteuersignal SWf an den Schalter 101f aus.
Die Textur-Dekodiereinheit (zweite Dekodierhilfsmittel) 180f enthält einen Textur-Bewegungskompensator 184f, der entsprechend dem Textur-Bewegungsvektor oder dem Transparenz-Bewegungsvektor eine Adresse erzeugt, um ein Vorhersage-Textursignal oder ein Vorhersage-Transparenzsignal zu erhalten, und der unter Verwendung der Adresse ein Vorhersage-Textursignal Emp oder ein Vorhersage-Transparenzsignal Emg aus dem Rahmen-Speichermodul 102b empfängt. Außerdem enthält die Textur-Dekodiereinheit 180f einen Invers-Quantisierer 181f, der die Quantisierungsskala und die DCT-Koeffizienten im kodierten Textur-Bitstrom oder im kodierten Transparenz-Bitstrom empfängt und die DCT-Koeftizienten invers quantisierf; und einen Umkehr-Kosinus-Transformator 182f, der an den invers quantisierten DCT-Koeffizienten Diq eine Umkehr-Kosinus-Transformation ausführt. Außerdem enthält die Textur-Dekodiereinheit 180f einen Addierer 183, der das Vorhersage-Textursignal Emp oder das Vorhersage-Transparenzsignal Emg zum umkehr-kosinustransformierten Signal Didct hinzufügt und ein reproduziertes Textursignal (dekodiertes Textursignal) Dpt oder ein reproduziertes Transparenzsignal (dekodiertes Transparenzsignal) Dpg ausgibt. Das reproduzierte Textursignal Dpt oder das reproduzierte Transparenzsignal Dpg aus dem Addierer 183 wird im Rahmen-Speichermodul 102f gespeichert.
Das Bild-Dekodiergerät 100f enthält im Weiteren einen Synthesizer 190f, der eine Synthese der Ausgabedaten des Dekodiergeräts 180f (entweder das reproduzierte Textursignal Dpt und das reproduzierte Transparenzsignal Dpg beide zusammen oder nur das reproduzierte Textursignal Dpt) sowie der Ausgabedaten der Dekodiereinheit 170 (das reproduzierte Formsignal Dk entsprechend der Ausgabe der Dekodiereinheit 180f) mit gewünschten Bilddaten ausführt und an die Wiedergabeeinheit 104 synthetisierte Bilddaten Dsyn ausgibt, die das reproduzierte Beliebigformsignal Dx mit Transparenz-Informationen oder das reproduzierte Beliebigformsignal Dp enthalten. Obwohl der Synthesizer 190f gemäß der neunten Ausführungsform das reproduzierte Binärsignal D2 von der Dekodiereinheit 170 oder das reproduzierte Rechtecksignal Dt von der Dekodiereinheit 180f unmittelbar zur Wiedergabeeinheit 104 übermittelt, kann das Signal D2 oder Dt im Synthesizer 190f auch mit einem anderen Beliebigform-Bildsignal synthetisiert werden. Obwohl das vom Synthesizer 190f ausgegebene Signal in die Wiedergabeeinheit 104 eingegeben wird, kann es auch in ein Informationsausgabegerät, wie z. B. einen Drucker (nicht dargestellt), eingegeben werden.
In dieser neunten Ausführungsform werden für Pixel, in denen das reproduzierte Formsignal Null ist, die Pixelwerte im reproduzierten Textursignal und im reproduzierten Transparenzsignal durch Pixelwerte eines vorgeschriebenen Bildes ersetzt. Das vorgeschriebene Bild ist ein im Voraus an der Empfangsstation hergestelltes Bild oder ein Bild, das von einem anderen Bild-Dekodiergerät reproduziert wurde.
Es wird eine Beschreibung der Arbeitsweise des Bild-Dekodiergeräts 100f gemäß der neunten Ausführungsform gegeben.
16 ist ein Flussdiagramm des Dekodierungsprozesses durch das Bild-Dekodiergerät 100f. Wird in das Bild-Dekodiergerät 100f ein kodiertes Bildsignal mit einer Datenstruktur, die in einer der 13(a), 13(b), 14(a), und 14(b) dargestellt ist, eingegeben, dann analysiert der Datenanalysator 160f den im kodierten Bildsignal auf das 32-Bit-Synchronsignal folgenden 2-Bit-Bild-Identifikator und entscheidet, ob der Wert des Bild-Identifikators „SID = 00 bzw. SID = 11" oder ein anderer ist (Schritt Sf1).
Ist das Ergebnis der Entscheidung SID = 00 oder 11, dann wird entschieden, ob SID = 00 oder nicht ist (Schritt Sf2). Ist das Ergebnis der Entscheidung in Schritt Sf2 SID = 00, weil das einlaufende kodierte Bildsignal Eo das kodierte Rechtecksignal Et ist, dann steuert der Datenanalysator 160f den Schalter 101f über das Schaltsteuersignal SWf so, dass das kodierte Signal immer in die Textur-Dekodiereinheit 180f eingegeben wird. Somit werden in der Textur-Dekodiereinheit 180f die kodierten Textur-Bitströme im kodierten Rechtecksignal dekodiert (Schritt Sf3). Der Dekodierungsprozess in Schritt Sf3 stimmt mit dem Dekodierungsprozess Se2 gemäß der siebenten Ausführungsform überein. Dann wird das dekodierte Rechtecksignal durch den Synthesizer 190f der Wiedergabeeinheit 104 zur Wiedergabe zugeführt (Schritt Sf13). Im Synthesizer 190f kann das dekodierte Rechtecksignal Dg mit einem anderen Beliebigform-Bildsignal synthetisiert werden.
Danach wird entschieden, ob das kodierte Rechtecksignal Et aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt Sf14). Besteht das kodierte Rechtecksignal nicht aus den Daten des letzten Blocks im letzten Rahmen, dann werden an einem zum nächsten Block gehörenden kodierten Rechtecksignal die Schritte Sf1 – Sf3, Sf13 und Sf14 ausgeführt. Besteht das kodierte Rechtecksignal jedoch aus den Daten des letzten Blocks im letzten Rahmen, dann ist die Dekodierung des kodierten Rechtecksignals beendet.
Ist hingegen das Ergebnis der Entscheidung in Schritt Sf2 SID = 11, dann ist das einlaufende kodierte Bildsignal das zweite kodierte Beliebigformsignal Ex, das als Bildinformation die kodierten Form-Bitströme, die kodierten Textur-Bitströme und die kodierten Transparenz-Bitströme umfasst. Der Datenanalysator 160f steuert dann den Schalter 101f über das Schaltsteuersignal SWf so, dass der zu jedem Block des kodierten Beliebigformsignals Ex mit Transparenzsignal gehörende kodierte Form-Bitstrom in die Form-Dekodiereinheit 170 eingegeben wird, während die zum Block gehörenden kodierten Textur- und Transparenz-Bitströme in die Textur-Dekodiereinheit 180f eingegeben werden. Somit wird im zweiten kodierten Beliebigformsignal Ex der kodierte Form-Bitstrom vom kodierten Textur-Bitstrom sowie dem kodierten Transparenz-Bitstrom separiert (Schritt Sf4), und der separierte Form-Bitstrom wird durch die Form-Dekodiereinheit 170 dekodiert (Schritt Sf5), während die separierten Textur- und Transparenz-Bitströme durch die Textur-Dekodiereinheit 180f dekodiert werden (Schritte Sf6 und Sf7).
Im Einzelnen wird der kodierte Form-Bitstrom Epk – ähnlich wie der kodierte Form-Bitstrom E2k des binären Bildsignals – durch den Form-Dekoder 170 dekodiert. Nach Abschluss der Dekodierung des zu einem Block gehörenden kodierten Form-Bitstroms Epk stellt der arithmetische Dekoder 171 das Ende des zu diesem Block gehörenden kodierten Form-Bitstroms Epk fest und gibt ein Abschlusszeitsignal Te an den Datenanalysator 160f aus. Beim Empfang des Abschlusszeitsignals Te steuert der Datenanalysator 160f den Schalter 101b über das Schaltsteuersignal SWb so, dass das einlaufende kodierte Bildsignal in die Textur-Dekodiereinheit 180f eingegeben wird.
Somit werden der kodierte Textur-Bitstrom Ept und der kodierte Transparenz-Bitstrom Epg vom Datenanalysator 160f zur Textur-Dekodiereinheit 180f geleitet. In der Dekodiereinheit 180f werden die Quantisierungsskala und die DCT-Koeffizienten eines jeden Bitstroms in den Invers-Quantisierer 181f eingegeben, und die DCT-Koeffizienten werden invers quantisiert. Danach wird am invers quantisierten Signal Diq durch den Umkehr-Kosinus-Transformator 182f eine Umkehr-Kosinus-Transformation ausgeführt.
Inzwischen werden der Textur-Bewegungsvektor BV und der Transparenz-Bewegungsvektor BV in den Textur-Bewegungskompensator 184f eingegeben. Der Kompensator 184f erzeugt Adressen zur Versorgung mit einem Vorhersage-Textursignal und einem Vorhersage-Transparenzsignal, die diesen Bewegungsvektoren BV zugeordnet sind, und erhält aus dem Rahmen-Speichermodul 102b unter Verwendung der Adressen ein Vorhersage-Textursignal Emp sowie ein Vorhersage-Transparenzsignal Emg.
Der Addieren 183 führt eine Addition der Ausgabedaten Didct vom Umkehr-Kosinus-Transformator 182f und des Vorhersage-Textursignals Emp oder des Vorhersage-Transparenzsignals Emg aus und gibt ein dekodiertes Textursignal Dpt oder ein dekodiertes Transparenzsignal Dpg aus. Diese dekodierten Signale Dpt und Dpg werden in den Rahmen-Speichermodul 102f und den Synthesizer 190f eingegeben. Der Synthesizer 190f führt eine Synthese des reproduzierten Textursignals Dpt, des reproduzierten Transparenzsignals Dpg und des dazugehörigen reproduzierten Formsignals Dk mit einem gewünschten Bild zur Erzeugung synthetisierter Bilddaten Dsyn aus. Beim Abschluss der Dekodierung des kodierten Transparenz-Bitstroms stellt der Datenanalysator 160f das Ende des kodierten Transparenz-Bitstroms fest und steuert den Schalter 101f über das Schaltsteuersignal SWb so, dass das einlaufende kodierte Bildsignal in die Form-Dekodiereinheit 170 eingegeben wird.
Außerdem werden die reproduzierten und synthetisierten Daten (dekodiertes Beliebigformsignal mit Transparenz-Informationen) Dx vom Synthesizer 190f an die Wiedergabeeinheit 104 zur Bildwiedergabe ausgegeben (Schrit Sf13).
Danach wird entschieden, ob das zweite kodierte Beliebigformsignal aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt Sf14). Besteht es nicht aus den Daten des letzten Blocks im letzten Rahmen, dann werden an einem zum nächsten Block gehörenden zweiten kodierten Beliebigformsignal die Schritte Sf1, Sf2, Sf4 – Sf7, Sf13 und Sf14 ausgeführt. Besteht es jedoch aus den Daten des letzten Blocks im letzten Rahmen, dann ist die Dekodierung des zweiten kodierten Beliebigformsignals beendet.
Wird im Schritt Sf1 entschieden, dass der Wert des Bild-Identifikators nicht durch „SID = 00 oder 11" gegeben ist, dann wird in Schritt Sf8 entschieden, ob SID = 10 ist oder nicht. Ist das Ergebnis der Entscheidung in Schritt Sf8 SID = 10, weil das einlaufende kodierte Bildsignal Eo das kodierte Binärsignal E2 ist, das nur die kodierten Form-Bitströme als Bildinformation enthält, dann steuert der Datenanalysator 160f den Schalter 101f über das Schaltsteuersignal SWf so, dass der zu jedem Block im kodierten Binärsignal gehörende kodierte Form-Bitstrom immer in die Form-Dekodiereinheit 170 eingegeben wird. Somit werden in der Form-Dekodiereinheit 170 die kodierten Form-Bitströme im kodierten Binärsignal dekodiert (Schritt Sf9). Der Dekodierungsprozess Sf9 stimmt mit dem Dekodierungsprozess in Schritt Sb2 gemäß der dritten Ausführungsform überein. Dann wird das dekodierte Binärsignal D2 über den Synthesizer 190f zur Wiedergabe an die Wiedergabeeinheit 104 geleitet (Schritt Sf13). Im Synthesizer 190f kann das dekodierte Binärsignal D2 mit einem anderen Beliebigform-Bildsignal synthetisiert werden.
Danach wird entschieden, ob das kodierte Binärsignal aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt Sf14). Besteht es nicht aus den Daten des letzten Blocks im letzten Rahmen, dann werden an einem zum nächsten Block gehörenden kodierten Binärsignal die Schritte Sf1, Sf8, Sf9, Sf13 und Sf14 ausgeführt. Besteht es jedoch aus den Daten des letzten Blocks im letzten Rahmen, dann ist die Dekodierung des kodierten Binärsignals beendet.
Ist das Ergebnis der Entscheidung in Schritt Sf8 jedoch SID = 01, dann ist das einlaufende kodierte Bildsignal das erste kodierte Beliebigformsignal, welches als Bildinformation die kodierten Form-Bitströme und die kodierten Textur-Bitströme enthält. Der Datenanalysator 160f steuert dann den Schalter 101f über das Schaltsteuersignal SWf so, dass der zu jedem Block des kodierten Beliebigformsignals gehörende kodierte Form-Bitstrom in die Form-Dekodiereinheit 170 eingegeben wird, während der zum Block gehörende kodierte Textur-Bitstrom in die Textur-Dekodiereinheit 180f eingegeben wird. Dadurch werden im ersten kodierten Beliebigformsignal der kodierte Form-Bitstrom und der kodierte Textur-Bitstrom voneinander separiert (Schritt Sf10), und der separierte Form-Bitstrom wird durch die Form-Dekodiereinheit 170 dekodiert (Schritt Sf11), während der separierte Textur-Bitstrom durch die Textur-Dekodiereinheit 180f dekodiert wird (Schritt Sf12). Im Weiteren werden diese. Ströme durch die Wiedergabeeinheit 104 dargestellt (Schritt Sf13). Die Dekodierungsprozesse in den Schritten Sf11 bzw. Sf12 stimmen mit den Dekodierungsprozessen in den Schritten Sb4 bzw. Sb5 gemäß der dritten Ausführungsform überein, und die Bildwiedergabe in Schritt Sf13 stimmt mit der Bildwiedergabe in Schritt Sb6 nach der dritten Ausführungsform überein.
Danach wird entschieden, ob das erste kodierte Beliebigformsignal Ep aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt Sf14). Besteht es nicht aus den Daten des letzten Blocks im letzten Rahmen, dann werden an einem zum nächsten Block gehörenden ersten kodierten Beliebigformsignal Ep die Schritte Sf1, Sf8 und Sf10 – Sf14 ausgeführt. Besteht es jedoch aus den Daten des letzten Blocks im letzten Rahmen, dann ist die Dekodierung des ersten kodierten Beliebigformsignals Ep beendet.
In dem zu dieser neunten Ausführungsform gehörenden Dekodierungsprozess werden bei der Dekodierung des ersten oder des zweiten kodierten Beliebigformsignals für Pixel, in denen das reproduzierte Formsignal Null ist, die Pixelwerte im reproduzierten Textursignal und im reproduzierten Transparenzsignal durch Pixelwerte eines vorgeschriebenen Bildes ersetzt. Das vorgeschriebene Bild ist ein im Voraus an der Empfangsstation hergestelltes Bild oder ein Bild, das von einem anderen Bild-Dekodiergerät reproduziert wurde.
Wie oben mit Bezug auf die neunte Ausführungsform der Erfindung beschrieben wurde, enthält das Bild-Dekodiergerät 100f einen Datenanalysator 160f zur Analyse der einlaufenden kodierten Daten. Der Datenanalysator 160f detektiert einen Bild-Identifikator, der anzeigt, um welches kodierte Signal -das kodierte Binärsignal E2, das erste kodierte Beliebigformsignal Ep, das zweite kodierte Beliebigformsignal Ex oder das kodierte Rechtecksignal Eg – es sich beim einlaufenden kodierten Signal handelt, und in Abhängigkeit vom Wert des Bild-Identifikators steuert der Analysator 160f den Schalter 101f so, dass die Bitströme im einlaufenden kodierten Signal passend in die Form-Dekodiereinheit 170 bzw. die Textur-Dekodiereinheit 180f eingegeben werden. Somit können die oben erwähnten vier kodierten Bildsignale, die unterschiedliche Datenstrukturen haben, mit Dekodierungsprozessen dekodiert werden, die zu einem einzigen Kodierungsverfahren korrespondieren.
In dieser neunten Ausführungsform der Erfindung wird der kodierte Form-Bitstrom durch ein arithmetisches Dekodierungsverfahren (erstes Dekodierungsverfahren) in der Form-Dekodiereinheit 170 dekodiert, und der kodierte Textur-Bitstrom sowie der dekodierte Transparenz-Bitstrom werden durch dasselbe Dekodierungsverfahren einschließlich DCT dekodiert. Mit anderen Worten, das Dekodierungsverfahren für den kodierten Textur-Bitstrom (zweites Dekodierungsverfahren) stimmt mit dem Dekodierungsverfahren für den kodierten Transparenz-Bitstrom (drittes Dekodierungsverfahren) überein. Der kodierte Transparenz-Bitstrom kann jedoch auch durch ein Dekodierungsverfahren dekodiert werden, das eine Wavelet-Bearbeitung oder dergleichen enthält (drittes Dekodierungsverfahren) und das sich von dem Dekodierungsverfahren einschließlich DCT (zweites Dekodierungsverfahren) unterscheidet.
Diese neunte Ausführungsform der Erfindung ist besonders auf das Bild-Dekodiergerät 100f zugeschnitten, welches die kodierten Signale mit der für die achte Ausführungsform beschriebenen Datenstruktur, d. h. ein erstes und zweites kodiertes Beliebigformsignal, ein kodiertes Binärsignal und ein kodiertes Rechtecksignal, unter Verwendung ihrer Bild-Identifikatoren identifiziert und zu den jeweiligen Datenstrukturen passend die Dekodierungsprozesse ausführt. Wenn jedoch die Bild-Eingabeeinheit 110 im Bild-Kodiergerät 100a gemäß der in 3 dargestellten zweiten Ausführungsform so aufgebaut ist, dass es ein Beliebigform-Bildsignal, ein binäres Bildsignal, ein Rechteck-Bildsignal und ein Beliebigform-Bildsignal mit Transparenz-Informationen identifizieren kann, dann kann ein Bild-Kodiergerät so aufgebaut werden, dass es die Kodierung dieser Bildsignale mit Bild-Identifikatoren zur Identifizierung der zu diesen Bildsignalen gehörenden kodierten Signale ausführt.
[Ausführungsform 10]
17(a)–17(c) sowie 18(a)–18(b) sind schematische Darstellungen zur Erläuterung von Datenstrukturen zur Bildübertragung entsprechend einer zehnten Ausführungsform. Im Einzelnen zeigt 17(a) eine Datenstruktur eines kodierten Beliebigformsignals (erstes kodiertes Beliebigformsignal) 3500, das durch Kodierung eines Beliebigform-Bildsignals mit sowohl kodierten Form-Bitströmen als auch kodierten Textur-Bitströmen erhalten wurde, 17(b) zeigt eine Datenstruktur eines kodierten Binärsignals 3600, das durch Kodierung eines binären Bildsignals erhalten wurde, und 17(c) zeigt eine Datenstruktur eines kodierten Rechtecksignals (kodiertes Pixelwertsignal) 3700, das durch Kodierung eines Rechteck-Bildsignals erhalten wurde, welches als Wiedergabedatendaten nur ein Textursignal (Pixelwertsignal) zur Farbwiedergabe eines Bildes enthält. Ferner zeigt 18(a) eine Datenstruktur eines kodierten Beliebigformsignals mit Transparenz-Informationen (zweites kodiertes Beliebigformsignal) 3800, das durch Kodierung eines Beliebigform-Bildsignals erhalten wurde, das Transparenz-Informationen enthält, und 18(b) zeigt eine Datenstruktur eines kodierten Transparenzsignals 3900, das durch Kodierung eines Beliebigform-Transparenzsignals erhalten wurde, das sowohl kodierte Form- als auch kodierte Transparenz-Bitströme enthält.
Diese Datenstrukturen zur Bildübertragung gemäß der zehnten Ausführungsform werden in einem System eingesetzt, in welchem das Transparenz-Informationen enthaltende Beliebigform-Bildsignal kompressiv kodiert und übertragen wird, und im Weiteren wird das durch kompressive Kodierung erhaltene zweite kodierte Beliebigformsignal dekodiert und dargestellt. Das heißt, in diesem System sind Bild-Kodierungsverfahren und -gerät so aufgebaut, dass sie einen Kodierungsprozess für das Transparenz-Informationen enthaltende Beliebigform-Bildsignal ausführen, während Bild-Dekodierungsverfahren und – gerät für die Ausführung eines Dekodierungsprozesses für das zweite kodierte Beliebigformsignal ausgelegt sind.
Das in 17(a) dargestellte erste kodierte Beliebigformsignal 3500 stimmt mit dem in 13(a) dargestellten kodierten Beliebigformsignal 2500 nach der achten Ausführungsform überein, d. h., es wird erhalten, indem der 1-Bit-Form-Identifikator 502 im kodierten Beliebigformsignal 500 gemäß der ersten Ausführungsform durch einen Zwei-Bit-Bild-Identifikator 3502 ersetzt wird.
Das in 17(b) dargestellte kodierte binäre Formsignal 3600 stimmt mit dem in 13(b) dargestellten kodierten binären Formsignal 2600 nach der achten Ausführungsform überein, d. h., es wird erhalten, indem der 1-Bit-Form-Identifikator 602 im kodierten binären Formsignal 600 gemäß der ersten Ausführungsform durch einen Zwei-Bit-Bild-Identifikator 3602 ersetzt wird.
Das in 17(c) dargestellte kodierte Rechtecksignal (kodiertes Pixelwertsignal) 3700 stimmt mit dem in 14(a) dargestellten kodierten Rechtecksignal 2700 nach der achten Ausführungsform überein, d. h., es wird erhalten, indem ein Zwei-Bit-Bild-Identifikator 3702 zwischen dem Synchronsignal 701 und dem Datenkopf 703 in das in 23(c) dargestellte kodierte Pixelwertsignal 700a eingefügt wird.
Das in 18(a) dargestellte zweite kodierte Beliebigformsignal 3800 stimmt mit dem in 14(b) dargestellten zweiten kodierten Beliebigformsignal 2800 nach der achten Ausführungsform überein und enthält einen Zwei-Bit-Bild-Identifikator 3802.
Außerdem enthält das in 18(b) dargestellte kodierte Transparenzsignal am Anfang ein 32-Bit-Synchronsignal 901, einen auf das Synchronsignal 901 folgenden 3-Bit-Bild-Identifikator (SID) 3902 und einen auf den Identifikator 3902 folgenden zusätzlichen Datenkopf 903.
Außerdem enthält das kodierte Transparenzsignal 3900 kodierte Form-Bitströme 91E, die durch Kodierung eines Formsignals (binären Transparenzsignals) erhalten wurden, welches als ein Bestandteil des Beliebigform-Transparenzsignals die Form eines jeden Objekts darstellt; und kodierte Form-Bitströme 92E, die durch Kodierung eines mehrwertigen Transparenzsignals erhalten wurden, welches als ein Bestandteil des Beliebigform-Bildsignals für die Gradationswiedergabe der Transparenz eines jeden Objekts verwendet wird. Im Einzelnen sind in dem kodierten Transparenzsignal 3900 für jeden der Blöcke, in die eine ein Objekt auf einem Displaybild umfassende Objektregion unterteilt ist, ein kodierter Form-Bitstrom 91E und ein kodierter Transparenz-Bitstrom 92E in dieser Reihenfolge angeordnet.
Genauer gesagt sind auf den Datenkopf 903 folgend angeordnet: ein kodierter Form-Bitstrom 91E1 und ein kodierter Transparenz-Bitstrom 92E1, die zu einem Block E1 gehören; ein kodierter Form-Bitstrom 91E2 und ein kodierter Transparenz-Bitstrom 92E2, die zu einem Block E2 gehören; und ein kodierter Form-Bitstrom 91E3 und ein kodierter Transparenz-Bitstrom 92E3, die zu einem Block E3 gehören.
Außerdem enthalten, wie in 18(b) dargestellt ist, die kodierten Form-Bitströme 91E1, 91E2 und 91E3 jeweils längenvariant kodierte Daten 904, 909 und 914, die Form-Bewegungsvektoren (in der Figur einfach als Form-BV bezeichnet) entsprechen; und längenvariant kodierte Daten 905, 910 und 915, die binären Formsignalen (binären Transparenzsignalen) entsprechen, wobei jedes Signal anzeigt, ob die Pixel in dem Block innerhalb oder außerhalb des jeweiligen Objekts liegen (in der Figur: Formdaten).
Die kodierten Transparenz-Bitströme 92E1, 92E2 und 92E3 enthalten jeweils 5-Bitkodierte Daten 906, 911 und 916, die Quantisierungsskalen entsprechen (in der Figur: Quantisierungsskala); längenvariant kodierte Daten 907, 912 und 917, die Transparenz-Bewegungsvektoren entsprechen (in der Figur: Transparenz-BV); und längenvariant kodierte Daten 908, 913 und 918, die quantisierten Signalen entsprechen, die aus dem mehrwertigen Transparenzsignal durch Ausführen von DCT und Quantisierung erhalten werden (in der Figur: Transparenz-DCT-Koeffizienten).
Das Synchronsignal 901 ist ein Signal zur Anzeige des Kopfes eines zu einem Objekt gehörenden kodierten Transparenzsignals, und es ist ein einmalig kodiertes Signal. Der Form-Identifikator (SID) 3902 ist ein Signal zur Anzeige, welchen Typ von den oben beschriebenen fünf Typen kodierter Bildsignale das kodierte Bildsignal hat, d. h., es ist ein Signal zur Feststellung der Art der im kodierten Bildsignal enthaltenen Bitströme. Ist der Wert des Bild-Identifikators (SID) gleich 10, dann wird angezeigt, dass im kodierten Bildsignal als Wiedergabedaten sowohl kodiere Form-Bitströme als auch kodierte Textur-Bitströme vorkommen. Bei SID = 010 zeigt der Bild-Identifikator an, dass nur die kodierten Form-Bitströme im kodierten Signal vorliegen. Bei SID = 00 zeigt der Bild-Identifikator an, dass nur die kodierten Textur-Bitströme im kodierten Signal vorkommen. Wenn SID gleich 11 ist, dann zeigt der Bild-Identifikator das Vorhandensein der kodierten Form-Bitströme, der kodierten Textur-Bitströme und der kodierten Transparenz-Bitströme im kodierten Signal an. Gilt aber SID = 011, dann zeigt der Bild-Identifikator an, dass im kodierten Signal die kodierten Form- und die kodierten Transparenz-Bitströme vorliegen.
Der Datenkopf 903 enthält Informationen z. B. über den Wiedergabezeitpunkt des Bildes des zugehörigen Objekts, zum Bildattribut und zum Vorhersagemodus für die Kodierung. Diese Daten haben jedoch keinen Bezug zur vorliegenden Erfindung und erfordern deshalb keine ausführliche Beschreibung.
Der Form-BV ist die kodierte Datenmenge eines Bewegungsvektors, der die Bewegung eines Bildes in einem Block zwischen dem vorliegenden und dem vorhergehenden Rahmen aufzeigt, und er wird zur Vorhersage eines Formsignals eines bestimmten Blocks im vorliegenden Rahmen aus einem Formsignal des entsprechenden Blocks im vorhergehenden Rahmen verwendet. Im Weiteren werden die Formdaten durch arithmetisches Kodieren eines Formsignals erhalten, und die Quantisierungsskala ist ein Parameter für die inverse Quantisierung der DCT-Koeffizienten, die erhalten werden, indem an einem mehrwertigen Transparenzsignal DCT und Quantisierung ausgeführt werden. Der Transparenz-BV ist ein kodiertes Signal eines Transparenz-Bewegungsvektors, der die Bewegung eines Bildes zwischen dem vorliegenden und dem vorhergehenden Rahmen aufzeigt, und er wird zur Vorhersage eines mehrwertigen Transparenzsignals des vorliegenden Rahmens aus einem mehrwertigen Transparenzsignal des vorhergehenden Rahmen verwendet. Ferner werden die Transparenz-DCT-Koefffizienten erhalten, indem ein quantisiertes Signal des mehrwertigen Transparenzsignals längenvariant kodiert wird.
Obwohl diese Daten in der Figur nicht dargestellt sind, werden im kodierten Transparenzsignal 3900 vor den Transparenz-DCT-Koeffizienten auch verschiedene Arten von Nebeninformationen (Daten) untergebracht, und diese Nebendaten erfordern manchmal eine große Anzahl von Bits.
Es wird eine Beschreibung der Funktions- und Wirkungsweise gegeben.
In der so aufgebauten zehnten Ausführungsform enthalten die kodierten Bildsignale – d. h. das erste kodierte Beliebigformsignal 3500, das kodierte Binärsignal 3600, das kodierte Rechtecksignal 3700, das zweite kodierte Beliebigformsignal 3800 und das kodierte Transparenzsignal 3900 – wegen ihrer unterschiedlichen Datenstrukturen die zugehörigen Zwei-Bit-Bild-Identifikatoren 3502, 3602, 3702, 3802 und 3902 zur Identifizierung dieser kodierten Signale. Deshalb können diese fünf kodierten Signale durch Bezugnahme auf die Bild-Identifikatoren auf der Dekodierungsseite identifiziert werden.
Im Einzelnen ermöglichen die Bild-Identifikatoren in einem Bild-Dekodiergerät, das MPEG4 angepasst und für die Dekodierung des oben erwähnten kodierten Beliebigformsignals ausgelegt ist, dem Gerät ein richtiges Dekodieren des kodierten Binärsignals und des kodierten Rechtecksignals selbst dann, wenn das kodierte Binärsignal und das kodierte Rechtecksignal gemeinsam mit dem ersten und dem zweiten kodierten Beliebigformsignal sowie dem Beliebigform-Transparenzsignal eingegeben werden. Folglich kann vermieden werden, dass das kodierte Binärsignal und das kodierte Rechtecksignal mit einem an MPEG4 angepassten Dekodierungsprozess verarbeitet werden und dass der Dekodierungsprozess abbricht.
In dieser zehnten Ausführungsform werden die jeweiligen kodierten Signale mit unterschiedlichen Datenstrukturen zwar durch Inter-Rahmen-Vorhersage-Kodierung erhalten, diese kodierten Signale können jedoch auch durch Intra-Rahmen-Kodierung erzeugt werden.
Außerdem ist in den zugehörigen kodierten Signalen, die in dieser zehnten Ausführungsform verwendet werden, einem jeden Block mindestens einer von den kodierten Form-, Textur- und Transparenz-Bitströmen zugeordnet. In jedem kodierten Signal können aber auch in jedem Rahmen vorgeschriebene kodierte Bitströme angeordnet werden.
Wie in der achten Ausführungsform der Erfindung enthält außerdem jeder der kodierten Transparenz-Bitströme 83D in der Datenstruktur des in 18(a) dargestellten zweiten kodierten Beliebigformsignals 3800 (kodiertes Signal des Beliebigform-Bildsignals mit Transparenzinformationen) einen Transparenz-BV und eine Quantisierungsskala. Es ist jedoch nicht immer nötig, dass der kodierte Transparenz-Bitstrom 83D im zweiten kodierten Beliebigformsignal 3800 den Transparenz-BV und die Quantisierungsskala enthält, und die Dekodierung der Transparenz-DCT-Koeffizienten kann unter Verwendung von Textur-BV sowie Quantisierungsskala des kodierten Textur-Bitstroms 82D ausgeführt werden.
[Ausführungsform 11]
19 ist ein Blockschema zur Darstellung eines Bild-Dekodiergeräts gemäß einer elften Ausführungsform der vorliegenden Erfindung. Die Bezugsziffer 100g in 11 kennzeichnet ein Bild-Dekodiergerät, das kodierte Daten mit der Datenstruktur zur Bildübertragung entsprechend der zehnten Ausführungsform dekodiert. Das Bild-Dekodiergerät 100g ist so aufgebaut, dass es einen Dekodierungs-Prozess ausführt, welcher der Datenstruktur eines als kodierte Datenmenge einlaufenden kodierten Signals angepasst ist.
Im Einzelnen ist das Gerät 100g wie folgt aufgebaut. Empfängt das Gerät 100g als kodierte Daten Eo das in 17(b) dargestellte kodierte Binärsignal (E2) 3600, dann gibt es als dekodierte Bilddaten Dsyn ein dekodiertes Binärsignal D2 aus. Empfängt das Gerät 100g als kodierte Daten Eo das in 17(a) dargestellte erste kodierte Beliebigformsignal (Ep) 3500, dann gibt es für jedes Objekt als dekodierte Bilddaten Dsyn ein dekodiertes Beliebigformsignal Dp aus. Empfängt das Gerät 100g als kodierte Daten Eo das in 17(c) dargestellte kodierte Rechtecksignal (Et) 3700, dann gibt es als dekodierte Bilddaten Dsyn ein dekodiertes Rechtecksignal Dt aus. Empfängt das Gerät 100g als kodierte Daten Eo das in 18(a) dargestellte zweite kodierte Beliebigformsignal (Ex) 3800, dann gibt es für jedes Objekt als dekodierte Bilddaten Dsyn ein dekodiertes Beliebigformsignal Dx mit Transparenz-Informationen aus. Empfängt das Gerät 100g das in 18(b) dargestellte kodierte Transparenzsignal (Ep) 3900, dann gibt es als dekodierte Bilddaten Dsyn ein dekodiertes Transparenzsignal Dg aus.
Im Weiteren wird die Struktur des Bild-Dekodiergeräts 100g ausführlich beschrieben.
Das Gerät 100g enthält einen Datenanalysator 160g, der die in das Eingabeterminal 160a einlaufenden kodierten Daten Eo analysiert und gemäß dem Analyseergebnis ein Schaltsteuersignal SWg ausgibt; eine Form-Dekodiereinheit (erste Dekodierhilfsmittel) 170, welche für die Formdaten (kodiertes Formsignal) einen arithmetischen Dekodierungsprozess ausführt; eine Textur-Dekodiereinheit (zweite Dekodierhilfsmittel) 180f, welche für die Textur-DCT-Koeffizienten Ept und die Transparenz-DCT-Koeffizienten Egt einen Dekodierungsprozess einschließlich Umkehr-DCT ausführt; einen Schalter 101g, welcher entsprechend dem Schaltsteuersignal das vom Datenanalysator 160g analysierte und ausgegebene kodierte Signal einer der beiden Dekodiereinheiten 170 bzw. 180f zuführt; und einen Rahmen-Speichermodul 102f, der ein Vorhersage-Formsignal, ein Vorhersage-Textursignal und ein Vorhersage-Transparenzsignal speichert.
Der Datenanalysator 160g analysiert das einlaufende kodierte Signal zur Überprüfung des auf das 32-Bit-Synchronsignal am Kopf folgenden 2-Bit-Bild-Identifikators (einer der Bild-Identifikatoren 3502, 3702 und 3802 in den kodierten Signalen, die jeweils in den 17(a), 17(c) und 18(a) dargestellt sind), und steuert den Schalter 101g entsprechend dem gesetzten Wert des Bild-Identifikators (SID).
Bei SID = 10 wird der Schalter 101g durch das Schaltsteuersignal SWg so gesteuert, dass die kodierten Form-Bitströme des einlaufenden kodierten Signals in die Form-Dekodiereinheit 170 und die kodierten Textur-Bitströme des kodierten Signals in die Textur-Dekodiereinheit 180f eingegeben werden. Bei SID = 010 wird der Schalter 101g durch das Schaltsteuersignal SWg so gesteuert, dass die einlaufenden kodierten Daten in die Form-Dekodiereinheit 170 eingegeben werden. Bei SID = 00 wird der Schalter 101g durch das Schaltsteuersignal SWg so gesteuert, dass die kodierten Textur-Bitströme des einlaufenden kodierten Signals in die Textur-Dekodierhilfsmittel 180f eingegeben werden. Bei SID = 11 wird der Schalter 101g durch das Schaltsteuersignal SWg so gesteuert, dass die kodierten Form-Bitströme des einlaufenden kodierten Signals in die Form-Dekodiereinheit 170 und die kodierten Textur- sowie Transparenz-Bitströme in die Textur-Dekodiereinheit 180f eingegeben werden. Bei SID = 011 wird der Schalter 101g durch das Schaltsteuersignal SWg so gesteuert, dass die kodierten Form-Bitströme im einlaufenden kodierten Signal in die Form-Dekodiereinheit 170, die kodierten Transparenz-Bitströme aber in die Textur-Dekodiereinheit 180f eingegeben werden.
Ähnlich dem Datenanalysator 160 gemäß der in 7(b) dargestellten dritten Ausführungsform enthält der Datenanalysator 160g eine Tabellen-Speichereinheit 162, einen Komparator 161 und einen Schalter-Steuerkreis 163. In dieser elften Ausführungsform vergleicht der Komparator 161 den Bitstrom des einlaufenden kodierten Signals mit dem Bitstrom der Dekodier-Referenztabelle, die in der Tabellen-Speichereinheit 162 gespeichert ist, und identifiziert den Bild-Identifikator, den kodierten Form-Bitstrom, den kodierten Textur-Bitstrom und den kodierten Transparenz-Bitstrom, die in den kodierten Daten enthalten sind. Entsprechend dem Ergebnis der Identifizierung steuert der Komparator 161 den Schalter 101 g über ein Schaltsteuersignal SWg.
Das Bild-Dekodiergerät 100g enthält ferner einen Synthesizer 190g, der eine Synthese der Ausgabedaten des Dekodiergeräts 180f (entweder das reproduzierte Textursignal Dpt und das reproduzierte Transparenzsignal Dpg beide zusammen oder nur das reproduzierte Textursignal Dpt bzw. das reproduzierte Transparenzsignal Dgt) sowie der Ausgabedaten der Dekodiereinheit 170 (das reproduzierte Formsignal Dk entsprechend der Ausgabe der Dekodiereinheit 180f) mit gewünschten Bilddaten ausführt und an die Wiedergabeeinheit 104 synthetisierte Bilddaten Dsyn ausgibt, die das reproduzierte Beliebigformsignal Dx mit Transparenz-Informationen oder das reproduzierte Beliebigformsignal Dp bzw. das reproduzierte Transparenzsignal Dg enthalten Obwohl der Synthesizer 190g gemäß der elften Ausführungsform das reproduzierte Binärsignal D2 von der Dekodiereinheit 170 oder das reproduzierte Rechtecksignal Dt von der Dekodiereinheit 180f unmittelbar an die Wiedergabeeinheit 104 ausgibt, kann das Signal D2 oder Dt im Synthesizer 190g auch mit einem anderen Beliebigform-Bildsignal synthetisiert werden. Obwohl das vom Synthesizer 190g ausgegebene Signal in die Wiedergabeeinheit 104 eingegeben wird, kann es auch in ein Informationsausgabegerät, wie z. B. einen Drucker (nicht dargestellt), eingegeben werden. Die anderen Bestandteile stimmen mit den bereits für die neunte Ausführungsform beschriebenen überein.
In dieser elften Ausführungsform werden für Pixel, in denen das reproduzierte Formsignal Null ist, die Pixelwerte im reproduzierten Textursignal durch Pixelwerte eines vorgeschriebenen Bildes ersetzt. Das vorgeschriebene Bild ist ein im Voraus an der Empfangsstation hergestelltes Bild oder ein Bild, das von einem anderen Bild-Dekodiergerät reproduziert wurde.
Es wird eine Beschreibung der Arbeitsweise des Bild-Dekodiergeräts 100g gemäß der elften Ausführungsform gegeben.
20 ist ein Flussdiagramm des Dekodierungsprozesses durch das Bild-Dekodiergerät 100g. Wird in das Bild-Dekodiergerät 100g ein kodiertes Bildsignal mit einer Datenstruktur, die in einer der 17(a), 17(b), 17(c), 18(a) und 18(b) dargestellt ist, eingegeben, dann analysiert der Datenanalysator 160g den auf das 32-Bit-Synchronsignal im kodierten Bildsignal folgenden 2-Bit-Kode und entscheidet, ob dieser 2-Bit-Kode 01 ist oder nicht (Schritt Sg1). Ist der 2-Bit-Kode nicht 01, dann wird weiter entschieden, ob der den Wert des Bild-Identifikators darstellende 2-Bit-Kode „SID = 00 oder 01" ist oder nicht (Schritt Sg2).
Ist das Ergebnis der Entscheidung in Schritt Sg2 SID = 00 oder 11, dann wird entschieden, ob SID = 00 ist oder nicht (Schritt Sg3). Ist das Ergebnis der Entscheidung in Schritt Sg3 SID = 00, weil das einlaufende kodierte Bildsignal Eo das kodierte Rechtecksignal (kodiertes Pixelwertsignal) Et ist, dann steuert der Datenanalysator 160g den Schalter 101g über das Schaltsteuersignal SWg so, dass das kodierte Signal immer in die Textur-Dekodiereinheit 180f eingegeben wird. Dadurch werden in der Textur-Dekodiereinheit 180f die kodierten Textur-Bitströme (kodierte Pixelwert-Bitströme) im kodierten Rechtecksignal dekodiert (Schritt Sg4). Der Dekodierungsprozess in Schritt Sg4 stimmt mit dem Dekodierungsprozess Se2 gemäß der siebenten Ausführungsform überein. Danach wird das dekodierte Rechtecksignal Dt über den Synthesizer 190g der Wiedergabeeinheit 104 übermittelt, um als Bild wiedergegeben zu werden (Schritt Sg18). Im Synthesizer 190g kann das dekodierte Rechtecksignal Dt mit einem anderen Beliebigform-Bildsignal synthetisiert werden.
Danach wird entschieden, ob das kodierte Rechtecksignal Et aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt Sg19). Besteht das kodierte Rechtecksignal nicht aus den Daten des letzten Blocks im letzten Rahmen, dann werden an einem zum nächsten Block gehörenden kodierten Rechtecksignal die Schritte Sg1 – Sg4, Sg18 und Sg19 ausgeführt. Besteht das kodierte Rechtecksignal jedoch aus den Daten des letzten Blocks im letzten Rahmen, dann ist die Dekodierung des kodierten Rechtecksignals beendet.
Ist hingegen das Ergebnis der Entscheidung in Schritt Sg3 SID = 11, dann ist das einlaufende kodierte Bildsignal das zweite kodierte Beliebigformsignal, das als Bildinformation die kodierten Form-Bitströme, die kodierten Textur-Bitströme und die kodierten Transparenz-Bitströme umfasst. Der Datenanalysator 160g steuert dann den Schalter 101g über das Schaltsteuersignal SWg so, dass der zu jedem Block des zweiten kodierten Beliebigformsignals gehörende kodierte Form-Bitstrom in die Form-Dekodiereinheit 170 eingegeben wird, während die zum Block gehörenden kodierten Textur- und Transparenz-Bitströme in die Textur-Dekodiereinheit 180f eingegeben werden. Somit werden im zweiten kodierten Beliebigformsignal der kodierte Form-Bitstrom vom kodierten Textur-Bitstrom sowie dem kodierten Transparenz-Bitstrom separiert (Schritt Sg5), und der separierte Form-Bitstrom wird durch die Form-Dekodiereinheit 170 dekodiert (Schritt Sg6), während die separierten Textur- und Transparenz-Bitströme durch die Textur-Dekodiereinheit 180f dekodiert werden (Schritte Sg7 und Sg8). Die Prozesse in den Schritten Sg5 – Sg8 stimmen mit denen in den Schritten Sf4–Sf7 nach der neunten Ausführungsform überein. Das dekodierte Formsignal Dxk, das dekodierte Textursignal Dxt und das dekodierte Transparenzsignal Dgt werden durch den Synthesizer 190g synthetisiert und als synthetisiertes Signal Dsyn wird das dekodierte Beliebigformsignal Dx zur Wiedergabe als Bild in die Wiedergabeeinheit 104 eingegeben (Schritt Sg18) Danach wird entschieden, ob das zweite kodierte Beliebigformsignal Ex aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt Sg19). Besteht es nicht aus den Daten des letzten Blocks im letzten Rahmen, dann werden an einem zum nächsten Block gehörenden zweiten kodierten Beliebigformsignal Ex die Schritte Sg1–Sg3, Sg5– Sg8, Sg18 und Sg19 ausgeführt. Besteht es jedoch aus den Daten des letzten Blocks im letzten Rahmen, dann ist die Dekodierung des zweiten kodierten Beliebigformsignals beendet.
Ist das Ergebnis der Entscheidung in Schritt Sg2 SID = 10, dann ist das einlaufende kodierte Bildsignal Eo das erste kodierte Beliebigformsignal Ep, welches als Bildinformation die kodierten Form-Bitströme und die kodierten Textur-Bitströme enthält. Der Datenanalysator 160g steuert dann den Schalter 101g über das Schaltsteuersignal SWg so, dass der zu jedem Block des kodierten Beliebigformsignals gehörende kodierte Form-Bitstrom in die Form-Dekodiereinheit 170 eingegeben wird, während der zum Block gehörende kodierte Textur-Bitstrom in die Textur-Dekodiereinheit 180f eingegeben wird. Dadurch werden im kodierten Beliebigformsignal der kodierte Form-Bitstrom und der kodierte Textur-Bitstrom voneinander separiert (Schritt Sg9), und der separierte Form-Bitstrom wird durch die Form-Dekodiereinheit 170 dekodiert (Schritt Sg10), während der separierte Textur-Bitstrom durch die Textur-Dekodiereinheit 180f dekodiert wird (Schritt Sg11). Die Dekodierungsprozesse in den Schritten Sg9–Sf11 stimmen mit den Dekodierungsprozessen in den Schritten Sf10–Sf12 nach der neunten Ausführungsform überein.
Das dekodierte Formsignal Dpk und das dekodierte Textursignal Dpt werden durch den Synthesizer 190g synthetisiert und als synthetisiertes Signal Dsyn wird das erste dekodierte Beliebigformsignal Dp zur Bildwiedergabe in die Wiedergabeeinheit 104 eingegeben (Schritt Sg18).
Danach wird entschieden, ob das erste kodierte Beliebigformsignal Ep aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt Sg19). Besteht es nicht aus den Daten des letzten Blocks im letzten Rahmen, dann werden an einem zum nächsten Block gehörenden ersten kodierten Beliebigformsignal Ep die Schritte Sg1, Sg2 und Sg9–Sg11, Sg18 und Sg19 ausgeführt. Besteht es jedoch aus den Daten des letzten Blocks im letzten Rahmen, dann ist die Dekodierung des ersten kodierten Beliebigformsignals beendet.
Außerdem wird dann, wenn die Entscheidung im Schritt Sg1 ergibt, dass der auf das Synchronsignal folgende 2-Bit-Kode gleich 01 ist, im Schritt Sg12 entschieden, ob der Wert des Bild-Identifikators (SID) gleich 010 ist oder nicht. Ist SID = 010, weil das einlaufende kodierte Bildsignal Eo das kodierte Binärsignal E2 ist, das nur die kodierten Form-Bitströme als Bildinformation enthält, dann steuert der Datenanalysator 160g den Schalter 101g über das Schaltsteuersignal SWg so, dass der zu jedem Block im kodierten Binärsignal gehörende kodierte Form-Bitstrom immer in die Form-Dekodiereinheit 170 eingegeben wird. Somit werden die kodierten Form-Bitströme im kodierten Binärsignal in der Form-Dekodiereinheit 170 dekodiert (Schritt Sg13). Der Dekodierungsprozess Sg13 stimmt mit dem Dekodierungsprozess in Schritt Sb2 gemäß der dritten Ausführungsform überein. Danach wird das dekodierte Binärsignal D2 über den Synthesizer 190g zur Wiedergabe an die Wiedergabeeinheit 104 geleitet (Schritt Sg18). Im Synthesizer 190g kann das dekodierte Binärsignal D2 mit einem anderen Beliebigform-Bildsignal synthetisiert werden.
Danach wird entschieden, ob das kodierte Binärsignal aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt Sg19). Besteht es nicht aus den Daten des letzten Blocks im letzten Rahmen, dann werden an einem zum nächsten Block gehörenden kodierten Binärsignal die Schritte Sg1, Sg12, Sg13, Sg18 und Sg19 ausgeführt. Besteht es jedoch aus den Daten des letzten Blocks im letzten Rahmen, dann ist die Dekodierung des kodierten Binärsignals beendet.
Wird jedoch im Schritt Sg12 entschieden, dass SID nicht 010 ist, dann wird in Schritt Sg14 entschieden, ob SID gleich 011 ist oder nicht. Wenn SID nicht 011 ist, dann kehrt der Dekodierungsprozess des Bild-Dekodiergeräts 100g zum Schritt Sg1 zurück.
Ist das Ergebnis der Entscheidung in Schritt Sg14 SID = 011, weil das einlaufende kodierte Bildsignal Eo als Bildinformation die kodierten Form-Bitströme Egk und die kodierten Transparenz-Bitströme Egt enthält, dann steuert der Datenanalysator 160g den Schalter 101g über das Schaltsteuersignal SWg so, dass der zu jedem Blockdes kodierten Beliebigformsignals gehörende kodierte Form-Bitstrom Egk in die Form-Dekodiereinheit 170 eingegeben wird, während der zum Block gehörende kodierte Transparenz-Bitstrom Egt in die Textur-Dekodiereinheit 180f eingegeben wird. Damit werden im kodierten Transparenzsignal der kodierte Form-Bitstrom Egk und der kodierte Textur-Bitstrom Egt voneinander separiert (Schritt Sg15), und der separierte Form-Bitstrom Egk wird durch die Form-Dekodiereinheit 170 dekodiert (Schritt Sg16), während der separierte Transparenz-Bitstrom Egt durch die Textur-Dekodiereinheit 180f dekodiert wird (Schritt Sg17).
Das heißt, der kodierte Form-Bitstrom Egk wird – ähnlich wie der kodierte Form-Bitstrom E2k des binären Bildsignals – durch die Form-Dekodiereinheit 170 dekodiert. Nach Abschluss der Dekodierung des zu einem Block gehörenden kodierten Form-Bitstroms Egk stellt der arithmetische Dekoder 171 das Ende des zu diesem Block gehörenden kodierten Form-Bitstroms Egk fest und gibt ein Abschlusszeitsignal Te an den Datenanalysator 160g aus. Beim Empfang des Abschlusszeitsignals Te steuert der Datenanalysator 160g den Schalter 101g über das Schaltsteuersignal SWb so, dass das einlaufende kodierte Bildsignal in die Textur-Dekodiereinheit 180f eingegeben wird.
Somit wird der kodierte Transparenz-Bitstrom Egt vom Datenanalysator 160f zur Textur-Dekodiereinheit 180f geleitet. In der Dekodiereinheit 180f werden die Quantisierungsskala und die DCT-Koeffizienten in jedem Bitstroms in den Invers-Quantisierer 181f eingegeben, und die DCT-Koeffizienten werden invers quantisiert. Danach wird am invers quantisierten Signal Diq durch den Umkehr-Kosinus-Transformator 182f eine Umkehr-Kosinus-Transformation ausgeführt.
Inzwischen wird der Transparenz-Bewegungsvektor BV in den Textur-Bewegungskompensator 184f eingegeben. Der Kompensator 184f erzeugt eine Adresse zur Versorgung mit einem Vorhersage-Transparenzsignal, das dem Transparenz-Bewegungsvektor BV zugeordnet ist, und erhält aus dem Rahmen-Speichermodul 102f unter Verwendung der Adresse das Vorhersage-Textursignal Emg.
Der Addierer 183 führt eine Addition der Ausgabedaten Didct vom Umkehr-Kosinus-Transformator 182f und des Vorhersage-Transparenzsignals Emg aus und gibt ein dekodiertes Transparenzsignal Dgt aus. Das dekodierte Transparenzsignal Dgt wird in den Rahmen-Speichermodul 102f und den Synthesizer 190g eingegeben. Der Synthesizer 190g führt eine Synthese des reproduzierten Transparenzsignals Dgt und des dazugehörigen reproduzierten Formsignals Dgk mit einem gewünschten Bild zur Erzeugung synthetisierter Bilddaten Dsyn aus. Die synthetisierten Bilddaten Dsyn werden zur Wiedergabe als ein Bild in die Wiedergabeeinheit 104 eingegeben (Schritt Sg18). Beim Abschluss der Dekodierung des kodierten Transparenz-Bitstroms stellt der Datenanalysator 160g das Ende des kodierten Transparenz-Bitstroms fest und steuert den Schalter 101f über das Schaltsteuersignal SWg so, dass das einlaufende kodierte Bildsignal in die Form-Dekodiereinheit 170 eingegeben wird.
Danach wird entschieden, ob das eingegebene kodierte Signal aus den Daten des letzten Blocks im letzten Rahmen besteht (Schritt Sg19). Besteht es nicht aus den Daten des letzten Blocks im letzten Rahmen, dann werden an einlaufenden kodierten Daten, die zum nächsten Block gehören, die Schritte Sg1, Sg12 und Sg14–Sg19 ausgeführt. Besteht es jedoch aus den Daten des letzten Blocks im letzten Rahmen, dann ist die Dekodierung des eingegebenen kodierten Signals beendet.
In dieser elften Ausführungsform werden für Pixel, in denen das reproduzierte Formsignal Null ist, die Pixelwerte im reproduzierten ersten und zweiten Beliebigformsignal und im reproduzierten Transparenzsignal durch Pixelwerte eines vorgeschriebenen Bildes ersetzt. Das vorgeschriebene Bild ist ein im Voraus an der Empfangsstation hergestelltes Bild oder ein Bild, das von einem anderen Bild-Dekodiergerät reproduziert wurde.
Wie oben mit Bezug auf die elfte Ausführungsform der Erfindung beschrieben wurde, enthält das Bild-Dekodiergerät 100g einen Datenanalysator 160g zur Analyse der einlaufenden kodierten Daten. Der Datenanalysator 160g detektiert einen Bild-Identifikator, der anzeigt, um welches kodierte Signal -das kodierte Binärsignal E2, das erste und zweite kodierte Beliebigformsignal Ep und Ex, das kodierte Rechtecksignal Et oder das kodierte Transparenzsignal Eg – es sich beim einlaufenden kodierten Signal handelt, und je nach Wert des Bild-Identifikators steuert der Analysator 160g den Schalter 101g so, dass das einlaufende kodierte Signal richtig in die Form-Dekodiereinheit 170 bzw. die Textur-Dekodiereinheit 180f eingegeben wird. Somit können die oben erwähnten fünf kodierten Bildsignale, die unterschiedliche Datenstrukturen haben, mit Dekodierungsprozessen dekodiert werden, die zu einem einzigen Kodierungsverfahren korrespondieren.
Außerdem werden in dieser elften Ausführungsform der kodierte Textur-Bitstrom und der kodierte Transparenz-Bitstrom in der Textur-Dekodiereinheit 180f mit demselben Dekodierungsverfahren dekodiert. Wie in der neunten Ausführungsform beschrieben wurde, kann der kodierte Transparenz-Bitstrom jedoch auch mit einem Dekodierungsverfahren dekodiert werden, das sich von dem für den kodierten Textur-Bitstrom verwendeten unterscheidet.
Diese elfte Ausführungsform der Erfindung ist darüber hinaus besonders auf das Bild-Dekodiergerät 100g ausgerichtet, welches die kodierten Signale mit der für die zehnte Ausführungsform beschriebenen Datenstruktur, d. h. ein erstes und zweites kodiertes Beliebigformsignal, ein kodiertes Binärsignal, ein kodiertes Transparenzsignal und ein kodiertes Rechtecksignal, unter Verwendung ihrer Bild-Identifikatoren identifiziert und zu den jeweiligen Datenstrukturen passend die Dekodierungsprozesse ausführt. Wenn jedoch die Bild-Eingabeeinheit 110 im Bild-Kodiergerät 100a gemäß der in 3 dargestellten zweiten Ausführungsform so aufgebaut ist, dass es ein Beliebigform-Bildsignal, ein binäres Bildsignal, ein Rechteck-Bildsignal, ein Beliebigform-Transparenzsignal und ein Beliebigform-Bildsignal mit Transparenz-Informationen identifizieren kann, dann kann ein Bild-Kodiergerät so aufgebaut werden, dass es die Kodierung dieser Bildsignale mit Bild-Identifikatoren zur Identifizierung der zu diesen Bildsignalen gehörenden kodierten Signale ausführt.
Wird ein Kodierungs- oder Dekodierungsprogramm zur Verwirklichung einer der oben erwähnten Bildkodier- oder -dekodiergeräten bzw. Bildkodierungs- oder – dekodierungsverfahren in einem Datenspeichermedium (z. B. einer Diskette) gespeichert, dann kann die Bildverarbeitung nach einer der oben erwähnten Ausführungsformen einfach in einem unabhängigen Computersystem ausgeführt werden.
21(a)–21(c) sind schematische Darstellungen zur Erläuterung des Bild-Kodierungsprozesses nach der zweiten Ausführungsform oder des Bild-Dekodierungsprozesses nach der dritten, vierten, fünften, siebenten, neunten oder elften Ausführungsform mit einem Computersystem unter Verwendung einer Diskette, die das Kodierungs- oder Dekodierungsprogramm enthält.
21(a) zeigt eine Vorderansicht einer Diskette FD, deren Querschnittsansicht und einen Diskettenkörper D. 21(b) zeigt ein Beispiel für ein physisches Format des Diskettenkörpers D.
Der Diskettenkörper D steckt in einer Hülle FC, und beide bilden die Diskette FD. Auf der Oberfläche des Diskettenkörpers D sind konzentrisch vom äußeren Durchmesser der Diskette zum inneren Durchmesser hin eine Vielzahl von Spuren Tr angebracht. Jede Spur ist in 16 Winkelsektoren unterteilt. Somit werden in der Diskette FD, die das oben erwähnte Programm enthält, die Programmdaten in zugewiesenen Sektoren auf dem Diskettenkörper D gespeichert.
21(c) zeigt die Struktur zur Speicherung des Programms auf der Diskette FD und zur Ausführung der Bildverarbeitung unter Verwendung des auf der Diskette FD gespeicherten Programms.
Im Einzelnen werden bei Speicherung des Programms auf der Diskette FD Programmdaten vom Computersystem Cs über das Disketten-Laufwerk FDD auf die Diskette FD geschrieben. Wird das oben erwähnte Bild-Kodiergerät oder das Bild-Dekodiergerät im Computersystem Cs durch das in der Diskette FD gespeicherte Programm realisiert, dann wird das Programm aus der Diskette FD mit Hilfe des Disketten-Laufwerks FDD gelesen und dann in das Computersystem Cs geladen.
In der obigen Beschreibung wird zwar eine Diskette als Speichermedium verwendet, es kann aber auch eine Bildplatte verwendet werden. Auch in diesem Fall kann – in ähnlicher Weise wie bei dem oben erwähnten Einsatz der Diskette – die Bild-Kodierung oder -Dekodierung mittels Software ausgeführt werden. Das Speichermedium ist nicht auf eine Diskette oder eine Bildplatte beschränkt, sondern es kann ein beliebiges zur Speicherung des Programms geeignetes Medium, so z. B. eine Karte mit integriertem Schaltkreis oder ein Festwertspeicher, verwendet werden.
Außerdem gibt es den Fall, dass kodierte Bildsignale mit unterschiedlichen Datenstrukturen, wie z. B. ein kodiertes Binärsignal, ein kodiertes Rechtecksignal, ein erstes und ein zweites kodiertes Beliebigformsignal und ein kodiertes Transparenzsignal, in einem Datenspeichermedium, wie z. B. einer Bildplatte, gespeichert werden.
Unter der Annahme, dass die in einem Datenspeichermedium gespeicherten kodierten Bildsignale mit unterschiedlichen Datenstrukturen solche kodierten Bildsignale sind, die Datenstrukturen mit Bild-Identifikatoren gemäß der ersten, sechsten, achten oder zehnten Ausführungsform aufweisen, können – beim Auslesen dieser kodierten Bildsignale aus dem Medium und bei der Dekodierung – die jeweiligen kodierten Signale mit Hilfe von Identifikatoren identifiziert und angepasst an die Datenstrukturen der kodierten Signale mit einem Bild-Dekodierungsverfahren oder einem Bild-Dekodiergerät dekodiert werden, die zu einem einzigen Kodierungsverfahren korrespondieren. Zum Beispiel können kodierte Bildsignale mit unterschiedlichen Strukturen, wie z. B. ein kodiertes Binärsignal oder ein kodiertes Beliebigformsignal, dekodiert werden. In diesem Falle kommt man mit Hinblick auf das kodierte Binärsignal bei der Erzeugung des Binärsignals ohne ein kodiertes Blind-Textursignal aus, wodurch die unerwünschte Zunahme der Kode-Bitzahl weitgehend vermieden wird.

Claims

Bild-Dekodierungsverfahren mit den Schritten: Empfang eines kodierten Bitstroms einschließlich eines Bild-Identifikators und eines durch Kodierung eines Bildsignals erhaltenen kodierten Bildsignals, wobei der Bild-Identifikator eine Datenstruktur des kodierten Bildsignals kennzeichnet; Dekodierung von kodierten Formsignaldaten des kodierten Bildsignals, wobei die kodierten Formsignaldaten durch Kodierung eines Formsignals erhalten wurden, das anzeigt, ob jedes Pixel innerhalb oder außerhalb eines Objekts des Bildsignals liegt; und Dekodierung von kodierten Pixelwertsignaldaten des kodierten Bildsignals, wobei die kodierten Pixelwertsignaldaten durch Kodierung eines Pixelwertsignals erhalten wurden, das den Pixelwert eines Pixels kennzeichnet; dadurch gekennzeichnet, dass dann, wenn der Bild-Identifikator anzeigt, dass das kodierte Bildsignal nur die kodierten Formsignaldaten enthält, nur der Dekodierungsschritt der kodierten Formsignaldaten ausgeführt wird; wenn der Bild-Identifikator anzeigt, dass das kodierte Bildsignal nur die kodierten Pixelwertsignaldaten enthält, nur der Dekodierungsschritt der kodierten Pixelwertsignaldaten ausgeführt wird; und wenn der Bild-Identifikator anzeigt, dass das kodierte Bildsignal die kodierten Formsignaldaten und die kodierten Pixelwertsignaldaten enthält, der Dekodierungsschritt der kodierten Formsignaldaten und der Dekodierungsschritt der kodierten Pixelwertsignaldaten ausgeführt werden.
Bild-Dekodierungsverfahren nach Anspruch 1, im Weiteren mit dem Schritt zur Dekodierung von kodierten mehrwertigen Transparenzsignaldaten des kodierten Bildsignals, wobei die kodierten mehrwertigen Transparenzsignaldaten durch Kodierung eines mehrwertigen Transparenzsignals erhalten wurden; dadurch gekennzeichnet, dass dann, wenn der Bild-Identifikator anzeigt, dass das kodierte Bildsignal die kodierten Formsignaldaten, die kodierten Pixelwertsignaldaten und die kodierten mehrwertigen Transparenzsignaldaten enthält, der Dekodierungsschritt der kodierten Formsignaldaten, der Dekodierungsschritt der kodierten Pixelwertsignaldaten und der Dekodierungsschritt der kodierten mehrwertigen Transparenzsignaldaten ausgeführt werden.
Bilddekodierungsverfahren nach Anspruch 1, dadurch gekennzeichnet, dass das Formsignal ein Binärwertsignal und das Pixelwertsignal ein mehrwertiges Signal ist.
Bild-Dekodiergerät mit: Empfangshilfsmitteln zum Empfang eines kodierten Bitstroms einschließlich eines Bild-Identifikators und eines durch Kodierung eines Bildsignals erhaltenen kodierten Bildsignals, wobei der Bild-Identifikator eine Datenstruktur des kodierten Bildsignals kennzeichnet; Dekodierungshilfsmitteln zur Dekodierung von kodierten Formsignaldaten des kodierten Bildsignals, wobei die kodierten Formsignaldaten durch Kodierung eines Formsignals erhalten wurden, das anzeigt, ob jedes Pixel außerhalb oder innerhalb eines Objekts des Bildsignals liegt; und Dekodierungshilfsmitteln zur Dekodierung von kodierten Pixelwertsignaldaten des kodierten Bildsignals, wobei die kodierten Pixelwertsignaldaten durch Kodierung eines Pixelwertsignals erhalten wurden, das den Pixelwert eines Pixels anzeigt; dadurch gekennzeichnet, dass dann, wenn der Bild-Identifikator anzeigt, dass das kodierte Bildsignal nur die kodierten Formsignaldaten enthält, die Dekodierung der kodierten Formsignaldaten nur von den Dekodierungshilfsmitteln zur Dekodierung der kodierten Formsignaldaten ausgeführt wird; wenn der Bild-Identifikator anzeigt, dass das kodierte Bildsignal nur die kodierten Pixelwertsignaldaten enthält, die Dekodierung der kodierten Pixelwertsignaldaten nur von den Dekodierungshilfsmitteln zur Dekodierung der kodierten Pixelwertsignaldaten ausgeführt wird; und wenn der Bild-Identifikator anzeigt, dass das kodierte Bildsignal die kodierten Formsignaldaten und die kodierten Pixelwertsignaldaten enthält, die Dekodierung der kodierten Formsignaldaten und der kodierten Pixelwertsignaldaten von den Dekodierungshilfsmitteln zur Dekodierung der kodierten Formsignaldaten und den Dekodierungshilfsmitteln zur Dekodierung der kodierten Pixelwertsignaldaten ausgeführt wird.
Bild-Dekodierungsverfahren nach Anspruch 4, im Weiteren mit Dekodierungshilfsmitteln zur Dekodierung von kodierten mehrwertigen Transparenzsignaldaten des kodierten Bildsignals, wobei die kodierten mehrwertigen Transparenzsignaldaten durch Kodierung eines mehrwertigen Transparenzsignals erhalten wurden; dadurch gekennzeichnet, dass dann, wenn der Bild-Identifikator anzeigt, dass das kodierte Bildsignal die kodierten Formsignaldaten, die kodierten Pixelwertsignaldaten und die kodierten mehrwertigen Transparenzsignaldaten enthält, die Dekodierung der kodierten Formsignaldaten, der kodierten Pixelwertsignaldaten und der kodierten mehrwertigen Transparenzsignaldaten von den Dekodierungshilfsmitteln zur Dekodierung der kodierten Formsignaldaten, den Dekodierungshilfsmitteln zur Dekodierung der kodierten Pixelwertsignaldaten und den Dekodierungshilfsmitteln zur Dekodierung der kodierten mehrwertigen Transparenzsignaldaten ausgeführt wird.
Bild-Dekodiergerät nach Anspruch 4, dadurch gekennzeichnet, dass das Formsignal ein Binärwertsignal und das Pixelwertsignal ein mehrwertiges Signal ist.