DE69815922T2

DE69815922T2 - Verfahren und Vorrichtung zur prädiktiven Bildkodierung und -dekodierung

Info

Publication number: DE69815922T2
Application number: DE69815922T
Authority: DE
Inventors: Choong Seng Oosakafu Shatomorioka 416 Boon
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp
Priority date: 1997-04-09
Filing date: 1998-04-07
Publication date: 2004-04-22
Anticipated expiration: 2018-04-08
Also published as: EP1079634B1; US6459813B1; EP1065883A2; BR9801156A; DE69815922D1; TW395136B; EP0871336A2; DE69834959T2; EP1079634A1; ES2203383T3; IN192209B; ES2202678T3; KR19980081235A; DE69834959D1; US6633678B2; EP0871336B1; EP1322122A1; US6370276B2; ES2265531T3; DE69824896D1

Description

Gebiet der Erfindung
Die vorliegende Erfindung betrifft die prädiktive Bilddecodierung und die prädiktive Bildcodierung und insbesondere Verfahren und Vorrichtungen zur prädiktiven Bilddecodierung, Verfahren und Vorrichtungen zur prädiktiven Bildcodierung und Datenspeichermedien, die zur Verarbeitung von Bildern mit veränderlicher Größe verwendet werden.
Hintergrund der Erfindung
Um ein digitales Bild mit hoher Effizienz zu speichern oder zu übertragen, muss es kompressionscodiert werden. Ein typisches Verfahren zur Kompressionscodierung digitaler Bilder ist das durch JPEG (Joint Photographic Experts Group; Gemeinsame Fachgruppe Fotografie) und MPEG (Moving Picture Experts Group; Fachgruppe Film) vertretene DCT-Verfahren (Discrete Cosine Transformation; Diskrete Kosinustransformation). Darüber hinaus gibt es Wellenform-Codierungsverfahren wie Codierung mit unterteilten Bändern, Wavelet-Codierung und Fraktal-Codierung. Um ein redundantes Signal zwischen Bildern zu eliminieren, wird eine Interbild-Prädiktion durch Bewegungskompensation durchgeführt und das Differenzsignal wird Wellenform-codiert.
Hier wird ein auf der Bewegungskompensations-DCT beruhendes MPEG-Verfahren beschrieben. Zunächst wird ein Eingangsbild eines zu codierenden Einzelbilds in mehrere Makroblöcke mit einer Größe von jeweils 16 × 16 Pixeln unterteilt. Jeder Makroblock wird weiter in vier Blöcke mit einer Größe von jeweils 8 × 8 Pixeln unterteilt, und jeder Block von 8 × 8 Pixeln wird DCT-transformiert und quantisiert. Dieses Verfahren heißt Intrabild-Codierung.
Mit einem Verfahren der Bewegungserkennung, wie Block-Abgleich, aus einem Einzelbild, das vorübergehend an ein Objektbild mit einem zu quantisierenden Objekt-Makroblock angrenzt, wird der Prädiktions-Makroblock mit dem kleinsten Fehler aus dem Objekt-Makroblock erkannt und aufgrund der erkannten Bewegung wird die Bewegungskompensation aus dem letzten Bild durchgeführt, um so einen optimalen Prädiktionsblock zu erhalten. Ein Signal, das die Bewegung zu dem Prädiktionsblock mit dem kleinsten Fehler anzeigt, ist ein Bewegungsvektor. Ein Bild, das als Bezug für die Erzeugung des Prädiktions-Makroblocks verwendet wird, wird nachstehend als Bezugsbild bezeichnet. Danach wird die Differenz zwischen den Objektblock und dem entsprechenden Prädiktionsblock ermittelt, und diese Differenz wird DCT-transformiert, um den DCT-Koeffizienten zu erhalten. Der DCT-Koeffizient wird quantisiert und die quantisierten Ausgangsdaten werden zusammen mit den Bewegungs-Informationen übertragen oder gespeichert. Dieses Verfahren heißt Bild-zu-Bild-Codierung.
Die Bild-zu-Bild-Codierung hat zwei Prädiktionsmodi: Prädiktion aus einem vorhergehenden Bild in der Reihenfolge der Anzeige und Prädiktion sowohl aus vorhergehenden als auch künftigen Bildern. Der erstgenannte Modus wird als Vorwärtsprädiktion und der letztgenannte als Zweirichtungsprädiktion bezeichnet.
Decoderseitig wird nach dem Zurückführen des quantisierten DCT-Koeffizienten zum ursprünglichen Differenzsignal der Prädiktionsblock auf der Grundlage des Differenzsignals und des Bewegungsvektors erhalten, und der Prädiktionsblock und das Differenzsignal werden addiert, um das Bild zu reproduzieren. Bei diesem herkömmlichen Verfahren wird vorausgesetzt, dass die Größe des Bezugsbilds (eines Bilds, das als Bezug zur Erzeugung eines Prädiktionsbilds dient) gleich der Größe des Objektbilds ist.
In den letzten Jahren sind mehrere Objekte, die ein Bild (Bild beliebiger Form) darstellen, getrennt kompressionscodiert und übertragen worden, um dadurch die Codierungsleistung zu verbessern und eine objektweise Reproduktion zu ermöglichen. Bei der Codierung und Decodierung dieser Bilder beliebiger Form ändert sich die Größe des Bilds sehr häufig. So wird ein Ball immer kleiner, bis er schließlich ganz verschwindet. Außerdem kommt es vor, dass die Größe des Bilds (Objekts) Null wird.
Bei der normalen prädiktiven Codierung ist ein Bezugsbild ein reproduziertes Bild kurz vor einem Objektbild, das gerade verarbeitet wird. Wenn die Größe des Bezugsbilds Null ist, da nichts in dem Bezugsbild definiert ist, d. h. da das Bezugsbild keine signifikanten Bilddaten hat, die zur prädiktiven Codierung zu verwenden sind, kann keine prädiktive Codierung durchgeführt werden. In diesem Fall gibt es außer der Intrabild-Codierung keine herkömmliche Methode. In der Regel erhöht jedoch die Intrabild-Codierung die Menge der codierten Daten und senkt die Kompressionsleistung. Wenn ein Bild verschwindet (Bildgröße = Null) und in einer Folge von Laufbildern häufig erscheint, wird die Codierungsleistung erheblich verschlechtert. Wenn beispielsweise bei einem Blitzlicht-Laufbild das Licht in Bild-Einheiten verschwindet und wieder erscheint, müssen alle Bilder des Lichts Intrabild-codiert werden.
Der Beitrag „Object-oriented analysis synthesis coding of moving images" („Objektorientierte Analysensynthesecodierung von Laufbildern") von N. G. Musmann et al., in Signal Processing: Image Communication, XX, Jg. 1, 01.01.1989, S. 117–138, befasst sich mit einem prädiktiven Codierungsverfahren durch Teilen eines Bilds in die drei Parameter Bewegung, Form und Farbe. Anstatt die übliche blockweise Codierung zu verwenden, kann entsprechend D1 ein Bild, das ein Objekt enthält, effizienter durch prädiktive Codierung codiert werden. Wenn jedoch kleine Objekte codiert werden, schaltet die Codermodussteuerung auf die Block-orientierte Codierung zurück.
Kurze Darstellung der Erfindung
Ziel der vorliegenden Erfindung ist es, ein Verfahren und eine Vorrichtung zur prädiktiven Bilddecodierung, ein Verfahren und eine Vorrichtung zur prädiktiven Bildcodierung und ein Datenspeichermedium zur Verfügung zu stellen, die eine effiziente prädiktive Codierung oder Decodierung von Bildern mit veränderlicher Größe auch dann realisieren können, wenn die Größe eines Bezugsbilds Null ist oder wenn das Bezugsbild völlig transparent ist.
Weitere Ziele und Vorzüge der Erfindung dürften aus der nachstehenden detaillierten Beschreibung hervorgehen. Die detaillierte Beschreibung und die beschriebenen speziellen Ausführungsformen dienen nur der Erläuterung, da Fachleute anhand der detaillierten Beschreibung verschiedene Ergänzungen und Modifikationen innerhalb des Schutzumfangs der Erfindung erkennen dürften.
Die vorliegende Erfindung betrifft also ein Verfahren zur prädiktiven Bilddecodierung und ein Verfahren zur prädiktiven Bildcodierung, die in den beigefügten Ansprüchen definiert sind.
Kurze Beschreibung der Zeichnungen
1 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem Verfahren zur prädiktiven Bilddecodierung gemäß einer ersten Ausführungsform, die nicht Bestandteil der vorliegenden Erfindung ist.
Die 2(a) und 2(b) sind schematische Darstellungen zur Erläuterung der Bildprädiktion bei dem erfindungsgemäßen Verfahren zur prädiktiven Bilddecodierung.
3 ist ein Blockdiagramm, das eine Vorrichtung zur prädiktiven Bilddecodierung gemäß der ersten Ausführungsform zeigt.
4 ist ein Blockdiagramm, das eine Einzelbild-Speichereinheit zeigt, die in der Vorrichtung zur prädiktiven Bilddecodierung gemäß der ersten Ausführungsform verwendet wird.
5 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem prädiktiven Bilddecodierungsverfahren gemäß einer dritten Ausführungsform, die nicht Bestandteil der vorliegenden Erfindung ist.
6 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem prädiktiven Bilddecodierungsverfahren gemäß einer vierten Ausführungsform, die nicht Bestandteil der vorliegenden Erfindung ist.
7 ist ein Diagramm, das Bilddaten gemäß der ersten Ausführungsform zeigt.
8 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem prädiktiven Bilddecodierungsverfahren gemäß einer zweiten Ausführungsform der Erfindung.
9 ist ein Diagramm, das Bilddaten gemäß der zweiten Ausführungsform der Erfindung zeigt.
10 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem prädiktiven Bilddecodierungsverfahren gemäß einer fünften Ausführungsform, die nicht Bestandteil der vorliegenden Erfindung ist.
11 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem prädiktiven Bilddecodierungsverfahren gemäß einer sechsten Ausführungsform der Erfindung.
12 ist Blockdiagramm, das eine Vorrichtung zur prädiktiven Bildcodierung gemäß einer siebenten Ausführungsform zeigt, die nicht Bestandteil der vorliegenden Erfindung ist.
Detaillierte Beschreibung der bevorzugten Ausführungsformen
Ausführungsform 1
1 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem prädiktiven Bilddecodierungsverfahren gemäß einer ersten Ausführungsform, die nicht Bestandteil der vorliegenden Erfindung ist. Bevor 1 erläutert wird, wird ein Bildprädiktionsverfahren gemäß der ersten Ausführungsform anhand der 2(a) und 2(b) beschrieben.
Die Größe eines Eingangsbilds, das bei dem Verfahren zur prädiktiven Bilddecodierung der ersten Ausführungsform verwendet wird, ist veränderlich, und es kann passieren, dass die Größe Null wird.
2(a) zeigt Bilder 201 bis 210 eines Laufbilds, die in der Reihenfolge der Anzeige angeordnet sind. Das Bild 201 ist das erste anzuzeigende Einzelbild, an das sich 202, 203 ... anschließen, und diese Reihenfolge ist durch #1 bis #10 dargestellt. Da das Bild #1 (201) das erste Bild ist, wird es Intrabild-codiert. Bei der ersten Ausführungsform wird ein Bild (ein Einzelbild) in mehrere Blöcke unterteilt, die jeweils eine Größe von 8 × 8 Pixeln haben, und jeder Block von 8 × 8 Pixeln wird DCT-transformiert und quantisiert. Der quantisierte Koeffizient wird einer Codierung variabler Länge unterzogen. Bei der Decodierung werden die durch die Codierung variabler Länge erhaltenen codierten Daten einer Decodierung variabler Länge unterzogen, und der durch die Decodierung variabler Länge erhaltene quantisierte Koeffizient wird einer Rückquantisierung und Rück-DCT unterzogen, wodurch das Bild reproduziert wird. Dann wird das Bild #2 (202) einer prädiktiven Bild-zu-Bild-Codierung durch Verweisen auf das reproduzierte Bild #1 (201) unterzogen.
Bei der ersten Ausführungsform wird mittels Block-Abgleichs als Bewegungserkennungsverfahren der Prädiktionsblock mit dem kleinsten Fehler aus dem Objektblock, der gerade verarbeitet wird, aus dem Bild #1 (201) erkannt. Aufgrund der erkannten Bewegung vom Objektblock zum Prädiktionsblock wird durch Bewegungskompensation des Objektblocks aus dem reproduzierten Bild #1 (201) ein optimaler Prädiktionsblock erhalten. Danach wird die Differenz zwischen dem Objektblock und dem entsprechenden Prädiktionsblock ermittelt und DCT-transformiert. Der DCT-Koeffizient wird quantisiert und der quantisierte Ausgabewert wird zusammen mit den Bewegungs-Informationen übertragen oder gespeichert. Das reproduzierte Bild #1 (201) dient als Bezugsbild für das Bild #2 (202). Diese Prädiktion wird als Vorwärtsprädiktion bezeichnet. Bei der Decodierung wird der Prädiktionsblock zu der der Rückquantisierung und Rück-DCT unterzogenen Differenz addiert, wodurch das Bild reproduziert wird.
In ähnlicher Weise werden das Bild #3 (203) und das Bild #4 (204) unter Verwendung der durch Pfeile gekennzeichneten Bezugsbilder prädiktiv codiert. Wie bei den Bildern #6 (206), #8 (208) und #10 (210) kann die Prädiktion vom vorletzten Bild erfolgen. Im Gegensatz zur Vorwärtsprädiktion kann die Prädiktion wie bei den Bildern #5 (205), #7 (207) und #9 (209) durch Verweisen auf ein künftiges Bild erfolgen, das nach dem Objektbild angezeigt werden soll. Diese Prädiktion wird als Rückwärtsprädiktion bezeichnet. Wenn sowohl die Vorwärts- als auch die Rückwärtsprädiktion durchgeführt werden, handelt es sich um eine Zweirichtungsprädiktion. Die Zweirichtungsprädiktion hat drei Modi: Vorwärtsprädiktionsmodus, Rückwärtsprädiktionsmodus, Interpolationsmodus zur Herstellung des Gleichgewichts von Vorwärts- und Rückwärtsprädiktion.
2(b) zeigt die Übertragungsreihenfolge, d. h. die Decodierungsreihenfolge, der Bilder, die wie in 2(a) gezeigt vorhergesagt wurden.
Das Bild #1 (211) wird zuerst decodiert und reproduziert. Durch Verweisen auf das reproduzierte Bild #1 wird das Bild #2 (212) decodiert. Bei den Zweirichtungsprädiktionsbildern wie beim Bild #5 (216) müssen die für die Prädiktion verwendeten Bezugsbilder vor dem Prädiktionsbild decodiert und reproduziert werden. Daher wird das Bild #6 (215) vor dem Bild #5 (216) decodiert. Ebenso werden die Bilder #8 (217) und #10 (219) vor den Bildern #7 (218) bzw. #9 (220) übertragen, decodiert und reproduziert.
Bei der Übertragung eines Bilds mit veränderlicher Größe muss die Größe des Bilds übertragen werden. Bei der ersten Ausführungsform wird die Bildgröße am Kopf der codierten Daten des Bilds angegeben und die horizontale Größe Hm und die vertikale Größe Vm werden jeweils durch 20 Bit dargestellt. 7 zeigt die gemäß der ersten Ausführungsform codierten Bilddaten (VD), die außer der horizontalen Größe Hm und vertikalen Größe Vm auch den Bewegungsvektor, die Quantisierungsbreite und den DCT-Koeffizienten aufweisen.
Nachstehend wird der Prädiktionsbild-Erzeugungsprozess bei dem Verfahren zur prädiktiven Bilddecodierung gemäß der ersten Ausführungsform beschrieben.
Um ein Prädiktionsbild zu erzeugen, wird zunächst die Größe des vorhergehenden Bezugsbilds eingegeben (Schritt 102), und es wird geprüft, ob die Größe des Bezugsbilds Null ist oder nicht (Schritt 103).
Bei der in 2(b) gezeigten Decodierungsreihenfolge ist stets ein Bezugsbild vor einem zu decodierenden Bild vorhanden (bei der Codierung ein Codierungsobjekt). Das heißt, das Bezugsbild ist das zuletzt reproduzierte Bild beim Verfahren der prädiktiven Decodierung der ersten Ausführungsform. Beispielsweise ist in 2(b) das Bild #3 (213) ein Bezugsbild für das Bild #4 (214). Ein durch Zweirichtungsprädiktion reproduziertes Bild kann jedoch nicht zur Prädiktion verwendet werden, sodass dieses Bild kein Bezugsbild sein kann. Daher ist beispielsweise das Bild #6 (215) ein Bezugsbild für das Bild #8 (217).
Wenn im Schritt 103 entschieden wird, dass die Größe des Bezugsbilds nicht Null ist, folgt Schritt 104, in dem ein Prädiktionsbild unter Verwendung des Bezugsbilds erzeugt wird. Wenn jedoch im Schritt 103 entschieden wird, dass die Größe des Bezugsbilds Null ist, folgt Schritt 105, in dem ein Prädiktionsbild unter Verwendung eines vor kurzem reproduzierten Bilds, dessen Größe nicht Null ist, als Bezugsbild erzeugt wird. Die Methode zur Erkennung eines vor kurzem reproduzierten Bilds, dessen Größe nicht Null ist, wird nachstehend anhand von 2(b) beschrieben.
Wenn ein Prädiktionsbild des Bilds #4 (214) erzeugt wird, wird unterstellt, dass die Größe des Bilds #3 (213) unmittelbar vor dem Bild #4 (214) Null ist und die Größe des Bilds #2 nicht Null ist. In diesem Fall wird durch Verweisen auf das Bild #2 (212) ein Prädiktionsbild des Bilds #4 (214) erzeugt. Genauso wird bei der Erzeugung eines Prädiktionsbilds des Bilds #6 (215) in der Annahme, dass die Größe der Bilder #3 (213) und #4 (214) Null ist, das Prädiktionsbild durch Verweisen auf das Bild #2 (212) erzeugt. Die erste Ausführungsform verwendet die blockweise Bewegungskompensation als Verfahren zur Erzeugung eines Prädiktionsbilds, wie MPEG1. 3 ist ein Blockdiagramm, das eine Vorrichtung zur prädiktiven Bilddecodierung 300 gemäß der ersten Ausführungsform zeigt.
Die Vorrichtung zur prädiktiven Bilddecodierung 300 empfängt Bilddaten, die durch Kompressionscodierung eines Bilds mit veränderlicher Größe nach einem vorgeschriebenen Verfahren erhalten werden, und führt die prädiktive Decodierung der Bilddaten durch.
Die Vorrichtung zur prädiktiven Bilddecodierung 300 weist einen Daten-Analysator 302, eine Decoder 303 und ein Addierwerk 306 auf. Der Daten-Analysator 302 analysiert die kompressionscodierten Bilddaten und gibt die Quantisierungsbreite und den DCT-Koeffizienten an die Leitung 312, den Bewegungsvektor an die Leitung 318 und die Bildgröße an die Leitung 321 aus. Der Decoder 303 wandelt die komprimierten Blockdaten (komprimierter Block) aus dem Daten-Analysator 302 durch Daten-Expansion in einen expandierten Block um. Das Addierwerk 306 addiert den expandierten Block und den Prädiktionsblock, um einen reproduzierten Block zu erzeugen.
Die Vorrichtung zur prädiktiven Bilddecodierung 300 weist außerdem eine Einzelbild-Speichereinheit 309 und einen Prädiktionsbild-Generator 310 auf. Die Einzelbild-Speichereinheit 309 speichert den reproduzierten Block. Der Prädiktionsbild-Generator 310 erzeugt eine Adresse zum Zugreifen auf die Einzelbild-Speichereinheit 309 aufgrund des Bewegungsvektors und erhält als Prädiktionsblock einen Block, der der Adresse aus dem in der Einzelbild-Speichereinheit 309 gespeicherten Bild entspricht. Bei der ersten Ausführungsform bestimmt der Prädiktionsbild-Generator 310 als Bezugsbild ein einziges reproduziertes Bild, das vor kurzem reproduziert worden ist und wichtige zu referenzierende Bilddaten aufweist, aufgrund der Bildgröße vom Daten-Analysator 302. Die Bestimmung des Bezugsbilds kann, wie in 3 durch Strichlinien dargestellt ist, mit einem Steuergerät 320 erfolgen, das die Einzelbild-Speichereinheit 309 entsprechend der Bildgröße vom Daten-Analysator 302 steuert. Das heißt, die Einzelbild-Speichereinheit 309 wird vom Steuergerät 320 so gesteuert, dass sie ein einzelnes reproduziertes Bild wählt, das vor kurzem reproduziert worden ist und wichtige zu referenzierende Bilddaten aufweist.
Der Decoder 303 weist einen Rückquantisierer (IQ) 304, der den komprimierten Block aus dem Daten-Analysator 302 rückquantisiert, und einen diskreten Kosinus-Rücktransformator (nachstehend als IDCT bezeichnet) 305 auf, der die Ausgangssignale vom Rückquantisierer 304 einer Rück-DCT (Transformation eines Frequenzbereichssignals in ein Raumbereichssignal) unterzieht.
Die Bezugssymbole 301 und 307 bezeichnen das Eingabe- bzw. Ausgabeterminal der Vorrichtung zur prädiktiven Bilddecodierung 300.
Nachstehend wird die Funktionsweise der in 3 gezeigten Vorrichtung zur prädiktiven Bilddecodierung beschrieben.
Zunächst werden Bilddaten (codierte Daten), die durch Kompressionscodierung eines Bilds mit veränderlicher Größe nach einem festgelegten Verfahren erhalten werden, in das Eingabeterminal 301 eingegeben. Bei der ersten Ausführungsform erfolgt die Kompressionscodierung durch Bewegungskompensations-DCT wie bei MPEG1, sodass die codierten Daten den Bewegungsvektor, die Quantisierungsbreite, den DCT-Koeffizienten und die Bildgrößendaten umfassen.
Dann werden im Daten-Analysator 302 die kompressionscodierten Bilddaten analysiert und die Quantisierungsbreite und der DCT-Koeffizient werden als komprimierte Blockdaten über die Leitung 312 an den Decoder 303 gesendet. Außerdem wird der im Daten-Analysator 302 analysierte Bewegungsvektor über die Leitung 318 an den Prädiktionsbild-Generator 310 gesendet. Ebenso wird die vom Daten-Analysator 302 analysierte Bildgröße über die Leitung 321 an das Steuergerät 320 gesendet.
Im Decoder 303 werden die komprimierten Blockdaten, d. h. der komprimierte Block, vom Rückquantisierer 304 und vom Rück-DCT-Transformator 305 expandiert, sodass ein expandierter Block 314 entsteht. Genauer gesagt, rückquantisiert der Rückquantisierer 304 den komprimierten Block und der Rück-DCT-Transformator 305 transformiert das Frequenzbereichssignal in ein Raumbereichssignal, sodass der expandierte Block 314 entsteht. Im Prädiktionsbild-Generator 310 wird entsprechend dem über die Leitung 318 gesendeten Bewegungsvektor eine Adresse 321 zum Zugreifen auf die Einzelbild-Speichereinheit 309 erzeugt und in die Einzelbild-Speichereinheit 309 eingegeben. Dann wird aus den in der Einzelbild-Speichereinheit 309 gespeicherten Bildern ein Prädiktionsblock 317 erzeugt. Der Prädiktionsblock 317 (319) und der expandierte Block 314 werden in das Addierwerk 306 eingegeben, in dem die Blöcke 319 und 314 addiert werden, sodass ein reproduzierter Block 315 entsteht. Der reproduzierte Block 315 wird vom Ausgabeterminal 307 ausgegeben und wird gleichzeitig über die Leitung 316 gesendet und in der Einzelbild-Speichereinheit 309 gespeichert. Wenn die Intrabild-Decodierung durchgeführt wird, sind die Abtastwerte des Prädiktionsblocks alle Null.
Die Funktionsweise des Prädiktionsbild-Generators 310 ist mit der identisch, die bereits in Zusammenhang mit dem Ablaufdiagramm von 1 beschrieben wurde. Das heißt, die Größe des Bezugsbilds wird in den Prädiktionsbild-Generator 310 eingegeben, und der Prädiktionsbild-Generator 310 bestimmt das Bezugsbild. Die Bezugsbild-Bestimmung kann durch Steuern der Einzelbild-Speichereinheit 309 entsprechend den über das Steuergerät 320 und die Leitung 322 gesendeten Informationen darüber, ob die Größe des Bezugsbilds Null ist oder nicht, erfolgen.
4 ist ein Blockdiagramm, das eine Einzelbild-Speicherbank 406 als Beispiel für die Einzelbild-Speichereinheit 309 in der Vorrichtung zur prädiktiven Bilddecodierung 300 gemäß der ersten Ausführungsform zeigt. Die Einzelbild-Speicherbank 406 weist drei Einzelbild-Speicher 401 bis 403 auf. Das reproduzierte Bild wird in einem der Einzelbild-Speicher 401 bis 403 gespeichert. Bei der Erzeugung eines Prädiktionsbilds erfolgt der Zugriff auf die Einzelbild-Speicher 401 bis 403.
Bei der ersten Ausführungsform hat die Einzelbild-Speicherbank 406 Schalter 404 und 405. Der Schalter 405 soll einen Einzelbild-Speicher zum Speichern des reproduzierten Bilds wählen, das von den Einzelbild-Speichern 401 bis 403 über die Leitung 408 (entspricht der Leitung 316 in 3) eingegeben wird. Der Schalter 405 wählt nacheinander die Einzelbild-Speicher 401 bis 403, die vom Steuergerät 320, d. h. entsprechend dem Steuersignal 322, gesteuert werden. Das heißt, nachdem das erste reproduzierte Bild im Einzelbild-Speicher 401 gespeichert worden ist, wird das zweite reproduzierte Bild im Einzelbild-Speicher 402 gespeichert. Nachdem das dritte reproduzierte Bild im Einzelbild-Speicher 403 gespeichert worden ist, wählt der Schalter 405 den Einzelbild-Speicher 401. Der Schalter 404 ist über die Leitung 407 (entspricht der Leitung 317 in 3) mit dem Prädiktionsbild-Generator 310 verbunden. Dieser Schalter 404 wählt ebenfalls nacheinander die Einzelbild-Speicher 401 bis 403, die vom Steuergerät 320, d. h. entsprechend dem Steuersignal 322, gesteuert werden. Die Schaltfolge wird jedoch entsprechend der Größe des Bezugsbilds geändert. Obwohl zur Erzeugung eines Prädiktionsbilds entsprechend der vorgegebenen Reihenfolge beispielsweise der Schalter 404 mit dem Einzelbild-Speicher 402 verbunden werden muss, wenn die Bildgröße des Einzelbild-Speichers 402 Null ist, steuert das Steuergerät 320 den Schalter 404 so, dass der vorhergehende Einzelbild-Speicher 401 gewählt wird (unter der Voraussetzung, dass die Bildgröße des Einzelbild-Speichers 401 nicht Null ist). Auf diese Weise kann ein Prädiktionsbild aus einem Bezugsbild, dessen Größe nicht Null ist, erzeugt werden. Der Schalter 404 kann mit mehreren Einzelbild-Speichern gleichzeitig verbunden werden. Bei einer Einheit, bei der jeder Einzelbild-Speicher bei jeder Reproduktion eines einzelnen Bilds rückgesetzt wird, kann durch Steuern der Einheit mit dem Steuergerät 320 in einer Weise, dass der Einzelbild-Speicher nicht rückgesetzt wird, wenn die Größe des reproduzierten Bilds Null ist, ein vor kurzem reproduziertes Bild, dessen Größe nicht Null ist, im Einzelbild-Speicher bleiben. Mit anderen Worten, es ist möglich, eine Aktualisierung des Einzelbild-Speichers zu vermeiden.
Obwohl bei der ersten Ausführungsform das blockweise Bewegungskompensations-DCT-Verfahren beschrieben wird, kann die vorliegende Erfindung auch für andere Prädiktionsverfahren verwendet werden, die beispielsweise globale Bewegungskompensation oder arbiträre gitterförmige Block-Bewegungskompensation nutzen. Obwohl bei der ersten Ausführungsform ein Prädiktionsbild aus einem einzigen reproduzierten Bild, das als Bezugsbild dient, erzeugt wird, kann die vorliegende Erfindung ebenso für den Fall verwendet werden, wo ein Prädiktionsbild aus mehreren Bezugsbildern erzeugt wird.
Wie vorstehend beschrieben, wird gemäß der ersten Ausführungsform die Größe eines vorhergehenden Bezugsbilds ermittelt, die in die Vorrichtung eingegeben wird, und wenn die Größe des Bezugsbilds nicht Null ist, wird ein Prädiktionsbild unter Verwendung des Bezugsbilds erzeugt. Wenn jedoch die Größe des vorhergehenden Bezugsbilds Null ist, wird ein Prädiktionsbild unter Verwendung eines vor kurzem reproduzierten Bilds erzeugt, dessen Größe nicht Null ist. Wenn also mehrere Objekte, die ein Bild darstellen, kompressionscodiert und objektweise gesendet werden, um die Kompressionsleistung zu erhöhen, wird vermieden, dass ein Bild mit veränderlicher Größe, das bereits verschwunden ist, als Bezugsbild für die prädiktive Decodierung oder Codierung verwendet wird, was zu einer zweckmäßigen prädiktiven Decodierung oder Codierung führt, die das Restsignal (Differenzsignal) unterdrücken kann. Außerdem können die codierten Daten, die von der Vorrichtung zur prädiktiven Bildcodierung gemäß der siebenten Ausführungsform erhalten werden, von der Vorrichtung zur prädiktiven Bilddecodierung gemäß der zweiten Ausführungsform fehlerfrei decodiert werden.
Ausführungsform 2
Bei der ersten Ausführungsform wird ermittelt, ob die Größe des Bezugsbilds Null ist oder nicht, und die Bezugsbild-Bestimmung erfolgt unter Verwendung der ermittelten Informationen. Wenn jedoch der Umstand, dass die Bildgröße Null ist, durch einen anderen Index (z. B. ein Ein-Bit-Flag F) dargestellt wird, kann die Steuerung mit diesem Index durchgeführt werden. Bei der zweiten Ausführungsform der Erfindung wird die Erzeugung des Prädiktionsbilds unter Verwendung dieses Indexes gesteuert.
Das heißt, bei der zweiten Ausführungsform, die in 9 dargestellt ist, weisen die codierten Daten eines Objektbilds ein Ein-Bit-Flag F auf, das anzeigt, dass die Bildgröße Null ist, d. h. das entsprechende Bezugsbild ist völlig transparent und hat keine codierten Daten, und dieses Flag F wird vor der die Bildgröße angebenden horizontalen und vertikalen Größe Hm und Vm gesetzt. Wenn die Bildgröße Null ist, ist das Flag F „0". Bei der zweiten Ausführungsform wird also die Erzeugung eines Prädiktionsbilds mit Hilfe des Flags F gesteuert.
Nachstehend wird ein Prädiktionsbild-Erzeugungsprozess bei dem Verfahren zur prädiktiven Bilddecodierung gemäß der zweiten Ausführungsform anhand des Ablaufdiagramms von 8 beschrieben.
Um ein Prädiktionsbild zu erzeugen, wird zunächst im Schritt 802 ein vorhergehendes Bezugsbild eingegeben, und im Schritt 803 wird geprüft, ob das Flag F des Bezugsbilds „1" ist oder nicht. Wenn im Schritt 803 entschieden wird, dass das Flag F des Bezugsbilds „1" ist, ist die Größe dieses Bezugsbilds nicht Null, d. h. das Bezugsbild ist nicht völlig transparent und es hat codierte Daten. Somit wird im Schritt 804 ein Prädiktionsbild unter Verwendung des vorhergehenden Bezugsbilds erzeugt.
Wenn jedoch im Schritt 803 entschieden wird, dass das Flag F des Bezugsbilds nicht „1" ist, folgt Schritt 805, in dem ein Prädiktionsbild unter Verwendung eines vor kurzem reproduzierten Bilds, dessen Flag F nicht „0" ist, als Bezugsbild erzeugt wird.
Wenn, wie vorstehend beschrieben, bei der zweiten Ausführungsform der Endung mehrere Objekte, die ein Bild darstellen, kompressionscodiert und dann objektweise gesendet werden, wird vermieden, dass ein Bild mit veränderlicher Größe, das bereits verschwunden ist, als Bezugsbild verwendet wird, was zu einer zweckmäßigen prädiktiven Decodierung oder Codierung führt, die das Restsignal (Differenzsignal) unterdrücken kann. Außerdem haben die codierten Daten des Objektbilds an ihrem Kopf ein Flag, das anzeigt, ob das zuvor reproduzierte Bild wichtige zu referenzierende codierte Daten hat, und die Bezugsbild-Bestimmung erfolgt durch Erkennen dieses Flags. Dadurch wird die Bestimmung des Bezugsbilds erleichtert.
Ausführungsform 3
5 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem Verfahren zur prädiktiven Bilddecodierung gemäß einer dritten Ausführungsform, die nicht Bestandteil der vorliegenden Erfindung ist. Der Prädiktionsbild-Erzeugungsprozess gemäß der dritten Ausführungsform ist im Wesentlichen mit dem gemäß der ersten Ausführungsform identisch, mit der Ausnahme, dass Schritt 505 in 5 an die Stelle von Schritt 105 in 1 tritt. Wenn das Bezugsbild Null ist oder wenn es völlig transparent ist (oder wenn das Flag F des Bilds „0" ist), wird im Schritt 505 ein Prädiktionsbild, dem ein vorgegebener Wert zugewiesen ist, d. h. ein Prädiktionsbild mit einem vorgegebenen Wert, erzeugt.
Bei der dritten Ausführungsform wird unterstellt, dass das Prädiktionsbild grau ist, d. h., dass sowohl sein Leuchtdichte-Signalwert als auch sein Farbdifferenzsignalwert 128 sind. Dadurch wird bei der Codierung der graue Block von dem zu codierenden Block subtrahiert. Bei der Decodierung wird der graue Block zu dem zu decodierenden Block addiert. Der vorgenannte vorgegebene Wert kann variabel sein und vom Coder an den Decoder gesendet werden, um zur Erzeugung eines Prädiktionsbilds verwendet zu werden.
Wenn, wie vorstehend beschrieben, bei der dritten Ausführungsform mehrere Objekte, die ein Bild darstellen, kompressionscodiert und dann objektweise gesendet werden, wird vermieden, dass ein Bild mit veränderlicher Größe, das bereits verschwunden ist, als Bezugsbild verwendet wird, was zu einer zweckmäßigen prädiktiven Decodierung oder Codierung führt, die das Restsignal (Differenzsignal) unterdrücken kann. Außerdem wird, wenn die Größe des Bezugsbilds Null ist, d. h. wenn das Bezugsbild völlig transparent ist, ein Prädiktionsbild mit einem vorgegebenen Wert erzeugt. Dadurch wird außer den Wirkungen, die mit der ersten Ausführungsform erzielt werden, auch die Erzeugung des Prädiktionsbilds erleichtert.
Ausführungsform 4
10 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem Verfahren zur prädiktiven Bilddecodierung gemäß einer vierten Ausführungsform, die nicht Bestandteil der vorliegenden Erfindung ist. Der Prädiktionsbild-Erzeugungsprozess gemäß der vierten Ausführungsform ist im Wesentlichen mit dem Prozess gemäß der zweiten Ausführungsform identisch, mit der Ausnahme, dass Schritt 1005 in 10 an die Stelle von Schritt 805 in 8 tritt. Wenn das Flag F des Bezugsbilds „0" ist, wird im Schritt 1005 ein Prädiktionsbild, dem ein vorgegebener Wert zugewiesen ist, d. h. ein Prädiktionsbild mit einem vorgegebenen Wert, erzeugt.
Wenn bei der vierten Ausführungsform mehrere Objekte, die ein Bild darstellen, kompressionscodiert und dann objektweise gesendet werden, wird vermieden, dass ein Bild mit veränderlicher Größe, das bereits verschwunden ist, als Bezugsbild verwendet wird, was zu einer zweckmäßigen prädiktiven Decodierung oder Codierung führt, die das Restsignal (Differenzsignal) unterdrücken kann. Außerdem haben die codierten Daten des Objektbilds an ihrem Kopf ein Flag, das anzeigt, ob das zuvor reproduzierte Bild wichtige zu referenzierende codierte Daten hat, und wenn festgestellt wird, dass dieses Flag „0" ist, wird ein Prädiktionsbild mit dem vorgegebenen Wert erzeugt. Dadurch wird außer den Wirkungen, die mit der zweiten Ausführungsform erzielt werden, auch die Erzeugung des Prädiktionsbilds erleichtert.
Ausführungsform 5
6 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem Verfahren zur prädiktiven Bilddecodierung, das die Zweirichtungsprädiktion verwendet, gemäß einer fünften Ausführungsform, die nicht Bestandteil der vorliegenden Erfindung ist. Nachstehend wird die Zweirichtungsprädiktion für den Fall beschrieben, dass die Bezugsbildgröße Null ist, d. h. dass das Bezugsbild völlig transparent ist.
Zunächst werden im Schritt 602 die Größen der Vorwärts- und Rückwärfs-Bezugsbilder eingegeben. Das in 2(a) gezeigte Bild #5 (205) ist ein Zweirichtungsprädiktionsbild, dessen Vorwärts- und Rückwärts-Bezugsbilder die Bilder #4 (204) bzw. #6 (206) sind.
Wenn in den Schritten 603 und 604 entschieden wird, dass die Größe der Vorwärts- und Rückwärts-Bezugsbilder jeweils Null ist, wird im Schritt 605 ein Bild, dem ein vorgegebener Wert zugewiesen ist, d. h. ein Bild mit einem vorgegebenen Wert, als vorgegebener Wert erzeugt.
Wenn in den Schritten 603 und 604 entschieden wird, dass die Größe des Vorwärts-Bezugsbilds Null und die Größe des Rückwärts-Bezugsbilds nicht Null ist, wird im Schritt 606 ein Prädiktionsbild unter Verwendung nur des Rückwärts-Bezugsbilds erzeugt.
Wenn in den Schritten 603 und 607 entschieden wird, dass die Größe des Vorwärts-Bezugsbilds nicht Null und die Größe des Rückwärts-Bezugsbilds Null ist, wird im Schritt 608 ein Prädiktionsbild unter Verwendung nur des Vorwärts-Bezugsbilds erzeugt.
Wenn in den Schritten 603 und 607 entschieden wird, dass die Größe der Vorwärts- und Rückwärts-Bezugsbilder jeweils nicht Null ist, wird ein Prädiktionsbild unter Verwendung dieser Bezugsbilder erzeugt.
Im Schritt 610 wird das erzeugte Prädiktionsbild ausgegeben. Bei Empfang des Prädiktionsbilds subtrahiert der Coder das Prädiktionsbild vom Objektbild, während der Decoder das Prädiktionsbild zur Differenz des Objektbilds addiert. Auf diese Weise kann das Restsignal (Differenzsignal) unterdrückt werden.
In dem Fall, dass wie vorstehend beschrieben bei der fünften Ausführungsform mehrere Objekte, die ein Bild darstellen, kompressionscodiert und objektweise gesendet werden, wenn ein Prädiktionsbild unter Verwendung von Vorwärts- und Rückwärts-Bezugsbildern erzeugt wird, wird vermieden, dass Bilder mit veränderlicher Größe, die bereits verschwunden sind, als Bezugsbilder verwendet werden, was zu einer zweckmäßigen prädiktiven Decodierung oder Codierung führt, die das Restsignal (Differenzsignal) unterdrücken kann. Da außerdem ein Prädiktionsbild mit einem vorgegebenen Wert erzeugt wird, wird die Erzeugung des Prädiktionsbilds erleichtert.
Ausführungsform 6
11 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem Verfahren zur prädiktiven Bilddecodierung, das die Zweirichtungsprädiktion verwendet, gemäß einer sechsten Ausführungsform der vorliegenden Erfindung. Die sechste Ausführungsform ist im Wesentlichen mit der fünften Ausführungsform identisch, so wie die zweite mit der vierten Ausführungsform und die erste mit der dritten Ausführungsform identisch ist. Genauer gesagt, wird bei der sechsten Ausführungsform die Frage „Ist Größe Null?" in den Schritten 603, 604 und 607 in 6 in die Frage „Ist Flag F 0?" in den Schritten 1103, 1104 und 1107 in 11 geändert.
In dem Fall, dass bei der sechsten Ausführungsform mehrere Objekte, die ein Bild darstellen, kompressionscodiert und objektweise gesendet werden, wenn ein Prädiktionsbild unter Verwendung von Vorwärts- und Rückwärts-Bezugsbildern erzeugt wird, wird vermieden, dass Bilder mit veränderlicher Größe, die bereits verschwunden sind, als Bezugsbilder verwendet werden, was zu einer zweckmäßigen prädiktiven Decodierung oder Codierung führt, die das Restsignal (Differenzsignal) unterdrücken kann. Wenn festgestellt wird, dass das Flag F der Vorwärts- und Rückwärts-Bezugsbilder jeweils „0" ist, wird ein Prädiktionsbild mit einem vorgegeben Wert erzeugt. Dadurch wird die Erkennung eines Bilds mit veränderlicher Größe, das bereits verschwunden ist, erleichtert und die Erzeugung des Prädiktionsbilds wird ebenfalls erleichtert.
Ausführungsform 7
12 ist ein Blockdiagramm, das eine Vorrichtung zur prädiktiven Bildcodierung 1000 gemäß einer siebenten Ausführungsform zeigt, die nicht Bestandteil der vorliegenden Erfindung ist. Die Codiervorrichtung 1000 weist eine Strukturcodierungseinheit 1100, die die prädiktive Codierung eines ein Leuchtdichtesignal und ein Farbdifferenzsignal aufweisenden Struktursignals durchführt, und eine Formcodierungseinheit 1200 auf, die die prädiktive Codierung eines Formsignals durchführt.
Die Strukturcodierungseinheit 1100 weist eine Blockungseinheit 1110, die ein Struktursignal je Einzelbild in mehrere Makroblöcke mit einer Größe von jeweils 16 × 16 Pixeln (eine zu codierende Einheit) teilt und ein geteiltes Struktursignal ausgibt; ein Subtrahierwerk 1160, das die Differenz zwischen einem Block, der ein Codierungsobjekt ist (nachstehend als Objektblock bezeichnet) und einem dem Objektblock entsprechenden Prädiktionsblock berechnet; einen Kompressionscoder 1120, der die Differenz kompressionscodiert; und einen lokalen Decoder 1130 auf, der das Ausgangssignal vom Kompressionscoder 1120 expansiv decodiert. Der Kompressionscoder 1120 weist einen diskreten Kosinustransformator (nachstehend als DCT bezeichnet) 1121, der die diskrete Kosinustransformation (DCT) der Differenz durchführt, und einen Quantisierer 1122 auf, der den DCT-Koeffizienten quantisiert. Der lokale Decoder 1130 weist einen Rückquantisierer 1131, der das Ausgangssignal vom Quantisierer 1122 rückquantisiert, und einen diskreten Kosinus-Rücktransformator (nachstehend als IDCT bezeichnet) 1132 auf, der die Rück-DCT (Transformation eines Frequenzbereichssignals in ein Raumbereichssignal) des Ausgangssignals vom Rückquantisierer 1131 durchführt.
Die Strukturcodierungseinheit 1100 weist außerdem ein Addierwerk 1170, das ein expandiertes Block-Ausgangssignal vom IDCT 1132 und den Prädiktionsblock addiert, um einen reproduzierten Block zu erzeugen; eine Einzelbild-Speichereinheit (FM1) 1140, die den reproduzierten Block speichert; und einen Prädiktionsbild-Generator 1150 auf, der einen dem Objektblock entsprechenden Prädiktionsblock aus in der Einzelbild-Speichereinheit 1140 gespeicherten Bildern durch Bewegungskompensation aufgrund der mit einem vorgegebenen Bewegungserkennungsverfahren erkannten Bewegungs-Informationen erhält.
Der Prädiktionsbild-Generator 1150 bestimmt ein Bezugsbild, das bei der Erzeugung eines Prädiktionsblocks (Prädiktionsbilds) referenziert werden soll, aus den in der Einzelbild-Speichereinheit 1140 gespeicherten Bildern aufgrund der aus dem Ausgangssignal der Blockungseinheit 1110 erhaltenen Bildgröße.
Die Formcodierungseinheit 1200 weist eine Blockungseinheit 1210, die ein Formsignal je Einzelbild in mehrere Makroblöcke mit einer Größe von jeweils 16 × 16 Pixeln (eine zu codierende Einheit) teilt und ein geteiltes Formsignal ausgibt; ein Subtrahierwerk 1260, das die Differenz zwischen einem Block, der ein Codierungsobjekt ist (Objektblock), und einem dem Objektblock entsprechenden Prädiktionsblock berechnet; einen Formcoder 1220, der die Differenz nach einem vorgegebenen Codierungsverfahren codiert; und einen Formdecoder 1230 auf, der das Ausgangssignal vom Formcoder 1220 nach einem dem Codierungsverfahren entsprechenden Decodierungsverfahren decodiert. Der Formcoder 1220 codiert das Ausgangssignal vom Subtrahierwerk 1260 nach einem Codierungsverfahren wie Quarter-Tree- oder Kettencodierung.
Die Formcodierungseinheit 1200 weist außerdem ein Addierwerk 1270, das ein decodiertes Block-Ausgangssignal vom Formdecoder 1230 und den Prädiktionsblock addiert, um einen reproduzierten Block zu erzeugen; eine Einzelbild-Speichereinheit (FM2) 1240, die das decodierte Block-Ausgangssignal vom Addierwerk 1270 speichert; und einen Prädiktionsbild-Generator 1250 auf, der einen dem Objektblock entsprechenden Prädiktionsblock aus den in der Einzelbild-Speichereinheit 1240 gespeicherten Form-Informationen durch Bewegungskompensation aufgrund der mit einem vorgegebenen Bewegungserkennungsverfahren erkannten Bewegungs-Informationen erhält.
Der Prädiktionsbild-Generator 1250 bestimmt ein Bezugsbild, das bei der Erzeugung eines Prädiktionsblocks (Prädiktionsbilds) referenziert werden soll, aus den in der Einzelbild-Speichereinheit 1240 gespeicherten Bildern aufgrund der aus dem Ausgangssignal der Blockungseinheit 1210 erhaltenen Bildgröße.
Die Bestimmung des Bezugsbilds durch die Codierungseinheit 1100 oder 1200 kann, wie in 12 durch Strichlinien dargestellt ist, durch Verwendung eines Formdetektors 1280, der die Form-Erkennung aufgrund des reproduzierten Blocks durchführt, und durch Steuern der Einzelbild-Speichereinheiten 1140 und 1240 entsprechend dem vom Formdetektor 1280. ausgegebenen Ergebnis der Form-Erkennung erfolgen. In diesem Fall ist die Steuerung der Einzelbild-Speichereinheiten entsprechend dem Ergebnis der Form-Erkennung mit der Steuerung der Einzelbild-Speichereinheit 309 durch das Steuergerät 320 gemäß der ersten Ausführungsform identisch. Das Ergebnis der Form-Erkennung wird für einen nachstehend beschriebenen Coder variabler Länge 1010 verwendet und zusammen mit den codierten Daten des Struktursignals und des Formsignals gesendet.
Die Vorrichtung zur prädiktiven Bildcodierung 1000 weist außerdem einen Coder variabler Länge 1010 auf. Der Coder variabler Länge 1010 führt die Codierung variabler Länge des vom Strukturcoder 1100 ausgegebenen codierten Struktursignals und des codierten Formsignals und des Ergebnisses der Form-Erkennung, die vom Formcoder 1200 ausgegeben werden, durch und multiplext diese auszugebenden Signale.
In 12 bezeichnet das Bezugssymbol 1001 ein Eingabeterminal für das Struktursignal, 1002 bezeichnet ein Eingabeterminal für das Formsignal, und 1003 bezeichnet ein Ausgabeterminal für die codierten Daten.
Nachstehend wird die Funktionsweise beschrieben.
Wenn ein Struktursignal (Leuchtdichte-/Farbdifferenzsignal) und ein Formsignal in die Vorrichtung zur prädiktiven Bildcodierung 1000 eingegeben werden, werden das Struktursignal und das Formsignal durch die in den Codierungseinheiten 1100 und 1200 enthaltenen Blockungseinheiten 1110 bzw. 1210 in Makroblöcke (zu codierende Einheiten) geteilt und für jeden Makroblock wird die prädiktive Codierung durchgeführt.
In der Struktursignal-Codierungseinheit 1100 berechnet das Subtrahierwerk 1160 die Differenz zwischen einem Objektblock und einem Prädiktionsblock, der DCT 1121 transformiert diese Differenz in einen DCT-Koeffizienten und der Quantisierer 1122 quantisiert den DCT-Koeffizienten, um einen quantisierten Koeffizienten zu erzeugen. Der quantisierte Koeffizient wird an den Coder variabler Länge 1010 ausgegeben.
Der Rückquantisierer 1131 rückquantisiert den quantisierten Koeffizienten, um einen DCT-Koeffizienten zu erzeugen, und der IDCT 1130 transformiert den DCT-Koeffizienten in einen dem Objektblock entsprechenden expandierten Block nach einem Verfahren zur Transformation von Frequenzbereichsdaten in Raumbereichsdaten. Das Addierwerk 1170 addiert den expandierten Block und den Prädiktionsblock, um einen reproduzierten Block zu erzeugen. Der reproduzierte Block wird in der Einzelbild-Speichereinheit 1140 gespeichert. Dabei erzeugt der Prädiktionsbild-Generator 1150 einen dem Objektblock entsprechenden Prädiktionsblock aus den in der Einzelbild-Speichereinheit 1140 gespeicherten Bildern durch Bewegungskompensation aufgrund der nach einem festgelegten Bewegungserkennungsverfahren erkannten Bewegungs-Informationen. Außerdem bestimmt der Prädiktionsbild-Generator 1150 als Bezugsbild ein einzelnes reproduziertes. Bild, das vor kurzem reproduziert worden ist und wichtige zu referenzierende Bilddaten enthält, aus den in der Einzelbild-Speichereinheit 1140 gespeicherten Bildern. Wenn die Vorrichtung den Formdetektor 1280 aufweist, kann die Bestimmung des Bezugsbilds durch Steuern der Einzelbild-Speichereinheit 1140 entsprechend dem Ausgangssignal vom Formdetektor 1280, d. h. den Informationen darüber, ob die Größe des zu referenzierenden reproduzierten Bilds Null ist oder nicht, erfolgen.
Parallel zur Verarbeitung im Strukturcoder 1100 wird im Formcoder 1200 die prädiktive Codierung des Formsignals ähnlich wie die vorstehend beschriebene prädiktive Codierung des Struktursignals durchgeführt. Das heißt, es wird die Differenz zwischen dem Objektblock und dem Prädiktionsblock durch das Subtrahierwerk 1260 ermittelt, diese Differenz wird dann nach einem Codierungsverfahren wie Quarter-Tree- oder Kettencodierung im Formcoder 1220 codiert, und das Codierungsergebnis wird an den Coder variabler Länge 1010 ausgegeben. Das codierte Formsignal aus dem Formcoder 1220 wird dann vom Formdecoder 1230 wiederhergestellt, und der wiederhergestellte Block und der Prädiktionsblock werden vom Addierwerk 1270 addiert, um einen reproduzierten Block zu erzeugen.
Der vom Addierwerk 1270 ausgegebene reproduzierte Block wird in der Einzelbild-Speichereinheit 1240 gespeichert. Im Prädiktionsbild-Generator 1250 wird ein dem Objektblock entsprechender Prädiktionsblock aus den in der Einzelbild-Speichereinheit 1240 gespeicherten Form-Informationen durch Bewegungskompensation aufgrund der nach einem festgelegten Bewegungserkennungsverfahren erkannten Bewegungs-Informationen erzeugt. Außerdem wird im Prädiktionsbild-Generator 1250 ein einzelnes reproduziertes Bild, das vor kurzem reproduziert worden ist und wichtige zu referenzierende Bilddaten aufweist, als Bezugsbild aus den in der Einzelbild-Speichereinheit 1240 gespeicherten reproduzierten Bildern aufgrund der aus dem Ausgangssignal der Blockungseinheit 1210 erhaltenen Bildgröße bestimmt.
Wenn die Vorrichtung den Formdetektor 1280 aufweist, kann die Bestimmung des Bezugsbilds durch Steuern der Einzelbild-Speichereinheit 1240 entsprechend dem Ausgangssignal vom Formdetektor 1280, d. h. den Informationen darüber, ob die Größe des zu referenzierenden reproduzierten Bilds Null ist oder nicht, erfolgen. In diesem Fall wird der reproduzierte Block in den Formdetektor 1280 eingegeben, wo die Form-Erkennung durchgeführt wird. Unterstellt man beispielsweise, dass das Formsignal ein Binärsignal ist, so sind keine reproduzierten Daten vorhanden, wenn es nur schwarze Daten zwischen weißen und schwarzen Daten als Formdaten gibt. Zu diesem Zeitpunkt gibt es kein Struktursignal, das dem Formsignal dieses Blocks entspricht. In diesem Fall werden, wie vorstehend beschrieben, ein Flag, das „keine codierten Daten" anzeigt, oder Daten, die „Bildgröße ist Null" anzeigen, vom Formdetektor 1280 an die Einzelbild-Speichereinheiten 1140 und 1240 und den Coder variabler Länge 1010 ausgegeben. In den Einzelbild-Speichereinheiten 1140 und 1240 wird die Steuerung entsprechend dem Ausgangssignal vom Formdetektor 1280 ähnlich wie die Steuerung der Einzelbild-Speichereinheit 309 durch das Steuergerät 320 gemäß der ersten Ausführungsform durchgeführt.
Wie vorstehend beschrieben, wird gemäß der siebenten Ausführungsform in der Codierungseinheit 1100 (1200) ein einzelnes reproduziertes Signal, das vor kurzem reproduziert worden ist und wichtige zu referenzierende Bilddaten aufweist, als Bezugsbild aus den in der Einzelbild-Speichereinheit 1140 (1240) gespeicherten reproduzierten Bildern entsprechend der aus dem Ausgangssignal der Blockungseinheit 1110 (1210) erhaltenen Bildgröße bestimmt. Wenn mehrere Objekte, die ein Bild darstellen, kompressionscodiert und objektweise gesendet werden, wird vermieden, dass ein Bild mit veränderlicher Größe, das bereits verschwunden ist, als Bezugsbild für die prädiktive Codierung verwendet wird, sodass eine zweckmäßige prädiktive Codierung durchgeführt wird, die das Restsignal (Differenzsignal) unterdrücken kann. Außerdem können die codierten Daten, die mit der Vorrichtung zur prädiktiven Bildcodierung gemäß der siebenten Ausführungsform erhalten werden, von der Vorrichtung zur prädiktiven Bilddecodierung gemäß der zweiten Ausführungsform fehlerfrei decodiert werden.
Wenn die Vorrichtung den Formdetektor 1280 aufweist, wird die Bestimmung, ob ein dem eingegebenen Objektblock entsprechendes Bezugsbild vorhanden ist oder nicht, durch Erkennen der Form des reproduzierten Blocks des Formsignals in der Formcodierungseinheit 1200 durchgeführt. Wenn der reproduzierte Block keine Form hat, wird im Strukturcoder und Formcoder ein Prädiktionsblock unter Verwendung eines reproduzierten Blocks, der vor kurzem reproduziert worden ist und eine Form hat, anstatt unter Verwendung des dem Objektblock entsprechenden reproduzierten Blocks erzeugt.
Wenn mehrere Objekte, die ein Bild darstellen, kompressionscodiert und objektweise gesendet werden, wird vermieden, dass ein Bild mit veränderlicher Größe, das bereits verschwunden ist, als Bezugsbild für die prädiktive Codierung verwendet wird, sodass eine zweckmäßige prädiktive Codierung durchgeführt wird. Außerdem können in diesem Fall die codierten Daten, die mit der Vorrichtung zur prädiktiven Bildcodierung gemäß der siebenten Ausführungsform erhalten werden, von der Vorrichtung zur prädiktiven Bilddecodierung gemäß der zweiten Ausführungsform fehlerfrei decodiert werden. Das heißt, in der Vorrichtung zur prädiktiven Bilddecodierung steuert der Daten-Analysator 302 die Einzelbild-Speichereinheit 309 aufgrund des Ausgangssignals vom Formdetektor 1280. Wenn daher codierte Daten, die durch objektweise prädiktive Codierung erhalten werden, decodiert werden, wird vermieden, dass ein Bild mit veränderlicher Größe, das bereits verschwunden ist, als Bezugsbild für die prädiktive Decodierung verwendet wird, sodass eine zweckmäßige prädiktive Decodierung durchgeführt wird.
Bei der siebenten Ausführungsform wird die Auswahl des reproduzierten Bilds als Bezugsbild durch den Prädiktionsbild-Generator 1150 (1250) oder die Steuerung der Einzelbild-Speichereinheit 1140 (1240) entsprechend dem Ergebnis der Form-Erkennung in der gleichen Weise wie die Auswahl des reproduzierten Bilds als Bezugsbild durch den Prädiktionsbild-Generator 1150 (1250) bzw. die Steuerung der Einzelbild-Speichereinheit 309 durch das Steuergerät 320 gemäß der ersten Ausführungsform durchgeführt. Die vorliegende Erfindung ist jedoch nicht darauf beschränkt.
Wenn es beispielsweise keine zu referenzierenden Bilddaten in einem Einzelbild vor dem Objekt-Einzelbild gibt, kann ein Prädiktionsbild mit einem vorgegebenen Wert erzeugt werden, wie bei der dritten Ausführungsform beschrieben. In diesem Fall wird als Vorrichtung zur prädiktiven Bilddecodierung, die der Vorrichtung zur prädiktiven Bildcodierung entspricht, eine Vorrichtung verwendet, die die prädiktive Bilddecodierung gemäß der dritten Ausführungsform durchführt.
Die Prädiktion gemäß der siebenten Ausführungsform kann eine Zweirichtungsprädiktion sein, wie bei der fünften Ausführungsform beschrieben. In diesem Fall wird als Vorrichtung zur prädiktiven Bilddecodierung, die der Vorrichtung zur prädiktiven Bildcodierung entspricht, eine Vorrichtung verwendet, die die prädiktive Bilddecodierung gemäß der fünften Ausführungsform durchführt.

Claims

Verfahren zur prädiktiven Bilddecodierung zum Decodieren von Objektbilddaten, die durch Kompressionscodierung eines Objektbilds mit veränderlicher Größe erhalten werden, mit dem Schritt (S804, S805 in 8) Erzeugen eines Prädiktions-Objektbilds unter Verwendung, als Bezugsobjektbild, mindestens eines reproduzierten Objektbilds, das vor einem Ziel-Objektbild, das das Ziel der Decodierung ist, reproduziert worden ist, wobei das Ziel-Objektbild prädiktiv decodiert wird, dadurch gekennzeichnet, dass das Prädiktions-Objektbild unter Verwendung mindestens eines reproduzierten Objektbilds, das vor kurzem reproduziert worden ist und wichtige zu referenzierende Objektbilddaten aufweist (S805), erzeugt wird und die Objektbilddaten ein Flag (F) aufweisen, das anzeigt, ob die Objektbilddaten wichtige Objektbilddaten aufweisen oder nicht.
Vorrichtung zur prädiktiven Bilddecodierung nach Anspruch 1, dadurch gekennzeichnet, dass das Prädiktions-Objektbild unter Verwendung mindestens eines von zwei vor kurzem reproduzierten Objektbildern (214, 215) als Bezugsobjektbild erzeugt wird, wobei das eine Objektbild (214) wichtige zu referenzierende Objektbilddaten aufweist.
Vorrichtung zur prädiktiven Bilddecodierung nach Anspruch 1, dadurch gekennzeichnet, dass das Prädiktions-Objektbild unter Verwendung nur eines Rückwärts-Bezugsobjektbilds mit veränderlicher Größe erzeugt wird, wenn festgestellt wird, dass die Größe eines Vorwärts-Bezugsobjektbilds mit veränderlicher Größe Null ist und die Größe des Rückwärts-Bezugsobjektbilds mit veränderlicher Größe nicht Null ist (S606), das Prädiktions-Objektbild unter Verwendung nur des Vorwärts-Bezugsobjektbilds mit veränderlicher Größe erzeugt wird, wenn festgestellt wird, dass die Größe des Vorwärts-Bezugsobjektbilds mit veränderlicher Größe nicht Null ist und die Größe des Rückwärts-Bezugsobjektbilds mit veränderlicher Größe Null ist (S608), und das Prädiktions-Objektbild unter Verwendung sowohl des Vorwärts- als auch des Rückwärts-Bezugsobjektbilds mit veränderlicher Größe erzeugt wird, wenn festgestellt wird, dass weder die Größe des Vorwärts- noch die des Rückwärts-Bezugsobjektbilds mit veränderlicher Größe Null ist (S609).