DE69816342T2

DE69816342T2 - Prädiktives Bilddekodierungsverfahren

Info

Publication number: DE69816342T2
Application number: DE69816342T
Authority: DE
Inventors: Choong Seng Boon
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp
Priority date: 1997-04-09
Filing date: 1998-04-07
Publication date: 2004-05-27
Anticipated expiration: 2018-04-08
Also published as: EP1079634B1; US6459813B1; EP1065883A2; BR9801156A; DE69815922D1; TW395136B; EP0871336A2; DE69834959T2; EP1079634A1; ES2203383T3; IN192209B; ES2202678T3; KR19980081235A; DE69834959D1; US6633678B2; EP0871336B1; EP1322122A1; US6370276B2; ES2265531T3; DE69824896D1

Description

Gebiet der Erfindung
Die vorliegende Erfindung betrifft die prädiktive Bilddecodierung und die prädiktive Bildcodierung und insbesondere Verfahren und Vorrichtungen zur prädiktiven Bilddecodierung, Verfahren und Vorrichtungen zur prädiktiven Bildcodierung und Datenspeichermedien, die zur Verarbeitung von Bildern mit veränderlicher Größe verwendet werden.
Hintergrund der Erfindung
Um ein digitales Bild mit hoher Effizienz zu speichern oder zu übertragen, muss es kompressionscodiert werden. Ein typisches Verfahren zur Kompressionscodierung digitaler Bilder ist das durch JPEG (Joint Photographic Experts Group; Gemeinsame Fachgruppe Fotografie) und MPEG (Moving Picture Experts Group; Fachgruppe Film) vertretene DCT-Verfahren (Discrete Cosine Transformation; Diskrete Kosinustransformation). Darüber hinaus gibt es Wellenform-Codierungsverfahren wie Codierung mit unterteilten Bändern, Wavelet-Codierung und Fraktal-Codierung. Um ein redundantes Signal zwischen Bildern zu eliminieren, wird eine Interbild-Prädiktion durch Bewegungskompensation durchgeführt und das Differenzsignal wird Wellenform-codiert.
Hier wird ein auf der Bewegungskompensations-DCT beruhendes MPEG-Verfahren beschrieben. Zunächst wird ein Eingangsbild eines zu codierenden Einzelbilds in mehrere Makroblöcke mit einer Größe von jeweils 16 × 16 Pixeln unterteilt. Jeder Makroblock wird weiter in vier Blöcke mit einer Größe von jeweils 8 × 8 Pixeln unterteilt, und jeder Block von 8 × 8 Pixeln wird DCT-transformiert und quantisiert. Dieses Verfahren heißt Intrabild-Codierung.
Mit einem Verfahren der Bewegungserkennung, wie Block-Abgleich, aus einem Einzelbild, das vorübergehend an ein Objektbild mit einem zu quantisierenden Objekt-Makroblock angrenzt, wird der Prädiktions-Makroblock mit dem kleinsten Fehler aus dem Objekt-Makroblock erkannt und aufgrund der erkannten Bewegung wird die Bewegungskompensation aus dem letzten Bild durchgeführt, um so einen optimalen Prädiktionsblock zu erhalten. Ein Signal, das die Bewegung zu dem Prädiktionsblock mit dem kleinsten Fehler anzeigt, ist ein Bewegungsvektor. Ein Bild, das als Bezug für die Erzeugung des Prädiktions-Makroblocks verwendet wird, wird nachstehend als Bezugsbild bezeichnet. Danach wird die Differenz zwischen den Objektblock und dem entsprechenden Prädiktionsblock ermittelt, und diese Differenz wird DCT-transformiert, um den DCT-Koeffizienten zu erhalten. Der DCT-Koeffizient wird quantisiert und die quantisierten Ausgangsdaten werden zusammen mit den Bewegungs-Informationen übertragen oder gespeichert. Dieses Verfahren heißt Bild-zu-Bild-Codierung.
Die Bild-zu-Bild-Codierung hat zwei Prädiktionsmodi: Prädiktion aus einem vorhergehenden Bild in der Reihenfolge der Anzeige und Prädiktion sowohl aus vorhergehenden als auch künftigen Bildern. Der erstgenannte Modus wird als Vorwärtsprädiktion und der letztgenannte als Zweirichtungsprädiktion bezeichnet.
Decoderseitig wird nach dem Zurückführen des quantisierten DCT-Koeffizienten zum ursprünglichen Differenzsignal der Prädiktionsblock auf der Grundlage des Differenzsignals und des Bewegungsvektors erhalten, und der Prädiktionsblock und das Differenzsignal werden addiert, um das Bild zu reproduzieren. Bei diesem herkömmlichen Verfahren wird vorausgesetzt, dass die Größe des Bezugsbilds (eines Bilds, das als Bezug zur Erzeugung eines Prädiktionsbilds dient) gleich der Größe des Objektbilds ist.
In den letzten Jahren sind mehrere Objekte, die ein Bild (Bild beliebiger Form) darstellen, getrennt kompressionscodiert und übertragen worden, um dadurch die Codierungsleistung zu verbessern und eine objektweise Reproduktion zu ermöglichen. Bei der Codierung und Decodierung dieser Bilder beliebiger Form ändert sich die Größe des Bilds sehr häufig. So wird ein Ball immer kleiner, bis er schließlich ganz verschwindet. Außerdem kommt es vor, dass die Größe des Bilds (Objekts) Null wird.
Bei der normalen prädiktiven Codierung ist ein Bezugsbild ein reproduziertes Bild kurz vor einem Objektbild, das gerade verarbeitet wird. Wenn die Größe des Bezugsbilds. Null ist, da nichts in dem Bezugsbild definiert ist, d. h. da das Bezugsbild keine signifikanten Bilddaten hat, die zur prädiktiven Codierung zu verwenden sind, kann keine prädiktive Codierung durchgeführt werden. In diesem Fall gibt es außer der Intrabild-Codierung keine herkömmliche Methode. In der Regel erhöht jedoch die Intrabild-Codierung die Menge der codierten Daten und senkt die Kompressionsleistung. Wenn ein Bild verschwindet (Bildgröße = Null) und in einer Folge von Laufbildern häufig erscheint, wird die Codierungsleistung erheblich verschlechtert. Wenn beispielsweise bei einem Blitzlicht-Laufbild das Licht in Bild-Einheiten verschwindet und wieder erscheint, müssen alle Bilder des Lichts Intrabild-codiert werden.
Das Dokument US-A-5.510.840 beschreibt eine Bewegungsvektor-Erkennungsschaltung, die den Bewegungsvektor für jeden Makroblock zwischen einem ungeraden und einem geraden Feld erkennt. Eine Codierungssystem-Bestimmungsschaltung bestimmt aufgrund des Zentralwerts eines Bewegungsvektors die Art des Codierungssystems, das heißt, ob das Codierungssystem ein feldgestütztes Codierungssystem oder ein Einzelbild-gestütztes Codierungssystem ist. Eine Steuerschaltung steuert Gatter und Umschalter entsprechend der Art des Codierungssystems, die von der Bestimmungsschaltung bestimmt wird, zum Erzeugen eines feldgestützten Bezugsbilds oder eines Einzelbild-gestützten Bezugsbilds aus Pufferspeichern. Die Schaltungen von einem additiven Knoten bis zu einer VLC-Schaltung finden Differenzdaten zwischen dem Bezugsbild und dem zu codierenden Bild und wandeln dabei die Differenzdaten durch diskrete Kosinus-Transformation und Codierung variabler Länge der umgewandelten Daten um. Die VLC-Schaltung setzt die Art des Codierungssystems als Flag in einem Kopf einer vorgegebenen hierarchischen Schicht eines Bitstroms. Ein Bilddaten-Decoder erkennt das Flag und führt die Decodierung durch Umschalten der feldgestützten Decodierung auf Einzelbild-gestützte Decodierung oder umgekehrt in Abhängigkeit von dem Flag zur Wiedergabe der Bilddaten durch.
Das Dokument DE 195.06.372 beschreibt ein Verfahren und eine Vorrichtung zur Berechnung der Zweirichtungsbewegung in einem Film-Codec-System niedriger Bitrate zum Filtern von Bewegungsvektoren durch Berechnen der Zweirichtungsbewegung in Einheiten von Objekten, die die gleiche Bewegung in einem Konstantenbereich haben, und zum Kompensieren der Bewegung mittels Bewegungsvektoren, die durch Vorwärts- oder Rückwärts-Prädiktion entsprechend dem Bewegungsprädiktionsmodus von vorher festgelegten Einzelbildern erzeugt werden, die den Bewegungsvektor genauer als der vorhandene Blockabgleich-Algorithmus bestimmen können und die Interbild-Bewegung mit einer geringeren Informationsmenge darstellen können. Daher werden weniger Daten für die Komprimierung gebraucht und die Qualität des rekonstruierten Bilds kann verbessert werden.
Das Dokument JP-A-08.154247 beschreibt einen Prozessor mit einem Fehlerdetektor, der Fehler in allen Komprimierungsdaten erkennt. Ein Fehlerprozessor ersetzt die Bilddaten, die den erkannten Fehlerdaten entsprechen, um die Qualitätsminderung des Einzelbilds zu minimieren, da Fehlerdaten sofort ersetzt werden.
Das Dokument JP-A-08.307875 beschreibt einen Detektor mit einem Einschreibadressengenerator (166), der eine Gruppe von x- und y-Adressen für jedes Pixel ausgibt. Die Ausgabe-Adressen sind so gestaltet, dass die Adressen gleich bleiben, während die x-Adressen wechselnden Speicherblöcken entsprechen, die zwei Speicherbereichen entsprechen. Diese Adressen entsprechen dann einer rechteckigen Fläche einer Seite. Wenn eine rechteckige Mindestfläche oder -seite mit der gleichen y-Adresse identifiziert wird, werden die Daten aus den beiden Speicherbereichen abwechselnd von aufeinanderfolgenden y-Adressen, die um 1 abweichen, gelesen.
Kurze Darstellung der Erfindung
Ziel der vorliegenden Erfindung ist es, ein Verfahren zur prädiktiven Bilddecodierung, zur Verfügung zu stellen, das eine effiziente prädiktive Decodierung eines Bilds veränderlicher Größe auch dann realisieren kann, wenn die Größe eines Bezugsbilds Null ist oder wenn das Bezugsbild völlig transparent ist. Dieses Verfahren ist in den beigefügten Ansprüchen definiert.
Weitere Ziele und Vorzüge der Erfindung dürften aus der nachstehenden detaillierten Beschreibung hervorgehen. Die detaillierte Beschreibung und die beschriebenen speziellen Ausführungsformen dienen nur der Erläuterung, da Fachleute anhand der detaillierten Beschreibung verschiedene Ergänzungen und Modifikationen innerhalb des Schutzumfangs der Erfindung erkennen dürften.
Kurze Beschreibung der Zeichnungen
1 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem Verfahren zur prädiktiven Bilddecodierung gemäß einer ersten Ausführungsform, die dem Verständnis der vorliegenden Erfindung dient.
Die 2(a) und 2(b) sind schematische Darstellungen zur Erläuterung der Bildprädiktion bei dem erfindungsgemäßen Verfahren zur prädiktiven Bilddecodierung.
3 ist ein Blockdiagramm, das eine Vorrichtung zur prädiktiven Bilddecodierung gemäß der ersten Ausführungsform zeigt.
4 ist ein Blockdiagramm, das eine Einzelbild-Speichereinheit zeigt, die in der Vorrichtung zur prädiktiven Bilddecodierung gemäß der ersten Ausführungsform verwendet wird.
7 ist ein Diagramm, das Bilddaten gemäß der ersten Ausführungsform zeigt.
8 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem prädiktiven Bilddecodierungsverfahren gemäß einer zweiten Ausführungsform der Erfindung.
9 ist ein Diagramm, das Bilddaten gemäß der zweiten Ausführungsform der Erfindung zeigt.
Detaillierte Beschreibung der bevorzugten Ausführungsformen
Ausführungsform 1
1 ist ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses bei einem prädiktiven Bilddecodierungsverfahren gemäß einer ersten Ausführungsform. Bevor 1 erläutert wird, wird ein Bildprädiktionsverfahren gemäß der ersten Ausführungsform anhand der 2(a) und 2(b) beschrieben.
Die Größe eines Eingangsbilds, das bei dem Verfahren zur prädiktiven Bilddecodierung der ersten Ausführungsform verwendet wird, ist veränderlich, und es kann passieren, dass die Größe Null wird.
2(a) zeigt Bilder 201 bis 210 eines Laufbilds, die in der Reihenfolge der Anzeige angeordnet sind. Das Bild 201 ist das erste anzuzeigende Einzelbild, an das sich 202, 203 ... anschließen, und diese Reihenfolge ist durch #1 bis #10 dargestellt. Da das Bild #1 (201) das erste Bild ist, wird es Intrabild-codiert. Bei der ersten Ausführungsform wird ein Bild (ein Einzelbild) in mehrere Blöcke unterteilt, die jeweils eine Größe von 8 × 8 Pixeln haben, und jeder Block von 8 × 8 Pixeln wird DCT-transformiert und quantisiert. Der quantisierte Koeffizient wird einer Codierung variabler Länge unterzogen. Bei der Decodierung werden die durch die Codierung variabler Länge erhaltenen codierten Daten einer Decodierung variabler Länge unterzogen, und der durch die Decodierung variabler Länge erhaltene quantisierte Koeffizient wird einer Rückquantisierung und Rück-DCT unterzogen, wodurch das Bild reproduziert wird. Dann wird das Bild #2 (202) einer prädiktiven Bild-zu-Bild-Codierung durch Verweisen auf das reproduzierte Bild #1 (201) unterzogen.
Bei der ersten Ausführungsform wird mittels Block-Abgleichs als Bewegungserkennungsvertahren der Prädiktionsblock mit dem kleinsten Fehler aus dem Objektblock, der gerade verarbeitet wird, aus dem Bild #1 (201) erkannt. Aufgrund der erkannten Bewegung vom Objektblock zum Prädiktionsblock wird durch Bewegungskompensation des Objektblocks aus dem reproduzierten Bild #1 (201) ein optimaler Prädiktionsblock erhalten. Danach wird die Differenz zwischen dem Objektblock und dem entsprechenden Prädiktionsblock ermittelt und DCT-transformiert. Der DCT-Koeffizient wird quantisiert und der quantisierte Ausgabewert wird zusammen mit den Bewegungs-Informationen übertragen oder gespeichert. Das reproduzierte Bild #1 (201) dient als Bezugsbild für das Bild #2 (202). Diese Prädiktion wird als Vorwärtsprädiktion bezeichnet. Bei der Decodierung wird der Prädiktionsblock zu der der Rückquantisierung und Rück-DCT unterzogenen Differenz addiert, wodurch das Bild reproduziert wird.
In ähnlicher Weise werden das Bild #3 (203) und das Bild #4 (204) unter Verwendung der durch Pfeile gekennzeichneten Bezugsbilder prädiktiv codiert. Wie bei den Bildern #6 (206), #8 (208) und #10 (210) kann die Prädiktion vom vorletzten Bild erfolgen. Im Gegensatz zur Vorwärtsprädiktion kann die Prädiktion wie bei den Bildern #5 (205), #7 (207) und #9 (209) durch Verweisen auf ein künftiges Bild erfolgen, das nach dem Objektbild angezeigt werden soll. Diese Prädiktion wird als Rückwärtsprädiktion bezeichnet. Wenn sowohl die Vorwärts- als auch die Rückwärtsprädiktion durchgeführt werden, handelt es sich um eine Zweirichtungsprädiktion. Die Zweirichtungsprädiktion hat drei Modi: Vorwärtsprädiktionsmodus, Rückwärtsprädiktionsmodus, Interpolationsmodus zur Herstellung des Gleichgewichts von Vorwärts- und Rückwärtsprädiktion.
2(b) zeigt die Übertragungsreihenfolge, d. h. die Decodierungsreihenfolge, der Bilder, die wie in 2(a) gezeigt vorhergesagt wurden.
Das Bild #1 (211) wird zuerst decodiert und reproduziert. Durch Verweisen auf das reproduzierte Bild #1 wird das Bild #2 (212) decodiert. Bei den Zweirichtungsprädiktionsbildern wie beim Bild #5 (216) müssen die für die Prädiktion verwendeten Bezugsbilder vor dem Prädiktionsbild decodiert und reproduziert werden. Daher wird das Bild #6 (215) vor dem Bild #5 (216) decodiert. Ebenso werden die Bilder #8 (217) und #10 (219) vor den Bildern #7 (218) bzw. #9 (220) übertragen, decodiert und reproduziert.
Bei der Übertragung eines Bilds mit veränderlicher Größe muss die Größe des Bilds übertragen werden. Bei der ersten Ausführungsform wird die Bildgröße am Kopf der codierten Daten des Bilds angegeben und die horizontale Größe Hm und die vertikale Größe Vm werden jeweils durch 20 Bit dargestellt. 7 zeigt die gemäß der ersten Ausführungsform codierten Bilddaten (VD), die außer der horizontalen Größe Hm und vertikalen Größe Vm auch den Bewegungsvektor, die Quantisierungsbreite und den DCT-Koeffizienten aufweisen.
Nachstehend wird der Prädiktionsbild-Erzeugungsprozess bei dem Verfahren zur prädiktiven Bilddecodierung gemäß der ersten Ausführungsform beschrieben.
Um ein Prädiktionsbild zu erzeugen, wird zunächst die Größe des vorhergehenden Bezugsbilds eingegeben (Schritt 102), und es wird geprüft, ob die Größe des Bezugsbilds Null ist oder nicht (Schritt 103).
Bei der in 2(b) gezeigten Decodierungsreihenfoige ist stets ein Bezugsbild vor einem zu decodierenden Bild vorhanden (bei der Codierung ein Codierungsobjekt). Das heißt, das Bezugsbild ist das zuletzt reproduzierte Bild beim Verfahren der prädiktiven Decodierung der ersten Ausführungsform. Beispielsweise ist in 2(b) das Bild #3 (213) ein Bezugsbild für das Bild #4 (214). Ein durch Zweirichtungsprädiktion reproduziertes Bild kann jedoch nicht zur Prädiktion verwendet werden, sodass dieses Bild kein Bezugsbild sein kann. Daher ist beispielsweise das Bild #6 (215) ein Bezugsbild für das Bild #8 (217).
Wenn im Schritt 103 entschieden wird, dass die Größe des Bezugsbilds nicht Null ist, folgt Schritt 104, in dem ein Prädiktionsbild unter Verwendung des Bezugsbilds erzeugt wird. Wenn jedoch im Schritt 103 entschieden wird, dass die Größe des Bezugsbilds Null ist, folgt Schritt 105, in dem ein Prädiktionsbild unter Verwendung eines vor kurzem reproduzierten Bilds, dessen Größe nicht Null ist, als Bezugsbild erzeugt wird. Die Methode zur Erkennung eines vor kurzem reproduzierten Bilds, dessen Größe nicht Null ist, wird nachstehend anhand von 2(b) beschrieben.
Wenn ein Prädiktionsbild des Bilds #4 (214) erzeugt wird, wird unterstellt, dass die Größe des Bilds #3 (213) unmittelbar vor dem Bild #4 (214) Null ist und die Größe des Bilds #2 nicht Null ist. In diesem Fall wird durch Verweisen auf das Bild #2 (212) ein Prädiktionsbild des Bilds #4 (214) erzeugt. Genauso wird bei der Erzeugung eines Prädiktionsbilds des Bilds #6 (215) in der Annahme, dass die Größe der Bilder #3 (213) und #4 (214) Null ist, das Prädiktionsbild durch Verweisen auf das Bild #2 (212) erzeugt. Die erste Ausführungsform verwendet die blockweise Bewegungskompensation als Verfahren zur Erzeugung eines Prädiktionsbilds, wie MPEG 1.
3 ist ein Blockdiagramm, das eine Vorrichtung zur prädiktiven Bilddecodierung 300 gemäß der ersten Ausführungsform zeigt.
Die Vorrichtung zur prädiktiven Bilddecodierung 300 empfängt Bilddaten, die durch Kompressionscodierung eines Bilds mit veränderlicher Größe nach einem vorgeschriebenen Verfahren erhalten werden, und führt die prädiktive Decodierung der Bilddaten durch.
Die Vorrichtung zur prädiktiven Bilddecodierung 300 weist einen Daten-Analysator 302, eine Decoder 303 und ein Addierwerk 306 auf. Der Daten-Analysator 302 analysiert die kompressionscodierten Bilddaten und gibt die Quantisierungsbreite und den DCT-Koeffizienten an die Leitung 312, den Bewegungsvektor an die Leitung 318 und die Bildgröße an die Leitung 321 aus. Der Decoder 303 wandelt die komprimierten Blockdaten (komprimierter Block) aus dem Daten-Analysator 302 durch Daten-Expansion in einen expandierten Block um. Das Addierwerk 306 addiert den expandierten Block und den Prädiktionsblock, um einen reproduzierten Block zu erzeugen.
Die Vorrichtung zur prädiktiven Bilddecodierung 300 weist außerdem eine Einzelbild-Speichereinheit 309 und einen Prädiktionsbild-Generator 310 auf. Die Einzelbild-Speichereinheit 309 speichert den reproduzierten Block. Der Prädiktionsbild-Generator 310 erzeugt eine Adresse zum Zugreifen auf die Einzelbild-Speichereinheit 309 aufgrund des Bewegungsvektors und erhält als Prädiktionsblock einen Block, der der Adresse aus dem in der Einzelbild-Speichereinheit 309 gespeicherten Bild entspricht. Bei der ersten Ausführungsform bestimmt der Prädiktionsbild-Generator 310 als Bezugsbild ein einziges reproduziertes Bild, das vor kurzem reproduziert worden ist und wichtige zu referenzierende Bilddaten aufweist, aufgrund der Bildgröße vom Daten-Analysator 302. Die Bestimmung des Bezugsbilds kann, wie in 3 durch Strichlinien dargestellt ist, mit einem Steuergerät 320 erfolgen, das die Einzelbild-Speichereinheit 309 entsprechend der Bildgröße vom Daten-Analysator 302 steuert. Das heißt, die Einzelbild-Speichereinheit 309 wird vom Steuergerät 320 so gesteuert, dass sie ein einzelnes reproduziertes Bild wählt, das vor kurzem reproduziert worden ist und wichtige zu referenzierende Bilddaten aufweist.
Der Decoder 303 weist einen Rückquantisierer (IQ) 304, der den komprimierten Block aus dem Daten-Analysator 302 rückquantisiert, und einen diskreten Kosinus-Rücktransformator (nachstehend als IDCT bezeichnet) 305 auf, der die Ausgangssignale vom Rückquantisierer 304 einer Rück-DCT (Transformation eines Frequenzbereichssignals in ein Raumbereichssignal) unterzieht.
Die Bezugssymbole 301 und 307 bezeichnen das Eingabe- bzw. Ausgabeterminal der Vorrichtung zur prädiktiven Bilddecodierung 300.
Nachstehend wird die Funktionsweise der in 3 gezeigten. Vorrichtung zur prädiktiven Bilddecodierung beschrieben.
Zunächst werden Bilddaten (codierte Daten), die durch Kompressionscodierung eines Bilds mit veränderlicher Größe nach einem festgelegten Verfahren erhalten werden, in das Eingabeterminal 301 eingegeben. Bei der ersten Ausführungsform erfolgt die Kompressionscodierung durch Bewegungskompensations-DCT wie bei MPEG1, sodass die codierten Daten den Bewegungsvektor, die Quantisierungsbreite, den DCT-Koeffizienten und die Bildgrößendaten umfassen.
Dann werden im Daten-Analysator 302 die kompressionscodierten Bilddaten analysiert und die Quantisierungsbreite und der DCT-Koeffizient werden als komprimierte Blockdaten über die Leitung 312 an den Decoder 303 gesendet. Außerdem wird der im Daten-Analysator 302 analysierte Bewegungsvektor über die Leitung 318 an den Prädiktionsbild-Generator 310 gesendet. Ebenso wird die vom Daten-Analysator 302 analysierte Bildgröße über die Leitung 321 an das Steuergerät 320 gesendet.
Im Decoder 303 werden die komprimierten Blockdaten, d. h. der komprimierte Block, vom Rückquantisierer 304 und vom Rück-DCT-Transformator 305 expandiert, sodass ein expandierter Block 314 entsteht. Genauer gesagt, rückquantisiert der Rückquantisierer 304 den komprimierten Block und der Rück-DCT-Transformator 305 transformiert das Frequenzbereichssignal in ein Raumbereichssignal, sodass der expandierte Block 314 entsteht. Im Prädiktionsbild-Generator 310 wird entsprechend dem über die Leitung 318 gesendeten Bewegungsvektor eine Adresse 321 zum Zugreifen auf die Einzelbild-Speichereinheit 309 erzeugt und in die Einzelbild-Speichereinheit 309 eingegeben. Dann wird aus den in der Einzelbild-Speichereinheit 309 gespeicherten Bildern ein Prädiktionsblock 317 erzeugt. Der Prädiktionsblock 317 (319) und der expandierte Block 314 werden in das Addierwerk 306 eingegeben, in dem die Blöcke 319 und 314 addiert werden, sodass ein reproduzierter Block 315 entsteht. Der reproduzierte Block 315 wird vom Ausgabeterminal 307 ausgegeben und wird gleichzeitig über die Leitung 316 gesendet und in der Einzelbild-Speichereinheit 309 gespeichert. Wenn die Intrabild-Decodierung durchgeführt wird, sind die Abtastwerte des Prädiktionsblocks alle Null.
Die Funktionsweise des Prädiktionsbild-Generators 310 ist mit der identisch, die bereits in Zusammenhang mit dem Ablaufdiagramm von 1 beschrieben wurde. Das heißt, die Größe des Bezugsbilds wird in den Prädiktionsbild-Generator 310 eingegeben, und der Prädiktionsbild-Generator 310 bestimmt das Bezugsbild. Die Bezugsbild-Bestimmung kann durch Steuern der Einzelbild-Speichereinheit 309 entsprechend den über das Steuergerät 320 und die Leitung 322 gesendeten Informationen darüber, ob die Größe des Bezugsbilds Null ist oder nicht, erfolgen.
4 ist ein Blockdiagramm, das eine Einzelbild-Speicherbank 406 als Beispiel für die Einzelbild-Speichereinheit 309 in der Vorrichtung zur prädiktiven Bilddecodierung 300 gemäß der ersten Ausführungsform zeigt. Die Einzelbild-Speicherbank 406 weist drei Einzelbild-Speicher 401 bis 403 auf. Das reproduzierte Bild wird in einem der Einzelbild-Speicher 401 bis 403 gespeichert. Bei der Erzeugung eines Prädiktionsbilds erfolgt der Zugriff auf die Einzelbild-Speicher 401 bis 403.
Bei der ersten Ausführungsform hat die Einzelbild-Speicherbank 406 Schalter 404 und 405. Der Schalter 405 soll einen Einzelbild-Speicher zum Speichern des reproduzierten Bilds wählen, das von den Einzelbild-Speichern 401 bis 403 über die Leitung 408. (entspricht der Leitung 316 in 3) eingegeben wird. Der Schalter 405 wählt nacheinander die Einzelbild-Speicher 401 bis 403, die vom Steuergerät 320, d. h. entsprechend dem Steuersignal 322, gesteuert werden. Das heißt, nachdem das erste reproduzierte Bild im Einzelbild-Speicher 401 gespeichert worden ist, wird das zweite reproduzierte Bild im Einzelbild-Speicher 402 gespeichert. Nachdem das dritte reproduzierte Bild im Einzelbild-Speicher 403 gespeichert worden ist, wählt der Schalter 405 den Einzelbild-Speicher 401. Der Schalter 404 ist über die Leitung 407 (entspricht der Leitung 317 in 3) mit dem Prädiktionsbild-Generator 310 verbunden. Dieser Schalter 404 wählt ebenfalls nacheinander die Einzelbild-Speicher 401 bis 403, die vom Steuergerät 320, d. h. entsprechend dem Steuersignal 322, gesteuert werden. Die Schaltfolge wird jedoch entsprechend der Größe des Bezugsbilds geändert. Obwohl zur Erzeugung eines Prädiktionsbilds entsprechend der vorgegebenen Reihenfolge beispielsweise der Schalter 404 mit dem Einzelbild-Speicher 402 verbunden werden muss, wenn die Bildgröße des Einzelbild-Speichers 402 Null ist, steuert das Steuergerät 320 den Schalter 404 so, dass der vorhergehende Einzelbild-Speicher 401 gewählt wird (unter der Voraussetzung, dass die Bildgröße des Einzelbild-Speichers 401 nicht Null ist). Auf diese Weise kann ein Prädiktionsbild aus einem Bezugsbild, dessen Größe nicht Null ist, erzeugt werden. Der Schalter 404 kann mit mehreren Einzelbild-Speichern gleichzeitig verbunden werden. Bei einer Einheit, bei der jeder Einzelbild-Speicher bei jeder Reproduktion eines einzelnen Bilds rückgesetzt wird, kann durch Steuern der Einheit mit dem Steuergerät 320 in einer Weise, dass der Einzelbild-Speicher nicht rückgesetzt wird, wenn die Größe des reproduzierten Bilds Null ist, ein vor kurzem reproduziertes Bild, dessen Größe nicht Null ist, im Einzelbild-Speicher bleiben. Mit anderen Worten, es ist möglich, eine Aktualisierung des Einzelbild-Speichers zu vermeiden.
Obwohl bei der ersten Ausführungsform das blockweise Bewegungskompensations-DCT-Verfahren beschrieben wird, kann die vorliegende Erfindung auch für andere Prädiktionsverfahren verwendet werden, die beispielsweise globale Bewegungskompensation oder arbiträre gitterförmige Block-Bewegungskompensation nutzen. Obwohl bei der ersten Ausführungsform ein Prädiktionsbild aus einem einzigen reproduzierten Bild, das als Bezugsbild dient, erzeugt wird, kann die vorliegende Erfindung ebenso für den Fall verwendet werden, wo ein Prädiktionsbild aus mehreren Bezugsbildern erzeugt wird.
Wie vorstehend beschrieben, wird gemäß der ersten Ausführungsform die Größe eines vorhergehenden Bezugsbilds ermittelt, die in die Vorrichtung eingegeben wird, und wenn die Größe des Bezugsbilds nicht Null ist, wird ein Prädiktionsbild unter Verwendung des Bezugsbilds erzeugt. Wenn jedoch die Größe des vorhergehenden Bezugsbilds Null ist, wird ein Prädiktionsbild unter Verwendung eines vor kurzem reproduzierten Bilds erzeugt, dessen Größe nicht Null ist. Wenn also mehrere Objekte, die ein Bild darstellen, kompressionscodiert und objektweise gesendet werden, um die Kompressionsleistung zu erhöhen, wird vermieden, dass ein Bild mit veränderlicher Größe, das bereits verschwunden ist, als Bezugsbild für die prädiktive Decodierung oder Codierung verwendet wird, was zu einer zweckmäßigen prädiktiven Decodierung oder Codierung führt, die das Restsignal (Differenzsignal) unterdrücken kann. Außerdem können die codierten Daten, die von der Vorrichtung zur prädiktiven Bildcodierung gemäß der ersten Ausführungsform erhalten werden, von der Vorrichtung zur prädiktiven Bilddecodierung gemäß der zweiten Ausführungsform fehlerfrei decodiert werden.
Ausführungsform 2
Bei der ersten Ausführungsform wird ermittelt, ob die Größe des Bezugsbilds Null ist oder nicht, und die Bezugsbild-Bestimmung erfolgt unter Verwendung der ermittelten Informationen. Wenn jedoch der Umstand, dass die Bildgröße Null ist, durch einen anderen Index (z. B. ein Ein-Bit-Flag F) dargestellt wird, kann die Steuerung mit diesem Index durchgeführt werden. Bei der zweiten Ausführungsform der Erfindung wird die Erzeugung des Prädiktionsbilds unter Verwendung dieses Indexes gesteuert.
Das heißt, bei der zweiten Ausführungsform, die in 9 dargestellt ist, weisen die codierten Daten eines Objektbilds ein Ein-Bit-Flag F auf, das anzeigt, dass die Bildgröße Null ist, d. h. das entsprechende Bezugsbild ist völlig transparent und hat keine codierten Daten, und dieses Flag F wird vor der die Bildgröße angebenden horizontalen und vertikalen Größe Hm und Vm gesetzt. Wenn die Bildgröße Null ist, ist das Flag F „0". Bei der zweiten Ausführungsform wird also die Erzeugung eines Prädiktionsbilds mit Hilfe des Flags F gesteuert.
Nachstehend wird ein Prädiktionsbild-Erzeugungsprozess bei dem Verfahren zur prädiktiven Bilddecodierung gemäß der zweiten Ausführungsform anhand des Ablaufdiagramms von 8 beschrieben.
Um ein Prädiktionsbild zu erzeugen, wird zunächst im Schritt 802 ein vorhergehendes Bezugsbild eingegeben, und im Schritt 803 wird geprüft, ob das Flag F des Bezugsbilds „1" ist oder nicht. Wenn im Schritt 803 entschieden wird, dass das Flag F des Bezugsbilds „1" ist, ist die Größe dieses Bezugsbilds nicht Null, d. h. das Bezugsbild ist nicht völlig transparent und es hat codierte Daten. Somit wird im Schritt 804 ein Prädiktionsbild unter Verwendung des vorhergehenden Bezugsbilds erzeugt.
Wenn jedoch im Schritt 803 entschieden wird, dass das Flag F des Bezugsbilds nicht „1" ist, folgt Schritt 805, in dem ein Prädiktionsbild unter Verwendung eines vor kurzem reproduzierten Bilds, dessen Flag F nicht „0" ist, als Bezugsbild erzeugt wird.
Wenn, wie vorstehend beschrieben, bei der zweiten Ausführungsform der Erfindung mehrere Objekte, die ein Bild darstellen, kompressionscodiert und dann objektweise gesendet werden, wird vermieden, dass ein Bild mit veränderlicher Größe, das bereits verschwunden ist, als Bezugsbild verwendet wird, was zu einer zweckmäßigen prädiktiven Decodierung oder Codierung führt, die das Restsignal (Differenzsignal) unterdrücken kann.
Außerdem haben die codierten Daten des Objektbilds an ihrem Kopf ein Flag, das anzeigt, ob das zuvor reproduzierte Bild wichtige zu referenzierende codierte Daten hat, und die Bezugsbild-Bestimmung erfolgt durch. Erkennen dieses Flags. Dadurch wird die Bestimmung des Bezugsbilds erleichtert.

Claims

Prädiktives Bilddecodierungsverfahren zum Decodieren von ersten codierten Daten (214), die durch Codierung eines Bilds erhalten werden, mit den Schritten Bestimmen (803), ob zweite codierte Daten (213), die in der Reihenfolge der Anzeige vor den ersten codierten Daten (214) kommen, codierte Bilddaten (VD) aufweisen; Erzeugen (804, 805) eines Prädiktionsbilds unter Verwendung eines reproduzierten Bilds, das den zweiten codierten Daten (213) entspricht, als Bezugsbild, wenn die zweiten codierten Daten (213) codierte Bilddaten (VD) aufweisen, und wenn die zweiten codierten Daten (213) keine codierten Bilddaten (VD) aufweisen, unter Verwendung eines reproduzierten Bilds, das dritten codierten Daten (212) entspricht, die codierte Bilddaten (VD) aufweisen und in der Reihenfolge der Anzeige vor den zweiten codierten Daten (213) kommen, als Bezugsbild; und Decodieren der ersten codierten Daten (214) durch prädiktive Decodierung unter Verwendung des erzeugten Prädiktionsbilds, dadurch gekennzeichnet, dass die Bestimmung aufgrund eines in den zweiten codierten Daten (213) enthaltenen Flags (Flag F) durchgeführt wird, wobei das Flag (Flag F) angibt, ob die zweiten codierten Daten (213) codierte Bilddaten (VD) aufweisen.
Prädiktives Bilddecodierungsverfahren nach Anspruch 1, dadurch gekennzeichnet, dass das Bild ein beliebig gestaltetes Objekt aufweist, dessen Größe variabel ist.