-
Gebiet der Erfindung
-
Die vorliegende Erfindung betrifft
die prädiktive
Bilddecodierung und die prädiktive
Bildcodierung und insbesondere Verfahren und Vorrichtungen zur prädiktiven
Bilddecodierung, Verfahren und Vorrichtungen zur prädiktiven
Bildcodierung und Datenspeichermedien, die zur Verarbeitung von
Bildern mit veränderlicher
Größe verwendet
werden.
-
Hintergrund
der Erfindung
-
Um ein digitales Bild mit hoher Effizienz
zu speichern oder zu übertragen,
muss es kompressionscodiert werden. Ein typisches Verfahren zur
Kompressionscodierung digitaler Bilder ist das durch JPEG (Joint
Photographic Experts Group; Gemeinsame Fachgruppe Fotografie) und
MPEG (Moving Picture Experts Group; Fachgruppe Film) vertretene DCT-Verfahren (Discrete
Cosine Transformation; Diskrete Kosinustransformation). Darüber hinaus
gibt es Wellenform-Codierungsverfahren wie Codierung mit unterteilten
Bändern,
Wavelet-Codierung und Fraktal-Codierung. Um ein redundantes Signal
zwischen Bildern zu eliminieren, wird eine Interbild-Prädiktion
durch Bewegungskompensation durchgeführt und das Differenzsignal
wird Wellenform-codiert.
-
Hier wird ein auf der Bewegungskompensations-DCT
beruhendes MPEG-Verfahren beschrieben. Zunächst wird ein Eingangsbild
eines zu codierenden Einzelbilds in mehrere Makroblöcke mit
einer Größe von jeweils
16 × 16
Pixeln unterteilt. Jeder Makroblock wird weiter in vier Blöcke mit
einer Größe von jeweils
8 × 8
Pixeln unterteilt, und jeder Block von 8 × 8 Pixeln wird DCT-transformiert
und quantisiert. Dieses Verfahren heißt Intrabild-Codierung.
-
Mit einem Verfahren der Bewegungserkennung,
wie Block-Abgleich, aus einem Einzelbild, das vorübergehend
an ein Objektbild mit einem zu quantisierenden Objekt-Makroblock angrenzt,
wird der Prädiktions-Makroblock
mit dem kleinsten Fehler aus dem Objekt-Makroblock erkannt und aufgrund
der erkannten Bewegung wird die Bewegungskompensation aus dem letzten
Bild durchgeführt,
um so einen optimalen Prädiktionsblock
zu erhalten. Ein Signal, das die Bewegung zu dem Prädiktionsblock
mit dem kleinsten Fehler anzeigt, ist ein Bewegungsvektor. Ein Bild,
das als Bezug für
die Erzeugung des Prädiktions-Makroblocks
verwendet wird, wird nachstehend als Bezugsbild bezeichnet. Danach
wird die Differenz zwischen den Objektblock und dem entsprechenden Prädiktionsblock
ermittelt, und diese Differenz wird DCT-transformiert, um den DCT-Koeffizienten zu
erhalten. Der DCT-Koeffizient wird quantisiert und die quantisierten
Ausgangsdaten werden zusammen mit den Bewegungs-Informationen übertragen
oder gespeichert. Dieses Verfahren heißt Bild-zu-Bild-Codierung.
-
Die Bild-zu-Bild-Codierung hat zwei
Prädiktionsmodi:
Prädiktion
aus einem vorhergehenden Bild in der Reihenfolge der Anzeige und
Prädiktion
sowohl aus vorhergehenden als auch künftigen Bildern. Der erstgenannte
Modus wird als Vorwärtsprädiktion und
der letztgenannte als Zweirichtungsprädiktion bezeichnet.
-
Decoderseitig wird nach dem Zurückführen des
quantisierten DCT-Koeffizienten zum ursprünglichen Differenzsignal der
Prädiktionsblock
auf der Grundlage des Differenzsignals und des Bewegungsvektors
erhalten, und der Prädiktionsblock
und das Differenzsignal werden addiert, um das Bild zu reproduzieren.
Bei diesem herkömmlichen
Verfahren wird vorausgesetzt, dass die Größe des Bezugsbilds (eines Bilds,
das als Bezug zur Erzeugung eines Prädiktionsbilds dient) gleich
der Größe des Objektbilds
ist.
-
In den letzten Jahren sind mehrere
Objekte, die ein Bild (Bild beliebiger Form) darstellen, getrennt kompressionscodiert
und übertragen
worden, um dadurch die Codierungsleistung zu verbessern und eine objektweise
Reproduktion zu ermöglichen.
Bei der Codierung und Decodierung dieser Bilder beliebiger Form ändert sich
die Größe des Bilds
sehr häufig.
So wird ein Ball immer kleiner, bis er schließlich ganz verschwindet. Außerdem kommt
es vor, dass die Größe des Bilds
(Objekts) Null wird.
-
Bei der normalen prädiktiven
Codierung ist ein Bezugsbild ein reproduziertes Bild kurz vor einem Objektbild,
das gerade verarbeitet wird. Wenn die Größe des Bezugsbilds Null ist,
da nichts in dem Bezugsbild definiert ist, d. h. da das Bezugsbild
keine signifikanten Bilddaten hat, die zur prädiktiven Codierung zu verwenden
sind, kann keine prädiktive
Codierung durchgeführt
werden. In diesem Fall gibt es außer der Intrabild-Codierung
keine herkömmliche Methode.
In der Regel erhöht
jedoch die Intrabild-Codierung die Menge der codierten Daten und
senkt die Kompressionsleistung. Wenn ein Bild verschwindet (Bildgröße = Null)
und in einer Folge von Laufbildern häufig erscheint, wird die Codierungsleistung
erheblich verschlechtert. Wenn beispielsweise bei einem Blitzlicht-Laufbild
das Licht in Bild-Einheiten
verschwindet und wieder erscheint, müssen alle Bilder des Lichts
Intrabild-codiert werden.
-
Der Beitrag „Object-oriented analysis
synthesis coding of moving images" („Objektorientierte Analysensynthesecodierung
von Laufbildern")
von N. G. Musmann et al., in Signal Processing: Image Communication,
XX, Jg. 1, 01.01.1989, S. 117–138, befasst
sich mit einem prädiktiven
Codierungsverfahren durch Teilen eines Bilds in die drei Parameter
Bewegung, Form und Farbe. Anstatt die übliche blockweise Codierung
zu verwenden, kann entsprechend D1 ein Bild, das ein Objekt enthält, effizienter
durch prädiktive
Codierung codiert werden. Wenn jedoch kleine Objekte codiert werden,
schaltet die Codermodussteuerung auf die Block-orientierte Codierung
zurück.
-
Kurze Darstellung der
Erfindung
-
Ziel der vorliegenden Erfindung ist
es, ein Verfahren und eine Vorrichtung zur prädiktiven Bilddecodierung, ein
Verfahren und eine Vorrichtung zur prädiktiven Bildcodierung und
ein Datenspeichermedium zur Verfügung
zu stellen, die eine effiziente prädiktive Codierung oder Decodierung
von Bildern mit veränderlicher
Größe auch
dann realisieren können, wenn
die Größe eines
Bezugsbilds Null ist oder wenn das Bezugsbild völlig transparent ist.
-
Weitere Ziele und Vorzüge der Erfindung dürften aus
der nachstehenden detaillierten Beschreibung hervorgehen. Die detaillierte
Beschreibung und die beschriebenen speziellen Ausführungsformen
dienen nur der Erläuterung,
da Fachleute anhand der detaillierten Beschreibung verschiedene
Ergänzungen
und Modifikationen innerhalb des Schutzumfangs der Erfindung erkennen
dürften.
-
Die vorliegende Erfindung betrifft
also ein Verfahren zur prädiktiven
Bilddecodierung und ein Verfahren zur prädiktiven Bildcodierung, die
in den beigefügten
Ansprüchen
definiert sind.
-
Kurze Beschreibung
der Zeichnungen
-
1 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem Verfahren zur prädiktiven
Bilddecodierung gemäß einer
ersten Ausführungsform,
die nicht Bestandteil der vorliegenden Erfindung ist.
-
Die 2(a) und 2(b) sind schematische Darstellungen
zur Erläuterung
der Bildprädiktion
bei dem erfindungsgemäßen Verfahren
zur prädiktiven Bilddecodierung.
-
3 ist
ein Blockdiagramm, das eine Vorrichtung zur prädiktiven Bilddecodierung gemäß der ersten
Ausführungsform
zeigt.
-
4 ist
ein Blockdiagramm, das eine Einzelbild-Speichereinheit zeigt, die
in der Vorrichtung zur prädiktiven
Bilddecodierung gemäß der ersten Ausführungsform
verwendet wird.
-
5 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem prädiktiven Bilddecodierungsverfahren
gemäß einer
dritten Ausführungsform,
die nicht Bestandteil der vorliegenden Erfindung ist.
-
6 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem prädiktiven Bilddecodierungsverfahren
gemäß einer
vierten Ausführungsform,
die nicht Bestandteil der vorliegenden Erfindung ist.
-
7 ist
ein Diagramm, das Bilddaten gemäß der ersten
Ausführungsform
zeigt.
-
8 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem prädiktiven Bilddecodierungsverfahren
gemäß einer
zweiten Ausführungsform
der Erfindung.
-
9 ist
ein Diagramm, das Bilddaten gemäß der zweiten
Ausführungsform
der Erfindung zeigt.
-
10 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem prädiktiven
Bilddecodierungsverfahren gemäß einer
fünften Ausführungsform,
die nicht Bestandteil der vorliegenden Erfindung ist.
-
11 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem prädiktiven
Bilddecodierungsverfahren gemäß einer
sechsten Ausführungsform
der Erfindung.
-
12 ist
Blockdiagramm, das eine Vorrichtung zur prädiktiven Bildcodierung gemäß einer
siebenten Ausführungsform
zeigt, die nicht Bestandteil der vorliegenden Erfindung ist.
-
Detaillierte
Beschreibung der bevorzugten Ausführungsformen
-
Ausführungsform 1
-
1 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem prädiktiven Bilddecodierungsverfahren
gemäß einer
ersten Ausführungsform,
die nicht Bestandteil der vorliegenden Erfindung ist. Bevor 1 erläutert wird, wird ein Bildprädiktionsverfahren
gemäß der ersten
Ausführungsform
anhand der 2(a) und 2(b) beschrieben.
-
Die Größe eines Eingangsbilds, das
bei dem Verfahren zur prädiktiven
Bilddecodierung der ersten Ausführungsform
verwendet wird, ist veränderlich, und
es kann passieren, dass die Größe Null
wird.
-
2(a) zeigt
Bilder 201 bis 210 eines Laufbilds, die in der
Reihenfolge der Anzeige angeordnet sind. Das Bild 201 ist
das erste anzuzeigende Einzelbild, an das sich 202, 203 ...
anschließen,
und diese Reihenfolge ist durch #1 bis #10 dargestellt. Da das Bild
#1 (201) das erste Bild ist, wird es Intrabild-codiert.
Bei der ersten Ausführungsform
wird ein Bild (ein Einzelbild) in mehrere Blöcke unterteilt, die jeweils
eine Größe von 8 × 8 Pixeln
haben, und jeder Block von 8 × 8
Pixeln wird DCT-transformiert und quantisiert. Der quantisierte
Koeffizient wird einer Codierung variabler Länge unterzogen. Bei der Decodierung
werden die durch die Codierung variabler Länge erhaltenen codierten Daten
einer Decodierung variabler Länge
unterzogen, und der durch die Decodierung variabler Länge erhaltene
quantisierte Koeffizient wird einer Rückquantisierung und Rück-DCT unterzogen,
wodurch das Bild reproduziert wird. Dann wird das Bild #2 (202)
einer prädiktiven Bild-zu-Bild-Codierung durch Verweisen
auf das reproduzierte Bild #1 (201) unterzogen.
-
Bei der ersten Ausführungsform
wird mittels Block-Abgleichs als Bewegungserkennungsverfahren der
Prädiktionsblock
mit dem kleinsten Fehler aus dem Objektblock, der gerade verarbeitet
wird, aus dem Bild #1 (201) erkannt. Aufgrund der erkannten
Bewegung vom Objektblock zum Prädiktionsblock
wird durch Bewegungskompensation des Objektblocks aus dem reproduzierten
Bild #1 (201) ein optimaler Prädiktionsblock erhalten. Danach
wird die Differenz zwischen dem Objektblock und dem entsprechenden
Prädiktionsblock
ermittelt und DCT-transformiert. Der DCT-Koeffizient wird quantisiert und der
quantisierte Ausgabewert wird zusammen mit den Bewegungs-Informationen übertragen oder
gespeichert. Das reproduzierte Bild #1 (201) dient als
Bezugsbild für
das Bild #2 (202). Diese Prädiktion wird als Vorwärtsprädiktion
bezeichnet. Bei der Decodierung wird der Prädiktionsblock zu der der Rückquantisierung
und Rück-DCT
unterzogenen Differenz addiert, wodurch das Bild reproduziert wird.
-
In ähnlicher Weise werden das Bild
#3 (203) und das Bild #4 (204) unter Verwendung
der durch Pfeile gekennzeichneten Bezugsbilder prädiktiv codiert.
Wie bei den Bildern #6 (206), #8 (208) und #10 (210)
kann die Prädiktion
vom vorletzten Bild erfolgen. Im Gegensatz zur Vorwärtsprädiktion
kann die Prädiktion
wie bei den Bildern #5 (205), #7 (207) und #9
(209) durch Verweisen auf ein künftiges Bild erfolgen, das
nach dem Objektbild angezeigt werden soll. Diese Prädiktion
wird als Rückwärtsprädiktion
bezeichnet. Wenn sowohl die Vorwärts-
als auch die Rückwärtsprädiktion
durchgeführt
werden, handelt es sich um eine Zweirichtungsprädiktion. Die Zweirichtungsprädiktion
hat drei Modi: Vorwärtsprädiktionsmodus,
Rückwärtsprädiktionsmodus,
Interpolationsmodus zur Herstellung des Gleichgewichts von Vorwärts- und
Rückwärtsprädiktion.
-
2(b) zeigt
die Übertragungsreihenfolge, d.
h. die Decodierungsreihenfolge, der Bilder, die wie in 2(a) gezeigt vorhergesagt
wurden.
-
Das Bild #1 (211) wird zuerst
decodiert und reproduziert. Durch Verweisen auf das reproduzierte Bild
#1 wird das Bild #2 (212) decodiert. Bei den Zweirichtungsprädiktionsbildern
wie beim Bild #5 (216) müssen die für die Prädiktion verwendeten Bezugsbilder
vor dem Prädiktionsbild
decodiert und reproduziert werden. Daher wird das Bild #6 (215)
vor dem Bild #5 (216) decodiert. Ebenso werden die Bilder
#8 (217) und #10 (219) vor den Bildern #7 (218) bzw.
#9 (220) übertragen,
decodiert und reproduziert.
-
Bei der Übertragung eines Bilds mit
veränderlicher
Größe muss
die Größe des Bilds übertragen
werden. Bei der ersten Ausführungsform
wird die Bildgröße am Kopf
der codierten Daten des Bilds angegeben und die horizontale Größe Hm und
die vertikale Größe Vm werden
jeweils durch 20 Bit dargestellt. 7 zeigt
die gemäß der ersten
Ausführungsform
codierten Bilddaten (VD), die außer der horizontalen Größe Hm und
vertikalen Größe Vm auch
den Bewegungsvektor, die Quantisierungsbreite und den DCT-Koeffizienten aufweisen.
-
Nachstehend wird der Prädiktionsbild-Erzeugungsprozess
bei dem Verfahren zur prädiktiven Bilddecodierung
gemäß der ersten
Ausführungsform beschrieben.
-
Um ein Prädiktionsbild zu erzeugen, wird
zunächst
die Größe des vorhergehenden
Bezugsbilds eingegeben (Schritt 102), und es wird geprüft, ob die Größe des Bezugsbilds
Null ist oder nicht (Schritt 103).
-
Bei der in 2(b) gezeigten Decodierungsreihenfolge
ist stets ein Bezugsbild vor einem zu decodierenden Bild vorhanden
(bei der Codierung ein Codierungsobjekt). Das heißt, das
Bezugsbild ist das zuletzt reproduzierte Bild beim Verfahren der
prädiktiven
Decodierung der ersten Ausführungsform.
Beispielsweise ist in 2(b) das
Bild #3 (213) ein Bezugsbild für das Bild #4 (214).
Ein durch Zweirichtungsprädiktion
reproduziertes Bild kann jedoch nicht zur Prädiktion verwendet werden, sodass
dieses Bild kein Bezugsbild sein kann. Daher ist beispielsweise das
Bild #6 (215) ein Bezugsbild für das Bild #8 (217).
-
Wenn im Schritt 103 entschieden
wird, dass die Größe des Bezugsbilds
nicht Null ist, folgt Schritt 104, in dem ein Prädiktionsbild
unter Verwendung des Bezugsbilds erzeugt wird. Wenn jedoch im Schritt 103 entschieden
wird, dass die Größe des Bezugsbilds
Null ist, folgt Schritt 105, in dem ein Prädiktionsbild
unter Verwendung eines vor kurzem reproduzierten Bilds, dessen Größe nicht
Null ist, als Bezugsbild erzeugt wird. Die Methode zur Erkennung eines
vor kurzem reproduzierten Bilds, dessen Größe nicht Null ist, wird nachstehend
anhand von 2(b) beschrieben.
-
Wenn ein Prädiktionsbild des Bilds #4 (214) erzeugt
wird, wird unterstellt, dass die Größe des Bilds #3 (213)
unmittelbar vor dem Bild #4 (214) Null ist und die Größe des Bilds
#2 nicht Null ist. In diesem Fall wird durch Verweisen auf das Bild
#2 (212) ein Prädiktionsbild
des Bilds #4 (214) erzeugt. Genauso wird bei der Erzeugung
eines Prädiktionsbilds
des Bilds #6 (215) in der Annahme, dass die Größe der Bilder
#3 (213) und #4 (214) Null ist, das Prädiktionsbild
durch Verweisen auf das Bild #2 (212) erzeugt. Die erste
Ausführungsform
verwendet die blockweise Bewegungskompensation als Verfahren zur
Erzeugung eines Prädiktionsbilds,
wie MPEG1. 3 ist ein
Blockdiagramm, das eine Vorrichtung zur prädiktiven Bilddecodierung 300 gemäß der ersten
Ausführungsform
zeigt.
-
Die Vorrichtung zur prädiktiven
Bilddecodierung 300 empfängt Bilddaten, die durch Kompressionscodierung
eines Bilds mit veränderlicher
Größe nach
einem vorgeschriebenen Verfahren erhalten werden, und führt die
prädiktive
Decodierung der Bilddaten durch.
-
Die Vorrichtung zur prädiktiven
Bilddecodierung 300 weist einen Daten-Analysator 302,
eine Decoder 303 und ein Addierwerk 306 auf. Der
Daten-Analysator 302 analysiert die kompressionscodierten
Bilddaten und gibt die Quantisierungsbreite und den DCT-Koeffizienten an
die Leitung 312, den Bewegungsvektor an die Leitung 318 und
die Bildgröße an die
Leitung 321 aus. Der Decoder 303 wandelt die komprimierten
Blockdaten (komprimierter Block) aus dem Daten-Analysator 302 durch
Daten-Expansion in einen expandierten Block um. Das Addierwerk 306 addiert
den expandierten Block und den Prädiktionsblock, um einen reproduzierten
Block zu erzeugen.
-
Die Vorrichtung zur prädiktiven
Bilddecodierung 300 weist außerdem eine Einzelbild-Speichereinheit 309 und
einen Prädiktionsbild-Generator 310 auf.
Die Einzelbild-Speichereinheit 309 speichert
den reproduzierten Block. Der Prädiktionsbild-Generator 310 erzeugt
eine Adresse zum Zugreifen auf die Einzelbild-Speichereinheit 309 aufgrund
des Bewegungsvektors und erhält
als Prädiktionsblock
einen Block, der der Adresse aus dem in der Einzelbild-Speichereinheit 309 gespeicherten
Bild entspricht. Bei der ersten Ausführungsform bestimmt der Prädiktionsbild-Generator 310 als
Bezugsbild ein einziges reproduziertes Bild, das vor kurzem reproduziert
worden ist und wichtige zu referenzierende Bilddaten aufweist, aufgrund
der Bildgröße vom Daten-Analysator 302.
Die Bestimmung des Bezugsbilds kann, wie in 3 durch Strichlinien dargestellt ist,
mit einem Steuergerät 320 erfolgen,
das die Einzelbild-Speichereinheit 309 entsprechend der
Bildgröße vom Daten-Analysator 302 steuert.
Das heißt, die
Einzelbild-Speichereinheit 309 wird vom Steuergerät 320 so
gesteuert, dass sie ein einzelnes reproduziertes Bild wählt, das
vor kurzem reproduziert worden ist und wichtige zu referenzierende
Bilddaten aufweist.
-
Der Decoder 303 weist einen
Rückquantisierer
(IQ) 304, der den komprimierten Block aus dem Daten-Analysator 302 rückquantisiert,
und einen diskreten Kosinus-Rücktransformator
(nachstehend als IDCT bezeichnet) 305 auf, der die Ausgangssignale vom
Rückquantisierer 304 einer
Rück-DCT
(Transformation eines Frequenzbereichssignals in ein Raumbereichssignal)
unterzieht.
-
Die Bezugssymbole 301 und 307 bezeichnen
das Eingabe- bzw. Ausgabeterminal der Vorrichtung zur prädiktiven
Bilddecodierung 300.
-
Nachstehend wird die Funktionsweise
der in 3 gezeigten Vorrichtung
zur prädiktiven
Bilddecodierung beschrieben.
-
Zunächst werden Bilddaten (codierte
Daten), die durch Kompressionscodierung eines Bilds mit veränderlicher
Größe nach
einem festgelegten Verfahren erhalten werden, in das Eingabeterminal 301 eingegeben.
Bei der ersten Ausführungsform
erfolgt die Kompressionscodierung durch Bewegungskompensations-DCT
wie bei MPEG1, sodass die codierten Daten den Bewegungsvektor, die
Quantisierungsbreite, den DCT-Koeffizienten und die Bildgrößendaten
umfassen.
-
Dann werden im Daten-Analysator 302 die kompressionscodierten
Bilddaten analysiert und die Quantisierungsbreite und der DCT-Koeffizient
werden als komprimierte Blockdaten über die Leitung 312 an
den Decoder 303 gesendet. Außerdem wird der im Daten-Analysator 302 analysierte
Bewegungsvektor über
die Leitung 318 an den Prädiktionsbild-Generator 310 gesendet.
Ebenso wird die vom Daten-Analysator 302 analysierte Bildgröße über die Leitung 321 an
das Steuergerät 320 gesendet.
-
Im Decoder 303 werden die
komprimierten Blockdaten, d. h. der komprimierte Block, vom Rückquantisierer 304 und
vom Rück-DCT-Transformator 305 expandiert,
sodass ein expandierter Block 314 entsteht. Genauer gesagt,
rückquantisiert
der Rückquantisierer 304 den
komprimierten Block und der Rück-DCT-Transformator 305 transformiert
das Frequenzbereichssignal in ein Raumbereichssignal, sodass der
expandierte Block 314 entsteht. Im Prädiktionsbild-Generator 310 wird
entsprechend dem über die
Leitung 318 gesendeten Bewegungsvektor eine Adresse 321 zum
Zugreifen auf die Einzelbild-Speichereinheit 309 erzeugt
und in die Einzelbild-Speichereinheit 309 eingegeben. Dann
wird aus den in der Einzelbild-Speichereinheit 309 gespeicherten
Bildern ein Prädiktionsblock 317 erzeugt.
Der Prädiktionsblock 317 (319)
und der expandierte Block 314 werden in das Addierwerk 306 eingegeben,
in dem die Blöcke 319 und 314 addiert
werden, sodass ein reproduzierter Block 315 entsteht. Der
reproduzierte Block 315 wird vom Ausgabeterminal 307 ausgegeben
und wird gleichzeitig über
die Leitung 316 gesendet und in der Einzelbild-Speichereinheit 309 gespeichert.
Wenn die Intrabild-Decodierung durchgeführt wird, sind die Abtastwerte
des Prädiktionsblocks
alle Null.
-
Die Funktionsweise des Prädiktionsbild-Generators 310 ist
mit der identisch, die bereits in Zusammenhang mit dem Ablaufdiagramm
von 1 beschrieben wurde.
Das heißt,
die Größe des Bezugsbilds
wird in den Prädiktionsbild-Generator 310 eingegeben,
und der Prädiktionsbild-Generator 310 bestimmt
das Bezugsbild. Die Bezugsbild-Bestimmung kann durch Steuern der
Einzelbild-Speichereinheit 309 entsprechend den über das
Steuergerät 320 und
die Leitung 322 gesendeten Informationen darüber, ob
die Größe des Bezugsbilds
Null ist oder nicht, erfolgen.
-
4 ist
ein Blockdiagramm, das eine Einzelbild-Speicherbank 406 als
Beispiel für
die Einzelbild-Speichereinheit 309 in der Vorrichtung zur
prädiktiven
Bilddecodierung 300 gemäß der ersten
Ausführungsform
zeigt. Die Einzelbild-Speicherbank 406 weist drei Einzelbild-Speicher 401 bis 403 auf.
Das reproduzierte Bild wird in einem der Einzelbild-Speicher 401 bis 403 gespeichert.
Bei der Erzeugung eines Prädiktionsbilds
erfolgt der Zugriff auf die Einzelbild-Speicher 401 bis 403.
-
Bei der ersten Ausführungsform
hat die Einzelbild-Speicherbank 406 Schalter 404 und 405.
Der Schalter 405 soll einen Einzelbild-Speicher zum Speichern
des reproduzierten Bilds wählen,
das von den Einzelbild-Speichern 401 bis 403 über die
Leitung 408 (entspricht der Leitung 316 in 3) eingegeben wird. Der
Schalter 405 wählt
nacheinander die Einzelbild-Speicher 401 bis 403,
die vom Steuergerät 320,
d. h. entsprechend dem Steuersignal 322, gesteuert werden.
Das heißt,
nachdem das erste reproduzierte Bild im Einzelbild-Speicher 401 gespeichert worden
ist, wird das zweite reproduzierte Bild im Einzelbild-Speicher 402 gespeichert.
Nachdem das dritte reproduzierte Bild im Einzelbild-Speicher 403 gespeichert
worden ist, wählt
der Schalter 405 den Einzelbild-Speicher 401.
Der Schalter 404 ist über
die Leitung 407 (entspricht der Leitung 317 in 3) mit dem Prädiktionsbild-Generator 310 verbunden.
Dieser Schalter 404 wählt
ebenfalls nacheinander die Einzelbild-Speicher 401 bis 403,
die vom Steuergerät 320,
d. h. entsprechend dem Steuersignal 322, gesteuert werden.
Die Schaltfolge wird jedoch entsprechend der Größe des Bezugsbilds geändert. Obwohl zur
Erzeugung eines Prädiktionsbilds
entsprechend der vorgegebenen Reihenfolge beispielsweise der Schalter 404 mit
dem Einzelbild-Speicher 402 verbunden werden muss, wenn
die Bildgröße des Einzelbild-Speichers 402 Null
ist, steuert das Steuergerät 320 den
Schalter 404 so, dass der vorhergehende Einzelbild-Speicher 401 gewählt wird
(unter der Voraussetzung, dass die Bildgröße des Einzelbild-Speichers 401 nicht
Null ist). Auf diese Weise kann ein Prädiktionsbild aus einem Bezugsbild,
dessen Größe nicht
Null ist, erzeugt werden. Der Schalter 404 kann mit mehreren
Einzelbild-Speichern gleichzeitig verbunden werden. Bei einer Einheit,
bei der jeder Einzelbild-Speicher bei jeder Reproduktion eines einzelnen
Bilds rückgesetzt
wird, kann durch Steuern der Einheit mit dem Steuergerät 320 in
einer Weise, dass der Einzelbild-Speicher
nicht rückgesetzt
wird, wenn die Größe des reproduzierten
Bilds Null ist, ein vor kurzem reproduziertes Bild, dessen Größe nicht
Null ist, im Einzelbild-Speicher bleiben. Mit anderen Worten, es
ist möglich,
eine Aktualisierung des Einzelbild-Speichers zu vermeiden.
-
Obwohl bei der ersten Ausführungsform
das blockweise Bewegungskompensations-DCT-Verfahren beschrieben wird, kann
die vorliegende Erfindung auch für
andere Prädiktionsverfahren
verwendet werden, die beispielsweise globale Bewegungskompensation
oder arbiträre
gitterförmige
Block-Bewegungskompensation nutzen. Obwohl bei der ersten Ausführungsform
ein Prädiktionsbild
aus einem einzigen reproduzierten Bild, das als Bezugsbild dient,
erzeugt wird, kann die vorliegende Erfindung ebenso für den Fall
verwendet werden, wo ein Prädiktionsbild
aus mehreren Bezugsbildern erzeugt wird.
-
Wie vorstehend beschrieben, wird
gemäß der ersten
Ausführungsform
die Größe eines
vorhergehenden Bezugsbilds ermittelt, die in die Vorrichtung eingegeben
wird, und wenn die Größe des Bezugsbilds
nicht Null ist, wird ein Prädiktionsbild
unter Verwendung des Bezugsbilds erzeugt. Wenn jedoch die Größe des vorhergehenden
Bezugsbilds Null ist, wird ein Prädiktionsbild unter Verwendung
eines vor kurzem reproduzierten Bilds erzeugt, dessen Größe nicht
Null ist. Wenn also mehrere Objekte, die ein Bild darstellen, kompressionscodiert
und objektweise gesendet werden, um die Kompressionsleistung zu
erhöhen,
wird vermieden, dass ein Bild mit veränderlicher Größe, das
bereits verschwunden ist, als Bezugsbild für die prädiktive Decodierung oder Codierung
verwendet wird, was zu einer zweckmäßigen prädiktiven Decodierung oder Codierung
führt,
die das Restsignal (Differenzsignal) unterdrücken kann. Außerdem können die
codierten Daten, die von der Vorrichtung zur prädiktiven Bildcodierung gemäß der siebenten
Ausführungsform
erhalten werden, von der Vorrichtung zur prädiktiven Bilddecodierung gemäß der zweiten
Ausführungsform
fehlerfrei decodiert werden.
-
Ausführungsform 2
-
Bei der ersten Ausführungsform
wird ermittelt, ob die Größe des Bezugsbilds
Null ist oder nicht, und die Bezugsbild-Bestimmung erfolgt unter
Verwendung der ermittelten Informationen. Wenn jedoch der Umstand,
dass die Bildgröße Null
ist, durch einen anderen Index (z. B. ein Ein-Bit-Flag F) dargestellt wird,
kann die Steuerung mit diesem Index durchgeführt werden. Bei der zweiten
Ausführungsform
der Erfindung wird die Erzeugung des Prädiktionsbilds unter Verwendung
dieses Indexes gesteuert.
-
Das heißt, bei der zweiten Ausführungsform, die
in 9 dargestellt ist,
weisen die codierten Daten eines Objektbilds ein Ein-Bit-Flag F
auf, das anzeigt, dass die Bildgröße Null ist, d. h. das entsprechende
Bezugsbild ist völlig
transparent und hat keine codierten Daten, und dieses Flag F wird
vor der die Bildgröße angebenden
horizontalen und vertikalen Größe Hm und
Vm gesetzt. Wenn die Bildgröße Null
ist, ist das Flag F „0". Bei der zweiten
Ausführungsform
wird also die Erzeugung eines Prädiktionsbilds
mit Hilfe des Flags F gesteuert.
-
Nachstehend wird ein Prädiktionsbild-Erzeugungsprozess
bei dem Verfahren zur prädiktiven Bilddecodierung
gemäß der zweiten
Ausführungsform
anhand des Ablaufdiagramms von 8 beschrieben.
-
Um ein Prädiktionsbild zu erzeugen, wird
zunächst
im Schritt 802 ein vorhergehendes Bezugsbild eingegeben, und im
Schritt 803 wird geprüft,
ob das Flag F des Bezugsbilds „1" ist oder nicht.
Wenn im Schritt 803 entschieden wird, dass das Flag F des Bezugsbilds „1" ist, ist die Größe dieses
Bezugsbilds nicht Null, d. h. das Bezugsbild ist nicht völlig transparent
und es hat codierte Daten. Somit wird im Schritt 804 ein Prädiktionsbild
unter Verwendung des vorhergehenden Bezugsbilds erzeugt.
-
Wenn jedoch im Schritt 803 entschieden wird,
dass das Flag F des Bezugsbilds nicht „1" ist, folgt Schritt 805, in
dem ein Prädiktionsbild
unter Verwendung eines vor kurzem reproduzierten Bilds, dessen Flag
F nicht „0" ist, als Bezugsbild
erzeugt wird.
-
Wenn, wie vorstehend beschrieben,
bei der zweiten Ausführungsform
der Endung mehrere Objekte, die ein Bild darstellen, kompressionscodiert und
dann objektweise gesendet werden, wird vermieden, dass ein Bild
mit veränderlicher
Größe, das
bereits verschwunden ist, als Bezugsbild verwendet wird, was zu
einer zweckmäßigen prädiktiven
Decodierung oder Codierung führt,
die das Restsignal (Differenzsignal) unterdrücken kann. Außerdem haben die
codierten Daten des Objektbilds an ihrem Kopf ein Flag, das anzeigt,
ob das zuvor reproduzierte Bild wichtige zu referenzierende codierte
Daten hat, und die Bezugsbild-Bestimmung erfolgt durch Erkennen dieses
Flags. Dadurch wird die Bestimmung des Bezugsbilds erleichtert.
-
Ausführungsform 3
-
5 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem Verfahren zur prädiktiven
Bilddecodierung gemäß einer
dritten Ausführungsform,
die nicht Bestandteil der vorliegenden Erfindung ist. Der Prädiktionsbild-Erzeugungsprozess
gemäß der dritten
Ausführungsform
ist im Wesentlichen mit dem gemäß der ersten
Ausführungsform
identisch, mit der Ausnahme, dass Schritt 505 in 5 an die Stelle von Schritt 105 in 1 tritt. Wenn das Bezugsbild
Null ist oder wenn es völlig transparent
ist (oder wenn das Flag F des Bilds „0" ist), wird im Schritt 505 ein Prädiktionsbild,
dem ein vorgegebener Wert zugewiesen ist, d. h. ein Prädiktionsbild
mit einem vorgegebenen Wert, erzeugt.
-
Bei der dritten Ausführungsform
wird unterstellt, dass das Prädiktionsbild
grau ist, d. h., dass sowohl sein Leuchtdichte-Signalwert als auch
sein Farbdifferenzsignalwert 128 sind. Dadurch wird bei der
Codierung der graue Block von dem zu codierenden Block subtrahiert.
Bei der Decodierung wird der graue Block zu dem zu decodierenden
Block addiert. Der vorgenannte vorgegebene Wert kann variabel sein
und vom Coder an den Decoder gesendet werden, um zur Erzeugung eines
Prädiktionsbilds
verwendet zu werden.
-
Wenn, wie vorstehend beschrieben,
bei der dritten Ausführungsform
mehrere Objekte, die ein Bild darstellen, kompressionscodiert und
dann objektweise gesendet werden, wird vermieden, dass ein Bild
mit veränderlicher
Größe, das
bereits verschwunden ist, als Bezugsbild verwendet wird, was zu
einer zweckmäßigen prädiktiven
Decodierung oder Codierung führt,
die das Restsignal (Differenzsignal) unterdrücken kann. Außerdem wird,
wenn die Größe des Bezugsbilds
Null ist, d. h. wenn das Bezugsbild völlig transparent ist, ein Prädiktionsbild
mit einem vorgegebenen Wert erzeugt. Dadurch wird außer den
Wirkungen, die mit der ersten Ausführungsform erzielt werden,
auch die Erzeugung des Prädiktionsbilds
erleichtert.
-
Ausführungsform 4
-
10 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem Verfahren zur prädiktiven
Bilddecodierung gemäß einer
vierten Ausführungsform,
die nicht Bestandteil der vorliegenden Erfindung ist. Der Prädiktionsbild-Erzeugungsprozess
gemäß der vierten
Ausführungsform
ist im Wesentlichen mit dem Prozess gemäß der zweiten Ausführungsform
identisch, mit der Ausnahme, dass Schritt 1005 in 10 an die Stelle von Schritt 805 in 8 tritt. Wenn das Flag F
des Bezugsbilds „0" ist, wird im Schritt 1005 ein
Prädiktionsbild,
dem ein vorgegebener Wert zugewiesen ist, d. h. ein Prädiktionsbild
mit einem vorgegebenen Wert, erzeugt.
-
Wenn bei der vierten Ausführungsform
mehrere Objekte, die ein Bild darstellen, kompressionscodiert und
dann objektweise gesendet werden, wird vermieden, dass ein Bild
mit veränderlicher
Größe, das
bereits verschwunden ist, als Bezugsbild verwendet wird, was zu
einer zweckmäßigen prädiktiven Decodierung
oder Codierung führt,
die das Restsignal (Differenzsignal) unterdrücken kann. Außerdem haben
die codierten Daten des Objektbilds an ihrem Kopf ein Flag, das
anzeigt, ob das zuvor reproduzierte Bild wichtige zu referenzierende
codierte Daten hat, und wenn festgestellt wird, dass dieses Flag „0" ist, wird ein Prädiktionsbild
mit dem vorgegebenen Wert erzeugt. Dadurch wird außer den
Wirkungen, die mit der zweiten Ausführungsform erzielt werden, auch
die Erzeugung des Prädiktionsbilds
erleichtert.
-
Ausführungsform 5
-
6 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem Verfahren zur prädiktiven
Bilddecodierung, das die Zweirichtungsprädiktion verwendet, gemäß einer
fünften
Ausführungsform,
die nicht Bestandteil der vorliegenden Erfindung ist. Nachstehend
wird die Zweirichtungsprädiktion
für den
Fall beschrieben, dass die Bezugsbildgröße Null ist, d. h. dass das
Bezugsbild völlig transparent
ist.
-
Zunächst werden im Schritt 602 die
Größen der
Vorwärts-
und Rückwärfs-Bezugsbilder eingegeben.
Das in 2(a) gezeigte
Bild #5 (205) ist ein Zweirichtungsprädiktionsbild, dessen Vorwärts- und Rückwärts-Bezugsbilder
die Bilder #4 (204) bzw. #6 (206) sind.
-
Wenn in den Schritten 603 und 604 entschieden
wird, dass die Größe der Vorwärts- und Rückwärts-Bezugsbilder
jeweils Null ist, wird im Schritt 605 ein Bild, dem ein vorgegebener
Wert zugewiesen ist, d. h. ein Bild mit einem vorgegebenen Wert,
als vorgegebener Wert erzeugt.
-
Wenn in den Schritten 603 und 604 entschieden
wird, dass die Größe des Vorwärts-Bezugsbilds Null
und die Größe des Rückwärts-Bezugsbilds
nicht Null ist, wird im Schritt 606 ein Prädiktionsbild unter Verwendung
nur des Rückwärts-Bezugsbilds
erzeugt.
-
Wenn in den Schritten 603 und 607 entschieden
wird, dass die Größe des Vorwärts-Bezugsbilds nicht
Null und die Größe des Rückwärts-Bezugsbilds Null
ist, wird im Schritt 608 ein Prädiktionsbild
unter Verwendung nur des Vorwärts-Bezugsbilds
erzeugt.
-
Wenn in den Schritten 603 und 607 entschieden
wird, dass die Größe der Vorwärts- und Rückwärts-Bezugsbilder
jeweils nicht Null ist, wird ein Prädiktionsbild unter Verwendung
dieser Bezugsbilder erzeugt.
-
Im Schritt 610 wird das
erzeugte Prädiktionsbild
ausgegeben. Bei Empfang des Prädiktionsbilds subtrahiert
der Coder das Prädiktionsbild
vom Objektbild, während
der Decoder das Prädiktionsbild
zur Differenz des Objektbilds addiert. Auf diese Weise kann das
Restsignal (Differenzsignal) unterdrückt werden.
-
In dem Fall, dass wie vorstehend
beschrieben bei der fünften
Ausführungsform
mehrere Objekte, die ein Bild darstellen, kompressionscodiert und objektweise
gesendet werden, wenn ein Prädiktionsbild
unter Verwendung von Vorwärts-
und Rückwärts-Bezugsbildern erzeugt
wird, wird vermieden, dass Bilder mit veränderlicher Größe, die
bereits verschwunden sind, als Bezugsbilder verwendet werden, was
zu einer zweckmäßigen prädiktiven
Decodierung oder Codierung führt,
die das Restsignal (Differenzsignal) unterdrücken kann. Da außerdem ein Prädiktionsbild
mit einem vorgegebenen Wert erzeugt wird, wird die Erzeugung des
Prädiktionsbilds erleichtert.
-
Ausführungsform 6
-
11 ist
ein Ablaufdiagramm eines Prädiktionsbild-Erzeugungsprozesses
bei einem Verfahren zur prädiktiven
Bilddecodierung, das die Zweirichtungsprädiktion verwendet, gemäß einer
sechsten Ausführungsform
der vorliegenden Erfindung. Die sechste Ausführungsform ist im Wesentlichen
mit der fünften
Ausführungsform
identisch, so wie die zweite mit der vierten Ausführungsform
und die erste mit der dritten Ausführungsform identisch ist. Genauer
gesagt, wird bei der sechsten Ausführungsform die Frage „Ist Größe Null?" in den Schritten 603, 604 und 607 in 6 in die Frage „Ist Flag
F 0?" in den Schritten 1103, 1104 und 1107 in 11 geändert.
-
In dem Fall, dass bei der sechsten
Ausführungsform
mehrere Objekte, die ein Bild darstellen, kompressionscodiert und
objektweise gesendet werden, wenn ein Prädiktionsbild unter Verwendung
von Vorwärts-
und Rückwärts-Bezugsbildern
erzeugt wird, wird vermieden, dass Bilder mit veränderlicher Größe, die
bereits verschwunden sind, als Bezugsbilder verwendet werden, was
zu einer zweckmäßigen prädiktiven
Decodierung oder Codierung führt,
die das Restsignal (Differenzsignal) unterdrücken kann. Wenn festgestellt
wird, dass das Flag F der Vorwärts- und
Rückwärts-Bezugsbilder
jeweils „0" ist, wird ein Prädiktionsbild
mit einem vorgegeben Wert erzeugt. Dadurch wird die Erkennung eines
Bilds mit veränderlicher
Größe, das
bereits verschwunden ist, erleichtert und die Erzeugung des Prädiktionsbilds
wird ebenfalls erleichtert.
-
Ausführungsform 7
-
12 ist
ein Blockdiagramm, das eine Vorrichtung zur prädiktiven Bildcodierung 1000 gemäß einer
siebenten Ausführungsform
zeigt, die nicht Bestandteil der vorliegenden Erfindung ist. Die
Codiervorrichtung 1000 weist eine Strukturcodierungseinheit 1100,
die die prädiktive
Codierung eines ein Leuchtdichtesignal und ein Farbdifferenzsignal
aufweisenden Struktursignals durchführt, und eine Formcodierungseinheit 1200 auf,
die die prädiktive Codierung
eines Formsignals durchführt.
-
Die Strukturcodierungseinheit 1100 weist eine
Blockungseinheit 1110, die ein Struktursignal je Einzelbild
in mehrere Makroblöcke
mit einer Größe von jeweils
16 × 16
Pixeln (eine zu codierende Einheit) teilt und ein geteiltes Struktursignal
ausgibt; ein Subtrahierwerk 1160, das die Differenz zwischen
einem Block, der ein Codierungsobjekt ist (nachstehend als Objektblock
bezeichnet) und einem dem Objektblock entsprechenden Prädiktionsblock
berechnet; einen Kompressionscoder 1120, der die Differenz
kompressionscodiert; und einen lokalen Decoder 1130 auf,
der das Ausgangssignal vom Kompressionscoder 1120 expansiv
decodiert. Der Kompressionscoder 1120 weist einen diskreten
Kosinustransformator (nachstehend als DCT bezeichnet) 1121, der
die diskrete Kosinustransformation (DCT) der Differenz durchführt, und
einen Quantisierer 1122 auf, der den DCT-Koeffizienten
quantisiert. Der lokale Decoder 1130 weist einen Rückquantisierer 1131,
der das Ausgangssignal vom Quantisierer 1122 rückquantisiert,
und einen diskreten Kosinus-Rücktransformator
(nachstehend als IDCT bezeichnet) 1132 auf, der die Rück-DCT (Transformation
eines Frequenzbereichssignals in ein Raumbereichssignal) des Ausgangssignals
vom Rückquantisierer 1131 durchführt.
-
Die Strukturcodierungseinheit 1100 weist
außerdem
ein Addierwerk 1170, das ein expandiertes Block-Ausgangssignal
vom IDCT 1132 und den Prädiktionsblock addiert, um einen
reproduzierten Block zu erzeugen; eine Einzelbild-Speichereinheit
(FM1) 1140, die den reproduzierten Block speichert; und
einen Prädiktionsbild-Generator 1150 auf,
der einen dem Objektblock entsprechenden Prädiktionsblock aus in der Einzelbild-Speichereinheit 1140 gespeicherten
Bildern durch Bewegungskompensation aufgrund der mit einem vorgegebenen
Bewegungserkennungsverfahren erkannten Bewegungs-Informationen erhält.
-
Der Prädiktionsbild-Generator 1150 bestimmt
ein Bezugsbild, das bei der Erzeugung eines Prädiktionsblocks (Prädiktionsbilds)
referenziert werden soll, aus den in der Einzelbild-Speichereinheit 1140 gespeicherten
Bildern aufgrund der aus dem Ausgangssignal der Blockungseinheit 1110 erhaltenen
Bildgröße.
-
Die Formcodierungseinheit 1200 weist
eine Blockungseinheit 1210, die ein Formsignal je Einzelbild
in mehrere Makroblöcke
mit einer Größe von jeweils
16 × 16
Pixeln (eine zu codierende Einheit) teilt und ein geteiltes Formsignal
ausgibt; ein Subtrahierwerk 1260, das die Differenz zwischen
einem Block, der ein Codierungsobjekt ist (Objektblock), und einem
dem Objektblock entsprechenden Prädiktionsblock berechnet; einen
Formcoder 1220, der die Differenz nach einem vorgegebenen
Codierungsverfahren codiert; und einen Formdecoder 1230 auf,
der das Ausgangssignal vom Formcoder 1220 nach einem dem
Codierungsverfahren entsprechenden Decodierungsverfahren decodiert.
Der Formcoder 1220 codiert das Ausgangssignal vom Subtrahierwerk 1260 nach
einem Codierungsverfahren wie Quarter-Tree- oder Kettencodierung.
-
Die Formcodierungseinheit 1200 weist
außerdem
ein Addierwerk 1270, das ein decodiertes Block-Ausgangssignal
vom Formdecoder 1230 und den Prädiktionsblock addiert, um einen
reproduzierten Block zu erzeugen; eine Einzelbild-Speichereinheit
(FM2) 1240, die das decodierte Block-Ausgangssignal vom
Addierwerk 1270 speichert; und einen Prädiktionsbild-Generator 1250 auf,
der einen dem Objektblock entsprechenden Prädiktionsblock aus den in der
Einzelbild-Speichereinheit 1240 gespeicherten Form-Informationen durch
Bewegungskompensation aufgrund der mit einem vorgegebenen Bewegungserkennungsverfahren
erkannten Bewegungs-Informationen erhält.
-
Der Prädiktionsbild-Generator 1250 bestimmt
ein Bezugsbild, das bei der Erzeugung eines Prädiktionsblocks (Prädiktionsbilds)
referenziert werden soll, aus den in der Einzelbild-Speichereinheit 1240 gespeicherten
Bildern aufgrund der aus dem Ausgangssignal der Blockungseinheit 1210 erhaltenen
Bildgröße.
-
Die Bestimmung des Bezugsbilds durch
die Codierungseinheit 1100 oder 1200 kann, wie
in 12 durch Strichlinien
dargestellt ist, durch Verwendung eines Formdetektors 1280,
der die Form-Erkennung aufgrund des reproduzierten Blocks durchführt, und
durch Steuern der Einzelbild-Speichereinheiten 1140 und 1240 entsprechend dem
vom Formdetektor 1280. ausgegebenen Ergebnis der Form-Erkennung
erfolgen. In diesem Fall ist die Steuerung der Einzelbild-Speichereinheiten
entsprechend dem Ergebnis der Form-Erkennung mit der Steuerung der
Einzelbild-Speichereinheit 309 durch das Steuergerät 320 gemäß der ersten
Ausführungsform
identisch. Das Ergebnis der Form-Erkennung wird für einen
nachstehend beschriebenen Coder variabler Länge 1010 verwendet und zusammen mit
den codierten Daten des Struktursignals und des Formsignals gesendet.
-
Die Vorrichtung zur prädiktiven
Bildcodierung 1000 weist außerdem einen Coder variabler Länge 1010
auf. Der Coder variabler Länge
1010 führt
die Codierung variabler Länge
des vom Strukturcoder 1100 ausgegebenen codierten Struktursignals
und des codierten Formsignals und des Ergebnisses der Form-Erkennung,
die vom Formcoder 1200 ausgegeben werden, durch und multiplext
diese auszugebenden Signale.
-
In 12 bezeichnet
das Bezugssymbol 1001 ein Eingabeterminal für das Struktursignal, 1002 bezeichnet
ein Eingabeterminal für
das Formsignal, und 1003 bezeichnet ein Ausgabeterminal
für die
codierten Daten.
-
Nachstehend wird die Funktionsweise
beschrieben.
-
Wenn ein Struktursignal (Leuchtdichte-/Farbdifferenzsignal)
und ein Formsignal in die Vorrichtung zur prädiktiven Bildcodierung 1000 eingegeben
werden, werden das Struktursignal und das Formsignal durch die in
den Codierungseinheiten 1100 und 1200 enthaltenen
Blockungseinheiten 1110 bzw. 1210 in Makroblöcke (zu
codierende Einheiten) geteilt und für jeden Makroblock wird die
prädiktive Codierung
durchgeführt.
-
In der Struktursignal-Codierungseinheit 1100 berechnet
das Subtrahierwerk 1160 die Differenz zwischen einem Objektblock
und einem Prädiktionsblock,
der DCT 1121 transformiert diese Differenz in einen DCT-Koeffizienten
und der Quantisierer 1122 quantisiert den DCT-Koeffizienten,
um einen quantisierten Koeffizienten zu erzeugen. Der quantisierte Koeffizient
wird an den Coder variabler Länge
1010 ausgegeben.
-
Der Rückquantisierer 1131 rückquantisiert den
quantisierten Koeffizienten, um einen DCT-Koeffizienten zu erzeugen,
und der IDCT 1130 transformiert den DCT-Koeffizienten in
einen dem Objektblock entsprechenden expandierten Block nach einem
Verfahren zur Transformation von Frequenzbereichsdaten in Raumbereichsdaten.
Das Addierwerk 1170 addiert den expandierten Block und
den Prädiktionsblock,
um einen reproduzierten Block zu erzeugen. Der reproduzierte Block
wird in der Einzelbild-Speichereinheit 1140 gespeichert.
Dabei erzeugt der Prädiktionsbild-Generator 1150 einen
dem Objektblock entsprechenden Prädiktionsblock aus den in der
Einzelbild-Speichereinheit 1140 gespeicherten Bildern durch
Bewegungskompensation aufgrund der nach einem festgelegten Bewegungserkennungsverfahren
erkannten Bewegungs-Informationen. Außerdem bestimmt der Prädiktionsbild-Generator 1150 als
Bezugsbild ein einzelnes reproduziertes. Bild, das vor kurzem reproduziert
worden ist und wichtige zu referenzierende Bilddaten enthält, aus den
in der Einzelbild-Speichereinheit 1140 gespeicherten Bildern.
Wenn die Vorrichtung den Formdetektor 1280 aufweist, kann
die Bestimmung des Bezugsbilds durch Steuern der Einzelbild-Speichereinheit 1140 entsprechend
dem Ausgangssignal vom Formdetektor 1280, d. h. den Informationen
darüber, ob
die Größe des zu
referenzierenden reproduzierten Bilds Null ist oder nicht, erfolgen.
-
Parallel zur Verarbeitung im Strukturcoder 1100 wird
im Formcoder 1200 die prädiktive Codierung des Formsignals ähnlich wie
die vorstehend beschriebene prädiktive
Codierung des Struktursignals durchgeführt. Das heißt, es wird
die Differenz zwischen dem Objektblock und dem Prädiktionsblock durch
das Subtrahierwerk 1260 ermittelt, diese Differenz wird
dann nach einem Codierungsverfahren wie Quarter-Tree- oder Kettencodierung
im Formcoder 1220 codiert, und das Codierungsergebnis wird
an den Coder variabler Länge
1010 ausgegeben. Das codierte Formsignal aus dem Formcoder 1220 wird dann
vom Formdecoder 1230 wiederhergestellt, und der wiederhergestellte
Block und der Prädiktionsblock
werden vom Addierwerk 1270 addiert, um einen reproduzierten
Block zu erzeugen.
-
Der vom Addierwerk 1270 ausgegebene
reproduzierte Block wird in der Einzelbild-Speichereinheit 1240 gespeichert.
Im Prädiktionsbild-Generator 1250 wird
ein dem Objektblock entsprechender Prädiktionsblock aus den in der
Einzelbild-Speichereinheit 1240 gespeicherten Form-Informationen
durch Bewegungskompensation aufgrund der nach einem festgelegten
Bewegungserkennungsverfahren erkannten Bewegungs-Informationen erzeugt.
Außerdem
wird im Prädiktionsbild-Generator 1250 ein
einzelnes reproduziertes Bild, das vor kurzem reproduziert worden
ist und wichtige zu referenzierende Bilddaten aufweist, als Bezugsbild
aus den in der Einzelbild-Speichereinheit 1240 gespeicherten
reproduzierten Bildern aufgrund der aus dem Ausgangssignal der Blockungseinheit 1210 erhaltenen
Bildgröße bestimmt.
-
Wenn die Vorrichtung den Formdetektor 1280 aufweist,
kann die Bestimmung des Bezugsbilds durch Steuern der Einzelbild-Speichereinheit 1240 entsprechend
dem Ausgangssignal vom Formdetektor 1280, d. h. den Informationen
darüber,
ob die Größe des zu
referenzierenden reproduzierten Bilds Null ist oder nicht, erfolgen.
In diesem Fall wird der reproduzierte Block in den Formdetektor 1280 eingegeben,
wo die Form-Erkennung durchgeführt wird.
Unterstellt man beispielsweise, dass das Formsignal ein Binärsignal
ist, so sind keine reproduzierten Daten vorhanden, wenn es nur schwarze
Daten zwischen weißen
und schwarzen Daten als Formdaten gibt. Zu diesem Zeitpunkt gibt
es kein Struktursignal, das dem Formsignal dieses Blocks entspricht. In
diesem Fall werden, wie vorstehend beschrieben, ein Flag, das „keine
codierten Daten" anzeigt,
oder Daten, die „Bildgröße ist Null" anzeigen, vom Formdetektor 1280 an
die Einzelbild-Speichereinheiten 1140 und 1240 und
den Coder variabler Länge
1010 ausgegeben. In den Einzelbild-Speichereinheiten 1140 und 1240 wird
die Steuerung entsprechend dem Ausgangssignal vom Formdetektor 1280 ähnlich wie
die Steuerung der Einzelbild-Speichereinheit 309 durch
das Steuergerät 320 gemäß der ersten Ausführungsform
durchgeführt.
-
Wie vorstehend beschrieben, wird
gemäß der siebenten
Ausführungsform
in der Codierungseinheit 1100 (1200) ein einzelnes
reproduziertes Signal, das vor kurzem reproduziert worden ist und
wichtige zu referenzierende Bilddaten aufweist, als Bezugsbild aus
den in der Einzelbild-Speichereinheit 1140 (1240)
gespeicherten reproduzierten Bildern entsprechend der aus dem Ausgangssignal
der Blockungseinheit 1110 (1210) erhaltenen Bildgröße bestimmt.
Wenn mehrere Objekte, die ein Bild darstellen, kompressionscodiert
und objektweise gesendet werden, wird vermieden, dass ein Bild mit
veränderlicher
Größe, das
bereits verschwunden ist, als Bezugsbild für die prädiktive Codierung verwendet
wird, sodass eine zweckmäßige prädiktive
Codierung durchgeführt
wird, die das Restsignal (Differenzsignal) unterdrücken kann.
Außerdem
können
die codierten Daten, die mit der Vorrichtung zur prädiktiven Bildcodierung
gemäß der siebenten
Ausführungsform
erhalten werden, von der Vorrichtung zur prädiktiven Bilddecodierung gemäß der zweiten
Ausführungsform
fehlerfrei decodiert werden.
-
Wenn die Vorrichtung den Formdetektor 1280 aufweist,
wird die Bestimmung, ob ein dem eingegebenen Objektblock entsprechendes
Bezugsbild vorhanden ist oder nicht, durch Erkennen der Form des
reproduzierten Blocks des Formsignals in der Formcodierungseinheit 1200 durchgeführt. Wenn
der reproduzierte Block keine Form hat, wird im Strukturcoder und
Formcoder ein Prädiktionsblock
unter Verwendung eines reproduzierten Blocks, der vor kurzem reproduziert
worden ist und eine Form hat, anstatt unter Verwendung des dem Objektblock
entsprechenden reproduzierten Blocks erzeugt.
-
Wenn mehrere Objekte, die ein Bild
darstellen, kompressionscodiert und objektweise gesendet werden,
wird vermieden, dass ein Bild mit veränderlicher Größe, das
bereits verschwunden ist, als Bezugsbild für die prädiktive Codierung verwendet
wird, sodass eine zweckmäßige prädiktive
Codierung durchgeführt
wird. Außerdem
können
in diesem Fall die codierten Daten, die mit der Vorrichtung zur
prädiktiven
Bildcodierung gemäß der siebenten
Ausführungsform
erhalten werden, von der Vorrichtung zur prädiktiven Bilddecodierung gemäß der zweiten
Ausführungsform
fehlerfrei decodiert werden. Das heißt, in der Vorrichtung zur
prädiktiven
Bilddecodierung steuert der Daten-Analysator 302 die Einzelbild-Speichereinheit 309 aufgrund
des Ausgangssignals vom Formdetektor 1280. Wenn daher codierte
Daten, die durch objektweise prädiktive
Codierung erhalten werden, decodiert werden, wird vermieden, dass
ein Bild mit veränderlicher
Größe, das
bereits verschwunden ist, als Bezugsbild für die prädiktive Decodierung verwendet
wird, sodass eine zweckmäßige prädiktive Decodierung
durchgeführt
wird.
-
Bei der siebenten Ausführungsform
wird die Auswahl des reproduzierten Bilds als Bezugsbild durch den
Prädiktionsbild-Generator 1150 (1250) oder
die Steuerung der Einzelbild-Speichereinheit 1140 (1240)
entsprechend dem Ergebnis der Form-Erkennung in der gleichen Weise
wie die Auswahl des reproduzierten Bilds als Bezugsbild durch den
Prädiktionsbild-Generator 1150 (1250)
bzw. die Steuerung der Einzelbild-Speichereinheit 309 durch das
Steuergerät 320 gemäß der ersten
Ausführungsform
durchgeführt.
Die vorliegende Erfindung ist jedoch nicht darauf beschränkt.
-
Wenn es beispielsweise keine zu referenzierenden
Bilddaten in einem Einzelbild vor dem Objekt-Einzelbild gibt, kann
ein Prädiktionsbild
mit einem vorgegebenen Wert erzeugt werden, wie bei der dritten
Ausführungsform
beschrieben. In diesem Fall wird als Vorrichtung zur prädiktiven
Bilddecodierung, die der Vorrichtung zur prädiktiven Bildcodierung entspricht,
eine Vorrichtung verwendet, die die prädiktive Bilddecodierung gemäß der dritten
Ausführungsform
durchführt.
-
Die Prädiktion gemäß der siebenten Ausführungsform
kann eine Zweirichtungsprädiktion
sein, wie bei der fünften
Ausführungsform
beschrieben. In diesem Fall wird als Vorrichtung zur prädiktiven
Bilddecodierung, die der Vorrichtung zur prädiktiven Bildcodierung entspricht,
eine Vorrichtung verwendet, die die prädiktive Bilddecodierung gemäß der fünften Ausführungsform
durchführt.