Gebiet der Technik
-
Diese Erfindung bezieht sich auf eine Bildkodiervorrichtung.
Stand der Technik
-
Die Bildkodiertechnik hat eine lange Geschichte. Ausgezeichnete Normenvorschläge
wie zum Beispiel ITU-T H261, ITU-T H263, ISO MPEG1/2 usw. sind aufgestellt worden.
Grob gesägt bestehen zwei Vorgehensweisen für Verfahren der Bildkodierung: ein
Kodierungsverfahren, das die orthogonale Transformation benutzt, und ein
Vorhersagekodierverfahren, bei dem die Abweichung von vorhergesagten Werten unter Verwendung der
Vorhersagefunktion kodiert wird.
-
Obwohl das Kodierverfahren, bei dem die orthogonale Transformation verwendet
wird, komplizierte Berechnungen erfordert, kann eine bessere Bildqualität als beim
Vorhersagekodierverfahren aufrechterhalten werden, wenn kodierte Signale kleiner Bitzahlen
gewonnen werden. Gewöhnliche Kodierverfahren, die die orthogonale Transformation
verwenden, wie zum Beispiel JPEG, MPEG und dergleichen, setzen die DCT (diskrete
Cosinus-Transformation) ein. Obwohl bekannt ist, dass die DCT eine Kodierung mit einer
kleinen Bitzahl ermöglicht, hat sie ihre eigenen Probleme, indem sie eine hochgenaue
Multiplikation verlangt, was zu komplizierten Berechnungen führt, und indem die
reversible Kodierung nicht möglich ist. Entsprechend kann eine DCT-Berechnung auf Gebieten,
auf denen Reversibilität erforderlich ist, nicht verwendet werden.
-
Im Gegensatz dazu verlangt das Vorhersage-Kodierverfahren einfache Berechnungen
und kann eine reversible Kodierung ausführen: Das bei Fax-Schreiben verwendete MMR
(Modified Modified Read) ist als ein Bildkodierverfahren bekannt, das Reversibilität
besitzt. MMR wird gemäss CCITT-Empfehlung T6 "Fax-Kodiersschemata und
Kodiersteuerfunktionen für Fax-Geräte der Gruppe 4" verwendet. Bei diesem Verfahren wird der
Differenzwert in der horizontalen Richtung zwischen den Änderungspunkten von
Pixelwerten auf der unmittelbar vorher bereits kodierten Abtastzeile und den Änderungspunkten
des Pixelwertes auf der noch nicht kodierten Abtastzeile mit variabler Länge kodiert.
MMMR (Modified MMR), das ein weiter verbessertes MMR ist, wird als das
Auswertemodell für MPEG4 verwendet (ISO/IEC/JTC/SC29/WG11 Nr. 1277, Juli 1996).
-
Übrigens kann ein Bild, wenn die Bildsignale in Objekte aufgetrennt und die Objekte
dann als willkürliche Formen verarbeitet werden, Objekt um Objekt behandelt und
zusammengesetzt werden, was zu effektiver Signalübermittlung führt. Bei Anwendungen, in
denen die Bitzahl beschränkt ist, ist es unter Verwendung solcher Information möglich,
wichtigen Objekten bei der Übermittlung und Aufzeichnung selektiv Priorität zuzuweisen.
Im Stande der Technik ist aber die Kodierung von Objekten willkürlicher Form nicht
berücksichtigt worden. Die Normierung der Kodierung von Bildsignalen willkürlicher
Formen ist in ISO MPEG4 vorangekommen. In MPEG4 wurde ein Auswertemodell unter
dem Namen VM3.0 geschaffen (abgedruckt in ISO/IEC/JTCl/SC29/WG11 Nr. 1277), das
nunmehr ein einzigartiges Bildkodierverfahren ist, das Bildsignale willkürlicher Form
kodieren kann.
-
Ein Bildsignal willkürlicher Form besteht normalerweise aus der Gestaltinformation,
die die Form eines Objekts anzeigt, und aus der Pixelwertinformation (Farbinformation),
die die Pixelwerte innerhalb eines Objekts darstellt. Was die Gestaltinformation betrifft,
wird entweder die zweiwertige Gestaltinformation, die anzeigt, ob ein Pixel signifikant (im
Inneren der Form) oder insignifikant (auf der Aussenseite der Form) ist, oder die
Transparenzinformation, die das Verhältnis angibt, wie stark das Objekt den Hintergrund
verdeckt, für die jeweiligen Pixel angegeben, die bei der Zusammensetzung mit anderen
Bildern verwendet werden. Wenn die Transparenz nur zwei Niveaus hat, nämlich 0% und
100%, ist die Gestaltinformation mit der Transparenzinformation identisch, und das Signal
für ein Bild von willkürlicher Form wird dann sowohl durch die zweiwertige
Gestaltinformation als auch durch die Pixelwertinformation dargestellt.
-
Fig. 53 ist eine Zeichnung, die diese Information erklärt. Die
Transparenzinformation ist eine Information, die darstellt, welches Verhältnis jedes Pixels für die
Zusammensetzung verwendet wird, wenn ein in Fig. 53(a) gezeigter Fisch mit dem anderen Bild
zusammengesetzt wird. In Fig. 53(b) ist der Wert der Transparenzinformation in der
waagerechten Abtastzeile durch eine gestrichelte Linie in der Figur angezeigt. Die Fläche
ausserhalb des Fisches ist vollkommen transparent. Hier wird Transparenz 0 der
Einfachheit halber als vollkommen transparent definiert. Daher hat ausserhalb des Fisches die
Transparenzinformation einen Wert von Null, während sie innerhalb des Fisches einen
Wert hat, der nicht Null ist.
-
Fig. 53(c) zeigt die Transparenz, die zweiwertig gemacht worden ist, indem sie die
beiden Werte Null und Nicht Null annimmt. In Fig. 53(c) verlangen die Pixel, die eine
Transparenz von nicht Null besitzen, eine Kodierung der Pixelwertinformation, während
die Pixel, die eine Transparenz von Null besitzen, keine Pixelwertinformation erfordern, so
dass die zweiwertige Transparenzinformation für die Kodierung der Pixelwertinformation
sehr wichtig ist. Andererseits ist die Komponente der Transparenzinformation, die nicht
durch zweiwertige Information dargestellt werden kann, wie in Fig. 53(d) gezeigt,
mehrwertige Information, die Graustufen genannt wird. Die Gestaltinformation, die, wie oben
beschrieben, durch mehrwertige Information dargestellt werden kann, kann ähnlich wie die
für die Pixelwertinformation durch Kurvenformkodierung behandelt werden.
-
Bei Durchführung von Bildkodierung werden auf räumlicher Korrelation und auf
zeitlicher Korrelation beruhende Intraframe-Kodierungen getrennt verwendet, und zwar
werden beide eingesetzt. In der Interframe-Kodierung wird die Bewegung in
geschlossenen Übertragungsblöcken erkannt, und Bewegungskompensation wird für die erkannte
Bewegung ausgeführt. Der Bewegungsvektor wird allgemein für die
Bewegungskompensation verwendet. In der oben erwähnten VM3.0 werden Intraframe-Kodierung und
Interframe-Kodierung Block um Block adaptiv gewechselt, und eine Bewegungskompensation
wird ähnlich wie in MPEG1/2 ausgeführt, wodurch die Kodierleistung verbessert wird.
-
Wenn eine Kodierung eines Bildes durchgeführt wird, das, wie oben beschrieben, aus
Gestaltinformation und aus Pixelwertinformation besteht, wird die Kodierleistung
gegenüber einer direkten Kodierung der Gestaltinformation weiter verbessert, wenn eine, die
Bewegung kompensierende Kodierung einer Gestaltinformation ausgeführt wird, indem
der Bewegungsvektor der Pixelwertinformation für die bei der Bildsynthese zu
verwendende Gestaltinformation verwendet wird. Darüber wird in ISO/IEC/JTC1/SC29/WG11,
Nr. 1260, März 1996, berichtet.
-
Bei der Bewegungserkennung und Bewegungskompensation wird weiter
angenommen, dass es zweckdienlich ist, wenn die Gestaltinformation in eine zweiwertige
Gestaltinformationskomponente und in eine mehrwertige Gestaltinformationskomponente
aufgetrennt wird, wobei die mehrwertige. Informationskomponente und die Pixelwertinformation
zusammen der gleichen Kurvenformkodierung unterworfen werden, was tatsächlich
ausgeübt worden ist.
-
In der oben beschriebenen Bildkodierung und dazugehörigen Bilddekodierung des
Standes der Technik bestehen die folgenden Probleme.
-
Obwohl die MMR-Kodierung ein repräsentatives Verfahren der oben beschriebenen
reversiblen (verlustlosen) Kodierung ist, ist es wegen der Reversibilität nicht möglich, die
Kompressionsrate stark zu verbessern, indem eine Herabsetzung der visuell weniger
wichtigen Bildqualität zugelassen wird.
-
Darüber hinaus ist MMR ein Intraframe-Kodierverfahren und berücksichtigt nicht die
Verbesserung der Kompressionsrate durch Einsatz der Interframe-Korrelation. In MMR
und in MMMR, das eine modifizierte Version von MMR ist, wird nur die Differenz
zwischen dem Änderungspunkt der derzeitigen Abtastzeile und dem Änderungspunkt der
unmittelbar vorausgehenden Abtastzeile eingesetzt, während die Redundanz durch die
Korrelation als gerade Linie in der Senkrechten nicht genügend beseitigt wird.
Entsprechend ist die Kodierleistung gut, wenn die Änderung des Pixelwertes entlang der
Abtastzeile eintritt, aber die Kodierleistung ist schlecht, wenn die Änderung des
Pixelwertes nicht entlang der Abtastzeile eintritt. MMR und MMMR beinhalten ferner den
waagerechten Kodiermodus, der die Korrelation in der Senkrechten überhaupt nicht
einsetzt, um die Pixel zu kodieren, die nicht als die Differenz des Änderungspunktes der
unmittelbar vorausgehenden Abtastzeile kodiert werden können. In diesem waagerechten
Kodiermodus bleibt Raum für eine weitere Verbesserung der Leistung durch Verwendung
der Korrelation in der Senkrechten.
-
Des Weiteren ist in MMR und MMMR des Standes der Technik eine hierarchische
Bildwiedergabe durch Dekodierung eines Teils des Bitstroms nicht möglich. Andere
Verfahren, in denen eine hierarchische Bildwiedergabe möglich ist, besitzen keine gute
Kodierleistung und weisen den Mangel auf, die kodierende Bitzahl zu erhöhen.
Entsprechend gibt es kein Kodierverfahren, das eine wirksame hierarchische Bildwiedergabe
ermöglicht.
-
Wenn ein Bild, das aus Gestaltinformation und Bildinformation besteht, durch
Bewegungskompensation kodiert wird, wird des Weiteren die Gestaltinformation unter
Verwendung des gleichen Bewegungsvektors bewegungskompensiert, der für die
Bildinformation des Standes der Technik verwendet wird. Wenn in einer solchen Situation aber
zum Beispiel eine Kugel rotiert, bewegt sich eine auf der Kugel gezeichnete Figur, obwohl
die Gestalt der Kugel sich nicht ändert, so dass der Bewegungsvektor der Bildinformation
nicht mit dem der Gestaltinformation identisch ist. In einem solchen Falle erfolgt daher
keine gute Kodierung, was ein Problem des Kodierverfahrens des Standes der Technik ist.
-
Weiter beruht, während in VM3.0 ein Verfahren vorliegt, das die Kodierleistung zu
verbessern sucht, indem Intraframe-Kodierung und Interframe-Kodierung Block um Block
adaptiv vertauscht werden, die. Beurteilung zuungunsten einer Intraframe- oder Interframe-
Kodierung ähnlich wie, beim adaptiven Wechsel in MPEG1/2 auf der
Pixelwertinformation, so dass es schwierig ist, die Gestaltinformation, sie sich in ihrer Natur weitgehend
von der Pixelwertinformation unterscheidet, geeignet und wirksam zu kodieren.
-
DE-A-41 36 636 beschreibt eine DCT-Kodiertechnik, bei der ein Videoobjekt in eine
rechteckige Fläche eingeschlossen ist.
-
Angesichts der oben beschriebenen Punkte wird diese Erfindung vorgeschlagen, und
es ist ein Ziel dieser Erfindung, eine Bilddekodiervorrichtung zur Verfügung zu stellen, die
das oben erwähnte, wirksam kodierte Signal in geeigneter Weise dekodieren kann.
Offenbarung der Erfindung
-
Somit betrifft die vorliegende Erfindung eine Bilddekodiervorrichtung, wie sie im
beigefügten Anspruch definiert wird.
Kurze Beschreibung der Zeichnungen
-
Fig. 22 ist ein Blockdiagramm, das die Struktur einer Bildkodiervorrichtung gemäss
einer ersten Ausführungsform zeigt, die keinen Teil dieser Erfindung bildet.
-
Fig. 23 ist ein Blockdiagramm, das die Struktur einer Bildkodiervorrichtung gemäss
einer zweiten Ausführungsform zeigt, die keinen Teil dieser Erfindung bildet.
-
Fig. 24 ist ein Blockdiagramm, das die Struktur einer Bildkodiervorrichtung gemäss
einer dritten Ausführungsform zeigt, die keinen Teil dieser Erfindung bildet.
-
Fig. 25 ist ein Blockdiagramm, das die Struktur einer Bilddekodiervorrichtung
gemäss einer vierten Ausführungsform zeigt, die keinen Teil dieser Erfindung bildet.
-
Fig. 26 ist ein Blockdiagramm, das die Struktur einer Bildkodiervorrichtung gemäss
einer fünften Ausführungsform zeigt, die keinen Teil dieser Erfindung bildet.
-
Fig. 27 ist ein Blockdiagramm, das die Struktur einer Bildkodiervorrichtung gemäss
einer sechsten Ausführungsform zeigt, die keinen Teil dieser Erfindung bildet.
-
Fig. 28 ist ein Blockdiagramm, das zeigt, wie die Anzahl von Bewegungsvektoren
in einer Bildkodiervorrichtung gemäss einer dreiundzwanzigsten Ausführungsform, die
keinen Teil dieser Erfindung bildet, ausgewählt wird.
-
Fig. 29 ist ein Blockdiagramm, das die Struktur einer Bildkodiervorrichtung gemäss
einer siebenten Ausführungsform zeigt, die keinen Teil dieser Erfindung bildet.
-
Fig. 44 ist ein Blockdiagramm, das die Struktur einer Bildkodiervorrichtung gemäss
einer achten Ausführungsform zeigt, die keinen Teil dieser Erfindung bildet.
-
Fig. 45 ist eine Zeichnung, um das Funktionsprinzip einer Bildkodiervorrichtung
gemäss einer achten Ausführungsform, die keinen Teil dieser Erfindung bildet, zu erklären.
-
Fig. 46 ist ein Blockdiagramm, das die Struktur einer Bilddekodiervorrichtung
gemäss einer neunten Ausführungsform dieser Erfindung zeigt.
-
Fig. 50 ist eine Zeichnung, die eine Diskette als ein Beispiel eines
Aufzeichnungsmediums für ein Bildkodierprogramm und ein Bilddekodierprogramm
gemäss einer zehnten Ausführungsform dieser Erfindung zeigt.
Ausführungsform Nr. 1
-
Eine Bildkodiervorrichtung gemäss einer ersten Ausführungsform, die keinen Teil
dieser Erfindung bildet, empfängt als Bildeingangssignale Bildsignale, die zumindest
entweder aus der Gestaltinformation oder der. Transparenzinformation sowie der
Pixelinformation bestehen, und kodiert die Bildsignale gemäss dem für die betreffenden
Bildsignale zweckmässigen Modus.
-
Fig. 22 ist eine Blockstruktur, die die Struktur der. Bildkodiervorrichtung gemäss
der ersten Ausführungsform zeigt. In der Figur bezeichnet 101 das Bildeingangssignal, das
zumindest entweder aus der Gestaltinformation oder der Transparenzinformation sowie der
Pixelinformation besteht. Mit 102 wird die Blockeinheit bezeichnet, die das
Bildeingangssignal 101 blockt und das geblockte Formsignal 103, das geblockte
Transparenzsignal 105 und das geblockte Pixelwertsignal 107 ausgibt. Mit 110 wird die Einheit für die
Beurteilung des Form codiermodus bezeichnet, während 114 die Einheit für die
Beurteilung des Transparenzkodiermodus und 116 die Einheit für die Beurteilung des
Pixelwertkodiermodus bezeichnet, die die für das Formsignal 103, das Transparenzsignal 105
und das Pixelwertsignal 107 jeweils zweckmässigen Kodiermodi beurteilen und den
Formkodiermodus 111, den Transparenzkodiermodus 115 und den Pixelwertkodiermodus 119
ausgeben. Mit 112 wird der Formkodierer, mit 116 der Transparenzkodierer und mit 120
der Pixelwertkodierer bezeichnet, die alle die betreffenden Signale gemäss der jeweiligen
Beurteilungseinheit kodieren und das kodierte Formsignal 113, das kodierte
Transparenzsignal 117 bzw. das kodierte Pixelwertsignal 121 ausgeben. Mit 122 wird der
Moduskodierer bezeichnet, der kollektiv alle Kodiermodi 111, 115 und 119 kodiert und das
kodierte Modussignal 123 ausgibt.
-
Die Funktion der wie oben aufgebauten Bildkodiervorrichtung gemäss der ersten
Ausführungsform wird erklärt. Zu Beginn wird das Bildeingangssignal 101, das aus der
Gestaltinformation, der Transparenzinformation und der Pixelwertinformation besteht, in
die Bildkodiervorrichtung gemäss der ersten Ausführungsform eingegeben. Hier werden
die Transparenzinformation und die Gestaltinformation unter Bezugnahme auf die im
Abschnitt des Standes der Technik verwendete Fig. 53 erklärt. Die Transparenzinformation
stellt das Verhältnis jedes zusammenzusetzenden Pixels dar, wenn das in Fig. 53(a)
gezeigte Bild mit einem weiteren Bild kombiniert wird, und stellt grundsätzlich mehrwertige
Information wie die in Fig. 53(d) gezeigte dar. Die Gestaltinformation ist zweiwertige
Information wie die in Fig. 53(c) gezeigte, die zweiwertige Transparenzinformation
darstellt, wobei Null und Nicht Null anzeigen, dass das Objekt "existiert/nicht existiert".
Man bemerke, dass die Information ausschliesslich durch das oben beschriebene
Formsignal dargestellt werden kann und daher die Transparenzinformation nicht erforderlich ist,
wenn die Transparenzinformation nur doe beiden Niveaus: vollkommene Transparenz und
vollkommene Undurchsichtigkeit besitzt. Entsprechend werden in diesem Falle nur die
Gestaltinformation und die Pixelwertinformation kodiert bzw. dekodiert.
-
Die Blockeinheit 102 blockt das Bildeingangssignal 101, indem es auf der Basis der
entsprechenden Beziehung zwischen den Pixeln der Gestaltinformation, der
Transparenzinformation und der Pixelwertinformation eine Mehrzahl von Pixeln integriert und das
geblockte Formsignal 103, das geblockte Transparenzsignal 105 und das geblockte
Pixelwertsignal 107 ausgibt. Das Formsignal 103 wird an die Einheit 110 für die Beurteilung
des Formkodiermodus und an den Formkodierer 112 ausgegeben, während das
Transparenzsignal 105 an die Einheit 114 für die Beurteilung des Transparenzkodiermodus und
den Transparenzkodierer 116 und das Pixelwertsignal 107 an die Einheit 118 für die
Beurteilung des Pixelwertkodiermodus und an den Pixelwertkodierer 120 ausgegeben wird.
-
Die Einheit 110 für die Beurteilung des Formkodiermodus, die Einheit 114 für die
Beurteilung des Transparenzkodiermodus und die Einheit 118 für die Beurteilung des
Pixelwertkodiermodus beurteilen zweckmässige Kodiermodi für das eingegebene
Formsignal 103, das eingegebene Transparenzsignal 105 bzw. das eingegebene
Pixelwertsignal 107 und geben den Formkodiermodus 111, den Transparenzkodiermodus 115 und
den Pixelwertkodiermodus 119 aus. Jeder Kodiermodus wird an jede Kodiermoduseinheit
sowie an die Moduskodiereinheit 122 ausgegeben.
-
Der Formkodierer 112, der Transparenzkodierer 116 und der Pixelwertkodierer 120
geben die betreffenden Eingangssignale gemäss jedem der eingegebenen Kodiermodi aus
und geben das kodierte Formsignal 113, das kodierte Transparenzsignal 117 und das
kodierte Pixelwertsignal 121 aus. Andererseits kodiert der Moduskodierer 122 kollektiv
alle eingegebenen Kodiermodi und gibt das kodierte Modussignal 123 aus. Das kodierte
Formsignal 113, das kodierte Transparenzsignal 117, das kodierte Pixelwertsignal 121 und
das kodierte Modussignal 123 sind die kodierten Ausgangssignale der
Bildkodiervorrichtung gemäss der achtzehnten Ausführungsform.
-
Wie oben beschrieben, haben die kodierten Ausgangssignale der
Bildkodiervorrichtung gemäss der ersten Ausführungsform die Blockeinheit 401, die das Bildeingangssignal
blockt und das Bildeingangssignal in das Formsignal, das Transparenzsignal und das
Pixelwertsignal auftrennt und diese Signale ausgibt, sowie die
Kodiermodusbeurteilungseinheiten 110, 114 und 118, die die für jedes Signal jeweils zweckmässigen Kodiermodi
beurteilen, die Kodierer 112, 116 und 120, die jedes Signal gemäss jedem Kodiermodus
kodieren, und den Moduskodierer 122, der kollektiv alle Kodiermodi kodiert, und dadurch
ist es möglich, dass die Kodierung gemäss dem für jedes getrennte Signal zweckmässigen
Modus ausgeführt wird und die gesamte, mit dem ausgewählten Modus in Beziehung
stehende Information kollektiv kodiert wird. Da die Gestaltinformation, die
Transparenzinformation und die Pixelwertinformation oft eine gegenseitige Korrelation besitzen, ist es
wahrscheinlich, dass der gleiche Kodiermodus ausgewählt wird. Durch Ausführung der
Kodierung mit variabler Länge, worin die Kodes, denen der gleiche Modus zugeteilt
worden ist, die kurze Kodelänge haben sollen, ergibt sich die mögliche Verringerung der
Bitzahl des kodierten Signals.
Ausführungsform Nr. 2
-
Eine Bildkodiervorrichtung gemäss einer zweiten Ausführungsform, die keinen Teil
dieser Erfindung bildet, empfängt als Bildeingangssignale Bildsignale, die zumindest
entweder aus der Gestaltinformation oder der Transparenzinformation sowie der
Pixelinformation bestehen, und kodiert die Bildsignale gemäss dem für die betreffenden
Bildsignale zweckmässigen Modus.
-
Fig. 23 ist eine Blockstruktur, die die Struktur der Bildkodiervorrichtung gemäss
der zweiten Ausführungsform zeigt. In der Figur beurteilt die Einheit 110 für die.
Beurteilung des Formkodiermodus den für das Formsignal 103 zweckmässigen
Kodiermodus und gibt das Ergebnis der Beurteilung als Kodiermodus an den Formkodierer 112,
den Moduskodierer 122 sowie an die Einheit 130 für die Beurteilung des
Transparenzkodiermodus und die Einheit 132 für die Beurteilung des Pixelwertkodiermodus aus.
Danach führt die Einheit 130 für die Beurteilung des Transparenzkodiermodus die
Beurteilung unter Bezugnahme auf den eingegebenen Formkodiermodus 111 aus und gibt das
Ergebnis der Beuteilung als Kodiermodus an den Transparenzkodierer 116, den
Moduskodierer 122 sowie an die Einheit 132 für die Beurteilung des Pixelwertkodiermodus aus.
Die Einheit 132 für die Beurteilung des Pixelwertkodiermodus führt die Beurteilung unter
Bezugnahme auf den eingegebenen Formkodiermodus 111 und den eingegebenen
Transparenzkodiermodus 115 aus.
-
Die Funktion der Bildkodiervorrichtung gemäss der zweiten Ausführungsform ist mit
Ausnahme der Beurteilungen der jeweiligen Modusbeurteilungseinheiten der der ersten
Ausführungsform ähnlich und gibt das kodierte Formsignal 111, das kodierte
Transparenzsignal 117, das kodierte Pixelwertsignal. 121 und das kodierte Modussignal 123 in
ähnlicher Weise aus.
-
Wie oben beschrieben, hat die Bildkodiervorrichtung gemäss der zweiten
Ausführungsform die Einheit 130 für die Beurteilung des Transparenzkodiermodus, die den
Kodiermodus des Transparenzsignals unter Bezugnahme auf den Formkodiermodus
beurteilt, sowie die Einheit 132 für die Beurteilung des Pixelwertkodiermodus, die den
Kodiermodus des Pixelwertsignals unter Bezugnahme sowohl auf den Formkodiermodus
als auch auf den Transparenzkodiermodus beurteilt, wodurch es wahrscheinlich ist, dass
die ausgewählten Modi die gleichen sind. Entsprechend kann im Moduskodierer 122, in
dem ein kürzerer Kode in dem Fall zugewiesen wird, in dem die Modi gleich sind, die
Leistung der Kodierung mit variabler Länge mehr als in der ersten Ausführungsform
verbessert werden, und die Bitzahl des kodierten Modussignals kann verringert werden,
was das erreichte Ergebnis ist.
Ausführungsform Nr. 3
-
Eine Bildkodiervorrichtung gemäss einer dritten Ausführungsform verbessert die
Kodierleistung des kodierten Modussignals ähnlich wie die der zweiten Ausführungsform.
-
Fig. 24 ist eine Blockstruktur, die die Struktur der Bildkodiervorrichtung gemäss
der dritten Ausführungsform zeigt. In der Figur beurteilt die Einheit 118 für die
Beurteilung des Pixelwertkodiermodus den für das Pixelwertsignal 107 zweckmässigen
Kodiermodus und gibt das Ergebnis der Beurteilung als Kodiermodus an den Pixelwertkodierer
120, den Moduskodierer 122 sowie auch an die Einheit 136 für die Beurteilung des
Transparenzkodiermodus und die Einheit 138 für die Beurteilung des Formkodiermodus
aus. Danach führt die Einheit 136 für die Beurteilung des Transparenzkodiermodus die
Beurteilung unter Bezugnahme auf den eingegebenen Pixelwertkodiermodus 119 aus und
gibt das Ergebnis der Beurteilung als Kodiermodus an den Transparenzkodierer 116, den
Moduskodierer 122 sowie auch an die Einheit 138 für die Beurteilung des
Formkodiermodus aus. Die Einheit 138 für die Beurteilung des Formkodiermodus führt die
Beurteilung unter Bezugnahme auf den eingegebenen Pixelwertkodiermodus 119 und den
eingebenen Transparenzkodiermodus 115 aus.
-
Die Funktion der Bildkodiervorrichtung gemäss der dritten Ausführungsform ist mit
Ausnahme der Beurteilungen der jeweiligen Modusbeurteilungseinheiten der der ersten
Ausführungsform ähnlich und gibt das kodierte Formsignal 113, das kodierte
Transparenzsignal 117, das kodierte Pixelwertsignal 121 und das kodierte Modussignal 123 in
ähnlicher Weise aus.
-
Wie oben beschrieben, hat die Bildkodiervorrichtung gemäss der dritten
Ausführungsform die Einheit 136 für die Beurteilung des Transparenzkodiermodus, die den
Kodiermodus des Transparenzsignals unter Bezugnahme auf den Pixelwertkodiermodus
beurteilt, sowie die Einheit 138 für die Beurteilung des Formkodiermodus, die den
Kodiermodus des Formsignals unter Bezugnahme sowohl auf den Pixelwertkodiermodus als auch
auf den Transparenzkodiermodus beurteilt, wodurch es wahrscheinlich ist, dass die
ausgewählten Modi die gleichen sind. Entsprechend kann im Moduskodierer 122, in dem ein
kürzerer Kode in dem Fall zugewiesen wird, in dem die Modi gleich sind, die Leistung der
Kodierung mit variabler Länge mehr als in der ersten Ausführungsform verbessert werden,
und die Bitzahl des kodierten Modulsignals kann verringert werden, was das erreichte
Ergebnis ist.
Ausführungsform Nr. 4
-
Eine Bilddekodiervorrichtung gemäss einer vierten Ausführungsform, die keinen Teil
dieser Erfindung bildet, kodiert das durch die Bildkodiervorrichtung gemäss der ersten
Ausführungsform kodierte Signal in zweckmässiger Weise.
-
Fig. 25 ist eine Blockstruktur, die die Struktur der Bilddekodiervorrichtung gemäss
der vierten Ausführungsform zeigt. In der Figur sind die Eingangssignale 113, 117, 119
und 123 das kodierte Formsignal 113, das kodierte Transparenzsignal 117, das kodierte
Pixelwertsignal 119 bzw. das kodierte Modussignal 123, die alle von der
Bildkodiervorrichtung gemäss der ersten Ausführungsform ausgegeben werden. Mit 150 wird der
Modusdekodierer bezeichnet, der das kodierte Modussignal 123 dekodiert und den
Formkodiermodus 151, den Transparenzkodiermodus 153 und den Pixelwertkodiermodus 155
ausgibt. Mit 156 ist der Formdekodierer, mit 158 der Transparenzdekodierer und mit 160
der Pixelwertdekodierer bezeichnet, die das kodierte Formsignal 113, das kodierte
Transparenzsignal 117 bzw. das kodierte Pixelwertsignal 119 gemäss den vom Modusdekodierer
150 eingegebenen Kodiermodi kodieren und das dekodierte Formsignal 157, das
dekodierte Transparenzsignal 159 bzw. das dekodierte Pixelwertsignal 161 ausgeben. Mit 162 wird
die Entblockeinheit bezeichnet, die das dekodierte Formsignal 157, das dekodierte
Transparenzsignal 159 und das dekodierte Pixelwertsignal 161 empfängt und integriert und das
dekodierte Bildsignal 163 ausgibt.
-
Die Funktion der wie oben aufgebauten Bilddekodiervorrichtung gemäss der vierten
Ausführungsform wird beschrieben. Die Bilddekodiervorrichtung gemäss der vierten
Ausführungsform empfängt das kodierte Formsignal 113, das kodierte Transparenzsignal
117, das kodierte Pixelwertsignal 119 und das kodierte Modussignal 123, um sie in den
Formdekodierer 156, den Transparenzdekodierer 158, den Pixelwertdekodierer 160 bzw.
den Modusdekodierer 150 auszugeben.
-
Der Modusdekodierer 150 dekodiert das kodierte Modussignal 123 und gibt den
Formkodiermodus 151, den Transparenzkodiermodus 153 und den Pixelwertkodiermodus
155 in den Formdekodierer 156, den Transparenzdekodierer 158 bzw. den Pixelwertdekodierer
160 aus. Der Formdekodierer 156, der Transparenzdekodierer 158 und der
Pixelwertdekodierer 160 dekodieren die eingegebenen, kodierten Signale gemäss dem
jeweils eingegebenen Kodiermodus und geben das dekodierte Formsignal 157, das
dekodierte Transparenzsignal 159 und das dekodierte Pixelwertsignal 161 in die
Entblockeinheit 162 aus. Die Entblockeinheit 162 integriert die eingegebenen dekodierten Signale und
gibt das dekodierte Bildsignal 163 aus.
-
Wie oben beschrieben, hat die Bilddekodiervorrichtung gemäss der vierten
Ausführungsform den Modusdekodierer 150, den Formdekodierer 156, den
Transparenzdekodierer 158, den Pixelwertdekodierer 160 und die Entblockeinheit 162 und dekodiert
dadurch in zweckmässiger Weise das von der Bildkodiervorrichtung gemäss der ersten
Ausführungsform gewonnene kodierte Signal, führt die Integration aus und kann das
dekodierte Bildsignal 163 gewinnen.
-
Man bemerke, dass in der Bilddekodiervorrichtung gemäss der vierten
Ausführungsform die in den Bildkodiervorrichtungen gemäss der zweiten und dritten Ausführungsform
gewonnenen kodierten Signale ebenfalls in zweckmässiger Weise dekodiert werden
können, obwohl das durch die Bildkodiervorrichtung gemäss der achtzehnten
Ausführungsform gewonnene, kodierte Bildsignal [].
Ausführungsform Nr. 5
-
Eine Bildkodiervorrichtung gemäss einer fünften Ausführungsform, die keinen Teil
dieser Erfindung bildet, führt die Kodierung eines Eingangssignals durch, während sie die
Intra- und Interframekodierung in Anpassung an das Eingangssignal wechselt.
-
Fig. 26 ist eine Blockstruktur, die die Struktur der Bildkodiervorrichtung gemäss
der fünften Ausführungsform zeigt. In der Figur bezeichnet 178 eine Einheit für die
Beurteilung der Intra- und Interframekodierung der Pixelkodierung, die Intra- gegen Inter-
für den Kodiermodus des Pixelwertsignals beurteilt und den Kodiermodus 119 des
Pixelwertsignals ausgibt. Mit 138 wird die Einheit für die Beurteilung des
Formkodiermodus bezeichnet, die der Einheit, für die Beurteilung des Formkodiermodus in der
zwanzigsten Ausführungsform entspricht, die in Fig. 24 mit 138 bezeichnet ist. Mit 170
und 176 sind die Schalter bezeichnet, die gemäss dem Ausgangssignal der
Beurteilungseinheit 178 gestellt sind und den Kodiermodus des Formsignals bestimmen. Mit 172 wird
die Einheit für die Beurteilung der Intra- und Interframekodierung bezeichnet, die Intra-
gegen Inter- für den Kodiermodus des Formsignals beurteilt und den Kodiermodus 173 des
Formsignals ausgibt. Die weiteren Ziffern sind denen in Fig. 22 ähnlich, und die
Beschreibung ist der der ersten Ausführungsform ähnlich.
-
Eine Beschreibung der wie oben aufgebauten Bildkodiervorrichtung gemäss der
fünften Ausführungsform wird gegeben. Zu Beginn wird das Bildeingangssignal 101 in die
Bildkodiervorrichtung gemäss der fünften Ausführungsform eingegeben, und die
Blockeinheit 102 führt ähnlich wie in der achtzehnten Ausführungsform das Blocken und die
Signalauftrennung durch und gibt das Pixelwertsignal und das Formsignal aus.
-
Wenn das abgetrennte Pixelwertsignal 107 in die Einheit für die Beurteilung von
Intra- und Interframekodierung der Pixelwertkodierung eingegeben wird, urteilt
Beurteilungseinheit 178, ob die Kodierung mit Intraframekodierung oder Interframekodierung
erfolgt, und gibt das Ergebnis der Beurteilung als den Pixelwertkodiermodus, der "Intra"
bzw. "Inter" anzeigt, an den. Pixelwertkodierer 120, den Moduskodierer 122 und die
Einheit 138 für die Beurteilung des Formkodiermodus aus.
-
In der Einheit 138 für die Beurteilung des Formkodiermodus sind die Schalter 170
und 176 gemäss dem Pixelwertkodiermodus 119 gestellt. Die Schaltung erfolgt in der
Weise, dass die Beurteilungseinheit 178 das Eingangssignal nicht empfängt, wenn der
Pixelwertkodiermodus "Intra" anzeigt, während die Beurteilungseinheit 178 das
Eingangssignal empfängt, wenn der Pixelwertkodiermodus "Inter" anzeigt. Entsprechend wird der
Formbeurteilungsmodus 111, der Intraframekodierung anzeigt, von der Beurteilungseinheit
138 ausgegeben, wenn der Pixelwertkodiermodus 119 Intraframekodierung anzeigt.
-
Wenn andererseits der Pixelwertkodiermodus 119 Interframekodierung anzeigt,
urteilt die Einheit 172 für die Beurteilung von Intra- und Interframekodierung, ob die
Kodierung des spezifischen Formsignals für das Formsignal 105 mit Intraframekodierung oder
mit Interframekodierung erfolgt, und gibt das Ergebnis der Beurteilung als
Formkodiermodus 111 aus.
-
In jedem Falle wird der Formkodiermodus 111 an den Formkodierer 112 und den
Moduskodierer 122 ausgegeben. Die Funktionen des Pixelwertkodierers 120, des
Formkodierers 112 und des Moduskodierers 122, die alle die jeweiligen kodierten Signale
ausgeben, sind denen der ersten Ausführungsform ähnlich.
-
Es erhellt aus der oben beschriebenen Arbeitsweise, dass in der
Bildkodiervorrichtung gemäss der fünften Ausführungsform das Formsignal immer intraframe-kodiert
ist, wenn das Pixelwertsignal intraframe-kodiert ist. Allgemein sind, wenn die Pixelwerte
sich nicht in Übereinstimmung befinden, die Formen auch nicht in Übereinstimmung,
daher ist, wenn das Pixelwertsignal intraframe-kodiert werden soll, das heisst, wenn das
Pixelwertsignal eine geringe zeitliche Korrelation besitzt, die Kodierleistung bei der
Kodierung des Formsignals kaum herabgesetzt, selbst wenn die Anzahl der Kodiermodi für
die Kodierung des Formsignals ähnlich der zweiundzwanzigsten Ausführungsform
begrenzt ist.
-
Es gibt auch den Fall, wo sich die zusammenzufügenden Pixelwerte ändern werden,
obwohl das Formsignal beim Zusammenfügen konstant ist, wie bei einem feststehenden
Bild (zusammengefügtes Bild) und dergleichen, und in diesem Falle ist die
Interframekodierung für das Formsignal nicht immer zweckmässig, selbst wenn die
Interframekodierung gemäss dem Pixelwertsignal ausgewählt wurde. Wenn in der
Bildkodiervorrichtung gemäss der zweiundzwanzigsten Ausführungsform die Interframekodierung
für das Pixelwertsignal ausgewählt worden ist, wird beurteilt, ob Intra- oder
Interframekodierung für das Formsignal gewählt werden soll, so dass es auch möglich ist, die
Intraframekodierung für das Formsignal auszuwählen, wodurch es möglich ist, eine
ernsthafte Herabsetzung der Kodierleistung auf Grund der für die Kodierung des
Formsignals unzweckmässigen Interframekodierung zu verhindern.
-
Ferner ist, wenn zumindest entweder das Formsignal oder das Pixelwertsignal
interframe-kodiert wird, eine Menge zusätzlicher Information für die in der
Interframekodierung auszuführende Bewegungskompensation usw. erforderlich. In der
Bildkodiervorrichtung gemäss der fünften Ausführungsform gibt es keinen Fall, in dem nur das Formsignal
interframe-kodiert wird, so dass die Bitzahl niedrig gehalten werden kann, wenn die
Intraframekodierung für das Pixelwertsignal ausgewählt wird. Allgemein hat die oben
erwähnte zusätzliche Information die kleinere Bitzahl als in dem Fall, in dem das
Pixelwertsignal intraframe-kodiert wird, aber im Vergleich zu der für Intraframekodierung
des Formsignals erforderlichen Bitzahl ist die Bitzahl so hoch, dass sie nicht unbeachtet
bleiben kann, was eine grosse Auswirkung hat.
-
Wie oben beschrieben, hat die Bildkodiervorrichtung gemäss der fünften
Ausführungsform die Einheit 178 für die Beurteilung der Intra- und Interframekodierung für das
Pixelwertsignal und die Einheit 138 für die Beurteilung des Formkodiermodus, die die
Einheit 172 für die Beurteilung der Intra- und Interframekodierung für das Formsignal
einschliesst, daher kodiert der Intraframe den Kodiermodus des Formsignals, wenn der
Kodiermodus des Pixelwertsignals die Intraframekodierung ist, während der Kodiermodus
für das Formsignal beurteilt und auswählt wird, wenn der Kodiermodus des
Pixelwertsignals die Interframekodierung ist, was zu einer höheren Korrelation zwischen dem
Kodiermodus 119 für das Pixelwertsignal und dem Kodiermodus 111 für das Formsignal
führt und dadurch die Verringerung der Bitzahl des kodierten Modussignals zustande
bringt und es ermöglicht, dass im Ergebnis der Verhinderung der Wahl der
Interframekodierung die Bitzahl der zusätzlichen Information für die Bewegungskompensation
verringert wird.
Ausführungsform Nr. 6
-
Eine Bildkodiervorrichtung gemäss einer sechsten Ausführungsform, die keinen Teil
dieser Erfindung bildet, führt die Kodierung des Eingangssignals durch, während sie die
Zahl der Bewegungsvektoren bei der Kodierung in Anpassung an das Eingangssignal
wechselt.
-
Fig. 27 ist eine Blockstruktur, die die Struktur der Bildkodiervorrichtung gemäss
der sechsten Ausführungsform zeigt. In der Figur bezeichnet 188 die Einheit für die
Beurteilung der Zahl der Bewegungsvektoren für die Kodierung des Pixelwertes, die
urteilt, welches die Anzahl von Bewegungsvektoren sein soll, und gibt den Kodiermodus
119 für das Pixelwertsignal aus. Mit 138 wird die Einheit für die Beurteilung des
Formkodiermodus bezeichnet, die der Einheit für die Beurteilung des Formkodiermodus gemäss
der zwanzigsten Ausführungsform entspricht, die in Fig. 24 mit 138 bezeichnet ist. Mit
180 und 186 werden Schalter bezeichnet, die gemäss dem Ausgangssignal der
Beurteilungseinheit 188 schalten und den Kodiermodus für das Formsignal bestimmen. Mit 182
wird die Einheit für die Beurteilung der Zahl von Bewegungsvektoren für die
Formkodierung bezeichnet, die urteilt, welches die Anzahl von Bewegungsvektoren sein soll, und den
Kodiermodus 183 für das Formsignal gemäss dem Ergebnis der Beurteilung ausgibt. Die
weiteren Kodierungen sind denen in Fig. 22 ähnlich, und die Beschreibung ist der für die
erste Ausführungsform ähnlich.
-
Die Beschreibung der wie oben aufgebauten Bildkodiervorrichtung gemäss der
sechsten Ausführungsform wird gegeben. Zu Beginn empfängt die Bildkodiervorrichtung
gemäss der sechsten Ausführungsform das Bildeingangssignal 101, und die Blockeinheit
102 führt ähnlich wie in der ersten Ausführungsform das Blocken und die Auftrennung des
Signals durch und gibt das Pixelwertsignal und das Formsignal aus.
-
Die Einheit 188 für die Beurteilung der Zahl der Bewegungsvektoren für die
Kodierung des Pixelwertes empfängt das abgetrennte Pixelwertsignal 107, beurteilt dann
das zu kodierende Signal bezüglich der Anzahl der Bewegungsvektoren für das
Pixelwertsignal 107 und gibt das Ergebnis der Beurteilung als Pixelwertkodiermodus 119 an
den Pixelwertkodierer 120, den Moduskodierer 122 und die Einheit 138 für die
Beurteilung des Formkodiermodus aus.
-
Fig. 28 ist eine Zeichnung zur Erklärung der Anzahl der Bewegungsvektoren. Da
die Bewegung in der Nähe des Umrisses eines Objekts kompliziert ist, ist es sehr
schwierig, unter Einsatz nur eines Bewegungsvektors (motion vector MV) pro Block den
Bewegungskompensationsfehler genügend stark zu verringern. In diesem Falle ist es
bekannt, dass es wünschenswert ist, den Block zu unterteilen und dann die aufgeteilten
Blöcke den Bewegungsvektoren zuzuweisen, und diese an die Natur des Bildes angepasste
Änderung der Anzahl der Bewegungsvektoren verbessert die Kodierleistung. Entsprechend
wechselt die Bildkodiervorichtung gemäss der sechsten Ausführungsform adaptiv
zwischen der Bewegungskompensation unter Verwendung nur eines Bewegungsvektors
(MV1) pro Block, wie in der Figur gezeigt, und der Bewegungskompensation unter
Verwendung von insgesamt vier Bewegungsvektoren (MV1, MV2, MV3, MV4), die jeweils
einem der getrennten Blöcke zugewiesen werden, in die der einzelne Block aufgetrennt
wurde. Daher urteilt die Beurteilungseinheit 188, ob die Anzahl der Bewegungsvektoren
eins oder vier ist, und gibt "1" bzw. "4" als Kodiermodus für die Kodierung des
Pixelwertes aus.
-
In der Einheit 138 für den Formkodiermodus werden die Sehalter 180 und 186
gemäss dem Pixelwertkodiermodus gestellt. Die Schaltung erfolgt so, dass die
Beurteilungseinheit 182 das Eingangssignal nicht empfangen kann, wenn der Pixelwertkodiermodus
"1" anzeigt, während die Beurteilungseinheit 182 das Eingangssignal empfangen kann,
wenn der Pixelwertkodiermodus "4" anzeigt. Entsprechend wird die minimale Anzahl "1"
von Bewegungsvektoren als Formbeurteilungsmodus 111 ausgegeben, wenn der
Pixelwertkodiermodus 119 "1" ist.
-
Wenn andererseits der Pixelwertkodiermodus 119 "4" anzeigt, urteilt die Einheit 182
für die Beurteilung der Zahl von Bewegungsvektoren, ob die Anzahl der Bewegungsvektoren
für das Formsignal 105 eins oder vier sein sollte, und gibt das Ergebnis der
Beurteilung als Formkodiermodus 111 aus.
-
In jedem Fall wird der Formkodiermodus 111 an den Formkodierer 112 und den
Moduskodierer 122 ausgegeben. Die Funktionen des Pixelwertkodierers 120, des
Formkodierers 112 und des Moduskodierers 122 sind denen der ersten Ausführungsform
ähnlich, und die entsprechenden kodierten Signale werden ausgegeben.
-
In der Bildkodiervorrichtung gemäss der sechsten Ausführungsform wird im
Ergebnis der oben beschriebenen Abläufe das Formsignal immer unter Verwendung der
minimalen Anzahl von Bewegungsvektoren kodiert, wenn das Pixelwertsignal unter
Verwendung der minimalen Anzahl von Bewegungsvektoren kodiert wird. Mit steigender Anzahl
der Bewegungsvektoren steigt die für die Kodierung der Bewegungsvektoren erforderliche
Information nachteilig an. In diesem Falle wird durch die Verringerung der Zahl von
Bewegungsvektoren für die Kodierung des Formsignals ein Ansteigen der Last verhindert.
-
Wie oben beschrieben, hat die Bildkodiervorrichtung gemäss der dreiundzwanzigsten
Ausführungsform die Einheit 188 für die Beurteilung der Zahl von Bewegungsvektoren für
die Kodierung des Pixelwertes und die Einheit 138 für die Beurteilung des
Formkodiermodus, die die Einheit 182 für die Beurteilung der Zahl von Bewegungsvektoren für die
Formkodierung einschliesst. Daher verwendet der Kodiermodus für das Formsignal die
minimale Anzahl von Bewegungsvektoren, wenn der Kodiermodus für das Pixelwertsignal
die minimale Anzahl von Bewegungsvektoren verwendet. Wenn der Kodiermodus für das
Pixelwertsignal eine grosse Anzahl von Bewegungsvektoren verwendet, wird der
Kodiermodus für das Formsignal beurteilt und dann ausgewählt. Das führt zur Korrelation
zwischen dem. Kodiermodus 119 für das Pixelwertsignal und dem Kodiermodus. 111 für das
Formsignal und ermöglicht eine Verringerung der Bitzahl des kodierten Modussignals, es
verursacht auch die Verhinderung der Auswahl, wenn die Anzahl von Bewegungsvektoren
ansteigt, und ermöglicht es dadurch, dass verhindert wird, dass die Bitzahl wegen des
Anstiegs der zusätzlichen Information ansteigt.
Ausführungsform Nr. 7
-
Eine Bildkodiervorrichtung gemäss einer siebenten Ausführungsform, die keinen Teil
dieser Erfindung bildet, führt die Kodierung des Eingangssignals durch, während sie in
Anpassung an das Eingangssignal zwischen einer Veränderung und Nichtveränderung des
Quantisierungsschritts wechselt.
-
Fig. 27 ist eine Blockstruktur, die die Struktur der Bildkodiervorrichtung gemäss
der siebenten Ausführungsform zeigt. In der Figur bezeichnet 198 die Einheit für die
Beurteilung einer Änderung oder Nichtänderung des Quantisierungsschrittes für die
Kodierung des Pixelwertes, die beurteilt, ob der Quantisierungsschritt für den
Kodiermodus für das Pixelwertsignal durchgeführt oder nicht durchgeführt wird, und gibt den
Kodiermodus 119 für das Pixelwertsignal aus. Mit 138 wird die Einheit für die Beurteilung
des Formkodiermodus bezeichnet, die der Einheit für die Beurteilung des
Formkodiermodus gemäss der dritten Ausführungsform entspricht, die in Fig. 24 mit 138 bezeichnet
ist. Mit 190 und 196 werden die Schalter bezeichnet, die gemäss dem Ausgangssignal der
Beurteilungseinheit 198 gestellt werden und den Kodiermodus für das Formsignal
bestimmen. Mit 192 wird die Einheit für die Beurteilung einer Änderung oder
Nichtänderung des Quantisierungsschrittes für die Formkodierung bezeichnet, die urteilt, ob der
Quantisierungsschritt für den Kodiermodus für das Formsignal ausgeführt wird oder nicht,
und den Kodiermodus 113 für das Formsignal gemäss dem Ergebnis der Beurteilung
ausgibt. Die weiteren Kodierungen sind denen in Fig. 22 ähnlich, und die Beschreibung
ist der für die erste Ausführungsform ähnlich.
-
Die Beschreibung der wie oben aufgebauten Bildkodiervorrichtung gemäss der
siebenten Ausführungsform wird gegeben. Zu Beginn empfängt die Bildkodiervorrichtung
gemäss der vierundzwanzigsten Ausführungsform das Bildeingangssignal 101, und die
Blockeinheit 102 führt ähnlich wie in der ersten Ausführungsform das Blocken und die
Auftrennung des Signals durch und gibt das Pixelwertsignal und das Formsignal aus.
-
Die Einheit 198 für die Beurteilung einer Änderung oder Nichtänderung des
Quantisierungsschrittes empfängt das abgetrennte Pixelwertsignal 107, beurteilt dann, ob der
Quantisierungsschritt für das Pixelwertsignal 107 durchgeführt oder nicht durchgeführt
wird, und gibt das Ergebnis der Beurteilung als Pixelwertkodiermodus 119 an den
Pixelwertkodierer 120, den Moduskodierer 122 und die Einheit 138 für die Beurteilung des
Formkodiermodus aus.
-
In der Einheit 138 für den Formkodiermodus werden Schalter 190 und 196 gemäss
dem Pixelwertkodiermodus gestellt. Die Schaltung erfolgt so, dass die Beurteilungseinheit
192 das Eingangssignal nicht empfangen kann, wenn der Pixelwertkodiermodus "Nichtänderung"
anzeigt, während die Beurteilungseinheit 192 das Eingangssignal empfangen
kann, wenn der Pixelwertkodiermodus "Änderung" anzeigt. Entsprechend wird der
Formbeurteilungsmodus 111, der "Nichtänderung" anzeigt, ausgegeben, wenn der
Pixelwertkodiermodus 119 anzeigt, dass der Quantisierungsschritt nicht verändert wird.
-
Wenn andererseits der Pixelwertkodiermodus 119 anzeigt, dass der
Quantisierungsschritt verändert wird, urteilt die Beurteilungseinheit 192, ob der Quantisierungsschritt für
das Formsignal 105 ausgeführt oder nicht ausgeführt wird, und gibt das Ergebnis der
Beurteilung als Formkodiermodus 111 aus.
-
In jedem Fall wird der Formkodiermodus 111 an den Formkodierer 112 und den
Moduskodierer 122 ausgegeben. Die Funktionen des Pixelwertkodierers 120, des
Formkodierers 112 und des Moduskodierers 122 sind denen der ersten Ausführungsform
ähnlich, und die entsprechenden kodierten Signale werden ausgegeben.
-
Da der Wert des Quantisierungsschritts direkt mit der Kompressionsrate, d. h. der
Übertragungsrate der kodierten Signale, in Beziehung steht, wird allgemein der
Quantisierungsschritt grob gesteuert, wenn die Übertragungsrate gleich dem gegebenen Wert oder
grösser als dieser ist, während der Quantisierungsschritt fein gesteuert wird, wenn die
Übertragungsrate kleiner als der gegebene Wert ist, damit die Übertragungs- oder
Aufzeichnungsrate des kodierten Signals, zu dem das Bild kodiert wird, konstant bleibt. Da
der Wert des Quantisierungsschritts auch direkt die Bildqualität des kodierten Signals
beeinflusst, kann die Kompressionsrate erhöht werden, indem der Quantisierungsschritt
grösser gemacht wird, wenn das Bild ein Bild ist, bei dem stufenartige Veränderungen der
Pixelwerte vorhanden sind, da ein Abfall der Bildqualität in der Amplitudenrichtung
visuell schwer erkannt werden kann. In diesem Falle erfolgt die Änderung des
Quantisierungsschrittes gewöhnlich in Übereinstimmung mit der Änderung des Pixelwertes.
-
Wenn eine Steuerung der Änderung des Quantisierungsschrittes erfolgt, wie oben
beschrieben, wird die Information, die anzeigt, dass "der Quantisierungsschritt geändert
worden ist", zu jedem Block hinzugefügt und zusammen mit den Bilddaten kodiert. Oft
sollte, allerdings die Änderung des Quantisierungsschrittes derart erfolgen, dass das
Pixelwertsignal und das Formsignal gleichzeitig verändert werden, so dass, wenn der
Quantisierungsschritt für das Pixelwertsignal nicht verändert wird, selbst dann, wenn die
Änderung des Quantisierungsschritts für das Formsignal verhindert wird, der Abfall der
Bildqualität, der durch die Beschränkung verursacht wird, klein ist, während die
zusätzliche
Information, die die Änderung des Quantisierungsschrittes anzeigt, in starkem
Ausmass verringert wird.
-
Wie oben beschrieben, hat die Bildkodiervorrichtung gemäss der siebenten
Ausführungsform die Einheit 198 für die Beurteilung einer Änderung oder Nichtänderung des
Quantisierungsschritts für die Kodierung des Pixelwertes und die Einheit 138 für die
Beurteilung des Formkodiermodus, die die Einheit 192 für die Beurteilung einer Änderung
oder Nichtänderung des Quantisierungsschrittes für die Formkodierung einschliesst, und
daher ist der Kodiermodus für das Formsignal "Nichtänderung des
Quantisierungsschrittes", wenn der Kodiermodus für das Pixelwertsignal "Nichtänderung des
Quantisierungsschrittes" ist, während, wenn der Kodiermodus für das Pixelwertsignal "Änderung
des Quantisierungsschrittes" ist, der Kodiermodus für das Formsignal beurteilt und
ausgewählt wird, was zur Korrelation zwischen dem Kodiermodus 119 für das Pixelwertsignal
und dem Kodiermodus 1111 für das Formsignal führt und eine Verringerung der Bitzahl des
kodierten Modussignals ermöglicht, die Verhinderung der Wahl der Änderung des
Quantisierungsschrittes verursacht und es dadurch ermöglicht, dass der Anstieg der zusätzlichen
Information wegen der Änderung des Quantisierungsschrittes verhindert und die Bitzahl
verringert wird.
-
Man bemerke, dass, obwohl die Strukturen der Bildkodiervorrichtungen gemäss der
fünften bis siebenten Ausführungsform auf der in Fig. 24 gezeigten dritten
Ausführunsform beruhen, diese auch auf der in Fig. 23 gezeigten zweiten Ausführungsform beruhen
körnen, dass ferner die Korrelation der Kodiermodi stärker wird und ein Anstieg der
zusätzlichen Information verhindert wird, was die Verringerung der Bitzahl ermöglicht. Es
ist auch möglich, sie auf die in Fig. 20 gezeigte erste Ausführungsform zu gründen, und
die Bitzahl wird verringert, während für die jeweiligen Signale geeignete Kodierungen
realisiert werden.
-
Ferner können die durch die Bildkodiervorrichtungen gemäss der fünften bis
siebenten Ausführungsform gewonnenen, kodierten Signale durch die
Bilddekodiervorrichtung gemäss der dritten Ausführungsform zweckmässig dekodiert werden.
-
Ferner wird in der fünften bis siebenten Ausführungsform das Bildeingangssignal in
das Pixelwertsignal und das Formsignal aufgetrennt, während in der ersten bis vierten
Ausführungsform das Bildeingangssignal zusätzlich zur Pixelwertinformation aus der
Transparenzinformation und der Gestaltinformation besteht und in das Pixelwertsignal, das
Transparenzsignal und das Formsignal aufgetrennt wird. Wenn daher in der fünften bis
siebenten Ausführungsform die Transparenzinformation und die Gestaltinformation eine
Übereinstimmung besitzen, ist es möglich, ausschliesslich die Gestaltinformation zu
verwenden, während, wenn keine Übereinstimmung vorhanden ist, das Formsignal und das
Pixelwertsignal gewonnen werden, sofern die Transparenzinformation zum Formsignal
gemacht wird oder die Transparenzinformation, die ein mehrwertiges Signal ist, in der
Blockeinheit zusammen mit der Pixelwertinformation verarbeitet wird.
Ausführungsform Nr. 8
-
Eine Bildkodiervorrichtung gemäss einer achten Ausführungsform, die keinen Teil
dieser Erfindung bildet, kodiert Formsignale, die die Formen von Objekten darstellen,
extrahiert aus einem Bildsignal eine signifikante Fläche und führt eine wirksame
Kodierung durch.
-
Fig. 44 ist ein Blockdiagramm, das die Struktur der Bildkodiervorrichtung gemäss
der ächten Ausführungsform zeigt. In der Figur bezeichnet 401 das zweidimensionale
Formsignal als Eingangssignal. Mit 402 wird ein Extraktor signifikanter Flächen
bezeichnet, der eine signifikante Fläche aus dem Formeingangssignal 401 extrahiert und ein
signifikantes Flächensignal 403 ausgibt. Mit 404 wird die Blockeinheit bezeichnet, die das
Formeingangssignal 401 blockt und ein geblocktes Formsignal 405 ausgibt. Mit 408 wird
der Schalter bezeichnet, der gemäss dem signifikanten Flächensignal 403 das Schalten
ausführt. Mit 412 wird ein Blockgrössenveränderer bezeichnet, der die Blockgrösse
gemäss dem signifikanten Flächensignal 403 ändert und das geänderte geblockte
Formsignal 413 ausgibt. Mit 418 und 414 werden Kodierer bezeichnet, die das signifikante
Flächensignal 403 und das geblockte Formsignal 413 kodieren und die kodierten Signale
419 bzw. 415 ausgeben.
-
Die Funktion der wie oben aufgebauten Bildkodiervorrichtung gemäss der achten
Ausführungsform wird beschrieben. Das Eingangssignal 401, das ein zweidimensionales
Formsignal ist, wird in die Bildkodiervorrichtung gemäss der achten Ausführungsform und
dann in den Extraktor signifikanter Flächen 402 und die Blockeinheit 404 eingegeben. Der
Extraktor signifikanter Flächen 402 erkennt das Ausmass der signifikanten Fläche und gibt
das signifikante Flächensignal 403 an den Schalter 408, den Blockgrössenveränderer 412
Lind den Kodierer 418 aus.
-
Fig. 45 ist eine Zeichnung, um das Funktionsprinzip der durch die
Bildkodiervorrichtung gemäss der achten Ausführungsform ausgeführten Kodierung zu erklären. Der
durch schräge Linien bezeichnete Teil bedeutet den inneren Pixel des Objekts, das heisst
den Pixel, in dem das signifikante Signal existiert, und ein minimales Rechteck, das den in
schrägen Linien dargestellten Teil enthält, nämlich das durch die fette Linie in der Figur
angedeutete Rechteck, entspricht dem Bereich der signifikanten Fläche.
-
Die Blockeinheit 405 blockt, das Formeingangssignal und gibt das geblockte
Formsignal an den Schalter 408 aus. Hier ist der Schalter 408 im Zustand EIN, wenn das
geblockte Formsignal 405 dem Bereich der signifikanten Fläche entspricht, der durch das
signifikante Flächensignal 403 angezeigt wird. Das bedeutet, dass das geblockte
Formsignal dem Kodierprozess nicht unterliegt, wenn es ausserhalb der signifikanten Fläche ist.
-
Wenn der Schalter auf EIN steht, wird das geblockte Formsignal 405 in den
Blockgrössenveränderer 412 eingegeben, die Grösse wird zu dem minimalen Block verändert,
der gemäss dem in den Blockgrössenveränderer eingegebenen signifikanten Flächensignal
403 die signifikante Fläche enthält, das veränderte Formsignal 413 wird zum Kodierer 414
ausgegeben, kodiert und als das kodierte Signal 415 des Formsignals betrachtet.
Andererseits wird auch das den Bereich der signifikanten Fläche anzeigende signifikante
Flächensignal im Kodierer 418 kodiert, und das kodierte Signal 419 wird ausgegeben.
-
Wie oben beschrieben, hat die Bildkodiervorrichtung gemäss der achten
Ausführungsform den signifikanten Flächenerkenner 102 und den Blockgrössenveränderer 412,
erkennt dadurch den Bereich der signifikanten Fläche und verändert die Blockgrösse des
Formsignals, um das Formsignal nur, im inneren Bereich der signifikanten Fläche zu
kodieren, während der Bereich ausserhalb der signifikanten Fläche nicht mehr kodiert und
die Kodierleistung des Formsignals verbessert wird.
Ausführungsform Nr. 9
-
Eine Bilddekodiervorrichtung gemäss einer neunten Ausführungsform dieser
Erfindung dekodiert das durch die Bildkodiervorrichtung gemäss der achten Ausführungsform
ausgegebene, kodierte Signal und gewinnt ein zweidimensionales Formsignal.
-
Fig. 46 ist ein Blockdiagramm, das die Struktur der Bildkodiervorrichtung gemäss
der neunten Ausführungsform zeigt. In der Figur bezeichnen 419 und 415 das durch die
Bildkodiervorrichtung gemäss der achten Ausführungsform ausgegebene, kodierte Signal.
-
Mit 420 wird der Dekodierer für das signifikante Flächensignal bezeichnet, der das
eingegebene Signal dekodiert und ein dekodiertes signifikantes Flächensignal 421 ausgibt.
Mit 422 wird der Dekodierer für das Formsignal bezeichnet, der das eingegebene. Signal
dekodiert und ein dekodiertes Signal 423 für die minimale geblockte Form ausgibt. Mit
430 wird ein Blockgrössenveränderer bezeichnet, der die Blockgrösse gemäss dem
dekodierten signifikanten Flächensignal 423 verändert und das dekodierte geblockte
Formsignal 431 ausgibt. Mit 426 wird der Schalter bezeichnet, der das Schalten gemäss dem
signifikanten Flächensignal 421 ausführt. Mit 432 wird die Entblockeinheit bezeichnet, die
das geblockte Formsignal 427 integriert und das dekodierte Formsignal 433 ausgibt.
-
Die Funktion der wie oben aufgebauten Bilddekodiervorrichtung gemäss der neunten
Ausführungsform wird beschrieben. Die kodierten Signale 419 und 415 werden in die
Dekodierer 420 bzw. 422 eingegeben und dekodiert. Der Dekodierer 420 gibt das
dekodierte signifikante Flächensignal 421 an den Blockgrössenveränderer 430 und den
Schalter 426 aus. Andererseits gibt der Dekodierer 422 das minimale geblockte Formsignal
423, das der minimale Block ist, in dem der Bereich der signifikanten Fläche enthalten ist,
an den Blockgrössenveränderer 430 aus. Der Blockgrössenveränderer 430 verändert die
Blockgrösse zu der durch das eingegebene, dekodierte signifikante Flächensignal
gegebenen Grösse und gibt das veränderte geblockte Formsignal 431 an den Schalter 426 aus. Der
Schalter 426 wird nur auf EIN gestellt, wenn das Eingangssignal ein Signal ist, das den
signifikanten Flächenbereich enthält, der durch das signifikante Flächensignal 421
bezeichnet wird, sonst gibt er den Wert aus, der die Aussenseite des signifikanten
Flächenbereichs anzeigt. Die Entblockeinheit 432 integriert das eingegebene geblockte Formsignal
und das die Aussenseite des signifikanten Flächenbereichs anzeigende Signal und gibt das
zweidimensionale Formsignal als dekodiertes Signal 433 aus.
-
Wie oben beschrieben, hat die Bilddekodiervorrichtung gemäss der neunten
Ausführungsform die Dekodierer 420 und 422, den Blockgrössenveränderer 430, den Schalter 426
und die Entblockeinheit 432, kodiert damit den signifikanten Flächenbereich und dekodiert
auf dieser Grundlage das Formsignal, wodurch das in der achten Ausführungsform
kodierte Signal zweckmässig dekodiert werden kann.
Ausführungsform Nr. 10
-
Ein Aufzeichnungsmedium für ein Bildkodierprogramm und ein
Aufzeichnungsmedium für ein Bilddekodierprogramm verwirklichen die Bildkodiervorrichtungen und die
Bilddekodiervorrichtungen gemäss der ersten bis neunten Ausführungsform.
-
Fig. 50 zeigt eine Diskette, die ein Beispiel eines Aufzeichnungsmediums ist, in
dem das Programm aufgezeichnet wird.
-
Ein Bildkodierprogramm, das in der in Fig. 50 gezeigten Diskette aufgezeichnet ist,
läuft auf einem Personalcomputer, einer Workstation oder dergleichen und verwirklicht
dadurch die Bildkodiervorrichtung gemäss der zweiten Ausführungsform.
-
In ähnlicher Weise läuft ein Bilddekodierprogramm, das in der in Fig. 50 gezeigten
Diskette aufgezeichnet ist, auf einem Personalcomputer, einer Workstation oder
dergleichen und verwirklicht dadurch die Bilddekodiervorrichtung gemäss der dritten
Ausführungsform. In der gleichen Ausführungsform ist dies ein Fall, in dem nach dem
Änderungspixel-Kodierprozess, wie in Fig. 6 beschrieben, die Auswahl durch den Schalter
erfolgt.
-
Wie oben beschrieben, sind in den Programmaufzeichnungsmedien gemäss der
zehnten Ausführungsform das Bildkodierprogramm oder das Bilddekodierprogramm
aufgezeichnet, und dadurch können auf einem Rechnersystem wie einem gewöhnlichen
Personalcomputer oder dergleichen die Bildkodiervorrichtung oder die
Bilddekodiervorrichtung gemäss dieser Erfindung verwirklicht werden.
-
Man bemerke, dass die Vorrichtungen gemäss anderen Ausführungsformen in
ähnlicher Weise verwirklicht werden können, obwohl in der zehnten Ausführungsform die
Bildkodiervorrichtung gemäss der zweiten Ausführungsform bzw. die
Bilddekodiervorrichtung gemäss der dritten Ausführungsform aufgezeichnet sind.
-
Des Weiteren können eine IC-Karte, ein CD-ROM, eine optische Platte, ein
Kassettenband oder dergleichen in ähnlicher Weise eingesetzt werden, sofern sie ein
Medium sind, in dem die Programme aufgezeichnet werden können, obwohl in der
vierzigsten Ausführungsform die Diskette als ein Aufzeichnungsmedium vorgestellt wird.