DE69718834T2

DE69718834T2 - Bilddekodiervorrichtung mit Objektzonendekoder und Formdekoder

Info

Publication number: DE69718834T2
Application number: DE69718834T
Authority: DE
Inventors: Shinya Kadono
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp
Priority date: 1996-05-17
Filing date: 1997-05-15
Publication date: 2003-11-13
Anticipated expiration: 2017-05-16
Also published as: CN1165179C; DE69724672T2; CN1196856A; EP1120970A2; ID17349A; US20020041715A1; DE69724673T2; ES2191177T3; CN1344114A; US20010016006A1; US6560372B1; EP1120975A3; CN1348314A; DE69724673D1; WO1997044956A1; DE69718749D1; US6445826B1; US6188796B1; EP1120972B1; EP1120971B1

Description

Gebiet der Technik

Diese Erfindung bezieht sich auf eine Bildkodiervorrichtung.

Stand der Technik

Die Bildkodiertechnik hat eine lange Geschichte. Ausgezeichnete Normenvorschläge wie zum Beispiel ITU-T H261, ITU-T H263, ISO MPEG1/2 usw. sind aufgestellt worden. Grob gesägt bestehen zwei Vorgehensweisen für Verfahren der Bildkodierung: ein Kodierungsverfahren, das die orthogonale Transformation benutzt, und ein Vorhersagekodierverfahren, bei dem die Abweichung von vorhergesagten Werten unter Verwendung der Vorhersagefunktion kodiert wird.
Obwohl das Kodierverfahren, bei dem die orthogonale Transformation verwendet wird, komplizierte Berechnungen erfordert, kann eine bessere Bildqualität als beim Vorhersagekodierverfahren aufrechterhalten werden, wenn kodierte Signale kleiner Bitzahlen gewonnen werden. Gewöhnliche Kodierverfahren, die die orthogonale Transformation verwenden, wie zum Beispiel JPEG, MPEG und dergleichen, setzen die DCT (diskrete Cosinus-Transformation) ein. Obwohl bekannt ist, dass die DCT eine Kodierung mit einer kleinen Bitzahl ermöglicht, hat sie ihre eigenen Probleme, indem sie eine hochgenaue Multiplikation verlangt, was zu komplizierten Berechnungen führt, und indem die reversible Kodierung nicht möglich ist. Entsprechend kann eine DCT-Berechnung auf Gebieten, auf denen Reversibilität erforderlich ist, nicht verwendet werden.
Im Gegensatz dazu verlangt das Vorhersage-Kodierverfahren einfache Berechnungen und kann eine reversible Kodierung ausführen: Das bei Fax-Schreiben verwendete MMR (Modified Modified Read) ist als ein Bildkodierverfahren bekannt, das Reversibilität besitzt. MMR wird gemäss CCITT-Empfehlung T6 "Fax-Kodiersschemata und Kodiersteuerfunktionen für Fax-Geräte der Gruppe 4" verwendet. Bei diesem Verfahren wird der Differenzwert in der horizontalen Richtung zwischen den Änderungspunkten von Pixelwerten auf der unmittelbar vorher bereits kodierten Abtastzeile und den Änderungspunkten des Pixelwertes auf der noch nicht kodierten Abtastzeile mit variabler Länge kodiert. MMMR (Modified MMR), das ein weiter verbessertes MMR ist, wird als das Auswertemodell für MPEG4 verwendet (ISO/IEC/JTC/SC29/WG11 Nr. 1277, Juli 1996).
Übrigens kann ein Bild, wenn die Bildsignale in Objekte aufgetrennt und die Objekte dann als willkürliche Formen verarbeitet werden, Objekt um Objekt behandelt und zusammengesetzt werden, was zu effektiver Signalübermittlung führt. Bei Anwendungen, in denen die Bitzahl beschränkt ist, ist es unter Verwendung solcher Information möglich, wichtigen Objekten bei der Übermittlung und Aufzeichnung selektiv Priorität zuzuweisen. Im Stande der Technik ist aber die Kodierung von Objekten willkürlicher Form nicht berücksichtigt worden. Die Normierung der Kodierung von Bildsignalen willkürlicher Formen ist in ISO MPEG4 vorangekommen. In MPEG4 wurde ein Auswertemodell unter dem Namen VM3.0 geschaffen (abgedruckt in ISO/IEC/JTCl/SC29/WG11 Nr. 1277), das nunmehr ein einzigartiges Bildkodierverfahren ist, das Bildsignale willkürlicher Form kodieren kann.
Ein Bildsignal willkürlicher Form besteht normalerweise aus der Gestaltinformation, die die Form eines Objekts anzeigt, und aus der Pixelwertinformation (Farbinformation), die die Pixelwerte innerhalb eines Objekts darstellt. Was die Gestaltinformation betrifft, wird entweder die zweiwertige Gestaltinformation, die anzeigt, ob ein Pixel signifikant (im Inneren der Form) oder insignifikant (auf der Aussenseite der Form) ist, oder die Transparenzinformation, die das Verhältnis angibt, wie stark das Objekt den Hintergrund verdeckt, für die jeweiligen Pixel angegeben, die bei der Zusammensetzung mit anderen Bildern verwendet werden. Wenn die Transparenz nur zwei Niveaus hat, nämlich 0% und 100%, ist die Gestaltinformation mit der Transparenzinformation identisch, und das Signal für ein Bild von willkürlicher Form wird dann sowohl durch die zweiwertige Gestaltinformation als auch durch die Pixelwertinformation dargestellt.
Fig. 53 ist eine Zeichnung, die diese Information erklärt. Die Transparenzinformation ist eine Information, die darstellt, welches Verhältnis jedes Pixels für die Zusammensetzung verwendet wird, wenn ein in Fig. 53(a) gezeigter Fisch mit dem anderen Bild zusammengesetzt wird. In Fig. 53(b) ist der Wert der Transparenzinformation in der waagerechten Abtastzeile durch eine gestrichelte Linie in der Figur angezeigt. Die Fläche ausserhalb des Fisches ist vollkommen transparent. Hier wird Transparenz 0 der Einfachheit halber als vollkommen transparent definiert. Daher hat ausserhalb des Fisches die Transparenzinformation einen Wert von Null, während sie innerhalb des Fisches einen Wert hat, der nicht Null ist.
Fig. 53(c) zeigt die Transparenz, die zweiwertig gemacht worden ist, indem sie die beiden Werte Null und Nicht Null annimmt. In Fig. 53(c) verlangen die Pixel, die eine Transparenz von nicht Null besitzen, eine Kodierung der Pixelwertinformation, während die Pixel, die eine Transparenz von Null besitzen, keine Pixelwertinformation erfordern, so dass die zweiwertige Transparenzinformation für die Kodierung der Pixelwertinformation sehr wichtig ist. Andererseits ist die Komponente der Transparenzinformation, die nicht durch zweiwertige Information dargestellt werden kann, wie in Fig. 53(d) gezeigt, mehrwertige Information, die Graustufen genannt wird. Die Gestaltinformation, die, wie oben beschrieben, durch mehrwertige Information dargestellt werden kann, kann ähnlich wie die für die Pixelwertinformation durch Kurvenformkodierung behandelt werden.
Bei Durchführung von Bildkodierung werden auf räumlicher Korrelation und auf zeitlicher Korrelation beruhende Intraframe-Kodierungen getrennt verwendet, und zwar werden beide eingesetzt. In der Interframe-Kodierung wird die Bewegung in geschlossenen Übertragungsblöcken erkannt, und Bewegungskompensation wird für die erkannte Bewegung ausgeführt. Der Bewegungsvektor wird allgemein für die Bewegungskompensation verwendet. In der oben erwähnten VM3.0 werden Intraframe-Kodierung und Interframe-Kodierung Block um Block adaptiv gewechselt, und eine Bewegungskompensation wird ähnlich wie in MPEG1/2 ausgeführt, wodurch die Kodierleistung verbessert wird.
Wenn eine Kodierung eines Bildes durchgeführt wird, das, wie oben beschrieben, aus Gestaltinformation und aus Pixelwertinformation besteht, wird die Kodierleistung gegenüber einer direkten Kodierung der Gestaltinformation weiter verbessert, wenn eine, die Bewegung kompensierende Kodierung einer Gestaltinformation ausgeführt wird, indem der Bewegungsvektor der Pixelwertinformation für die bei der Bildsynthese zu verwendende Gestaltinformation verwendet wird. Darüber wird in ISO/IEC/JTC1/SC29/WG11, Nr. 1260, März 1996, berichtet.
Bei der Bewegungserkennung und Bewegungskompensation wird weiter angenommen, dass es zweckdienlich ist, wenn die Gestaltinformation in eine zweiwertige Gestaltinformationskomponente und in eine mehrwertige Gestaltinformationskomponente aufgetrennt wird, wobei die mehrwertige. Informationskomponente und die Pixelwertinformation zusammen der gleichen Kurvenformkodierung unterworfen werden, was tatsächlich ausgeübt worden ist.
In der oben beschriebenen Bildkodierung und dazugehörigen Bilddekodierung des Standes der Technik bestehen die folgenden Probleme.
Obwohl die MMR-Kodierung ein repräsentatives Verfahren der oben beschriebenen reversiblen (verlustlosen) Kodierung ist, ist es wegen der Reversibilität nicht möglich, die Kompressionsrate stark zu verbessern, indem eine Herabsetzung der visuell weniger wichtigen Bildqualität zugelassen wird.
Darüber hinaus ist MMR ein Intraframe-Kodierverfahren und berücksichtigt nicht die Verbesserung der Kompressionsrate durch Einsatz der Interframe-Korrelation. In MMR und in MMMR, das eine modifizierte Version von MMR ist, wird nur die Differenz zwischen dem Änderungspunkt der derzeitigen Abtastzeile und dem Änderungspunkt der unmittelbar vorausgehenden Abtastzeile eingesetzt, während die Redundanz durch die Korrelation als gerade Linie in der Senkrechten nicht genügend beseitigt wird. Entsprechend ist die Kodierleistung gut, wenn die Änderung des Pixelwertes entlang der Abtastzeile eintritt, aber die Kodierleistung ist schlecht, wenn die Änderung des Pixelwertes nicht entlang der Abtastzeile eintritt. MMR und MMMR beinhalten ferner den waagerechten Kodiermodus, der die Korrelation in der Senkrechten überhaupt nicht einsetzt, um die Pixel zu kodieren, die nicht als die Differenz des Änderungspunktes der unmittelbar vorausgehenden Abtastzeile kodiert werden können. In diesem waagerechten Kodiermodus bleibt Raum für eine weitere Verbesserung der Leistung durch Verwendung der Korrelation in der Senkrechten.
Des Weiteren ist in MMR und MMMR des Standes der Technik eine hierarchische Bildwiedergabe durch Dekodierung eines Teils des Bitstroms nicht möglich. Andere Verfahren, in denen eine hierarchische Bildwiedergabe möglich ist, besitzen keine gute Kodierleistung und weisen den Mangel auf, die kodierende Bitzahl zu erhöhen. Entsprechend gibt es kein Kodierverfahren, das eine wirksame hierarchische Bildwiedergabe ermöglicht.
Wenn ein Bild, das aus Gestaltinformation und Bildinformation besteht, durch Bewegungskompensation kodiert wird, wird des Weiteren die Gestaltinformation unter Verwendung des gleichen Bewegungsvektors bewegungskompensiert, der für die Bildinformation des Standes der Technik verwendet wird. Wenn in einer solchen Situation aber zum Beispiel eine Kugel rotiert, bewegt sich eine auf der Kugel gezeichnete Figur, obwohl die Gestalt der Kugel sich nicht ändert, so dass der Bewegungsvektor der Bildinformation nicht mit dem der Gestaltinformation identisch ist. In einem solchen Falle erfolgt daher keine gute Kodierung, was ein Problem des Kodierverfahrens des Standes der Technik ist.
Weiter beruht, während in VM3.0 ein Verfahren vorliegt, das die Kodierleistung zu verbessern sucht, indem Intraframe-Kodierung und Interframe-Kodierung Block um Block adaptiv vertauscht werden, die. Beurteilung zuungunsten einer Intraframe- oder Interframe- Kodierung ähnlich wie, beim adaptiven Wechsel in MPEG1/2 auf der Pixelwertinformation, so dass es schwierig ist, die Gestaltinformation, sie sich in ihrer Natur weitgehend von der Pixelwertinformation unterscheidet, geeignet und wirksam zu kodieren.
DE-A-41 36 636 beschreibt eine DCT-Kodiertechnik, bei der ein Videoobjekt in eine rechteckige Fläche eingeschlossen ist.
Angesichts der oben beschriebenen Punkte wird diese Erfindung vorgeschlagen, und es ist ein Ziel dieser Erfindung, eine Bilddekodiervorrichtung zur Verfügung zu stellen, die das oben erwähnte, wirksam kodierte Signal in geeigneter Weise dekodieren kann.

Offenbarung der Erfindung

Somit betrifft die vorliegende Erfindung eine Bilddekodiervorrichtung, wie sie im beigefügten Anspruch definiert wird.

Kurze Beschreibung der Zeichnungen

Fig. 22 ist ein Blockdiagramm, das die Struktur einer Bildkodiervorrichtung gemäss einer ersten Ausführungsform zeigt, die keinen Teil dieser Erfindung bildet.
Fig. 23 ist ein Blockdiagramm, das die Struktur einer Bildkodiervorrichtung gemäss einer zweiten Ausführungsform zeigt, die keinen Teil dieser Erfindung bildet.
Fig. 24 ist ein Blockdiagramm, das die Struktur einer Bildkodiervorrichtung gemäss einer dritten Ausführungsform zeigt, die keinen Teil dieser Erfindung bildet.
Fig. 25 ist ein Blockdiagramm, das die Struktur einer Bilddekodiervorrichtung gemäss einer vierten Ausführungsform zeigt, die keinen Teil dieser Erfindung bildet.
Fig. 26 ist ein Blockdiagramm, das die Struktur einer Bildkodiervorrichtung gemäss einer fünften Ausführungsform zeigt, die keinen Teil dieser Erfindung bildet.
Fig. 27 ist ein Blockdiagramm, das die Struktur einer Bildkodiervorrichtung gemäss einer sechsten Ausführungsform zeigt, die keinen Teil dieser Erfindung bildet.
Fig. 28 ist ein Blockdiagramm, das zeigt, wie die Anzahl von Bewegungsvektoren in einer Bildkodiervorrichtung gemäss einer dreiundzwanzigsten Ausführungsform, die keinen Teil dieser Erfindung bildet, ausgewählt wird.
Fig. 29 ist ein Blockdiagramm, das die Struktur einer Bildkodiervorrichtung gemäss einer siebenten Ausführungsform zeigt, die keinen Teil dieser Erfindung bildet.
Fig. 44 ist ein Blockdiagramm, das die Struktur einer Bildkodiervorrichtung gemäss einer achten Ausführungsform zeigt, die keinen Teil dieser Erfindung bildet.
Fig. 45 ist eine Zeichnung, um das Funktionsprinzip einer Bildkodiervorrichtung gemäss einer achten Ausführungsform, die keinen Teil dieser Erfindung bildet, zu erklären.
Fig. 46 ist ein Blockdiagramm, das die Struktur einer Bilddekodiervorrichtung gemäss einer neunten Ausführungsform dieser Erfindung zeigt.
Fig. 50 ist eine Zeichnung, die eine Diskette als ein Beispiel eines Aufzeichnungsmediums für ein Bildkodierprogramm und ein Bilddekodierprogramm gemäss einer zehnten Ausführungsform dieser Erfindung zeigt.

Ausführungsform Nr. 1

Eine Bildkodiervorrichtung gemäss einer ersten Ausführungsform, die keinen Teil dieser Erfindung bildet, empfängt als Bildeingangssignale Bildsignale, die zumindest entweder aus der Gestaltinformation oder der. Transparenzinformation sowie der Pixelinformation bestehen, und kodiert die Bildsignale gemäss dem für die betreffenden Bildsignale zweckmässigen Modus.
Fig. 22 ist eine Blockstruktur, die die Struktur der. Bildkodiervorrichtung gemäss der ersten Ausführungsform zeigt. In der Figur bezeichnet 101 das Bildeingangssignal, das zumindest entweder aus der Gestaltinformation oder der Transparenzinformation sowie der Pixelinformation besteht. Mit 102 wird die Blockeinheit bezeichnet, die das Bildeingangssignal 101 blockt und das geblockte Formsignal 103, das geblockte Transparenzsignal 105 und das geblockte Pixelwertsignal 107 ausgibt. Mit 110 wird die Einheit für die Beurteilung des Form codiermodus bezeichnet, während 114 die Einheit für die Beurteilung des Transparenzkodiermodus und 116 die Einheit für die Beurteilung des Pixelwertkodiermodus bezeichnet, die die für das Formsignal 103, das Transparenzsignal 105 und das Pixelwertsignal 107 jeweils zweckmässigen Kodiermodi beurteilen und den Formkodiermodus 111, den Transparenzkodiermodus 115 und den Pixelwertkodiermodus 119 ausgeben. Mit 112 wird der Formkodierer, mit 116 der Transparenzkodierer und mit 120 der Pixelwertkodierer bezeichnet, die alle die betreffenden Signale gemäss der jeweiligen Beurteilungseinheit kodieren und das kodierte Formsignal 113, das kodierte Transparenzsignal 117 bzw. das kodierte Pixelwertsignal 121 ausgeben. Mit 122 wird der Moduskodierer bezeichnet, der kollektiv alle Kodiermodi 111, 115 und 119 kodiert und das kodierte Modussignal 123 ausgibt.
Die Funktion der wie oben aufgebauten Bildkodiervorrichtung gemäss der ersten Ausführungsform wird erklärt. Zu Beginn wird das Bildeingangssignal 101, das aus der Gestaltinformation, der Transparenzinformation und der Pixelwertinformation besteht, in die Bildkodiervorrichtung gemäss der ersten Ausführungsform eingegeben. Hier werden die Transparenzinformation und die Gestaltinformation unter Bezugnahme auf die im Abschnitt des Standes der Technik verwendete Fig. 53 erklärt. Die Transparenzinformation stellt das Verhältnis jedes zusammenzusetzenden Pixels dar, wenn das in Fig. 53(a) gezeigte Bild mit einem weiteren Bild kombiniert wird, und stellt grundsätzlich mehrwertige Information wie die in Fig. 53(d) gezeigte dar. Die Gestaltinformation ist zweiwertige Information wie die in Fig. 53(c) gezeigte, die zweiwertige Transparenzinformation darstellt, wobei Null und Nicht Null anzeigen, dass das Objekt "existiert/nicht existiert". Man bemerke, dass die Information ausschliesslich durch das oben beschriebene Formsignal dargestellt werden kann und daher die Transparenzinformation nicht erforderlich ist, wenn die Transparenzinformation nur doe beiden Niveaus: vollkommene Transparenz und vollkommene Undurchsichtigkeit besitzt. Entsprechend werden in diesem Falle nur die Gestaltinformation und die Pixelwertinformation kodiert bzw. dekodiert.
Die Blockeinheit 102 blockt das Bildeingangssignal 101, indem es auf der Basis der entsprechenden Beziehung zwischen den Pixeln der Gestaltinformation, der Transparenzinformation und der Pixelwertinformation eine Mehrzahl von Pixeln integriert und das geblockte Formsignal 103, das geblockte Transparenzsignal 105 und das geblockte Pixelwertsignal 107 ausgibt. Das Formsignal 103 wird an die Einheit 110 für die Beurteilung des Formkodiermodus und an den Formkodierer 112 ausgegeben, während das Transparenzsignal 105 an die Einheit 114 für die Beurteilung des Transparenzkodiermodus und den Transparenzkodierer 116 und das Pixelwertsignal 107 an die Einheit 118 für die Beurteilung des Pixelwertkodiermodus und an den Pixelwertkodierer 120 ausgegeben wird.
Die Einheit 110 für die Beurteilung des Formkodiermodus, die Einheit 114 für die Beurteilung des Transparenzkodiermodus und die Einheit 118 für die Beurteilung des Pixelwertkodiermodus beurteilen zweckmässige Kodiermodi für das eingegebene Formsignal 103, das eingegebene Transparenzsignal 105 bzw. das eingegebene Pixelwertsignal 107 und geben den Formkodiermodus 111, den Transparenzkodiermodus 115 und den Pixelwertkodiermodus 119 aus. Jeder Kodiermodus wird an jede Kodiermoduseinheit sowie an die Moduskodiereinheit 122 ausgegeben.
Der Formkodierer 112, der Transparenzkodierer 116 und der Pixelwertkodierer 120 geben die betreffenden Eingangssignale gemäss jedem der eingegebenen Kodiermodi aus und geben das kodierte Formsignal 113, das kodierte Transparenzsignal 117 und das kodierte Pixelwertsignal 121 aus. Andererseits kodiert der Moduskodierer 122 kollektiv alle eingegebenen Kodiermodi und gibt das kodierte Modussignal 123 aus. Das kodierte Formsignal 113, das kodierte Transparenzsignal 117, das kodierte Pixelwertsignal 121 und das kodierte Modussignal 123 sind die kodierten Ausgangssignale der Bildkodiervorrichtung gemäss der achtzehnten Ausführungsform.
Wie oben beschrieben, haben die kodierten Ausgangssignale der Bildkodiervorrichtung gemäss der ersten Ausführungsform die Blockeinheit 401, die das Bildeingangssignal blockt und das Bildeingangssignal in das Formsignal, das Transparenzsignal und das Pixelwertsignal auftrennt und diese Signale ausgibt, sowie die Kodiermodusbeurteilungseinheiten 110, 114 und 118, die die für jedes Signal jeweils zweckmässigen Kodiermodi beurteilen, die Kodierer 112, 116 und 120, die jedes Signal gemäss jedem Kodiermodus kodieren, und den Moduskodierer 122, der kollektiv alle Kodiermodi kodiert, und dadurch ist es möglich, dass die Kodierung gemäss dem für jedes getrennte Signal zweckmässigen Modus ausgeführt wird und die gesamte, mit dem ausgewählten Modus in Beziehung stehende Information kollektiv kodiert wird. Da die Gestaltinformation, die Transparenzinformation und die Pixelwertinformation oft eine gegenseitige Korrelation besitzen, ist es wahrscheinlich, dass der gleiche Kodiermodus ausgewählt wird. Durch Ausführung der Kodierung mit variabler Länge, worin die Kodes, denen der gleiche Modus zugeteilt worden ist, die kurze Kodelänge haben sollen, ergibt sich die mögliche Verringerung der Bitzahl des kodierten Signals.

Ausführungsform Nr. 2

Eine Bildkodiervorrichtung gemäss einer zweiten Ausführungsform, die keinen Teil dieser Erfindung bildet, empfängt als Bildeingangssignale Bildsignale, die zumindest entweder aus der Gestaltinformation oder der Transparenzinformation sowie der Pixelinformation bestehen, und kodiert die Bildsignale gemäss dem für die betreffenden Bildsignale zweckmässigen Modus.
Fig. 23 ist eine Blockstruktur, die die Struktur der Bildkodiervorrichtung gemäss der zweiten Ausführungsform zeigt. In der Figur beurteilt die Einheit 110 für die. Beurteilung des Formkodiermodus den für das Formsignal 103 zweckmässigen Kodiermodus und gibt das Ergebnis der Beurteilung als Kodiermodus an den Formkodierer 112, den Moduskodierer 122 sowie an die Einheit 130 für die Beurteilung des Transparenzkodiermodus und die Einheit 132 für die Beurteilung des Pixelwertkodiermodus aus. Danach führt die Einheit 130 für die Beurteilung des Transparenzkodiermodus die Beurteilung unter Bezugnahme auf den eingegebenen Formkodiermodus 111 aus und gibt das Ergebnis der Beuteilung als Kodiermodus an den Transparenzkodierer 116, den Moduskodierer 122 sowie an die Einheit 132 für die Beurteilung des Pixelwertkodiermodus aus. Die Einheit 132 für die Beurteilung des Pixelwertkodiermodus führt die Beurteilung unter Bezugnahme auf den eingegebenen Formkodiermodus 111 und den eingegebenen Transparenzkodiermodus 115 aus.
Die Funktion der Bildkodiervorrichtung gemäss der zweiten Ausführungsform ist mit Ausnahme der Beurteilungen der jeweiligen Modusbeurteilungseinheiten der der ersten Ausführungsform ähnlich und gibt das kodierte Formsignal 111, das kodierte Transparenzsignal 117, das kodierte Pixelwertsignal. 121 und das kodierte Modussignal 123 in ähnlicher Weise aus.
Wie oben beschrieben, hat die Bildkodiervorrichtung gemäss der zweiten Ausführungsform die Einheit 130 für die Beurteilung des Transparenzkodiermodus, die den Kodiermodus des Transparenzsignals unter Bezugnahme auf den Formkodiermodus beurteilt, sowie die Einheit 132 für die Beurteilung des Pixelwertkodiermodus, die den Kodiermodus des Pixelwertsignals unter Bezugnahme sowohl auf den Formkodiermodus als auch auf den Transparenzkodiermodus beurteilt, wodurch es wahrscheinlich ist, dass die ausgewählten Modi die gleichen sind. Entsprechend kann im Moduskodierer 122, in dem ein kürzerer Kode in dem Fall zugewiesen wird, in dem die Modi gleich sind, die Leistung der Kodierung mit variabler Länge mehr als in der ersten Ausführungsform verbessert werden, und die Bitzahl des kodierten Modussignals kann verringert werden, was das erreichte Ergebnis ist.

Ausführungsform Nr. 3

Eine Bildkodiervorrichtung gemäss einer dritten Ausführungsform verbessert die Kodierleistung des kodierten Modussignals ähnlich wie die der zweiten Ausführungsform.
Fig. 24 ist eine Blockstruktur, die die Struktur der Bildkodiervorrichtung gemäss der dritten Ausführungsform zeigt. In der Figur beurteilt die Einheit 118 für die Beurteilung des Pixelwertkodiermodus den für das Pixelwertsignal 107 zweckmässigen Kodiermodus und gibt das Ergebnis der Beurteilung als Kodiermodus an den Pixelwertkodierer 120, den Moduskodierer 122 sowie auch an die Einheit 136 für die Beurteilung des Transparenzkodiermodus und die Einheit 138 für die Beurteilung des Formkodiermodus aus. Danach führt die Einheit 136 für die Beurteilung des Transparenzkodiermodus die Beurteilung unter Bezugnahme auf den eingegebenen Pixelwertkodiermodus 119 aus und gibt das Ergebnis der Beurteilung als Kodiermodus an den Transparenzkodierer 116, den Moduskodierer 122 sowie auch an die Einheit 138 für die Beurteilung des Formkodiermodus aus. Die Einheit 138 für die Beurteilung des Formkodiermodus führt die Beurteilung unter Bezugnahme auf den eingegebenen Pixelwertkodiermodus 119 und den eingebenen Transparenzkodiermodus 115 aus.
Die Funktion der Bildkodiervorrichtung gemäss der dritten Ausführungsform ist mit Ausnahme der Beurteilungen der jeweiligen Modusbeurteilungseinheiten der der ersten Ausführungsform ähnlich und gibt das kodierte Formsignal 113, das kodierte Transparenzsignal 117, das kodierte Pixelwertsignal 121 und das kodierte Modussignal 123 in ähnlicher Weise aus.
Wie oben beschrieben, hat die Bildkodiervorrichtung gemäss der dritten Ausführungsform die Einheit 136 für die Beurteilung des Transparenzkodiermodus, die den Kodiermodus des Transparenzsignals unter Bezugnahme auf den Pixelwertkodiermodus beurteilt, sowie die Einheit 138 für die Beurteilung des Formkodiermodus, die den Kodiermodus des Formsignals unter Bezugnahme sowohl auf den Pixelwertkodiermodus als auch auf den Transparenzkodiermodus beurteilt, wodurch es wahrscheinlich ist, dass die ausgewählten Modi die gleichen sind. Entsprechend kann im Moduskodierer 122, in dem ein kürzerer Kode in dem Fall zugewiesen wird, in dem die Modi gleich sind, die Leistung der Kodierung mit variabler Länge mehr als in der ersten Ausführungsform verbessert werden, und die Bitzahl des kodierten Modulsignals kann verringert werden, was das erreichte Ergebnis ist.

Ausführungsform Nr. 4

Eine Bilddekodiervorrichtung gemäss einer vierten Ausführungsform, die keinen Teil dieser Erfindung bildet, kodiert das durch die Bildkodiervorrichtung gemäss der ersten Ausführungsform kodierte Signal in zweckmässiger Weise.
Fig. 25 ist eine Blockstruktur, die die Struktur der Bilddekodiervorrichtung gemäss der vierten Ausführungsform zeigt. In der Figur sind die Eingangssignale 113, 117, 119 und 123 das kodierte Formsignal 113, das kodierte Transparenzsignal 117, das kodierte Pixelwertsignal 119 bzw. das kodierte Modussignal 123, die alle von der Bildkodiervorrichtung gemäss der ersten Ausführungsform ausgegeben werden. Mit 150 wird der Modusdekodierer bezeichnet, der das kodierte Modussignal 123 dekodiert und den Formkodiermodus 151, den Transparenzkodiermodus 153 und den Pixelwertkodiermodus 155 ausgibt. Mit 156 ist der Formdekodierer, mit 158 der Transparenzdekodierer und mit 160 der Pixelwertdekodierer bezeichnet, die das kodierte Formsignal 113, das kodierte Transparenzsignal 117 bzw. das kodierte Pixelwertsignal 119 gemäss den vom Modusdekodierer 150 eingegebenen Kodiermodi kodieren und das dekodierte Formsignal 157, das dekodierte Transparenzsignal 159 bzw. das dekodierte Pixelwertsignal 161 ausgeben. Mit 162 wird die Entblockeinheit bezeichnet, die das dekodierte Formsignal 157, das dekodierte Transparenzsignal 159 und das dekodierte Pixelwertsignal 161 empfängt und integriert und das dekodierte Bildsignal 163 ausgibt.
Die Funktion der wie oben aufgebauten Bilddekodiervorrichtung gemäss der vierten Ausführungsform wird beschrieben. Die Bilddekodiervorrichtung gemäss der vierten Ausführungsform empfängt das kodierte Formsignal 113, das kodierte Transparenzsignal 117, das kodierte Pixelwertsignal 119 und das kodierte Modussignal 123, um sie in den Formdekodierer 156, den Transparenzdekodierer 158, den Pixelwertdekodierer 160 bzw. den Modusdekodierer 150 auszugeben.
Der Modusdekodierer 150 dekodiert das kodierte Modussignal 123 und gibt den Formkodiermodus 151, den Transparenzkodiermodus 153 und den Pixelwertkodiermodus 155 in den Formdekodierer 156, den Transparenzdekodierer 158 bzw. den Pixelwertdekodierer 160 aus. Der Formdekodierer 156, der Transparenzdekodierer 158 und der Pixelwertdekodierer 160 dekodieren die eingegebenen, kodierten Signale gemäss dem jeweils eingegebenen Kodiermodus und geben das dekodierte Formsignal 157, das dekodierte Transparenzsignal 159 und das dekodierte Pixelwertsignal 161 in die Entblockeinheit 162 aus. Die Entblockeinheit 162 integriert die eingegebenen dekodierten Signale und gibt das dekodierte Bildsignal 163 aus.
Wie oben beschrieben, hat die Bilddekodiervorrichtung gemäss der vierten Ausführungsform den Modusdekodierer 150, den Formdekodierer 156, den Transparenzdekodierer 158, den Pixelwertdekodierer 160 und die Entblockeinheit 162 und dekodiert dadurch in zweckmässiger Weise das von der Bildkodiervorrichtung gemäss der ersten Ausführungsform gewonnene kodierte Signal, führt die Integration aus und kann das dekodierte Bildsignal 163 gewinnen.
Man bemerke, dass in der Bilddekodiervorrichtung gemäss der vierten Ausführungsform die in den Bildkodiervorrichtungen gemäss der zweiten und dritten Ausführungsform gewonnenen kodierten Signale ebenfalls in zweckmässiger Weise dekodiert werden können, obwohl das durch die Bildkodiervorrichtung gemäss der achtzehnten Ausführungsform gewonnene, kodierte Bildsignal [].

Ausführungsform Nr. 5

Eine Bildkodiervorrichtung gemäss einer fünften Ausführungsform, die keinen Teil dieser Erfindung bildet, führt die Kodierung eines Eingangssignals durch, während sie die Intra- und Interframekodierung in Anpassung an das Eingangssignal wechselt.
Fig. 26 ist eine Blockstruktur, die die Struktur der Bildkodiervorrichtung gemäss der fünften Ausführungsform zeigt. In der Figur bezeichnet 178 eine Einheit für die Beurteilung der Intra- und Interframekodierung der Pixelkodierung, die Intra- gegen Inter- für den Kodiermodus des Pixelwertsignals beurteilt und den Kodiermodus 119 des Pixelwertsignals ausgibt. Mit 138 wird die Einheit für die Beurteilung des Formkodiermodus bezeichnet, die der Einheit, für die Beurteilung des Formkodiermodus in der zwanzigsten Ausführungsform entspricht, die in Fig. 24 mit 138 bezeichnet ist. Mit 170 und 176 sind die Schalter bezeichnet, die gemäss dem Ausgangssignal der Beurteilungseinheit 178 gestellt sind und den Kodiermodus des Formsignals bestimmen. Mit 172 wird die Einheit für die Beurteilung der Intra- und Interframekodierung bezeichnet, die Intra- gegen Inter- für den Kodiermodus des Formsignals beurteilt und den Kodiermodus 173 des Formsignals ausgibt. Die weiteren Ziffern sind denen in Fig. 22 ähnlich, und die Beschreibung ist der der ersten Ausführungsform ähnlich.
Eine Beschreibung der wie oben aufgebauten Bildkodiervorrichtung gemäss der fünften Ausführungsform wird gegeben. Zu Beginn wird das Bildeingangssignal 101 in die Bildkodiervorrichtung gemäss der fünften Ausführungsform eingegeben, und die Blockeinheit 102 führt ähnlich wie in der achtzehnten Ausführungsform das Blocken und die Signalauftrennung durch und gibt das Pixelwertsignal und das Formsignal aus.
Wenn das abgetrennte Pixelwertsignal 107 in die Einheit für die Beurteilung von Intra- und Interframekodierung der Pixelwertkodierung eingegeben wird, urteilt Beurteilungseinheit 178, ob die Kodierung mit Intraframekodierung oder Interframekodierung erfolgt, und gibt das Ergebnis der Beurteilung als den Pixelwertkodiermodus, der "Intra" bzw. "Inter" anzeigt, an den. Pixelwertkodierer 120, den Moduskodierer 122 und die Einheit 138 für die Beurteilung des Formkodiermodus aus.
In der Einheit 138 für die Beurteilung des Formkodiermodus sind die Schalter 170 und 176 gemäss dem Pixelwertkodiermodus 119 gestellt. Die Schaltung erfolgt in der Weise, dass die Beurteilungseinheit 178 das Eingangssignal nicht empfängt, wenn der Pixelwertkodiermodus "Intra" anzeigt, während die Beurteilungseinheit 178 das Eingangssignal empfängt, wenn der Pixelwertkodiermodus "Inter" anzeigt. Entsprechend wird der Formbeurteilungsmodus 111, der Intraframekodierung anzeigt, von der Beurteilungseinheit 138 ausgegeben, wenn der Pixelwertkodiermodus 119 Intraframekodierung anzeigt.
Wenn andererseits der Pixelwertkodiermodus 119 Interframekodierung anzeigt, urteilt die Einheit 172 für die Beurteilung von Intra- und Interframekodierung, ob die Kodierung des spezifischen Formsignals für das Formsignal 105 mit Intraframekodierung oder mit Interframekodierung erfolgt, und gibt das Ergebnis der Beurteilung als Formkodiermodus 111 aus.
In jedem Falle wird der Formkodiermodus 111 an den Formkodierer 112 und den Moduskodierer 122 ausgegeben. Die Funktionen des Pixelwertkodierers 120, des Formkodierers 112 und des Moduskodierers 122, die alle die jeweiligen kodierten Signale ausgeben, sind denen der ersten Ausführungsform ähnlich.
Es erhellt aus der oben beschriebenen Arbeitsweise, dass in der Bildkodiervorrichtung gemäss der fünften Ausführungsform das Formsignal immer intraframe-kodiert ist, wenn das Pixelwertsignal intraframe-kodiert ist. Allgemein sind, wenn die Pixelwerte sich nicht in Übereinstimmung befinden, die Formen auch nicht in Übereinstimmung, daher ist, wenn das Pixelwertsignal intraframe-kodiert werden soll, das heisst, wenn das Pixelwertsignal eine geringe zeitliche Korrelation besitzt, die Kodierleistung bei der Kodierung des Formsignals kaum herabgesetzt, selbst wenn die Anzahl der Kodiermodi für die Kodierung des Formsignals ähnlich der zweiundzwanzigsten Ausführungsform begrenzt ist.
Es gibt auch den Fall, wo sich die zusammenzufügenden Pixelwerte ändern werden, obwohl das Formsignal beim Zusammenfügen konstant ist, wie bei einem feststehenden Bild (zusammengefügtes Bild) und dergleichen, und in diesem Falle ist die Interframekodierung für das Formsignal nicht immer zweckmässig, selbst wenn die Interframekodierung gemäss dem Pixelwertsignal ausgewählt wurde. Wenn in der Bildkodiervorrichtung gemäss der zweiundzwanzigsten Ausführungsform die Interframekodierung für das Pixelwertsignal ausgewählt worden ist, wird beurteilt, ob Intra- oder Interframekodierung für das Formsignal gewählt werden soll, so dass es auch möglich ist, die Intraframekodierung für das Formsignal auszuwählen, wodurch es möglich ist, eine ernsthafte Herabsetzung der Kodierleistung auf Grund der für die Kodierung des Formsignals unzweckmässigen Interframekodierung zu verhindern.
Ferner ist, wenn zumindest entweder das Formsignal oder das Pixelwertsignal interframe-kodiert wird, eine Menge zusätzlicher Information für die in der Interframekodierung auszuführende Bewegungskompensation usw. erforderlich. In der Bildkodiervorrichtung gemäss der fünften Ausführungsform gibt es keinen Fall, in dem nur das Formsignal interframe-kodiert wird, so dass die Bitzahl niedrig gehalten werden kann, wenn die Intraframekodierung für das Pixelwertsignal ausgewählt wird. Allgemein hat die oben erwähnte zusätzliche Information die kleinere Bitzahl als in dem Fall, in dem das Pixelwertsignal intraframe-kodiert wird, aber im Vergleich zu der für Intraframekodierung des Formsignals erforderlichen Bitzahl ist die Bitzahl so hoch, dass sie nicht unbeachtet bleiben kann, was eine grosse Auswirkung hat.
Wie oben beschrieben, hat die Bildkodiervorrichtung gemäss der fünften Ausführungsform die Einheit 178 für die Beurteilung der Intra- und Interframekodierung für das Pixelwertsignal und die Einheit 138 für die Beurteilung des Formkodiermodus, die die Einheit 172 für die Beurteilung der Intra- und Interframekodierung für das Formsignal einschliesst, daher kodiert der Intraframe den Kodiermodus des Formsignals, wenn der Kodiermodus des Pixelwertsignals die Intraframekodierung ist, während der Kodiermodus für das Formsignal beurteilt und auswählt wird, wenn der Kodiermodus des Pixelwertsignals die Interframekodierung ist, was zu einer höheren Korrelation zwischen dem Kodiermodus 119 für das Pixelwertsignal und dem Kodiermodus 111 für das Formsignal führt und dadurch die Verringerung der Bitzahl des kodierten Modussignals zustande bringt und es ermöglicht, dass im Ergebnis der Verhinderung der Wahl der Interframekodierung die Bitzahl der zusätzlichen Information für die Bewegungskompensation verringert wird.

Ausführungsform Nr. 6

Eine Bildkodiervorrichtung gemäss einer sechsten Ausführungsform, die keinen Teil dieser Erfindung bildet, führt die Kodierung des Eingangssignals durch, während sie die Zahl der Bewegungsvektoren bei der Kodierung in Anpassung an das Eingangssignal wechselt.
Fig. 27 ist eine Blockstruktur, die die Struktur der Bildkodiervorrichtung gemäss der sechsten Ausführungsform zeigt. In der Figur bezeichnet 188 die Einheit für die Beurteilung der Zahl der Bewegungsvektoren für die Kodierung des Pixelwertes, die urteilt, welches die Anzahl von Bewegungsvektoren sein soll, und gibt den Kodiermodus 119 für das Pixelwertsignal aus. Mit 138 wird die Einheit für die Beurteilung des Formkodiermodus bezeichnet, die der Einheit für die Beurteilung des Formkodiermodus gemäss der zwanzigsten Ausführungsform entspricht, die in Fig. 24 mit 138 bezeichnet ist. Mit 180 und 186 werden Schalter bezeichnet, die gemäss dem Ausgangssignal der Beurteilungseinheit 188 schalten und den Kodiermodus für das Formsignal bestimmen. Mit 182 wird die Einheit für die Beurteilung der Zahl von Bewegungsvektoren für die Formkodierung bezeichnet, die urteilt, welches die Anzahl von Bewegungsvektoren sein soll, und den Kodiermodus 183 für das Formsignal gemäss dem Ergebnis der Beurteilung ausgibt. Die weiteren Kodierungen sind denen in Fig. 22 ähnlich, und die Beschreibung ist der für die erste Ausführungsform ähnlich.
Die Beschreibung der wie oben aufgebauten Bildkodiervorrichtung gemäss der sechsten Ausführungsform wird gegeben. Zu Beginn empfängt die Bildkodiervorrichtung gemäss der sechsten Ausführungsform das Bildeingangssignal 101, und die Blockeinheit 102 führt ähnlich wie in der ersten Ausführungsform das Blocken und die Auftrennung des Signals durch und gibt das Pixelwertsignal und das Formsignal aus.
Die Einheit 188 für die Beurteilung der Zahl der Bewegungsvektoren für die Kodierung des Pixelwertes empfängt das abgetrennte Pixelwertsignal 107, beurteilt dann das zu kodierende Signal bezüglich der Anzahl der Bewegungsvektoren für das Pixelwertsignal 107 und gibt das Ergebnis der Beurteilung als Pixelwertkodiermodus 119 an den Pixelwertkodierer 120, den Moduskodierer 122 und die Einheit 138 für die Beurteilung des Formkodiermodus aus.
Fig. 28 ist eine Zeichnung zur Erklärung der Anzahl der Bewegungsvektoren. Da die Bewegung in der Nähe des Umrisses eines Objekts kompliziert ist, ist es sehr schwierig, unter Einsatz nur eines Bewegungsvektors (motion vector MV) pro Block den Bewegungskompensationsfehler genügend stark zu verringern. In diesem Falle ist es bekannt, dass es wünschenswert ist, den Block zu unterteilen und dann die aufgeteilten Blöcke den Bewegungsvektoren zuzuweisen, und diese an die Natur des Bildes angepasste Änderung der Anzahl der Bewegungsvektoren verbessert die Kodierleistung. Entsprechend wechselt die Bildkodiervorichtung gemäss der sechsten Ausführungsform adaptiv zwischen der Bewegungskompensation unter Verwendung nur eines Bewegungsvektors (MV1) pro Block, wie in der Figur gezeigt, und der Bewegungskompensation unter Verwendung von insgesamt vier Bewegungsvektoren (MV1, MV2, MV3, MV4), die jeweils einem der getrennten Blöcke zugewiesen werden, in die der einzelne Block aufgetrennt wurde. Daher urteilt die Beurteilungseinheit 188, ob die Anzahl der Bewegungsvektoren eins oder vier ist, und gibt "1" bzw. "4" als Kodiermodus für die Kodierung des Pixelwertes aus.
In der Einheit 138 für den Formkodiermodus werden die Sehalter 180 und 186 gemäss dem Pixelwertkodiermodus gestellt. Die Schaltung erfolgt so, dass die Beurteilungseinheit 182 das Eingangssignal nicht empfangen kann, wenn der Pixelwertkodiermodus "1" anzeigt, während die Beurteilungseinheit 182 das Eingangssignal empfangen kann, wenn der Pixelwertkodiermodus "4" anzeigt. Entsprechend wird die minimale Anzahl "1" von Bewegungsvektoren als Formbeurteilungsmodus 111 ausgegeben, wenn der Pixelwertkodiermodus 119 "1" ist.
Wenn andererseits der Pixelwertkodiermodus 119 "4" anzeigt, urteilt die Einheit 182 für die Beurteilung der Zahl von Bewegungsvektoren, ob die Anzahl der Bewegungsvektoren für das Formsignal 105 eins oder vier sein sollte, und gibt das Ergebnis der Beurteilung als Formkodiermodus 111 aus.
In jedem Fall wird der Formkodiermodus 111 an den Formkodierer 112 und den Moduskodierer 122 ausgegeben. Die Funktionen des Pixelwertkodierers 120, des Formkodierers 112 und des Moduskodierers 122 sind denen der ersten Ausführungsform ähnlich, und die entsprechenden kodierten Signale werden ausgegeben.
In der Bildkodiervorrichtung gemäss der sechsten Ausführungsform wird im Ergebnis der oben beschriebenen Abläufe das Formsignal immer unter Verwendung der minimalen Anzahl von Bewegungsvektoren kodiert, wenn das Pixelwertsignal unter Verwendung der minimalen Anzahl von Bewegungsvektoren kodiert wird. Mit steigender Anzahl der Bewegungsvektoren steigt die für die Kodierung der Bewegungsvektoren erforderliche Information nachteilig an. In diesem Falle wird durch die Verringerung der Zahl von Bewegungsvektoren für die Kodierung des Formsignals ein Ansteigen der Last verhindert.
Wie oben beschrieben, hat die Bildkodiervorrichtung gemäss der dreiundzwanzigsten Ausführungsform die Einheit 188 für die Beurteilung der Zahl von Bewegungsvektoren für die Kodierung des Pixelwertes und die Einheit 138 für die Beurteilung des Formkodiermodus, die die Einheit 182 für die Beurteilung der Zahl von Bewegungsvektoren für die Formkodierung einschliesst. Daher verwendet der Kodiermodus für das Formsignal die minimale Anzahl von Bewegungsvektoren, wenn der Kodiermodus für das Pixelwertsignal die minimale Anzahl von Bewegungsvektoren verwendet. Wenn der Kodiermodus für das Pixelwertsignal eine grosse Anzahl von Bewegungsvektoren verwendet, wird der Kodiermodus für das Formsignal beurteilt und dann ausgewählt. Das führt zur Korrelation zwischen dem. Kodiermodus 119 für das Pixelwertsignal und dem Kodiermodus. 111 für das Formsignal und ermöglicht eine Verringerung der Bitzahl des kodierten Modussignals, es verursacht auch die Verhinderung der Auswahl, wenn die Anzahl von Bewegungsvektoren ansteigt, und ermöglicht es dadurch, dass verhindert wird, dass die Bitzahl wegen des Anstiegs der zusätzlichen Information ansteigt.

Ausführungsform Nr. 7

Eine Bildkodiervorrichtung gemäss einer siebenten Ausführungsform, die keinen Teil dieser Erfindung bildet, führt die Kodierung des Eingangssignals durch, während sie in Anpassung an das Eingangssignal zwischen einer Veränderung und Nichtveränderung des Quantisierungsschritts wechselt.
Fig. 27 ist eine Blockstruktur, die die Struktur der Bildkodiervorrichtung gemäss der siebenten Ausführungsform zeigt. In der Figur bezeichnet 198 die Einheit für die Beurteilung einer Änderung oder Nichtänderung des Quantisierungsschrittes für die Kodierung des Pixelwertes, die beurteilt, ob der Quantisierungsschritt für den Kodiermodus für das Pixelwertsignal durchgeführt oder nicht durchgeführt wird, und gibt den Kodiermodus 119 für das Pixelwertsignal aus. Mit 138 wird die Einheit für die Beurteilung des Formkodiermodus bezeichnet, die der Einheit für die Beurteilung des Formkodiermodus gemäss der dritten Ausführungsform entspricht, die in Fig. 24 mit 138 bezeichnet ist. Mit 190 und 196 werden die Schalter bezeichnet, die gemäss dem Ausgangssignal der Beurteilungseinheit 198 gestellt werden und den Kodiermodus für das Formsignal bestimmen. Mit 192 wird die Einheit für die Beurteilung einer Änderung oder Nichtänderung des Quantisierungsschrittes für die Formkodierung bezeichnet, die urteilt, ob der Quantisierungsschritt für den Kodiermodus für das Formsignal ausgeführt wird oder nicht, und den Kodiermodus 113 für das Formsignal gemäss dem Ergebnis der Beurteilung ausgibt. Die weiteren Kodierungen sind denen in Fig. 22 ähnlich, und die Beschreibung ist der für die erste Ausführungsform ähnlich.
Die Beschreibung der wie oben aufgebauten Bildkodiervorrichtung gemäss der siebenten Ausführungsform wird gegeben. Zu Beginn empfängt die Bildkodiervorrichtung gemäss der vierundzwanzigsten Ausführungsform das Bildeingangssignal 101, und die Blockeinheit 102 führt ähnlich wie in der ersten Ausführungsform das Blocken und die Auftrennung des Signals durch und gibt das Pixelwertsignal und das Formsignal aus.
Die Einheit 198 für die Beurteilung einer Änderung oder Nichtänderung des Quantisierungsschrittes empfängt das abgetrennte Pixelwertsignal 107, beurteilt dann, ob der Quantisierungsschritt für das Pixelwertsignal 107 durchgeführt oder nicht durchgeführt wird, und gibt das Ergebnis der Beurteilung als Pixelwertkodiermodus 119 an den Pixelwertkodierer 120, den Moduskodierer 122 und die Einheit 138 für die Beurteilung des Formkodiermodus aus.
In der Einheit 138 für den Formkodiermodus werden Schalter 190 und 196 gemäss dem Pixelwertkodiermodus gestellt. Die Schaltung erfolgt so, dass die Beurteilungseinheit 192 das Eingangssignal nicht empfangen kann, wenn der Pixelwertkodiermodus "Nichtänderung" anzeigt, während die Beurteilungseinheit 192 das Eingangssignal empfangen kann, wenn der Pixelwertkodiermodus "Änderung" anzeigt. Entsprechend wird der Formbeurteilungsmodus 111, der "Nichtänderung" anzeigt, ausgegeben, wenn der Pixelwertkodiermodus 119 anzeigt, dass der Quantisierungsschritt nicht verändert wird.
Wenn andererseits der Pixelwertkodiermodus 119 anzeigt, dass der Quantisierungsschritt verändert wird, urteilt die Beurteilungseinheit 192, ob der Quantisierungsschritt für das Formsignal 105 ausgeführt oder nicht ausgeführt wird, und gibt das Ergebnis der Beurteilung als Formkodiermodus 111 aus.
In jedem Fall wird der Formkodiermodus 111 an den Formkodierer 112 und den Moduskodierer 122 ausgegeben. Die Funktionen des Pixelwertkodierers 120, des Formkodierers 112 und des Moduskodierers 122 sind denen der ersten Ausführungsform ähnlich, und die entsprechenden kodierten Signale werden ausgegeben.
Da der Wert des Quantisierungsschritts direkt mit der Kompressionsrate, d. h. der Übertragungsrate der kodierten Signale, in Beziehung steht, wird allgemein der Quantisierungsschritt grob gesteuert, wenn die Übertragungsrate gleich dem gegebenen Wert oder grösser als dieser ist, während der Quantisierungsschritt fein gesteuert wird, wenn die Übertragungsrate kleiner als der gegebene Wert ist, damit die Übertragungs- oder Aufzeichnungsrate des kodierten Signals, zu dem das Bild kodiert wird, konstant bleibt. Da der Wert des Quantisierungsschritts auch direkt die Bildqualität des kodierten Signals beeinflusst, kann die Kompressionsrate erhöht werden, indem der Quantisierungsschritt grösser gemacht wird, wenn das Bild ein Bild ist, bei dem stufenartige Veränderungen der Pixelwerte vorhanden sind, da ein Abfall der Bildqualität in der Amplitudenrichtung visuell schwer erkannt werden kann. In diesem Falle erfolgt die Änderung des Quantisierungsschrittes gewöhnlich in Übereinstimmung mit der Änderung des Pixelwertes.
Wenn eine Steuerung der Änderung des Quantisierungsschrittes erfolgt, wie oben beschrieben, wird die Information, die anzeigt, dass "der Quantisierungsschritt geändert worden ist", zu jedem Block hinzugefügt und zusammen mit den Bilddaten kodiert. Oft sollte, allerdings die Änderung des Quantisierungsschrittes derart erfolgen, dass das Pixelwertsignal und das Formsignal gleichzeitig verändert werden, so dass, wenn der Quantisierungsschritt für das Pixelwertsignal nicht verändert wird, selbst dann, wenn die Änderung des Quantisierungsschritts für das Formsignal verhindert wird, der Abfall der Bildqualität, der durch die Beschränkung verursacht wird, klein ist, während die zusätzliche Information, die die Änderung des Quantisierungsschrittes anzeigt, in starkem Ausmass verringert wird.
Wie oben beschrieben, hat die Bildkodiervorrichtung gemäss der siebenten Ausführungsform die Einheit 198 für die Beurteilung einer Änderung oder Nichtänderung des Quantisierungsschritts für die Kodierung des Pixelwertes und die Einheit 138 für die Beurteilung des Formkodiermodus, die die Einheit 192 für die Beurteilung einer Änderung oder Nichtänderung des Quantisierungsschrittes für die Formkodierung einschliesst, und daher ist der Kodiermodus für das Formsignal "Nichtänderung des Quantisierungsschrittes", wenn der Kodiermodus für das Pixelwertsignal "Nichtänderung des Quantisierungsschrittes" ist, während, wenn der Kodiermodus für das Pixelwertsignal "Änderung des Quantisierungsschrittes" ist, der Kodiermodus für das Formsignal beurteilt und ausgewählt wird, was zur Korrelation zwischen dem Kodiermodus 119 für das Pixelwertsignal und dem Kodiermodus 1111 für das Formsignal führt und eine Verringerung der Bitzahl des kodierten Modussignals ermöglicht, die Verhinderung der Wahl der Änderung des Quantisierungsschrittes verursacht und es dadurch ermöglicht, dass der Anstieg der zusätzlichen Information wegen der Änderung des Quantisierungsschrittes verhindert und die Bitzahl verringert wird.
Man bemerke, dass, obwohl die Strukturen der Bildkodiervorrichtungen gemäss der fünften bis siebenten Ausführungsform auf der in Fig. 24 gezeigten dritten Ausführunsform beruhen, diese auch auf der in Fig. 23 gezeigten zweiten Ausführungsform beruhen körnen, dass ferner die Korrelation der Kodiermodi stärker wird und ein Anstieg der zusätzlichen Information verhindert wird, was die Verringerung der Bitzahl ermöglicht. Es ist auch möglich, sie auf die in Fig. 20 gezeigte erste Ausführungsform zu gründen, und die Bitzahl wird verringert, während für die jeweiligen Signale geeignete Kodierungen realisiert werden.
Ferner können die durch die Bildkodiervorrichtungen gemäss der fünften bis siebenten Ausführungsform gewonnenen, kodierten Signale durch die Bilddekodiervorrichtung gemäss der dritten Ausführungsform zweckmässig dekodiert werden.
Ferner wird in der fünften bis siebenten Ausführungsform das Bildeingangssignal in das Pixelwertsignal und das Formsignal aufgetrennt, während in der ersten bis vierten Ausführungsform das Bildeingangssignal zusätzlich zur Pixelwertinformation aus der Transparenzinformation und der Gestaltinformation besteht und in das Pixelwertsignal, das Transparenzsignal und das Formsignal aufgetrennt wird. Wenn daher in der fünften bis siebenten Ausführungsform die Transparenzinformation und die Gestaltinformation eine Übereinstimmung besitzen, ist es möglich, ausschliesslich die Gestaltinformation zu verwenden, während, wenn keine Übereinstimmung vorhanden ist, das Formsignal und das Pixelwertsignal gewonnen werden, sofern die Transparenzinformation zum Formsignal gemacht wird oder die Transparenzinformation, die ein mehrwertiges Signal ist, in der Blockeinheit zusammen mit der Pixelwertinformation verarbeitet wird.

Ausführungsform Nr. 8

Eine Bildkodiervorrichtung gemäss einer achten Ausführungsform, die keinen Teil dieser Erfindung bildet, kodiert Formsignale, die die Formen von Objekten darstellen, extrahiert aus einem Bildsignal eine signifikante Fläche und führt eine wirksame Kodierung durch.
Fig. 44 ist ein Blockdiagramm, das die Struktur der Bildkodiervorrichtung gemäss der ächten Ausführungsform zeigt. In der Figur bezeichnet 401 das zweidimensionale Formsignal als Eingangssignal. Mit 402 wird ein Extraktor signifikanter Flächen bezeichnet, der eine signifikante Fläche aus dem Formeingangssignal 401 extrahiert und ein signifikantes Flächensignal 403 ausgibt. Mit 404 wird die Blockeinheit bezeichnet, die das Formeingangssignal 401 blockt und ein geblocktes Formsignal 405 ausgibt. Mit 408 wird der Schalter bezeichnet, der gemäss dem signifikanten Flächensignal 403 das Schalten ausführt. Mit 412 wird ein Blockgrössenveränderer bezeichnet, der die Blockgrösse gemäss dem signifikanten Flächensignal 403 ändert und das geänderte geblockte Formsignal 413 ausgibt. Mit 418 und 414 werden Kodierer bezeichnet, die das signifikante Flächensignal 403 und das geblockte Formsignal 413 kodieren und die kodierten Signale 419 bzw. 415 ausgeben.
Die Funktion der wie oben aufgebauten Bildkodiervorrichtung gemäss der achten Ausführungsform wird beschrieben. Das Eingangssignal 401, das ein zweidimensionales Formsignal ist, wird in die Bildkodiervorrichtung gemäss der achten Ausführungsform und dann in den Extraktor signifikanter Flächen 402 und die Blockeinheit 404 eingegeben. Der Extraktor signifikanter Flächen 402 erkennt das Ausmass der signifikanten Fläche und gibt das signifikante Flächensignal 403 an den Schalter 408, den Blockgrössenveränderer 412 Lind den Kodierer 418 aus.
Fig. 45 ist eine Zeichnung, um das Funktionsprinzip der durch die Bildkodiervorrichtung gemäss der achten Ausführungsform ausgeführten Kodierung zu erklären. Der durch schräge Linien bezeichnete Teil bedeutet den inneren Pixel des Objekts, das heisst den Pixel, in dem das signifikante Signal existiert, und ein minimales Rechteck, das den in schrägen Linien dargestellten Teil enthält, nämlich das durch die fette Linie in der Figur angedeutete Rechteck, entspricht dem Bereich der signifikanten Fläche.
Die Blockeinheit 405 blockt, das Formeingangssignal und gibt das geblockte Formsignal an den Schalter 408 aus. Hier ist der Schalter 408 im Zustand EIN, wenn das geblockte Formsignal 405 dem Bereich der signifikanten Fläche entspricht, der durch das signifikante Flächensignal 403 angezeigt wird. Das bedeutet, dass das geblockte Formsignal dem Kodierprozess nicht unterliegt, wenn es ausserhalb der signifikanten Fläche ist.
Wenn der Schalter auf EIN steht, wird das geblockte Formsignal 405 in den Blockgrössenveränderer 412 eingegeben, die Grösse wird zu dem minimalen Block verändert, der gemäss dem in den Blockgrössenveränderer eingegebenen signifikanten Flächensignal 403 die signifikante Fläche enthält, das veränderte Formsignal 413 wird zum Kodierer 414 ausgegeben, kodiert und als das kodierte Signal 415 des Formsignals betrachtet. Andererseits wird auch das den Bereich der signifikanten Fläche anzeigende signifikante Flächensignal im Kodierer 418 kodiert, und das kodierte Signal 419 wird ausgegeben.
Wie oben beschrieben, hat die Bildkodiervorrichtung gemäss der achten Ausführungsform den signifikanten Flächenerkenner 102 und den Blockgrössenveränderer 412, erkennt dadurch den Bereich der signifikanten Fläche und verändert die Blockgrösse des Formsignals, um das Formsignal nur, im inneren Bereich der signifikanten Fläche zu kodieren, während der Bereich ausserhalb der signifikanten Fläche nicht mehr kodiert und die Kodierleistung des Formsignals verbessert wird.

Ausführungsform Nr. 9

Eine Bilddekodiervorrichtung gemäss einer neunten Ausführungsform dieser Erfindung dekodiert das durch die Bildkodiervorrichtung gemäss der achten Ausführungsform ausgegebene, kodierte Signal und gewinnt ein zweidimensionales Formsignal.
Fig. 46 ist ein Blockdiagramm, das die Struktur der Bildkodiervorrichtung gemäss der neunten Ausführungsform zeigt. In der Figur bezeichnen 419 und 415 das durch die Bildkodiervorrichtung gemäss der achten Ausführungsform ausgegebene, kodierte Signal.
Mit 420 wird der Dekodierer für das signifikante Flächensignal bezeichnet, der das eingegebene Signal dekodiert und ein dekodiertes signifikantes Flächensignal 421 ausgibt. Mit 422 wird der Dekodierer für das Formsignal bezeichnet, der das eingegebene. Signal dekodiert und ein dekodiertes Signal 423 für die minimale geblockte Form ausgibt. Mit 430 wird ein Blockgrössenveränderer bezeichnet, der die Blockgrösse gemäss dem dekodierten signifikanten Flächensignal 423 verändert und das dekodierte geblockte Formsignal 431 ausgibt. Mit 426 wird der Schalter bezeichnet, der das Schalten gemäss dem signifikanten Flächensignal 421 ausführt. Mit 432 wird die Entblockeinheit bezeichnet, die das geblockte Formsignal 427 integriert und das dekodierte Formsignal 433 ausgibt.
Die Funktion der wie oben aufgebauten Bilddekodiervorrichtung gemäss der neunten Ausführungsform wird beschrieben. Die kodierten Signale 419 und 415 werden in die Dekodierer 420 bzw. 422 eingegeben und dekodiert. Der Dekodierer 420 gibt das dekodierte signifikante Flächensignal 421 an den Blockgrössenveränderer 430 und den Schalter 426 aus. Andererseits gibt der Dekodierer 422 das minimale geblockte Formsignal 423, das der minimale Block ist, in dem der Bereich der signifikanten Fläche enthalten ist, an den Blockgrössenveränderer 430 aus. Der Blockgrössenveränderer 430 verändert die Blockgrösse zu der durch das eingegebene, dekodierte signifikante Flächensignal gegebenen Grösse und gibt das veränderte geblockte Formsignal 431 an den Schalter 426 aus. Der Schalter 426 wird nur auf EIN gestellt, wenn das Eingangssignal ein Signal ist, das den signifikanten Flächenbereich enthält, der durch das signifikante Flächensignal 421 bezeichnet wird, sonst gibt er den Wert aus, der die Aussenseite des signifikanten Flächenbereichs anzeigt. Die Entblockeinheit 432 integriert das eingegebene geblockte Formsignal und das die Aussenseite des signifikanten Flächenbereichs anzeigende Signal und gibt das zweidimensionale Formsignal als dekodiertes Signal 433 aus.
Wie oben beschrieben, hat die Bilddekodiervorrichtung gemäss der neunten Ausführungsform die Dekodierer 420 und 422, den Blockgrössenveränderer 430, den Schalter 426 und die Entblockeinheit 432, kodiert damit den signifikanten Flächenbereich und dekodiert auf dieser Grundlage das Formsignal, wodurch das in der achten Ausführungsform kodierte Signal zweckmässig dekodiert werden kann.

Ausführungsform Nr. 10

Ein Aufzeichnungsmedium für ein Bildkodierprogramm und ein Aufzeichnungsmedium für ein Bilddekodierprogramm verwirklichen die Bildkodiervorrichtungen und die Bilddekodiervorrichtungen gemäss der ersten bis neunten Ausführungsform.
Fig. 50 zeigt eine Diskette, die ein Beispiel eines Aufzeichnungsmediums ist, in dem das Programm aufgezeichnet wird.
Ein Bildkodierprogramm, das in der in Fig. 50 gezeigten Diskette aufgezeichnet ist, läuft auf einem Personalcomputer, einer Workstation oder dergleichen und verwirklicht dadurch die Bildkodiervorrichtung gemäss der zweiten Ausführungsform.
In ähnlicher Weise läuft ein Bilddekodierprogramm, das in der in Fig. 50 gezeigten Diskette aufgezeichnet ist, auf einem Personalcomputer, einer Workstation oder dergleichen und verwirklicht dadurch die Bilddekodiervorrichtung gemäss der dritten Ausführungsform. In der gleichen Ausführungsform ist dies ein Fall, in dem nach dem Änderungspixel-Kodierprozess, wie in Fig. 6 beschrieben, die Auswahl durch den Schalter erfolgt.
Wie oben beschrieben, sind in den Programmaufzeichnungsmedien gemäss der zehnten Ausführungsform das Bildkodierprogramm oder das Bilddekodierprogramm aufgezeichnet, und dadurch können auf einem Rechnersystem wie einem gewöhnlichen Personalcomputer oder dergleichen die Bildkodiervorrichtung oder die Bilddekodiervorrichtung gemäss dieser Erfindung verwirklicht werden.
Man bemerke, dass die Vorrichtungen gemäss anderen Ausführungsformen in ähnlicher Weise verwirklicht werden können, obwohl in der zehnten Ausführungsform die Bildkodiervorrichtung gemäss der zweiten Ausführungsform bzw. die Bilddekodiervorrichtung gemäss der dritten Ausführungsform aufgezeichnet sind.
Des Weiteren können eine IC-Karte, ein CD-ROM, eine optische Platte, ein Kassettenband oder dergleichen in ähnlicher Weise eingesetzt werden, sofern sie ein Medium sind, in dem die Programme aufgezeichnet werden können, obwohl in der vierzigsten Ausführungsform die Diskette als ein Aufzeichnungsmedium vorgestellt wird.

Claims

1. Bilddekodiervorrichtung, die ein kodiertes geblocktes Formsignal empfängt, das ein kodiertes Signal eines geblockten Formsignals ist, das gewonnen wird, indem ein zweidimensionales Formsignal, das die Form eines Objekts anzeigt, in Blockflächen unterteilt wird, deren jede eine vorbestimmte Anzahl von Pixeln umfasst, die benannte Vorrichtung umfassend:

eine Formsignaldekodiereinheit (422, 430), so funktionierend, dass sie das kodierte geblockte Formsignal dekodiert; und

eine Entblockeinheit (432), so funktionierend, dass sie das von der Formsignaldekodiereinheit ausgegebene, geblockte Formsignal über eine Mehrzahl von Blockflächen integriert, um so das zweidimensionale Formsignal zurückzugewinnen, und das zurückgewonnene zweidimensionale Formsignal ausgibt;

wobei die benannte Bilddekodiervorrichtung dadurch gekennzeichnet ist, dass sie weiter enthält:

eine Dekodiereinheit (420) für ein signifikantes Flächensignal, so funktionierend, dass sie ein kodiertes signifikantes Flächensignal dekodiert, um das signifikante Flächensignal auszugeben, wobei das benannte kodierte signifikante Flächensignal ein kodiertes Signal eines signifikanten Flächensignals ist, das eine das Objekt umschliessende minimale rechteckige Fläche als eine signifikante Fläche bezeichnet; und

die benannte Formsignaldekodiereinheit das kodierte geblockte Formsignal unter Verwendung des signifikanten Flächensignals dekodiert, um das geblockte Formsignal auszugeben, und die benannte Formsignaldekodiereinheit des Weiteren als Dekodierprozess für das kodierte geblockte Formsignal einen Dekodierprozess an nur demjenigen kodierten geblockten Formsignal ausführt, das dem Teil jeder Blockfläche entspricht, der mit der als signifikante Fläche angezeigten, minimalen Rechteckfläche überlappt, sowie das jeder Blockfläche entsprechende geblockte Formsignal ausgibt.