DE4127920C2 - Bild-Codier-Einrichtung - Google Patents
Bild-Codier-EinrichtungInfo
- Publication number
- DE4127920C2 DE4127920C2 DE19914127920 DE4127920A DE4127920C2 DE 4127920 C2 DE4127920 C2 DE 4127920C2 DE 19914127920 DE19914127920 DE 19914127920 DE 4127920 A DE4127920 A DE 4127920A DE 4127920 C2 DE4127920 C2 DE 4127920C2
- Authority
- DE
- Germany
- Prior art keywords
- block
- resolution information
- coding
- gradation
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/98—Adaptive-dynamic-range coding [ADRC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Description
Die vorliegende Erfindung befaßt sich mit einer Halbton- oder
Gleichton-Einrichtung.
In einer Bildfunk-Endstation (Facsimile) z. B. sind die ursprünglichen
Bildsignale verschlüsselt, um die Übertragungseffizienz
zu verbessern. Insbesondere ist die Menge der Bilddaten
mit einem Halbton oder Gleichton verhältnismäßig groß,
so daß deshalb ein höchst effizientes Codieren gefordert ist.
Ein Beispiel einer derartigen effizienten Codierung wurde als
ein sog. BTC(Block Truncation Coding)-Schema in der veröffentlichten
ungeprüften japanischen Patentanmeldung Nr. Sho-57-174984
vorgeschlagen, in der ein Bildsignal in Blockeinheiten
unterteilt wurde, wobei jede Blockeinheit eine gewisse
Größe aufweist und die Form jedes Blockes angestumpft wurde.
Das BTC-Codierschema wird im folgenden mit Bezug auf die Fig. 1
bis 5 beschrieben. In dem BTC-Codierschema ist ein in
Fig. 1 gezeigtes Bild in eine Vielzahl von Blockeinheiten unterteilt,
wobei jede aus Li × Lj Bildelementen zusammengesetzt
ist, wie dies in Fig. 7 gezeigt wird. Unter der Annahme,
daß L = Li = Lj ist und daß jeder Ton der Bildelemente
in einem Block durch aÿ repräsentiert wird, so ist der mittlere
Ton P₀ des gesamten Blocks P₀ = Σ aÿ/L². Unter der Voraussetzung,
daß die mittlere Dichte und die Anzahl der Bildelemente
einem niedrigeren Ton als der mittlere Ton P₀ in dem
Block P₁ bzw. N₁ aufweist, wie in Fig. 8 gezeigt ist, dann
wird die mittlere Dichte P₁ und die Anzahl N₁ ausgedrückt
durch:
Wenn der mittlere Ton und die Anzahl der Bildelemente einen
höheren Ton aufweisen, so ist der mittlere Ton P₀ in dem
Block P₂ bzw. N₂, und ferner wird dann der mittlere Ton P₂
und die Anzahl N₂ ausgedrückt durch:
Diese Ausdrücke haben ihre Gültigkeit unter der Bedingung,
daß Φÿ = 0 ist, wenn aÿ P₀ und Φÿ = 1 ist, wenn aÿ < P₀
ist.
Nunmehr, für den Fall, daß ganze Zahlen m und n kleiner als
L² und die Anzahl der Gradationsstufen (Abstufungs-Niveaus) des Tons eingesetzt
werden und wird erkannt, daß die Ton-Dichteverteilung in dem
Block einheitlich ist, so daß | P₁-P₂ | < m, N₁ < n oder N₂ < n
ist, so daß jedes Φÿ zu Null gemacht wird.
Wie in Fig. 9 gezeigt wird, werden die ganzen Bildelemente in
dem Block nur durch den Ton P₀ wiedergegeben. Wird erkannt,
daß die Ton-Dichteverteilung in dem Block einheitlich ist, so
daß | P₁-P₂ | m, N₁ n und N₂ n ist, so wird der Block
durch beide mittleren Töne P₁ und P₂ wiedergegeben, wie es in
der Fig. 10 gezeigt wird. Die Bildelemente, bei denen Φÿ Null
gemacht wurde, werden wiedergegeben durch P₁, hingegen die
Bildelemente, die Φÿ gleich 1 gemacht wurden, werden durch
P₂ wiedergegeben. In diesem Falle stellt Φÿ eine Information
in Zusammenhang mit der Blockform dar, während P₀, P₁
und/oder P₂ Informationen der Gradation darstellen und
als Gradations-Information bezeichnet wird. Die Informationen
der Auflösung werden blockweise in mehreren Paaren von Linien
zusammengefaßt und mit Hilfe eines gewöhnlichen binären
Codierschemas codiert, und die darauffolgenden Längen der
Blöcke, die in den Informationswerten einander gleich sind,
werden ebenfalls mit Hilfe eines wohlbekannten Längenlauf-Codierschemas
codiert, um dann übertragen zu werden. Die
Parameter m und n in diesem Codierschema dienen einerseits
(m) als Unterdrückungsschwelle zur Elimination vereinzelter
Störpegel in einem Bild und anderseits (n) als Entscheidungsschwelle
zur Elimination von kleinen Fluktuationen im
Ton eines Blockes, so daß das Bild so lange geglättet wird,
bis beide Parameter m und n große Wert annehmen.
In diesem Schema, in dem die Bildelemente in einem Block nur
durch zwei spezifische Ton-Niveaus maximal ausgedrückt werden
können, tritt ein strittiger Punkt auf, wenn die Blockgröße L
weiter gemacht wird, um eine höhere Zusammendrängung zu erhalten,
so wird die Bildentartung groß. Insbesondere ist die
Störung in dem Bereich mit glatter Ton-Variation nicht zu
vernachlässigen. Ein zusätzlicher Fehler liegt darin, daß die
Redundanz hoch ist, da die Auflösungs-Information auf alle
Blöcke einheitlich aufgeteilt ist. Obwohl versucht wurde,
diesen strittigen Punkt anzugehen, die Redundanz durch
Ausführung einer binären Codierung der Auflösungs-Information
mehrerer Linien in Blöcken zu verringern, war dieses nicht
befriedigend.
Zusätzlich tritt ein weiteres Problem auf, nämlich daß es
schwierig ist, die Codierrate durch Auswahl der Parameter m
und n zu steuern. Es ist ferner auch schwierig, ein Bild in
verschlüsselter Form aufzubereiten.
In Jain, A.: Fundamentals of digital image processing,
Englewood Cliffs, NJ, Prentice Hall, 1989, S. 479-498 werden
die Grundlagen der Codierungstechniken zur Codierung von
Pixeln beschrieben. Bekannt ist (S. 497, 1. Abs.) das Bild in
Blöcke bestimmter Größe zu unterteilen und diese Blöcke zu
klassifizieren. Dabei werden flache Regionen, d. h. Regionen
mit geringer Aktivität bzw. Varianz feiner quantisiert als
solche hoher Aktivität, d. h. Regionen mit stark veränderlichem
Bildinhalt. Zu diesem Zweck kann man eine Anzahl von
Klassen definieren, in die die Blöcke klassifiziert werden.
In Ishibashi, S.: Coding parameter Optimization for the block
truncation coding of still pictures, Electronics and
Communication in Japan, Part 1, Vol. 73, No. 2, 1990, S. 1-
10, werden BTC-Verfahren zur Codierung von unbewegten Bildern
beschrieben, wobei das adaptive BTC-Verfahren den lokalen
Verhältnissen angepaßt ist und je nach der lokalen Struktur
der verwendete Codierungs-Mode geändert wird.
Die US-PS 4 238 768 betrifft ein Gerät zum Codieren von Bildsignalen,
bei dem ebenfalls das Bild in Blöcke unterteilt
ist, wobei die Blöcke einer Klassifikation unterworfen werden.
Dabei wird ein Schwellwert definiert, mit dem die Intensitäten
der Pixel verglichen werden, der i. A. gleich dem Mittelwert
gesetzt wird. Ist die Intensität größer als die
Schwelle, wird sie auf 1 gesetzt, andernfalls erhält sie den
Wert 0. Daraus wird ein Wert für die Auflösung bestimmt, der
zusammen mit zwei Grauwerten übertragen wird, wobei sich die
Grauwerte aus der Auflösung und den Intensitäten berechnen
lassen.
Nachteilig ist, daß bei den obenerwähnten Codierern keine
konstante Codequantität, d. h. eine konstante Ausgangsbit
datenrate, bei gleichbleibender Bildqualität gewährleistet
ist.
Der Erfindung liegt daher die Aufgabe zugrunde, eine Block-
Codier-Einrichtung zu schaffen, die die obengenannten Nachteile
verrmeidet, und mittels eines BTC-Codierschemas eine einfache
Codierung und Decodierung unter Beibehaltung der Bildqualität
mit einer konstanten Codequantität ermöglicht.
Die Aufgabe wird durch die Erfindung nach den Ansprüchen 1
und 5 gelöst.
Weitere vorteilhafte Ausgestaltungen ergeben sich aus den Unteransprüchen.
Die Aufgabe wird durch eine Bild-Codier-Einrichtung gelöst,
die eine Einrichtung zur Unterteilung von Bilddaten in
Blöcke, die jeweils die gleiche Anzahl von Bildelementen aufweisen;
eine Klassifikationseinrichtung zur Klassifizierung
der Blöcke entsprechend dem Intensitätsgradienten jedes
Blockes; eine Vielzahl von Block-Codiereinrichtungen zum
Codieren der Blöcke; und eine Auswahleinrichtung zum Auswählen
einer Block-Codiereinrichtung in Abhängigkeit von dem Ergebnis
der Klassifikation der Klassifikationseinrichtung aufweist,
wobei alle Block-Codiereinrichtungen eine für alle
gleiche, konstante Codequantität abgeben, die die Summe der
zu übertragenden Gradationsdaten und Auflösungsinformationen
ist, und wobei mit zunehmender (abnehmender) Anzahl der Gradationsstufen
eines Blockes die zu übertragenden Auflösungsinformationen
vermindert (vermehrt) werden.
Ferner wird die Aufgabe durch eine Bild-Codier-Einrichtung
gelöst, mit einer Einrichtung zur Unterteilung von Bilddaten
in Blöcke, die die gleiche Anzahl von Bildelementen aufweisen;
einer Vielzahl von Block-Codiereinrichtungen zum Codieren
der Blöcke; einem lokalen Decoder, der die durch die
Block-Codiereinrichtungen codierten Blöcke decodiert; einer
Klassifikationseinrichtung, in der die lokal decodierten
Blöcke mit den originalen Blockdaten eines Blockes verglichen
werden und die Vergleiche nach einem festgelegten Verfahren
bewertet werden; und einer Auswahleinrichtung zum Auswählen
einer Block-Codiereinrichtung in Abhängigkeit von der Bewertung
der Vergleiche der Klassifikationseinrichtung; wobei
alle Block-Codiereinrichtungen eine für alle gleiche,
konstante Codequantität abgeben, die die Summe der zu übertragenden
Gradationsdaten und Auflösungsinformationen ist,
und wobei mit zunehmender (abnehmender) Anzahl der
Gradationstufen eines Blockes die zu übertragenden
Auflösungsinformationen vermindert (vermehrt) werden.
Gemäß der vorliegenden Erfindung können Blöcke eines Bildes
durch die Verwendung einer Vielzahl von Ton-Niveaus (Gradationen), z. B. von
einer oder zwei Ton-Niveaus zu m ausgedrückt werden, wobei m
zwei oder mehr sein kann und die Auflösungs-Informationen,
die erforderlich sind, im Hinblick auf die verwendete Anzahl
der Ton-Niveaus lediglich übertragen werden, so daß die
exzellente Bildqualität erhalten bleibt, selbst für den Fall,
daß die zu codierende Blockgröße erweitert wird, um die Codiereffizienz
zu vergrößern. Darüber hinaus besagt das allgemein
bekannte Webersche Gesetz, daß der Mensch eine Seheigenschaft
hat, so daß es nicht üblich ist, eine leichte Sensitivität
im Ton-Niveau in einem Bildbereich mit einer großen
Ton-Variation zu haben, während es wahrscheinlich ist, eine
geringe Sensitivität in der Auflösung in einem Bildbereich
mit glatten Ton-Variationen zu haben. Deshalb wird gemäß der
vorliegenden Erfindung die Anzahl der Abstufungen in einem
Bildbereich mit glatten Ton-Variationen erhöht, wodurch die
Auflösung des Bildes geringer gemacht wird. Im Gegensatz dazu
wird die Anzahl der Ton-Niveaus in einem Bildbereich mit
einer großen Ton-Variation erniedrigt, wodurch die Auflösung
erhöht wird. Es ist deshalb üblich, die visuelle Verschlechterung
der Bildqualität zu vernachlässigen, die durch das Codieren
verursacht wurde, und daß keine überflüssigen Ton-Niveau-Daten
und Auflösungs-Informationen zur Codierung übermittelt
werden, so daß die Codiereffizienz verbessert wird.
Eine Ausführungsform der vorliegenden Erfindung wird im folgenden
mit Bezug zu den begleitenden Zeichnungen näher erläutert.
Es zeigt:
Fig. 1 ein Blockdiagramm, das eine Ausführungsform einer
Bild-Codier-Einrichtung gemäß der vorliegenden Erfindung
wiedergibt;
Fig. 2 ein Blockdiagramm, das ein Beispiel der Vielzahl der
in der Bild-Codier-Einrichtung verwendeten Codierer
der Fig. 1 zeigt;
Fig. 3(a) bis 3(c) zeigen erklärende Diagramme zur Illustration
von Quantisierungszuständen in dem Codierer, der
in Fig. 1 gezeigt ist;
Fig. 4(a) bis 4(c) zeigen erklärende Diagramme zur Illustration
des Unterschiedes in den Auflösungs-Informationen
der Codierer untereinander; und
Fig. 5 ein Blockdiagramm, das eine andere Ausführungsform
der Bild-Codier-Einrichtung gemäß der vorliegenden
Erfindung zeigt.
Fig. 6 ein erklärendes Diagramm zur Illustration eines Bildes,
das in eine Vielzahl von Blöcken aufgeteilt ist;
Fig. 7 ein erklärendes Diagramm zur Illustration der Struktur
jedes einzelnen Blockes;
Fig. 8 ein erklärendes Diagramm zur Illustration des mittleren
Tones, der als Referenz beim Codieren verwendet
wird;
Fig. 9 ein erklärendes Diagramm zur Illustration eines Codier-
Zustandes für den Fall, daß die Ton-Variation
eines Bildes glatt ist;
Fig. 10 ein erklärendes Diagramm zur Illustration eines Codier-
Zustandes für den Fall, daß die Ton-Variation
eines Bildes groß ist;
Zunächst wird der Betrieb der Bild-Codier-Einrichtung gemäß
der vorliegenden Erfindung kurz beschrieben, unter der Annahme,
daß der Eingabe-Betrieb der zu codierenden Bilddaten
für jeden der Blöcke, wie sie in den Fig. 6 und 7 gezeigt
werden, ausgeführt werden, z. B. einer Zusammensetzung aus L × L
Bildelementen.
Eine Block-Klassifizierungseinheit 1 klassifiziert den Grad
des Tongradienten in einem Block gemäß der Bilddaten 7, die
eingegeben werden, um ein Klassifizierungsergebnis 14 an den
Selektor 6 zu liefern. In der Ausführungsform der Fig. 1
führt ein Codierer 3 eine Ein-Ton-Block-Codierung
durch, ein Codierer 4 führt eine Zwei-Ton-Codierung durch,
und ein Codierer 5 führt eine m-Ton-Niveau-Codierung durch.
Für den Fall, daß der Grad des Tongradienten in dem Block
groß ist, werden die Ausgänge, die durch die Codierer für
niedrige Abstufungsanzahl (Gradationsanzahl) erzeugt wurden, solche wie beispielsweise
Codierer an der Seite des Codierers 3, hauptsächlich
verwendet durch den Selektor 6. Andererseits, für den
Fall, daß dieser Grad glatt ist, werden die Ausgänge, die
durch die Codierer für große Abstufungszahlen erzeugt sind,
wie beispielsweise die Codierer an der Seite des Codierers 5,
hauptsächlich verwendet durch den Selektor 6. Was später in
bezug auf die Auflösungs-Informationen beschrieben wird, wird
das Codieren in der Art ausgeführt, daß viele Fälle dem Codierer
3 zugeordnet sind, der eine Ein-Ton-Block-Codierung
ausführt, während wenige Fälle dem Codierer 5 zugeordnet
sind, der eine n-Ton-Niveau-Block-Codierung
durchführt. Für den Fall eines großen Tongradienten wird deshalb
die Codierung unter den Bedingungen kleiner Ton-Informationen
und großer Auflösungs-Information durchgeführt. Für
den Fall eines glatten Tongradienten wird die Codierung unter
den Bedingungen von vielen Ton-Informationen und wenig Auflösungs-Informationen
durchgeführt. Der Selektor 6 wählt die
Daten aus und gibt die Daten 10-1 bis 10-3 heraus, die durch
einen der Codierer 3 bis 5 in Übereinstimmung mit dem Ergebnis
der Blockklassifizierung 14 codiert werden.
Nunmehr wird die oben erwähnte Bild-Codier-Einrichtung im
einzelnen beschrieben.
In dieser Ausführungsform ist das Bild aus 8 × 8 Bildelement-Blöcken
zusammengesetzt und die Bilddaten 7, die in Fig. 1
gezeigt sind, werden durch jeden Block aus 8 × 8 Bildelementen
eingegeben. Zusätzlich werden drei Arten der Block-Codierung
angepaßt durchgeführt, nämlich die Zwei-Ton-Codierung,
die Vier-Ton-Codierung und die Sechzehn-Ton-Codierung.
Die Anzahl der Bildelemente in einem Block können verändert
werden, und ebenfalls kann die Form des Blockes modifiziert
werden.
Wie weiter oben beschrieben wurde, arbeitet die Block-Klassifizierungseinheit
1 so, um zu klassifizieren, ob der Tongradient
der Bildelemente in einem Block glatt oder komplex ist,
die Ton-Variation desselben groß ist oder nicht, oder ob die
Ton-Verteilung dazwischen liegt oder nicht. Insbesondere mißt
die Block-Klassifizierungseinheit 1 die Ton-Verteilung der
Bildelemente in einem Block aus. Gemäß der Klassifizierung
des Ergebnisses klassifiziert die Einheit 1, ob die Ton-Variation
scharf ist, wenn die Dispersion groß ist, sie klassifiziert,
ob der Tongradient glatt ist, wenn die Dispersion
klein ist und sie klassifiziert, ob die Tonverteilung dazwischen
liegt, wenn die Dispersion dazwischen liegt. Die oben
erwähnte selbe Klassifizierung kann durch Differenzierung
eines Wertes des Bild-Element-Tons mit Bezug auf einen Raumbereich
erzielt werden, so daß die Zahl der Maximum- und Minimumwerte
als Kriterium erhalten werden können.
Da die entsprechenden Codierer 3 bis 5 dieselbe Basisschaltungs-Konstruktion
aufweisen, werden diese mit Bezug auf die
Fig. 2 zusammen beschrieben.
Bei Erhalt der Bilddaten 9 bestimmt eine Quantisierungs-Niveau-Steuerung
15 die Quantisierungs-Niveaus Q1, Q2 . . . auf
der Basis der erhaltenen Bilddaten 9. Die Anzahl und Werte
dieser Quantisierungs-Niveaus sind unter den entsprechenden
Codierern unterschiedlich: Zum Beispiel dient der Codierer 4 zur
Durchführung der Zwei-Ton-Block-Codierung, wie dies
in Fig. 3(a) gezeigt ist, und hat zwei Quantisierungs-Niveaus
Q1 und Q2. Für den Fall von Vier- oder Sechzehn-Ton-Niveaus,
wie es in Fig. 3(b) oder 3(c) gezeigt ist, gibt es vier Quantisierungs-Niveaus
Q1 bis Q4 (Q2 und Q3 sind nicht gezeigt),
oder 16 Quantisierungs-Niveaus Q1 bis Q16 (Q2 bis Q15 sind
nicht gezeigt).
Insbesondere sind, wie in den Fig. 3(a) bis 3(c) gezeigt
wird, die maximalen Quantisierungs-Niveaus Q1 und die minimalen
Quantisierungs-Niveaus Q2, Q4 oder Q16 bestimmt, und der
Unterschied zwischen den maximalen und minimalen Niveaus ist
äquidistant unterteilt, um somit eine lineare Quantisierung
durchzuführen. Das maximale Quantisierungs-Niveau Q1 ist ein
Mittelwert der Tonwerte von n Bildelementen, die sequentiell
mit abfallenden Werten vom Maximumwert "max" der Dichten der
Bildelemente in dem Block genommen werden. In der gleichen
Weise ist das minimale Quantisierungs-Niveau ein Mittelwert
des Tons für n Bildelemente, die sequentiell mit ansteigenden
Werten von Minimumwert "min" der Dichten hergenommen wird.
Angenommen, die Anzahl der Bildelemente in dem Block ist L²
und die Anzahl der Abstufungen ist l, dann ist der Parameter
n abgerundet als ein Wert der Größenordnung, ausgedrückt
durch n = L²/l. Die maximalen und minimalen Quantisierungs-Niveaus
können so verwendet werden wie sie sind. Zusätzlich
kann beispielsweise eine nicht lineare Quantisierung als
Quantisierung des MAX durchgeführt werden, da die oben beschriebene
Methode nicht auf Fälle der linearen Quantisierung
zwischen dem maximalen und dem minimalen Quantisierungs-Niveau
für gleiche Schritte begrenzt ist. Dies gilt unter der
Annahme einer stochastischen Tonfunktion, für die ein
Quantisierer-Optimum gebildet werden kann.
Als nächstes codiert ein Abstufungsdaten-Codierer 16 (Gradationsdaten-Codierer) ein
Quantisierungs-Niveau 11, das von dem oben erwähnten Quantisierungs-Niveau-Rechner
15 geliefert wird. Wie in den Fig. 3(a)
bis 3(c) insbesondere gezeigt wird, gibt der Abstufungsdaten-Codierer
16 den Mittelwert La der maximalen und minimalen
Quantisierungs-Niveaus Q1 und Q2 oder Q4 oder Q16 und die
Differenz Le zwischen diesen Größen aus. Unter der Annahme,
daß die Eingangs-Bilddaten 9 in dieser Ausführungsform 256
Abstufungen pro Bildelement haben und mit acht Bit pro Bildelement
durch einen binären Ausdruck ohne Vorzeichen ausgedrückt
werden, sind die La und Ld, die in den Fig. 3(a) bis
3(c) gezeigt sind, durch die Anzahl der Abstufungen (Gradationen), die
gleich oder annähernd gleich dazu sind, ausgedrückt. Das heißt,
die La und Ld werden mit 16 Bits oder ähnlichem ausgedrückt.
Die Art der Codierung der Quantisierungs-Niveaus 11 ist nicht
auf die oben erwähnte Methode begrenzt, und die maximalen und
minimalen Quantisierungs-Niveaus können zugeordnet werden wie
sie sind. Zusätzlich, im Falle, daß eine nicht lineare Quantisierung
in dem Quantisierungs-Niveau-Rechner 15 durchgeführt
wird, muß der Änderungsweg des Quantisierungsschrittes
(der Unterschied zwischen benachbarten Quantisierungs-Niveaus)
auch codiert werden.
Der Quantisierer 17 quantisiert die oben erwähnten Eingangs-Bilddaten
9 in Übereinstimmung mit dem Quantisierungs-Niveau
11 und gibt das Ergebnis als Auflösungs-Information 12 für
die Auflösungskraft heraus. In diesem Falle ist der Schwellenwert
der Quantisierung ein Mittelwert der entsprechenden
Quantisierungs-Niveaus. Zum Beispiel wird der Schwellenwert zwischen
den Quantisierungs-Niveaus Q1 und Q2 ausgedrückt durch (Q1+Q2)/2.
Die quantisierten Auflösungs-Informationen 12 für die
Auflösungskraft in diesem Ausführungsbeispiel, die quantisiert
sind in zwei, vier oder sechzehn Abstufungen, sind entsprechend
Ein-Bit-, Zwei-Bit- oder Vier-Bit-Daten.
Als nächstes eliminiert ein Auflösungs-Informations-Selektor
18 visuell überflüssige Daten von den Auflösungs-Informationen
12 entsprechend der Anzahl der Abstufungen, die durch den
Quantisierer 17 quantisiert wurden und gibt benötigte Auflösungs-Informationen
13 für die Auflösung heraus. Wie in dem
Beispiel, das in den Fig. 4(a) bis 4(c) gezeigt wird, werden
alle Auflösungs-Informationen der 64 Bildelemente (= 8 × 8
Bildelemente) im Falle der Zwei-Ton-Codierung ausgewählt. Im
Falle eines Vier-Ton-Niveaus werden Auflösungs-Informationen
von 32 Bildelementen (= 8 × 8 Bildelemente/2) in einer Quineunxform
ausgewählt. Ferner, im Falle einer Sechzehn-Ton-Niveau-Codierung
und der Auflösungs-Information von 16 Bildelementen
(= (8 Bildelemente)/2 × (8 Bildelementen)/2) wird in
einer orthogonalen Form ausgewählt.
In Fig. 4 zeigen die schraffierten Teile die ausgewählten
Bildelemente. Wie die Daten für die Auflösungs-Information
ausgewählt werden, ist nicht beschränkt auf das oben erwähnte
Beispiel. Zum Beispiel können die Daten der Auflösungs-Information
für 32 Bildelemente in einer Quineunxform im Falle der
Zwei-Ton-Codierung ausgewählt werden. Hier ist es wichtig,
daß wenn viele Abstufungsdaten einem gewissen Block zugeordnet
sind, die Daten für die Auflösungs-Information schwach
zugeordnet werden, und im Gegensatz dazu, wenn wenig Abstufungsdaten
zugeordnet sind, wird die Auflösungs-Information
stark zugeordnet.
Ferner arbeitet ein Auflösungs-Informations-Codierer 19 derart,
um die oben erwähnte ausgewählte Auflösungsinformation
13 zu codieren. In der vorliegenden Ausführungsform, ohne die
Verwendung einer Codierung zur Zurückhaltung der Ton-
und/oder Auflösungs-Redundanz werden die codierten Bilddaten
10 herausgegeben, indem die ausgewählten Auflösungs-Informationen
13 in binären Zahlen ohne Vorzeichen, wie sie sind,
ausgedrückt werden.
Der Selektor 6 der Fig. 1 arbeitet derart, daß er die codierten
Bilddaten 10-1 bis 10-3, die von dem Codierer 3 bis 5 in
Übereinstimmung mit dem Block-Klassifikations-Ergebnis 14,
auswählt und herausgibt.
Gemäß der oben beschriebenen Art werden die Bilddaten 7, die
von jedem Block geliefert werden, in Kombination mit der Ton-Niveau-Information
und der Auflösungs-Information codiert.
Die kombinierten Daten werden als codierte Bilddaten 8
ausgegeben.
Tabelle 1 zeigt den Zusammenhang zwischen der Ton-Niveau-Information
(Gradationsinformation) und der Auflösungs-Informations-Codierung
an entsprechenden Abstufungen.
Wie in der Tabelle 1 für dieses Ausführungsbeispiel gezeigt
wird, ist stets eine konstante Rate der codierten Daten (80
Bits), unabhängig von dem Ergebnis der Block-Klassifikation,
zugeordnet und für jeden Block codiert. Wenn die Block-Auswahldaten
von zwei Bits jedem Block zuaddiert werden, um
zu identifizieren, welcher Codierer ausgewählt wurde, wird
die Codiereffizienz oder das Regelverhältnis in dieser
Ausführungsform (8 × 8 Bildelemente × 8 Bits/(80 Bits + 2
Bits)) = 6244 sein.
Im Ton-Niveau-Datencodierer 16 und im Auflösungs-Informationscodierer
19 in Fig. 2 wird für die Zurückhaltung sowohl
des Ton-Niveaus als auch der Auflösungs-Redundanz, beispielsweise
Huffman-Codierung, arithmetische Codierung, oder ähnliches
nicht verwendet.
Als nächstes wird für diese Ausführungsform der Vorgang der
Decodierung kurz beschrieben werden. Zunächst wird eine Identifikation
mit den oben erwähnten Block-Auswahldaten gemacht,
für den einer der Codierer 3 bis 5 in Fig. 1 während der Codierzeit
ausgewählt wurde, und die Ton-Niveau-Information La
und Ld und die Auflösungs-Information, die in Fig. 3 gezeigt
ist, werden decodiert. Da in diesem Ausführungsbeispiel die
Huffman-Codierung nicht verwendet wird, funktioniert es gut,
wenn binäre Zahlen, die in einer vorgegebenen Reihenfolge und
Bit-Länge angeordnet sind, sukzessiv gelesen werden. Als
nächstes wird unter Verwendung der Ton-Niveau-Information La
und Ld die Differenz von (La + Ld)/2 zu (La - Ld)/2 in gleiche
Schritte aufgeteilt, um die Quantisierungs-Niveaus Q1, Q2 . . .
zu berechnen. Die Bilddaten werden auf der Basis der erhaltenen
Quantisierungs-Niveaus und der Auflösungs-Information
reproduziert. Wenn zu diesem Zeitpunkt eine gewisse Auflösungs-Information
selektiv leer ausgeht, zum Beispiel in der
horizontalen oder vertikalen Richtung, wird eine Interpolation
unter Verwendung der Tonwerte der benachbarten Bildelemente,
die reproduziert wurden, durchgeführt, so daß der Ton
des ausgelassenen Bildelements reproduziert wird. Durch die
oben beschriebene Methode wird ein codiertes Bild decodiert.
Fig. 5 ist ein Blockdiagramm, das eine andere Ausführungsform
der vorliegenden Erfindung zeigt. Es ist unterschiedlich
zu Fig. 1, daß die Bilddaten 10-1 bis 10-3, die durch den Codierer
3 bis 5 zur gleichen Zeit einem lokalen Decodierer 20
zugeführt werden und daß ein Selektor 6 durch den Ausgang des
lokalen Decodierers 20 gesteuert wird. Der lokale Decodierer
20 decodiert die codierten Bilddaten 10-1 bis 10-3, um mit
den Bilddaten 7, bevor die Codierer 10-1 bis 10-3 in einer
Block-Klassifikationseinheit 1 codieren, verglichen zu werden.
Gemäß dem Ergebnis 14 des Vergleichs arbeitet der Selektor
6 so, um die codierten Bilddaten mit sehr minimaler Störungsgröße
auszuwählen und auszugeben. Das heißt, daß die Block-Klassifikationseinheit
1 als eine Störungs-Messungseinrichtung
arbeitet. Hier gibt es keine Einschränkung in bezug auf
die Weise der Störung und einem mittleren quadrierten Fehlerabstand.
Ein absoluter mittlerer Fehlerabstand kann verwendet
werden.
Im zweiten Ausführungsbeispiel der vorliegenden Erfindung,
das in Fig. 5 gezeigt wird, ist es nicht notwendig, die Ton-Bedingungen
eines Blockes zu klassifizieren, d. h., ob ein
eingegebenes Bild für jeden Block eine Tonabstufung aufweist,
die verhältnismäßig glatt als Ganzes über dem Block ist, oder
eine Ton-Variation aufweist, die verhältnismäßig groß als
Ganzes über dem Block erscheint, oder ob eine Zwischenton-Variation
zwischen den beiden oben erwähnten Bedingungen als
Ganzes über dem Block aufweist. Um zu klassifizieren, welcher
der oben erwähnten Codierer die visuelle Entartung oder Verschlechterung
der Bildqualität beim Codieren der Bilddaten,
die jedem Block zugeführt werden, minimieren kann, wird der
Dispersionswert des Tones der Bildelemente in jedem Block
oder der Differenzial-Koeffizient in einer Raumdomäne in dem
Ausführungsbeispiel, das in Fig. 1 gezeigt wird, verwendet.
Dennoch kann nicht gesagt werden, daß stets die ideale Klassifikation
durchgeführt wird. In dem anderen Ausführungsbeispiel,
das in Fig. 5 gezeigt wird, ist im Gegensatz dazu die
ideale Klassifikation ausgeführt, basierend auf wenigstens
einer Störungsgröße, wie z. B. eine mittlere quadrierte
Fehlerdistanz, der Akkumulation einer absoluten mittleren
Fehlerdistanz oder ähnlichem. Diese Ausführungsform erweist
sich als vorteilhaft dadurch, daß es möglich ist, die Codierung
mit weniger Entartung in der Bildqualität durchzuführen.
Gemäß der vorliegenden Erfindung wurde oben folgendes beschrieben:
- (1) Selbst für den Fall, daß die Blockgröße, die zu codieren ist, vergrößert wird, um die Codiereffizienz zu verbessern, ist die Entartung oder Verschlechterung der Bildqualität klein, weil die Codierer für Zwei- oder Mehr-Ton-Niveaus in geeigneter Weise verwendet werden.
- (2) Da eine Vielzahl von Codierern in geeigneter Weise verwendet wird, ist es möglich, die Reproduktion eines Bildes mit einer guten Qualität auszuführen, unabhängig von den Arten der Bilder. Mit anderen Worten gesagt, ist es nicht leicht, visuell die Entartung oder Verschlechterung der Bildqualität, die durch die Codierung mehrerer Bilder, wie einem Charakter/Linienbild, in dem die Auflösungs-Reproduktion visuell fokussiert ist, oder einem Figuren/Landschaftsbild, in dem die Ton-Niveau-Reproduktion visuell fokussiert ist, oder einem Bild mit einer zwischen den oben genannten Charakteren liegenden beiden Bildern, zu detektieren. Zusätzlich kann eine Codierung hoher Effizienz erreicht werden, ohne eine Huffman-Codierung zur Zurückhaltung der theoretischen Informations-Redundanz zu verwenden.
- (3) Da die Codiereffizienz für jeden Block stabil gemacht wurde, ohne eine Huffman-Codierung zur Einschränkung der Redundanz zu verwenden, für den Fall, daß die codierten Bilddaten in einem Speicher gespeichert werden, der eine gewisse konstante Kapazität aufweist, oder für den Fall, daß die codierten Bilddaten in einer sekundären Speichereinrichtung gespeichert oder von dieser reproduziert werden, die eine gewisse konstante Transferrate aufweist, ist es nicht notwendig, die Codiereffizienz (Code-Quantität) zu steuern, so daß es möglich ist, die Kapazität eines Pufferspeichers zu reduzieren oder den Pufferspeicher per se wegzulassen. Da es zusätzlich möglich ist, einen unabhängigen Zugriff von Block zu Block zu erlangen, wird nur ein gewisser Teil der Bilddaten Bild für Bild codiert. Somit ist es möglich, die Bildaufbereitung, wie beispielsweise Ausschnitte, Übertragung, Auslassungen oder ähnliches, eines Bildes, wie es im Zustand für codierte Bilddaten ist, mit hoher Geschwindigkeit auszuführen.
Claims (6)
1. Bild-Codier-Einrichtung, mit
- - einer Einrichtung zur Unterteilung von Bilddaten in Blöcke, die jeweils die gleiche Anzahl von Bildelementen aufweisen;
- - einer Klassifikationseinrichtung (1) zur Klassifizierung der Blöcke entsprechend dem Intensitätsgradienten jedes Blockes;
- - einer Vielzahl von Block-Codiereinrichtungen (3, 4, 5) zum Codieren der Blöcke; und
- - einer Auswahleinrichtung (6) zum Auswählen einer Block- Codiereinrichtung in Abhängigkeit von dem Ergebnis der Klassifikation der Klassifikationseinrichtung (1);
- - wobei alle Block-Codiereinrichtungen (3, 4, 5) eine für alle gleiche, konstante Codequantität abgeben, die die Summe der zu übertragenden Gradationsdaten und Auflösungsinformationen ist, und wobei
- - mit zunehmender (abnehmender) Anzahl der Gradationsstufen eines Blockes die zu übertragenden Auflösungsinformationen vermindert (vermehrt) werden.
2. Bild-Codier-Einrichtung nach Anspruch 1, dadurch gekennzeichnet,
daß die Auswahleinrichtung (6) eine Block-Codiereinrichtung
(3, 4, 5) mit einer geringen Gradationsinformation
und einer großen Auflösungsinformation auswählt, falls
der Block einen großen Intensitäts-Gradienten hat, während
die Auswahleinrichtung (6) eine Block-Codiereinrichtung (3, 4, 5)
mit einer großen Gradationsinformation und einer geringen
Auflösungsinformation auswählt, falls der Block einen geringen
Intensitäts-Gradienten hat.
3. Bild-Codier-Einrichtung nach Anspruch 1 oder 2, dadurch
gekennzeichnet, daß die Klassifizierungseinheit (1) die Gradationsverteilung
der Bildelemente eines Blocks ausmißt.
4. Bild-Codier-Einrichtung nach Anspruch 3, dadurch gekennzeichnet,
daß die aus der Gradationsverteilung ermittelte Dispersion
zur Klassifizierung verwendet wird.
5. Bild-Codier-Einrichtung, mit
- - einer Einrichtung zur Unterteilung von Bilddaten in Blöcke, die die gleiche Anzahl von Bildelementen aufweisen;
- - eine Vielzahl von Block-Codiereinrichtungen (3, 4, 5) zum Codieren der Blöcke;
- - einem lokalen Decodierer (20), der die durch die Block- Codiereinrichtungen (3, 4, 5) kodierten Blöcke dekodiert;
- - einer Klassifikationseinrichtung (1), in der die lokal dekodierten Blöcke mit den original Blockdaten eines Blockes verglichen werden und die Vergleiche nach einem festgelegten Verfahren bewertet werden; und
- - einer Auswahleinrichtungen (6) zum Auswählen einer Block- Codiereinrichtung (3, 4, 5) in Abhängigkeit von der Bewertung der Vergleiche der Klassifikationseinrichtung (1);
- - wobei alle Block-Codiereinrichtungen (3, 4, 5) eine für alle gleiche, konstante Codequantität abgeben, die die Summe der zu übertragenden Gradationsdaten und Auflösungsinformationen ist, und wobei
- - mit zunehmender (abnehmender) Anzahl der Gradationsstufen eines Blockes die zu übertragenden Auflösungsinformationen vermindert (vermehrt) werden.
6. Bild-Codier-Einrichtung nach einem der vorangegangenen Ansprüche,
dadurch gekennzeichnet, daß die Block-Codiereinrichtung
(3, 4, 5) umfaßt
- - eine Quantisierungs-Niveau-Steuerung (15) zur Quantisierung von Intensität-Daten;
- - einen Gradationsdaten-Kodierer (16) zum Kodieren der Quantisierungsniveaus;
- - einen Quantisierer (17) zum Quantisieren der Eingangsbilddaten in Übereinstimmung mit dem Quantisierungsniveau (11);
- - einen Auflösungsinformationsselektor (18) zur Elimination visuell überflüssiger Daten der Auflösungsinformation (12) des Quantisierers (17), und
- - einen Auflösungsinformations-Codierer (19) zur Codierung der Auflösungsinformation (13) des Auflösungsinformationsselektors (18) .
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP22356690 | 1990-08-23 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE4127920A1 DE4127920A1 (de) | 1992-04-09 |
DE4127920C2 true DE4127920C2 (de) | 1995-02-09 |
Family
ID=16800171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19914127920 Expired - Lifetime DE4127920C2 (de) | 1990-08-23 | 1991-08-23 | Bild-Codier-Einrichtung |
Country Status (2)
Country | Link |
---|---|
DE (1) | DE4127920C2 (de) |
GB (1) | GB2249238B (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19919624A1 (de) * | 1999-04-29 | 2000-11-02 | Oce Printing Systems Gmbh | Verfahren, System und Computerprogramm zum Komprimieren und Übertragen von Bildrasterdaten |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0567697A1 (de) * | 1992-04-29 | 1993-11-03 | Yiu Keung Chan | Methode für Bildkompression im Raumbereich |
US5553160A (en) * | 1994-09-01 | 1996-09-03 | Intel Corporation | Method and apparatus for dynamically selecting an image compression process based on image size and color resolution |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5474623A (en) * | 1977-11-28 | 1979-06-14 | Nippon Telegr & Teleph Corp <Ntt> | Coding processing system for video signal |
JPS5527751A (en) * | 1978-08-17 | 1980-02-28 | Nec Corp | Error detection circuit |
US4319267A (en) * | 1979-02-16 | 1982-03-09 | Nippon Telegraph And Telephone Public Corporation | Picture coding and/or decoding equipment |
JPS57174984A (en) * | 1981-04-20 | 1982-10-27 | Nippon Telegr & Teleph Corp <Ntt> | Encoding and decoding system for halftone fascimile signal |
JP2670259B2 (ja) * | 1985-11-29 | 1997-10-29 | ソニー株式会社 | 高能率符号化装置 |
JPS6386620A (ja) * | 1986-09-30 | 1988-04-18 | Canon Inc | デコ−ダの動作誤り検出装置 |
JPS63132356A (ja) * | 1986-11-25 | 1988-06-04 | Canon Inc | メモリバンク切換え装置 |
-
1991
- 1991-08-16 GB GB9117742A patent/GB2249238B/en not_active Expired - Lifetime
- 1991-08-23 DE DE19914127920 patent/DE4127920C2/de not_active Expired - Lifetime
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19919624A1 (de) * | 1999-04-29 | 2000-11-02 | Oce Printing Systems Gmbh | Verfahren, System und Computerprogramm zum Komprimieren und Übertragen von Bildrasterdaten |
DE19919624C2 (de) * | 1999-04-29 | 2001-03-01 | Oce Printing Systems Gmbh | Verfahren, System und Computerprogramm zum Komprimieren und Übertragen von Bildrasterdaten |
US7564586B1 (en) | 1999-04-29 | 2009-07-21 | Oce Printing Systems Gmbh | Method, system and computer program for compressing and transmitting image raster data |
Also Published As
Publication number | Publication date |
---|---|
GB2249238A (en) | 1992-04-29 |
GB9117742D0 (en) | 1991-10-02 |
GB2249238B (en) | 1995-02-01 |
DE4127920A1 (de) | 1992-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3636675C2 (de) | ||
DE69324743T2 (de) | Vorrichtung und Verfahren zur Bildsignalkodierung | |
DE68927082T2 (de) | Verfahren und Vorrichtung für die Bilddatenkomprimierung | |
DE69015695T2 (de) | Einrichtung zur Transformationskodierung. | |
DE69517283T2 (de) | Bildsignalkodierungsvorrichtung die zwischen variabler Längenkodierung und fester Längenkodierung wechselt | |
DE3751416T2 (de) | Bildcodiersystem zum Ueberwachen einer Informationsmenge durch Bildung eines Histogramms. | |
DE3224319C2 (de) | Verfahren und Einrichtung zum Bestimmen der Art der Schwärzungsgradpegelverteilung einer Bildfläche | |
DE69209540T2 (de) | Bildverarbeitungsgerät | |
DE69622501T2 (de) | Bildverarbeitungsvorrichtung und -verfahren | |
DE68923349T2 (de) | Bildreduzierungsvorrichtung. | |
DE69632620T2 (de) | Verfahren und Vorrichtung zur Kodierung und Dekodierung eines Bildes | |
DE3225415C2 (de) | ||
DE68921813T2 (de) | Verfahren und Vorrichtung zur Setzung von Farbtrennregeln. | |
DE3202913C2 (de) | Verfahren und Vorrichtung zur Verarbeitung eines Grauwertkomponenten enthaltenden Faksimilesignals | |
DE69411804T2 (de) | Umgekehrte Halbtonrasterung durch lineare Filterung und statistische Glättung | |
DE69126750T2 (de) | Kodierungsgerät für digitale Bildsignale | |
DE69125199T2 (de) | Geometrische Vektorquantifizierung | |
DE3854846T2 (de) | Kodierung eines Bildsignals mit Berücksichtigung des Kontrasts in jedem Bild und Dekodierung analog zur Kodierung | |
DE69225365T2 (de) | Bildsignalkodierungsvorrichtung | |
DE69427010T2 (de) | Genaue Bildtypunterscheidung | |
DE69123991T2 (de) | Bildverarbeitung mit neuronalem Netzwerk | |
DE3815586C2 (de) | Kompressionsverfahren für Bildsignale | |
DE3208859C2 (de) | ||
DE69116924T2 (de) | Halbton-Bildverarbeitungssystem | |
DE19802860B4 (de) | Verfahren und Vorrichtung zum kontext-basierten arithmetischen Codieren/Decodieren |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
R071 | Expiry of right | ||
R071 | Expiry of right |