DE69322351T2 - Verbesserte Dekomprimierung von Standard ADCT-komprimierten Bildern - Google Patents
Verbesserte Dekomprimierung von Standard ADCT-komprimierten BildernInfo
- Publication number
- DE69322351T2 DE69322351T2 DE69322351T DE69322351T DE69322351T2 DE 69322351 T2 DE69322351 T2 DE 69322351T2 DE 69322351 T DE69322351 T DE 69322351T DE 69322351 T DE69322351 T DE 69322351T DE 69322351 T2 DE69322351 T2 DE 69322351T2
- Authority
- DE
- Germany
- Prior art keywords
- image
- transform
- transform coefficients
- quantized
- coefficients
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000006837 decompression Effects 0.000 title claims description 17
- 238000000034 method Methods 0.000 claims description 64
- 238000007906 compression Methods 0.000 claims description 34
- 230000006835 compression Effects 0.000 claims description 29
- 230000008569 process Effects 0.000 claims description 16
- 238000013139 quantization Methods 0.000 claims description 16
- 230000009466 transformation Effects 0.000 claims description 10
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 claims description 2
- 230000006870 function Effects 0.000 description 10
- 238000001914 filtration Methods 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 6
- 230000000903 blocking effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000007547 defect Effects 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 241000255925 Diptera Species 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 240000005002 Erythronium dens canis Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012432 intermediate storage Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/527—Global motion vector estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Image Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
- Die vorliegende Erfindung ist allgemein auf die Erzeugung von Dokumentenbildern und insbesondere auf ein Verfahren zur Verbesserung des Aussehens eines dekomprimierten Dokumentbildes gerichtet, wobei die Treue zu einem ursprünglichen Dokumentbild beibehalten wird, von dem es abgeleitet ist.
- Eine Datenkompression wird bei Datenverarbeitungsverfahren verlangt, wo für praktische Anwendungen zu viele Daten vorhanden sind, die die Daten verwenden. Im allgemeinen wird eine Komprimierung bei Kommunikationsverbindungen verwendet, wo die Übertragungszeit lang ist oder wo die Bandbreite beschränkt ist. Eine andere Verwendung für eine Komprimierung ist bei der Datenspeicherung, wo die Größe des Raums eines Mediums, auf dem die Daten gespeichert werden, wesentlich durch Komprimierung verringert werden kann. Eine noch andere Anwendung zur Komprimierung ist ein digitales Kopiergerät, wo eine Zwischenspeicherung von Daten zur Zusammenstellung, zum erneuten Drucken oder für irgendeine andere digitale Kopiergerätfunktion verlangt wird. Allgemein gesagt sind abgetastete Bilder, d. h., elektronische Darstellungen von Hardcopydokumenten, üblicherweise groß, und somit sind sie erwünschte Kandidaten für eine Komprimierung.
- Viele unterschiedliche Komprimierungstechniken bestehen, und viele sind Eigentum einzelner Benutzer. Jedoch sind Normen erwünscht, wenn immer eine Interkommunikation zwischen Einrichtungen ausgeführt wird. Insbesondere wird mit dem Aufkommen einer Multimediakommunikation, wo von früher unterschiedlichen Einrichtungen verlangt wird, zu kommunizieren, eine allgemeine Norm verlangt. Ein Beispiel ist der gegenwärtige Wunsch an Fax-Geräte, daß sie fähig sind, mit Druckern zu kommunizieren. Gegenwärtig sind Komprimierungsnormen im allgemeinen bei unterschiedlichen Einrichtungen unterschiedlich.
- Drei Hauptschemata zur Bildkomprimierung werden gegenwärtig durch internationale Normierungsgruppen untersucht. Ein erstes für eine Facsimile-Bildübertragung, die hauptsächlich binär ist, wird von dem JBIG (Joint Binary Image Group) Komitee untersucht, ein zweites für Fernsehen und Film, wobei eine Norm von der MPEG (Motion Pictures Expert Group) erarbeitet wir. Für sich nicht bewegende, allgemeine Bilder, d. h., Stehbilder, die allgemeiner als die von JBIG umfaßt werden, sucht die Gruppe JPEG (Joint Photographic Expert Group) eine von einer Einrichtung unabhängige Komprimierungsnorm zu entwickeln, wobei ein adaptives, diskretes Kosinustransformationsschema verwendet wird.
- ADCT (Adaptive Discrete Cosine Transform, beispielsweise beschrieben von W. H. Chen und C. H. Smith in "Adaptive Coding of Monochrome and Color Images", IEEE Trans. Comm., Bd. COM-25, S. 1285-1292, November 1977) das von dem JPEG Komitee verbreitete Verfahren, wird in dieser Anmeldung genannt und ist ein verlustreiches System, das Datenredundanz auf der Grundlage von Pixel-Pixel Korrelationen verringert. Im allgemeinen ändert sich in Bildern auf einer pixelweisen Grundlage ein Bild nicht sehr stark. Ein Bild hat deshalb, das was als eine "natürliche, räumliche Korrelation" bekannt ist. In natürlichen Szenen wird eine Korrelation verallgemeinert, aber nicht genau. Rauschen macht jedes Pixel etwas von seinem Nachbarn verschieden.
- Im allgemeinen verlangt, wie es in Fig. 1 gezeigt ist, das Komprimierungsverfahren einen Ausschnitts-Speicher 10, der einen M · M Ausschnitt des Bildes speichert. Wir verwenden quadratische Ausschnitte bei der Beschreibung auf der Grundlage der JPEG Empfehlungen, wobei aber darauf hinzuweisen ist, daß Verfahren gemäß der Erfindung, die unten beschrieben ist, mit irgendeiner Form Ausschnitt durchgeführt werden können. Von dem Teil des Bildes, der in dem Ausschnitts-Speicher gespeichert ist, wird die diskrete Kosinustransformation (DCT), eine Frequenzraumdarstellung des Bildes, bei dem Umsetzer 12 gebildet. Hardwareausführungen stehen zur Verfügung, wie der Bildkomprimierungsprozessor C-Cube Microsystems CL550A gemäß JPEG, der entweder im Komprimierungs- oder Dekomprimierungsmodus gemäß der vorgeschlagenen JPEG- Norm arbeitet. Eine Teilungs/Quantisierungseinrichtung 14 wird von einem Satz von Werten verwendet, der als eine Q-Tabelle bezeichnet wird, die in einem Q-Tabellenspeicher 16 gespeichert ist, so daß ein bestimmter Q-Tabellenwert in den DCT Wert geteilt wird, wobei der ganzzahlige Teil des Werts als der quantisierte DCT Wert zurückgegeben wird. Ein Huffmann Codierer 20, der eine statistische Codierung der quantisierten DCT Werte verwendet, erzeugt das komprimierte Bild, das zur Speicherung, Übertragung, usw. ausgegeben wird.
- Das gegenwärtige ADCT Komprimierungsverfahren teilt ein Bild in M · M Pixelblöcke, mit M = 8. Die Wahl M = 8 ist ein Kompromiß, wobei je größer der gegebene Block ist, um so größer das erreichbare Verdichtungsverhältnis. Jedoch ist es bei einem solchen größeren Block auch wahrscheinlicher, daß er nichtkorrelierte Pixel in dem Block aufweist, wodurch das Komprimierungsverhältnis verringert wird. Wenn der Block kleiner ist, kann eine größere Korrelation in dem Block erreicht werden, wobei aber eine geringere Gesamtkomprimierung erzielt würde. Insbesondere ist es bei einem Dokumentbild wahrscheinlicher, daß Bildränder innerhalb eines 8 · 8 Blocks angetroffen werden, als es der Fall bei einer Szene wäre, die ein natürliches Bild bildet. Somit schlägt die Annahme einer Raumkorrelation in einem gewissen Maße fehl. Ein Hauptproblem, das durch die vorliegende Erfindung angesprochen wird, wie es hier unten offensichtlicher wird, ist, daß die Annahmen des ADCT Vorschlags gut bei Photographien arbeiten, die fortlaufende Töne und viele Werte von Graupixeln enthalten, aber häufig schlecht bei der Wiedergabe von Dokumentbildern arbeiten, die beträchtliche hochfrequente Komponenten und viele kontraststarke Ränder aufweisen.
- Komprimierungsschemata neigen dazu, einen Satz Basisfunktionen zu verwenden, um die Zwischenblockkorrelationen zu nützen. Basisfunktionen definieren die Daten als eine Projektion auf einen Satz orthogonaler Funktionen in einem Intervall. ADCT verwendet Kosinusfunktionen als die Basisfunktionen und die diskrete Kosinustransformation (DCT) als den Projektionsschritt. In dem ersten Schritt der ADCT Norm wird das Bild in 8 · 8 Blöcke aufgeteilt. Innerhalb eines jeden Blocks wird ein Satz von 64 DCT Koeffizienten für die Pixel in dem Block bestimmt. Die DCT Koeffizienten stellen die Koeffizienten eines jeden Kosinusausdrucks der diskreten Kosinustransformation des 8 · 8 Blocks dar.
- Es wird nun auf Fig. 2A bezug genommen, in der ein Feld mit 64 Graupegelwerten gezeigt ist, die 64 Pixel in einem 8 · 8 Block des Bildes darstellen. Dieser 8 · 8 Block wird gemäß den ADCT Spezifizierungen für den JPEG transformiert, wobei die in Fig. 2B gezeigten DCT Koeffizienten gegeben sind. Diese Koeffizienten beschreiben wohl vollständig die Bilddaten der Fig. 2A, wobei sich aber im allgemeinen größere Werte nun an der oberen linken Ecke in dem niedrigeren Raumfrequenzbereich häufen. Gleichzeitig tendieren bei der großen Mehrzahl von Bildern, wenn die Frequenz des Bildes zunimmt, die Koeffizientenwerte in dem unteren, rechten Abschnitt des Gitters zu Null.
- Im allgemeinen neigt das menschliche Auge dazu, am besten niedere Frequenzen in einem Bild zu sehen. Bei höheren Frequenzen sind Änderungen von Amplitude zu Amplitude nicht wahrnehmbar, es sei denn, solche Änderungen treten bei einem äußerst großen Kontrast auf. Das ist eine gut bekannte Wirkung des menschlichen Sehsystems und ausführlich dargelegt, vgl. z. B. "Visual Performance and Image Coding" von P. Roetling, Proceedings of the S. I. D. 17/2 S. 111-114 (1976). Das ADCT Verfahren verwendet die Tatsache, daß kleine Amplitudenänderungen bei hohen Frequenzen im allgemeinen unberücksichtigt bleiben können.
- Der nächste Schritt in dem ADCT Verfahren schließt die Verwendung einer Quantisierungs- oder Q-Matrix ein. Die Q-Matrix, die in Fig. 2C gezeigt ist, ist eine normierte, von JPEG vorgeschlagene Matrix zur Komprimierung, wobei aber das ADCT Verfahren und die Verfahren gemäß der vorliegenden Erfindung, die unten beschrieben sind, auch bei Verwendung anderer Q-Matrizen (oder Q-Tabellen) arbeiten können. Die Matrix schließt die Wirkung ein, daß niederere Frequenzen grob gesagt bedeutender als hohe Frequenzen sind, indem allgemein größere Quantisierungsschritte, d. h., größere Eintragungen für größere Frequenzen eingeführt werden. Die Tabelle versucht jedoch auch intern einige erwünschte Änderungen von der allgemeinen Annahme zu konstruieren. Demgemäß ändern sich die Werte in der Tabelle mit der Frequenz, wo die genaue Änderung eine Funktion des menschlichen Sehsystems sein kann, der Art der erwarteten Vorlage, d. h., Photo, Text, Graphik, usw., oder von irgendeinem anderen anwendungsabhängigen Parameter. Jeder der DCT Werte aus der Fig. 2B wird durch einen entsprechenden Q-Matrixwert aus Fig. 2C dividiert, wodurch sich die quantisierten DCT (QDCT) Werte ergeben mittels:
- QDCT[m][n] = INT{DCT[m][n] : Q-Tabelle [m][n] + ½}
- wo INT{A} den ganzzahligen Teil von A bezeichnet.
- Der Rest des Divisionsverfahrens wird entfernt, wodurch sich ein Datenverlust ergibt. Hier und im folgenden verwenden wir den Ausdruck Division, um das bei ADCT detaillierte Verfahren zu beschreiben, einschließlich der Verfahren, Abschneiden und Runden zu behandeln. Des weiteren gehen, da die Q-Werte in dem unteren, rechten Bereich der Tabelle dazu neigen, groß zu sein, gehen die meisten Werte in diesem Bereich nach Null, es sei denn, es gibt äußerst hohe Amplituden des Bildes bei den höheren Frequenzen.
- Nach dem Ableiten des quantisierten Satzes von DCT Werten, die in Fig. 2D gezeigt sind, werden Pixel in der Reihenfolge einer einen Raum füllenden Zickzackkurve angeordnet, und ein statistisches Codierungsverfahren, wie das Huffmannverfahren, wird verwendet, das übertragene Signal zu erzeugen. Diese statistische Codierung wird in einer verlustlosen Weise ausgeführt, und der einzige Verlust, der bei der Komprimierung eingeführt wird, ist derjenige, der durch die Quantisierung der DCT Koeffizienten unter Verwendung der Q-Tabelle erzeugt wird.
- ADCT Transformationen sind gut bekannt, und es gibt Hardware, die Transformation an den Bilddaten auszuführen, z. B. US-A 5,049,991 von Nihara, US-A 5,001,559 von Gonzales u. a. und US-A 4,999,705 von Puri. Der Hauptschwerpunkt dieser Einzelpatente betrifft jedoch Laufbilder und keine Dokumentenbilder.
- Um das nun komprimierte Bild zu dekomprimieren, wird unter Bezugnahme auf Fig. 1 einer Reihe von Funktionen oder Schritten gefolgt, um den beschriebenen Vorgang umzukehren. Die Huffmanncodierung wird bei einem Decodierer 50 entfernt. Das Bildsignal stellt nun die quantisierten DCT Koeffizienten dar, die mit einer Signalmultiplikationseinrichtung 52 mit den Q-Tabellenwerten im Speicher 54 in einem zu dem Komprimierungsverfahren umgekehrten Verfahren multipliziert werden. Bei dem Umkehr-Umsetzer 56 wird die umgekehrte Transformation der diskreten Kosinustransformation abgeleitet, und das Ausgangsbild im Raumbereich wird bei dem Bildpuffer 58 gespeichert.
- Bei dem beschriebenen Dekomprimierungsverfahren wird eine Huffmanncodierung entfernt, um den Satz quantisierter DCT Koeffizienten zu erhalten. Jedes Element des Satzes wird durch einen Wert der Q-Tabelle unter Verwendung der Daten der Fig. 2C und 2D multipliziert, wobei sich die in Fig. 3A gezeigten DCT Koeffizienten ergeben, nämlich durch:
- DCT[m][n] = QDCT[m][n] · Q-Tabelle[m][n].
- Jedoch ist das in Fig. 3A gezeigte Ergebnis nicht der ursprüngliche Satz der in Fig. 2B gezeigten DCT Koeffizienten, weil die Reste, die für die ursprüngliche Quantisierung der DCT Koeffizienten mit der Q-Tabelle bei dem Komprimierungsverfahren berechnet wurden, verloren gegangen sind. Bei einem üblichen ADCT Dekomprimierungsverfahren wird die inverse, diskrete Kosinustransformation des Satzes von DCT Koeffizienten abgeleitet, um in Fig. 3B gezeigte Bildwerte zu erhalten.
- Das beschriebene Verfahren arbeitet nicht, die besten Bilder wiederzugeben. Natürlich kann es nicht das ursprüngliche Bild wiedergeben, da Daten innerhalb des Bildes bei dem Komprimierungs-Quantisierungs-Schritt entfernt worden sind. Fehler werden bemerkt, wo immer starke Ränder, im allgemeinen in einem Text vorhanden, erscheinen. Insbesondere werden an solchen Rändern "Bildfehler" oder in manchen Fällen " Mückenrauschen" bemerkt. Diese Schwierigkeiten treten bei Text, Graphik und Halbtönen auf, Komponenten, die bei Dokumentenbildern sehr häufig sind. Zusätzlich zu Mückenrauschen oder Bildfehlern erscheint häufig ein blockierender Bildfehler, der verbunden mit Bildbereichen mit sich langsam verändernden Graus erscheint, wo jeder M · M Block, der die Berechnung der Komprimierungsbasis bildete, sichtbar erscheint. In jedem Fall ist ein Problem aufgetreten.
- Um die genannten Bildfehler zu entfernen, sind zwei Verfahren, das Problem anzugehen, versucht worden. In einem ersten Verfahren wird das dekomprimierte Bild nachverarbeitet, d. h., nachdem das Bild vollständig dekomprimiert worden ist, wird ein Versuch gemacht, das Bild zu verbessern. Natürlich kann eine solche Verarbeitung niemals zurück zu dem ursprünglichen Bild gehen, weil das Bild verloren worden ist. Solche Verfahren sind gezeigt in dem Artikel "Reduction of Blocking Effects in Image Coding" von Reeve, III u. a., Optical Engeneering, Januar/Februar, 1984, Bd. 23, Nr. 1, S. 34 und "Linear Filtering for Reducing Blocking Effects in Orthogonal Transform Image Coding" von C. Avril u. a., Journal of Electronical Imaging, April 1992, Bd. 1 (2), S. 183-191. Jedoch führt diese Nachverarbeitung des Bildes zu einer Rekonstruktion, die nicht das wirkliche Quellenbild gewesen sein konnte, und nachfolgende Komprimierungs/Dekomprimierungsschritte, wie sie bei elektronischen Bildanwendungen möglich sind, führen zu möglicherweise immer größeren Abweichungen zwischen der Rekonstruktion und dem Original.
- Eine andere Methode für dieses Problem ist ein iteratives Decodierverfahren, das die bekannte Bandgrenze der Daten verwendet. Bei dieser Methode werden, wobei die komprimierte Form des Bildes wieder verwendet wird, unterschiedliche Blöcke, vielleicht 32 · 32 verwendet, das Bild zu decodieren. Bei einem Beispiel "Iterative Procedures for Reduction of Blocking Effects in Transform Image Coding" von R. Rosenholtz u. a., SPIE, Bd. 1452, Image Processing Algorithms and Techniques II, (1991), S. 116-126, wurde ein Verfahren, das gesamte Bild unscharf zu machen, in der Hoffnung betrachtet, daß ein solches Unscharfmachen dazu neigen würde, die obenerwähnten Blockbildfehler zu glätten.
- Gemäß der Erfindung wird ein Verfahren zur Dekomprimierung eines komprimierten Dokumentbildes geschaffen, wie es im Anspruch 1 festgelegt ist.
- Gemäß einem anderen Gesichtspunkt der Erfindung kann in einem solchen Dekomprimierungsverfahren der Schritt f) die zusätzlichen Schritte enthalten: 1) Bestimmen, daß der Block neuer Transformationskoeffizienten nicht von dem Originalbild ableitbar ist; und 2) einzelne neue Transformationskoeffizienten zu ändern, so daß ein Block geänderter, neuer Transformationskoeffizienten von dem Originalbild ableitbar ist, 3) Wiedergewinnen des Bildes von den Blöcken abgeänderter, neuer Transformationskoeffizienten.
- Gemäß einem noch anderen Gesichtspunkt der Erfindung können die Schrift d-f iterativ wiederholt werden, bis eine ausgewählte Bedingung auftritt. Mögliche, ausgewählte Bedingungen sind i) eine Anzahl von Iterationen, ii) es werden keine Korrekturen bei dem transformierten Bild verlangt, oder iii) es sind keine Änderungen bei aufeinanderfolgenden Iterationen an dem invertiert transformierten Bild gemacht worden.
- Indem das Dekomprimierungsverfahren abgeändert wird, im Gegensatz dazu, das Komprimierungsverfahren abzuändern, können die Ganzheit und Kompatibilität mit dem JPEG Standardverfahren unabhängig von der Anzahl der Komprimierungs/Dekomprimierungszyklen beibehalten werden, denen die Daten des Dokumentbildes ausgesetzt sind. Zusätzlich kann das Verfahren selektiv auf der Grundlage der Bildeingabe und davon verwendet werden, ob Verbesserungen unter Verwendung des Dekomprimierungsverfahrens gemacht werden können.
- Nur in beispielhafter Weise werden Ausführungsformen der Erfindung unter Bezugnahme auf die beigefügten Zeichnungen beschrieben, in denen:
- Fig. 1 (bereits beschrieben) ein funktionales Blockdiagramm für das ADCT Komprimierungs/Dekomprimierungsverfahren nach dem Stand der Technik zeigt;
- Fig. 2A (bereits beschrieben) einen 8 · 8 Block von Bilddaten zeigt, die komprimiert werden sollen;
- Fig. 2B (bereits beschrieben) die diskreten Kosinuswerte zeigt, wie sie bestimmt worden sind und eine Frequenzraumdarstellung des Bildes der Fig. 2A geben;
- Fig. 2C fehlt
- Fig. 2D (bereits beschrieben) die quantisierten, diskreten Kosinuswerte zeigt, wie sie bestimmt wurden;
- Fig. 3A (bereits beschrieben) die DCT Werte zeigt, die von den Daten der Fig. 2A unter Verwendung der Q-Tabelle der Fig. 2C wiedergewonnen worden sind, und
- Fig. 3B (bereits beschrieben) den entsprechenden 8 · 8 rekonstruierten Bilddatenblock zeigt;
- Fig. 4 den Grundsatz eines einzigen Satzes quantisierter ACDT Werte zeigt, die eine Klasse unterschiedener und möglicher Bilder darstellen;
- Fig. 5A-C numerische Beispiele für den Fall eines Mehrquellenbildes zeigen, das durch einen einzigen Satz quantisierter ACDT Werte dargestellt ist;
- Fig. 6 die Wirkung des randbewahrenden Tiefpaßfilters zeigt, der bei den Beispielen verwendet wird;
- Fig. 7A ein Beispiel eines Bildblocks zusammen mit seiner Nachbarschaft und dem Filterzusammenhang zeigt;
- Fig. 7B die Ergebnisse des Filterverfahrens bei dem Bild zeigt,
- Fig. 7C die DCT Transformation des Bildes zeigt, wobei die Kreise darstellen, daß das Bild nicht innerhalb des Satzes möglicher Bilder ist;
- Fig. 7D eine Abänderung bei der DCT Transformation des Bildes zeigt; und
- Fig. 7E die inverse Transformation der abgeänderten DCT Transformation zeigt;
- Fig. 8 eine graphische Darstellung der Fig. 7 zeigt, wo das gefilterte Bild außerhalb des Satzes von Bildern mit identischen ADCT Darstellungen liegt; und
- Fig. 9 ein Ablaufdiagramm eines iterativen Dekomprimierungsverfahrens zeigt.
- Unter Bezugnahme nun auf die Zeichnungen, merken wir zum Anfang an, daß, während es unmöglich ist, zu dem genauen Bild zurückzukehren, was ursprünglich in dem Komprimierungsverfahren komprimiert worden ist, weil Daten in dem Komprimierungsverfahren verloren gegangen sind, es möglich ist, zu einem Bild zurückzukehren, das in gewisser Weise dem komprimierten Originalbild ähnlich ist, wie es hier nachfolgend beschrieben ist. Zweitens ist es möglich, die grundlegenden Bildfehler zu korrigieren, die in dem Bild erscheinen. Unter Bezugnahme auf Fig. 4 wird nun ein allgemeiner Überblick über das Komprimierungs/Dekomprimierungsverfahren gezeigt. Es gibt einen Satz Bilder, die voneinander verschieden sind, die aber in bezug darauf ähnlich sind, daß jedes Bild in dem Satz an der gleichen ADCT Darstellung komprimiert wird. Deshalb sollte irgendein Dekomprimierungsverfahren ein Ausgangsbild erzeugen, das innerhalb dieses Satzes ist. Die Kenntnis des Satzes möglicher Bilder wird durch die verwendete Q-Tabelle codiert. Da die Q-Tabelle Divisoren der diskreten, quantisierten Transformationskoeffizienten darstellt und als Ergebnis des Quantisierungsverfahrens Bruchteilsabschnitte eines jeden Koeffizienten entfernt sind, stellt dann der Satz möglicher Bilder alle diejenigen Bilder dar, von denen dieselben quantisierten Transformationskoeffizienten über einen Bereich möglicher Koeffizientenwerte für jeden Ausdruck der Transformation bestimmt werden können.
- Nun unter Bezugnahme auf Fig. 5A ist dort ein Satz möglicher Quellenbilder 100, 102, 104 und 106 gezeigt, von denen jedes aus Bildsignalen mit einem Graudichtewert besteht, der bei dem Beispiel von 0 bis 256 reicht, gefolgt von ihren entsprechenden DCT Koeffizienten als ein Ergebnis der DCT Umwandlung (zur Darstellung, als die DCT 108 angegeben). Diese Bilder stellen Bereiche von Dokumentenbildern dar, die durch Abtasten eines Originaldokuments mit einem Eingabeabtaster erzeugt worden sind, oder als elektronisches Dokument auf einem Computer, usw. erzeugt worden sind. Wie man sehen kann unterscheiden sich die Bilder und die DCT Koeffizienten 110, 112, 114 und 116, die in Fig. 5B gezeigt sind, sind unterschiedlich. Die DCT Koeffizienten werden bei der Quantisierung 118 unter Verwendung der entsprechenden Eingänge in die Q- Tabelle 119 quantisiert, die in Fig. 5C gezeigt ist. Bei diesem Beispiel wird der obere linke Eingang der DCT Koeffizienten durch den oberen linken Eingang [16] in der Q-Tabelle dividiert. Unter Verwendung eines Rundungsvorgangs für den Bruchteil sind die Ergebnisse für diese Koeffizienten
- im Satz 110, 157/16 = 9,81 gerundet auf 10,
- im Satz 112, 160/16 = 10
- im Satz 114, 163/16 = 10,19 gerundet auf 10, und
- im Satz 116, 163/16 = 10,13 gerundet auf 10.
- Alle die oberen linken Eingänge in die Tabelle der DCT Koeffizienten sind deshalb auf die gleichen quantisierten DCT Koeffizienten (Satz 120, der in Fig. 5c gezeigt ist) unter Verwendung dieser Q-Tabelle abbildbar. Das gleiche gilt für alle anderen DCT Koeffizi enten, die in Fig. 5A gezeigt sind. Die komprimierten Daten des Satzes 120 beschreiben deshalb einen Satz möglicher Quellenbilder statt eines einzigen Quellenbilds mit einem Teilsatz dieser möglichen Quellenbilder, die in Fig. 5A gezeigt sind. Die Bestimmung, daß ein 8 · 8 Bildblock eine mögliche Quelle der quantisierten DCT Koeffizienten ist, kann abgeleitet werden, indem die Tatsache betrachtet wird, daß die Eingänge in die Q- Tabelle die Quantisierer definieren und deshalb die Genauigkeit der DCT Koeffizienten. Bei dem in Fig. 5B gegebenem Beispiel ist der obere, linke Eingang begrenzt durch 153 ≤ Eingang ≤ 168, wobei 16 Werte überbrückt werden und irgendein Wert in diesem Bereich als ein DCT Koeffizient ohne Änderung der komprimierten Daten verwendet werden kann. Es ist diese "Uneindeutigkeit", die bei dem untenbeschriebenem Verfahren verwendet wird, wobei ein mögliches Quellenbild ausgewählt wird, d. h., i) ein mögliches Quellenbild, das mit den komprimierten Daten übereinstimmt, und ii) ein Bild, das mit dem Modell eines Dokumentbildes übereinstimmt. Auf diese Weise unterscheidet sich das Verfahren von früheren Verfahren, bei denen das letzte abgeleitete Bild nicht mit den komprimierten Daten wie bei Nachfilterungsverfahren übereinstimmt, oder kein Quellenbildmodell verwendet, die Dekomprimierung zu beschränken, aber vielmehr eine Abtastüberlegung verwendete, das Bild unscharf zu machen.
- Um eine Erwartung für das Eingabedokumentbild zu definieren, wird angemerkt, daß das Bildproblem, das sich aus dem Dekomprimierungsverfahren ergibt, Zittern oder hochfrequentiertes Rauschen ist. Das Ausschließen des hochfrequentierten Rauschens ist erwünscht und verlangt ein Tiefpaßfilter. Unglücklicherweise tritt das Zittern an Rändern auf, die in Dokumentenbildern sehr häufig und wichtig sind. Demgemäß ist, da Ränder hohe Frequenzen darstellen, die nicht entfernt werden sollten, ein einfaches Tiefpaßfilter nicht angemessen, weil es die Randinformation zerstören würde, d. h.: die Lesbarkeit von Zeichen oder die Definition von Linien zusammen mit der Verringerung des Rauschens. Es wird vielmehr ein Tiefpaßfilter verlangt, das Ränder bewahrt. Ein solches Filter ist ein nichtlineares Filter, das ein statistisches Ordnungs-Filter (oder ein Medianfilter), ein Sigmafilter oder Ähnliches sein kann.
- Bei unserem gegenwärtigen Beispiel und unter Bezugnahme auf Fig. 6 arbeitet das Sigmafilter an dem Bild, wobei in diesem Beispiel ein Rauschwert oder Delta von Δ = 32 verwendet wird. Das Pixel mit dem Wert 231 ist von Pixeln umgeben, die von diesem Wert um nicht mehr als Δ abweicht, und deshalb wird ein Ausgangswert 218 erhalten, indem über alle 9 Pixel in einem 3 · 3 Bereich gemittelt wird. Das Pixel mit dem Wert 40 ist von Pixeln innerhalb des Bereiches sowie von Pixeln umgeben, die den Bereich überschreiten, wodurch ein Ausgangswert 55 erhalten wird, der durch Mittelung über 3 Pixel erzeugt wird.
- Nun unter Bezugnahme auf Fig. 7A ist eine Gruppe dekomprimierter Pixel und ihrer Grauwerte in einem 8 · 8 Pixelblock innerhalb einer 10 · 10 Pixelnachbarschaft durch die schwarzen Linien angegeben, die die Nachbarschaft von dem Rest des Bildes trennen, wie es gezeigt ist. An den Grenzen des Bildes wiederholen wir einfach Pixel, und dies ist in Fig. 7A in der linkesten Spalten und der untersten Zeile dargestellt. Das Sigmafilter ist als eine Mittelungsfunktion dargestellt, die an Pixeln in einer 3 · 3 Nachbarschaft ausgeführt wird, die nicht von dem Mittenpixel um mehr als einen Wert von 32 abweichen. In Fig. 7A weichen die Werte 155, 96 und 141 (alle eingekreist) von dem Mittenpixel 206 (durch ein Quadrat gekennzeichnet) um mehr als einen Wert von 32 ab (der Rauschwert oder e). Wenn dieses Filter angewendet wird, wird ein abgeändertes Bild von den Graupegelpixeln erhalten, die in Fig. 7B gezeigt sind, und es ergibt sich ein neuer Wert von 208 (gekennzeichnet durch ein Quadrat) für das Pixel.
- Nachdem man ein gefiltertes Bild erhalten hat, das das hochfrequentierte Rauschen innerhalb des dekomprimierten Bildes abgeschwächt hat, wird ein Vergleich mit dem Originalbild erhalten, um die Treue zu dem Originalbild sicherzustellen. Die DCT des Bildes wird abgeleitet, wie es in Fig. 7c gezeigt ist. Die Ergebnisse werden unmittelbar mit dem ursprünglichen, komprimierten Bild verglichen (beispielsweise mit dem DCT Koeffizientengruppen 110, 112, 114 und 116 und der Q-Tabelle 119 der Fig. 5B und 5C verglichen). Jede Position in dem DCT Satz weist einen Bereich annehmbarer Werte auf, und bei dem Beispiel der Fig. 7C ist der Wert an der Position 3,1 (der eingekreiste Wert von 74) jenseits des Bereiches annehmbarer Werte, die früher zu 75 bis 84 mittels 8 = INT {annehmbarer Wert: 10 + 1/2} bestimmt worden sind, wo "8" der quantisierte DCT Koeffizient und "10" der entsprechende Eingang in die Q-Tabelle ist. Demgemäß wird der Wert 75 für den Wert 74 ersetzt. Mit anderen Worten sind die Transformationswerte so geändert worden, daß das Bild, das außerhalb der Gruppe möglicher Bilder war, nun gerade innerhalb dieser Gruppe ist (siehe Fig. 5A und 5B). Während ein Wert gerade innerhalb des annehmbaren Bereiches bei diesem Beispiel ausgewählt wird, können Versuche zeigen, daß Werte an anderen Positionen in dem Bereich auch eine geeignete Gruppe für Werte außerhalb des Bereiches sein mögen. Fig. 7D zeigt dem korrigierten DCT Koeffizienten an der Position 3,1 mit einem zusätzlich abgeänderten Eingang an der Position 1,4 (eingekreist). Aus den Fig. 7C und 7D ist es klar, daß ein einfaches Filtern eines dekomprimierten Bildes nicht gewährleistet, daß das Ergebnis des Filterungsvorgangs ein Bild ist, das ein mögliches Quellenbild für die komprimierten Daten war, so daß ein Bild erzeugt wird, das die DCT Daten verletzt. Die inverse Transformation der abgeänderten DCT Gruppe wird abgeleitet, und eine Gruppe grauer Bildpixel wird wiedererhalten, wie es in Fig. 7E gezeigt ist. Alle Pixel in Fig. 7E, die unter Bezugnahme auf Fig. 7B abgeändert worden sind, sind erneut eingekreist. Man sollte beachten, daß die in Fig. 7E gegebenen Werte die Werte eines möglichen Originalbildes sind, wo hingegen zwei Werte, die in Fig. 7B gegeben sind, die annehmbaren DCT Bereiche verletzten.
- Das Verfahren, das Bild zu filtern, in den Frequenzraum zu transformieren, die Frequenzraumwerte zu vergleichen und zu ändern, und sie zurück zu den grauen Bildpixeln zu transformieren, kann mehrere Male erneut iteriert werden. Die Anzahl der Iterationen kann auf der Grundlage keiner Änderungen bei der DCT Transformation ausgewählt werden (d. h., es gibt eine Konvergenz). Alternativ kann das Verfahren iteriert werden, bis es keine weiteren Änderungen bei dem Bild gibt (eine andere Art Konvergenz). Bei einer noch anderen Alternative kann die Anzahl von Iterationen, die auf eine feste Zahl festgelegt ist, oder eine feste Anzahl als ein obere Grenze der Iterationen dienen.
- Bei dem verwendeten Iterationsverfahren kann die Rauschabschätzung, die in dem Filter verwendet wird, bei jeder Iteration geändert werden. Das heißt, statt Δ = 32 anzunehmen und diesen Wert bei jeder Iteration zu verwenden, können Werte von zwei Dritteln von Δ bei der zweiten Iteration und von einem Drittel Δ bei der dritten Iteration im Fall von drei Iterationen verwendet werden. Wir können auch in sequentiellen Vorgängen filtern und schärfen (ein unterschiedliches Filtern anwenden).
- Nun ist das Bild ein neues. Zuerst wird angemerkt, daß dieses Bild ein mögliches Originalbild ist, das das komprimierte Originalbild zum Ergebnis haben könnte. Deshalb gibt es einige Treue mit dem Originalbild. Das Bild ist zumindest einmal geglättet worden, um hochfrequentiertes Rauschen zu entfernen, während Ränder verstärkt oder beibehalten werden. Die Korrektur mag Änderungen an dem Bild eingeführt haben, aber eine komprimierte Fassung des gefilterten Bildes ist mit dem ursprünglich komprimierten Bild (der ursprünglichen möglichen Gruppe) verglichen worden, um die Treue zu gewährleisten. Das gefilterte Bild wurde, wie verlangt, korrigiert. Es wird angenommen, daß das korrigierte, gefilterte Bild besser als das gefilterte Bild ist, weil es in vollständiger Übereinstimmung mit dem Bereich möglicher Bilder ist.
- Fig. 8 stellt das Prinzip des Verfahrens dar. Das Originalbild wird komprimiert; die komprimierte Darstellung wird dekomprimiert. Das dekomprimierte Bild wird gefiltert, um das Aussehen zu verbessern, wobei es bei dieser Durchführung aber nach außerhalb des Bereiches von Bildern gezwungen wird, die annehmbar sind. Die DCT Darstellung des Bildes wird deshalb geändert, um das Bild in den annehmbaren Bereich von Bildern zu zwingen.
- Nun unter Bezugnahme auf Fig. 9 ist ein Ablaufdiagramm der iterative ADCT Dekomprimierung/Rekonstruktion vorgesehen, die zusätzliche Arbeitsschritte des Verfahrens gemäß der vorliegenden Erfindung zeigt. Ein in Übereinstimmung mit dem ADCT Komprimierungsverfahren mit statistischer Codierung komprimiertes Bild wird beim Schritt 300 erhalten. Die statistische Codierung wird beim Schritt 302 entfernt, um quantisierte DCT Koeffizienten zu erhalten. Beim Schritt 304 werden die quantisierten DCT Koeffizienten mit Werten in der Q-Tabelle multipliziert, um die Gruppe von DCT Koeffizienten zu erhalten. Beim Schritt 306 wird die inverse Transformation der DCT Koeffizienten abgeleitet, um das Graupegelbild zu erzeugen. Indem von dem normalen Verfahren beim Schritt 308 abgewichen wird, wird der 8 · 8 Ausgangsblock gefiltert. Beim Schritt 310 wird der gefilterte Bildausgang verwendet, eine Gruppe von DCT Koeffizienten zu erzeugen. Beim Schritt 312 werden die DCT Koeffizienten des gefilterten Bildes mit den DCT Koeffizienten, die beim Schritt 312 erhalten worden sind, und mit einem annehmbaren Bereich um jeden Wert herum verglichen. Beim Schritt 314 wird, wenn die DCT Koeffizienten des gefilterten Bildes innerhalb des annehmbaren Bereiches um jeden Wert herum sind, dann beim Schritt 316 die inverse Transformation der DCT Koeffizienten abgeleitet, um das Graupegelbild zu erzeugen. Beim Schritt 320 wird das Graubild zum Ausgang gelenkt. Wenn die PCT Koeffizienten des gefilterten Bildes nicht innerhalb des annehmbaren Bereiches um jeden Wert herum sind, dann werden beim Schritt 322 annehmbare Werte für Werte außerhalb des Bereichs ersetzt, und das Verfahren wird vom Schritt 306 an wiederholt. Nicht gezeigt ist, daß ein Zähler schrittweise erhöht werden kann, um die Anzahl der Iterationen zu begrenzen. Wenn beim Schritt 324 die Grenze der Iterationsanzahl erreicht ist, werden die Daten zum Block 316 zur nachfolgenden Ausgabe durch den Block 320 übertragen. Dieser Schritt gewährleistet, daß der Ausgang des Graupegelbild ein gültiges Bild für die komprimierte Beschreibung ist, die beim Block 300 erhalten wurde.
- Man beachte, daß ein bestimmter Filtertyp und eine bestimmte Konfliktlösung für die DCT Koeffizienten bei den Beispielen verwendet wurde. Offensichtlich sind unterschiedliche Filter möglich, einschließlich statistischer Filter allgemeiner Ordnung und "Such- und-Ersetz"-Bilder. Auch können dem Filter die lokalen Eigenschaften des 8 · 8 Blocks zugrunde liegen. Ein Beispiel ist eine randbewahrende Glättung, die einen Bruchteil des dynamischen Bereiches der lokalen 8 · 8 Blöcke verwendet, und/oder die Q-Matrix, um die maximale Rauschänderung zu bestimmen, die in dem Block angetroffen wird. Eine andere Möglichkeit zur Bearbeitung des Bildbereiches im Gegensatz zu dem DCT Bereich ist, die Daten einer Schwellenbehandlung zu unterziehen, wenn ein binäres Original angenommen wird. Diese Annahme muß jedoch in einem DCT Bereich geprüft werden, und die Schwellenverarbeitung sollte nur akzeptiert werden, wenn die DCT Koeffizienten nach der Schwellenbearbeitung in Übereinstimmung mit den DCT Koeffizienten vor der Schwellenbearbeitung sind.
- Unterschiedliche Möglichkeiten bestehen zur Konfliktlösung der DCT Koeffizienten. Die Konvergenzgeschwindigkeit kann verbessert werden, indem der Algorithmus etwas abgeändert wird. Mögliche Abänderungen schließen z. B. die Addition von Rauschen zu den abgeänderten DCT Koeffizienten ein. Schließlich kann die Anzahl der Iterationen eine Funktion der lokalen Eigenschaften des 8 · 8 Blocks sein, statt eine festgelegte Anzahl zu verwenden, wie sie in den Beispielen verwendet wurde.
Claims (6)
1. Ein Verfahren zur Verbesserung des Aussehens eines dekomprimierten
Dokumentbildes, während die Treue zu einem Originaldokumentbild beibehalten wird,
von dem es abgeleitet wird, wobei zur Komprimierung ein Originaldokumentbild in
Pixelblöcken (Fig. 2A) unterteilt wird, die genannten Pixelblöcke in Blöcke (Fig.
2B) von Transformationskoeffizienten durch eine Vorwärtstransformationscodier-
Operation geändert werden, wobei eine Frequenzraumtransformationsoperation
verwendet wird, die genannten Transformationskoeffizienten nachfolgend mit
einem mit Verlust behafteten Quantisierungsverfahren quantisiert werden, bei dem
jeder Transformationskoeffizient gemäß einem Quantisierungswert aus einer
Quantisierungstabelle (Fig. 2C) quantisiert wird und das Ergebnis (Fig. 2B) als
ein quantisierter Transformationskoeffizient verwendet wird, um quantisierte
Transformationskoeffizientenblöcke (Fig. 2D) zu bilden, wobei das Verfahren die
Dekomprimierungsschritte einschließt:
a) Erhalten (300) der genannten quantisierten
Transformationskoeffizientenblöcke für das genannte Originalbild;
b) Dequantisieren (304) der Transformationskoeffizienten in einem Block gemäß
der Quantisierungstabelle (119), um einen Block erhaltener
Transformationskoeffizienten zu erhalten;
c) Wiedergewinnen des Bildes, indeme ein inverse Transformationsoperation
(306) auf die erhaltenen Transformationskoeffizienten angewendet wird;
d) Verringern (308) von Rauschen hoher Frequenzen mit einem Filter, das in
dem wiedergegebenen Bild als ein Ergebnis des mit Verlust behafteten
Quanti
sierungsverfahrens erscheint, während die Ränder bewahrt werden, wodurch das
Aussehen des wiedergewonnenen Bildes visuell ansprechender gemacht wird;
e) Ändern des gefilterten, wiedergewonnenen Bildes in Blöcke neuer
Transformationskoeffizienten durch eine Vorwärtstransformationscodieroperation (310),
wobei die Frequenzraum-Transformationskomprimierungsoperation verwendet wird;
f) Verwenden eines jeden genannten Blocks neuer Transformationskoeffizienten
(Fig. 7C), eines entsprechenden Blocks erhaltener Transformationskoeffizienten
und der genannten Quantisierungstabelle (Fig. 2C; 119), Bestimmen (314), ob
das genannte gefilterte, wiedergewonnene Bild von dem genannten
wiedergewonnenen Bild ableitbar ist, indem bestimmt wird, ob die neuen
Transformationskoeffizienten eine vorbestimmte Beziehung zu den erhaltenen
Transformationskoeffizienten in Abhängigkeit von den Werten in der genannten
Quantisierungstabelle aufweisen, wodurch bestimmt wird, ob das gefilterte, wiedergewonnene
Bild innerhalb einer Menge annehmbarer Bilder ist, und
g) wenn die genannte Bestimmung positiv ist, das gefilterte, wiedergewonnene
Bild zu einem Ausgangspuffer zu übertragen (316, 32).
2. Ein Verfahren, wie in Anspruch 1 beansprucht, wobei der Schritt f) die
zusätzlichen Schritte einschließt
1) Bestimmen, daß der Block neuer Transformationskoeffizienten keine
vorbestimmte Beziehung zu dem Originalbild zeigt; und
2) Abändern (322) einzelner, neuer Transformationskoeffizienten, so daß ein
Block abgeänderter, neuer Transformationskoeffizienten (Fig. 7D) die
vorbestimmte Beziehung zu dem Originalbild zeigt;
3) Wiedergewinnen des Bildes (Fig. 7E) aus den Blöcken abgeänderter, neuer
Transformationskoeffizienten.
3. Ein Verfahren, wie in Anspruch 2 beansprucht, das einschließt, die Schritte d-f
iterativ zu wiederholen, bis eine vorbestimmte Bedingung auftritt.
4. Ein Verfahren, wie in irgendeinem der vorhergehenden Ansprüche beansprucht,
wobei die Vorwärtstransformationscodieroperation, die die
Frequenzraum-Transformationsoperation verwendet, eine diskrete Kosinustransformation ist.
5. Ein Verfahren, wie in irgendeinem der vorhergehenden Ansprüche beansprucht,
wobei die quantisierten Transformationskoeffizientenblöcke (Fig. 2D) zur
Komprimierung ferner mit einem verlustfreien Codierverfahren codiert (20) werden,
und der zusätzliche Schritt (302), irgendeine verlustfreie Codierung zu entfernen,
vor dem Schritt b) vorgesehen wird.
6. Ein Verfahren, wie in irgendeinem der vorhergehenden Ansprüche beansprucht,
wobei ein quantisierter Transformationskoeffizient zur Komprimierung erzeugt
wird, indem jeder Transformationskoeffizient durch einen Quantisierungswert aus
der Quantisierungstabelle dividiert (14) wird, der ganzzahlige Teil des
Ergebnisses als der quantisierte Transformationskoeffizient verwendet wird, und wobei der
Schritt der Dequantisierung der quantisierten Transformationskoeffizienten
umfaßt, jeden quantisierten Transformationskoeffizienten mit einem entsprechenden
Quantisierungswert aus der Quantisierungstabelle zu multiplizieren.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/956,128 US5379122A (en) | 1992-10-02 | 1992-10-02 | Decompression of standard ADCT-compressed images |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69322351D1 DE69322351D1 (de) | 1999-01-14 |
DE69322351T2 true DE69322351T2 (de) | 1999-05-20 |
Family
ID=25497784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69322351T Expired - Lifetime DE69322351T2 (de) | 1992-10-02 | 1993-09-28 | Verbesserte Dekomprimierung von Standard ADCT-komprimierten Bildern |
Country Status (4)
Country | Link |
---|---|
US (1) | US5379122A (de) |
EP (1) | EP0590922B1 (de) |
JP (1) | JP3594630B2 (de) |
DE (1) | DE69322351T2 (de) |
Families Citing this family (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3196906B2 (ja) * | 1992-08-21 | 2001-08-06 | 富士ゼロックス株式会社 | 画像信号の符号化装置 |
US5515388A (en) * | 1993-03-19 | 1996-05-07 | Sony Corporation | Apparatus and method for preventing repetitive random errors in transform coefficients representing a motion picture signal |
JP3466705B2 (ja) * | 1993-05-28 | 2003-11-17 | ゼロックス・コーポレーション | 圧縮画像の圧縮解除方法 |
EP0671816B1 (de) * | 1993-09-28 | 2000-03-29 | Sony Corporation | Gerät zur kodierung/dekodierung mit rundung auf ausschliesslich gerade oder ungerade werte |
JP3495766B2 (ja) * | 1993-10-01 | 2004-02-09 | テキサス インスツルメンツ インコーポレイテツド | 画像処理方法 |
KR0129573B1 (ko) * | 1994-04-30 | 1998-04-10 | 배순훈 | 디지탈 화상 복호화를 위한 디씨(dc) 계수의 오차보상 방법 |
KR0128881B1 (ko) * | 1994-04-30 | 1998-04-10 | 배순훈 | 디지틀화상복호화장치 |
KR970010087B1 (en) * | 1994-04-30 | 1997-06-21 | Daewoo Electronics Co Ltd | Postprocessing method for digital image |
US5534925A (en) * | 1994-05-02 | 1996-07-09 | Cognitech Inc. | Image compression by optimal reconstruction |
JPH08116448A (ja) * | 1994-10-13 | 1996-05-07 | Fuji Xerox Co Ltd | 画像信号の符号化装置及び復号装置 |
US5521718A (en) * | 1994-12-05 | 1996-05-28 | Xerox Corporation | Efficient iterative decompression of standard ADCT-compressed images |
KR0165497B1 (ko) * | 1995-01-20 | 1999-03-20 | 김광호 | 블럭화현상 제거를 위한 후처리장치 및 그 방법 |
EP0735772A3 (de) * | 1995-03-27 | 1998-04-01 | Hewlett-Packard Company | Verfahren zur Auswahl von JPEG-Quantisierungstabellen für Anwendungen mit niedriger Bandbreite |
US5872874A (en) * | 1995-04-26 | 1999-02-16 | Hewlett-Packard Company | Method and apparatus for scaling down images that are provided in a compressed data format |
KR0160690B1 (ko) * | 1995-04-29 | 1999-01-15 | 김광호 | 영상신호 부호화/복호화장치에 있어서 블럭킹 효과 제거회로 |
US5629778A (en) * | 1995-05-15 | 1997-05-13 | Polaroid Corporation | Method and apparatus for reduction of image data compression noise |
US5936673A (en) * | 1995-05-26 | 1999-08-10 | Intel Corporation | Temporal tile staggering for block based video compression |
US5995665A (en) * | 1995-05-31 | 1999-11-30 | Canon Kabushiki Kaisha | Image processing apparatus and method |
USH1684H (en) * | 1995-09-29 | 1997-10-07 | Xerox Corporation | Fast preview processing for JPEG compressed images |
US5850294A (en) * | 1995-12-18 | 1998-12-15 | Lucent Technologies Inc. | Method and apparatus for post-processing images |
US5881180A (en) * | 1996-02-08 | 1999-03-09 | Sony Corporation | Method and apparatus for the reduction of blocking effects in images |
US5845083A (en) * | 1996-03-07 | 1998-12-01 | Mitsubishi Semiconductor America, Inc. | MPEG encoding and decoding system for multimedia applications |
US5974196A (en) * | 1996-03-15 | 1999-10-26 | Sony Corporation | Method and apparatus for blocking effect reduction in images |
US5933542A (en) * | 1996-04-24 | 1999-08-03 | Sony Corporation | Method and apparatus for blocking effect reduction in images by post-processing in the spatial domain |
US6026217A (en) * | 1996-06-21 | 2000-02-15 | Digital Equipment Corporation | Method and apparatus for eliminating the transpose buffer during a decomposed forward or inverse 2-dimensional discrete cosine transform through operand decomposition storage and retrieval |
US6101276A (en) | 1996-06-21 | 2000-08-08 | Compaq Computer Corporation | Method and apparatus for performing two pass quality video compression through pipelining and buffer management |
US5796875A (en) * | 1996-08-13 | 1998-08-18 | Sony Electronics, Inc. | Selective de-blocking filter for DCT compressed images |
US5854857A (en) * | 1996-09-26 | 1998-12-29 | Xerox Corporation | Using encoding cost data for segmentation and background suppression in JPEG-compressed images |
US5838831A (en) * | 1996-09-26 | 1998-11-17 | Xerox Corporation | Compression of image data with retaining cost data for each compressed image block |
US5757975A (en) * | 1996-11-21 | 1998-05-26 | Xerox Corporation | Artifact reduction for large dynamic range input data in JPEG compression |
US6044177A (en) * | 1997-06-18 | 2000-03-28 | Hewlett-Packard Company | Artifact reduction decompression method and apparatus for interpolated images |
KR100243225B1 (ko) | 1997-07-16 | 2000-02-01 | 윤종용 | 블록화효과 및 링잉잡음 감소를 위한 신호적응필터링방법 및신호적응필터 |
US6049330A (en) * | 1997-08-28 | 2000-04-11 | Oak Technology, Inc. | Method and apparatus for optimizing storage of compressed images in memory |
FR2769161B1 (fr) * | 1997-10-01 | 1999-12-24 | Univ Neuchatel | Procede de controle du taux de compression d'images numeriques |
KR100269125B1 (ko) * | 1997-10-25 | 2000-10-16 | 윤덕용 | 양자화효과감소를위한영상데이터후처리방법및장치 |
US6104441A (en) * | 1998-04-29 | 2000-08-15 | Hewlett Packard Company | System for editing compressed image sequences |
US6256415B1 (en) | 1998-06-10 | 2001-07-03 | Seiko Epson Corporation | Two row buffer image compression (TROBIC) |
US7194138B1 (en) * | 1998-11-04 | 2007-03-20 | International Business Machines Corporation | Reduced-error processing of transformed digital data |
US6392764B1 (en) * | 1998-11-12 | 2002-05-21 | Xerox Corporation | Systems and methods for adaptively filtering palettized images |
US6421468B1 (en) | 1999-01-06 | 2002-07-16 | Seiko Epson Corporation | Method and apparatus for sharpening an image by scaling elements of a frequency-domain representation |
US7254824B1 (en) * | 1999-04-15 | 2007-08-07 | Sedna Patent Services, Llc | Encoding optimization techniques for encoding program grid section of server-centric interactive programming guide |
US6963609B2 (en) * | 2000-01-12 | 2005-11-08 | Koninklijke Philips Electronics N.V. | Image data compression |
US6456663B1 (en) * | 2000-03-29 | 2002-09-24 | Matsushita Electric Industrial Co., Ltd. | DCT domain down conversion system that compensates for IDCT mismatch |
US6909812B1 (en) | 2000-07-13 | 2005-06-21 | Lucent Technologies Inc. | Methods and apparatus for nearly lossless-concatenated block transform coding |
US6766341B1 (en) | 2000-10-23 | 2004-07-20 | International Business Machines Corporation | Faster transforms using scaled terms |
US7007054B1 (en) | 2000-10-23 | 2006-02-28 | International Business Machines Corporation | Faster discrete cosine transforms using scaled terms |
US6961473B1 (en) * | 2000-10-23 | 2005-11-01 | International Business Machines Corporation | Faster transforms using early aborts and precision refinements |
KR100386639B1 (ko) * | 2000-12-04 | 2003-06-02 | 주식회사 오픈비주얼 | 정규화된 역양자화기를 이용한 영상 및 동영상의 복원 방법 |
US7020672B2 (en) * | 2001-03-30 | 2006-03-28 | Koninklijke Philips Electronics, N.V. | Reduced complexity IDCT decoding with graceful degradation |
JP3893099B2 (ja) | 2002-10-03 | 2007-03-14 | オリンパス株式会社 | 撮像システムおよび撮像プログラム |
US7139437B2 (en) * | 2002-11-12 | 2006-11-21 | Eastman Kodak Company | Method and system for removing artifacts in compressed images |
JP4657869B2 (ja) * | 2005-09-27 | 2011-03-23 | シャープ株式会社 | 欠陥検出装置、イメージセンサデバイス、イメージセンサモジュール、画像処理装置、デジタル画像品質テスタ、欠陥検出方法、欠陥検出プログラム、およびコンピュータ読取可能な記録媒体 |
US7590298B2 (en) * | 2006-04-12 | 2009-09-15 | Xerox Corporation | Decompression with reduced ringing artifacts |
US7532767B2 (en) * | 2006-05-31 | 2009-05-12 | Xerox Corporation | Removing ringing and blocking artifacts from JPEG compressed document images |
JP5102122B2 (ja) * | 2008-06-11 | 2012-12-19 | キヤノン株式会社 | 復号化装置及び復号化方法 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4794455A (en) * | 1987-01-07 | 1988-12-27 | Pictel Corporation | Method and apparatus employing adaptive filtering for efficiently communicating image sequences |
US5170264A (en) * | 1988-12-10 | 1992-12-08 | Fuji Photo Film Co., Ltd. | Compression coding device and expansion decoding device for a picture signal |
JP2521145B2 (ja) * | 1989-02-20 | 1996-07-31 | 日本ビクター株式会社 | 動き補償予測符号化復号化方式 |
IL91221A (en) * | 1989-08-04 | 1995-03-30 | Ibm Israel | Binary text compression method |
US5001559A (en) * | 1989-10-12 | 1991-03-19 | International Business Machines Corporation | Transform coding using coefficient prediction techniques |
US4974078A (en) * | 1989-11-13 | 1990-11-27 | Eastman Kodak Company | Digital compression method and system with improved coding efficiency |
US5146326A (en) * | 1989-11-14 | 1992-09-08 | Fujitsu Limited | Coded picture information decoding apparatus having means for improving picture distortion |
US5229864A (en) * | 1990-04-16 | 1993-07-20 | Fuji Photo Film Co., Ltd. | Device for regenerating a picture signal by decoding |
US5216516A (en) * | 1990-04-27 | 1993-06-01 | Ricoh Company, Inc. | Orthogonal transformation arithmetic unit |
US4999705A (en) * | 1990-05-03 | 1991-03-12 | At&T Bell Laboratories | Three dimensional motion compensated video coding |
JPH0434669A (ja) * | 1990-05-31 | 1992-02-05 | Toshiba Corp | 画像処理方式 |
KR960010392B1 (ko) * | 1990-09-29 | 1996-07-31 | 니뽕 빅터 가부시끼가이샤 | 적응 양자화를 이용한 화상 신호 부호화 복호화 장치 |
JP2876258B2 (ja) * | 1991-01-23 | 1999-03-31 | 株式会社リコー | デジタル電子スチルカメラ |
US5231484A (en) * | 1991-11-08 | 1993-07-27 | International Business Machines Corporation | Motion video compression system with adaptive bit allocation and quantization |
KR940011605B1 (ko) * | 1991-12-20 | 1994-12-22 | 삼성전자 주식회사 | 고정비트율 설정에 의한 영상압축방식 |
US5321522A (en) * | 1993-07-19 | 1994-06-14 | Xerox Corporation | ADCT compression with minimum compression ratio |
-
1992
- 1992-10-02 US US07/956,128 patent/US5379122A/en not_active Expired - Lifetime
-
1993
- 1993-06-30 JP JP16186593A patent/JP3594630B2/ja not_active Expired - Fee Related
- 1993-09-28 EP EP93307658A patent/EP0590922B1/de not_active Expired - Lifetime
- 1993-09-28 DE DE69322351T patent/DE69322351T2/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0590922A2 (de) | 1994-04-06 |
EP0590922B1 (de) | 1998-12-02 |
DE69322351D1 (de) | 1999-01-14 |
US5379122A (en) | 1995-01-03 |
JP3594630B2 (ja) | 2004-12-02 |
EP0590922A3 (en) | 1994-05-11 |
JPH06139351A (ja) | 1994-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69322351T2 (de) | Verbesserte Dekomprimierung von Standard ADCT-komprimierten Bildern | |
DE69434862T2 (de) | Segmentierungs-basiertes entfernen von artefakten aus einem jpeg-bild | |
DE69415887T2 (de) | Verbesserter Dekompressionstandard für ADCT-komprimierte Bilddokumente | |
DE69627982T2 (de) | Signaladaptives Nachverarbeitungssystem um Blockierungseffekte und Ringstörungen zu verringern | |
DE19819198B4 (de) | Reversible DCT für verlustfreie/verlustbehaftete Kompression | |
DE69116869T2 (de) | Digitale bildkodierung mit einer zufallsabtastung der bilder | |
DE69222766T2 (de) | System zur adaptiven kompression der blockgrössen eines bildes | |
DE69228442T2 (de) | Verfahren und vorrichtung zur bilddatenkompression durch luminanz/chrominanz-kodierung | |
DE19861377B4 (de) | Ein verbessertes Kompressions- und Dekompressionssystem mit reversiblen Wavelets und verlustbehafteter Rekonstruktion | |
DE69130214T2 (de) | Bilddatenkompression mit adaptiver Blockgrössenauswahl | |
DE69722601T2 (de) | Datenkompression mit hybrider verlustloser entropiekodierung von run-length codes | |
DE69309529T2 (de) | Verfahren und Vorrichtung für die räumliche Filterung von blocktransformationsdekodierten digitalen Bildern | |
DE69723550T2 (de) | Kodierung und dekodierung von grafischen symbolen | |
DE69413759T2 (de) | ADCT-Kompression mit minimalem Kompressionsgrad | |
DE60203850T2 (de) | System und Verfahren zum Verarbeiten von Bildern mit aufgelöster Mosaikstruk- tur, um durch Farb-Aliasing hervorgerufenen Artefakte zu verringern. | |
DE602004001993T2 (de) | Transformations basiertes restbewegungsrahmen kodierungsverfahren mit übervollständiger basis und zugehörige vorrichtung zur videokompression | |
DE69818751T2 (de) | Dekompression von interpolierten Bildern | |
DE60119904T2 (de) | Vorrichtung und Verfahren zur Entfernung des Mosaikeffekts in Rohbilddaten im Hinblick auf die Datenkompression | |
DE69523419T2 (de) | Effiziente iterative Dekomprimierung von standard-ADCT-komprimierten Bildern | |
DE69915843T2 (de) | Teilbandkodierung/-dekodierung | |
WO2017162835A1 (de) | Datenkompression mittels adaptiven unterabtastens | |
DE69126525T2 (de) | Digitale bildverarbeitung mit filterung der blockkanten | |
DE60015755T2 (de) | Verlustfreie adaptive codierung von daten eines endlichen alphabets | |
DE69723325T2 (de) | Verfahren und Vorrichtung zur Codierung und Decodierung von Bildern | |
EP0985317B1 (de) | Verfahren zur codierung und decodierung eines digitalisierten bildes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition |