DE69322351T2 - Verbesserte Dekomprimierung von Standard ADCT-komprimierten Bildern - Google Patents

Verbesserte Dekomprimierung von Standard ADCT-komprimierten Bildern

Info

Publication number
DE69322351T2
DE69322351T2 DE69322351T DE69322351T DE69322351T2 DE 69322351 T2 DE69322351 T2 DE 69322351T2 DE 69322351 T DE69322351 T DE 69322351T DE 69322351 T DE69322351 T DE 69322351T DE 69322351 T2 DE69322351 T2 DE 69322351T2
Authority
DE
Germany
Prior art keywords
image
transform
transform coefficients
quantized
coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69322351T
Other languages
English (en)
Other versions
DE69322351D1 (de
Inventor
Reiner Webster New York 14580 Eschbach
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Application granted granted Critical
Publication of DE69322351D1 publication Critical patent/DE69322351D1/de
Publication of DE69322351T2 publication Critical patent/DE69322351T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/527Global motion vector estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

  • Die vorliegende Erfindung ist allgemein auf die Erzeugung von Dokumentenbildern und insbesondere auf ein Verfahren zur Verbesserung des Aussehens eines dekomprimierten Dokumentbildes gerichtet, wobei die Treue zu einem ursprünglichen Dokumentbild beibehalten wird, von dem es abgeleitet ist.
  • Eine Datenkompression wird bei Datenverarbeitungsverfahren verlangt, wo für praktische Anwendungen zu viele Daten vorhanden sind, die die Daten verwenden. Im allgemeinen wird eine Komprimierung bei Kommunikationsverbindungen verwendet, wo die Übertragungszeit lang ist oder wo die Bandbreite beschränkt ist. Eine andere Verwendung für eine Komprimierung ist bei der Datenspeicherung, wo die Größe des Raums eines Mediums, auf dem die Daten gespeichert werden, wesentlich durch Komprimierung verringert werden kann. Eine noch andere Anwendung zur Komprimierung ist ein digitales Kopiergerät, wo eine Zwischenspeicherung von Daten zur Zusammenstellung, zum erneuten Drucken oder für irgendeine andere digitale Kopiergerätfunktion verlangt wird. Allgemein gesagt sind abgetastete Bilder, d. h., elektronische Darstellungen von Hardcopydokumenten, üblicherweise groß, und somit sind sie erwünschte Kandidaten für eine Komprimierung.
  • Viele unterschiedliche Komprimierungstechniken bestehen, und viele sind Eigentum einzelner Benutzer. Jedoch sind Normen erwünscht, wenn immer eine Interkommunikation zwischen Einrichtungen ausgeführt wird. Insbesondere wird mit dem Aufkommen einer Multimediakommunikation, wo von früher unterschiedlichen Einrichtungen verlangt wird, zu kommunizieren, eine allgemeine Norm verlangt. Ein Beispiel ist der gegenwärtige Wunsch an Fax-Geräte, daß sie fähig sind, mit Druckern zu kommunizieren. Gegenwärtig sind Komprimierungsnormen im allgemeinen bei unterschiedlichen Einrichtungen unterschiedlich.
  • Drei Hauptschemata zur Bildkomprimierung werden gegenwärtig durch internationale Normierungsgruppen untersucht. Ein erstes für eine Facsimile-Bildübertragung, die hauptsächlich binär ist, wird von dem JBIG (Joint Binary Image Group) Komitee untersucht, ein zweites für Fernsehen und Film, wobei eine Norm von der MPEG (Motion Pictures Expert Group) erarbeitet wir. Für sich nicht bewegende, allgemeine Bilder, d. h., Stehbilder, die allgemeiner als die von JBIG umfaßt werden, sucht die Gruppe JPEG (Joint Photographic Expert Group) eine von einer Einrichtung unabhängige Komprimierungsnorm zu entwickeln, wobei ein adaptives, diskretes Kosinustransformationsschema verwendet wird.
  • ADCT (Adaptive Discrete Cosine Transform, beispielsweise beschrieben von W. H. Chen und C. H. Smith in "Adaptive Coding of Monochrome and Color Images", IEEE Trans. Comm., Bd. COM-25, S. 1285-1292, November 1977) das von dem JPEG Komitee verbreitete Verfahren, wird in dieser Anmeldung genannt und ist ein verlustreiches System, das Datenredundanz auf der Grundlage von Pixel-Pixel Korrelationen verringert. Im allgemeinen ändert sich in Bildern auf einer pixelweisen Grundlage ein Bild nicht sehr stark. Ein Bild hat deshalb, das was als eine "natürliche, räumliche Korrelation" bekannt ist. In natürlichen Szenen wird eine Korrelation verallgemeinert, aber nicht genau. Rauschen macht jedes Pixel etwas von seinem Nachbarn verschieden.
  • Im allgemeinen verlangt, wie es in Fig. 1 gezeigt ist, das Komprimierungsverfahren einen Ausschnitts-Speicher 10, der einen M · M Ausschnitt des Bildes speichert. Wir verwenden quadratische Ausschnitte bei der Beschreibung auf der Grundlage der JPEG Empfehlungen, wobei aber darauf hinzuweisen ist, daß Verfahren gemäß der Erfindung, die unten beschrieben ist, mit irgendeiner Form Ausschnitt durchgeführt werden können. Von dem Teil des Bildes, der in dem Ausschnitts-Speicher gespeichert ist, wird die diskrete Kosinustransformation (DCT), eine Frequenzraumdarstellung des Bildes, bei dem Umsetzer 12 gebildet. Hardwareausführungen stehen zur Verfügung, wie der Bildkomprimierungsprozessor C-Cube Microsystems CL550A gemäß JPEG, der entweder im Komprimierungs- oder Dekomprimierungsmodus gemäß der vorgeschlagenen JPEG- Norm arbeitet. Eine Teilungs/Quantisierungseinrichtung 14 wird von einem Satz von Werten verwendet, der als eine Q-Tabelle bezeichnet wird, die in einem Q-Tabellenspeicher 16 gespeichert ist, so daß ein bestimmter Q-Tabellenwert in den DCT Wert geteilt wird, wobei der ganzzahlige Teil des Werts als der quantisierte DCT Wert zurückgegeben wird. Ein Huffmann Codierer 20, der eine statistische Codierung der quantisierten DCT Werte verwendet, erzeugt das komprimierte Bild, das zur Speicherung, Übertragung, usw. ausgegeben wird.
  • Das gegenwärtige ADCT Komprimierungsverfahren teilt ein Bild in M · M Pixelblöcke, mit M = 8. Die Wahl M = 8 ist ein Kompromiß, wobei je größer der gegebene Block ist, um so größer das erreichbare Verdichtungsverhältnis. Jedoch ist es bei einem solchen größeren Block auch wahrscheinlicher, daß er nichtkorrelierte Pixel in dem Block aufweist, wodurch das Komprimierungsverhältnis verringert wird. Wenn der Block kleiner ist, kann eine größere Korrelation in dem Block erreicht werden, wobei aber eine geringere Gesamtkomprimierung erzielt würde. Insbesondere ist es bei einem Dokumentbild wahrscheinlicher, daß Bildränder innerhalb eines 8 · 8 Blocks angetroffen werden, als es der Fall bei einer Szene wäre, die ein natürliches Bild bildet. Somit schlägt die Annahme einer Raumkorrelation in einem gewissen Maße fehl. Ein Hauptproblem, das durch die vorliegende Erfindung angesprochen wird, wie es hier unten offensichtlicher wird, ist, daß die Annahmen des ADCT Vorschlags gut bei Photographien arbeiten, die fortlaufende Töne und viele Werte von Graupixeln enthalten, aber häufig schlecht bei der Wiedergabe von Dokumentbildern arbeiten, die beträchtliche hochfrequente Komponenten und viele kontraststarke Ränder aufweisen.
  • Komprimierungsschemata neigen dazu, einen Satz Basisfunktionen zu verwenden, um die Zwischenblockkorrelationen zu nützen. Basisfunktionen definieren die Daten als eine Projektion auf einen Satz orthogonaler Funktionen in einem Intervall. ADCT verwendet Kosinusfunktionen als die Basisfunktionen und die diskrete Kosinustransformation (DCT) als den Projektionsschritt. In dem ersten Schritt der ADCT Norm wird das Bild in 8 · 8 Blöcke aufgeteilt. Innerhalb eines jeden Blocks wird ein Satz von 64 DCT Koeffizienten für die Pixel in dem Block bestimmt. Die DCT Koeffizienten stellen die Koeffizienten eines jeden Kosinusausdrucks der diskreten Kosinustransformation des 8 · 8 Blocks dar.
  • Es wird nun auf Fig. 2A bezug genommen, in der ein Feld mit 64 Graupegelwerten gezeigt ist, die 64 Pixel in einem 8 · 8 Block des Bildes darstellen. Dieser 8 · 8 Block wird gemäß den ADCT Spezifizierungen für den JPEG transformiert, wobei die in Fig. 2B gezeigten DCT Koeffizienten gegeben sind. Diese Koeffizienten beschreiben wohl vollständig die Bilddaten der Fig. 2A, wobei sich aber im allgemeinen größere Werte nun an der oberen linken Ecke in dem niedrigeren Raumfrequenzbereich häufen. Gleichzeitig tendieren bei der großen Mehrzahl von Bildern, wenn die Frequenz des Bildes zunimmt, die Koeffizientenwerte in dem unteren, rechten Abschnitt des Gitters zu Null.
  • Im allgemeinen neigt das menschliche Auge dazu, am besten niedere Frequenzen in einem Bild zu sehen. Bei höheren Frequenzen sind Änderungen von Amplitude zu Amplitude nicht wahrnehmbar, es sei denn, solche Änderungen treten bei einem äußerst großen Kontrast auf. Das ist eine gut bekannte Wirkung des menschlichen Sehsystems und ausführlich dargelegt, vgl. z. B. "Visual Performance and Image Coding" von P. Roetling, Proceedings of the S. I. D. 17/2 S. 111-114 (1976). Das ADCT Verfahren verwendet die Tatsache, daß kleine Amplitudenänderungen bei hohen Frequenzen im allgemeinen unberücksichtigt bleiben können.
  • Der nächste Schritt in dem ADCT Verfahren schließt die Verwendung einer Quantisierungs- oder Q-Matrix ein. Die Q-Matrix, die in Fig. 2C gezeigt ist, ist eine normierte, von JPEG vorgeschlagene Matrix zur Komprimierung, wobei aber das ADCT Verfahren und die Verfahren gemäß der vorliegenden Erfindung, die unten beschrieben sind, auch bei Verwendung anderer Q-Matrizen (oder Q-Tabellen) arbeiten können. Die Matrix schließt die Wirkung ein, daß niederere Frequenzen grob gesagt bedeutender als hohe Frequenzen sind, indem allgemein größere Quantisierungsschritte, d. h., größere Eintragungen für größere Frequenzen eingeführt werden. Die Tabelle versucht jedoch auch intern einige erwünschte Änderungen von der allgemeinen Annahme zu konstruieren. Demgemäß ändern sich die Werte in der Tabelle mit der Frequenz, wo die genaue Änderung eine Funktion des menschlichen Sehsystems sein kann, der Art der erwarteten Vorlage, d. h., Photo, Text, Graphik, usw., oder von irgendeinem anderen anwendungsabhängigen Parameter. Jeder der DCT Werte aus der Fig. 2B wird durch einen entsprechenden Q-Matrixwert aus Fig. 2C dividiert, wodurch sich die quantisierten DCT (QDCT) Werte ergeben mittels:
  • QDCT[m][n] = INT{DCT[m][n] : Q-Tabelle [m][n] + ½}
  • wo INT{A} den ganzzahligen Teil von A bezeichnet.
  • Der Rest des Divisionsverfahrens wird entfernt, wodurch sich ein Datenverlust ergibt. Hier und im folgenden verwenden wir den Ausdruck Division, um das bei ADCT detaillierte Verfahren zu beschreiben, einschließlich der Verfahren, Abschneiden und Runden zu behandeln. Des weiteren gehen, da die Q-Werte in dem unteren, rechten Bereich der Tabelle dazu neigen, groß zu sein, gehen die meisten Werte in diesem Bereich nach Null, es sei denn, es gibt äußerst hohe Amplituden des Bildes bei den höheren Frequenzen.
  • Nach dem Ableiten des quantisierten Satzes von DCT Werten, die in Fig. 2D gezeigt sind, werden Pixel in der Reihenfolge einer einen Raum füllenden Zickzackkurve angeordnet, und ein statistisches Codierungsverfahren, wie das Huffmannverfahren, wird verwendet, das übertragene Signal zu erzeugen. Diese statistische Codierung wird in einer verlustlosen Weise ausgeführt, und der einzige Verlust, der bei der Komprimierung eingeführt wird, ist derjenige, der durch die Quantisierung der DCT Koeffizienten unter Verwendung der Q-Tabelle erzeugt wird.
  • ADCT Transformationen sind gut bekannt, und es gibt Hardware, die Transformation an den Bilddaten auszuführen, z. B. US-A 5,049,991 von Nihara, US-A 5,001,559 von Gonzales u. a. und US-A 4,999,705 von Puri. Der Hauptschwerpunkt dieser Einzelpatente betrifft jedoch Laufbilder und keine Dokumentenbilder.
  • Um das nun komprimierte Bild zu dekomprimieren, wird unter Bezugnahme auf Fig. 1 einer Reihe von Funktionen oder Schritten gefolgt, um den beschriebenen Vorgang umzukehren. Die Huffmanncodierung wird bei einem Decodierer 50 entfernt. Das Bildsignal stellt nun die quantisierten DCT Koeffizienten dar, die mit einer Signalmultiplikationseinrichtung 52 mit den Q-Tabellenwerten im Speicher 54 in einem zu dem Komprimierungsverfahren umgekehrten Verfahren multipliziert werden. Bei dem Umkehr-Umsetzer 56 wird die umgekehrte Transformation der diskreten Kosinustransformation abgeleitet, und das Ausgangsbild im Raumbereich wird bei dem Bildpuffer 58 gespeichert.
  • Bei dem beschriebenen Dekomprimierungsverfahren wird eine Huffmanncodierung entfernt, um den Satz quantisierter DCT Koeffizienten zu erhalten. Jedes Element des Satzes wird durch einen Wert der Q-Tabelle unter Verwendung der Daten der Fig. 2C und 2D multipliziert, wobei sich die in Fig. 3A gezeigten DCT Koeffizienten ergeben, nämlich durch:
  • DCT[m][n] = QDCT[m][n] · Q-Tabelle[m][n].
  • Jedoch ist das in Fig. 3A gezeigte Ergebnis nicht der ursprüngliche Satz der in Fig. 2B gezeigten DCT Koeffizienten, weil die Reste, die für die ursprüngliche Quantisierung der DCT Koeffizienten mit der Q-Tabelle bei dem Komprimierungsverfahren berechnet wurden, verloren gegangen sind. Bei einem üblichen ADCT Dekomprimierungsverfahren wird die inverse, diskrete Kosinustransformation des Satzes von DCT Koeffizienten abgeleitet, um in Fig. 3B gezeigte Bildwerte zu erhalten.
  • Das beschriebene Verfahren arbeitet nicht, die besten Bilder wiederzugeben. Natürlich kann es nicht das ursprüngliche Bild wiedergeben, da Daten innerhalb des Bildes bei dem Komprimierungs-Quantisierungs-Schritt entfernt worden sind. Fehler werden bemerkt, wo immer starke Ränder, im allgemeinen in einem Text vorhanden, erscheinen. Insbesondere werden an solchen Rändern "Bildfehler" oder in manchen Fällen " Mückenrauschen" bemerkt. Diese Schwierigkeiten treten bei Text, Graphik und Halbtönen auf, Komponenten, die bei Dokumentenbildern sehr häufig sind. Zusätzlich zu Mückenrauschen oder Bildfehlern erscheint häufig ein blockierender Bildfehler, der verbunden mit Bildbereichen mit sich langsam verändernden Graus erscheint, wo jeder M · M Block, der die Berechnung der Komprimierungsbasis bildete, sichtbar erscheint. In jedem Fall ist ein Problem aufgetreten.
  • Um die genannten Bildfehler zu entfernen, sind zwei Verfahren, das Problem anzugehen, versucht worden. In einem ersten Verfahren wird das dekomprimierte Bild nachverarbeitet, d. h., nachdem das Bild vollständig dekomprimiert worden ist, wird ein Versuch gemacht, das Bild zu verbessern. Natürlich kann eine solche Verarbeitung niemals zurück zu dem ursprünglichen Bild gehen, weil das Bild verloren worden ist. Solche Verfahren sind gezeigt in dem Artikel "Reduction of Blocking Effects in Image Coding" von Reeve, III u. a., Optical Engeneering, Januar/Februar, 1984, Bd. 23, Nr. 1, S. 34 und "Linear Filtering for Reducing Blocking Effects in Orthogonal Transform Image Coding" von C. Avril u. a., Journal of Electronical Imaging, April 1992, Bd. 1 (2), S. 183-191. Jedoch führt diese Nachverarbeitung des Bildes zu einer Rekonstruktion, die nicht das wirkliche Quellenbild gewesen sein konnte, und nachfolgende Komprimierungs/Dekomprimierungsschritte, wie sie bei elektronischen Bildanwendungen möglich sind, führen zu möglicherweise immer größeren Abweichungen zwischen der Rekonstruktion und dem Original.
  • Eine andere Methode für dieses Problem ist ein iteratives Decodierverfahren, das die bekannte Bandgrenze der Daten verwendet. Bei dieser Methode werden, wobei die komprimierte Form des Bildes wieder verwendet wird, unterschiedliche Blöcke, vielleicht 32 · 32 verwendet, das Bild zu decodieren. Bei einem Beispiel "Iterative Procedures for Reduction of Blocking Effects in Transform Image Coding" von R. Rosenholtz u. a., SPIE, Bd. 1452, Image Processing Algorithms and Techniques II, (1991), S. 116-126, wurde ein Verfahren, das gesamte Bild unscharf zu machen, in der Hoffnung betrachtet, daß ein solches Unscharfmachen dazu neigen würde, die obenerwähnten Blockbildfehler zu glätten.
  • Gemäß der Erfindung wird ein Verfahren zur Dekomprimierung eines komprimierten Dokumentbildes geschaffen, wie es im Anspruch 1 festgelegt ist.
  • Gemäß einem anderen Gesichtspunkt der Erfindung kann in einem solchen Dekomprimierungsverfahren der Schritt f) die zusätzlichen Schritte enthalten: 1) Bestimmen, daß der Block neuer Transformationskoeffizienten nicht von dem Originalbild ableitbar ist; und 2) einzelne neue Transformationskoeffizienten zu ändern, so daß ein Block geänderter, neuer Transformationskoeffizienten von dem Originalbild ableitbar ist, 3) Wiedergewinnen des Bildes von den Blöcken abgeänderter, neuer Transformationskoeffizienten.
  • Gemäß einem noch anderen Gesichtspunkt der Erfindung können die Schrift d-f iterativ wiederholt werden, bis eine ausgewählte Bedingung auftritt. Mögliche, ausgewählte Bedingungen sind i) eine Anzahl von Iterationen, ii) es werden keine Korrekturen bei dem transformierten Bild verlangt, oder iii) es sind keine Änderungen bei aufeinanderfolgenden Iterationen an dem invertiert transformierten Bild gemacht worden.
  • Indem das Dekomprimierungsverfahren abgeändert wird, im Gegensatz dazu, das Komprimierungsverfahren abzuändern, können die Ganzheit und Kompatibilität mit dem JPEG Standardverfahren unabhängig von der Anzahl der Komprimierungs/Dekomprimierungszyklen beibehalten werden, denen die Daten des Dokumentbildes ausgesetzt sind. Zusätzlich kann das Verfahren selektiv auf der Grundlage der Bildeingabe und davon verwendet werden, ob Verbesserungen unter Verwendung des Dekomprimierungsverfahrens gemacht werden können.
  • Nur in beispielhafter Weise werden Ausführungsformen der Erfindung unter Bezugnahme auf die beigefügten Zeichnungen beschrieben, in denen:
  • Fig. 1 (bereits beschrieben) ein funktionales Blockdiagramm für das ADCT Komprimierungs/Dekomprimierungsverfahren nach dem Stand der Technik zeigt;
  • Fig. 2A (bereits beschrieben) einen 8 · 8 Block von Bilddaten zeigt, die komprimiert werden sollen;
  • Fig. 2B (bereits beschrieben) die diskreten Kosinuswerte zeigt, wie sie bestimmt worden sind und eine Frequenzraumdarstellung des Bildes der Fig. 2A geben;
  • Fig. 2C fehlt
  • Fig. 2D (bereits beschrieben) die quantisierten, diskreten Kosinuswerte zeigt, wie sie bestimmt wurden;
  • Fig. 3A (bereits beschrieben) die DCT Werte zeigt, die von den Daten der Fig. 2A unter Verwendung der Q-Tabelle der Fig. 2C wiedergewonnen worden sind, und
  • Fig. 3B (bereits beschrieben) den entsprechenden 8 · 8 rekonstruierten Bilddatenblock zeigt;
  • Fig. 4 den Grundsatz eines einzigen Satzes quantisierter ACDT Werte zeigt, die eine Klasse unterschiedener und möglicher Bilder darstellen;
  • Fig. 5A-C numerische Beispiele für den Fall eines Mehrquellenbildes zeigen, das durch einen einzigen Satz quantisierter ACDT Werte dargestellt ist;
  • Fig. 6 die Wirkung des randbewahrenden Tiefpaßfilters zeigt, der bei den Beispielen verwendet wird;
  • Fig. 7A ein Beispiel eines Bildblocks zusammen mit seiner Nachbarschaft und dem Filterzusammenhang zeigt;
  • Fig. 7B die Ergebnisse des Filterverfahrens bei dem Bild zeigt,
  • Fig. 7C die DCT Transformation des Bildes zeigt, wobei die Kreise darstellen, daß das Bild nicht innerhalb des Satzes möglicher Bilder ist;
  • Fig. 7D eine Abänderung bei der DCT Transformation des Bildes zeigt; und
  • Fig. 7E die inverse Transformation der abgeänderten DCT Transformation zeigt;
  • Fig. 8 eine graphische Darstellung der Fig. 7 zeigt, wo das gefilterte Bild außerhalb des Satzes von Bildern mit identischen ADCT Darstellungen liegt; und
  • Fig. 9 ein Ablaufdiagramm eines iterativen Dekomprimierungsverfahrens zeigt.
  • Unter Bezugnahme nun auf die Zeichnungen, merken wir zum Anfang an, daß, während es unmöglich ist, zu dem genauen Bild zurückzukehren, was ursprünglich in dem Komprimierungsverfahren komprimiert worden ist, weil Daten in dem Komprimierungsverfahren verloren gegangen sind, es möglich ist, zu einem Bild zurückzukehren, das in gewisser Weise dem komprimierten Originalbild ähnlich ist, wie es hier nachfolgend beschrieben ist. Zweitens ist es möglich, die grundlegenden Bildfehler zu korrigieren, die in dem Bild erscheinen. Unter Bezugnahme auf Fig. 4 wird nun ein allgemeiner Überblick über das Komprimierungs/Dekomprimierungsverfahren gezeigt. Es gibt einen Satz Bilder, die voneinander verschieden sind, die aber in bezug darauf ähnlich sind, daß jedes Bild in dem Satz an der gleichen ADCT Darstellung komprimiert wird. Deshalb sollte irgendein Dekomprimierungsverfahren ein Ausgangsbild erzeugen, das innerhalb dieses Satzes ist. Die Kenntnis des Satzes möglicher Bilder wird durch die verwendete Q-Tabelle codiert. Da die Q-Tabelle Divisoren der diskreten, quantisierten Transformationskoeffizienten darstellt und als Ergebnis des Quantisierungsverfahrens Bruchteilsabschnitte eines jeden Koeffizienten entfernt sind, stellt dann der Satz möglicher Bilder alle diejenigen Bilder dar, von denen dieselben quantisierten Transformationskoeffizienten über einen Bereich möglicher Koeffizientenwerte für jeden Ausdruck der Transformation bestimmt werden können.
  • Nun unter Bezugnahme auf Fig. 5A ist dort ein Satz möglicher Quellenbilder 100, 102, 104 und 106 gezeigt, von denen jedes aus Bildsignalen mit einem Graudichtewert besteht, der bei dem Beispiel von 0 bis 256 reicht, gefolgt von ihren entsprechenden DCT Koeffizienten als ein Ergebnis der DCT Umwandlung (zur Darstellung, als die DCT 108 angegeben). Diese Bilder stellen Bereiche von Dokumentenbildern dar, die durch Abtasten eines Originaldokuments mit einem Eingabeabtaster erzeugt worden sind, oder als elektronisches Dokument auf einem Computer, usw. erzeugt worden sind. Wie man sehen kann unterscheiden sich die Bilder und die DCT Koeffizienten 110, 112, 114 und 116, die in Fig. 5B gezeigt sind, sind unterschiedlich. Die DCT Koeffizienten werden bei der Quantisierung 118 unter Verwendung der entsprechenden Eingänge in die Q- Tabelle 119 quantisiert, die in Fig. 5C gezeigt ist. Bei diesem Beispiel wird der obere linke Eingang der DCT Koeffizienten durch den oberen linken Eingang [16] in der Q-Tabelle dividiert. Unter Verwendung eines Rundungsvorgangs für den Bruchteil sind die Ergebnisse für diese Koeffizienten
  • im Satz 110, 157/16 = 9,81 gerundet auf 10,
  • im Satz 112, 160/16 = 10
  • im Satz 114, 163/16 = 10,19 gerundet auf 10, und
  • im Satz 116, 163/16 = 10,13 gerundet auf 10.
  • Alle die oberen linken Eingänge in die Tabelle der DCT Koeffizienten sind deshalb auf die gleichen quantisierten DCT Koeffizienten (Satz 120, der in Fig. 5c gezeigt ist) unter Verwendung dieser Q-Tabelle abbildbar. Das gleiche gilt für alle anderen DCT Koeffizi enten, die in Fig. 5A gezeigt sind. Die komprimierten Daten des Satzes 120 beschreiben deshalb einen Satz möglicher Quellenbilder statt eines einzigen Quellenbilds mit einem Teilsatz dieser möglichen Quellenbilder, die in Fig. 5A gezeigt sind. Die Bestimmung, daß ein 8 · 8 Bildblock eine mögliche Quelle der quantisierten DCT Koeffizienten ist, kann abgeleitet werden, indem die Tatsache betrachtet wird, daß die Eingänge in die Q- Tabelle die Quantisierer definieren und deshalb die Genauigkeit der DCT Koeffizienten. Bei dem in Fig. 5B gegebenem Beispiel ist der obere, linke Eingang begrenzt durch 153 ≤ Eingang ≤ 168, wobei 16 Werte überbrückt werden und irgendein Wert in diesem Bereich als ein DCT Koeffizient ohne Änderung der komprimierten Daten verwendet werden kann. Es ist diese "Uneindeutigkeit", die bei dem untenbeschriebenem Verfahren verwendet wird, wobei ein mögliches Quellenbild ausgewählt wird, d. h., i) ein mögliches Quellenbild, das mit den komprimierten Daten übereinstimmt, und ii) ein Bild, das mit dem Modell eines Dokumentbildes übereinstimmt. Auf diese Weise unterscheidet sich das Verfahren von früheren Verfahren, bei denen das letzte abgeleitete Bild nicht mit den komprimierten Daten wie bei Nachfilterungsverfahren übereinstimmt, oder kein Quellenbildmodell verwendet, die Dekomprimierung zu beschränken, aber vielmehr eine Abtastüberlegung verwendete, das Bild unscharf zu machen.
  • Um eine Erwartung für das Eingabedokumentbild zu definieren, wird angemerkt, daß das Bildproblem, das sich aus dem Dekomprimierungsverfahren ergibt, Zittern oder hochfrequentiertes Rauschen ist. Das Ausschließen des hochfrequentierten Rauschens ist erwünscht und verlangt ein Tiefpaßfilter. Unglücklicherweise tritt das Zittern an Rändern auf, die in Dokumentenbildern sehr häufig und wichtig sind. Demgemäß ist, da Ränder hohe Frequenzen darstellen, die nicht entfernt werden sollten, ein einfaches Tiefpaßfilter nicht angemessen, weil es die Randinformation zerstören würde, d. h.: die Lesbarkeit von Zeichen oder die Definition von Linien zusammen mit der Verringerung des Rauschens. Es wird vielmehr ein Tiefpaßfilter verlangt, das Ränder bewahrt. Ein solches Filter ist ein nichtlineares Filter, das ein statistisches Ordnungs-Filter (oder ein Medianfilter), ein Sigmafilter oder Ähnliches sein kann.
  • Bei unserem gegenwärtigen Beispiel und unter Bezugnahme auf Fig. 6 arbeitet das Sigmafilter an dem Bild, wobei in diesem Beispiel ein Rauschwert oder Delta von Δ = 32 verwendet wird. Das Pixel mit dem Wert 231 ist von Pixeln umgeben, die von diesem Wert um nicht mehr als Δ abweicht, und deshalb wird ein Ausgangswert 218 erhalten, indem über alle 9 Pixel in einem 3 · 3 Bereich gemittelt wird. Das Pixel mit dem Wert 40 ist von Pixeln innerhalb des Bereiches sowie von Pixeln umgeben, die den Bereich überschreiten, wodurch ein Ausgangswert 55 erhalten wird, der durch Mittelung über 3 Pixel erzeugt wird.
  • Nun unter Bezugnahme auf Fig. 7A ist eine Gruppe dekomprimierter Pixel und ihrer Grauwerte in einem 8 · 8 Pixelblock innerhalb einer 10 · 10 Pixelnachbarschaft durch die schwarzen Linien angegeben, die die Nachbarschaft von dem Rest des Bildes trennen, wie es gezeigt ist. An den Grenzen des Bildes wiederholen wir einfach Pixel, und dies ist in Fig. 7A in der linkesten Spalten und der untersten Zeile dargestellt. Das Sigmafilter ist als eine Mittelungsfunktion dargestellt, die an Pixeln in einer 3 · 3 Nachbarschaft ausgeführt wird, die nicht von dem Mittenpixel um mehr als einen Wert von 32 abweichen. In Fig. 7A weichen die Werte 155, 96 und 141 (alle eingekreist) von dem Mittenpixel 206 (durch ein Quadrat gekennzeichnet) um mehr als einen Wert von 32 ab (der Rauschwert oder e). Wenn dieses Filter angewendet wird, wird ein abgeändertes Bild von den Graupegelpixeln erhalten, die in Fig. 7B gezeigt sind, und es ergibt sich ein neuer Wert von 208 (gekennzeichnet durch ein Quadrat) für das Pixel.
  • Nachdem man ein gefiltertes Bild erhalten hat, das das hochfrequentierte Rauschen innerhalb des dekomprimierten Bildes abgeschwächt hat, wird ein Vergleich mit dem Originalbild erhalten, um die Treue zu dem Originalbild sicherzustellen. Die DCT des Bildes wird abgeleitet, wie es in Fig. 7c gezeigt ist. Die Ergebnisse werden unmittelbar mit dem ursprünglichen, komprimierten Bild verglichen (beispielsweise mit dem DCT Koeffizientengruppen 110, 112, 114 und 116 und der Q-Tabelle 119 der Fig. 5B und 5C verglichen). Jede Position in dem DCT Satz weist einen Bereich annehmbarer Werte auf, und bei dem Beispiel der Fig. 7C ist der Wert an der Position 3,1 (der eingekreiste Wert von 74) jenseits des Bereiches annehmbarer Werte, die früher zu 75 bis 84 mittels 8 = INT {annehmbarer Wert: 10 + 1/2} bestimmt worden sind, wo "8" der quantisierte DCT Koeffizient und "10" der entsprechende Eingang in die Q-Tabelle ist. Demgemäß wird der Wert 75 für den Wert 74 ersetzt. Mit anderen Worten sind die Transformationswerte so geändert worden, daß das Bild, das außerhalb der Gruppe möglicher Bilder war, nun gerade innerhalb dieser Gruppe ist (siehe Fig. 5A und 5B). Während ein Wert gerade innerhalb des annehmbaren Bereiches bei diesem Beispiel ausgewählt wird, können Versuche zeigen, daß Werte an anderen Positionen in dem Bereich auch eine geeignete Gruppe für Werte außerhalb des Bereiches sein mögen. Fig. 7D zeigt dem korrigierten DCT Koeffizienten an der Position 3,1 mit einem zusätzlich abgeänderten Eingang an der Position 1,4 (eingekreist). Aus den Fig. 7C und 7D ist es klar, daß ein einfaches Filtern eines dekomprimierten Bildes nicht gewährleistet, daß das Ergebnis des Filterungsvorgangs ein Bild ist, das ein mögliches Quellenbild für die komprimierten Daten war, so daß ein Bild erzeugt wird, das die DCT Daten verletzt. Die inverse Transformation der abgeänderten DCT Gruppe wird abgeleitet, und eine Gruppe grauer Bildpixel wird wiedererhalten, wie es in Fig. 7E gezeigt ist. Alle Pixel in Fig. 7E, die unter Bezugnahme auf Fig. 7B abgeändert worden sind, sind erneut eingekreist. Man sollte beachten, daß die in Fig. 7E gegebenen Werte die Werte eines möglichen Originalbildes sind, wo hingegen zwei Werte, die in Fig. 7B gegeben sind, die annehmbaren DCT Bereiche verletzten.
  • Das Verfahren, das Bild zu filtern, in den Frequenzraum zu transformieren, die Frequenzraumwerte zu vergleichen und zu ändern, und sie zurück zu den grauen Bildpixeln zu transformieren, kann mehrere Male erneut iteriert werden. Die Anzahl der Iterationen kann auf der Grundlage keiner Änderungen bei der DCT Transformation ausgewählt werden (d. h., es gibt eine Konvergenz). Alternativ kann das Verfahren iteriert werden, bis es keine weiteren Änderungen bei dem Bild gibt (eine andere Art Konvergenz). Bei einer noch anderen Alternative kann die Anzahl von Iterationen, die auf eine feste Zahl festgelegt ist, oder eine feste Anzahl als ein obere Grenze der Iterationen dienen.
  • Bei dem verwendeten Iterationsverfahren kann die Rauschabschätzung, die in dem Filter verwendet wird, bei jeder Iteration geändert werden. Das heißt, statt Δ = 32 anzunehmen und diesen Wert bei jeder Iteration zu verwenden, können Werte von zwei Dritteln von Δ bei der zweiten Iteration und von einem Drittel Δ bei der dritten Iteration im Fall von drei Iterationen verwendet werden. Wir können auch in sequentiellen Vorgängen filtern und schärfen (ein unterschiedliches Filtern anwenden).
  • Nun ist das Bild ein neues. Zuerst wird angemerkt, daß dieses Bild ein mögliches Originalbild ist, das das komprimierte Originalbild zum Ergebnis haben könnte. Deshalb gibt es einige Treue mit dem Originalbild. Das Bild ist zumindest einmal geglättet worden, um hochfrequentiertes Rauschen zu entfernen, während Ränder verstärkt oder beibehalten werden. Die Korrektur mag Änderungen an dem Bild eingeführt haben, aber eine komprimierte Fassung des gefilterten Bildes ist mit dem ursprünglich komprimierten Bild (der ursprünglichen möglichen Gruppe) verglichen worden, um die Treue zu gewährleisten. Das gefilterte Bild wurde, wie verlangt, korrigiert. Es wird angenommen, daß das korrigierte, gefilterte Bild besser als das gefilterte Bild ist, weil es in vollständiger Übereinstimmung mit dem Bereich möglicher Bilder ist.
  • Fig. 8 stellt das Prinzip des Verfahrens dar. Das Originalbild wird komprimiert; die komprimierte Darstellung wird dekomprimiert. Das dekomprimierte Bild wird gefiltert, um das Aussehen zu verbessern, wobei es bei dieser Durchführung aber nach außerhalb des Bereiches von Bildern gezwungen wird, die annehmbar sind. Die DCT Darstellung des Bildes wird deshalb geändert, um das Bild in den annehmbaren Bereich von Bildern zu zwingen.
  • Nun unter Bezugnahme auf Fig. 9 ist ein Ablaufdiagramm der iterative ADCT Dekomprimierung/Rekonstruktion vorgesehen, die zusätzliche Arbeitsschritte des Verfahrens gemäß der vorliegenden Erfindung zeigt. Ein in Übereinstimmung mit dem ADCT Komprimierungsverfahren mit statistischer Codierung komprimiertes Bild wird beim Schritt 300 erhalten. Die statistische Codierung wird beim Schritt 302 entfernt, um quantisierte DCT Koeffizienten zu erhalten. Beim Schritt 304 werden die quantisierten DCT Koeffizienten mit Werten in der Q-Tabelle multipliziert, um die Gruppe von DCT Koeffizienten zu erhalten. Beim Schritt 306 wird die inverse Transformation der DCT Koeffizienten abgeleitet, um das Graupegelbild zu erzeugen. Indem von dem normalen Verfahren beim Schritt 308 abgewichen wird, wird der 8 · 8 Ausgangsblock gefiltert. Beim Schritt 310 wird der gefilterte Bildausgang verwendet, eine Gruppe von DCT Koeffizienten zu erzeugen. Beim Schritt 312 werden die DCT Koeffizienten des gefilterten Bildes mit den DCT Koeffizienten, die beim Schritt 312 erhalten worden sind, und mit einem annehmbaren Bereich um jeden Wert herum verglichen. Beim Schritt 314 wird, wenn die DCT Koeffizienten des gefilterten Bildes innerhalb des annehmbaren Bereiches um jeden Wert herum sind, dann beim Schritt 316 die inverse Transformation der DCT Koeffizienten abgeleitet, um das Graupegelbild zu erzeugen. Beim Schritt 320 wird das Graubild zum Ausgang gelenkt. Wenn die PCT Koeffizienten des gefilterten Bildes nicht innerhalb des annehmbaren Bereiches um jeden Wert herum sind, dann werden beim Schritt 322 annehmbare Werte für Werte außerhalb des Bereichs ersetzt, und das Verfahren wird vom Schritt 306 an wiederholt. Nicht gezeigt ist, daß ein Zähler schrittweise erhöht werden kann, um die Anzahl der Iterationen zu begrenzen. Wenn beim Schritt 324 die Grenze der Iterationsanzahl erreicht ist, werden die Daten zum Block 316 zur nachfolgenden Ausgabe durch den Block 320 übertragen. Dieser Schritt gewährleistet, daß der Ausgang des Graupegelbild ein gültiges Bild für die komprimierte Beschreibung ist, die beim Block 300 erhalten wurde.
  • Man beachte, daß ein bestimmter Filtertyp und eine bestimmte Konfliktlösung für die DCT Koeffizienten bei den Beispielen verwendet wurde. Offensichtlich sind unterschiedliche Filter möglich, einschließlich statistischer Filter allgemeiner Ordnung und "Such- und-Ersetz"-Bilder. Auch können dem Filter die lokalen Eigenschaften des 8 · 8 Blocks zugrunde liegen. Ein Beispiel ist eine randbewahrende Glättung, die einen Bruchteil des dynamischen Bereiches der lokalen 8 · 8 Blöcke verwendet, und/oder die Q-Matrix, um die maximale Rauschänderung zu bestimmen, die in dem Block angetroffen wird. Eine andere Möglichkeit zur Bearbeitung des Bildbereiches im Gegensatz zu dem DCT Bereich ist, die Daten einer Schwellenbehandlung zu unterziehen, wenn ein binäres Original angenommen wird. Diese Annahme muß jedoch in einem DCT Bereich geprüft werden, und die Schwellenverarbeitung sollte nur akzeptiert werden, wenn die DCT Koeffizienten nach der Schwellenbearbeitung in Übereinstimmung mit den DCT Koeffizienten vor der Schwellenbearbeitung sind.
  • Unterschiedliche Möglichkeiten bestehen zur Konfliktlösung der DCT Koeffizienten. Die Konvergenzgeschwindigkeit kann verbessert werden, indem der Algorithmus etwas abgeändert wird. Mögliche Abänderungen schließen z. B. die Addition von Rauschen zu den abgeänderten DCT Koeffizienten ein. Schließlich kann die Anzahl der Iterationen eine Funktion der lokalen Eigenschaften des 8 · 8 Blocks sein, statt eine festgelegte Anzahl zu verwenden, wie sie in den Beispielen verwendet wurde.

Claims (6)

1. Ein Verfahren zur Verbesserung des Aussehens eines dekomprimierten Dokumentbildes, während die Treue zu einem Originaldokumentbild beibehalten wird, von dem es abgeleitet wird, wobei zur Komprimierung ein Originaldokumentbild in Pixelblöcken (Fig. 2A) unterteilt wird, die genannten Pixelblöcke in Blöcke (Fig. 2B) von Transformationskoeffizienten durch eine Vorwärtstransformationscodier- Operation geändert werden, wobei eine Frequenzraumtransformationsoperation verwendet wird, die genannten Transformationskoeffizienten nachfolgend mit einem mit Verlust behafteten Quantisierungsverfahren quantisiert werden, bei dem jeder Transformationskoeffizient gemäß einem Quantisierungswert aus einer Quantisierungstabelle (Fig. 2C) quantisiert wird und das Ergebnis (Fig. 2B) als ein quantisierter Transformationskoeffizient verwendet wird, um quantisierte Transformationskoeffizientenblöcke (Fig. 2D) zu bilden, wobei das Verfahren die Dekomprimierungsschritte einschließt:
a) Erhalten (300) der genannten quantisierten Transformationskoeffizientenblöcke für das genannte Originalbild;
b) Dequantisieren (304) der Transformationskoeffizienten in einem Block gemäß der Quantisierungstabelle (119), um einen Block erhaltener Transformationskoeffizienten zu erhalten;
c) Wiedergewinnen des Bildes, indeme ein inverse Transformationsoperation (306) auf die erhaltenen Transformationskoeffizienten angewendet wird;
d) Verringern (308) von Rauschen hoher Frequenzen mit einem Filter, das in dem wiedergegebenen Bild als ein Ergebnis des mit Verlust behafteten Quanti sierungsverfahrens erscheint, während die Ränder bewahrt werden, wodurch das Aussehen des wiedergewonnenen Bildes visuell ansprechender gemacht wird;
e) Ändern des gefilterten, wiedergewonnenen Bildes in Blöcke neuer Transformationskoeffizienten durch eine Vorwärtstransformationscodieroperation (310), wobei die Frequenzraum-Transformationskomprimierungsoperation verwendet wird;
f) Verwenden eines jeden genannten Blocks neuer Transformationskoeffizienten (Fig. 7C), eines entsprechenden Blocks erhaltener Transformationskoeffizienten und der genannten Quantisierungstabelle (Fig. 2C; 119), Bestimmen (314), ob das genannte gefilterte, wiedergewonnene Bild von dem genannten wiedergewonnenen Bild ableitbar ist, indem bestimmt wird, ob die neuen Transformationskoeffizienten eine vorbestimmte Beziehung zu den erhaltenen Transformationskoeffizienten in Abhängigkeit von den Werten in der genannten Quantisierungstabelle aufweisen, wodurch bestimmt wird, ob das gefilterte, wiedergewonnene Bild innerhalb einer Menge annehmbarer Bilder ist, und
g) wenn die genannte Bestimmung positiv ist, das gefilterte, wiedergewonnene Bild zu einem Ausgangspuffer zu übertragen (316, 32).
2. Ein Verfahren, wie in Anspruch 1 beansprucht, wobei der Schritt f) die zusätzlichen Schritte einschließt
1) Bestimmen, daß der Block neuer Transformationskoeffizienten keine vorbestimmte Beziehung zu dem Originalbild zeigt; und
2) Abändern (322) einzelner, neuer Transformationskoeffizienten, so daß ein Block abgeänderter, neuer Transformationskoeffizienten (Fig. 7D) die vorbestimmte Beziehung zu dem Originalbild zeigt;
3) Wiedergewinnen des Bildes (Fig. 7E) aus den Blöcken abgeänderter, neuer Transformationskoeffizienten.
3. Ein Verfahren, wie in Anspruch 2 beansprucht, das einschließt, die Schritte d-f iterativ zu wiederholen, bis eine vorbestimmte Bedingung auftritt.
4. Ein Verfahren, wie in irgendeinem der vorhergehenden Ansprüche beansprucht, wobei die Vorwärtstransformationscodieroperation, die die Frequenzraum-Transformationsoperation verwendet, eine diskrete Kosinustransformation ist.
5. Ein Verfahren, wie in irgendeinem der vorhergehenden Ansprüche beansprucht, wobei die quantisierten Transformationskoeffizientenblöcke (Fig. 2D) zur Komprimierung ferner mit einem verlustfreien Codierverfahren codiert (20) werden, und der zusätzliche Schritt (302), irgendeine verlustfreie Codierung zu entfernen, vor dem Schritt b) vorgesehen wird.
6. Ein Verfahren, wie in irgendeinem der vorhergehenden Ansprüche beansprucht, wobei ein quantisierter Transformationskoeffizient zur Komprimierung erzeugt wird, indem jeder Transformationskoeffizient durch einen Quantisierungswert aus der Quantisierungstabelle dividiert (14) wird, der ganzzahlige Teil des Ergebnisses als der quantisierte Transformationskoeffizient verwendet wird, und wobei der Schritt der Dequantisierung der quantisierten Transformationskoeffizienten umfaßt, jeden quantisierten Transformationskoeffizienten mit einem entsprechenden Quantisierungswert aus der Quantisierungstabelle zu multiplizieren.
DE69322351T 1992-10-02 1993-09-28 Verbesserte Dekomprimierung von Standard ADCT-komprimierten Bildern Expired - Lifetime DE69322351T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US07/956,128 US5379122A (en) 1992-10-02 1992-10-02 Decompression of standard ADCT-compressed images

Publications (2)

Publication Number Publication Date
DE69322351D1 DE69322351D1 (de) 1999-01-14
DE69322351T2 true DE69322351T2 (de) 1999-05-20

Family

ID=25497784

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69322351T Expired - Lifetime DE69322351T2 (de) 1992-10-02 1993-09-28 Verbesserte Dekomprimierung von Standard ADCT-komprimierten Bildern

Country Status (4)

Country Link
US (1) US5379122A (de)
EP (1) EP0590922B1 (de)
JP (1) JP3594630B2 (de)
DE (1) DE69322351T2 (de)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3196906B2 (ja) * 1992-08-21 2001-08-06 富士ゼロックス株式会社 画像信号の符号化装置
US5515388A (en) * 1993-03-19 1996-05-07 Sony Corporation Apparatus and method for preventing repetitive random errors in transform coefficients representing a motion picture signal
JP3466705B2 (ja) * 1993-05-28 2003-11-17 ゼロックス・コーポレーション 圧縮画像の圧縮解除方法
EP0671816B1 (de) * 1993-09-28 2000-03-29 Sony Corporation Gerät zur kodierung/dekodierung mit rundung auf ausschliesslich gerade oder ungerade werte
JP3495766B2 (ja) * 1993-10-01 2004-02-09 テキサス インスツルメンツ インコーポレイテツド 画像処理方法
KR0129573B1 (ko) * 1994-04-30 1998-04-10 배순훈 디지탈 화상 복호화를 위한 디씨(dc) 계수의 오차보상 방법
KR0128881B1 (ko) * 1994-04-30 1998-04-10 배순훈 디지틀화상복호화장치
KR970010087B1 (en) * 1994-04-30 1997-06-21 Daewoo Electronics Co Ltd Postprocessing method for digital image
US5534925A (en) * 1994-05-02 1996-07-09 Cognitech Inc. Image compression by optimal reconstruction
JPH08116448A (ja) * 1994-10-13 1996-05-07 Fuji Xerox Co Ltd 画像信号の符号化装置及び復号装置
US5521718A (en) * 1994-12-05 1996-05-28 Xerox Corporation Efficient iterative decompression of standard ADCT-compressed images
KR0165497B1 (ko) * 1995-01-20 1999-03-20 김광호 블럭화현상 제거를 위한 후처리장치 및 그 방법
EP0735772A3 (de) * 1995-03-27 1998-04-01 Hewlett-Packard Company Verfahren zur Auswahl von JPEG-Quantisierungstabellen für Anwendungen mit niedriger Bandbreite
US5872874A (en) * 1995-04-26 1999-02-16 Hewlett-Packard Company Method and apparatus for scaling down images that are provided in a compressed data format
KR0160690B1 (ko) * 1995-04-29 1999-01-15 김광호 영상신호 부호화/복호화장치에 있어서 블럭킹 효과 제거회로
US5629778A (en) * 1995-05-15 1997-05-13 Polaroid Corporation Method and apparatus for reduction of image data compression noise
US5936673A (en) * 1995-05-26 1999-08-10 Intel Corporation Temporal tile staggering for block based video compression
US5995665A (en) * 1995-05-31 1999-11-30 Canon Kabushiki Kaisha Image processing apparatus and method
USH1684H (en) * 1995-09-29 1997-10-07 Xerox Corporation Fast preview processing for JPEG compressed images
US5850294A (en) * 1995-12-18 1998-12-15 Lucent Technologies Inc. Method and apparatus for post-processing images
US5881180A (en) * 1996-02-08 1999-03-09 Sony Corporation Method and apparatus for the reduction of blocking effects in images
US5845083A (en) * 1996-03-07 1998-12-01 Mitsubishi Semiconductor America, Inc. MPEG encoding and decoding system for multimedia applications
US5974196A (en) * 1996-03-15 1999-10-26 Sony Corporation Method and apparatus for blocking effect reduction in images
US5933542A (en) * 1996-04-24 1999-08-03 Sony Corporation Method and apparatus for blocking effect reduction in images by post-processing in the spatial domain
US6026217A (en) * 1996-06-21 2000-02-15 Digital Equipment Corporation Method and apparatus for eliminating the transpose buffer during a decomposed forward or inverse 2-dimensional discrete cosine transform through operand decomposition storage and retrieval
US6101276A (en) 1996-06-21 2000-08-08 Compaq Computer Corporation Method and apparatus for performing two pass quality video compression through pipelining and buffer management
US5796875A (en) * 1996-08-13 1998-08-18 Sony Electronics, Inc. Selective de-blocking filter for DCT compressed images
US5854857A (en) * 1996-09-26 1998-12-29 Xerox Corporation Using encoding cost data for segmentation and background suppression in JPEG-compressed images
US5838831A (en) * 1996-09-26 1998-11-17 Xerox Corporation Compression of image data with retaining cost data for each compressed image block
US5757975A (en) * 1996-11-21 1998-05-26 Xerox Corporation Artifact reduction for large dynamic range input data in JPEG compression
US6044177A (en) * 1997-06-18 2000-03-28 Hewlett-Packard Company Artifact reduction decompression method and apparatus for interpolated images
KR100243225B1 (ko) 1997-07-16 2000-02-01 윤종용 블록화효과 및 링잉잡음 감소를 위한 신호적응필터링방법 및신호적응필터
US6049330A (en) * 1997-08-28 2000-04-11 Oak Technology, Inc. Method and apparatus for optimizing storage of compressed images in memory
FR2769161B1 (fr) * 1997-10-01 1999-12-24 Univ Neuchatel Procede de controle du taux de compression d'images numeriques
KR100269125B1 (ko) * 1997-10-25 2000-10-16 윤덕용 양자화효과감소를위한영상데이터후처리방법및장치
US6104441A (en) * 1998-04-29 2000-08-15 Hewlett Packard Company System for editing compressed image sequences
US6256415B1 (en) 1998-06-10 2001-07-03 Seiko Epson Corporation Two row buffer image compression (TROBIC)
US7194138B1 (en) * 1998-11-04 2007-03-20 International Business Machines Corporation Reduced-error processing of transformed digital data
US6392764B1 (en) * 1998-11-12 2002-05-21 Xerox Corporation Systems and methods for adaptively filtering palettized images
US6421468B1 (en) 1999-01-06 2002-07-16 Seiko Epson Corporation Method and apparatus for sharpening an image by scaling elements of a frequency-domain representation
US7254824B1 (en) * 1999-04-15 2007-08-07 Sedna Patent Services, Llc Encoding optimization techniques for encoding program grid section of server-centric interactive programming guide
US6963609B2 (en) * 2000-01-12 2005-11-08 Koninklijke Philips Electronics N.V. Image data compression
US6456663B1 (en) * 2000-03-29 2002-09-24 Matsushita Electric Industrial Co., Ltd. DCT domain down conversion system that compensates for IDCT mismatch
US6909812B1 (en) 2000-07-13 2005-06-21 Lucent Technologies Inc. Methods and apparatus for nearly lossless-concatenated block transform coding
US6766341B1 (en) 2000-10-23 2004-07-20 International Business Machines Corporation Faster transforms using scaled terms
US7007054B1 (en) 2000-10-23 2006-02-28 International Business Machines Corporation Faster discrete cosine transforms using scaled terms
US6961473B1 (en) * 2000-10-23 2005-11-01 International Business Machines Corporation Faster transforms using early aborts and precision refinements
KR100386639B1 (ko) * 2000-12-04 2003-06-02 주식회사 오픈비주얼 정규화된 역양자화기를 이용한 영상 및 동영상의 복원 방법
US7020672B2 (en) * 2001-03-30 2006-03-28 Koninklijke Philips Electronics, N.V. Reduced complexity IDCT decoding with graceful degradation
JP3893099B2 (ja) 2002-10-03 2007-03-14 オリンパス株式会社 撮像システムおよび撮像プログラム
US7139437B2 (en) * 2002-11-12 2006-11-21 Eastman Kodak Company Method and system for removing artifacts in compressed images
JP4657869B2 (ja) * 2005-09-27 2011-03-23 シャープ株式会社 欠陥検出装置、イメージセンサデバイス、イメージセンサモジュール、画像処理装置、デジタル画像品質テスタ、欠陥検出方法、欠陥検出プログラム、およびコンピュータ読取可能な記録媒体
US7590298B2 (en) * 2006-04-12 2009-09-15 Xerox Corporation Decompression with reduced ringing artifacts
US7532767B2 (en) * 2006-05-31 2009-05-12 Xerox Corporation Removing ringing and blocking artifacts from JPEG compressed document images
JP5102122B2 (ja) * 2008-06-11 2012-12-19 キヤノン株式会社 復号化装置及び復号化方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4794455A (en) * 1987-01-07 1988-12-27 Pictel Corporation Method and apparatus employing adaptive filtering for efficiently communicating image sequences
US5170264A (en) * 1988-12-10 1992-12-08 Fuji Photo Film Co., Ltd. Compression coding device and expansion decoding device for a picture signal
JP2521145B2 (ja) * 1989-02-20 1996-07-31 日本ビクター株式会社 動き補償予測符号化復号化方式
IL91221A (en) * 1989-08-04 1995-03-30 Ibm Israel Binary text compression method
US5001559A (en) * 1989-10-12 1991-03-19 International Business Machines Corporation Transform coding using coefficient prediction techniques
US4974078A (en) * 1989-11-13 1990-11-27 Eastman Kodak Company Digital compression method and system with improved coding efficiency
US5146326A (en) * 1989-11-14 1992-09-08 Fujitsu Limited Coded picture information decoding apparatus having means for improving picture distortion
US5229864A (en) * 1990-04-16 1993-07-20 Fuji Photo Film Co., Ltd. Device for regenerating a picture signal by decoding
US5216516A (en) * 1990-04-27 1993-06-01 Ricoh Company, Inc. Orthogonal transformation arithmetic unit
US4999705A (en) * 1990-05-03 1991-03-12 At&T Bell Laboratories Three dimensional motion compensated video coding
JPH0434669A (ja) * 1990-05-31 1992-02-05 Toshiba Corp 画像処理方式
KR960010392B1 (ko) * 1990-09-29 1996-07-31 니뽕 빅터 가부시끼가이샤 적응 양자화를 이용한 화상 신호 부호화 복호화 장치
JP2876258B2 (ja) * 1991-01-23 1999-03-31 株式会社リコー デジタル電子スチルカメラ
US5231484A (en) * 1991-11-08 1993-07-27 International Business Machines Corporation Motion video compression system with adaptive bit allocation and quantization
KR940011605B1 (ko) * 1991-12-20 1994-12-22 삼성전자 주식회사 고정비트율 설정에 의한 영상압축방식
US5321522A (en) * 1993-07-19 1994-06-14 Xerox Corporation ADCT compression with minimum compression ratio

Also Published As

Publication number Publication date
EP0590922A2 (de) 1994-04-06
EP0590922B1 (de) 1998-12-02
DE69322351D1 (de) 1999-01-14
US5379122A (en) 1995-01-03
JP3594630B2 (ja) 2004-12-02
EP0590922A3 (en) 1994-05-11
JPH06139351A (ja) 1994-05-20

Similar Documents

Publication Publication Date Title
DE69322351T2 (de) Verbesserte Dekomprimierung von Standard ADCT-komprimierten Bildern
DE69434862T2 (de) Segmentierungs-basiertes entfernen von artefakten aus einem jpeg-bild
DE69415887T2 (de) Verbesserter Dekompressionstandard für ADCT-komprimierte Bilddokumente
DE69627982T2 (de) Signaladaptives Nachverarbeitungssystem um Blockierungseffekte und Ringstörungen zu verringern
DE19819198B4 (de) Reversible DCT für verlustfreie/verlustbehaftete Kompression
DE69116869T2 (de) Digitale bildkodierung mit einer zufallsabtastung der bilder
DE69222766T2 (de) System zur adaptiven kompression der blockgrössen eines bildes
DE69228442T2 (de) Verfahren und vorrichtung zur bilddatenkompression durch luminanz/chrominanz-kodierung
DE19861377B4 (de) Ein verbessertes Kompressions- und Dekompressionssystem mit reversiblen Wavelets und verlustbehafteter Rekonstruktion
DE69130214T2 (de) Bilddatenkompression mit adaptiver Blockgrössenauswahl
DE69722601T2 (de) Datenkompression mit hybrider verlustloser entropiekodierung von run-length codes
DE69309529T2 (de) Verfahren und Vorrichtung für die räumliche Filterung von blocktransformationsdekodierten digitalen Bildern
DE69723550T2 (de) Kodierung und dekodierung von grafischen symbolen
DE69413759T2 (de) ADCT-Kompression mit minimalem Kompressionsgrad
DE60203850T2 (de) System und Verfahren zum Verarbeiten von Bildern mit aufgelöster Mosaikstruk- tur, um durch Farb-Aliasing hervorgerufenen Artefakte zu verringern.
DE602004001993T2 (de) Transformations basiertes restbewegungsrahmen kodierungsverfahren mit übervollständiger basis und zugehörige vorrichtung zur videokompression
DE69818751T2 (de) Dekompression von interpolierten Bildern
DE60119904T2 (de) Vorrichtung und Verfahren zur Entfernung des Mosaikeffekts in Rohbilddaten im Hinblick auf die Datenkompression
DE69523419T2 (de) Effiziente iterative Dekomprimierung von standard-ADCT-komprimierten Bildern
DE69915843T2 (de) Teilbandkodierung/-dekodierung
WO2017162835A1 (de) Datenkompression mittels adaptiven unterabtastens
DE69126525T2 (de) Digitale bildverarbeitung mit filterung der blockkanten
DE60015755T2 (de) Verlustfreie adaptive codierung von daten eines endlichen alphabets
DE69723325T2 (de) Verfahren und Vorrichtung zur Codierung und Decodierung von Bildern
EP0985317B1 (de) Verfahren zur codierung und decodierung eines digitalisierten bildes

Legal Events

Date Code Title Description
8364 No opposition during term of opposition