DE19958553A1 - Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten - Google Patents
Verfahren zur Kompression von gescannten Farb- und/oder GraustufendokumentenInfo
- Publication number
- DE19958553A1 DE19958553A1 DE19958553A DE19958553A DE19958553A1 DE 19958553 A1 DE19958553 A1 DE 19958553A1 DE 19958553 A DE19958553 A DE 19958553A DE 19958553 A DE19958553 A DE 19958553A DE 19958553 A1 DE19958553 A1 DE 19958553A1
- Authority
- DE
- Germany
- Prior art keywords
- image
- regions
- foreground
- background
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/41—Bandwidth or redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Color Television Systems (AREA)
- Processing Of Color Television Signals (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
Die Erfindung betrifft ein Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten, wobei das digitale Bild des gescannten Dokuments in drei Bildebenen - ein Vordergrundbild, ein Hintergrundbild und ein binäres Maskenbild - zerlegt wird. DOLLAR A Zunächst wird aus dem definiert verkleinerten Originaldokument mit einem adaptiven Schwellwertverfahren ein lokal variables Schwellwertbild erzeugt und wieder auf die Größe des Originaldokumentes gebracht. Das Originalbild wird anschließend mit diesem Schwellwertbild quantisiert, um ein bitonales Quantisierungsbild herzustellen. Danach erfolgt eine Textdetektion (Segmentierung), welche das Dokument in Vordergrund- und Hintergrundregionen unterteilt und das Ergebnis der Segmentierung in einem binären Maskenbild ablegt. Aus dem Originalbild und dem Maskenbild werden ein Vorder- und ein Hintergrundbild hergestellt und die drei Bilder anschließend jeweils mit einem geeigneten Bildkoder kodiert.
Description
Die Erfindung betrifft ein Verfahren zur Kompression von gescannten Farb- bzw.
Graustufendokumenten, wobei das digitale Bild des gescannten Dokuments in drei
Bildebenen zerlegt wird. Diese Bildebenen sind ein Vordergrundbild, ein
Hintergrundbild und ein binäres Maskenbild. Das Maskenbild beschreibt, welche
Bereiche des Dokuments zum Vordergrund bzw. zum Hintergrund gehören.
Bestandteile des Vordergrundes sind Text und graphische Elemente. Die Farbigkeit
bzw. die Intensität dieser Vordergrundbereiche wird durch das Vordergrundbild
beschrieben. Zu den Hintergrundbereichen zählen der Texthintergrund sowie die im
Dokument enthaltenen Bilder. Die Farb- bzw. Helligkeitsinformation des Hintergrundes
sowie die in dem Dokument enthaltenen Bilder sind im Hintergrundbild enthalten. Jedes
der drei Bilder wird für sich mit einem geeigneten Bildkodierungsverfahren kodiert. Bei
der Dekodierung wird das Dokument aus dem Vordergrund- und Hintergrundbild
wieder zusammengesetzt. Hierbei beschreibt das binäre Maskenbild, in welchen
Bereichen das rekonstruierte Dokument aus dem Vordergrundbild bzw. aus dem
Hintergrundbild zu erzeugen ist.
Bei geeigneter Zerlegung des Dokuments in die beschriebenen drei Bildebenen lassen
sich mit dieser Repräsentation deutlich bessere Kompressionsergebnisse als mit
Bildkodierungsverfahren erzielen, die das Dokument als Ganzes kodieren. Die
Erfindung beschreibt ein neues Verfahren zur Bestimmung des binären Maskenbildes
sowie eine Methode zur effizienten Zerlegung des Originaldokuments in die
Vordergrund- und Hintergrundbilder. Hierbei werden keinerlei spezielle Annahmen
über Art oder Aufbau des Dokuments vorausgesetzt.
Dokumente, die mit hohen Auflösungen gescannt werden, benötigen sehr viel
Speicherplatz für die anfallenden digitalen Bilddaten. So ergeben sich bei einem 300 dpi
Scan einer farbigen A4-Seite ca. 25 Millionen Bytes, bei einem farbigen 600 dpi Scan
sogar ca. 100 Millionen Bytes. Dokumente mit Datenmengen dieser Größenordnung
lassen sich unkomprimiert nur in geringen Mengen archivieren, eine Übertragung über
Netzwerke mit niedrigen Übertragungsraten ist praktisch unmöglich.
Verlustlose Kompressionsverfahren wie der verlustlose Modus des JPEG-Standards
(JPEG-LS) oder Lempel-Ziv Welch (LZW) ermöglichen nur sehr geringe
Kompressionsfaktoren. Höhere Kompressionsfaktoren sind nur durch den Einsatz
verlustbehafteter Kompressionsverfahren möglich. Als Standardverfahren ist das DCT-
basierte "JPEG-Verfahren" der Joint Pictures Expert Group zu nennen. Jedoch weder
das JPEG-Verfahren noch neuere, bessere Wavelet-basierte Kompressionsverfahren
lassen sich für die hochgradige Kompression von gescannten Dokumenten einsetzen.
Diese reinen Bildkompressionsverfahren setzen die Statistik von typischen Bildsignalen
voraus, die durch eine hohe örtliche Korrelation gekennzeichnet ist. Da bei gescannten
Dokumenten diese Annahmen nicht zutreffen, werden bei hohen Kompressionsfaktoren
die textuellen Anteil der Dokumente derart stark verändert, daß ein Lesen des Textes
unmöglich wird. Gegenwärtig werden Dokumente zur Archivierung üblicherweise binär
gescannt und mit den CCITT Fax-Kompressionsstandards "Fax Group 32" bzw. "Fax
Group 4" komprimiert. Bei diesen rein binären Kompressionsverfahren bleibt die
Lesbarkeit im allgemeinen erhalten, jedoch gehen die Helligkeits- und
Farbinformationen der Bildanteile vollständig verloren.
Ein neuer Ansatz, der diese Probleme umgeht, ist der aktuell in der Planung befindliche
Mixed Raster Content Standard (MRC) (ITU Empfehlung T.44). Danach ist es möglich,
ein Dokument in Regionen unterschiedlicher örtlicher Auflösung zu unterteilen, die auf
unterschiedliche Weise kodiert werden können. Ein Modus des MRC-Standards ist ein
Multilayerkodierungsmodus, der eine Zerlegung des Dokuments in die drei zuvor
beschrieben Ebenen vorsieht. Im MRC-Standard wird jedoch ausschließlich der
Dekodierungsprozeß eindeutig festgelegt, es gibt keine Vorgaben, wie die Zerlegung
des Dokuments in die drei Bildebenen bei der Kodierung zu realisieren ist. Ein
Verfahren, welches diesen Multilayerkodierungsmodus verwendet, ist in US Patent
Nummer 5,779,092 beschrieben. Es setzt jedoch Bedingungen voraus, die in vielen zu
bearbeitenden Dokumenten nicht anzutreffen sind: Die Form von Bildern wird
grundsätzlich als rechteckig vorausgesetzt. Eine Hinterlegung von Text mit
Hintergrundbildern bzw. das Vorhandensein von Text innerhalb von Bildern ist nicht
vorgesehen. Weiterhin muß der Dokumentenhintergrund grundsätzlich weiß bzw. hell
sein.
Ziel der Erfindung ist es, die Kompression gescannter Dokumente ohne
Einschränkungen an die Beschaffenheit der Vorlagen, wie heller Hintergrund,
rechteckige Abbildungen, exakte Trennung von Bild- und Textbestandteilen, zu
ermöglichen. Darüber hinaus soll der Aufwand an Rechenzeit und Speicherkapazität
deutlich gesenkt werden. Weiterhin sollen unterschiedliche Dokumentenklassen und
Bilder über wenige Steuerparameter nach einem einheitlichen Verfahren komprimiert
werden.
Ausgehend von der Repräsentation des Dokuments in den drei Ebenen - Vordergrund-,
Hintergrund- und Maskenbild - ist der grundsätzliche Ablauf des erfindungsgemäßen
Kompressionsverfahrens im Hauptanspruch 1 dargestellt. Detaillierte, vorteilhafte
Ausgestaltungen der aufeinanderfolgenden Verfahrensschritte sind in den
Unteransprüchen 2 bis 9 enthalten.
Zunächst wird aus dem definiert verkleinerten Originaldokument mit einem adaptiven
Schwellwertverfahren ein lokal variables Schwellwertbild erzeugt und wieder auf die
Größe des Originaldokumentes gebracht. Das Originalbild wird anschließend mit
diesem Schwellwertbild quantisiert, um ein bitonales Quantisierungsbild herzustellen.
Anhand dieses Quantisierungsbildes und dem Originalbild wird danach eine
Textdetektion (Segmentierung) durchgeführt, welche das Dokument in Vordergrund-
und Hintergrundregionen unterteilt. Hierbei werden Regionen wie Text und graphische
Elemente dem Vordergrundbild, Texthintergrund und Bilder dem Hintergrundbild
zugeordnet. Das Ergebnis dieser Segmentierung wird im binären Maskenbild abgelegt.
Das binäre Maskenbild hat die gleiche Größe bzw. Auflösung wie das Originalbild.
Anschließend wird aus dem Originalbild und dem Maskenbild das Vordergrundbild
erzeugt, welches die Farbigkeit der Vordergrundregionen beschreibt. Dieses
Vordergrundbild besitzt eine gegenüber dem Originalbild reduzierte Auflösung. Aus
dem Komplement des bitonalen Maskenbildes und dem Originalbild wird danach das
Hintergrundbild wiederum mit verringerter Auflösung erzeugt. Die drei Bilder werden
anschließend jeweils mit einem geeigneten Bildkoder kodiert.
Die Quantisierung bzw. Binärisierung des Originaldokuments geschieht in zwei
Schritten: Zunächst wird mit einem adaptiven Verfahren ein lokal variabler Schwellwert
bestimmt. Der Vergleich der Grauwertrepräsentation des Originaldokuments mit diesem
Schwellwert liefert das binäre Quantisierungsbild.
Liegt das Originaldokument als farbiges Dokument vor, wird es zunächst in ein
Graustufenbild und zwei Farbdifferenzkomponentenbilder umgewandelt. Zur
Bestimmung des lokal variablen Schwellwertbildes wird das Graustufenbild verwendet.
Das Graustufenbild, welches normalerweise mit einer Auflösung von 150 bis 600 dpi
vorliegt, wird auf eine geeignete Größe verkleinert. Hierzu wird eine Tiefpaßfilterung
mit anschließender Unterabtastung durchgeführt. Durch die Verkleinerung werden
örtliche Störungen des Originalscans wie Rauschen, Dither- oder Rastereffekte
verringert, wodurch sich verläßlichere Schwellwerte bestimmen lassen. Weiterhin wird
hierdurch der Rechenaufwand zur Bestimmung der Schwellwerte reduziert.
Als nächstes wird eine lokale Dynamikanalyse durchgeführt. Hierzu wird das
verkleinerte Graustufenbild einer Minimum- und Maximumfilterung unterzogen.
Die Differenz aus Maximum- und Minimumbild erzeugt ein Dynamikbild, welches
Hinweise auf Regionen mit starken Kanten, z. B. in Textregionen, liefert.
Das Dynamikbild wird im nächsten Schritt mit einer extern vorgebbaren
Mindestdynamik verglichen, welche die Empfindlichkeit der Quantisierung und der
Textdetektion steuert. In Regionen, deren Dynamik diesen Mindestwert überschreitet,
wird ein Quantisierungsschwellwert bestimmt, der sich aus der Hälfte der Summe aus
Minimum- und Maximumbild berechnet. In Regionen, deren Dynamik zu gering ist,
wird der Quantisierungsschwellwert zunächst auf Null gesetzt.
Da die so bestimmten Schwellwerte starken örtlichen Schwankungen unterliegen und
ihre Maxima jeweils im helleren Bereich einer Kante zu finden sind, wird als nächster
Schritt eine Mittelwertbildung für alle Schwellwerte ungleich Null durchgeführt.
Diese gemittelten Schwellwerte werden jetzt auf angrenzende Pixel ausgedehnt.
Im letzten Schritt werden alle verbleibenden Pixel, für die noch keine Schwellwert
existiert, mit einem Kern ausgefüllt, der aus dem Mittelwert über alle Werte ungleich
Null gebildet wird. Neu berechnete Werte werden direkt in das Schwellwertbild
zurückgeschrieben, wodurch es möglich ist, für alle Pixel des Bildes einen Schwellwert
mit nur einem Durchlauf zu bestimmen.
Da das jetzt bestimmte Schwellwertbild kleiner als das Originaldokument ist, muß es
zur Quantisierung wieder auf die Originalgröße gebracht werden. Die Vergrößerung
erfolgt mittels bilinearer Interpolation. Hierdurch ergeben sich bei der anschließend
durchgeführten Quantisierung weniger Störungen als bei einer einfachen Vergrößerung
durch Pixelwiederholungen, was zu verbesserten Kodierungsergebnissen für das im
folgenden erzeugte binäre Maskenbild führt.
Das erzeugte binäre Quantisierungsbild ist Ausgangspunkt für den zweiten Bereich des
erfindungsgemäßen Verfahrens, die Textdetektion.
Ziel der Textdetektion (Segmentierung) ist es, das binäre Maskenbild zu erzeugen,
welches eine Pixel-individuelle Zuordnung in Vordergrund- und Hintergrundregionen
beschreibt. Textuelle und graphische Strukturen, die zum Vordergrund gehörig
detektiert wurden, werden im binären Maskenbild schwarz repräsentiert,
Hintergrundregionen weiß.
Die Segmentierung erfolgt erfindungsgemäß, indem, alle verbundenen Regionen
gleichen Wertes des Quantisierungsbildes als mögliche Kandidaten für
Vordergrundbestandteile beurteilt werden. Dazu werden sie nach diversen Kriterien auf
ihre Zugehörigkeit zum Vordergrund hin untersucht. Die als Vordergrund segmentierten
Regionen werden in das binäre Maskenbild eingetragen.
Während der Segmentierung ist das Maskenbild zunächst noch nicht binär und kann die
Zustände: "noch nicht untersucht", "Vordergrund", "Hintergrund" und "Loch"
annehmen.
Als erster Schritt werden alle verbundenen Regionen des Quantisierungsbildes
identifiziert. Hierbei wird für Dokumente mit hoher Auflösung eine Vierer-
Nachbarschaft verwendet, bei geringen Auflösungen wird eine Achter-Nachbarschaft
angewendet.
Sind die Regionen bestimmt, wird eine Größenfilterung durchgeführt. Abhängig von der
Auflösung des Dokuments existiert eine Mindestgröße und eine Maximalgröße, die
nicht unter- bzw. überschritten werden darf Regionen, die im zulässigen Bereich liegen,
werden weiter untersucht, anderenfalls werden sie verworfen.
Als nächster Schritt erfolgt eine Kantendetektion. Hierzu werden alle Randpixel der
Region mit Hilfe an sich bekannter Kantenfilter untersucht, wobei die Kantenaktivität
durch den Absolutwert der Filterantwort bestimmt wird.
Um Kanten besser von Rastereffekten oder Rauschen unterscheiden zu können, wird die
ermittelte Kantenaktivität mit einem Mindestaktivitätswert verglichen. Ist die
Kantenaktivität geringer als dieser Mindestwert, so wird sie zu Null gesetzt.
In einem weiteren Schritt werden jetzt die mittlere und die maximale Kantenaktivität für
den Rand der Region und für den Innenbereich der Region zusätzlich die Varianz
bestimmt.
Als nächstes wird geprüft, ob sowohl die mittlere als auch die maximale Kantenaktivität
über vorgegebenen Mindestwerten liegen und außerdem die Varianz des Innenbereichs
einen Maximalwert nicht überschreiten.
Bei positivem Ergebnis wird die aktuelle Region als Vordergrundregion klassifiziert
und als solche ins Maskenbild eingetragen. Für den Fall, daß diese Region eine andere
bereits als Vordergrund klassifizierte berührt, wird sie als "Loch" eingetragen. Ist der
Test negativ, handelt es sich um eine Hintergrundregion, die ebenfalls ins Maskenbild
eingetragen wird.
Nach der Klassifizierung wird das Maskenbild binärisiert. Hierzu werden die
Vordergrundregionen auf schwarz, alle restlichen Regionen auf weiß gesetzt.
Die Segmentierung kann in vier unterschiedlichen Modi durchgeführt werden: Die
bisher beschriebene Verfahrensweise entspricht einem ersten Modus, der auch normalen
und inversen Text zu detektieren vermag. Für viele Dokumente, wie z. B. einfache
Briefe, in denen kein inverser Text vorkommt, kann ein zweiter Modus verwendet
werden, der nur die schwarzen verbundenen Regionen des Quantisierungsbildes
untersucht. Ein dritter Modus ist für extrem schwer zu segmentierende Dokumente wie
z. B. Landkarten sinnvoll, hierbei werden alle schwarzen Regionen des
Quantisierungsbildes automatisch als Vordergrundregionen angenommen, hierdurch
lassen sich auch bei schwer zu segmentierenden Dokumenten zufriedenstellende
Kodierungsergebnisse erzielen. Der vierte Modus besteht darin, direkt alle Pixel als
Hintergrundpixel zu klassifizieren, was bei der Kodierung von reinen Bilddokumenten
sinnvoll ist.
Im folgenden werden die Vordergrund- und Hintergrundbilder ermittelt. Hierbei müssen
zwei Aspekte erfüllt werden. Einerseits sollen Vordergrundbild bzw. Hintergrundbild
die Intensitäten des Originalscans möglichst gut repräsentieren, so daß auch bei
fehlerhafter Segmentierung keine visuellen Artefakte entstehen. Andererseits muß die
Struktur der entstehenden Bilder möglichst einfach sein, um eine effiziente Kodierung
zu gewährleisten.
Anhand des binären Maskenbildes und des Originalbildes wird das verkleinerte
Vordergrundbild erzeugt.
Zunächst werden alle zum Vordergrund gehörigen Regionen im binären Maskenbild
identifiziert. Da die Randwerte der Regionen fehlerhafte Intensitäten bzw. Farbigkeiten
aufweisen, werden die Vordergrundregionen grundsätzlich um einen Pixel verdünnt,
wobei jedoch mindestens das Skelett der Region erhalten bleibt.
Das Originalbild und das verdünnte binäre Maskenbild werden in Blöcke zerlegt.
Hierbei entspricht die Kantenlänge der Blöcke dem Verkleinerungsfaktor. Enthält ein
Block einen Anteil der verdünnten Vordergrundregion, so wird über diesen Anteil der
Mittelwert der entsprechenden Pixel des Originaldokuments gebildet und an die
korrespondierende Stelle im verkleinerten Vordergrundbild geschrieben. Enthält ein
Block keine verdünnte Vordergrundregion, so wird der Wert des Vordergrundbildes zu
Null gesetzt.
Danach werden die Vordergrundpixel mit Werten ungleich Null mit einer
Mittelwertfilterung für angrenzende Pixel ausgedehnt.
Im letzten Schritt werden alle verbleibenden Pixel ausgefüllt. Hierbei wird jeweils der
Mittelwert über alle Werte ungleich Null gebildet. Zur Steigerung der
Kodierungseffizienz wird ein konstanter Grauwert als zusätzlicher Anteil mit in die
Mittelwertbildung einbezogen, um das Vordergrundbild in Regionen ohne
Vordergrundregionen gegen Grau zu dämpfen. Neu berechnete Werte werden direkt in
das Vordergrundbild zurückgeschrieben, wodurch es möglich ist, alle Pixel des Bildes
mit nur einem Durchlauf zu bestimmen.
Die Bestimmung des Hintergrundbildes entspricht im Prinzip dem Verfahren, das zur
Bestimmung des Vordergrundbildes angewendet wird, nur daß jetzt die Verarbeitung
mit dem Komplement, dem inversen binären Maskenbild durchgeführt wird.
Zunächst werden alle zum Hintergrund gehörigen Regionen im binären Maskenbild
identifiziert. Da die Randwerte der Regionen fehlerhafte Intensitäten bzw. Farbigkeiten
aufweisen, werden auch die Hintergrundregionen um einen Pixel verdünnt, wobei
jedoch mindestens das Skelett der Region erhalten bleibt.
Das Originalbild und das verdünnte inverse binäre Maskenbild werden wiederum in
Blöcke zerlegt, deren Kantenlänge jetzt dem Verkleinerungsfaktor für das
Hintergrundbild entspricht. Enthält ein Block einen Anteil der verdünnten
Hintergrundregion, so wird über diesen Anteil der Mittelwert der entsprechenden Pixel
des Originaldokuments gebildet und in das verkleinerte Hintergrundbild geschrieben.
Enthält ein Block keine verdünnte Hintergrundregion, so wird das entsprechende Pixel
des Hintergrundbildes zu Null gesetzt.
Im nächsten Schritt werden die Hintergrundpixel mit Werten ungleich Null mit einer
Mittelwertfilterung für angrenzende Pixel ausgedehnt.
Im letzten Schritt werden alle verbleibenden Pixel ausgefüllt. Hierbei wird jeweils der
Mittelwert über alle Werte ungleich Null gebildet. Neu berechnete Werte werden direkt
zurückgeschrieben, wodurch es möglich ist, alle Pixel des Hintergrundbildes mit nur
einem Durchlauf zu bestimmen.
Sind die drei Bilder: Vordergrund-, Hintergrund- und das binäre Maskenbild nach dem
erfindungsgemäßen Verfahren erzeugt worden, werden sie mit an sich bekannten
Bildkodern komprimiert.
Die Dekodierung besteht darin, das Vordergrund-, Hintergrund- und das binäre
Maskenbild zunächst getrennt zu dekodieren. Die verkleinerten Hintergrund- und
Vordergrundbilder werden mittels Interpolation auf die Größe des Maskenbildes
vergrößert. Abhängig vom Wert des binären Maskenbildes wird dann das rekonstruierte
Bild aus den Pixeln des vergrößerten Hintergrund- bzw. Vordergrundbildes
zusammengesetzt.
Die Erfindung soll nachstehend an einem Ausführungsbeispiel näher erläutert werden.
Dazu zeigen
Fig. 1 ein Blockschaltbild des Verfahrens
Fig. 2 die Verfahrensschritte bis zur Quantisierung des Originalbildes mit
Bestimmung des Schwellwertes
Fig. 3 die Verfahrensschritte der Textdetektion/Segmentierung
Fig. 4 die Verfahrensschritte zur Bestimmung des Vordergrundbildes
Fig. 5 die Verfahrensschritte zur Bestimmung des Hintergrundbildes
Fig. 6 das Beispiel eines Originaldokumentes
Fig. 7 das Quantisierungsbild des Originaldokumentes
Fig. 8 das Segmentierungsergebnis
Fig. 9 das verfahrensgemäße Vordergrundbild
Fig. 10 das verfahrensgemäße Hintergrundbild
Fig. 11 die dekodierte Rekonstruktion des Originaldokumentes.
Im Beispiel liegt das Originaldokument (Fig. 6) als farbiges Dokument mit schwarzen
und farbigen Textanteilen in einer Auflösung von 300 dpi vor, welches zunächst gem.
Fig. 2 in ein Graustufenbild zur Bestimmung des lokal variablen Schwellwertbildes und
zwei Farbdifferenz-Komponentenbilder umgewandelt wird. Das Graustufenbild wird
durch eine Tiefpaßfilterung mit anschließender Unterabtastung auf 150 dpi verkleinert.
Das verkleinerte Graustufenbild wird danach im Rahmen einer lokalen Dynamikanalyse
einer Maximum-/Minimumfilterung mit 3 × 3 Kernen unterzogen. Aus der Differenz
zwischen Maximum- und Minimumbild entsteht ein Dynamikbild, welches im nächsten
Schritt mit einer Mindestdynamik von 55 verglichen wird. Für Bereiche, welche diesen
Mindestwert überschreiten, wird die Zugehörigkeit zu einer Textregion angenommen
und ein Quantisierungs-Schwellwert aus der Hälfte der Summe aus Maximum- und
Minimumbild berechnet, während für Regionen mit geringerer Dynamik dieser
Quantisierungsschwellwert zunächst gleich Null gesetzt wird. Alle Schwellwerte
ungleich Null werden anschließend einer Mittelwertbildung mit einem 3 × 3 Kern
unterzogen. Diese gemittelten Schwellwerte werden dann mit einer weiteren 5 × 5
Mittelwertfilterung auf die angrenzenden Pixel ausgedehnt. Pixel, für die noch kein
Schwellwert existiert, werden abschließend mit einem 7 × 7 Kern ausgefüllt. Mittels
bilinearer Interpolation wird das Schwellwertbild zur Quantisierung wieder auf
Originalgröße gebracht. Durch Vergleich des Graustufenbildes mit dem
Schwellwertbild entsteht gem. Fig. 7 ein binäres Quantisierungsbild als Grundlage für
die anschließende Textdetektion (Segmentierung) gem. Fig. 3.
Hierzu werden zunächst alle verbundenen Regionen des gem. Fig. 2 erzeugten
Quantisierungsbildes identifiziert, wobei im Beispiel eine Vierer-Nachbarschaft
angewendet wird. Im Rahmen der anschließenden Größenfilterung werden eine
Mindest- und eine Maximalgröße für jede zu untersuchende Region vorgegeben, die
nicht unter-/überschritten werden darf. Regionen außerhalb dieses Bereiches werden im
weiteren verworfen. Danach erfolgt eine nicht-lineare Kantendetektion durch
Untersuchung aller Randpixel der betreffenden Region mit Hilfe je eines an sich
bekannten horizontalen und vertikalen Sobelfilters und eines Laplacefilters. Die
ermittelte Kantenaktivität wird mit einem Mindestaktivitätswert verglichen und bei
dessen Unterschreitung zu Null gesetzt. Die mittlere und maximale Kantenaktivität
sowie Varianz des Innenbereiches werden in einem nächsten Schritt bestimmt und
anschließend geprüft, ob sowohl die mittlere als auch die maximale Kantenaktivität über
vorgegebenen Mittelwerten liegen und die Varianz des Innenbereiches einen
Maximalwert nicht überschreitet. Bei positivem Ergebnis wird die aktuelle Region als
Vordergrundregion klassifiziert und in das Maskenbild eingetragen. Berührt sie eine
andere bereits eingetragene Vordergrundregion, wird sie als "Loch" registriert. Bei
negativem Ergebnis wird die untersuchte Region als Hintergrundregion in das
Maskenbild eingetragen. Anschließend wird das klassifizierte Maskenbild binärisiert,
indem alle Vordergrundregionen auf "schwarz", die Hintergrundregionen und "Löcher"
auf "weiß" gesetzt werden (Fig. 8). Die Segmentierung des Beispieldokumentes erfolgt
gemäß Modus 1.
Aus dem binären Maskenbild und dem Originalbild wird gem. Fig. 4 das verkleinerte
Vordergrundbild erzeugt, indem alle Vordergrundregionen zunächst um einen Pixel
verdünnt werden und an Hand dieses verdünnten, binären Maskenbildes das Original
auf ein Drittel seiner Größe verkleinert wird. Dazu werden sowohl Maskenbild als auch
Originalbild in Blöcke von 3 × 3-Pixeln zerlegt. Über Anteile der verdünnten
Vordergrundregion innerhalb eines solchen 3 × 3-Blockes wird der Mittelwert dieser
Pixel in das verkleinerte Vordergrundbild übernommen. Enthält der 3 × 3-Block keine
verdünnte Vordergrundregion, wird das entsprechende Pixel zu Null gesetzt. Die
Vordergrundpixel mit Werten größer Null werden anschließend mit einer 5 × 5-
Mittelwertfilterung ausgedehnt und die verbleibenden Pixel mit einem 5 × 5-Kern
ausgefüllt, wobei ein konstanter Grauwert als zusätzlicher Anteil in die
Mittelwertbildung einbezogen wird. Zur Bestimmung des Hintergrundbildes gem. Fig. 5
werden alle zum Hintergrund gehörigen Regionen im binären Maskenbild identifiziert
und die Hintergrundregionen ebenfalls um ein Pixel verdünnt. Anschließend erfolgt die
Zerlegung von Originalbild und verdünnten Maskenbild in 3 × 3-Blöcke. Danach wird
analog dem Verfahrensschritt "Bestimmung des Vordergrundbildes" weiter verfahren.
Das Ergebnis ist in Fig. 10 dargestellt.
Die gemäß Beispiel erzeugten Bilder "Vordergrund", "Hintergrund" und "binäres
Maskenbild" werden anschließend mit an sich bekannten Bildkodern komprimiert, das
Maskenbild beispielsweise mittels "Fax Group 4", Vorder- und Hintergrundbild mittels
Wavelet-Kodierung. Die Dekodierung erfolgt für die drei Teilbilder getrennt, indem die
verkleinerten Vorder- und Hintergrundbilder durch lineare Interpolation auf die Größe
des binären Maskenbildes gebracht werden. Für einen schwarzen Wert des binären
Maskenbildes wird das rekonstruierte Bild aus den Pixeln des Vordergrundbildes, für
einen weißen Wert aus den Pixeln des Hintergrundbildes zusammengesetzt.
Mit dem dargestellten erfindungsgemäßen Datenkompressionsverfahren wird damit die
Kompression gescannter Dokumente ohne Einschränkung an deren Beschaffenheit, wie
beispielsweise heller Hintergrund, rechteckige Abbildungen, exakte Trennung von Bild-
und Textbestandteilen, ermöglicht. Der Aufwand an Rechenzeit und Speicherkapazität
wird hinaus deutlich gesenkt. Darüber hinaus können unterschiedliche
Dokumentenklassen und Bilder erstmalig nach einem einheitlichen Verfahren
komprimiert werden.
Claims (9)
1. Verfahren zur Kompression von gescannten Farb- und/oder
Graustufendokumenten, wobei das digitale Bild des gescannten Dokumentes in drei
Bildebenen, ein Vordergrundbild, ein Hintergrundbild und ein binäres Maskenbild
zerlegt, aus dem Originaldokument ein lokal variables Schwellwertbild hergestellt und
durch Quantisierung (Binärisierung) mit dem Originalbild ein bitonales
Quantisierungsbild erzeugt wird,
dadurch gekennzeichnet,
- - daß die Quantisierung anhand eines definiert verkleinerten Originalbildes durchgeführt wird,
- - daß aus dem Quantisierungsbild und dem Originalbild eine Textdetektion (Segmen tierung) erfolgt, welche das Dokument in Vordergrund- und Hintergrundregionen unterteilt,
- - daß bestimmte Regionen, insbesondere Text und graphische Elemente, dem Vorder grundbild, Texthintergrund und Bilder dem Hintergrundbild zugeordnet werden,
- - daß das Ergebnis der Segmentierung in einem binären Maskenbild von der Größe des Originalbildes abgelegt wird,
- - daß das aus Originalbild und Maskenbild mit gegenüber dem Originalbild reduzierter Auflösung erzeugte Vordergrundbild die Farbigkeit der Vordergrundregionen beschreibt,
- - daß aus Originalbild und bitonalem Maskenbild das Hintergrundbild mit gegenüber dem Originalbild reduzierter Auflösung erzeugt wird, und
- - daß binäres Maskenbild, Vordergrundbild und Hintergrundbild anschließend mit einem an sich bekannten Bildkoder kodiert werden (Fig. 1).
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet,
- - daß die Quantisierung (Binärisierung) des Originaldokumentes in zwei Schritten erfolgt, indem zuerst adaptiv ein lokal variabler Schwellwert aus dem verkleinerten Originalwert bestimmt und danach mit der Grauwertrepräsentation in Größe des Originaldokumentes verglichen wird,
- - daß farbige Originaldokumente in ein Graustufenbild und zwei Farbdifferenz komponentenbilder umgewandelt werden,
- - daß das Graustufenbild durch eine Tiefpaßfilterung mit anschließender Unterabtastung auf eine geeignete Größe verkleinert wird,
- - daß durch lokale Dynamikanalyse des verkleinerten Graustufenbildes ein Dynamikbild erzeugt wird,
- - daß das Dynamikbild mit einer extern vorgebbaren Mindestdynamik verglichen wird, welche die Empfindlichkeit der Quantisierung und der Textdetektion (Segmentierung) steuert,
- - daß bei Überschreiten dieses Mindestwertes aus der Hälfte der Summe aus Minimum-/Maximumbild ein Quantisierungsschwellwert bestimmt wird,
- - daß in Regionen mit zu geringer Dynamik der Quantisierungsschwellwert auf Null gesetzt wird,
- - daß eine Mittelwertbildung für alle Schwellwerte ungleich Null durchgeführt wird und die gemittelten Schwellwerte tiefpaßgefiltert ausgedehnt werden,
- - daß das Schwellwertbild mittels bilinearer Interpolation vergrößert und mit dem Graustufenbild des Originals verglichen wird (Fig. 2).
3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet,
- - daß das binäre Quantisierungsbild und das Originalbild einer Textdetektion (Segmentierung) unterzogen werden, wozu alle verbundenen Regionen eines zulässigen Größenbereiches ausgewählt werden,
- - daß alle verbundenen Regionen des Quantisierungsbildes gleichen Wertes hinsichtlich ihrer Eignung als Vordergrundbestandteile beurteilt werden,
- - daß die als Vordergrund segmentierten Regionen in das binäre Maskenbild eingetragen werden,
- - daß die Segmentierung in Abhängigkeit von Dokumententyp nach vier unterschiedlichen Modi durchführbar ist,
- - daß das im Ergebnis der Segmentierung erzeugte binäre Maskenbild eine Pixel- individuelle Zuordnung aller Dokumentenbereiche in Vorder- und Hintergrundregionen ermöglicht (Fig. 3).
4. Verfahren nach Anspruch 1 bis 3, dadurch gekennzeichnet,
- - daß das verkleinerte Vordergrundbild hergestellt wird, indem sowohl das verdünnte binäre Maskenbild als auch das Originalbild in Blöcke zerlegt und die Mittelwerte der verdünnten Vordergrundregionen dieser Blöcke in das verkleinerte Vordergrundbild eingetragen, ausgedehnt und anschließend die noch nicht bestimmten Regionen des Vordergrundbildes durch Mittelwertbildung über die bestimmten Regionen ausgefüllt werden, wobei ein konstanter Grauwert als zusätzlicher Anteil in die Mittelwertbildung einbezogen wird (Fig. 4).
5. Verfahren nach Anspruch 1 bis 3, dadurch gekennzeichnet,
- - daß das verkleinerte Hintergrundbild hergestellt wird, indem sowohl das verdünnte binäre Hintergrund-Maskenbild als auch das Originalbild in Blöcke zerlegt und die Mittelwerte der verdünnten Hintergrundregionen dieser Blöcke in das verkleinerte Hintergrundbild eingetragen, ausgedehnt und anschließend die noch nicht bestimmten Regionen des Hintergrundbildes durch Mittelwertbildung über die bestimmten Regionen ausgefüllt werden (Fig. 5).
6. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet,
- - daß das Graustufenbild durch Tiefpaßfilterung auf die Hälfte des Originals verkleinert und im Rahmen einer lokalen Dynamikanalyse einer Maximum- /Minimumfilterung mit 3 × 3 Kernen unterzogen wird,
- - daß die mit 3 × 3 Kernen gemittelten Schwellwerte mit einer weiteren 5 × 5 Mittelwertfilterung auf die angrenzenden Pixel ausgedehnt werden,
- - daß die Bereiche ohne Schwellwert abschließend mit einem 7 × 7 Kern ausgefüllt werden.
7. Verfahren nach Anspruch 3, dadurch gekennzeichnet,
- - daß alle Regionen des Quantisierungsbildes nacheinander einer Prüfung unterzogen werden,
- - daß zusammenhängende Regionen des Quantisierungsbildes gleichen Wertes einer Größenfilterung unterzogen werden, welche sehr kleine und sehr große Regionen eliminiert,
- - daß die Ränder der Regionen einer Kantenaktivitätsprüfung unterzogen werden, die Regionen mit geringer Kantenaktivität eliminiert,
- - daß der Innenbereich der Regionen einer Varianzbestimmung unterzogen wird, die Regionen zu Varianz eliminiert,
- - daß die erhaltenen Regionen als Vordergrund klassifiziert werden, sofern sie keine andere Textregion berühren.
8. Verfahren nach Anspruch 3, dadurch gekennzeichnet,
- - daß die Verfahrensschritte der Segmentierung (Fig. 3) nach einem ersten Modus für normalen und inversen Text durch Untersuchung weißer und schwarzer verbundener Regionen des Quantisierungsbildes durchgeführt werden,
- - daß die Verfahrensschritte der Segmentierung (Fig. 3) nach einem zweiten Modus durchgeführt werden, der nur die schwarzen verbundenen Regionen des Quanti sierungsbildes untersucht,
- - daß die Verfahrensschritte der Segmentierung (Fig. 3) nach einem dritten Modus durchgeführt werden, der alle schwarzen Regionen des Quantisierungsbildes automatisch als Vordergrundregion registriert,
- - daß die Verfahrensschritte der Segmentierung (Fig. 3) nach einem vierten Modus als Bildcodierung durchgeführt werden, indem alle Pixel direkt als Hintergrundpixel klassifiziert werden.
9. Verfahren nach Ansprüchen 1, 4 und 5, dadurch gekennzeichnet,
- - daß das binäre Maskenbild und das Originalbild in Blöcke der Größe 3 × 3 Pixel unterteilt werden,
- - daß für jeden Block der Mittelwert derjenigen Pixel des Originalbildes gebildet wird, die zur verdünnten Vordergrund- bzw. Hintergrundregion gehören,
- - daß die bestimmten Vordergrund- bzw. Hintergrundpixelintensitäten mit einem 5 × 5 Mittelwertfilter auf angrenzende Pixel ausgedehnt werden,
- - daß die verbleibenden Pixel mit einem weiteren 5 × 5 Mittelwertfilter ausgefüllt werden,
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19958553A DE19958553A1 (de) | 1999-12-04 | 1999-12-04 | Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten |
US09/456,875 US6731800B1 (en) | 1999-12-04 | 1999-12-08 | Method for compressing scanned, colored and gray-scaled documents |
CA002327238A CA2327238A1 (en) | 1999-12-04 | 2000-12-01 | Method for compressing scanned colored and gray-scale documents |
JP2000368616A JP2001223903A (ja) | 1999-12-04 | 2000-12-04 | 走査された色付きおよびグレースケールの文書を圧縮する方法 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19958553A DE19958553A1 (de) | 1999-12-04 | 1999-12-04 | Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten |
US09/456,875 US6731800B1 (en) | 1999-12-04 | 1999-12-08 | Method for compressing scanned, colored and gray-scaled documents |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19958553A1 true DE19958553A1 (de) | 2001-06-07 |
Family
ID=32826353
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19958553A Withdrawn DE19958553A1 (de) | 1999-12-04 | 1999-12-04 | Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten |
Country Status (4)
Country | Link |
---|---|
US (1) | US6731800B1 (de) |
JP (1) | JP2001223903A (de) |
CA (1) | CA2327238A1 (de) |
DE (1) | DE19958553A1 (de) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1555804A2 (de) * | 2004-01-19 | 2005-07-20 | Ricoh Company, Ltd. | Bildverarbeitungsvorrichtung, Bildverarbeitungsprogramm und Speichermedium |
EP1587298A1 (de) * | 2004-02-12 | 2005-10-19 | Xerox Corporation | System und Verfahren zur Anpassung von Bilddaten zur Erzeugung hochkomprimierbarer Bildebenen |
DE102006010763A1 (de) * | 2006-03-08 | 2007-09-13 | Netviewer Gmbh | Hybrides Bildkompressionsverfahren |
Families Citing this family (99)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6880122B1 (en) * | 1999-05-13 | 2005-04-12 | Hewlett-Packard Development Company, L.P. | Segmenting a document into regions associated with a data type, and assigning pipelines to process such regions |
GB2358098A (en) * | 2000-01-06 | 2001-07-11 | Sharp Kk | Method of segmenting a pixelled image |
JP4189506B2 (ja) * | 2000-06-09 | 2008-12-03 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理のための装置、方法及び記録媒体 |
US6977751B1 (en) * | 2000-06-30 | 2005-12-20 | Silverbrook Research Pty Ltd | Print engine/controller to work in multiples and a printhead driven by multiple print engine/controllers |
US6901169B2 (en) | 2001-02-01 | 2005-05-31 | At & T Corp. | Method and system for classifying image elements |
JP2002369010A (ja) * | 2001-06-05 | 2002-12-20 | Nec Corp | 画像符号化装置及び画像復号装置 |
US6842541B2 (en) * | 2001-10-31 | 2005-01-11 | Xerox Corporation | Adaptive color super resolution thresholding |
US7043077B2 (en) * | 2001-11-07 | 2006-05-09 | International Business Machines Corporation | System and method for efficient compression of raster image data |
US6898316B2 (en) * | 2001-11-09 | 2005-05-24 | Arcsoft, Inc. | Multiple image area detection in a digital image |
JP4169522B2 (ja) * | 2002-03-22 | 2008-10-22 | 株式会社リコー | 画像処理装置、画像処理プログラム及びこのプログラムを記憶する記憶媒体 |
US7043079B2 (en) * | 2002-04-25 | 2006-05-09 | Microsoft Corporation | “Don't care” pixel interpolation |
US7024039B2 (en) * | 2002-04-25 | 2006-04-04 | Microsoft Corporation | Block retouching |
US7392472B2 (en) * | 2002-04-25 | 2008-06-24 | Microsoft Corporation | Layout analysis |
US7164797B2 (en) * | 2002-04-25 | 2007-01-16 | Microsoft Corporation | Clustering |
US7120297B2 (en) * | 2002-04-25 | 2006-10-10 | Microsoft Corporation | Segmented layered image system |
US7110596B2 (en) * | 2002-04-25 | 2006-09-19 | Microsoft Corporation | System and method facilitating document image compression utilizing a mask |
US7263227B2 (en) * | 2002-04-25 | 2007-08-28 | Microsoft Corporation | Activity detector |
EP1388815A3 (de) * | 2002-04-25 | 2005-11-16 | Microsoft Corporation | Geschichtetes Bildsegmentierungssystem |
US6941011B2 (en) * | 2002-06-27 | 2005-09-06 | Hewlett-Packard Development Company, Lp. | Method and system for image processing including mixed resolution, multi-channel color compression, transmission and decompression |
JP4460447B2 (ja) * | 2002-06-28 | 2010-05-12 | ノキア コーポレイション | 情報端末 |
US6987882B2 (en) * | 2002-07-01 | 2006-01-17 | Xerox Corporation | Separation system for Multiple Raster Content (MRC) representation of documents |
US7242802B2 (en) * | 2002-07-01 | 2007-07-10 | Xerox Corporation | Segmentation method and system for Multiple Raster Content (MRC) representation of documents |
US7227988B2 (en) * | 2002-07-01 | 2007-06-05 | Xerox Corporation | Prioritized PDL segmentation producing two bit selector |
US7356183B2 (en) * | 2002-07-01 | 2008-04-08 | Xerox Corporation | Segmentation method and system for multiple raster content (MRC) representation of documents |
US7606417B2 (en) * | 2004-08-16 | 2009-10-20 | Fotonation Vision Limited | Foreground/background segmentation in digital images with differential exposure calculations |
US7680342B2 (en) | 2004-08-16 | 2010-03-16 | Fotonation Vision Limited | Indoor/outdoor classification in digital images |
TWI335549B (en) * | 2003-07-01 | 2011-01-01 | Xerox Corp | Segmentation method and system for multiple raster content (mrc) representation of documents |
JP2005064704A (ja) * | 2003-08-08 | 2005-03-10 | Ricoh Co Ltd | 画像処理装置、プログラム及び記憶媒体 |
US7430335B2 (en) * | 2003-08-13 | 2008-09-30 | Apple Inc | Pre-processing method and system for data reduction of video sequences and bit rate reduction of compressed video sequences using spatial filtering |
US7403568B2 (en) * | 2003-08-13 | 2008-07-22 | Apple Inc. | Pre-processing method and system for data reduction of video sequences and bit rate reduction of compressed video sequences using temporal filtering |
US7561753B2 (en) * | 2004-01-09 | 2009-07-14 | The Boeing Company | System and method for comparing images with different contrast levels |
US7379594B2 (en) * | 2004-01-28 | 2008-05-27 | Sharp Laboratories Of America, Inc. | Methods and systems for automatic detection of continuous-tone regions in document images |
US7991238B2 (en) | 2004-04-30 | 2011-08-02 | Neiversan Networks Co. Llc | Adaptive compression of multi-level images |
US20050244060A1 (en) * | 2004-04-30 | 2005-11-03 | Xerox Corporation | Reformatting binary image data to generate smaller compressed image data size |
US8204306B2 (en) * | 2004-06-14 | 2012-06-19 | Xerox Corporation | Method for image segmentation based on block clustering for improved processing of touching characters |
US6992686B2 (en) * | 2004-06-14 | 2006-01-31 | Xerox Corporation | System and method for dynamic control of file size |
US7283674B2 (en) * | 2004-06-25 | 2007-10-16 | Xerox Corporation | Using graphic objects in MFD scan-to-export function |
KR100643759B1 (ko) * | 2004-12-01 | 2006-11-10 | 삼성전자주식회사 | 문서 압축 장치 및 그 방법 |
EP1670257B1 (de) | 2004-12-10 | 2018-09-26 | Ricoh Company, Ltd. | Komprimierung eines mehrwertigen Bildes mittels Steuerung der Speicherplatzanforderung |
US7359552B2 (en) * | 2004-12-15 | 2008-04-15 | Mitsubishi Electric Research Laboratories, Inc. | Foreground detection using intrinsic images |
KR100599141B1 (ko) * | 2005-05-20 | 2006-07-12 | 삼성전자주식회사 | 문서 압축시스템 및 그 압축방법 |
JP2007306513A (ja) * | 2005-07-13 | 2007-11-22 | Konica Minolta Business Technologies Inc | 画像データの圧縮方法および装置 |
JP4533273B2 (ja) * | 2005-08-09 | 2010-09-01 | キヤノン株式会社 | 画像処理装置及び画像処理方法、プログラム |
US9247090B2 (en) * | 2005-10-20 | 2016-01-26 | Hewlett-Packard Development Company, L.P. | Printing and printers |
JP4469330B2 (ja) * | 2005-12-07 | 2010-05-26 | 株式会社リコー | 画像処理装置、画像処理方法、画像処理プログラム、記録媒体及び画像形成装置 |
US7379593B2 (en) * | 2005-12-21 | 2008-05-27 | Xerox Corporation | Method for image segmentation from proved detection of background and text image portions |
US7729546B2 (en) * | 2005-12-23 | 2010-06-01 | Lexmark International, Inc. | Document segmentation for mixed raster content representation |
US7692696B2 (en) | 2005-12-27 | 2010-04-06 | Fotonation Vision Limited | Digital image acquisition system with portrait mode |
IES20060559A2 (en) | 2006-02-14 | 2006-11-01 | Fotonation Vision Ltd | Automatic detection and correction of non-red flash eye defects |
DE602006002242D1 (de) * | 2006-02-15 | 2008-09-25 | Jaycrypto Ltd | Verfahren und Vorrichtung zum Erzeugen von Initialwerten für einen Zufallszahlengenerator |
US7792359B2 (en) * | 2006-03-02 | 2010-09-07 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting regions in digital images |
US7889932B2 (en) * | 2006-03-02 | 2011-02-15 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting regions in digital images |
US8630498B2 (en) * | 2006-03-02 | 2014-01-14 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting pictorial regions in digital images |
JP2007300601A (ja) * | 2006-04-07 | 2007-11-15 | Konica Minolta Business Technologies Inc | 画像データの圧縮方法およびその装置 |
US8019171B2 (en) | 2006-04-19 | 2011-09-13 | Microsoft Corporation | Vision-based compression |
IES20060564A2 (en) | 2006-05-03 | 2006-11-01 | Fotonation Vision Ltd | Improved foreground / background separation |
US8306336B2 (en) * | 2006-05-17 | 2012-11-06 | Qualcomm Incorporated | Line or text-based image processing tools |
JP4732250B2 (ja) * | 2006-06-14 | 2011-07-27 | キヤノン株式会社 | 情報処理装置、制御方法、およびコンピュータプログラム |
US8437054B2 (en) * | 2006-06-15 | 2013-05-07 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying regions of substantially uniform color in a digital image |
US7864365B2 (en) * | 2006-06-15 | 2011-01-04 | Sharp Laboratories Of America, Inc. | Methods and systems for segmenting a digital image into regions |
JP4333708B2 (ja) * | 2006-08-02 | 2009-09-16 | コニカミノルタビジネステクノロジーズ株式会社 | 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム |
US7876959B2 (en) * | 2006-09-06 | 2011-01-25 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text in digital images |
US7840071B2 (en) * | 2006-12-12 | 2010-11-23 | Seiko Epson Corporation | Method and apparatus for identifying regions of different content in an image |
US8254680B2 (en) * | 2007-01-24 | 2012-08-28 | Samsung Electronics Co., Ltd. | Apparatus and method of segmenting an image in an image coding and/or decoding system |
US7856142B2 (en) * | 2007-01-26 | 2010-12-21 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting character content in a digital image |
US8068684B2 (en) * | 2007-05-04 | 2011-11-29 | I.R.I.S. | Compression of digital images of scanned documents |
US20090041344A1 (en) * | 2007-08-08 | 2009-02-12 | Richard John Campbell | Methods and Systems for Determining a Background Color in a Digital Image |
US7899248B2 (en) * | 2007-08-30 | 2011-03-01 | Seiko Epson Corporation | Fast segmentation of images |
US7936923B2 (en) * | 2007-08-31 | 2011-05-03 | Seiko Epson Corporation | Image background suppression |
US8155437B2 (en) * | 2007-09-07 | 2012-04-10 | CVISION Technologies, Inc. | Perceptually lossless color compression |
US8121403B2 (en) * | 2007-10-30 | 2012-02-21 | Sharp Laboratories Of America, Inc. | Methods and systems for glyph-pixel selection |
US8270716B2 (en) | 2007-12-04 | 2012-09-18 | Ricoh Company, Limited | Selectively compressing picture and text areas of an image to maintain highest quality and effective compaction |
US8548251B2 (en) * | 2008-05-28 | 2013-10-01 | Apple Inc. | Defining a border for an image |
US8391638B2 (en) | 2008-06-04 | 2013-03-05 | Microsoft Corporation | Hybrid image format |
US8189917B2 (en) * | 2008-09-25 | 2012-05-29 | Sharp Laboratories Of America, Inc. | Methods and systems for locating text in a digital image |
US8594466B2 (en) * | 2008-11-11 | 2013-11-26 | Sharp Kabushiki Kaisha | Image data converting device, method for converting image data, program and storage medium |
US9521994B2 (en) * | 2009-05-11 | 2016-12-20 | Siemens Healthcare Gmbh | System and method for image guided prostate cancer needle biopsy |
JP5413080B2 (ja) * | 2009-09-15 | 2014-02-12 | 株式会社リコー | 画像処理装置及び画像処理方法 |
KR101710883B1 (ko) * | 2009-11-04 | 2017-02-28 | 삼성전자주식회사 | 필터 정보를 이용한 영상 압축 장치 및 방법과 영상 복원 장치 및 방법 |
KR101058726B1 (ko) * | 2009-11-11 | 2011-08-22 | 삼성전자주식회사 | 조명 성분을 제거하기 위한 이미지 보정 장치 및 방법 |
US8000528B2 (en) * | 2009-12-29 | 2011-08-16 | Konica Minolta Systems Laboratory, Inc. | Method and apparatus for authenticating printed documents using multi-level image comparison based on document characteristics |
US8340363B2 (en) | 2010-05-27 | 2012-12-25 | Palo Alto Research Center Incorporated | System and method for efficient interpretation of images in terms of objects and their parts |
US8582834B2 (en) | 2010-08-30 | 2013-11-12 | Apple Inc. | Multi-image face-based image processing |
US8760464B2 (en) | 2011-02-16 | 2014-06-24 | Apple Inc. | Shape masks |
US8331670B2 (en) * | 2011-03-22 | 2012-12-11 | Konica Minolta Laboratory U.S.A., Inc. | Method of detection document alteration by comparing characters using shape features of characters |
US8457426B1 (en) | 2011-05-18 | 2013-06-04 | Adobe Systems Incorporated | Method and apparatus for compressing a document using pixel variation information |
US8699815B2 (en) * | 2011-05-31 | 2014-04-15 | Adobe Systems Incorporated | Methods and apparatus for improved display of foreground elements |
BE1022166B1 (fr) * | 2014-12-23 | 2016-02-23 | I.R.I.S. | Procede de compression d'images |
US10303498B2 (en) | 2015-10-01 | 2019-05-28 | Microsoft Technology Licensing, Llc | Performance optimizations for emulators |
CN105550633B (zh) * | 2015-10-30 | 2018-12-11 | 小米科技有限责任公司 | 区域识别方法及装置 |
JP2017184197A (ja) * | 2016-03-31 | 2017-10-05 | 船井電機株式会社 | 印刷装置 |
CN108229344A (zh) * | 2017-12-19 | 2018-06-29 | 深圳市商汤科技有限公司 | 图像处理方法和装置、电子设备、计算机程序和存储介质 |
CN109960789B (zh) * | 2017-12-22 | 2023-01-24 | 广州帷策智能科技有限公司 | 基于自然语言处理的人物关系分析方法 |
WO2019133986A1 (en) * | 2017-12-30 | 2019-07-04 | Wu Yecheng | Printing white features of an image using a print device |
CN110365929B (zh) * | 2018-04-10 | 2021-01-05 | 北京仁光科技有限公司 | 信息传输方法、装置、设备、系统及存储介质 |
US11231918B1 (en) | 2020-08-31 | 2022-01-25 | Microsoft Technologly Licensing, LLC | Native emulation compatible application binary interface for supporting emulation of foreign code |
US11403100B2 (en) | 2020-08-31 | 2022-08-02 | Microsoft Technology Licensing, Llc | Dual architecture function pointers having consistent reference addresses |
US11042422B1 (en) | 2020-08-31 | 2021-06-22 | Microsoft Technology Licensing, Llc | Hybrid binaries supporting code stream folding |
CN114915788B (zh) * | 2022-07-19 | 2022-09-13 | 中科金勃信(山东)科技有限公司 | 一种用于档案的图像压缩方法、系统及介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4916744A (en) | 1985-12-10 | 1990-04-10 | Fuji Photo Film Co., Ltd. | Image signal processing method |
US4924521A (en) | 1987-12-18 | 1990-05-08 | International Business Machines Corporation | Image processing system and method employing combined black and white and gray scale image data |
US4873577A (en) | 1988-01-22 | 1989-10-10 | American Telephone And Telegraph Company | Edge decomposition for the transmission of high resolution facsimile images |
JPH02177766A (ja) | 1988-12-28 | 1990-07-10 | Canon Inc | 2値画像の階層的符号化方式 |
GB9006080D0 (en) | 1990-03-17 | 1990-05-16 | Int Computers Ltd | Progressive encoding |
WO1996024114A2 (en) | 1995-01-31 | 1996-08-08 | United Parcel Service Of America, Inc. | Method and apparatus for separating foreground from background in images containing text |
US5778092A (en) | 1996-12-20 | 1998-07-07 | Xerox Corporation | Method and apparatus for compressing color or gray scale documents |
-
1999
- 1999-12-04 DE DE19958553A patent/DE19958553A1/de not_active Withdrawn
- 1999-12-08 US US09/456,875 patent/US6731800B1/en not_active Expired - Lifetime
-
2000
- 2000-12-01 CA CA002327238A patent/CA2327238A1/en not_active Abandoned
- 2000-12-04 JP JP2000368616A patent/JP2001223903A/ja not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1555804A2 (de) * | 2004-01-19 | 2005-07-20 | Ricoh Company, Ltd. | Bildverarbeitungsvorrichtung, Bildverarbeitungsprogramm und Speichermedium |
EP1587298A1 (de) * | 2004-02-12 | 2005-10-19 | Xerox Corporation | System und Verfahren zur Anpassung von Bilddaten zur Erzeugung hochkomprimierbarer Bildebenen |
US7366357B2 (en) | 2004-02-12 | 2008-04-29 | Xerox Corporation | Systems and methods for adjusting image data to form highly compressible image planes |
CN1655578B (zh) * | 2004-02-12 | 2011-09-07 | 施乐公司 | 调整图像数据以形成高度可压缩图像平面的系统和方法 |
DE102006010763A1 (de) * | 2006-03-08 | 2007-09-13 | Netviewer Gmbh | Hybrides Bildkompressionsverfahren |
Also Published As
Publication number | Publication date |
---|---|
CA2327238A1 (en) | 2001-06-04 |
JP2001223903A (ja) | 2001-08-17 |
US6731800B1 (en) | 2004-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE19958553A1 (de) | Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten | |
DE4242796C2 (de) | Hocheffizientes Kodierverfahren für mit Zweipegelbildern vermischte natürliche Bilder | |
DE3940682C2 (de) | Codiervorrichtung und System, bestehend aus einer Codiervorrichtung und einer Decodiervorrichtung für digitale Bilddaten | |
DE69333288T2 (de) | Verbesserte vektorquantisierung | |
DE69832411T2 (de) | Speicherverwaltungssystem für bilddokumenten-datenbank | |
EP0283715B1 (de) | Verfahren zur Codierung von Bildsignalen | |
DE60119632T2 (de) | Erzeugung von nicht schichtgerechten Pixeln für eine Schicht eines aufgespalteten Bildes | |
DE69627982T2 (de) | Signaladaptives Nachverarbeitungssystem um Blockierungseffekte und Ringstörungen zu verringern | |
DE69738494T2 (de) | Videokodierungs- und Videodekodierungsvorrichtung | |
DE69738515T2 (de) | Vorrichtung und verfahren für hybride kompression von rasterdaten | |
EP1104916B1 (de) | Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten | |
DE19744898A1 (de) | Signaladaptives Filterverfahren und signaladaptives Filter | |
DE19739266B4 (de) | Verfahren und Vorrichtung zum Kodieren binärer Formen | |
DE19814892A1 (de) | Signaladaptives Filterverfahren zur Verringerung von Überschwingrauschen und signaladaptives Filter | |
DE602004001993T2 (de) | Transformations basiertes restbewegungsrahmen kodierungsverfahren mit übervollständiger basis und zugehörige vorrichtung zur videokompression | |
EP1425920B1 (de) | Verfahren zur videocodierung und computerprogrammprodukt | |
EP0042981B1 (de) | Verfahren zur Codierung von elektrischen Signalen, die bei der Abtastung eines grafischen Musters mit aus Text und Bildern gemischtem Inhalt gewonnen werden | |
EP1374559B1 (de) | Verfahren zur komprimierung und dekomprimierung von bilddaten | |
DE69725280T2 (de) | Kompressionsgerät mit arithmetischer Kodierung unter Verwendung eines kontextualen Models, das zu variablen Musterlängen in binären Bilddaten adaptiv ist | |
DE69936304T2 (de) | Bereichsbasierte skalierbare bildkodierung | |
DE69934194T2 (de) | Verfahren und Vorrichtung zur elektronischen Datenkompression | |
EP2294825B1 (de) | Vorrichtung und verfahren zum codieren und decodieren einer mehrzahl von fliesskommawerten | |
DE19944213C1 (de) | Verfahren zum Komprimieren eines digitalen Bildes mit mehreren Bit-Ebenen | |
EP0981910B1 (de) | Verfahren und vorrichtung zur codierung eines digitalisierten bildes | |
DE19524008C2 (de) | Kodiervorrichtung für Bi-Pegel-Bilder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8127 | New person/name/address of the applicant |
Owner name: ALGOVISION LURATECH GMBH, 10587 BERLIN, DE |
|
8127 | New person/name/address of the applicant |
Owner name: LURA TECH IMAGING GMBH, 42855 REMSCHEID, DE |
|
8110 | Request for examination paragraph 44 | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |
Effective date: 20120703 |