DE19958553A1 - Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten - Google Patents

Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten

Info

Publication number
DE19958553A1
DE19958553A1 DE19958553A DE19958553A DE19958553A1 DE 19958553 A1 DE19958553 A1 DE 19958553A1 DE 19958553 A DE19958553 A DE 19958553A DE 19958553 A DE19958553 A DE 19958553A DE 19958553 A1 DE19958553 A1 DE 19958553A1
Authority
DE
Germany
Prior art keywords
image
regions
foreground
background
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE19958553A
Other languages
English (en)
Inventor
Kai Uwe Barthel
Simon Mcpartlin
Michael Thierschmann
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lura Tech Imaging 42855 Remscheid De GmbH
Original Assignee
Luratech Gesellschaft fur Luft- und Raumfahrttechnologie & Multimedia Mbh
LURATECH GES fur LUFT und RAU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Luratech Gesellschaft fur Luft- und Raumfahrttechnologie & Multimedia Mbh, LURATECH GES fur LUFT und RAU filed Critical Luratech Gesellschaft fur Luft- und Raumfahrttechnologie & Multimedia Mbh
Priority to DE19958553A priority Critical patent/DE19958553A1/de
Priority to US09/456,875 priority patent/US6731800B1/en
Priority to CA002327238A priority patent/CA2327238A1/en
Priority to JP2000368616A priority patent/JP2001223903A/ja
Publication of DE19958553A1 publication Critical patent/DE19958553A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Color Television Systems (AREA)
  • Processing Of Color Television Signals (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten, wobei das digitale Bild des gescannten Dokuments in drei Bildebenen - ein Vordergrundbild, ein Hintergrundbild und ein binäres Maskenbild - zerlegt wird. DOLLAR A Zunächst wird aus dem definiert verkleinerten Originaldokument mit einem adaptiven Schwellwertverfahren ein lokal variables Schwellwertbild erzeugt und wieder auf die Größe des Originaldokumentes gebracht. Das Originalbild wird anschließend mit diesem Schwellwertbild quantisiert, um ein bitonales Quantisierungsbild herzustellen. Danach erfolgt eine Textdetektion (Segmentierung), welche das Dokument in Vordergrund- und Hintergrundregionen unterteilt und das Ergebnis der Segmentierung in einem binären Maskenbild ablegt. Aus dem Originalbild und dem Maskenbild werden ein Vorder- und ein Hintergrundbild hergestellt und die drei Bilder anschließend jeweils mit einem geeigneten Bildkoder kodiert.

Description

Die Erfindung betrifft ein Verfahren zur Kompression von gescannten Farb- bzw. Graustufendokumenten, wobei das digitale Bild des gescannten Dokuments in drei Bildebenen zerlegt wird. Diese Bildebenen sind ein Vordergrundbild, ein Hintergrundbild und ein binäres Maskenbild. Das Maskenbild beschreibt, welche Bereiche des Dokuments zum Vordergrund bzw. zum Hintergrund gehören.
Bestandteile des Vordergrundes sind Text und graphische Elemente. Die Farbigkeit bzw. die Intensität dieser Vordergrundbereiche wird durch das Vordergrundbild beschrieben. Zu den Hintergrundbereichen zählen der Texthintergrund sowie die im Dokument enthaltenen Bilder. Die Farb- bzw. Helligkeitsinformation des Hintergrundes sowie die in dem Dokument enthaltenen Bilder sind im Hintergrundbild enthalten. Jedes der drei Bilder wird für sich mit einem geeigneten Bildkodierungsverfahren kodiert. Bei der Dekodierung wird das Dokument aus dem Vordergrund- und Hintergrundbild wieder zusammengesetzt. Hierbei beschreibt das binäre Maskenbild, in welchen Bereichen das rekonstruierte Dokument aus dem Vordergrundbild bzw. aus dem Hintergrundbild zu erzeugen ist.
Bei geeigneter Zerlegung des Dokuments in die beschriebenen drei Bildebenen lassen sich mit dieser Repräsentation deutlich bessere Kompressionsergebnisse als mit Bildkodierungsverfahren erzielen, die das Dokument als Ganzes kodieren. Die Erfindung beschreibt ein neues Verfahren zur Bestimmung des binären Maskenbildes sowie eine Methode zur effizienten Zerlegung des Originaldokuments in die Vordergrund- und Hintergrundbilder. Hierbei werden keinerlei spezielle Annahmen über Art oder Aufbau des Dokuments vorausgesetzt.
Stand der Technik
Dokumente, die mit hohen Auflösungen gescannt werden, benötigen sehr viel Speicherplatz für die anfallenden digitalen Bilddaten. So ergeben sich bei einem 300 dpi Scan einer farbigen A4-Seite ca. 25 Millionen Bytes, bei einem farbigen 600 dpi Scan sogar ca. 100 Millionen Bytes. Dokumente mit Datenmengen dieser Größenordnung lassen sich unkomprimiert nur in geringen Mengen archivieren, eine Übertragung über Netzwerke mit niedrigen Übertragungsraten ist praktisch unmöglich.
Verlustlose Kompressionsverfahren wie der verlustlose Modus des JPEG-Standards (JPEG-LS) oder Lempel-Ziv Welch (LZW) ermöglichen nur sehr geringe Kompressionsfaktoren. Höhere Kompressionsfaktoren sind nur durch den Einsatz verlustbehafteter Kompressionsverfahren möglich. Als Standardverfahren ist das DCT- basierte "JPEG-Verfahren" der Joint Pictures Expert Group zu nennen. Jedoch weder das JPEG-Verfahren noch neuere, bessere Wavelet-basierte Kompressionsverfahren lassen sich für die hochgradige Kompression von gescannten Dokumenten einsetzen. Diese reinen Bildkompressionsverfahren setzen die Statistik von typischen Bildsignalen voraus, die durch eine hohe örtliche Korrelation gekennzeichnet ist. Da bei gescannten Dokumenten diese Annahmen nicht zutreffen, werden bei hohen Kompressionsfaktoren die textuellen Anteil der Dokumente derart stark verändert, daß ein Lesen des Textes unmöglich wird. Gegenwärtig werden Dokumente zur Archivierung üblicherweise binär gescannt und mit den CCITT Fax-Kompressionsstandards "Fax Group 32" bzw. "Fax Group 4" komprimiert. Bei diesen rein binären Kompressionsverfahren bleibt die Lesbarkeit im allgemeinen erhalten, jedoch gehen die Helligkeits- und Farbinformationen der Bildanteile vollständig verloren.
Ein neuer Ansatz, der diese Probleme umgeht, ist der aktuell in der Planung befindliche Mixed Raster Content Standard (MRC) (ITU Empfehlung T.44). Danach ist es möglich, ein Dokument in Regionen unterschiedlicher örtlicher Auflösung zu unterteilen, die auf unterschiedliche Weise kodiert werden können. Ein Modus des MRC-Standards ist ein Multilayerkodierungsmodus, der eine Zerlegung des Dokuments in die drei zuvor beschrieben Ebenen vorsieht. Im MRC-Standard wird jedoch ausschließlich der Dekodierungsprozeß eindeutig festgelegt, es gibt keine Vorgaben, wie die Zerlegung des Dokuments in die drei Bildebenen bei der Kodierung zu realisieren ist. Ein Verfahren, welches diesen Multilayerkodierungsmodus verwendet, ist in US Patent Nummer 5,779,092 beschrieben. Es setzt jedoch Bedingungen voraus, die in vielen zu bearbeitenden Dokumenten nicht anzutreffen sind: Die Form von Bildern wird grundsätzlich als rechteckig vorausgesetzt. Eine Hinterlegung von Text mit Hintergrundbildern bzw. das Vorhandensein von Text innerhalb von Bildern ist nicht vorgesehen. Weiterhin muß der Dokumentenhintergrund grundsätzlich weiß bzw. hell sein.
Ziel der Erfindung ist es, die Kompression gescannter Dokumente ohne Einschränkungen an die Beschaffenheit der Vorlagen, wie heller Hintergrund, rechteckige Abbildungen, exakte Trennung von Bild- und Textbestandteilen, zu ermöglichen. Darüber hinaus soll der Aufwand an Rechenzeit und Speicherkapazität deutlich gesenkt werden. Weiterhin sollen unterschiedliche Dokumentenklassen und Bilder über wenige Steuerparameter nach einem einheitlichen Verfahren komprimiert werden.
Ausgehend von der Repräsentation des Dokuments in den drei Ebenen - Vordergrund-, Hintergrund- und Maskenbild - ist der grundsätzliche Ablauf des erfindungsgemäßen Kompressionsverfahrens im Hauptanspruch 1 dargestellt. Detaillierte, vorteilhafte Ausgestaltungen der aufeinanderfolgenden Verfahrensschritte sind in den Unteransprüchen 2 bis 9 enthalten.
Zunächst wird aus dem definiert verkleinerten Originaldokument mit einem adaptiven Schwellwertverfahren ein lokal variables Schwellwertbild erzeugt und wieder auf die Größe des Originaldokumentes gebracht. Das Originalbild wird anschließend mit diesem Schwellwertbild quantisiert, um ein bitonales Quantisierungsbild herzustellen. Anhand dieses Quantisierungsbildes und dem Originalbild wird danach eine Textdetektion (Segmentierung) durchgeführt, welche das Dokument in Vordergrund- und Hintergrundregionen unterteilt. Hierbei werden Regionen wie Text und graphische Elemente dem Vordergrundbild, Texthintergrund und Bilder dem Hintergrundbild zugeordnet. Das Ergebnis dieser Segmentierung wird im binären Maskenbild abgelegt. Das binäre Maskenbild hat die gleiche Größe bzw. Auflösung wie das Originalbild. Anschließend wird aus dem Originalbild und dem Maskenbild das Vordergrundbild erzeugt, welches die Farbigkeit der Vordergrundregionen beschreibt. Dieses Vordergrundbild besitzt eine gegenüber dem Originalbild reduzierte Auflösung. Aus dem Komplement des bitonalen Maskenbildes und dem Originalbild wird danach das Hintergrundbild wiederum mit verringerter Auflösung erzeugt. Die drei Bilder werden anschließend jeweils mit einem geeigneten Bildkoder kodiert.
Die Quantisierung bzw. Binärisierung des Originaldokuments geschieht in zwei Schritten: Zunächst wird mit einem adaptiven Verfahren ein lokal variabler Schwellwert bestimmt. Der Vergleich der Grauwertrepräsentation des Originaldokuments mit diesem Schwellwert liefert das binäre Quantisierungsbild.
Liegt das Originaldokument als farbiges Dokument vor, wird es zunächst in ein Graustufenbild und zwei Farbdifferenzkomponentenbilder umgewandelt. Zur Bestimmung des lokal variablen Schwellwertbildes wird das Graustufenbild verwendet. Das Graustufenbild, welches normalerweise mit einer Auflösung von 150 bis 600 dpi vorliegt, wird auf eine geeignete Größe verkleinert. Hierzu wird eine Tiefpaßfilterung mit anschließender Unterabtastung durchgeführt. Durch die Verkleinerung werden örtliche Störungen des Originalscans wie Rauschen, Dither- oder Rastereffekte verringert, wodurch sich verläßlichere Schwellwerte bestimmen lassen. Weiterhin wird hierdurch der Rechenaufwand zur Bestimmung der Schwellwerte reduziert.
Als nächstes wird eine lokale Dynamikanalyse durchgeführt. Hierzu wird das verkleinerte Graustufenbild einer Minimum- und Maximumfilterung unterzogen.
Die Differenz aus Maximum- und Minimumbild erzeugt ein Dynamikbild, welches Hinweise auf Regionen mit starken Kanten, z. B. in Textregionen, liefert.
Das Dynamikbild wird im nächsten Schritt mit einer extern vorgebbaren Mindestdynamik verglichen, welche die Empfindlichkeit der Quantisierung und der Textdetektion steuert. In Regionen, deren Dynamik diesen Mindestwert überschreitet, wird ein Quantisierungsschwellwert bestimmt, der sich aus der Hälfte der Summe aus Minimum- und Maximumbild berechnet. In Regionen, deren Dynamik zu gering ist, wird der Quantisierungsschwellwert zunächst auf Null gesetzt.
Da die so bestimmten Schwellwerte starken örtlichen Schwankungen unterliegen und ihre Maxima jeweils im helleren Bereich einer Kante zu finden sind, wird als nächster Schritt eine Mittelwertbildung für alle Schwellwerte ungleich Null durchgeführt. Diese gemittelten Schwellwerte werden jetzt auf angrenzende Pixel ausgedehnt.
Im letzten Schritt werden alle verbleibenden Pixel, für die noch keine Schwellwert existiert, mit einem Kern ausgefüllt, der aus dem Mittelwert über alle Werte ungleich Null gebildet wird. Neu berechnete Werte werden direkt in das Schwellwertbild zurückgeschrieben, wodurch es möglich ist, für alle Pixel des Bildes einen Schwellwert mit nur einem Durchlauf zu bestimmen.
Da das jetzt bestimmte Schwellwertbild kleiner als das Originaldokument ist, muß es zur Quantisierung wieder auf die Originalgröße gebracht werden. Die Vergrößerung erfolgt mittels bilinearer Interpolation. Hierdurch ergeben sich bei der anschließend durchgeführten Quantisierung weniger Störungen als bei einer einfachen Vergrößerung durch Pixelwiederholungen, was zu verbesserten Kodierungsergebnissen für das im folgenden erzeugte binäre Maskenbild führt.
Das erzeugte binäre Quantisierungsbild ist Ausgangspunkt für den zweiten Bereich des erfindungsgemäßen Verfahrens, die Textdetektion.
Ziel der Textdetektion (Segmentierung) ist es, das binäre Maskenbild zu erzeugen, welches eine Pixel-individuelle Zuordnung in Vordergrund- und Hintergrundregionen beschreibt. Textuelle und graphische Strukturen, die zum Vordergrund gehörig detektiert wurden, werden im binären Maskenbild schwarz repräsentiert, Hintergrundregionen weiß.
Die Segmentierung erfolgt erfindungsgemäß, indem, alle verbundenen Regionen gleichen Wertes des Quantisierungsbildes als mögliche Kandidaten für Vordergrundbestandteile beurteilt werden. Dazu werden sie nach diversen Kriterien auf ihre Zugehörigkeit zum Vordergrund hin untersucht. Die als Vordergrund segmentierten Regionen werden in das binäre Maskenbild eingetragen.
Während der Segmentierung ist das Maskenbild zunächst noch nicht binär und kann die Zustände: "noch nicht untersucht", "Vordergrund", "Hintergrund" und "Loch" annehmen.
Als erster Schritt werden alle verbundenen Regionen des Quantisierungsbildes identifiziert. Hierbei wird für Dokumente mit hoher Auflösung eine Vierer- Nachbarschaft verwendet, bei geringen Auflösungen wird eine Achter-Nachbarschaft angewendet.
Sind die Regionen bestimmt, wird eine Größenfilterung durchgeführt. Abhängig von der Auflösung des Dokuments existiert eine Mindestgröße und eine Maximalgröße, die nicht unter- bzw. überschritten werden darf Regionen, die im zulässigen Bereich liegen, werden weiter untersucht, anderenfalls werden sie verworfen.
Als nächster Schritt erfolgt eine Kantendetektion. Hierzu werden alle Randpixel der Region mit Hilfe an sich bekannter Kantenfilter untersucht, wobei die Kantenaktivität durch den Absolutwert der Filterantwort bestimmt wird.
Um Kanten besser von Rastereffekten oder Rauschen unterscheiden zu können, wird die ermittelte Kantenaktivität mit einem Mindestaktivitätswert verglichen. Ist die Kantenaktivität geringer als dieser Mindestwert, so wird sie zu Null gesetzt.
In einem weiteren Schritt werden jetzt die mittlere und die maximale Kantenaktivität für den Rand der Region und für den Innenbereich der Region zusätzlich die Varianz bestimmt.
Als nächstes wird geprüft, ob sowohl die mittlere als auch die maximale Kantenaktivität über vorgegebenen Mindestwerten liegen und außerdem die Varianz des Innenbereichs einen Maximalwert nicht überschreiten.
Bei positivem Ergebnis wird die aktuelle Region als Vordergrundregion klassifiziert und als solche ins Maskenbild eingetragen. Für den Fall, daß diese Region eine andere bereits als Vordergrund klassifizierte berührt, wird sie als "Loch" eingetragen. Ist der Test negativ, handelt es sich um eine Hintergrundregion, die ebenfalls ins Maskenbild eingetragen wird.
Nach der Klassifizierung wird das Maskenbild binärisiert. Hierzu werden die Vordergrundregionen auf schwarz, alle restlichen Regionen auf weiß gesetzt.
Die Segmentierung kann in vier unterschiedlichen Modi durchgeführt werden: Die bisher beschriebene Verfahrensweise entspricht einem ersten Modus, der auch normalen und inversen Text zu detektieren vermag. Für viele Dokumente, wie z. B. einfache Briefe, in denen kein inverser Text vorkommt, kann ein zweiter Modus verwendet werden, der nur die schwarzen verbundenen Regionen des Quantisierungsbildes untersucht. Ein dritter Modus ist für extrem schwer zu segmentierende Dokumente wie z. B. Landkarten sinnvoll, hierbei werden alle schwarzen Regionen des Quantisierungsbildes automatisch als Vordergrundregionen angenommen, hierdurch lassen sich auch bei schwer zu segmentierenden Dokumenten zufriedenstellende Kodierungsergebnisse erzielen. Der vierte Modus besteht darin, direkt alle Pixel als Hintergrundpixel zu klassifizieren, was bei der Kodierung von reinen Bilddokumenten sinnvoll ist.
Im folgenden werden die Vordergrund- und Hintergrundbilder ermittelt. Hierbei müssen zwei Aspekte erfüllt werden. Einerseits sollen Vordergrundbild bzw. Hintergrundbild die Intensitäten des Originalscans möglichst gut repräsentieren, so daß auch bei fehlerhafter Segmentierung keine visuellen Artefakte entstehen. Andererseits muß die Struktur der entstehenden Bilder möglichst einfach sein, um eine effiziente Kodierung zu gewährleisten.
Anhand des binären Maskenbildes und des Originalbildes wird das verkleinerte Vordergrundbild erzeugt.
Zunächst werden alle zum Vordergrund gehörigen Regionen im binären Maskenbild identifiziert. Da die Randwerte der Regionen fehlerhafte Intensitäten bzw. Farbigkeiten aufweisen, werden die Vordergrundregionen grundsätzlich um einen Pixel verdünnt, wobei jedoch mindestens das Skelett der Region erhalten bleibt.
Das Originalbild und das verdünnte binäre Maskenbild werden in Blöcke zerlegt. Hierbei entspricht die Kantenlänge der Blöcke dem Verkleinerungsfaktor. Enthält ein Block einen Anteil der verdünnten Vordergrundregion, so wird über diesen Anteil der Mittelwert der entsprechenden Pixel des Originaldokuments gebildet und an die korrespondierende Stelle im verkleinerten Vordergrundbild geschrieben. Enthält ein Block keine verdünnte Vordergrundregion, so wird der Wert des Vordergrundbildes zu Null gesetzt.
Danach werden die Vordergrundpixel mit Werten ungleich Null mit einer Mittelwertfilterung für angrenzende Pixel ausgedehnt.
Im letzten Schritt werden alle verbleibenden Pixel ausgefüllt. Hierbei wird jeweils der Mittelwert über alle Werte ungleich Null gebildet. Zur Steigerung der Kodierungseffizienz wird ein konstanter Grauwert als zusätzlicher Anteil mit in die Mittelwertbildung einbezogen, um das Vordergrundbild in Regionen ohne Vordergrundregionen gegen Grau zu dämpfen. Neu berechnete Werte werden direkt in das Vordergrundbild zurückgeschrieben, wodurch es möglich ist, alle Pixel des Bildes mit nur einem Durchlauf zu bestimmen.
Die Bestimmung des Hintergrundbildes entspricht im Prinzip dem Verfahren, das zur Bestimmung des Vordergrundbildes angewendet wird, nur daß jetzt die Verarbeitung mit dem Komplement, dem inversen binären Maskenbild durchgeführt wird.
Zunächst werden alle zum Hintergrund gehörigen Regionen im binären Maskenbild identifiziert. Da die Randwerte der Regionen fehlerhafte Intensitäten bzw. Farbigkeiten aufweisen, werden auch die Hintergrundregionen um einen Pixel verdünnt, wobei jedoch mindestens das Skelett der Region erhalten bleibt.
Das Originalbild und das verdünnte inverse binäre Maskenbild werden wiederum in Blöcke zerlegt, deren Kantenlänge jetzt dem Verkleinerungsfaktor für das Hintergrundbild entspricht. Enthält ein Block einen Anteil der verdünnten Hintergrundregion, so wird über diesen Anteil der Mittelwert der entsprechenden Pixel des Originaldokuments gebildet und in das verkleinerte Hintergrundbild geschrieben. Enthält ein Block keine verdünnte Hintergrundregion, so wird das entsprechende Pixel des Hintergrundbildes zu Null gesetzt.
Im nächsten Schritt werden die Hintergrundpixel mit Werten ungleich Null mit einer Mittelwertfilterung für angrenzende Pixel ausgedehnt.
Im letzten Schritt werden alle verbleibenden Pixel ausgefüllt. Hierbei wird jeweils der Mittelwert über alle Werte ungleich Null gebildet. Neu berechnete Werte werden direkt zurückgeschrieben, wodurch es möglich ist, alle Pixel des Hintergrundbildes mit nur einem Durchlauf zu bestimmen.
Sind die drei Bilder: Vordergrund-, Hintergrund- und das binäre Maskenbild nach dem erfindungsgemäßen Verfahren erzeugt worden, werden sie mit an sich bekannten Bildkodern komprimiert.
Die Dekodierung besteht darin, das Vordergrund-, Hintergrund- und das binäre Maskenbild zunächst getrennt zu dekodieren. Die verkleinerten Hintergrund- und Vordergrundbilder werden mittels Interpolation auf die Größe des Maskenbildes vergrößert. Abhängig vom Wert des binären Maskenbildes wird dann das rekonstruierte Bild aus den Pixeln des vergrößerten Hintergrund- bzw. Vordergrundbildes zusammengesetzt.
Die Erfindung soll nachstehend an einem Ausführungsbeispiel näher erläutert werden.
Dazu zeigen
Fig. 1 ein Blockschaltbild des Verfahrens
Fig. 2 die Verfahrensschritte bis zur Quantisierung des Originalbildes mit Bestimmung des Schwellwertes
Fig. 3 die Verfahrensschritte der Textdetektion/Segmentierung
Fig. 4 die Verfahrensschritte zur Bestimmung des Vordergrundbildes
Fig. 5 die Verfahrensschritte zur Bestimmung des Hintergrundbildes
Fig. 6 das Beispiel eines Originaldokumentes
Fig. 7 das Quantisierungsbild des Originaldokumentes
Fig. 8 das Segmentierungsergebnis
Fig. 9 das verfahrensgemäße Vordergrundbild
Fig. 10 das verfahrensgemäße Hintergrundbild
Fig. 11 die dekodierte Rekonstruktion des Originaldokumentes.
Im Beispiel liegt das Originaldokument (Fig. 6) als farbiges Dokument mit schwarzen und farbigen Textanteilen in einer Auflösung von 300 dpi vor, welches zunächst gem. Fig. 2 in ein Graustufenbild zur Bestimmung des lokal variablen Schwellwertbildes und zwei Farbdifferenz-Komponentenbilder umgewandelt wird. Das Graustufenbild wird durch eine Tiefpaßfilterung mit anschließender Unterabtastung auf 150 dpi verkleinert. Das verkleinerte Graustufenbild wird danach im Rahmen einer lokalen Dynamikanalyse einer Maximum-/Minimumfilterung mit 3 × 3 Kernen unterzogen. Aus der Differenz zwischen Maximum- und Minimumbild entsteht ein Dynamikbild, welches im nächsten Schritt mit einer Mindestdynamik von 55 verglichen wird. Für Bereiche, welche diesen Mindestwert überschreiten, wird die Zugehörigkeit zu einer Textregion angenommen und ein Quantisierungs-Schwellwert aus der Hälfte der Summe aus Maximum- und Minimumbild berechnet, während für Regionen mit geringerer Dynamik dieser Quantisierungsschwellwert zunächst gleich Null gesetzt wird. Alle Schwellwerte ungleich Null werden anschließend einer Mittelwertbildung mit einem 3 × 3 Kern unterzogen. Diese gemittelten Schwellwerte werden dann mit einer weiteren 5 × 5 Mittelwertfilterung auf die angrenzenden Pixel ausgedehnt. Pixel, für die noch kein Schwellwert existiert, werden abschließend mit einem 7 × 7 Kern ausgefüllt. Mittels bilinearer Interpolation wird das Schwellwertbild zur Quantisierung wieder auf Originalgröße gebracht. Durch Vergleich des Graustufenbildes mit dem Schwellwertbild entsteht gem. Fig. 7 ein binäres Quantisierungsbild als Grundlage für die anschließende Textdetektion (Segmentierung) gem. Fig. 3.
Hierzu werden zunächst alle verbundenen Regionen des gem. Fig. 2 erzeugten Quantisierungsbildes identifiziert, wobei im Beispiel eine Vierer-Nachbarschaft angewendet wird. Im Rahmen der anschließenden Größenfilterung werden eine Mindest- und eine Maximalgröße für jede zu untersuchende Region vorgegeben, die nicht unter-/überschritten werden darf. Regionen außerhalb dieses Bereiches werden im weiteren verworfen. Danach erfolgt eine nicht-lineare Kantendetektion durch Untersuchung aller Randpixel der betreffenden Region mit Hilfe je eines an sich bekannten horizontalen und vertikalen Sobelfilters und eines Laplacefilters. Die ermittelte Kantenaktivität wird mit einem Mindestaktivitätswert verglichen und bei dessen Unterschreitung zu Null gesetzt. Die mittlere und maximale Kantenaktivität sowie Varianz des Innenbereiches werden in einem nächsten Schritt bestimmt und anschließend geprüft, ob sowohl die mittlere als auch die maximale Kantenaktivität über vorgegebenen Mittelwerten liegen und die Varianz des Innenbereiches einen Maximalwert nicht überschreitet. Bei positivem Ergebnis wird die aktuelle Region als Vordergrundregion klassifiziert und in das Maskenbild eingetragen. Berührt sie eine andere bereits eingetragene Vordergrundregion, wird sie als "Loch" registriert. Bei negativem Ergebnis wird die untersuchte Region als Hintergrundregion in das Maskenbild eingetragen. Anschließend wird das klassifizierte Maskenbild binärisiert, indem alle Vordergrundregionen auf "schwarz", die Hintergrundregionen und "Löcher" auf "weiß" gesetzt werden (Fig. 8). Die Segmentierung des Beispieldokumentes erfolgt gemäß Modus 1.
Aus dem binären Maskenbild und dem Originalbild wird gem. Fig. 4 das verkleinerte Vordergrundbild erzeugt, indem alle Vordergrundregionen zunächst um einen Pixel verdünnt werden und an Hand dieses verdünnten, binären Maskenbildes das Original auf ein Drittel seiner Größe verkleinert wird. Dazu werden sowohl Maskenbild als auch Originalbild in Blöcke von 3 × 3-Pixeln zerlegt. Über Anteile der verdünnten Vordergrundregion innerhalb eines solchen 3 × 3-Blockes wird der Mittelwert dieser Pixel in das verkleinerte Vordergrundbild übernommen. Enthält der 3 × 3-Block keine verdünnte Vordergrundregion, wird das entsprechende Pixel zu Null gesetzt. Die Vordergrundpixel mit Werten größer Null werden anschließend mit einer 5 × 5- Mittelwertfilterung ausgedehnt und die verbleibenden Pixel mit einem 5 × 5-Kern ausgefüllt, wobei ein konstanter Grauwert als zusätzlicher Anteil in die Mittelwertbildung einbezogen wird. Zur Bestimmung des Hintergrundbildes gem. Fig. 5 werden alle zum Hintergrund gehörigen Regionen im binären Maskenbild identifiziert und die Hintergrundregionen ebenfalls um ein Pixel verdünnt. Anschließend erfolgt die Zerlegung von Originalbild und verdünnten Maskenbild in 3 × 3-Blöcke. Danach wird analog dem Verfahrensschritt "Bestimmung des Vordergrundbildes" weiter verfahren.
Das Ergebnis ist in Fig. 10 dargestellt.
Die gemäß Beispiel erzeugten Bilder "Vordergrund", "Hintergrund" und "binäres Maskenbild" werden anschließend mit an sich bekannten Bildkodern komprimiert, das Maskenbild beispielsweise mittels "Fax Group 4", Vorder- und Hintergrundbild mittels Wavelet-Kodierung. Die Dekodierung erfolgt für die drei Teilbilder getrennt, indem die verkleinerten Vorder- und Hintergrundbilder durch lineare Interpolation auf die Größe des binären Maskenbildes gebracht werden. Für einen schwarzen Wert des binären Maskenbildes wird das rekonstruierte Bild aus den Pixeln des Vordergrundbildes, für einen weißen Wert aus den Pixeln des Hintergrundbildes zusammengesetzt.
Mit dem dargestellten erfindungsgemäßen Datenkompressionsverfahren wird damit die Kompression gescannter Dokumente ohne Einschränkung an deren Beschaffenheit, wie beispielsweise heller Hintergrund, rechteckige Abbildungen, exakte Trennung von Bild- und Textbestandteilen, ermöglicht. Der Aufwand an Rechenzeit und Speicherkapazität wird hinaus deutlich gesenkt. Darüber hinaus können unterschiedliche Dokumentenklassen und Bilder erstmalig nach einem einheitlichen Verfahren komprimiert werden.

Claims (9)

1. Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten, wobei das digitale Bild des gescannten Dokumentes in drei Bildebenen, ein Vordergrundbild, ein Hintergrundbild und ein binäres Maskenbild zerlegt, aus dem Originaldokument ein lokal variables Schwellwertbild hergestellt und durch Quantisierung (Binärisierung) mit dem Originalbild ein bitonales Quantisierungsbild erzeugt wird, dadurch gekennzeichnet,
  • - daß die Quantisierung anhand eines definiert verkleinerten Originalbildes durchgeführt wird,
  • - daß aus dem Quantisierungsbild und dem Originalbild eine Textdetektion (Segmen­ tierung) erfolgt, welche das Dokument in Vordergrund- und Hintergrundregionen unterteilt,
  • - daß bestimmte Regionen, insbesondere Text und graphische Elemente, dem Vorder­ grundbild, Texthintergrund und Bilder dem Hintergrundbild zugeordnet werden,
  • - daß das Ergebnis der Segmentierung in einem binären Maskenbild von der Größe des Originalbildes abgelegt wird,
  • - daß das aus Originalbild und Maskenbild mit gegenüber dem Originalbild reduzierter Auflösung erzeugte Vordergrundbild die Farbigkeit der Vordergrundregionen beschreibt,
  • - daß aus Originalbild und bitonalem Maskenbild das Hintergrundbild mit gegenüber dem Originalbild reduzierter Auflösung erzeugt wird, und
  • - daß binäres Maskenbild, Vordergrundbild und Hintergrundbild anschließend mit einem an sich bekannten Bildkoder kodiert werden (Fig. 1).
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet,
  • - daß die Quantisierung (Binärisierung) des Originaldokumentes in zwei Schritten erfolgt, indem zuerst adaptiv ein lokal variabler Schwellwert aus dem verkleinerten Originalwert bestimmt und danach mit der Grauwertrepräsentation in Größe des Originaldokumentes verglichen wird,
  • - daß farbige Originaldokumente in ein Graustufenbild und zwei Farbdifferenz­ komponentenbilder umgewandelt werden,
  • - daß das Graustufenbild durch eine Tiefpaßfilterung mit anschließender Unterabtastung auf eine geeignete Größe verkleinert wird,
  • - daß durch lokale Dynamikanalyse des verkleinerten Graustufenbildes ein Dynamikbild erzeugt wird,
  • - daß das Dynamikbild mit einer extern vorgebbaren Mindestdynamik verglichen wird, welche die Empfindlichkeit der Quantisierung und der Textdetektion (Segmentierung) steuert,
  • - daß bei Überschreiten dieses Mindestwertes aus der Hälfte der Summe aus Minimum-/Maximumbild ein Quantisierungsschwellwert bestimmt wird,
  • - daß in Regionen mit zu geringer Dynamik der Quantisierungsschwellwert auf Null gesetzt wird,
  • - daß eine Mittelwertbildung für alle Schwellwerte ungleich Null durchgeführt wird und die gemittelten Schwellwerte tiefpaßgefiltert ausgedehnt werden,
  • - daß das Schwellwertbild mittels bilinearer Interpolation vergrößert und mit dem Graustufenbild des Originals verglichen wird (Fig. 2).
3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet,
  • - daß das binäre Quantisierungsbild und das Originalbild einer Textdetektion (Segmentierung) unterzogen werden, wozu alle verbundenen Regionen eines zulässigen Größenbereiches ausgewählt werden,
  • - daß alle verbundenen Regionen des Quantisierungsbildes gleichen Wertes hinsichtlich ihrer Eignung als Vordergrundbestandteile beurteilt werden,
  • - daß die als Vordergrund segmentierten Regionen in das binäre Maskenbild eingetragen werden,
  • - daß die Segmentierung in Abhängigkeit von Dokumententyp nach vier unterschiedlichen Modi durchführbar ist,
  • - daß das im Ergebnis der Segmentierung erzeugte binäre Maskenbild eine Pixel- individuelle Zuordnung aller Dokumentenbereiche in Vorder- und Hintergrundregionen ermöglicht (Fig. 3).
4. Verfahren nach Anspruch 1 bis 3, dadurch gekennzeichnet,
  • - daß das verkleinerte Vordergrundbild hergestellt wird, indem sowohl das verdünnte binäre Maskenbild als auch das Originalbild in Blöcke zerlegt und die Mittelwerte der verdünnten Vordergrundregionen dieser Blöcke in das verkleinerte Vordergrundbild eingetragen, ausgedehnt und anschließend die noch nicht bestimmten Regionen des Vordergrundbildes durch Mittelwertbildung über die bestimmten Regionen ausgefüllt werden, wobei ein konstanter Grauwert als zusätzlicher Anteil in die Mittelwertbildung einbezogen wird (Fig. 4).
5. Verfahren nach Anspruch 1 bis 3, dadurch gekennzeichnet,
  • - daß das verkleinerte Hintergrundbild hergestellt wird, indem sowohl das verdünnte binäre Hintergrund-Maskenbild als auch das Originalbild in Blöcke zerlegt und die Mittelwerte der verdünnten Hintergrundregionen dieser Blöcke in das verkleinerte Hintergrundbild eingetragen, ausgedehnt und anschließend die noch nicht bestimmten Regionen des Hintergrundbildes durch Mittelwertbildung über die bestimmten Regionen ausgefüllt werden (Fig. 5).
6. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet,
  • - daß das Graustufenbild durch Tiefpaßfilterung auf die Hälfte des Originals verkleinert und im Rahmen einer lokalen Dynamikanalyse einer Maximum- /Minimumfilterung mit 3 × 3 Kernen unterzogen wird,
  • - daß die mit 3 × 3 Kernen gemittelten Schwellwerte mit einer weiteren 5 × 5 Mittelwertfilterung auf die angrenzenden Pixel ausgedehnt werden,
  • - daß die Bereiche ohne Schwellwert abschließend mit einem 7 × 7 Kern ausgefüllt werden.
7. Verfahren nach Anspruch 3, dadurch gekennzeichnet,
  • - daß alle Regionen des Quantisierungsbildes nacheinander einer Prüfung unterzogen werden,
  • - daß zusammenhängende Regionen des Quantisierungsbildes gleichen Wertes einer Größenfilterung unterzogen werden, welche sehr kleine und sehr große Regionen eliminiert,
  • - daß die Ränder der Regionen einer Kantenaktivitätsprüfung unterzogen werden, die Regionen mit geringer Kantenaktivität eliminiert,
  • - daß der Innenbereich der Regionen einer Varianzbestimmung unterzogen wird, die Regionen zu Varianz eliminiert,
  • - daß die erhaltenen Regionen als Vordergrund klassifiziert werden, sofern sie keine andere Textregion berühren.
8. Verfahren nach Anspruch 3, dadurch gekennzeichnet,
  • - daß die Verfahrensschritte der Segmentierung (Fig. 3) nach einem ersten Modus für normalen und inversen Text durch Untersuchung weißer und schwarzer verbundener Regionen des Quantisierungsbildes durchgeführt werden,
  • - daß die Verfahrensschritte der Segmentierung (Fig. 3) nach einem zweiten Modus durchgeführt werden, der nur die schwarzen verbundenen Regionen des Quanti­ sierungsbildes untersucht,
  • - daß die Verfahrensschritte der Segmentierung (Fig. 3) nach einem dritten Modus durchgeführt werden, der alle schwarzen Regionen des Quantisierungsbildes automatisch als Vordergrundregion registriert,
  • - daß die Verfahrensschritte der Segmentierung (Fig. 3) nach einem vierten Modus als Bildcodierung durchgeführt werden, indem alle Pixel direkt als Hintergrundpixel klassifiziert werden.
9. Verfahren nach Ansprüchen 1, 4 und 5, dadurch gekennzeichnet,
  • - daß das binäre Maskenbild und das Originalbild in Blöcke der Größe 3 × 3 Pixel unterteilt werden,
  • - daß für jeden Block der Mittelwert derjenigen Pixel des Originalbildes gebildet wird, die zur verdünnten Vordergrund- bzw. Hintergrundregion gehören,
  • - daß die bestimmten Vordergrund- bzw. Hintergrundpixelintensitäten mit einem 5 × 5 Mittelwertfilter auf angrenzende Pixel ausgedehnt werden,
  • - daß die verbleibenden Pixel mit einem weiteren 5 × 5 Mittelwertfilter ausgefüllt werden,
wobei für das Vordergrundbild ein konstanter Grauwert mit in die Mittelwertfilterung einbezogen wird.
DE19958553A 1999-12-04 1999-12-04 Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten Withdrawn DE19958553A1 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE19958553A DE19958553A1 (de) 1999-12-04 1999-12-04 Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
US09/456,875 US6731800B1 (en) 1999-12-04 1999-12-08 Method for compressing scanned, colored and gray-scaled documents
CA002327238A CA2327238A1 (en) 1999-12-04 2000-12-01 Method for compressing scanned colored and gray-scale documents
JP2000368616A JP2001223903A (ja) 1999-12-04 2000-12-04 走査された色付きおよびグレースケールの文書を圧縮する方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19958553A DE19958553A1 (de) 1999-12-04 1999-12-04 Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
US09/456,875 US6731800B1 (en) 1999-12-04 1999-12-08 Method for compressing scanned, colored and gray-scaled documents

Publications (1)

Publication Number Publication Date
DE19958553A1 true DE19958553A1 (de) 2001-06-07

Family

ID=32826353

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19958553A Withdrawn DE19958553A1 (de) 1999-12-04 1999-12-04 Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten

Country Status (4)

Country Link
US (1) US6731800B1 (de)
JP (1) JP2001223903A (de)
CA (1) CA2327238A1 (de)
DE (1) DE19958553A1 (de)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1555804A2 (de) * 2004-01-19 2005-07-20 Ricoh Company, Ltd. Bildverarbeitungsvorrichtung, Bildverarbeitungsprogramm und Speichermedium
EP1587298A1 (de) * 2004-02-12 2005-10-19 Xerox Corporation System und Verfahren zur Anpassung von Bilddaten zur Erzeugung hochkomprimierbarer Bildebenen
DE102006010763A1 (de) * 2006-03-08 2007-09-13 Netviewer Gmbh Hybrides Bildkompressionsverfahren

Families Citing this family (99)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6880122B1 (en) * 1999-05-13 2005-04-12 Hewlett-Packard Development Company, L.P. Segmenting a document into regions associated with a data type, and assigning pipelines to process such regions
GB2358098A (en) * 2000-01-06 2001-07-11 Sharp Kk Method of segmenting a pixelled image
JP4189506B2 (ja) * 2000-06-09 2008-12-03 コニカミノルタビジネステクノロジーズ株式会社 画像処理のための装置、方法及び記録媒体
US6977751B1 (en) * 2000-06-30 2005-12-20 Silverbrook Research Pty Ltd Print engine/controller to work in multiples and a printhead driven by multiple print engine/controllers
US6901169B2 (en) 2001-02-01 2005-05-31 At & T Corp. Method and system for classifying image elements
JP2002369010A (ja) * 2001-06-05 2002-12-20 Nec Corp 画像符号化装置及び画像復号装置
US6842541B2 (en) * 2001-10-31 2005-01-11 Xerox Corporation Adaptive color super resolution thresholding
US7043077B2 (en) * 2001-11-07 2006-05-09 International Business Machines Corporation System and method for efficient compression of raster image data
US6898316B2 (en) * 2001-11-09 2005-05-24 Arcsoft, Inc. Multiple image area detection in a digital image
JP4169522B2 (ja) * 2002-03-22 2008-10-22 株式会社リコー 画像処理装置、画像処理プログラム及びこのプログラムを記憶する記憶媒体
US7043079B2 (en) * 2002-04-25 2006-05-09 Microsoft Corporation “Don't care” pixel interpolation
US7024039B2 (en) * 2002-04-25 2006-04-04 Microsoft Corporation Block retouching
US7392472B2 (en) * 2002-04-25 2008-06-24 Microsoft Corporation Layout analysis
US7164797B2 (en) * 2002-04-25 2007-01-16 Microsoft Corporation Clustering
US7120297B2 (en) * 2002-04-25 2006-10-10 Microsoft Corporation Segmented layered image system
US7110596B2 (en) * 2002-04-25 2006-09-19 Microsoft Corporation System and method facilitating document image compression utilizing a mask
US7263227B2 (en) * 2002-04-25 2007-08-28 Microsoft Corporation Activity detector
EP1388815A3 (de) * 2002-04-25 2005-11-16 Microsoft Corporation Geschichtetes Bildsegmentierungssystem
US6941011B2 (en) * 2002-06-27 2005-09-06 Hewlett-Packard Development Company, Lp. Method and system for image processing including mixed resolution, multi-channel color compression, transmission and decompression
JP4460447B2 (ja) * 2002-06-28 2010-05-12 ノキア コーポレイション 情報端末
US6987882B2 (en) * 2002-07-01 2006-01-17 Xerox Corporation Separation system for Multiple Raster Content (MRC) representation of documents
US7242802B2 (en) * 2002-07-01 2007-07-10 Xerox Corporation Segmentation method and system for Multiple Raster Content (MRC) representation of documents
US7227988B2 (en) * 2002-07-01 2007-06-05 Xerox Corporation Prioritized PDL segmentation producing two bit selector
US7356183B2 (en) * 2002-07-01 2008-04-08 Xerox Corporation Segmentation method and system for multiple raster content (MRC) representation of documents
US7606417B2 (en) * 2004-08-16 2009-10-20 Fotonation Vision Limited Foreground/background segmentation in digital images with differential exposure calculations
US7680342B2 (en) 2004-08-16 2010-03-16 Fotonation Vision Limited Indoor/outdoor classification in digital images
TWI335549B (en) * 2003-07-01 2011-01-01 Xerox Corp Segmentation method and system for multiple raster content (mrc) representation of documents
JP2005064704A (ja) * 2003-08-08 2005-03-10 Ricoh Co Ltd 画像処理装置、プログラム及び記憶媒体
US7430335B2 (en) * 2003-08-13 2008-09-30 Apple Inc Pre-processing method and system for data reduction of video sequences and bit rate reduction of compressed video sequences using spatial filtering
US7403568B2 (en) * 2003-08-13 2008-07-22 Apple Inc. Pre-processing method and system for data reduction of video sequences and bit rate reduction of compressed video sequences using temporal filtering
US7561753B2 (en) * 2004-01-09 2009-07-14 The Boeing Company System and method for comparing images with different contrast levels
US7379594B2 (en) * 2004-01-28 2008-05-27 Sharp Laboratories Of America, Inc. Methods and systems for automatic detection of continuous-tone regions in document images
US7991238B2 (en) 2004-04-30 2011-08-02 Neiversan Networks Co. Llc Adaptive compression of multi-level images
US20050244060A1 (en) * 2004-04-30 2005-11-03 Xerox Corporation Reformatting binary image data to generate smaller compressed image data size
US8204306B2 (en) * 2004-06-14 2012-06-19 Xerox Corporation Method for image segmentation based on block clustering for improved processing of touching characters
US6992686B2 (en) * 2004-06-14 2006-01-31 Xerox Corporation System and method for dynamic control of file size
US7283674B2 (en) * 2004-06-25 2007-10-16 Xerox Corporation Using graphic objects in MFD scan-to-export function
KR100643759B1 (ko) * 2004-12-01 2006-11-10 삼성전자주식회사 문서 압축 장치 및 그 방법
EP1670257B1 (de) 2004-12-10 2018-09-26 Ricoh Company, Ltd. Komprimierung eines mehrwertigen Bildes mittels Steuerung der Speicherplatzanforderung
US7359552B2 (en) * 2004-12-15 2008-04-15 Mitsubishi Electric Research Laboratories, Inc. Foreground detection using intrinsic images
KR100599141B1 (ko) * 2005-05-20 2006-07-12 삼성전자주식회사 문서 압축시스템 및 그 압축방법
JP2007306513A (ja) * 2005-07-13 2007-11-22 Konica Minolta Business Technologies Inc 画像データの圧縮方法および装置
JP4533273B2 (ja) * 2005-08-09 2010-09-01 キヤノン株式会社 画像処理装置及び画像処理方法、プログラム
US9247090B2 (en) * 2005-10-20 2016-01-26 Hewlett-Packard Development Company, L.P. Printing and printers
JP4469330B2 (ja) * 2005-12-07 2010-05-26 株式会社リコー 画像処理装置、画像処理方法、画像処理プログラム、記録媒体及び画像形成装置
US7379593B2 (en) * 2005-12-21 2008-05-27 Xerox Corporation Method for image segmentation from proved detection of background and text image portions
US7729546B2 (en) * 2005-12-23 2010-06-01 Lexmark International, Inc. Document segmentation for mixed raster content representation
US7692696B2 (en) 2005-12-27 2010-04-06 Fotonation Vision Limited Digital image acquisition system with portrait mode
IES20060559A2 (en) 2006-02-14 2006-11-01 Fotonation Vision Ltd Automatic detection and correction of non-red flash eye defects
DE602006002242D1 (de) * 2006-02-15 2008-09-25 Jaycrypto Ltd Verfahren und Vorrichtung zum Erzeugen von Initialwerten für einen Zufallszahlengenerator
US7792359B2 (en) * 2006-03-02 2010-09-07 Sharp Laboratories Of America, Inc. Methods and systems for detecting regions in digital images
US7889932B2 (en) * 2006-03-02 2011-02-15 Sharp Laboratories Of America, Inc. Methods and systems for detecting regions in digital images
US8630498B2 (en) * 2006-03-02 2014-01-14 Sharp Laboratories Of America, Inc. Methods and systems for detecting pictorial regions in digital images
JP2007300601A (ja) * 2006-04-07 2007-11-15 Konica Minolta Business Technologies Inc 画像データの圧縮方法およびその装置
US8019171B2 (en) 2006-04-19 2011-09-13 Microsoft Corporation Vision-based compression
IES20060564A2 (en) 2006-05-03 2006-11-01 Fotonation Vision Ltd Improved foreground / background separation
US8306336B2 (en) * 2006-05-17 2012-11-06 Qualcomm Incorporated Line or text-based image processing tools
JP4732250B2 (ja) * 2006-06-14 2011-07-27 キヤノン株式会社 情報処理装置、制御方法、およびコンピュータプログラム
US8437054B2 (en) * 2006-06-15 2013-05-07 Sharp Laboratories Of America, Inc. Methods and systems for identifying regions of substantially uniform color in a digital image
US7864365B2 (en) * 2006-06-15 2011-01-04 Sharp Laboratories Of America, Inc. Methods and systems for segmenting a digital image into regions
JP4333708B2 (ja) * 2006-08-02 2009-09-16 コニカミノルタビジネステクノロジーズ株式会社 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム
US7876959B2 (en) * 2006-09-06 2011-01-25 Sharp Laboratories Of America, Inc. Methods and systems for identifying text in digital images
US7840071B2 (en) * 2006-12-12 2010-11-23 Seiko Epson Corporation Method and apparatus for identifying regions of different content in an image
US8254680B2 (en) * 2007-01-24 2012-08-28 Samsung Electronics Co., Ltd. Apparatus and method of segmenting an image in an image coding and/or decoding system
US7856142B2 (en) * 2007-01-26 2010-12-21 Sharp Laboratories Of America, Inc. Methods and systems for detecting character content in a digital image
US8068684B2 (en) * 2007-05-04 2011-11-29 I.R.I.S. Compression of digital images of scanned documents
US20090041344A1 (en) * 2007-08-08 2009-02-12 Richard John Campbell Methods and Systems for Determining a Background Color in a Digital Image
US7899248B2 (en) * 2007-08-30 2011-03-01 Seiko Epson Corporation Fast segmentation of images
US7936923B2 (en) * 2007-08-31 2011-05-03 Seiko Epson Corporation Image background suppression
US8155437B2 (en) * 2007-09-07 2012-04-10 CVISION Technologies, Inc. Perceptually lossless color compression
US8121403B2 (en) * 2007-10-30 2012-02-21 Sharp Laboratories Of America, Inc. Methods and systems for glyph-pixel selection
US8270716B2 (en) 2007-12-04 2012-09-18 Ricoh Company, Limited Selectively compressing picture and text areas of an image to maintain highest quality and effective compaction
US8548251B2 (en) * 2008-05-28 2013-10-01 Apple Inc. Defining a border for an image
US8391638B2 (en) 2008-06-04 2013-03-05 Microsoft Corporation Hybrid image format
US8189917B2 (en) * 2008-09-25 2012-05-29 Sharp Laboratories Of America, Inc. Methods and systems for locating text in a digital image
US8594466B2 (en) * 2008-11-11 2013-11-26 Sharp Kabushiki Kaisha Image data converting device, method for converting image data, program and storage medium
US9521994B2 (en) * 2009-05-11 2016-12-20 Siemens Healthcare Gmbh System and method for image guided prostate cancer needle biopsy
JP5413080B2 (ja) * 2009-09-15 2014-02-12 株式会社リコー 画像処理装置及び画像処理方法
KR101710883B1 (ko) * 2009-11-04 2017-02-28 삼성전자주식회사 필터 정보를 이용한 영상 압축 장치 및 방법과 영상 복원 장치 및 방법
KR101058726B1 (ko) * 2009-11-11 2011-08-22 삼성전자주식회사 조명 성분을 제거하기 위한 이미지 보정 장치 및 방법
US8000528B2 (en) * 2009-12-29 2011-08-16 Konica Minolta Systems Laboratory, Inc. Method and apparatus for authenticating printed documents using multi-level image comparison based on document characteristics
US8340363B2 (en) 2010-05-27 2012-12-25 Palo Alto Research Center Incorporated System and method for efficient interpretation of images in terms of objects and their parts
US8582834B2 (en) 2010-08-30 2013-11-12 Apple Inc. Multi-image face-based image processing
US8760464B2 (en) 2011-02-16 2014-06-24 Apple Inc. Shape masks
US8331670B2 (en) * 2011-03-22 2012-12-11 Konica Minolta Laboratory U.S.A., Inc. Method of detection document alteration by comparing characters using shape features of characters
US8457426B1 (en) 2011-05-18 2013-06-04 Adobe Systems Incorporated Method and apparatus for compressing a document using pixel variation information
US8699815B2 (en) * 2011-05-31 2014-04-15 Adobe Systems Incorporated Methods and apparatus for improved display of foreground elements
BE1022166B1 (fr) * 2014-12-23 2016-02-23 I.R.I.S. Procede de compression d'images
US10303498B2 (en) 2015-10-01 2019-05-28 Microsoft Technology Licensing, Llc Performance optimizations for emulators
CN105550633B (zh) * 2015-10-30 2018-12-11 小米科技有限责任公司 区域识别方法及装置
JP2017184197A (ja) * 2016-03-31 2017-10-05 船井電機株式会社 印刷装置
CN108229344A (zh) * 2017-12-19 2018-06-29 深圳市商汤科技有限公司 图像处理方法和装置、电子设备、计算机程序和存储介质
CN109960789B (zh) * 2017-12-22 2023-01-24 广州帷策智能科技有限公司 基于自然语言处理的人物关系分析方法
WO2019133986A1 (en) * 2017-12-30 2019-07-04 Wu Yecheng Printing white features of an image using a print device
CN110365929B (zh) * 2018-04-10 2021-01-05 北京仁光科技有限公司 信息传输方法、装置、设备、系统及存储介质
US11231918B1 (en) 2020-08-31 2022-01-25 Microsoft Technologly Licensing, LLC Native emulation compatible application binary interface for supporting emulation of foreign code
US11403100B2 (en) 2020-08-31 2022-08-02 Microsoft Technology Licensing, Llc Dual architecture function pointers having consistent reference addresses
US11042422B1 (en) 2020-08-31 2021-06-22 Microsoft Technology Licensing, Llc Hybrid binaries supporting code stream folding
CN114915788B (zh) * 2022-07-19 2022-09-13 中科金勃信(山东)科技有限公司 一种用于档案的图像压缩方法、系统及介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4916744A (en) 1985-12-10 1990-04-10 Fuji Photo Film Co., Ltd. Image signal processing method
US4924521A (en) 1987-12-18 1990-05-08 International Business Machines Corporation Image processing system and method employing combined black and white and gray scale image data
US4873577A (en) 1988-01-22 1989-10-10 American Telephone And Telegraph Company Edge decomposition for the transmission of high resolution facsimile images
JPH02177766A (ja) 1988-12-28 1990-07-10 Canon Inc 2値画像の階層的符号化方式
GB9006080D0 (en) 1990-03-17 1990-05-16 Int Computers Ltd Progressive encoding
WO1996024114A2 (en) 1995-01-31 1996-08-08 United Parcel Service Of America, Inc. Method and apparatus for separating foreground from background in images containing text
US5778092A (en) 1996-12-20 1998-07-07 Xerox Corporation Method and apparatus for compressing color or gray scale documents

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1555804A2 (de) * 2004-01-19 2005-07-20 Ricoh Company, Ltd. Bildverarbeitungsvorrichtung, Bildverarbeitungsprogramm und Speichermedium
EP1587298A1 (de) * 2004-02-12 2005-10-19 Xerox Corporation System und Verfahren zur Anpassung von Bilddaten zur Erzeugung hochkomprimierbarer Bildebenen
US7366357B2 (en) 2004-02-12 2008-04-29 Xerox Corporation Systems and methods for adjusting image data to form highly compressible image planes
CN1655578B (zh) * 2004-02-12 2011-09-07 施乐公司 调整图像数据以形成高度可压缩图像平面的系统和方法
DE102006010763A1 (de) * 2006-03-08 2007-09-13 Netviewer Gmbh Hybrides Bildkompressionsverfahren

Also Published As

Publication number Publication date
CA2327238A1 (en) 2001-06-04
JP2001223903A (ja) 2001-08-17
US6731800B1 (en) 2004-05-04

Similar Documents

Publication Publication Date Title
DE19958553A1 (de) Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
DE4242796C2 (de) Hocheffizientes Kodierverfahren für mit Zweipegelbildern vermischte natürliche Bilder
DE3940682C2 (de) Codiervorrichtung und System, bestehend aus einer Codiervorrichtung und einer Decodiervorrichtung für digitale Bilddaten
DE69333288T2 (de) Verbesserte vektorquantisierung
DE69832411T2 (de) Speicherverwaltungssystem für bilddokumenten-datenbank
EP0283715B1 (de) Verfahren zur Codierung von Bildsignalen
DE60119632T2 (de) Erzeugung von nicht schichtgerechten Pixeln für eine Schicht eines aufgespalteten Bildes
DE69627982T2 (de) Signaladaptives Nachverarbeitungssystem um Blockierungseffekte und Ringstörungen zu verringern
DE69738494T2 (de) Videokodierungs- und Videodekodierungsvorrichtung
DE69738515T2 (de) Vorrichtung und verfahren für hybride kompression von rasterdaten
EP1104916B1 (de) Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
DE19744898A1 (de) Signaladaptives Filterverfahren und signaladaptives Filter
DE19739266B4 (de) Verfahren und Vorrichtung zum Kodieren binärer Formen
DE19814892A1 (de) Signaladaptives Filterverfahren zur Verringerung von Überschwingrauschen und signaladaptives Filter
DE602004001993T2 (de) Transformations basiertes restbewegungsrahmen kodierungsverfahren mit übervollständiger basis und zugehörige vorrichtung zur videokompression
EP1425920B1 (de) Verfahren zur videocodierung und computerprogrammprodukt
EP0042981B1 (de) Verfahren zur Codierung von elektrischen Signalen, die bei der Abtastung eines grafischen Musters mit aus Text und Bildern gemischtem Inhalt gewonnen werden
EP1374559B1 (de) Verfahren zur komprimierung und dekomprimierung von bilddaten
DE69725280T2 (de) Kompressionsgerät mit arithmetischer Kodierung unter Verwendung eines kontextualen Models, das zu variablen Musterlängen in binären Bilddaten adaptiv ist
DE69936304T2 (de) Bereichsbasierte skalierbare bildkodierung
DE69934194T2 (de) Verfahren und Vorrichtung zur elektronischen Datenkompression
EP2294825B1 (de) Vorrichtung und verfahren zum codieren und decodieren einer mehrzahl von fliesskommawerten
DE19944213C1 (de) Verfahren zum Komprimieren eines digitalen Bildes mit mehreren Bit-Ebenen
EP0981910B1 (de) Verfahren und vorrichtung zur codierung eines digitalisierten bildes
DE19524008C2 (de) Kodiervorrichtung für Bi-Pegel-Bilder

Legal Events

Date Code Title Description
8127 New person/name/address of the applicant

Owner name: ALGOVISION LURATECH GMBH, 10587 BERLIN, DE

8127 New person/name/address of the applicant

Owner name: LURA TECH IMAGING GMBH, 42855 REMSCHEID, DE

8110 Request for examination paragraph 44
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee

Effective date: 20120703