DE69736938T2 - Detektion und Wiedergabe von Text in gerasterten Bildbereichen - Google Patents

Detektion und Wiedergabe von Text in gerasterten Bildbereichen Download PDF

Info

Publication number
DE69736938T2
DE69736938T2 DE69736938T DE69736938T DE69736938T2 DE 69736938 T2 DE69736938 T2 DE 69736938T2 DE 69736938 T DE69736938 T DE 69736938T DE 69736938 T DE69736938 T DE 69736938T DE 69736938 T2 DE69736938 T2 DE 69736938T2
Authority
DE
Germany
Prior art keywords
pixel
text
halftone
image
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69736938T
Other languages
English (en)
Other versions
DE69736938D1 (de
Inventor
Jeng-nan Webster Shiau
Zhigang Webster Fan
Raymond J. Webster Clark
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Application granted granted Critical
Publication of DE69736938D1 publication Critical patent/DE69736938D1/de
Publication of DE69736938T2 publication Critical patent/DE69736938T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)

Description

  • Die vorliegende Erfindung betrifft im Allgemeinen die Reproduktion von zusammengesetzten Dokumentenbildern, die sowohl Text- und/oder Grafikinformationen als auch Halbtonbereiche enthalten. Insbesondere betrifft die Erfindung die Reproduktion von Bildern, in denen Text- und/oder Grafikinformationen in einem Halbtonbereich eingebettet sind.
  • Wenn zusammengesetzte Dokumentenbilder, die Farbtonbereiche, die durch einen Halbtonprozess erzeugt wurden und Text und/oder Grafik enthalten, die in den Farbton bereichen eingebettet sind, reproduziert werden (beispielsweise mittels eines Digitalkopierers), ist es wünschenswert, das Bild in seine Text-/Grafikabschnitte und die Halbtonbereiche zu unterteilen, um die Druckqualität zu optimieren. (Im Folgenden wird Text und/oder Grafik einfach als „Text" bezeichnet). Textbereiche können oftmals unter Verwendung von Fehlerdiffusion reproduziert werden; Halbtonbereiche mit hoher Frequenz können unter Verwendung des Descreening-Filterns und anschließendem Halbtonverfahren unter Verwendung eines Bildschirms reproduziert werden, der für die Ausgabe-Druckvorrichtung beispielsweise einen Drucker eines Digitalkopierers geeignet ist. Verfahren zu dieser Reproduktion sind auf dem Gebiet der Technik bekannt. Siehe dazu beispielsweise US-A-4.194.221 und US-A-5.293.430.
  • Dokument US 4853792 offenbart ein System zum Umwandeln eines Bilddokumentes in digitale Signale und zum anschließenden Messen eines Dichtemittelwertes um einen Punkt von Interesse herum, um zu bestimmen, ob das Dokument unter Verwendung eines Dither-Verfahrens oder eines binären Umwandlungsverfahrens kodiert werden soll.
  • Die Unterscheidung zwischen und die Aufteilung des Bildes in Textbereiche und Halbtonbereiche stellt nicht immer eine leichte Aufgabe dar. Oftmals enthalten die Dokumente Text, der in den Halbtonbereichen eingebettet ist. In bisher angewendeten Reproduktionsverfahren wurde solch eingebetteter Text auf die gleiche Weise wie der ihn umgebende Halbtonbereich reproduziert. Demzufolge wurde er Tiefpassfiltern und Rescree ning unterzogen, wobei die umgebenden Pixel den Halbtonbereich darstellen. Als Ergebnis erscheint der Text verwischt oder „ausgefranst" (1).
  • Die vorliegende Erfindung überwindet dieses Problem durch Erkennen von Text, der in Halbtonbereiche eingebettet ist und durch gesondertes Wiedergeben des Textes und der Farbtonbereiche durch Prozesse, die jeweils für jeden Pixeltyp geeignet sind. Demzufolge wird entsprechend einem ersten Aspekt durch die Erfindung ein Verfahren gemäß Anspruch 1 des angehängten Satzes an Ansprüchen bereitgestellt.
  • Ausführungsbeispiele des erfinderischen Verfahrens können die folgenden Leistungsmerkmale enthalten. Das Mittelungsfenster, das zum Berechnen des Mittelwertbildes verwendet wird, kann vorgegebene Abmessungen haben; es kann auch variable Abmessungen haben, die auf Basis einer Abtastauflösung, die zum Erzeugen des Digitalbildes mit Frequenzkomponenten des Digitalbildes verwendet wird, variiert.
  • Der Diskriminierungswert basiert auf dem Mittelwertbild, entweder durch Berechnen eines Bereiches der Mittelwerte von Pixeln in einer Nachbarschaft, die jedes Pixel umgibt, durch Berechnen von Mittelwert-Kantengradienten für jeden Pixelort oder durch Berechnen einer Approximation von zweiten Ableitungswerten des Mittelwertes von Pixeln für jeden Pixelort.
  • Vorzugsweise umfasst das Verfahren darüber hinaus das Steuern der Druckvorrichtung in Übereinstimmung mit den Bestimmungen dahingehend, ob sich jedes Pixel in einem Halbtonbereich mit hoher Frequenz oder in einem Halbtonbereich mit niedriger Frequenz befindet, um eine Reproduktion von wenigstens einem Abschnitt des Dokumentenbildes auszugeben. Vorzugsweise umfasst das Verfahren darüber hinaus ein Filtern des digitalen Bildes durch Descreening vor dem Ausgeben der Reproduktion von wenigstens einem Abschnitt des Dokumentenbildes.
  • Vorzugsweise besteht der Abschnitt aus dem eingebetteten Text und/oder Grafik, wobei das Ausgeben das Drucken des eingebetteten Textes und/oder Grafik ohne das Drucken des Halbtonbereiches umfasst, in dem der Text und/oder Grafik eingebettet ist.
  • Das Verfahren ermöglicht es dem eingebetteten Text und/oder Grafik „extrahiert" zu werden, so dass der eingebettete Text und/oder Grafik ohne den Halbtonbereich gedruckt werden können, in den er eingebettet ist.
  • Entsprechend einem weitere Aspekt stellt die Erfindung eine Vorrichtung gemäß Anspruch 10 in dem angehängten Satz von Ansprüchen bereit.
  • Ausführungsbeispiele der erfinderischen Vorrichtung können die folgenden Leistungsmerkmale enthalten: Vorzugsweise umfasst die Vorrichtung darüber hinaus einen Frequenzdetektor, der das digitale Bild analysiert, um für jedes Pixel zu bestimmen, ob sich das Pixel in einem Halbtonbereich mit hoher Frequenz oder einem Halbtonbereich mit niedriger Frequenz befindet, und wobei der Videoprozessor des Weiteren die Druckvorrichtung in Übereinstimmung mit der Bestimmung dahingehend, ob sich das Pixel in einem Halbtonbereich mit hoher Frequenz oder einem Halbtonbereich mit niedriger Frequenz befindet, steuert, um eine Reproduktion von wenigstens einem Abschnitt des Dokumentenbildes auszugeben.
  • Vorzugsweise umfasst die Vorrichtung darüber hinaus einen Descreening-Filter, der Screen-Effekte aus dem digitalen Bild entfernt, bevor die Druckvorrichtung die Reproduktion von wenigstens einem Abschnitt des Dokumentenbildes ausgibt.
  • Die Eingabevorrichtung kann einen Scanner umfassen.
  • Die Vorrichtung kann einen Digitalkopierer umfassen.
  • Im Folgenden werden Ausführungsbeispiele der Erfindung exemplarisch in Bezug auf die beigefügten Zeichnungen beschrieben, in denen:
  • 1 ein Beispiel von Text zeigt, der in Halbtonbereichen eingebettet ist, die wie einem Reproduktionsverfahren entsprechend dem Stand der Technik wiedergegeben werden;
  • 2 ist ein Ablaufplan, der die Schritte eines Ausführungsbeispiels eines digitalen Reproduktionsverfahrens in Übereinstimmung mit der Erfindung darstellt;
  • 3 ist ein Blockdiagramm, das eine Reproduktionsvorrichtung darstellt, die das in 2 dargestellte Verfahren ausführt;
  • Die 4A und 4B sind Graphen, die eine Variation von Pixelwerten in der horizontalen Richtung für eine in dem Halbtonbereich eingebettete vertikale Linie vor und nach dem Bilden von Mittelwerten darstellen; und
  • 5 zeigt ein Beispiel von Text in Halbtonbereichen, die in Übereinstimmung mit der vorliegenden Erfindung wiedergegeben werden.
  • Wie in 2 dargestellt ist, beginnt die Bildreproduktion in Übereinstimmung mit der Erfindung mit der Eingabe 10 einer digitalen Darstellung eines Bildes. Die digitale Darstellung enthält eine Vielzahl von Pixeln, und der Wert eines jeden Pixels zeigt den Tonzustand des Pixels an. So zeigt beispielsweise in einer Acht-Bit-Darstellung ein Pixelwert von 255 typischerweise ein vollständig weißes Pixel an, und ein Pixelwert von Null zeigt typischerweise ein vollständig schwarzes Pixel an. Wie in 3 dargestellt ist, enthält ein Digitalkopierer 100 einen Scanner 102, der ein Dokument 104 mit Text und Farbtonbereichen scannt und eine digitale Darstellung Vi,j des Dokumentenbildes ausgibt. Vi,j kann in einem Datenzwischenspeicher 106 gespeichert werden.
  • Die Bilddaten Vi,j werden in einem Frequenzanalyseschritt 20 unter Verwendung eines Frequenz-Analysators 109 analysiert. Der Frequenz-Analysator 109 analysiert, wie dies auf dem Gebiet der Technik bekannt ist (beispielsweise oben genannte US-A-4.194.221 und US-A-5.293.430), die Bilddaten und bestimmt, ob es sich um Bilddaten fortlaufenden Farbtons, Halbtons mit niedriger Frequenz oder Halbtons mit hoher Frequenz handelt. Der Frequenz-Analysator 109 gibt die Frequenzinformationen ωi,j für jedes Pixel aus, die anzeigen, ob sich das Pixel in einem Halbtonbereich mit niedriger Frequenz oder in einem Halbtonbereich mit hoher Frequenz befindet.
  • Die Bilddaten Vi,j von dem Zwischenspeicher 106 werden ebenfalls durch einen Mittelwertbildungs-Filter 112 verarbeitet, der einen Mittelwertbildungsprozess 30 (2) durchführt, um ein Mittelwertbild Ai,j zu erzeugen. Das Mittelwertbild Ai,j besteht aus einem lokalen Mittelwert für jeden Pixelort der Pixelwerte für diesen Pixelort und die um gebenden Pixelorte. Mit anderen Worten bedeutet dies, dass der lokale Mittelwert durch Mittelwertbildung der Pixelwerte innerhalb eines lokalen Mittelungsfensters erhalten wird, das jedes Pixel in dem Bild umgibt. Der Mittelwertbildungsprozess 30 (2), der durch den Mittelwertbildungs-Filter 112 (3 ) ausgeführt wird, kann mathematisch als Faltung dargestellt werden: Ai,j = Σ Ci,j × Vi,j (1)wobei Ci,j die Filterkoeffizienten sind.
  • Der Mittelwertbildungsprozess 30 „glättet" Variationen in den Pixelwerten in den Halbtonbereichen „aus", belässt jedoch eindeutige Variationen dort, wo Text vorhanden ist, selbst wenn der Text in einem Halbtonbereich eingebettet ist. So stellt 4A beispielsweise die Variation in horizontaler Richtung der Pixelwerte in der Nachbarschaft eine vertikalen Linie dar, die in einem Halbtonbereich eingebettet ist. Die Halbtonbereiche werden durch die Abschnitte dargestellt, die mit HT bezeichnet sind; die vertikale Linie wird durch den Abschnitt dargestellt, der mit L gekennzeichnet ist. Wie in 4B dargestellt ist, werden die Halbtonbereiche auf nahezu einheitliche Werte ausgeglättet, wie in den Bereichen, die mit HT' gekennzeichnet sind, dargestellt ist, während der Bereich L', der der vertikalen Linie entspricht, immer noch eine signifikante Änderung in dem lokalen Pixelwert aufweist.
  • In einer Umsetzung der Erfindung kann die Größe des Mittelungsfensters vorgegeben sein. Alternativ dazu sollte die Größe des Mittelungsfensters vorzugsweise auf Basis der horizontalen und der vertikalen Frequenzkomponenten des eingegebene Videosignals Vi,j variieren. Als Minimum muss das Mittelungsfenster sowohl in horizontaler Richtung als auch in vertikaler Richtung so groß sein wie die „Wellenlänge" des Bildes in der jeweiligen Richtung, das heißt, die Anzahl der Pixel, um die sich die periodischen Komponenten des Bildes selbst wiederholen. Wenn das Mittelungsfenster jedoch zu groß ist, besteht die Möglichkeit, dass der lokale Mittelwert für ein Textpixel übermäßig durch umgebende Halbtonpixel beeinflusst wird, so dass es den Anschein hat, als ob überhaupt kein Textpixel vorhanden ist. Darüber hinaus ist ein größeres Mittelungsfenster kostenintensiver hinsichtlich der erforderlichen Rechenleistung und des Rechenspeichers und den eigentlichen Kosten.
  • Für eine gewöhnliche Abtastauflösung von 400 Punkten pro Inch (spi) (16 Punkte/mm) könnte eine Fenstergröße von 3 Pixeln mal 3 Pixel verwendet werden. Ein Mittelungsfenster mit dieser Größe ist in der Lage, 45-Grad-Halbtöne bei 120 Zeilen pro Inch (Ipi) (5 Zeilen/mm) oder einer höheren Frequenz auszuglätten, ohne dass dabei das Vorhandensein von eingebettetem Text übergangen wird. Für eine Abtastauflösung von 600 spi (24 Punkte/mm) könnte das Mittelungsfenster auf eine Größe von 5 mal 5 Pixeln erweitert werden. Für eine Abtastauflösung von 400 spi (16 Punkte/mm) in horizontaler Richtung und 600 spi (24 Punkte/mm) in vertikaler Richtung wäre bei einer 45-Grad-Halbton-Frequenz von 120 Ipi (5 Zeilen/mm) oder höher, ein Mittelungsfenster mit einer Größe von 3 Pixeln horizontal und 5 Pixeln vertikal angemessen.
  • Die Art und Weise mit der von den Pixelwerten innerhalb des Mittelungsfensters die Mittelwerte bestimmt werden, kann ebenfalls variieren. In einer Umsetzung kann der lokale Mittelwert ein einfacher Mittelwert sein. In diesem Fall könnten unter Verwendung des Mittelungsfensters mit einer Größe von beispielsweise 3 mal 5 Pixeln, die Filterkoeffizienten Ci,j wie folgt ausgedrückt werden:
    Figure 00060001
  • Alternativ dazu kann auch ein Verfahren mit einem gewichteten Mittelwert angewendet werden. Ein bevorzugter Satz an Koeffizienten, der bessere Mittelwertbildungsergebnisse liefert, ist:
    Figure 00060002
  • Dieser Filter kann auf herkömmliche Weise implementiert werden, in dem zuerst Vi,j Faltung mit einem 4-Pixel-mal-4-Pixel-Filter mit Einheitskoeffizienten unterzogen wird und anschließend die Ausgabe dieses Filters unter Verwendung des gleichen 4-Pixel-mal-4-Pixel-Filters Faltung unterzogen wird.
  • Die Ausgabe Ai,j des Mittelwertbildungsfilters 112 kann in dem Datenzwischenspeicher 114 (3) gespeichert werden.
  • Als Nächstes wird das Mittelwertbild Ai,j durch den Text-Detektor 116 (3) verarbeitet, wobei Text und Halbtonbereiche mit niedriger Frequenz von Halbtonbereichen mit hoher Frequenz in Schritt 40 unterschieden werden (2). Der Text-Detektor 116 kann auf verschiedene Art und Weise zwischen Text und Halbtonbereichen unterscheiden. Bei einem Verfahren wird ein Bereich der Mittelwerte von Pixeln für jeden Pixelort bestimmt und zwar durch Subtrahieren des minimalen lokalen Pixelmittelwertes von dem maximalen lokalen Pixelmittelwertes in einer „Bereichsnachbarschaft", die das Pixel umgibt. Ein Bereichswert Ri,j wird an jedem Pixelort berechnet und mit einem geeigneten vorgegebenen Schwellenwert T1 verglichen. Wenn der lokale Bereichswert den Schwellenwert übersteigt, was anzeigt, dass es eine signifikante Variation in den lokalen Pixelmittelwerten in der Nachbarschaft des Pixels von Interesse gibt, wird ein Diskriminierungswert Di,j auf 1 eingestellt, um das Vorhandensein von einem Textpixel anzuzeigen; anderenfalls wird Di,j auf 0 eingestellt, um anzuzeigen, dass sich das Pixel in einem Halbtonbereich befindet, das heißt, in einem Bereich, in dem wenig Variation in den lokalen Pixelmittelwerten vorliegt.
  • Hinsichtlich der Größe der Nachbarschaft, über der der Bereichswert Ri,j bestimmt wird, hat sich herausgestellt, dass eine einfache 3-Pixel-mal-3-Pixel-Nachbarschaft gut funktioniert. Es sind jedoch auch andere Nachbarschaftskonfigurationen möglich. So könnte beispielsweise die Nachbarschaft zum Bestimmen des Bereiches der lokalen Pixelmittelwerte aus dem Pixel von Interesse und den vier benachbarten Pixeln in vertikaler Richtung und in horizontaler Richtung bestehen; alternativ dazu könnte sie aus dem Pixel von Interesse und den vier benachbarten Pixeln in den diagonalen Richtungen bestehen. Selbstverständlich kann auch eine größere Nachbarschaft verwendet werden. Wenn jedoch eine zu große Nachbarschaft verwendet wird, wird die Bestimmung dahin gehend, ob ein gegebenes Pixel ein Textpixel oder ein Halbtonpixel ist, unangemessen durch die Pixel beeinflusst, die zu weit von dem gegebenen Pixel, das das relevante Pixel sein soll, wegbewegt wurden. Darüber hinaus würden die Berechnungszeit und die Kosten steigen.
  • Hinsichtlich des Schwellenwertes T1 ist festgelegt worden, dass ein Wert von 40 empirisch gut für ein 8-Bit-Darstellungs-Schema funktioniert, bei dem 0 anzeigt, dass ein Pixel vollständig schwarz ist und 255 anzeigt, dass ein Pixel vollständig weiß ist. Der eigentliche Wert kann natürlich in Abhängigkeit von den bestimmten Parametern der jeweils verwendeten Verarbeitungsvorrichtung variieren. Es sollte dennoch beachtet werden, dass, wenn der Schwellenwert zu hoch eingestellt wird, die Pixel nicht durch den Text-Detektor 116 erfasst werden; und, wenn der Schwellenwert zu niedrig eingestellt wird, alle Halbtonpixel unangemessen als Textpixel klassifiziert werden.
  • Alternativ dazu wendet ein zweites Detektionsverfahren Kantendetektionsfilter auf das Mittelwertbild Ai,j an. So könnte man beispielsweise einen Sobel-Kantendetektor (siehe beispielsweise Pratt, „Digital Image Processing", 2nd Edition, John Wiley & Son, New York, 1991, S. 501) verwenden. In diesem Fall würde man die horizontalen und die vertikalen Kantengradienten wie folgt berechnen: GH = ¼ × [(Ai-j,j+1 + 2Ai,j+1 + Ai+1,j+1) – (Ai-1,j-1 + 2Ai,j-1 + Aj+1,j-1)] (4) GV = ¼ × [(Ai+j,j+1 + 2Ai+1,j + Ai+1,j-1) – (Ai+1,j+1 + 2Ai,j+1 + Aj-1,j-1)] (5)
  • Wenn die Summe der absoluten Werte der zwei Gradienten einen vorgegebenen Schwellenwert T2 übersteigt, wird das Pixel als ein Textpixel klassifiziert, und der lokale Diskriminierungswert Di,j auf 1 eingesellt; anderenfalls wird Di,j auf 0 eingestellt, um ein Halbtonpixel anzuzeigen.
  • Als ein drittes alternatives Verfahren können Text oder Zeilen innerhalb von Halbtonbereichen noch genauer erkannt werden, indem Approximationen der horizontalen und vertikalen zweiten Ableitungswerte der lokalen Pixelmittelwerte wie folgt berechnet werden: LH = ¼ × [(Ai-j,j+1 + 2Ai,j+1 + Ai+1,j+1) + (Ai-1,j-1 + 2Ai,j-1 + Aj+1,j-1)– 4Ai,j] (6) LV = ¼ × [(Ai+j,j+1 + 2Ai+1,j + Ai+1,j-1) + (Ai+1,j+1 + 2Aj+1 + Aj-1,j-1) – 4Ai,j] (7)
  • Wenn entweder LH oder LV einen vorgegebenen Schwellenwert T3 übersteigt, wird der Diskriminierungswert Di,j auf 1 eingestellt, um ein Textpixel anzuzeigen; anderenfalls wird er auf 0 eingestellt. Dieses Detektionsschema ist bei der Erkennung von „Furchen" in Zeilen beispielsweise lokale Maximumwerte oder Minimumwerte in horizontal ausgerichteten Zeilen oder „Ellenbogen" (Krümmungen) in vertikal ausgerichteten Zeilen nützlich.
  • Die Diskriminierungswerte Di,j können in dem Datenzwischenspeicher 118 gespeichert werden.
  • Anschließend verarbeitet der Videoprozessor 120 (3) entweder die Videobilddaten Vi,j oder die dem Descreening unterzogenen Bilddaten V'i,j in dem Verarbeitungsschritt 50 (2) auf Basis der Diskriminierungswerte Di,j und der Frequenzinformationen ωi,j. Descreening, das durch den Filter 121 (3) in Übereinstimmung mit auf dem Gebiet der Technik bekannten Verfahren (beispielsweise den oben erwähnten US-A-4.194.221 und US-A-5.293.430) durchgeführt wird, ist notwendig, um Moire-Störungsmuster zu verhindern, die auftreten können, wenn ein Bild, das bereits Screen-Effekte enthält, einem erneuten Screening unterzogen wird. Pixel, für die der Diskriminierungswert Di,j Null ist, sind Halbtonpixel mit hoher Frequenz, und sie werden als solche durch erneutes Screening des Descreening unterzogenen Bildes Vi,j unter Verwendung eines Bildschirms wiedergegeben, der für den Drucker 122 geeignet ist.
  • Pixel, für die der Diskriminierungswert Di,j anderenfalls 1 ist, sind nur vermutlich Textpixel. Dies rührt daher, dass der Text-Detektor 116 dazu tendiert, eine positive Reaktion (Di,j = 1) für Pixel zu erzeugen, die in Halbtonbereichen mit niedrigen Frequenzen ange ordnet sind, wenn der Mittelwertbildungsprozess ein kleines Mittelungsfenster verwendet und den Halbtonbereich nicht adäquat ausglättet. Der Frequenz-Analysator 109 ist jedoch gut in der Lage, zwischen den Halbtonbereichen mit niedriger Frequenz und den Halbtonbereichen mit hoher Frequenz zu unterscheiden. Aus diesem Grund verarbeitet der Videoprozessor 120 die Bilddaten nicht nur auf Basis des Diskriminierungssignals Di,j, sondern auch im Zusammenhang mit den Frequenzinformationen ωi,j, die durch den Frequenz-Detektor 109 ausgegeben werden. Wenn dementsprechend der Diskriminierungswert Di,j 1 ist und die Frequenzinformation ωi,j anzeigt, dass sich ein Pixel in einem Halbtonbereich mit hoher Frequenz befindet, kann das Pixel so wiedergegeben werden, als ob es ein Textpixel ist. In diesem Fall werden die ursprünglich eingegebenen Videobilddaten Vi,j unter Verwendung eines Schwellenwert- oder eines Fehlerdiffusionsverfahrens verarbeitet.
  • Schließlich steuert die Ausgabe Oi,j des Videoprozessors den Drucker 122, der die ausgegebene Kopie 124 (3) im Druckschritt 60 (2) druckt. Da die Textpixel durch ein Verfahren wiedergegeben werden, das für Text am geeignetesten ist, während die Halbtonpixel durch ein Verfahren wiedergegeben werden, das für diesen Typ von Pixeln am geeignetesten ist, ist die Gesamterscheinung des reproduzierten zusammengesetzten Dokumentenbildes (5) signifikant schärfer, als die Gesamterscheinung des Bildes, das ohne ein Unterscheiden zwischen Halbtonpixeln und darin eingebetteten Textpixeln erzeugt wird (1).
  • Obgleich diese Erfindung im Zusammenhang mit bestimmten Ausführungsbeispielen davon beschrieben worden ist, ist es klar, dass zahlreiche Alternativen, Modifizierungen und Abänderungen den Personen mit gewöhnlicher Erfahrung auf dem Gebiet der Technik offensichtlich werden. So kann beispielsweise, obgleich die Erfindung im Kontext eines Digitalkopierers beschrieben worden ist, das Verfahren der Erfindung auch auf einen Personalcomputer angewendet werden, der Bilddaten, die von einer Zusatzquelle empfangen wurden und einen Computerdrucker verwendet. Obgleich darüber hinaus in dem Kopier-Kontext das gesamte Dokumentenbild kundenspezifisch gedruckt wird, kann das Verfahren der Erfindung auch verwendet werden, um nur die Textabschnitte des Dokumentes zu „extrahieren" und zu drucken.

Claims (10)

  1. Verfahren zum Reproduzieren eines zusammengesetzten Dokumentenbildes (104), das einen Halbtonbereich, mit Text und/oder Grafik, in dem Halbtonbereich eingebettet, enthält, derartig, dass zwischen Halbtonbereichen, die Text und/oder Grafik eingebettet haben, und Halbtonbereichen, die keinen Text und/oder keine Grafik eingebettet haben, unterschieden wird, das Verfahren umfasst: a) Bereitstellen (10) eines digitalen Bildes des Dokumentes (104), wobei das digitale Bild eine Vielzahl von Pixeln umfasst, von denen jedes einen Wert hat, um den Tonzustand des Pixels darzustellen; b) Bestimmen (30) eines Mittelwertbildes des Dokumentes (104) durch Berechnen für jedes der Pixel eines einfachen Mittelwertes oder eines gewichteten Mittelwertes der Werte der Pixels innerhalb eines Mittelungsfensters, das das Pixel umgibt; c) Bestimmen (40) eines Diskriminierungswertes für jedes Pixel auf Basis des Mittelwertbildes, der anzeigt, ob das Pixel ein Halbtonpixel oder ein in einem Halbtonbereich eingebettetes Text-/Grafikpixel ist, und d) Steuern (50) einer Druckvorrichtung in Übereinstimmung mit den Diskriminierungswerten, um eine Reproduktion wenigstens eines Teils des Dokumentenbildes auszugeben.
  2. Verfahren nach Anspruch 1, wobei das Mittelungsfenster vorgegebene Abmessungen hat.
  3. Verfahren nach Anspruch 1 oder 2, wobei das Mittelungsfenster variable Abmessungen hat und das Verfahren des Weiteren umfasst: e) Bestimmen der Abmessungen auf Basis einer Abtastauflösung, die verwendet wird, um das zusammengesetzte Dokumentenbild zu erzeugen, oder e') Bestimmen der Abmessungen auf Basis einer Frequenzkomponente des Halbtonbereiches.
  4. Verfahren nach einem der vorhergehenden Ansprüche, das des Weiteren umfasst: f) Bestimmen eines Bereichswertes für jedes der Pixel durch Berechnen eines Bereiches der Mittelwerte von Pixeln in einer Nachbarschaft, die das Pixel umgibt, und wobei der Schritt c) das Bestimmen, ob das Pixel ein Halbtonpixel oder ein Text-/Grafikpixel ist, auf Basis des Bereichswertes umfasst.
  5. Verfahren nach den Ansprüchen 1 bis 3, das des Weiteren umfasst: f') Bestimmen eines Gradientenwertes für jedes der Pixel durch Berechnen eines horizontalen und eines vertikalen Kantengradienten auf Basis des Mittelwertbildes und wobei der Schritt c) das Bestimmen für jedes Pixel, ob das Pixel ein Halbtonpixel oder ein Text-/Grafikpixel ist, auf Basis des Gradientenwertes umfasst.
  6. Verfahren nach einem der Ansprüche 1 bis 3, das des Weiteren umfasst: f'') Bestimmen eines zweiten Ableitungswertes für jedes der Pixel durch Berechnen einer Approximation zu einem horizontalen und einem vertikalen zweiten Ableitungswert des Ortsmittelwertes der Pixel und wobei der Schritt e) das Bestimmen für jedes Pixel, ob das Pixel ein Halbtonpixel oder ein Text-/Grafikpixel ist, auf Basis des Ableitungswertes umfasst.
  7. Verfahren nach einem der vorhergehenden Ansprüche, das des Weiteren das Analysieren der Dokumentenbildfrequenz umfasst, und wobei die Druckvorrichtung in dem Schritt d) in Übereinstimmung mit der analysierten Frequenz gesteuert wird.
  8. Verfahren nach einem der vorhergehenden Ansprüche, das des Weiteren das Descreening des Dokumentenbildes umfasst, und wobei die Druckvorrichtung in dem Schritt d) in Übereinstimmung mit dem Descreening unterzogenen Bild gesteuert wird.
  9. Programmierbare Bildverarbeitungsvorrichtung, die, wenn geeignet programmiert, das Verfahren nach einem der Ansprüche 1 bis 8 ausführt.
  10. Vorrichtung (100) zum digitalen Reproduzieren eines zusammengesetzten Dokumentenbildes (104), das einen Halbtonbereich, mit Text und/oder Grafik, in dem Halbtonbereich eingebettet, enthält, derartig, dass zwischen Halbtonbereichen, die Text und/oder Grafik eingebettet haben, und Halbtonbereichen, die keinen Text und/oder keine Grafik eingebettet haben, unterschieden wird, die Vorrichtung umfasst: eine Eingabevorrichtung (102), konfiguriert, um ein digitales Bild des Dokumentes bereitzustellen, wobei das digitale Bild eine Vielzahl von Pixeln umfasst, von denen jedes einen Wert hat, um den Tonzustand des Pixels darzustellen; eine Mittelungseinrichtung (112), die ein Mittelwertbild des Dokumentes (104) durch Berechnen für jeden der Pixel eines einfachen Mittelwertes oder eines gewichteten Mittelwertes der Werte der Pixel innerhalb eines Mittelungsfensters, das das Pixel umgibt, bestimmt; einen Textdetektor (116), der einen Diskriminierungswert für jedes Pixel auf Basis des Mittelwertbildes bestimmt, der anzeigt, ob das Pixel ein Halbtonpixel oder ein in einem Halbtonbereich eingebetteter Text-/Grafikpixel ist, und einen Videoprozessor (120), der eine Druckvorrichtung in Übereinstimmung mit den Diskriminierungswerten steuert, um eine Reproduktion wenigstens eines Teils des Dokumentenbildes (104) auszugeben.
DE69736938T 1996-05-30 1997-05-28 Detektion und Wiedergabe von Text in gerasterten Bildbereichen Expired - Lifetime DE69736938T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US655523 1996-05-30
US08/655,523 US5852678A (en) 1996-05-30 1996-05-30 Detection and rendering of text in tinted areas

Publications (2)

Publication Number Publication Date
DE69736938D1 DE69736938D1 (de) 2006-12-28
DE69736938T2 true DE69736938T2 (de) 2007-05-31

Family

ID=24629231

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69736938T Expired - Lifetime DE69736938T2 (de) 1996-05-30 1997-05-28 Detektion und Wiedergabe von Text in gerasterten Bildbereichen

Country Status (4)

Country Link
US (1) US5852678A (de)
EP (1) EP0810774B1 (de)
JP (1) JPH1070650A (de)
DE (1) DE69736938T2 (de)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW368640B (en) * 1996-12-25 1999-09-01 Hitachi Ltd Image processor, image processing device and image processing method
US6252676B1 (en) * 1997-06-04 2001-06-26 Agfa Corporation System and method for proofing
US6633411B1 (en) * 1998-04-01 2003-10-14 International Business Machines Corporation Method and apparatus for repurposing binary images
US6266153B1 (en) * 1998-05-12 2001-07-24 Xerox Corporation Image forming device having a reduced toner consumption mode
US6201613B1 (en) * 1998-07-22 2001-03-13 Xerox Corporation Automatic image enhancement of halftone and continuous tone images
JP2002525722A (ja) 1998-09-15 2002-08-13 フェーズ・ワン・アクティーゼルスカブ 画像処理方法とシステム
US6233060B1 (en) * 1998-09-23 2001-05-15 Seiko Epson Corporation Reduction of moiré in screened images using hierarchical edge detection and adaptive-length averaging filters
US6614930B1 (en) * 1999-01-28 2003-09-02 Koninklijke Philips Electronics N.V. Video stream classifiable symbol isolation method and system
US6289122B1 (en) 1999-04-15 2001-09-11 Electronics For Imaging, Inc. Intelligent detection of text on a page
US6522427B1 (en) 1999-09-21 2003-02-18 Seiko Epson Corporation Color table manipulations for contour reduction
US6546132B1 (en) * 1999-09-21 2003-04-08 Seiko Epson Corporation Color table manipulations for smooth splicing
US6711303B1 (en) * 1999-12-01 2004-03-23 Eastman Kodak Company Method and computer program for detecting rotation and magnification of images
US6625312B1 (en) 2000-02-28 2003-09-23 Xerox Corporation Document classification using segmentation tag statistics
KR20020027332A (ko) * 2000-03-31 2002-04-13 요트.게.아. 롤페즈 텍스트 검출
US6721458B1 (en) 2000-04-14 2004-04-13 Seiko Epson Corporation Artifact reduction using adaptive nonlinear filters
US7023576B1 (en) * 2000-05-09 2006-04-04 Phase One A/S Method and an apparatus for elimination of color Moiré
US6778700B2 (en) 2001-03-14 2004-08-17 Electronics For Imaging, Inc. Method and apparatus for text detection
US6792160B2 (en) * 2001-07-27 2004-09-14 Hewlett-Packard Development Company, L.P. General purpose image enhancement algorithm which augments the visual perception of detail in digital images
JP4143035B2 (ja) * 2002-02-25 2008-09-03 ゾラン コーポレイション テキストとグラフィックスの自動分別方法
US7019761B2 (en) 2002-02-25 2006-03-28 Zoran Corporation Methods for auto-separation of texts and graphics
US7148998B2 (en) * 2002-05-31 2006-12-12 Hewlett-Packard Development Company, L.P. System and method for automatic descreening of digital images
US7079686B2 (en) * 2002-08-20 2006-07-18 Lexmark International, Inc. Systems and methods for content-based document image enhancement
US7239430B2 (en) * 2002-12-12 2007-07-03 Xerox Corporation Binary halftone detection
US7345792B2 (en) * 2002-12-17 2008-03-18 Xerox Corporation Segmentation-based halftoning
US7639392B2 (en) * 2003-03-28 2009-12-29 Infoprint Solutions Company, Llc Methods, systems, and media to enhance image processing in a color reprographic system
US7433535B2 (en) * 2003-09-30 2008-10-07 Hewlett-Packard Development Company, L.P. Enhancing text-like edges in digital images
FR2860902B1 (fr) * 2003-10-10 2005-12-09 France Telecom Determination de caracteristiques textuelles de pixels
US7379595B2 (en) * 2004-05-24 2008-05-27 Xerox Corporation Manual windowing with auto-segmentation assistance in a scanning system
US7630544B1 (en) 2005-04-06 2009-12-08 Seiko Epson Corporation System and method for locating a character set in a digital image
US9247090B2 (en) 2005-10-20 2016-01-26 Hewlett-Packard Development Company, L.P. Printing and printers
US20080005684A1 (en) * 2006-06-29 2008-01-03 Xerox Corporation Graphical user interface, system and method for independent control of different image types
US7856142B2 (en) * 2007-01-26 2010-12-21 Sharp Laboratories Of America, Inc. Methods and systems for detecting character content in a digital image
US7965413B2 (en) 2007-03-29 2011-06-21 Xerox Corporation Method and system for detection of binary halftone frequencies
US8228561B2 (en) * 2007-03-30 2012-07-24 Xerox Corporation Method and system for selective bitmap edge smoothing
US8121403B2 (en) * 2007-10-30 2012-02-21 Sharp Laboratories Of America, Inc. Methods and systems for glyph-pixel selection
US8189917B2 (en) * 2008-09-25 2012-05-29 Sharp Laboratories Of America, Inc. Methods and systems for locating text in a digital image
US8368959B2 (en) * 2009-05-18 2013-02-05 Xerox Corporation Method and system for selective smoothing of halftoned objects using bitmap encoding
US9578207B1 (en) * 2015-09-30 2017-02-21 Csr Imaging Us, Lp Systems and methods for selectively screening image data
US9973654B1 (en) 2017-04-04 2018-05-15 Xerox Corporation Methods and devices for enhancing edges of a graphic object

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4194221A (en) * 1978-12-26 1980-03-18 Xerox Corporation Automatic multimode continuous halftone line copy reproduction
US4554593A (en) * 1981-01-02 1985-11-19 International Business Machines Corporation Universal thresholder/discriminator
GB2153619B (en) * 1983-12-26 1988-01-20 Canon Kk Image processing apparatus
US4853792A (en) * 1987-02-04 1989-08-01 Sharp Kabushiki Kaisha Image signal binary encoder
JP2702928B2 (ja) * 1987-06-19 1998-01-26 株式会社日立製作所 画像入力装置
US5001767A (en) * 1987-11-30 1991-03-19 Kabushiki Kaisha Toshiba Image processing device
JP3276985B2 (ja) * 1991-06-27 2002-04-22 ゼロックス・コーポレーション イメージピクセル処理方法
US5317419A (en) * 1991-08-07 1994-05-31 Konica Corporation Image recognition apparatus
US5446802A (en) * 1991-09-05 1995-08-29 Minolta Camera Kabushiki Kaisha Image processing apparatus comprising judgement means for judging dot photograph image, photograph image and character image

Also Published As

Publication number Publication date
JPH1070650A (ja) 1998-03-10
EP0810774A2 (de) 1997-12-03
DE69736938D1 (de) 2006-12-28
EP0810774A3 (de) 1999-05-26
US5852678A (en) 1998-12-22
EP0810774B1 (de) 2006-11-15

Similar Documents

Publication Publication Date Title
DE69736938T2 (de) Detektion und Wiedergabe von Text in gerasterten Bildbereichen
DE69419682T2 (de) Raumfiltereinheit zur adaptiven Randverstärkung
DE69511507T2 (de) Verfahren und Vorrichtung zur automatischen Bildsegmentierung unter Verwendung von Standardvergleichsmustern
DE69226825T2 (de) Verbessertes automatisches Segmentieren von Bildern
DE69029229T2 (de) Digitale halbtonrasterung mit fehlerdiffusion
DE69318876T2 (de) System und Verfahren zur Umwandlung von Halbtonbildern in Bilder mit kontinuierlichen Tönen
DE60111756T2 (de) Verfahren zum verbessern der kompressionsfähigkeit und der bildqualität von abgetasteten dokumenten
DE69228921T2 (de) Verfahren und programmierbares Gerät zur Bestimmung des Hintergrundpegels eines Dokuments
DE69620302T2 (de) Verfahren und Vorrichtung zur Verbesserung eines digitalen Bildes
DE3546135C2 (de)
DE69708449T2 (de) Vorrichtung zur Umwandlung von Graupegeln eines Bildes, Verfahren dafür, Programmspeichereinrichtung dafür, und Infrarotkamera
DE69032318T2 (de) Vorrichtung zur Bildverarbeitung
DE69533054T2 (de) Mehrfenstertechnik zur Schwellenwertverarbeitung eines Bildes unter Verwendung lokaler Bildeigenschaften
DE69209540T2 (de) Bildverarbeitungsgerät
DE4445386C1 (de) Verfahren und Vorrichtung zur Trennung einer Vordergrundinformation von einer Hintergrundinformation in einer Vorlage
DE3881392T2 (de) System und Verfahren für automatische Segmentierung.
DE69411804T2 (de) Umgekehrte Halbtonrasterung durch lineare Filterung und statistische Glättung
DE69822923T2 (de) Verfahren und Vorrichtung zur Kantenhervorhebung
DE69706763T2 (de) Verfahren und Vorrichtung zum selektiven Bearbeiten von abgetasteten Bildvorlagen
DE69732955T2 (de) Adaptive Rauschverminderung von Videobildern
DE69029169T2 (de) Bildverarbeitung mit Rauschanreicherungsoperatoren für Moire-Verringerung und/oder Zufallspunkterzeugung
DE69306847T2 (de) Bildverarbeitungssystem und -methode unter Anwendung adaptiver Abtastung von Halbtonvorlagen um besser druckbare Bilder zu erzeugen
DE2948341A1 (de) Verfahren zum verarbeiten von bildelementen und vorrichtung zum verarbeiten einer bilddatenreihe
DE69122421T2 (de) Verfahren und Gerät zum Hervorheben der Bildschärfe
DE69925354T2 (de) Bildverarbeitungssystem um vertikale Muster auf abgetasteten Bildern zu reduzieren

Legal Events

Date Code Title Description
8364 No opposition during term of opposition