DE19536170A1 - Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen - Google Patents
Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der InformationenInfo
- Publication number
- DE19536170A1 DE19536170A1 DE19536170A DE19536170A DE19536170A1 DE 19536170 A1 DE19536170 A1 DE 19536170A1 DE 19536170 A DE19536170 A DE 19536170A DE 19536170 A DE19536170 A DE 19536170A DE 19536170 A1 DE19536170 A1 DE 19536170A1
- Authority
- DE
- Germany
- Prior art keywords
- image
- template
- threshold value
- image properties
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Description
Die Erfindung betrifft die Ermittlung von Schwellwerten bei der
Digitalisierung von Bildern.
Um eine Bild- oder Zeichenerkennung (Optical Character
Recognition) in einem elektronisch abgetasteten und
digitalisierten Dokument durchführen zu können, müssen häufig in
einem ersten Vorverarbeitungsschritt (image preprocessing), die
Informationen des Vordergrundes von den Informationen des
Hintergrundes getrennt werden. Dabei stellen die Informationen
des Vordergrundes oftmals die eigentlichen, für die
Zeichenerkennung zu betrachtenden (wichtigen) Bilddaten dar,
während die Informationen des Hintergrundes vielfach störend
wirken und zu Fehlinterpretationen der Vordergrundinformationen
führen können. Auch tragen die Daten des Hintergrund des Bildes
häufig zu einer Herabsetzung der Erkennungsleistung der
Vordergrundinformation bei einer durchzuführenden
Zeichenerkennung bei. Die Informationen des Hintergrundes
sollten daher möglichst vor der Bild- oder Zeichenerkennung
entfernt werden.
Die Hintergrunddaten in einem Bild setzen sich zumeist aus
Störungen bei der Digitalisierung (wie Rauschen) und optisch
nicht herausfilterbare Bestandteile des digitalisierten
Dokumentes (z. B. Verschmutzungen, Schriftteile, Stempel, usw.)
zusammen. Um eine optimale Erkennungsrate in einer
anschließenden Bildverarbeitung erreichbar zu machen, sollten
die Bilddaten nach einer Bildaufbereitung idealerweise nur noch
die Daten enthalten, die später durch die Zeichenerkennung
verarbeitet werden sollen. Je besser die Bildaufbereitung vor
der Erkennung ist, desto günstiger sind auch die
Erkennungsergebnisse zu erwarten.
Viele Bildverarbeitungseinheiten erwarten als
Eingangsinformation ein in den Graustufen reduziertes Bild, z. B.
ein binarisiertes Schwarz/Weiß Bild. Zur Erzeugung eines
elektronisch abgetasteten Bildes von einer Vorlage werden
vielfach Lesegeräte (Scanner) herangezogen, die mit einer
vorgegebenen Abtastfrequenz (z. B. 200 bis 300 Bildpunkte pro
Quadratzoll) Bilder mit einer Vielzahl von Graustufen (z. B. 16
oder 256 Graustufen) liefern.
Bedingt durch eine Reihe von Fehlermöglichkeiten beim
elektronischen Einlesen einer Vorlage, wie beispielsweise
Scannertoleranzen oder einen mangelhaften Abgleich einzelner
Lese-Elemente eines Scanners, können bereits hier eine Reihe von
Einflußgrößen auftreten, die eine Bilderkennung nachteilig
beeinträchtigen können. Bei dem Vorgang der elektronischen
Umsetzung der Vorlage in ein elektronisches Bild werden
Bildstörungen insbesondere durch unzureichende Justierungen der
Einlesevorrichtung hervorgerufenen. Wird beispielsweise eine
Vorlage in horizontaler Richtung eingelesenen, so kann das
elektronische Grauwert-Bild der Vorlage horizontale Streifen
aufweisen, wenn die Lesezellen der Einlesevorrichtung in
vertikaler Richtung angeordnet sind und diese unterschiedlich
justiert wurden. Die horizontalen Streifen werden durch die
unterschiedlichen Empfindlichkeiten bzw. Justagen der einzelnen
Lesezellen bedingt.
Auch Art und Qualität der Vorlage selbst können die
Bilderkennung entscheidend prägen. So gehen bei einer Wandlung
eines Farbbildes in ein Graubild eventuell vorhandene
Farbkontraste verloren. Bei handschriftlichen, aber auch bei
maschinellen Eintragungen auf einer Vorlage hängt die Les- und
Erkennbarkeit auch insbesondere von deren Kontrastierung,
bedingt beispielsweise durch mehr oder minder starkes Andrücken
beim Schreiben, ab.
Für eine Reihe von Anwendungen besteht die Anforderung,
zusätzlich zu der Erzeugung eines Bildes für eine
Zeichenerkennung - das sogenannte Netto-Bild - ein Bild für eine
Archivierung - das sogenannte Brutto-Bild - zu erzeugen. Es
müssen also zwei elektronische Bilder erzeugt werden, was aus
Zeitgründen nach Möglichkeit ohne Durchsatzverlust durchgeführt
werden sollte. Von den momentan verfügbaren Anwendungen werden
hierfür Schwarz/Weiß Bilder, sowohl für die Erkennungseinheit
als auch für Archivierungszwecke, verwendet, da Graustufenbilder
rechenintensiv komprimiert und dekomprimiert werden müssen und
dennoch einen höheren Speicherbedarf als Schwarz/Weiß Bilder
haben.
Durch eine elektronische Abtastung einer Vorlage erhält man ein
elektronisches Bild der Vorlage, worin jedem Bildpunkt (Pixel)
ein Bildwert, beispielsweise ein Grauwert, ein Schwarz- oder
Weißwert oder ein Farbwert, zugeordnet ist. Durch die Verwendung
von Filtern lassen sich diese Zuordnungen beeinflussen. Bei
Anwendung eines Schwellwert-Filters lassen sich beispielsweise
die Bildwerte ober- bzw. unterhalb eines vorgegebenen
Schwellwertes aus dem elektronischen Bild herausfiltern. So
lassen sich z. B. die für eine Bildverarbeitung nicht gewünschten
Hintergrundinformationen oder Störeffekte eliminieren.
Die herausgefilterten Bildwerte stehen jedoch danach weder für
ein Archivbild noch für eine Bilderkennung zur Verfügung.
Eventuell unbeabsichtigt ausgefilterte Vordergrundinformationen
können so das Ergebnis einer anschließenden Bilderkennung
verfälschen. Je nach Wert des Schwellwertes gehen mehr oder
minder viele Informationen verloren. Der Wahl des Schwellwertes
kommt so eine eminente Bedeutung für die Qualität der
Bilderkennung zu.
Zur Erzeugung von Binärbildern aus Graustufenbildern werden
vielfach statische oder dynamische Konvertierungsalgorithmen
verwendet. Aus dem Buch von Peter Haberäcker, "Digitale
Bildverarbeitung", Carl Hanser Verlag München Wien, ISBN 3-446-
14442-0, 1985, sind eine Reihe von Verfahren zur
Bildverarbeitung bekannt, die auch für eine Bildvorverarbeitung
angewandt werden können. Es werden dort insbesondere als
Operationen im Ortsbereich (Kap. 8) Verfahren zur Glättung der
Grauwerte (Kap. 8.1) und die Anwendung von Differenzenoperatoren
(Kap. 8.2), sowie Verfahren zur dynamischen
Schwellwertbestimmung (Kap. 12.3) vorgestellt.
Eine Übersicht über die bekanntesten Verfahren zur Ermittlung
eines Schwellwertes ist in P.K.Sahoo, S.Soltani and A.K.C.Wong
"A Survey of Thresholding Techniques", Computer Vision, Graphics
and Image Processing 41, 233-260, 1988 zu finden. Es wird dort
zwischen Histogramm-Transformations-Methoden, die zur Ermittlung
des Schwellwertes die Form eines Histogramms einer
Grauwertverteilung verändern und Algorithmen zur
Schwellwertberechnung unterschieden.
Aus US-A-4,590,606 und US-A-5,038,381 sind weitere Verfahren zur
Bildverarbeitung, wie z. B. Vordergrundfilter durch
Laufzeitverhalten, bekannt.
EP-A-0.505.729 beschreibt ein System zur Binarisierung von
Bildern, das ein Lesen von Dokumenten mit einer normalen
Printqualität ermöglicht.
Allen Verfahren mit einer Ausfilterung von Informationen aus
einer elektronischen Vorlage ist jedoch gemein, daß durch das
Filtern auch eventuell solche Informationen, die für eine
Bilderkennung notwendig sind, verlorengehen können.
Es ist Aufgabe der Erfindung, den Prozeß der Vorbereitung von
Bildern für eine Bilderkennung zu verbessern, um so eine erhöhte
Erkennbarkeit der gewonnenen Bilder zu gewährleisten. Die
Aufgabe wird durch die unabhängigen Ansprüche gelöst.
Erfindungsgemäß erfolgt eine Ermittlung eines Schwellwertes für
die Erzeugung eines elektronischen Bildes aus einer Vorlage
unter Berücksichtigung der jeweiligen Bildeigenschaften der
Vorlage. Die Bildeigenschaften werden dabei insbesondere durch
den Bildinhalt, also die eigentlichen Bilddaten, und
Bildstörungen, also ungewollte Veränderungen des Bildinhaltes,
geprägt. Bei den Bildstörungen ist zu unterscheiden zwischen
solchen, die durch den Vorgang der elektronischen Umsetzung der
Vorlage in ein elektronisches Bild hervorgerufen werden und
solchen, die bereits in der Vorlage vorhanden sind.
In einem ersten Schritt erfolgt eine erste Erfassung der
Bildeigenschaften der Vorlage, z. B. durch ein Einscannen der
Vorlage mit einem vorgewählten Schwellwert oder durch eine
beliebige andere Erfassungsweise. Vorzugsweise wird für die
Erfassung bereits mindestens ein Schwellwert z. B. aufgrund von
Erfahrungen oder als Mittelwert vorgewählt. Insbesondere eignet
sich auch die Erzeugung eines Schwarz-/Weißbildes oder eines
Grauwertbildes aus der Vorlage zur Erfassung der
Bildeigenschaften.
In einem zweiten Schritt erfolgt eine Analyse der
Bildeigenschaften der Vorlage. Zu diesen vorlagenbedingten
Bildeigenschaften gehören beispielsweise die eigentlichen
Bilddaten, der Bildinhalt aber auch Bildstörungen. Die Analyse
der Bildeigenschaften der Vorlage kann entweder selektiv für
einzelne Bereiche der Vorlage oder integral für die gesamte
Vorlage durchgeführt werden.
In einem dritten Schritt wird dann mindestens ein Schwellwert
aus dem Ergebnis bzw. den Ergebnissen der Analyse der
vorlagenbedingten Bildeigenschaften ermittelt. Entsprechend der
durchgeführten Analyse der Bildeigenschaften der Vorlage kann
entweder jeweils mindestens ein Schwellwert selektiv für die
einzelnen Bereiche der Vorlage oder ein Schwellwert integral für
die gesamte Vorlage ermittelt werden.
Wurde in dem ersten Schritt bereits ein Schwellwert vorgegeben,
so kann dieser vorgegebene Schwellwert aufgrund der Analyse der
Bildeigenschaften der Vorlage an die ermittelten
Bildeigenschaften angepaßt werden. Der vorgegebene Schwellwert
wird dann entsprechend der Ergebnisse der Analyse der
Bildeigenschaften der Vorlage verändert, bzw. auch gleich
gelassen falls eine Änderung nicht notwendig ist.
Die Ermittlung des Schwellwertes aus den vorlagenbedingten
Bildeigenschaften erfolgt durch eine Analyse der räumlichen bzw.
örtlichen Verteilung der Bildeigenschaften, die auch als lokale
Bildfrequenzen bezeichnet werden. Aus der Verteilungsanalyse
läßt sich wiederum auf einen möglichen, zu erwartenden
Bildinhalt zurückschließen. Wird beispielsweise bei einem
Schwarz-/Weißbild eine Verteilungsdichte der schwarzen
Bildpunkte in einem Bereich oberhalb eines vorgebbaren
Grenzwertes der Verteilungsdichte ermittelt, so liegt
voraussichtlich in diesem Bereich eine wesentliche
Bildinformation, wie z. B. eine Schrift, ein Bild oder jeweils
Teile davon, vor. Der Schwellwert kann für diesen Bereich nun so
verändert werden, daß durch die Schwellwertfilterung weniger
Informationen verloren gehen. Wird in einem anderem Bereich in
diesem Schwarz-/Weißbild eine Verteilungsdichte der schwarzen
Bildpunkte unterhalb des vorgegebenen Grenzwertes ermittelt, so
liegt in diesem Bereich voraussichtlich keine wesentliche
Bildinformation oder nur eine Bildstörung vor. Der Schwellwert
kann für diesen Bereich nun so verändert werden, daß durch die
Schwellwertfilterung mehr Informationen eliminiert werden.
Die Verteilungsanalyse erfolgt vorzugsweise durch eine
Ermittlung der örtlichen Variation der Grau- bzw. Farbwerte,
z. B. entlang einer Zeile. Bei einem erzeugten Schwarz-/Weißbild
der Vorlage lassen sich so beispielsweise die Anzahl der
Schwarzwerte entlang einer Zeile - oder eines Zeilenausschnittes
- ermitteln. Bei einem erzeugten Grauwertbild der Vorlage kann
beispielsweise die Anzahl der Änderungen der Grauwerte entlang
einer Zeile oder eines Zeilenausschnittes ermittelt werden.
Die örtliche Variation der Grau- bzw. Farbwerte, also
beispielsweise die ermittelte Anzahl oder Dichte der
Schwarzwerte oder der Anzahl der Änderungen der Grauwerte, ist
vielfach ein Maß für den Informationsgehalt des betrachteten
Bereiches in der Vorlage. Die ermittelte örtliche Variation der
Grau- bzw. Farbwerte kann nun mit vorgebbaren Werten verglichen
werden, die so einen Rückschluß auf den wahrscheinlichen Inhalt
des Bereiches zulassen, also beispielsweise, ob der Bereich
voraussichtlich ein Bild oder eine Schrift enthält. Wird so ein
Bereich der voraussichtlich ein Bild oder eine Schrift
beinhaltet erkannt, kann der Schwellwert für diesen Bereich so
angepaßt werden, daß die Gefahr eines Informationsverlusts durch
die Schwellwertfilterung reduziert wird. Analog dazu kann der
Schwellwert in Bereichen, in denen keine wesentliche
Bildinformation oder nur eine Bildstörung vermutet wird, so
angepaßt werden, daß durch die Schwellwertfilterung mehr
Informationen herausgefiltert werden.
Ist beispielsweise in einem Schwarz-/Weißbild eine ermittelte
Anzahl der Schwarzwerte pro Längen- oder Flächeneinheit, bzw. in
einem Graubild die Anzahl der Änderungen der Grauwerte pro
Längen- oder Flächeneinheit größer als ein vorgegebener Wert,
deutet dies auf eine Schrift oder ein Bild in diesem Bereich
hin. Entsprechend deutet eine ermittelte Anzahl der Schwarzwerte
bzw. die Anzahl der Änderungen der Grauwerte pro Längen- oder
Flächeneinheit kleiner als ein vorgegebener Wert auf eine
Bildstörung oder zumindest auf eine unwesentliche
Bildinformation in diesem Bereich hin.
Aus der Verteilungsanalyse lassen sich also insbesondere die für
eine Bilderkennung interessante Bereiche, wie eine Schrift oder
ein Bild, erkennen. Weiterhin ermöglicht die Verteilungsanalyse
eine Hintergrunderkennung bei einem regelmäßigen Hintergrund.
Besteht die Vorlage nun aus Bildteilen mit ausschließlicher
Vorder- und/oder Hintergrundinformation, lassen sich die
einzelnen Bereiche mit unterschiedlichen Schwellwerten
bearbeiten. Hintergrundbereiche können so bereinigt werden,
während die für die Bilderkennung interessanten Bereiche
sicherer, im Sinne der Gefahr von Informationsverlusten,
verarbeitet werden.
Der oder die Schwellwerte können weiterhin an die
systembedingten Bildeigenschaften durch eine geeignete Wahl der
Bereiche für eine Untersuchung lokaler Bildeigenschaften
angepaßt werden. Zu den systembedingten Bildeigenschaften
gehören u. a. die durch den Einlesevorgang hervorgerufenen
Bildstörungen oder die Vorlagentyp-spezifischen
Bildeigenschaften, die von Vorlage zu Vorlage eines Vorlagentyps
gleich bleiben. Die vorlagentyp-spezifischen Bildeigenschaften
werden insbesondere durch den Bildaufbau und die Bildeinteilung
des jeweiligen Vorlagentyps geprägt. Bei einer Vorlage, die in
horizontaler Richtung eingelesen wird, werden die
Untersuchungsbereiche vorzugsweise horizontal länglich (z. B.
zeilenweise) - entsprechend der horizontalen Einleseweise -
angenommen. Entsprechend werden bei Vorlagen, bei denen die
Informationen überwiegend zeilenweise (oder vertikal) auftreten,
die Bereiche ebenfalls zeilenhaft (oder vertikal) ausgeprägt.
Die Erfindung findet Anwendung bei der (Vor-)verarbeitung von
Dokumenten für eine Bilderkennung und/oder für eine Archivierung
der Dokumente.
Weitere, vorteilhafte Ausführungen der Erfindung finden sich in
den Unteransprüchen.
Zur näheren Erläuterung der Erfindung sind im folgenden
Ausführungsbeispiele mit Bezugnahme auf die Zeichnungen
beschrieben. Funktionsgleiche Elemente sollen gleiche
Bezugszeichen tragen.
Fig. 1 zeigt eine Vorlage mit einer Schrift und einer
zufälligen Bildstörung,
Fig. 2 zeigt ein elektronisches Grauwertbild der Vorlage,
aus Fig. 1, das mit einem einheitlichen, mittleren
Schwellwert aus der Vorlage gewonnen wurde,
Fig. 3 zeigt die Grauwertverteilung in horizontaler
Richtung für 3 exemplarisch ausgewählte
Zeilenbereiche A, B und C mit einer Länge L in dem
Grauwertbild aus Fig. 2,
Fig. 4 zeigt ein gemäß der Erfindung aus der Vorlage in
Fig. 1 gewonnenes Bild,
Fig. 5 erläutern die Erfindung an einem Beispiel eines
Scanners, der eine 4-Bit-Wandlung durchführt.
Fig. 1 zeigt eine Vorlage 10 mit einer Schrift 20 und einer
zufälligen Bildstörung 30. Fig. 2 zeigt ein elektronisches
Grauwertbild 40 der Vorlage 10, das mit einem einheitlichen,
mittleren Schwellwert SWmittel aus der Vorlage 10 gewonnen wurde.
Der mittlere Schwellwert SWmittel kann beispielsweise aus einer
Mittelung der Grauwertverteilung der Vorlage oder eines
Bereiches davon stammen oder als Erfahrungswert einfach
vorgegeben werden. Das Grauwertbild 40 weist ein Bild 20′ der
Schrift 20 und ein Bild 30′ der zufälligen Bildstörung 30 auf.
Wie aus Fig. 2 zu entnehmen ist, sind durch die
Schwellwertfilterung Informationen verloren gegangen, die im
ungünstigsten Fall eine Erkennbarkeit der Schrift 20 erschweren
können.
Fig. 3 zeigt die Grauwertverteilung in horizontaler Richtung für
3 exemplarisch ausgewählte Zeilenbereiche A, B und C mit einer
Länge L in dem Grauwertbild 40. Innerhalb des Zeilenbereiches A
werden 8 Peaks oberhalb und 1 Peak unterhalb eines vorgegebenen
Grauwertes G ermittelt. Innerhalb des Zeilenbereiches B wird
kein Peak oberhalb und es werden 2 Peaks unterhalb des
Grauwertes G gefunden. Innerhalb des Zeilenbereiches C werden 2
Peaks oberhalb und 1 Peak unterhalb des Grauwertes G ermittelt.
Als Grenzwert für die Erkennung bild-relevanter Bereiche
innerhalb der Vorlage 10 sei eine Anzahl von 4 Peaks oberhalb
des vorgegebenen Grauwertes G für einen Zeilenbereich der Länge
L gegeben. Dementsprechend wird nur der Zeilenbereich A als ein
Bild-relevanter Bereich erkannt. Für diesen Zeilenbereich A wird
für einen zweiten Einlesevorgang ein Schwellwert SWinformation, der
gegenüber dem mittleren Schwellwert SWmittel weiter in Richtung
"weiß" verschoben ist, also weniger Informationen herausfiltern
wird, eingestellt. Die Zeilenbereiche B und C hingegen werden
als nicht-bild-relevante Bereiche eingestuft und es wird für
einen zweiten Einlesevorgang ein Schwellwert SWhinergrund, der
gegenüber dem mittleren Schwellwert SWmittel weiter in Richtung
"schwarz" verschoben ist, also mehr Informationen herausfiltern
wird, eingestellt.
Der oben dargestellte Vorgang zur Erkennung bild-relevanter
Bereiche wird entsprechend zeilenweise für das gesamte Bild 40
durchgeführt, die Schwellwerte der einzelnen Bereiche werden an
die erkannten Bereiche angepaßt und ein neues Bild 50 mit Hilfe
der neu angepaßten Schwellwerte erzeugt. Fig. 4 zeigt das neue
Bild 50. Die Schrift 20 der Vorlage 10 wurde als bild-relevanter
Bereich erkannt und in dem Bild 50 als Schrift 20′′ abgebildet.
Die zufällige Bildstörung 30 aus der Vorlage 10 konnte durch
diesen Prozeß vollständig eliminiert werden.
Die Erfindung soll an einem weiteren Beispiel eines Scanners,
der eine 4-Bit-Wandlung durchführt, erläutert. Eine 4-Bit-
Wandlung bedeutet, daß als Vorlage ein Graubild mit 16
Graustufen vorliegt, das in ein Schwarz-Weiß-Bild gewandelt
werden soll. Der Grauwert 15 soll in diesem Beispiel der
Graustufe "weiß" entsprechen und der Grauwert 0 der Graustufe
"schwarz".
Fig. 5a zeigt einen Bildausschnitt eines ersten eingescannten
Testbildes einer (hier nicht gezeigten) Vorlage. Fig. 5b stellt
die Verteilung der Bilddaten (Grauwert-Histogramm) für einen
Bereich des Testbildes dar. Aus diesem Histogramm ergibt sich
ein mittlerer Grauwert von 11,23. Wird als Schwellwert für die
Wandlung der Vorlage in ein Schwarz-Weiß-Bild dieser mittlere
Grauwert, oder durch die Abrundung auf gerade Werte (Integer)
ein entsprechender Schwellwert von 11, verwendet, werden nicht
ausreichend Bildinformationen der Vorlage in dem gezeigten
Bildausschnitt in schwarze Bildpunkte umgewandelt werden. Die
Schwellwertfilterung bewirkt, daß Werte, die kleiner als der
vorgegebene Schwellwert sind, in signifikante, schwarze
Bildpunkte umgewandelt werden. Störinformation (Rauschen,
Digitalisierungsfehler), aber auch tatsächliche
Bildinformationen mit Grauwerten größer als der Schwellwert
werden als weiße Bildpunkte dargestellt.
Aus dem Histoprogramm in Fig. 5b ist nicht ersichtlich, ob es sich
bei den Bildpunkten um verwertbare Informationen oder um
Rauschen handelt. Daher ist hier eine Schwarz-Weiß-Wandlung
immer mit dem Risiko des Auslöschens von Informationen behaftet.
Erfindungsgemäß wird nun eine Verteilungsanalyse durchgeführt,
d. h. es wird die "Frequenz" der vorliegenden Bilddaten in
horizontaler Richtung untersucht. Die horizontale Bildrichtung
bietet sich insbesondere dann an, wenn Schriften in horizontaler
Richtung erwartet werden. Fig. 5c zeigt einen Verlauf 100 der
Grauwerte für einen Bereich in horizontaler Richtung innerhalb
der Schrift "Konto-Nr" in Fig. 5a, wobei diese in der Vorlage
rot gedruckt wurde. Der Verlauf 100 der Grauwerte wird
mathematisch differenziert und führt zu einem Verlauf 110 der
Ableitung. Durch Aufsummieren der vorkommenden Wendepunkte oder
Maxima in der Ableitung 110, bezogen auf die Längeneinheit,
ergibt sich eine "Frequenz" für diesen Bereich. Die so
ermittelte "Frequenz" wird mit einem vorgegebenen Grenzwert
verglichen. Dabei wurde der Grenzwert aufgrund vorangegangener
Bilduntersuchungen so eingestellt, daß signifikante Textbereiche
erkannt werden können.
In dem Beispiel in Fig. 5c liegt die ermittelte "Frequenz"
oberhalb des vorgegebenen Grenzwertes, so daß ein signifikanter
Textbereich angenommen wird. Der Schwellwert für die
Schwarz-Weiß-Wandlung wird entsprechend angepaßt und in diesem
Beispiel um eine Graustufe (also von 11 auf 12) nach oben
festgelegt. Fig. 5d zeigt das Ergebnis der durchgeführten
Schwarz-Weiß-Wandlung mit dem angepaßten Schwellwert.
Der Einfachheit halber wurde in Fig. 5d die
Schwarz-Weiß-Wandlung für den ganzen in Fig. 5a gezeigten
Bereich mit dem angepaßten Schwellwert durchgeführt.
Entsprechend könnte jedoch auch eine Schwarz-Weiß-Wandlung mit
einer Vielzahl von an einzelne Bereiche angepaßten Schwellwerten
durchgeführt werden.
Claims (17)
1. Verfahren zur Ermittlung eines Schwellwertes für die
Erzeugung eines elektronischen Bildes (50) von einer
Vorlage (10), mit:
einem ersten Schritt der Erfassung der Bildeigenschaften der Vorlage (10);
einem zweiten Schritt der Analyse der räumlichen und/oder örtlichen Verteilung der Bildeigenschaften der Vorlage (10); und
einem dritten Schritt des Ermittelns eines Schwellwertes aus der Verteilungsanalyse der Bildeigenschaften der Vorlage (10).
einem ersten Schritt der Erfassung der Bildeigenschaften der Vorlage (10);
einem zweiten Schritt der Analyse der räumlichen und/oder örtlichen Verteilung der Bildeigenschaften der Vorlage (10); und
einem dritten Schritt des Ermittelns eines Schwellwertes aus der Verteilungsanalyse der Bildeigenschaften der Vorlage (10).
2. Verfahren nach Anspruch 1, worin die Verteilungsanalyse
der Bildeigenschaften durch eine Ermittlung der räumlichen
und/oder örtlichen Variation der Grau- bzw. Farbwerte
erfolgt.
3. Verfahren nach Anspruch 2, worin die Verteilungsanalyse
der Bildeigenschaften zeilenweise erfolgt.
4. Verfahren nach Anspruch 2 oder 3, worin die ermittelte
örtliche Variation der Grau- bzw. Farbwerte mit einem
vorgegebenen Wert verglichen wird.
5. Verfahren nach Anspruch 4, worin der vorgegebene Wert so
gewählt wird, daß ein Rückschluß auf den wahrscheinlichen
Bildinhalt ermöglicht wird, vorzugsweise, ob die Vorlage
(10) voraussichtlich ein Bild und/oder eine Schrift
enthält.
6. Verfahren nach einem der vorstehenden Ansprüche, worin der
erste Schritt der Erfassung der Bildeigenschaften der
Vorlage (10) ein Einlesen der Vorlage (10) mit einem
vorgewählten Schwellwert beinhaltet, und der vorgewählte
Schwellwert in dem dritten Schritt angepaßt wird.
7. Verfahren nach Anspruch 6, worin der vorgewählte
Schwellwert so verändert wird, daß, wenn aufgrund der
Verteilungsanalyse der Bildeigenschaften in der Vorlage
(10) relevante Informationen vermutet werden, durch die
Schwellwertfilterung weniger Informationen verloren gehen,
oder wenn in der Vorlage (10) keine relevante
Informationen vermutet werden, durch die
Schwellwertfilterung mehr Informationen verloren gehen.
8. Verfahren nach Anspruch 7, worin eine relevante
Informationen dann vermutet wird, wenn eine
Verteilungsdichte von zu betrachtenden Bildpunkten einen
vorgegebenen Grenzwert der Verteilungsdichte
überschreiten.
9. Verfahren entsprechend einem der vorstehenden Ansprüche,
worin die Ermittlung des Schwellwertes entweder selektiv
für einzelne Bereiche der Vorlage (10) oder integral für
die gesamte Vorlage (10) durchgeführt wird.
10. Verfahren entsprechend einem der vorstehenden Ansprüche,
worin die Verteilungsanalyse der Bildeigenschaften für
lokale Bereiche innerhalb der Vorlage durchgeführt wird.
11. Verfahren nach Anspruch 10, mit einem Schritt der
Anpassung der lokalen Bereiche an systembedingte
Bildeigenschaften.
12. Verfahren nach Anspruch 11, worin die lokalen Bereiche
entsprechend der Einleseweise der Vorlage (10) und/oder
einer bestimmten Auftretensform der Informationen in der
Vorlage (10) angepaßt werden.
13. Verwendung des Verfahrens entsprechend einem der
vorstehenden Ansprüche für eine Vorverarbeitung der
Vorlage (10) vor einer nachfolgenden Bildverarbeitung.
14. Verwendung des Verfahrens entsprechend einem der
vorstehenden Ansprüche für eine Bilderkennung und/oder für
eine Archivierung von Dokumenten.
15. Verwendung des Verfahrens entsprechend einem der
vorstehenden Ansprüche in einem Programm für eine
elektronische Datenverarbeitung.
16. Verwendung des Verfahrens entsprechend einem der
vorstehenden Ansprüche für eine Erkennung von Bereichen,
die eine Schrift und/oder ein Bild und/oder einen
regelmäßigen Hintergrund aufweisen.
17. Vorrichtung zur Ermittlung eines Schwellwertes für die
Erzeugung eines elektronischen Bildes (50) von einer
Vorlage (10), mit:
einem Mittel zur Erfassung der Bildeigenschaften der Vorlage (10);
einem Mittel zur Analyse der räumlichen und/oder örtlichen Verteilung der Bildeigenschaften der Vorlage (10); und
einem Mittel zur Ermittlung des Schwellwertes aus der Verteilungsanalyse der Bildeigenschaften der Vorlage (10), wobei das Mittel zur Ermittlung des Schwellwertes ein Mittel zur Auswertung und Bewertung der Analyse der räumlichen Verteilung der Bildeigenschaften aufweist.
einem Mittel zur Erfassung der Bildeigenschaften der Vorlage (10);
einem Mittel zur Analyse der räumlichen und/oder örtlichen Verteilung der Bildeigenschaften der Vorlage (10); und
einem Mittel zur Ermittlung des Schwellwertes aus der Verteilungsanalyse der Bildeigenschaften der Vorlage (10), wobei das Mittel zur Ermittlung des Schwellwertes ein Mittel zur Auswertung und Bewertung der Analyse der räumlichen Verteilung der Bildeigenschaften aufweist.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19536170A DE19536170A1 (de) | 1995-09-29 | 1995-09-29 | Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19536170A DE19536170A1 (de) | 1995-09-29 | 1995-09-29 | Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19536170A1 true DE19536170A1 (de) | 1997-04-03 |
Family
ID=7773481
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19536170A Ceased DE19536170A1 (de) | 1995-09-29 | 1995-09-29 | Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE19536170A1 (de) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10054185A1 (de) * | 2000-11-02 | 2002-05-29 | Infineon Technologies Ag | Verfahren zur Optimierung eines elektronisch erzeugten Bildes |
EP1330111A2 (de) * | 2002-01-16 | 2003-07-23 | Eastman Kodak Company | Technik zur automatischen Bildqualitätsbewertung und -korrektion |
DE10010621B4 (de) * | 1999-03-12 | 2006-08-24 | International Business Machines Corp. | Schnelles Lokalisieren von Adressblöcken in Graustufenbildern |
US7499569B2 (en) | 2004-02-26 | 2009-03-03 | Mitsubishi Fuso Truck And Bus Corporation | Hand pattern switching apparatus |
US8194941B2 (en) | 2007-03-12 | 2012-06-05 | Nec Corporation | Character noise eliminating apparatus, character noise eliminating method, and character noise eliminating program |
CN106529518B (zh) * | 2016-09-08 | 2018-12-14 | 广东德诚科教有限公司 | 一种答题卡识别的方法及装置 |
DE112006003272B4 (de) | 2005-11-30 | 2022-08-18 | Adobe Inc. | Verfahren und Vorrichtung zum Entfernen von Rauschen aus einem digitalen Bild |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4590606A (en) * | 1982-12-13 | 1986-05-20 | International Business Machines Corporation | Multi-function image processing system |
DE2757456C2 (de) * | 1976-12-22 | 1988-04-14 | Recognition Equipment Inc., Dallas, Tex., Us | |
DE3433493C2 (de) * | 1983-09-12 | 1988-07-21 | Ricoh Co., Ltd., Tokio/Tokyo, Jp | |
US4878248A (en) * | 1988-04-18 | 1989-10-31 | Industrial Technology Research Institute | Method and apparatus for automatically recognizing license plate characters |
US5038381A (en) * | 1988-07-11 | 1991-08-06 | New Dest Corporation | Image/text filtering system and method |
EP0505729A2 (de) * | 1991-03-29 | 1992-09-30 | EASTMAN KODAK COMPANY (a New Jersey corporation) | Bildbinarisierungssystem |
DE4411248C1 (de) * | 1994-03-31 | 1995-10-26 | Licentia Gmbh | Verfahren und Vorrichtung zum Binarisieren von Pixel-Daten |
DE4445386C1 (de) * | 1994-12-20 | 1996-05-02 | Ibm | Verfahren und Vorrichtung zur Trennung einer Vordergrundinformation von einer Hintergrundinformation in einer Vorlage |
-
1995
- 1995-09-29 DE DE19536170A patent/DE19536170A1/de not_active Ceased
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2757456C2 (de) * | 1976-12-22 | 1988-04-14 | Recognition Equipment Inc., Dallas, Tex., Us | |
US4590606A (en) * | 1982-12-13 | 1986-05-20 | International Business Machines Corporation | Multi-function image processing system |
DE3433493C2 (de) * | 1983-09-12 | 1988-07-21 | Ricoh Co., Ltd., Tokio/Tokyo, Jp | |
US4878248A (en) * | 1988-04-18 | 1989-10-31 | Industrial Technology Research Institute | Method and apparatus for automatically recognizing license plate characters |
US5038381A (en) * | 1988-07-11 | 1991-08-06 | New Dest Corporation | Image/text filtering system and method |
EP0505729A2 (de) * | 1991-03-29 | 1992-09-30 | EASTMAN KODAK COMPANY (a New Jersey corporation) | Bildbinarisierungssystem |
DE4411248C1 (de) * | 1994-03-31 | 1995-10-26 | Licentia Gmbh | Verfahren und Vorrichtung zum Binarisieren von Pixel-Daten |
DE4445386C1 (de) * | 1994-12-20 | 1996-05-02 | Ibm | Verfahren und Vorrichtung zur Trennung einer Vordergrundinformation von einer Hintergrundinformation in einer Vorlage |
Non-Patent Citations (3)
Title |
---|
OHYA, SHIO, AKAMATSU: "Recognition characters in scane images" IEEE Transactions on pattern analysis and machine intelligence, Vol. PAMI-16, N. 2, 1994, S. 214-220 * |
SAHOO, et al: "A Survey of Thresholding Techni- ques" Computer Vision, Graphics and Image Pro- cessing 41, 1988, S. 233-260 * |
WHITE/ROHRER: "Image Thresholding for Optical Character Recognition and other Application Reguiring Character Image Extraction" IBM J.Res. Develop., Vol. 27, Nr. 4, July 1983, pp. 400-411 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10010621B4 (de) * | 1999-03-12 | 2006-08-24 | International Business Machines Corp. | Schnelles Lokalisieren von Adressblöcken in Graustufenbildern |
DE10054185A1 (de) * | 2000-11-02 | 2002-05-29 | Infineon Technologies Ag | Verfahren zur Optimierung eines elektronisch erzeugten Bildes |
EP1330111A2 (de) * | 2002-01-16 | 2003-07-23 | Eastman Kodak Company | Technik zur automatischen Bildqualitätsbewertung und -korrektion |
EP1330111A3 (de) * | 2002-01-16 | 2004-12-08 | Eastman Kodak Company | Technik zur automatischen Bildqualitätsbewertung und -korrektion |
US6970606B2 (en) | 2002-01-16 | 2005-11-29 | Eastman Kodak Company | Automatic image quality evaluation and correction technique for digitized and thresholded document images |
US7499569B2 (en) | 2004-02-26 | 2009-03-03 | Mitsubishi Fuso Truck And Bus Corporation | Hand pattern switching apparatus |
DE112006003272B4 (de) | 2005-11-30 | 2022-08-18 | Adobe Inc. | Verfahren und Vorrichtung zum Entfernen von Rauschen aus einem digitalen Bild |
US8194941B2 (en) | 2007-03-12 | 2012-06-05 | Nec Corporation | Character noise eliminating apparatus, character noise eliminating method, and character noise eliminating program |
CN106529518B (zh) * | 2016-09-08 | 2018-12-14 | 广东德诚科教有限公司 | 一种答题卡识别的方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE4445386C1 (de) | Verfahren und Vorrichtung zur Trennung einer Vordergrundinformation von einer Hintergrundinformation in einer Vorlage | |
DE60308739T2 (de) | Automatisches Bildqualitäts-Bewertungsverfahren und Korrekturtechnik | |
DE69230629T2 (de) | Verfahren und Vorrichtung zur Bildverbesserung | |
DE3851173T2 (de) | Verfahren und Gerät zur Erkennung von Halbtonbildmustern. | |
DE69728127T2 (de) | Vorrichtung und Verfahren zur Extraktion eines Objekts in einem Bild | |
DE69026329T2 (de) | Entrasterung von gespeicherten digitalen Halbtonbildern durch logisches Filtrieren | |
DE69226846T2 (de) | Verfahren zur Bestimmung von Wortgrenzen im Text | |
DE3881392T2 (de) | System und Verfahren für automatische Segmentierung. | |
DE69736938T2 (de) | Detektion und Wiedergabe von Text in gerasterten Bildbereichen | |
DE3780955T2 (de) | Verfahren zur automatischen spitzenerkennung im graustufenhistogramm eines digitalen bildes. | |
DE69925354T2 (de) | Bildverarbeitungssystem um vertikale Muster auf abgetasteten Bildern zu reduzieren | |
DE69604481T2 (de) | Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern | |
DE3545951C2 (de) | ||
DE19956158A1 (de) | Bild-Binärisierungsverfahren auf Bereichsbasis | |
DE4103229C2 (de) | ||
DE60132315T2 (de) | Verbessertes verfahren zur bildbinarisierung | |
EP0925682B1 (de) | Verfahren zur detektion von kanten in einem bildsignal | |
DE3633743A1 (de) | Zeichenerkennungssystem | |
DE69322095T2 (de) | Verfahren und gerät zur identifizierung eines objekts mittels eine geordneten folge von grenz-pixel-parametern | |
DE69728724T2 (de) | Bildbereichs-Erkennungsverfahren und Bildverarbeitungsvorrichtung | |
DE102007013971A1 (de) | Verfahren und Vorrichtung zur Ermittlung einer Zellkontur einer Zelle | |
DE102008013789A1 (de) | Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen | |
EP3123393B1 (de) | Verfahren zur optischen erkennung von zeichen | |
DE3586203T2 (de) | Bildverarbeitungsgeraet fuer roentgentomographie. | |
DE10303724B4 (de) | Dynamisches Zweipegel-Schwellwertverfahren digitaler Bilder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8128 | New person/name/address of the agent |
Representative=s name: RACH, W., DR., PAT.-ASS., 70569 STUTTGART |
|
8131 | Rejection |