DE69618262T2 - Bilderverarbeitungsgerät und -verfahren - Google Patents
Bilderverarbeitungsgerät und -verfahrenInfo
- Publication number
- DE69618262T2 DE69618262T2 DE69618262T DE69618262T DE69618262T2 DE 69618262 T2 DE69618262 T2 DE 69618262T2 DE 69618262 T DE69618262 T DE 69618262T DE 69618262 T DE69618262 T DE 69618262T DE 69618262 T2 DE69618262 T2 DE 69618262T2
- Authority
- DE
- Germany
- Prior art keywords
- range
- image
- frequencies
- area
- deviation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 116
- 238000012545 processing Methods 0.000 title claims description 51
- 238000004364 calculation method Methods 0.000 claims description 9
- 235000019557 luminance Nutrition 0.000 description 97
- 230000008569 process Effects 0.000 description 79
- 238000000926 separation method Methods 0.000 description 45
- 230000000694 effects Effects 0.000 description 16
- 238000012015 optical character recognition Methods 0.000 description 13
- 238000003379 elimination reaction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 5
- 101100048046 Arabidopsis thaliana UGT84A2 gene Proteins 0.000 description 4
- 239000006185 dispersion Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000008030 elimination Effects 0.000 description 3
- 101001005165 Bos taurus Lens fiber membrane intrinsic protein Proteins 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/403—Discrimination between the two tones in the picture signal of a two-tone original
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Facsimile Image Signal Circuits (AREA)
Description
- Die vorliegende Erfindung bezieht sich auf eine Bildverarbeitungseinrichtung und ein Verfahren dafür, beispielsweise eine Bildverarbeitungseinrichtung und ein Verfahren dafür zum Bewirken einer Binarisierung durch Bestimmung eines Binarisierungsschwellenwerts für ein Mehrfachpegel- bzw. Mehrpegelbild, und insbesondere auf eine Bildverarbeitungseinrichtung und ein Verfahren dafür zum Bewirken einer Aufteilung von Bildbereichen für einen Zeichenerkennungsvorgang in dem Bild.
- Die Bildverarbeitungstechnologie hat in den letzten Jahren bedeutende Fortschritte gemacht und es wurde die Bildverarbeitungseinrichtung verbreitet, die ein Mehrpegelbild, wie beispielsweise ein Vollfarbbild verarbeiten und eine Zeichenerkennung in einem Mehrpegelbild durchführen kann.
- Bei einer derartigen Bildverarbeitungstechnologie ist eine Binarisierung des Mehrpegelbilds eine unverzichtbare Technologie. Für eine derartige Binarisierung war herkömmlich ein einfaches Binarisierungsverfahren unter Verwendung eines vorbestimmten festen Schwellenwerts, ein Otsu-Verfahren unter Verwendung eines Binarisierungsschwellenwerts, das in dem Histogramm die Dispersion zwischen zwei um diesen Schwellenwert getrennte Klassen maximiert (Otsu, "Automatic threshold selection based on judgement and minimum square method", Journal of Electronic Communication Society, vol. J63-D, Nr. 4, Seiten 349-356, 1980) und ein Binarisierungsverfahren zur Bestimmung des Schwellenwerts für ein Farbtonbild auf der Grundlage der örtlichen Dichte bekannt.
- Jedoch waren derartige Binarisierungsverfahren in der herkömmlichen Bildverarbeitungseinrichtung mit den folgenden Nachteilen verbunden.
- Bei dem einfachen Binarisierungsverfahren mit dem festen Schwellenwert ist es schwierig, einen geeigneten Schwellenwert zwischen der Dichte des Objekts und der des Hintergrunds innerhalb eines Bilds auszuwählen und als ein Ergebnis neigt das gesamte Bild dazu, schwärzlich oder weißlich zu werden. Wenn zwei Klassen extrem verschiedene Verteilungen besitzen, neigt bei dem Otsu-Verfahren der Schwellenwert dazu, zur höheren Klasse hin abzuweichen, so dass ein binäres Bild mit viel Rauschen erzeugt wird. Auch neigt das Binarisierungsverfahren zur Bestimmung des Schwellenwerts gemäß der örtlichen Dichte dazu, eine Blockverzerrung zu erzeugen, wenn das Bild in örtliche Bereiche aufgeteilt wird.
- Mit dem gegenwärtigen Fortschritt in der Bildverarbeitungstechnologie werden Bilder, die gemischt Zeichen, Photographien, Graphen usw. enthalten, zunehmend in der Bildverarbeitungseinrichtung, wie Computern, verarbeitet. In einem derartigen Fall wird das zu verarbeitende Bild als erstes durch eine Bildeingabeeinrichtung, wie beispielsweise einen Scanner, gelesen und in eine Bildverarbeitungseinrichtung eingegeben, die auf das Eingabebild einen Bereichsaufteilungsvorgang zur Extraktion des schwarzen Bildbereiche und einen optischen Zeichenerkennungs(OCR)vorgang und eine Dokumentenverwaltung ausführt, um somit erhaltene Zeichen und Bilder zu verwenden. Der Bereichsaufteilungsvorgang besteht darin, die schwarzen Bildelemente in dem Bild aufzuteilen und zu extrahieren, wodurch die Bereiche von Zeichen/Photographie/Graph/Tabelle usw. in dem Bild durch die Merkmale davon zu trennen und die Informationen jedes Bereichs zu erhalten. Auch besteht der OCR- Vorgang darin, in dem Zeichenbereich des Bilds das die Zeichenbilder bildende Bitmap in Zeichencodes umzuwandeln.
- Im folgenden wird unter Bezugnahme auf ein Ablaufdiagramm in Fig. 26 die Verarbeitung eines ein Zeichen enthaltenden Bilds in der vorstehend erklärten herkömmlichen Bildverarbeitungseinrichtung erklärt.
- Zuerst gibt ein Schritt S221 ein Originalbild durch eine Bildverarbeitungseinrichtung, wie beispielsweise einen Scanner, in einer Form, beispielsweise von Mehrpegelbilddaten von 8 Bit ein. Ein nächster Schritt S222 nimmt eine Beseitigung des elektrischen Rauschens, das in dem Scanner bei der Bildeingabe erzeugt wurde, und eine Korrektur der Verschlechterung des eingegebenen Originalbilds und der Neigung des Originalbilds vor. Dann führt ein Schritt S223 einen Bereichsaufteilungsvorgang auf das Eingabebild durch einfache Binarisierung mit einem festen Schwellenwert und Extraktion des Zeichenbereichs durch Auflösen der Daten jedes Bereichs aus. Der vorstehend erwähnte einfache Binarisierungsvorgang kann beispielsweise ein Binarisierungsvorgang gemäß der Dichte des Eingabebilds sein. Dann führt ein Schritt S224 eine Zeichenerkennung durch eine gewünschte Bildverarbeitung, wie beispielsweise einen OCR-Vorgang oder einen Pseudo-fortwährenden Farbtonvorgang auf jeden extrahierten Zeichenbereich aus. Dann zeigt ein letzter Schritt S225 das Verarbeitungsergebnis, wie beispielsweise das erkannte Zeichen.
- In der herkömmlichen Bildverarbeitungseinrichtung, wie vorstehend erklärt, wird das Eingabebild dem einfachen Binarisierungsvorgang mit dem festen Schwellenwert oder gemäß der Dichte des Originalbilds und dem Bereichsaufteilungsvorgang zur Extraktion des Textbereichs in dem Bild zum Zweck einer Zeichenerkennung unterzogen.
- Eine derartige herkömmliche Bildverarbeitungseinrichtung wurde jedoch mit den folgenden Nachteilen in Verbindung gebracht.
- Als ein Beispiel wird ein Fall betrachtet, in dem das Originalbild einen weißen Hintergrund besitzt, auf dem Zeichen in schwarzer oder grauer Farbe erzeugt sind. Ein derartiges Originalbild enthält drei oder mehr Leuchtdichtepegel und bei der einfachen Binarisierung mit dem festen Schwellenwert auf einem derartigen Bild wird der graue Zeichenbereich als "weiß" in einem Bereich binarisiert und als "schwarz" in dem anderen. Wenn diese zwei Bereiche irregulär erzeugt werden, werden die grauen Zeichen dicker und dünner, so daß eine sehr präzise Binarisierung nicht erreicht werden kann. Demzufolge kann der Bereichsaufteilungsvorgang und der Zeichenerkennungsvorgang nicht auf exakte Weise ausgeführt werden und eine bedeutende Verschlechterung wird bei der Teilung des grauen Zeichenbereichs und der Zeichenerkennungsrate der grauen Zeichen auftreten.
- Auch beim einfachen Binarisierungsvorgang gemäss der Originalbilddichte ergibt, wenn der Hintergrund nicht rein "weiß" ist, der Binarisierungsvorgang eine Klassifizierung des Hintergrunds als "weiß" und der schwarzen und grauen Zeichen als "schwarz" oder des Hintergrunds und der grauen Zeichen als "weiß" und der schwarzen Zeichen als "schwarz". Somit können die grauen Zeichen auch in diesem Fall nicht präzise binarisiert werden, so daß die Bereichsaufteilung und die Zeichenerkennung nicht auf exakte Weise erreicht werden können.
- Auch wenn der graue Zeichenbereich und die grauen Zeichen erkannt werden können, können sie nicht vom schwarzen Zeichenbereich und den schwarzen Zeichen unterschieden werden.
- Unter Berücksichtigung des vorstehenden, ist es eine Aufgabe der vorliegenden Erfindung, eine Bildverarbeitungseinrichtung und ein Verfahren dafür zu schaffen, die bzw. das einen geeigneten Binarisierungsschwellenwert zwischen der Objektdichte und der Hintergrunddichte in einem Bild automatisch einstellen kann.
- Eine Aufgabe der vorliegenden Erfindung besteht darin, eine Bildverarbeitungseinrichtung und ein Verfahren dafür zu schaffen, das einen Bereich in dem eingegebenen Mehrpegelbild bestimmen kann, in dem ein geeignetster Schwellenwert zur Trennung des Hintergrunds und des Objekts in dem Bild existiert.
- Die US-Patent-Beschreibung Nr. US-A-5097520 offenbart ein Binarisierungsverfahren und einen optimalen Schwellenwert für eine Binarisierung, das verwendet wird, wenn Mehrpegelbilddaten, die ein Eingabebild beschreiben, in schwarze und weiße Zweipegel-Bilddaten umgewandelt werden. Das Binarisierungsverfahren enthält die Schritte Zählen einer ersten Anzahl von schwarzen Bildelementen durch Verändern eines Schwellenwerts von einem dunkelsten Farbtonpegel auf einen hellsten Farbtonpegel, Zählen einer zweiten Anzahl von Bildelementen mit einem Farbtonpegel verschieden von dem hellsten Farbtonpegel, Erhalten eines Prozentsatzes der ersten Anzahl in Hinblick auf die zweite Anzahl für jeden der veränderten Schwellenwerte, um eine Dichte des Eingabebilds zu normieren, und Bestimmen des optimalen Schwellenwerts für eine Binarisierung auf der Grundlage des Prozentsatzes, der für jeden der veränderten Schwellenwerte erhalten wird.
- Gemäss einem ersten Gesichtspunkt der vorliegenden Erfindung wird ein Bildverarbeitungsverfahren nach Anspruch 1 ausgebildet.
- Gemäss einem zweiten Gesichtspunkt der vorliegenden Erfindung wird eine Bildverarbeitungseinrichtung nach Anspruch 6 ausgebildet.
- Andere Merkmale der vorliegenden Erfindung werden aus der folgenden genauen Beschreibung offensichtlich, die in Verbindung mit der Zeichnung als Beispiel gegeben wird.
- Es zeigen:
- Fig. 1 ein Blockschaltbild der Systemkonfiguration einer die vorliegende Erfindung verkörpernden Bildverarbeitungseinrichtung,
- Fig. 2 ein Flussdiagramm eines Bildbereich-Trennungs-OCR- Vorgangs in einem ersten Ausführungsbeispiel,
- Fig. 3 ein Flussdiagramm eines Binarisierungsvorgangs im ersten Ausführungsbeispiel,
- Fig. 4 eine Ansicht eines Beispiels für ein Histogramm des Bilds in dem ersten Ausführungsbeispiel,
- Fig. 5 ein Diagramm eines Beispiels eines Übergangs von Variablen in dem Binarisierungsvorgang des ersten Ausführungsbeispiels,
- Fig. 6 ein Flussdiagramm eines Bildbereich-Trennungs-Vorgangs in dem ersten Ausführungsbeispiel,
- Fig. 7 eine Ansicht eines Beispiels für die Bereichsdaten in dem ersten Ausführungsbeispiel,
- Fig. 8 ein Flussdiagramm eines Bereichs-Beseitigungs(LNR)- Vorgangs in dem ersten Ausführungsbeispiel,
- Fig. 9 ein Flussdiagramm eines Bereichs-Beseitigungs-Vorgangs 1 gemäss der Bereichsgröße in dem ersten Ausführungsbeispiel,
- Fig. 10 ein Flussdiagramm eines Bereichs-Beseitigungs-Vorgangs 2 gemäss dem Schwarz-Verhältnis in dem ersten Ausführungsbeispiel,
- Fig. 11 ein Flussdiagramm eines Bereichs-Beseitigungs-Vorgangs 3 gemäss der Bereichsgröße in dem ersten Ausführungsbeispiel,
- Fig. 12 ein Flussdiagramm einer Zeichen-enthaltendes-Bild- Verarbeitung in einem zweiten Ausführungsbeispiel,
- Fig. 13 eine Ansicht eines Beispiels für ein Histogramm des Bilds im zweiten Ausführungsbeispiel,
- Fig. 14 ein Flussdiagramm eines Bereichs-Aufteilungs-Vorgangs für jeden hierarchischen Leuchtdichtepegel in dem zweiten Ausführungsbeispiel,
- Fig. 15 ein Flussdiagramm eines Bereichs-Aufteilungs-Vor- Vorgangs im zweiten Ausführungsbeispiel,
- Fig. 16 eine Darstellung eines Beispiels von Variablen in dem Bereichs-Aufteilungs-Vor-Vorgang des zweiten Ausführungsbeispiels,
- Fig. 17 eine Ansicht eines Beispiels für ein Histogramm in einem Bereich, mit einer hierarchischen Leuchtdichtenummer "2" in dem Originalbild im zweiten Ausführungsbeispiel,
- Fig. 18 eine Darstellung eines Beispiels von Variablen in dem Bereichs-Aufteilungs-Vor-Vorgang des zweiten Ausführungsbeispiels,
- Fig. 19 eine Ansicht des Ergebnisses einer Binarisierung für jeden hierarchischen Leuchtdichtepegel in dem Bereichs- Aufteilungs-Vor-Vorgang des zweiten Ausführungsbeispiels,
- Fig. 20 ein Flussdiagramm einer Bildverarbeitung für jeden hierarchischen Leuchtdichtepegel in dem zweiten Ausführungsbeispiel,
- Fig. 21 ein Flussdiagramm eines Zeichenerkennungs-Vor-Vorgangs in dem zweiten Ausführungsbeispiel,
- Fig. 22 eine Ansicht eines Beispiels für die Tabelle zur Einstellung des Schwarzverhältnisses in dem zweiten Ausführungsbeispiel,
- Fig. 23A und 23B Ansichten von Beispielen für das Mehrpegel- Eingabebild in dem zweiten Ausführungsbeispiel,
- Fig. 24A und 24B Ansichten von Beispielen für ein Histogramm des Mehrpegel-Eingabebilds in dem zweiten Ausführungsbeispiel,
- Fig. 25A und 25B Ansichten von Beispielen für das aus dem Mehrpegel-Eingabebild in dem zweiten Ausführungsbeispiel binarisierte Bild und
- Fig. 26 ein Flussdiagramm einer Zeichen-enthaltendes Bild- Verarbeitung in einer herkömmlichen Bildverarbeitungseinrichtung.
- Nun wird die vorliegende Erfindung durch bevorzugte Ausführungsbeispiele unter Bezugnahme auf die Zeichnung genau klargestellt.
- Fig. 1 ist ein Blockschaltbild der Konfiguration eines Systems zur Ausführung des Binarisierungsvorgangs in einem ersten Ausführungsbeispiel. In Fig. 1 sind eine Bildverarbeitungseinrichtung 1 zur Ausführung eines Zeichenerkennungsvorgangs, eine Bildeingabeeinrichtung 2 wie beispielsweise ein Scanner, zur Eingabe eines Bilds und eine Bildanzeigeeinrichtung 3 zur Anzeige eines Bilds nach einer Verarbeitung ausgebildet.
- In der Bildverarbeitungseinrichtung 1 sind eine eine Schnittstelle mit der Bildeingabeeinrichtung 2 bildende Eingabeeinheit 4, eine Speichereinheit 5 zur Speicherung der Daten bei der Verarbeitung, eine Luminanzfrequenz-Anhäufungseinheit 6 zur Anhäufung der Luminanzfrequenz (Histogramm) des Eingabebilds, eine Binarisierungsschwellenwert-Berechnungseinheit 7 zur Berechung des Binarisierungsschwellenwerts des Eingabebilds, eine Binarisierungseinheit 8 zur Erzeugung eines binären Bilds mit dem in der Binarisierungsschwellenwert- Berechnungseinheit 7 berechneten Schwellenwert, eine Bereichs- Trennungseinheit 9 zur Trennung des Bilds in Bereiche, wie beispielsweise einen Zeichenbereich und Halbtonbereiche, gemäss den Attributen, eine Zeichenerkennungseinheit 10 zur Ausführung eines Zeichenerkennungsvorgangs für einen durch die Trennung der Bereiche extrahierten Zeichenbereich, eine Bildverarbeitungseinheit 11 zur Ausführung zahlreicher Bildverarbeitungen auf einen getrennten Halbtonbereich anders als der Zeichenbereich, eine eine Schnittstelle mit der Bildanzeigeeinrichtung 3 bildende Ausgabeeinheit 12 und eine die gesamte Bildverarbeitungseinrichtung 1 steuernde und aus einer CPU, einem ROM und einem RAM zusammengesetzte Steuereinheit 13.
- Im folgenden wird ein in der Bildverarbeitungseinrichtung 1 gemäss dem vorliegenden Ausführungsbeispiel ausgeführter OCR- Vorgang mit dem vorstehend erklärten Aufbau erklärt.
- Fig. 2 ist ein Flussdiagramm eines Bildbereich-Trennungs-OCR- Vorgangs unter Verwendung des Binarisierungs-Schwellenwert- Bestimmungsverfahrens, durch das sich das vorliegende Ausführungsbeispiel auszeichnet.
- Zuerst gibt ein Schritt S501 Bilddaten in der Form von 8-Bit Mehrpegel-Bilddaten durch die Bildeingabeeinrichtung 2, wie beispielsweise einen Scanner, ein. Ein nächster Schritt S502 bestimmt einen optimalen Binarisierungsschwellenwert für die Trennung von Bereichen, durch die sich die vorliegende Erfindung auszeichnet, auf dem in Schritt S501 eingegebenen Mehrpegel-Bild und erzeugt ein Binärbild durch den vorstehend erwähnten Binarisierungsschwellenwert. Dann führt ein Schritt S503 eine Trennung der Bereiche in dem in Schritt S502 erzeugten Binärbild aus und löst mit Attributen davon verbundene Bereichsdaten aus. Ein nächster Schritt S504 beseitigt in dem in den in Schritt S503 getrennten Bereichsdaten enthaltenen Fehler im Beurteilungsergebnis. Der Fehlerbeseitigungsvorgang in Schritt S504 wird nachfolgend die Layout-Rausch-Verringerung (LNR) genannt. Dann schneidet ein Schritt S505 aus dem Binärbild einen als "Text" in den in Schritt S503 getrennten Bereichsdaten bezeichneten Bereich aus, führt dann das OCR- Verfahren auf ein derartiges Binärbild aus und löst den erkannten Zeichencode aus.
- Im folgenden werden die Einzelheiten des Binarisierungsverfahrens in Schritt S502 des vorliegenden Ausführungsbeispiels unter Bezugnahme auf ein Flussdiagramm gemäss Fig. 3 erklärt.
- Gemäss Fig. 3 gibt ein Schritt S1 das 8-Bit Mehrpegel-Bild von der Speichereinheit 5 der Bildverarbeitungseinrichtung 1 in das RAM in der Steuereinheit 13 ein. Dieses Mehrpegel-Bild ist im voraus in der Speichereinheit 5 mittels der Bildeingabeeinrichtung 2, wie beispielsweise dem Scanner, gespeichert. Dann berechnet ein Schritt S2 ein Histogramm des gesamten Eingabebilds, wobei alle Bildelemente in dem Bild verwendet werden und die Frequenz für jeden Digitalwert von 8 Bits, d. h. von "0" bis "255" bestimmt wird. Somit kann ein Histogramm, wie in Fig. 4 gezeigt, erhalten werden.
- Ein nächster Schritt S3 setzt "0" bzw. "255" auf die Parameter START und ENDE, die jeweils einem Startpunkt und einem Endpunkt der in den folgenden Schritten 54 und 55 bestimmten statistischen Luminanzwerte entsprechen.
- Ein Schritt S4 berechnet einen Mittelwert AV der Bildelemente entsprechend den Digitalwerten von START bis ENDE. Für einen Fall START = 0 und ENDE = 255 wird beispielsweise der Mittelwert AV für die Bildelemente der Werte von "0" bis "255", nämlich aller Bildelemente, berechnet. Für einen Fall START = 0, ENDE = 177 wird der Mittelwert AV für die Bildelemente der Werte von "0" bis "177" berechnet.
- Ein Schritt S5 berechnet einen Versatzwert SK der Bildelemente entsprechend den Luminanzwerten von START bis ENDE. Der Versatzwert ist ein statistisches Maß, dass die Abweichung von der Verteilung des Histogramms anzeigt. Der Versatzwert SK wird durch die folgende Gleichung (1) berechnet:
- SK = (Σ(Xi - AV)^3) /D ... (1)
- wobei R^3 eine dritte Potenz von R, Xi der Luminanzwert des Bildelements und D die Dispersion des gesamten Bilds ist, berechnet durch die folgende Gleichung (2):
- D = Σ(Xi - AV)^2 ... (2)
- wobei R^2 ein Quadrat von R anzeigt.
- In der vorstehenden Gleichung (1) wird der Versatzwert durch die dritte Potenz der Differenz zwischen der Luminanz jedes Bildelements und dem Mittelwert davon erhalten, aber es kann auch irgendeine ungerade nummerierte Potenz anstelle der dritten Potenz verwendet werden.
- Nachfolgende Schritte S6, S7 beurteilen die Richtung der Abweichung des Histogramms. Zuerst beurteilt ein Schritt S6 die Richtung der Abweichung des Histogramms durch die folgende Bedingung (3):
- SK < -1,0 ... (3)
- zur Beurteilung, ob die Abweichung des Histogramms innerhalb eines Bereichs kleiner als der Mittelwert AV ist.
- Die Abfolge schreitet zu einem Schritt S10 oder S7 fort, je nachdem, ob die Bedingung (3) in Schritt S6 erfüllt ist oder nicht. Der Schritt S10 setzt den Mittelwert AV als ENDE, während START unverändert bleibt. Dann kehrt der Ablauf zum Schritt S4 zurück, um wieder den Mittelwert AV der Bildelemente von START bis ENDE zu berechnen.
- Andererseits beurteilt der Schritt S7 die Richtung der Abweichung des Histogramms durch die folgende Bedingung (4):
- SK > 2,0 ... (4)
- zur Beurteilung, ob die Abweichung des Histogramms innerhalb eines Bereichs größer als der Mittelwert AV ist.
- Die Abfolge schreitet zu einem Schritt S11 oder S8 fort, je nachdem, ob die Bedingung (4) in Schritt S7 erfüllt ist oder nicht. Der Schritt S11 setzt den Mittelwert AV als START, während ENDE unverändert bleibt. Dann kehrt der Ablauf zum Schritt S4 zurück, um wieder den Mittelwert AV der Bildelemente vom START zum ENDE zu berechnen.
- Andererseits setzt der Schritt S8 den Mittelwert AV, im Fall, dass die Bedingungen in Schritten S6 und S7 beide nicht erfüllt sind, als die Binarisierungsschwelle TH und ein Schritt S9 bewirkt eine einfache Binarisierung mit einer derartigen Binarisierungsschwelle TH.
- Das Binarisierungsverfahren in dem vorliegenden Ausführungsbeispiel wird auf die vorstehend erwähnte Weise ausgeführt, aber die durch die Bedingungen (3) und (4) dargestellten Bereiche sind nicht auf die vorstehend erwähnten Figuren beschränkt.
- Im folgenden wird das Binarisierungsverfahren des vorliegenden Ausführungsbeispiels weiter klargestellt, mit einem Beispiel für ein bestimmtes Bild.
- Nun wird Bezug auf Fig. 4 genommen, die ein Beispiel für das Histogramm zeigt, zur Erklärung der Bestimmung des Binarisierungsschwellenwerts TH in dem vorliegenden Ausführungsbeispiel.
- Fig. 4 ist das Histogramm eines 8-Bit Eingabebilds, wobei die Abszisse die Digitalwerte der Luminanz von "0" oder schwarz auf der linken Seit bis "255" oder weiß an der rechten Seite anzeigt, während die Ordinate die Frequenz jedes Digitalwerts anzeigt. Fig. 5 zeigt die Veränderung der Parameter für das Bild mit dem in Fig. 4 gezeigten Histogramm in dem Verfahren gemäss der Schritte S4 und S5 in der in Fig. 3 gezeigten Binarisierung. Fig. 5 zeigt die Veränderung jedes Parameters als eine Funktion der Anzahl von Zyklen durch die Schritte S4 und S5.
- Zuerst werden in dem ersten Zyklus durch die Schritte S4 und S5 der Mittelwert AV und der statistische Versatz SK jeweils als "177" und "-78,9" für START = 0 und ENDE = 255 berechnet. Wenn das statistische Maß SK weniger als "-1,0" ist, setzt Schritt S10 START = 0 und ENDE = 177.
- Der zweite Zyklus erzeugt den Mittelwert AV und das statistische Maß SK jeweils als "91" und "-8,6" für START = 0, ENDE = 177. Da das statistische Maß SK wieder weniger als "-1,0" ist, setzt Schritt S10 START = 0, ENDE = 91.
- Der dritte Zyklus erzeugt den Mittelwert AV und das statistische Maß SK jeweils als "43" und "9,6" für START = 0, ENDE = 91. Da das statistische Maß SK in diesem Fall "1,0" überschreitet, setzt Schritt S11 START = 43, ENDE = 91.
- Der vierte Zyklus erzeugt den Mittelwert AV und das statistische Maß SK jeweils als "72" und "-7,0" für START = 43, ENDE = 91. Da das statistische Maß SK weniger als "-1,0" ist, setzt Schritt S10 START = 43, ENDE = 72.
- Der fünfte Zyklus erzeugt den Mittelwert AV und das statistische Maß SK jeweils als "S8" und "-2,2" für START = 43, ENDE = 72. Da das statistische Maß wieder weniger als "-1,0" ist, setzt Schritt S10 START = 43, ENDE = 58.
- Der sechste Zyklus erzeugt den Mittelwert AV und das statistische Maß SK jeweils als "50" und "-0,4" für START = 43, ENDE = S8. Das statistische Maß SK, das größer als "-1,0" und kleiner als "1,0" ist, erfüllt die Bedingungen der Schritte S6 und S7 nicht, so daß Schritt S8 "50" als den Binarisierungsschwellenwert TH setzt. Dann führt der Schritt S9 eine einfache Binarisierung mit dem Binarisierungsschwellenwert TH aus und das binarisierte Bild wird in der Speichereinheit 5 gespeichert.
- Wie vorstehend erklärt, führt das vorliegenden Ausführungsbeispiel eine Binarisierung durch Bestimmung des Binarisierungsschwellenwert derart durch, daß der Versatzwert zu einem vorbestimmten Wert konvergiert. Genauer, in dem Eingabe- Mehrpegel-Bild ist ein Bereich, der einen für eine Trennung des Hintergrunds und des Objekts in dem Bild geeignetsten Schwellenwert enthält, auf der Grundlage der Frequenz der Luminanz und der Abweichung davon bestimmt und die mittlere Luminanz des derart bestimmten Bereichs wird wie der Binarisierungsschwellenwert angenommen. Ein derartiges Verfahren erlaubt, den optimalen Schwellenwert zur Aufteilung der Luminanz der Bildelemente in einem Bereich des Mehrpegel-Eingabebilds automatisch in zwei Klassen, d. h. den Hintergrund und das Objekt, zu bestimmen.
- Im folgenden werden unter Bezugnahme auf ein Flussdiagramm in Fig. 6 die Einzelheiten des Bildbereichstrennungsverfahrens in Schritt S503 in Fig. 2 erklärt.
- Zuerst gibt ein Schritt S601 ein Binärbild in die Speichereinheit 5 ein und speichert es. Dann bewirkt ein Schritt S602 eine Ausdünnung des Eingabebilds derart, dass m · n Bildelemente ein Bildelement werden, wodurch ein Bild zur Bildbereichstrennung erzeugt wird. Bei diesem Vorgang werden, wenn die m · n Bildelemente zumindest ein schwarzes Bildelement enthalten, diese m · n Bildelemente in ein schwarzes Bildelement transformiert.
- Dann trennt ein Schritt S603 einen Bereich, in dem die schwarzen Bildelemente für eine vorbestimmte Anzahl in der vertikalen, horizontalen oder diagonalen Richtung fortgesetzt vorhanden sind, unter allen Bildelementen des Bilds für eine Bildbereichstrennung. Bei diesem Vorgang werden die Bereiche durch in der Reihenfolge der Erfassung der Bereiche angefügte Zahlen bezeichnet. Dann klassifiziert ein Schritt S604 die Bereiche durch das Gewicht, die Höhe, den Bereich und die schwarze Bildelementdichte in dem Bereich, versieht jeden Bereich mit einem Attribut, das "Tabelle", "äußerer Rahmenbereich", "Text", usw. sein kann, wie nachstehend genauer beschrieben wird.
- Ein Schritt S605 berechnet die Mittelwerte der Breite und der Höhe aller als "Text" bezeichneten Bereiche und beurteilt die Zeichenverbindung, wie jeweils in der horizontalen Richtung geschrieben oder in der vertikalen Richtung geschrieben, wenn die erhaltene mittlere Breite größer oder kleiner als die erhaltene mittlere Höhe ist. Zur selben Zeit ist die Zeichengröße jedes Zeichens durch die mittlere Höhe im Fall einer horizontal geschriebenen Anordnung oder durch die mittlere Breite im Fall einer vertikal geschriebenen Anordnung gegeben.
- Auch werden die Spaltenanordnung und der Zeilenabstand aus dem Histogramm aller "Text"bereiche in der vertikalen Richtung (im Fall einer horizontal geschriebenen Anordnung) oder in der horizontalen Richtung (im Fall einer vertikalen Anordnung) auf dem Bild für eine Bildbereichstrennung erfaßt. Ein Schritt S606 nimmt einen "Text"bereich mit einer größeren Zeichengröße als einen "Titel". Dann kombiniert ein Schritt S607 die auf unzusammenhängende Weise gestreuten "Titel"bereiche und die "Text"bereiche entsprechend den Abständen zu den umgebenden Bereichen in einen vereinten Bereich. Dann versieht ein Schritt S608 jeden Bereich mit Bereichsdaten, wie beispielsweise der Koordinate und der Größe in dem Originalbild.
- Im vorliegenden Ausführungsbeispiel bewirkt das vorstehend erklärte Verfahren eine Trennung der Bildbereiche in dem Binärbild und erzeugt die Daten oder jeden Bereich.
- Fig. 7 zeigt ein Beispiel für die vorstehend erwähnten Bereichsdaten, deren Details im folgenden erklärt werden.
- "Zahl" bezeichnet die Reihenfolge einer Erfassung des Bereichs;
- "Attribut" bezeichnet Attributinformationen des Bereichs, klassifiziert in die folgenden acht Attribute:
- "Wurzel" bedeutet das Eingabebild selbst;
- "Text" bedeutet einen Zeichenbereich;
- "Titel" bedeutet einen Titelbereich;
- "Tabelle" bedeutet einen Tabellenbereich;
- "Rauschen" bedeutet einen weder als Zeichen- noch als Bildbereich identifizierbaren Bereich;
- "Rahmen" bedeutet einen Linienbereich, der eine Tabelle oder dergleichen bildet;
- "Photographisches Bild" bedeutet einen Photographiebereich;
- "Linienbild" bedeutet einen Linienbildbereich.
- "Startpunktkoordinate" bezeichnet X, Y Koordinaten, die einen Bereich in dem Originalbild beginnen;
- "Endpunktkoordinate" bezeichnet X, Y Koordinaten, die einen Bereich in dem Originalbild beenden;
- "Bildelementanzahl" bezeichnet die Anzahl aller Bildelemente in dem Originalbild;
- "Zeichenanordnungsinformation" bezeichnet die Information über die Zeichenanordnung, die vertikal geschrieben, horizontal geschrieben oder unidentifiziert ist.
- Im Hinblick auf die in Fig. 7 gezeigten Regionaldaten behält nur der Bereich mit dem als "Text" klassifizierten Attribut in einer hierarchischen Weise die Bereichsdaten auf den Zeilen (Zeilenbereichsdaten) vor der Kombination in Schritt S607 in Fig. 6 zurück.
- Wie vorstehend erklärt, führt das vorliegende Ausführungsbeispiel eine Trennung der Bildbereiche aus. Es ist zu beachten, daß die in Fig. 7 gezeigten Bereichsdaten nur ein Beispiel für die Anwendung des vorliegenden Ausführungsbeispiels sind und abhängig von der Bildverarbeitungseinrichtung geeignet ausgedehnt oder verringert werden können.
- Im folgenden werden die Einzelheiten des LNR-Verfahrens in Schritt S504 in Fig. 3 unter Bezugnahme auf ein Flussdiagramm in Fig. 8 beschrieben. Das LNR-Verfahren besteht darin, aus den getrennten Bildbereichen diese zu beseitigen, die Fehler in der Bildbereichstrennung enthalten.
- Zuerst unterscheidet ein Schritt S701 in Fig. 8, ob die Bereichsdaten nach der Bildbereichstrennung einen Wurzelbereich anzeigen. Der Wurzelbereich bedeutet einen das gesamte Bild umgebenden Bereich, nämlich einen gesamten Bereich. Wenn die Daten den Wurzelbereich anzeigen, schreitet der Ablauf ohne das LNR-Verfahren zu einem Schritt S706 fort. Wenn es nicht der Wurzelbereich ist, unterscheidet ein Schritt S702, ob die Bereichsdaten einen Text(Zeichen)bereich oder einen Rauschbereich anzeigen, und, im Fall eines Text- oder Rauschbereichs schreitet der Ablauf zu einem Schritt S703 fort, aber, wenn nicht, schreitet der Ablauf zu einem Schritt S705 fort.
- Der Schritt S703 bewirkt ein LNR1-Verfahren zur Beseitigung der Bereichsdaten, als einen Fehler in der Bereichstrennung, gemäss der Bereichsgröße und ein Schritt S704 bewirkt ein LNR3-Verfahren zur Beseitigung der Bereichsdaten, als einen Fehler in der Bereichstrennung gemäss dem Schwarzverhältnis innerhalb des Bereichs. Andererseits bewirkt der Schritt S705 ein LNR2-Verfahren zur Beseitigung der Bereichsdaten, die nicht als ein Textbereich oder ein Rauschbereich identifiziert sind, als einen Fehler in der Bereichstrennung gemäss der Größe des Bereichs. Die LNR 1, 3 und 2 Verfahren in den Schritten S703, S704 und S705 werden im folgenden genau beschrieben.
- Dann unterscheidet ein Schritt S706, ob alle Bereiche verarbeitet wurden, und, wenn nicht, kehrt der Ablauf zum Schritt S701 zurück, wenn sie aber vollständig sind, wird das LNR- Verfahren beendet.
- Im folgenden werden dort die Einzelheiten der LNR1-Verfahren im Schritt S703 erklärt.
- Fig. 9 ist ein Flussdiagramm, das das LNR1-Verfahren zeigt. Zuerst liest ein Schritt S731 die Höhe H1 und die Breite W1 aus den Bereichsdaten des zu verarbeitenden Bereichs. Dann setzt ein Schritt S732 zur Berechnung eines bei der Beurteilung der Bereichsgröße zu verwendenden Höhenschwellenwerts HT1 und eines Breitenschwellenwerts WT1 die Leseauflösung SR der Bildeingabeeinrichtung 2, wie beispielsweise des Scanners, und setzt auch eine Punktgröße MP1 des minimalen Zeichens, unbeseitigt in dem Bild, wie MP1h bzw. MP1w für die Höhe und die Breite.
- Im vorliegenden Ausführungsbeispiel werden die Schwellenwerte HT1 und WT1 gemäss den folgenden Gleichungen (5) und (6) berechnet:
- HT1 = (ΣR/72,0) · MP1h ... (5)
- WT1 = (ΣR/72,0) · MP1w ... (6)
- Ein Schritt S733 berechnet den Höhenschwellenwert HT1 gemäss der Gleichung (5). Beispielsweise im Fall, dass die Bildeingabeeinrichtung 2 eine Auflösung SR von 400 dpi besitzt und das minimale Zeichen in dem Bild eine Höhe MP1h von 4 Punkten besitzt, wird der Höhenschwellenwert HT1 als "22" berechnet. Dann vergleicht ein Schritt S734 die Höhe H1 der Bereichsdaten mit dem in Schritt S733 berechneten Höhenschwellenwert HT1 und der Ablauf schreitet zu einem Schritt S735 oder S738 fort, wenn der erstere größer oder kleiner ist.
- Ein Schritt S735 berechnet den Breitenschwellenwert WT1 gemäss Gleichung (6). Dann vergleicht ein Schritt S736 die Breite W1 der Bereichsdaten mit dem Breitenschwellenwert WT1, der in Schritt S735 berechnet wurde, und das LNR-Verfahren wird beendet, wenn der erstere größer ist, aber, wenn der erstere kleiner ist, schreitet der Ablauf zu einem Schritt S737 fort zur Beurteilung des Verhältnisses H1/W1 der Höhe H1 und der Breite W1 der Bereichsdaten. Das LNR1-Verfahren wird beendet, wenn das Verhältnis "2" nicht überschreitet, aber, wenn es "2" überschreitet, wird ein Fehler in der laufenden Trennung des Bereichs identifiziert und der Ablauf schreitet zu einem Schritt S738 fort, um diesen Bereich zu beseitigen.
- Im folgenden werden die Einzelheiten des LNR3-Verfahrens in Schritt S704 in Fig. 8 unter Bezugnahme auf ein Flussdiagramm in Fig. 10 beschrieben. Zuerst sammelt ein Schritt S741 die Anzahl von schwarzen Bildelementen in dem Bereich an und ein Schritt S742 berechnet das Schwarzverhältnis BR in dem Bereich gemäss der folgenden Gleichung (7):
- BR1 = BC/(W1 · H1) · 100 ... (7)
- Dann setzt ein Schritt S743 ein minimales Schwarzverhältnis BRT1 und ein maximales Schwarzverhältnis BRT2, die im voraus entsprechend den Schwarzverhältniskennlinien der Zeichen bestimmt werden, beispielsweise BRT1 = 5 und BRT2 = 52.
- Ein Schritt S744 vergleicht das Schwarzverhältnis BR des Bereichs mit dem minimalen Schwarzverhältnis BRT1 und dem maximalen Schwarzverhältnis BRT2. Wenn das Schwarzverhältnis BR kleiner als das minimale Schwarzverhältnis BRT1 oder größer als das maximale Schwarzverhältnis BRT2 ist, wird ein Fehler bei der laufenden Trennung des Bereichs identifiziert und der Ablauf schreitet zu einem Schritt S745 fort, um den Bereich zu beseitigen. In anderen Fällen wird das LNR3-Verfahren beendet.
- Im folgenden werden die Einzelheiten des LNR2-Verfahrens gemäss Schritt S705 in Fig. 8 unter Bezugnahme auf ein Flussdiagramm in Fig. 11 erklärt. Zuerst liest ein Schritt S751 die Höhe H2 und die Breite W2 aus den Bereichsdaten des zu verarbeitenden Bereichs und zur Berechnung eines bei der Beurteilung der Verhältnisgröße zu verwendender Höhenschwellenwert HT2 und ein Breitenschwellenwert WT2 stellt ein Schritt S752 die Auflösung SR der Bildeingabeeinrichtung 2 ein. Dann unterscheidet ein Schritt S753, ob das Attribut des laufenden Bereichs einen Rahmenbereich anzeigt, und der Ablauf schreitet zu einem Schritt S754 bzw. S757 fort, wenn der Rahmenbereich angezeigt wird oder nicht.
- Ein Schritt S754 setzt eine minimale Punktanzahl MP21 als MP21h, MP21w jeweils für die Höhe und die Breite. Auch setzt ein Schritt S757 einen minimale Punktanzahl MP22 als MP22h, MP22w jeweils für die Höhe und die Breite. Die minimalen Punktanzahlen MP21, MP22 zeigen die durch den Zeichenpunkt dargestellte minimale Größe des Bereichs an, der nicht in dem LNR2- Verfahren jeweils in dem Rahmenbereich oder einem anderen Bereich beseitigt wurde.
- Schritte S755, S758 berechnen die Höhenschwellenwerte HT21, HT22 und die Breitenschwellenwerte WT21, WT22 gemäss den vorstehenden Gleichungen (5) und (6). Im Fall, daß beispielsweise die Bildeingabeeinrichtung 2 eine Auflösung SR von 400 dpi besitzt und die minimale Punktanzahl 4 Punkte für die Höhe und die Breite ist, werden die Schwellenwerte HT22, WT22 beide als "22" berechnet. Dann setzen die Schritte S756 bzw. S759 den Höhenschwellenwert HT2 und den Breitenschwellenwert WT2.
- Ein nächster Schritt S760 bewirkt Vergleiche der Höhe H2 der Bereichsdaten mit dem in den Schritten S756 und S759 gesetzten Höhenschwellenwert HT2 und der Breite W2 der Bereichsdaten mit dem Breitenschwellenwert WT2. Wenn die Höhe H2 der Bereichsdaten kleiner als der Höhenschwellenwert HT2 ist oder die Breite W2 kleiner als der Breitenschwellenwert WT2 ist, wird ein Fehler in der laufenden Trennung des Bereichs identifiziert und ein Schritt S761 beseitigt den Bereich. In anderen Fällen wird das LNR2-Verfahren beendet.
- Wie vorstehend erklärt, beseitigt das LNR-Verfahren des vorliegenden Ausführungsbeispiels den Bereich, in dem der Fehler bei der Trennung des Bereichs identifiziert wird, durch drei verschiedene Vorgänge.
- Wie vorstehend erklärt, erlaubt das vorliegende Ausführungsbeispiel, einen optimalen Schwellenwert bei einer Klassifizierung der Luminanz der Bildelemente in dem Bereich auf einem Mehrpegel-Eingabebild in zwei Klassen von dem Objekt und dem Hintergrund automatisch zu bestimmen. Es ist daher möglich, das Objekt und den Hintergrund in dem Mehrpegel-Bild geeignet zu trennen, wodurch ein äußerst präzises OCR-Verfahren erreicht wird.
- Im vorstehenden ersten Ausführungsbeispiel wird angenommen, dass das Eingabebild aus 8-Bit Mehrpegel-Bilddaten zusammengesetzt ist, aber die vorliegende Erfindung ist nicht auf einen derartigen Fall beschränkt und auf irgendwelche Bildinformationen anwendbar, die eine Vielzahl von Bits zur Binarisierung enthalten, wie beispielsweise ein Farbbild.
- Auch kann das Abtasten des Bilds für eine Histogrammberechnung auf jedes Bildelement oder ein Bildelement auf jedem zahlreicher Bildelemente erfolgen. Auch die Berechnung des Mittelwerts AV oder das statistischen Ausmaßes SK muss nicht notwendigerweise mit 8 Bits durchgeführt werden, sondern kann anstelle davon mit einer geringeren Anzahl von Bits für den Zweck eines Erreichens einer höheren Geschwindigkeit oder einer Verringerung der Speicherkapazität durchgeführt werden.
- Auch wird das statistische Versatzmaß SK durch eine konvergierende Bedingung von ±1,0 definiert, aber eine derartige Bedingung ist nicht einschränkend und dort kann irgendeine Konfiguration zur Bestimmung des Binarisierungsschwellenwerte durch den Versatz SK angepaßt werden.
- Wie im vorstehenden erklärt, erlaubt das erste Ausführungsbeispiel der vorliegenden Erfindung, automatisch einen geeigneten Schwellenwert zwischen der Objektdichte und der Hintergrunddichte in einem Mehrpegel-Eingabebild zu setzen, indem ein Bereich bestimmt wird, der einen optimalen Schwellenwert zur Trennung des Objekts und des Hintergrunds auf der Grundlage der Frequenz und der Abweichung der Luminanz enthält, und dann zum Nehmen der mittleren Luminanz des bestimmten Bereichs als den Binarisierungsschwellenwert, wodurch ein Binärbild erhalten wird, in dem das Objekt geeignet von dem Hintergrund getrennt ist, ohne Erzeugung einer Blockverzerrung.
- Die Systemkonfiguration des zweiten Ausführungsbeispiels wird nicht erklärt, soweit sie dieselbe ist wie die des ersten Ausführungsbeispiels.
- Im folgenden wird die Bildverarbeitung in der Bildverarbeitungseinrichtung 1 des zweiten Ausführungsbeispiels unter Bezugnahme auf ein Flussdiagramm in Fig. 12 beschrieben.
- Zuerst gibt ein Schritt S21 ein Originalbild durch die Eingabeeinheit 4 in die Bildverarbeitungseinrichtung 1 ein. Das Eingabebild in der Form von 8-Bit Mehrpegel-Bilddaten wird in einer nicht dargestellten Arbeitsspeichereinrichtung gespeichert. Dann bewirkt ein Schritt S22 eine Beseitigung des in der Bildeingabeeinrichtung 2 bei der Bildeingabe erzeugten elektrischen Rauschens und Korrekturen des Eingabebilds, wie beispielsweise für die Verschlechterung des Originalbilds und der Neigung davon. Dann bewirkt ein Schritt S23 ein Binarisierungsverfahren für jeden Pegel der Luminanzhierarchie durch die Luminanzfrequenz-Anhäufungseinheit 6, die Binarisierungsschwellenwert-Berechnungseinheit 7 und die Binarisierungseinheit 8, und ein Bereichstrennverfahren durch die Bereichstrenneinheit 9. Die Einzelheiten des Bereichstrennverfahrens gemäß der Luminanzhierarchie im Schritt S23 werden später erklärt.
- Dann bewirkt ein Schritt S24 gemäss dem Ergebnis der Bereichstrennung gemäss der Luminanzhierarchie im Schritt S23 ein OCR- Verfahren durch die Zeichenerkennungseinheit 10 für eine Zeichenerkennung oder eine Bildverarbeitung, wie beispielsweise ein Pseudohalbtonverfahren durch das Fehlerdiffusionsverfahren oder durch das Ditherverfahren in der Bildverarbeitungseinheit 11 in einem anderen Bereich. Dann synthetisiert ein Schritt S25 die für jeweilige hierarchische Pegel verarbeiteten Bereiche in ein Bild und ein Schritt S26 zeigt das synthetisierte Bild auf der Bildanzeigeeinrichtung 3 durch die Ausgabeeinheit 12 an.
- Im folgenden werden die Einzelheiten des Bereichstrennungsverfahrens durch die Luminanzhierarchie im Schritt S23 in Fig. 12 beschrieben.
- Das vorliegende Ausführungsbeispiel wird durch ein Beispiel einer Verarbeitung eines Bilds erklärt, in dem schwarze und graue Zeichen auf einem weißen Hintergrund ausgebildet sind.
- Fig. 13 ist ein Histogramm, das die Frequenz der Luminanz eines Bilds zeigt, einschließlich eines in dem vorliegenden zweiten Ausführungsbeispiel zu verarbeitenden Zeichenbereichs.
- In Fig. 13 bezeichnet die Abszisse die Luminanz in Digitalwerten von "0" oder Schwarz am linken Ende und "255" oder Weiß am rechten Ende und die Ordinate bezeichnet die Frequenz jeder digitalen Luminanz. Somit entspricht in Fig. 13 der weiße Bereich des verarbeiteten Bilds mit einer hohen Luminanz einer Spitze an der rechten Seite, während der Bereich von schwarzen Zeichen mit einer niedrigen Luminanz einer Spitze auf der linken Seite entspricht und die grauen Zeichen mit der Zwischenluminanz entsprechen einer Spitze in der Mitte.
- Im folgenden wird das Bereichstrennungsverfahren gemäss dem vorliegenden zweiten Ausführungsbeispiel abhängig von der Luminanzhierarchie unter Bezugnahme auf ein Flussdiagramm in Fig. 14 erklärt.
- Zuerst setzt ein Schritt S31 eine Luminanzhierarchiezahl auf "1". Die Luminanzhierarchiezahl wird gemäss dem Merkmal (Anzahl von Spitzen) in der Frequenz der Luminanz in dem Bild gesetzt und in dem in Fig. 13 gezeigten Beispiel ist die Luminanzhierarchiezahl für die schwarzen Zeichen "1", für die grauen Zeichen "2" und für den weißen Bereich "3". Die Luminanzhierarchiezahl wird jedem Luminanzpegel gegeben, in dem die Zeichenerkennung durchzuführen ist.
- Ein nächster Schritt S32 führt als ein Vor-Verfahren für die Bereichstrennung eine einfache Binarisierung mit einem Schwellenwert optimal für die Bereichstrennung aus. Dann extrahiert ein Schritt S34 einen schwarzen Bildelementbereich aus dem binarisierten Bild, bewirkt eine Trennung in einen Textbereich, einen Photographiebereich, einen Musterbereich, usw. gemäss dem Merkmal des schwarzen Bildelementbereichs und gibt die später zu erklärenden Bereichsdaten frei. Dann bewirkt ein Schritt S34 als ein Nach-Verfahren der Bereichstrennung eine Beseitigung des Bereichs in dem ein Fehler ist, dessen Einzelheiten später erklärt werden. Dann unterscheidet ein Schritt S35, ob die Luminanzhierarchiezahl gleich oder kleiner als "1" ist. Wenn die Luminanzhierarchiezahl gleich oder kleiner als "1" ist, nämlich, wenn sie "1" ist, schreitet der Ablauf zu einem Schritt S36 fort, aber, wenn sie es nicht ist, nämlich, wenn sie gleich "2" oder größer ist, wird das Verfahren beendet.
- Bei der Unterscheidung gemäss Schritt S35 zur Beurteilung, ob die Luminanzhierarchiezahl gleich oder kleiner als "1" ist, wird dieser Wert durch Subtraktion eines festen Werts "2" von der maximalen Luminanzhierarchiezahl "3" bestimmt, so dass das vorliegende Ausführungsbeispiel an eine Erhöhung oder eine Verringerung in der Zahl von hierarchischen Luminanzpegeln anpassen kann.
- Ein Schritt S36 löscht einen schwarzen Bildelementbereich mit der Luminanzhierarchiezahl, getrennt als schwarze Zeichen, als einen bereits getrennten Bereich, aus dem Eingabebild und speichert ihn in der Speichereinheit 5. Diese Löschung erlaubt, die Trennung des grauen Zeichenbereichs mit der Luminanzhierarchiezahl "2", nur in den Bereichen anders als den schwarzen Zeichenbereichen mit der Luminanzhierarchiezahl "1" zu bewirken. Somit fügt ein Schritt S37 "1" zur Luminanzhierarchiezahl hinzu und der Ablauf kehrt zum Bereichstrennungsverfahren in Schritt S32 zurück.
- Wie vorstehend erklärt, bewirkt die Bereichstrennung durch die Luminanzhierarchie in dem vorliegenden Ausführungsbeispiel zuerst eine Binarisierung für die schwarzen Zeichenbereiche mit der Luminanzhierarchiezahl "1", gefolgt von einer Trennung der Bereiche und einer Beseitigung eines Fehlers in dem Bereich, und bewirkt nach der Löschung von somit getrennten schwarzen Bildelementbereichen eine Binarisierung für die grauen Zeichenbereiche mit der Luminanzhierarchiezahl "2", gefolgt von einer Trennung der Bereiche und Beseitigung eines Fehlers in dem Bereich.
- Im folgenden werden Einzelheiten der Binarisierung als das Vor-Verfahren für eine Bereichstrennung im Schritt S32 in Fig. 14 unter Bezugnahme auf ein Flussdiagramm in Fig. 15 erklärt. Das Vor-Verfahren in Schritt S32 wird zweimal ausgeführt, für die Luminanzhierarchiezahlen "1" und "2" mit jeweiligen Schwellenwerten TH1 und TH2, die gesammelt als TH in Fig. 15 dargestellt werden.
- Zuerst wird ein Fall für die Luminanzhierarchiezahl "1" erklärt.
- Gemäss Fig. 15 berechnet ein Schritt S51 das Histogramm des Eingabebilds durch Berechnung der Frequenz der 8-Bit Werte von "0" bis "255" für alle Bildelemente des Bilds. Somit wird ein Histogramm, wie in Fig. 13 gezeigt, erhalten.
- Dann setzt ein Schritt S52 "0" bzw. "255" für Parameter START und ENDE, die den Start- und Endpunkten eines in den nachfolgenden Schritten S53 und S54 bestimmten statistischen Luminanzmaßes entsprechen.
- Ein Schritt S53 berechnet den Mittelwert AV der Bildelemente entsprechend den Digitalwerten von START bis ENDE. In einem Fall von ST = 0 und EN = 255 wird beispielsweise der Mittelwert AV auf die Bildelemente der Werte von "0" bis "255" berechnet (in diesem Fall nämlich aller Bildelemente) und in einem Fall Von ST = 0 und EN = 177 wird die Berechnung der Bildelemente der Werte von "0" bis "177" durchgeführt.
- Dann berechnet ein Schritt S54 einen Versatzwert SK der Bildelemente entsprechend den Luminanzwerten von START bis ENDE. Der Versatz ist das statistische Maß, das die Abweichung der Verteilung des Histogramms darstellt, und wird durch die folgende Gleichung (1) berechnet:
- SK = (Σ(Xi - AV)^S)/D ... (1)
- wobei R^3 eine dritte Potenz von R anzeigt, X die Luminanz jedes Bildelements anzeigt und D die Dispersion des eingegebenen Bilds ist, berechnet durch die Gleichung (2):
- D = Σ(Xi - AV)^2 ... (2)
- wobei R^2 ein Quadrat von R anzeigt.
- Nachfolgende Schritte S55 und S56 beurteilen die Richtung einer Abweichung des Histogramms. Der Schritt S55 beurteilt die Richtung einer Abweichung des Histogramms durch die folgende Bedingung (3):
- SK < -1,0 ... (3),
- die anzeigt, ob das Histogramm eine Abweichung nach links aufweist.
- Der Ablauf schreitet zu einem Schritt S59 oder S56 fort, jeweils, wenn die Bedingung (3) in Schritt S55 erfüllt ist oder nicht. Der Schritt S59 setzt den Mittelwert AV als das ENDE, während START unverändert bleibt, und der Ablauf kehrt zum Schritt S53 zur erneuten Berechnung des Mittelwerts AV von START bis ENDE zurück.
- Andererseits beurteilt der Schritt S56 die Richtung der Abweichung des Histogramms durch die folgende Bedingung (4):
- SK > 1,0 ... (4),
- die anzeigt, daß das Histogramm eine Abweichung nach rechts aufweist.
- Der Ablauf schreitet jeweils zu einem Schritt S510 oder S57 fort, jeweils, wenn die Bedingung (4) in Schritt S56 erfüllt ist oder nicht. Der Schritt S510 setzt den Mittelwert AV als den START, während ENDE unverändert bleibt, und der Ablauf kehrt zum Schritt S53 zurück, um wiederum den Mittelwert AV von START bis ENDE zu berechnen.
- Andererseits setzt der Schritt S57 in einem Fall, in dem die vorstehend erwähnten Bedingungen beide in den Schritte S55 und S56 nicht erfüllt sind, den Mittelwert AV als einen Binarisierungsschwellenwert TH1. Dann bewirkt ein Schritt S58 ein einfaches Binarisierungsverfahren mit dem Binarisierungsschwellenwert TH1.
- Im vorliegenden Ausführungsbeispiel wird das Binarisierungsverfahren für die Luminanzhierarchiezahl "1" auf die vorstehend erwähnte Weise ausgeführt, in der ein für einen Bereich der schwarzen Zeichen geeigneter Binarisierungsschwellenwert ausgewählt wird und ein einfaches Binarisierungsverfahren ausgeführt wird. Anders gesagt, es wird eine Binarisierung ausgeführt, die für den schwarzen Zeichenbereich geeignet ist.
- Im folgenden wird eine genauere Erklärung für die Bestimmung des vorstehend erwähnten Binarisierungsschwellenwerts TH1 unter Verwendung des Beispiels des in Fig. 13 gezeigten Histogramms gegeben.
- Fig. 16 ist eine Graph, der die Veränderung von Parametern in dem in Fig. 15 gezeigten Bereichstrennungs-Vor-Verfahren auf ein Bild mit einem in Fig. 13 gezeigten Histogramm zeigt. In Fig. 16 sind die Parameter durch die Anzahl von Zyklen durch die Schritte S53 und S54 in dem in Fig. 15 gezeigten Flussdiagramm gezeigt.
- Im ersten Zyklus durch die Schritte S53 und S54 werden der Mittelwert AV und das statistische Maß SK jeweils als "185" und "-102,5" für START = 0 und ENDE = 255 berechnet. Wenn das statistische Maß SK weniger als "-1,0" ist, setzt der Schritt S59 START = 0 und ENDE = 185.
- Im zweiten Zyklus werden der Mittelwert AV und das statistische Maß SK jeweils als "98" und "-14,6" für START = 0 und ENDE = 185 berechnet. Wenn das statistische Maß wieder weniger als "-1,0" ist, setzt der Schritt S59 START = 0 und ENDE = 98.
- Im dritten Zyklus werden der Mittelwert AV und das statistische Maß SK jeweils als "45" und "10,7" für START = 0 und ENDE = 98 berechnet. Wenn das statistische Maß SK "1,0" überschreitet, setzt der Schritt S510 START = 45 und ENDE = 98.
- Im vierten Zyklus werden der Mittelwert AV und das statistische Maß SK jeweils als "77" und "-8,2" für START = 45 und ENDE = 98 berechnet. Wenn das statistische Maß SK kleiner als "- 1,0" ist, setzt der Schritt S59 START = 45 und ENDE = 77.
- Im fünften Zyklus werden der Mittelwert AV und das statistische Maß SK jeweils als "63" und "-3,0" für START = 45 und ENDE = 77 berechnet. Wenn das statistische Maß SK wieder kleiner als "-1,0" ist, setzt der Schritt S59 START 45 und ENDE = 63.
- Im sechsten Zyklus werden der Mittelwert AV und das statistische Maß SK jeweils als "54" und "0,9" für START 45 und ENDE = 63 berechnet. Wenn das statistische Maß SK größer ist als "- 1,0" und kleiner als "1,0", sind die Bedingungen der Schritte S55, S56 nicht erfüllt. Somit schreitet der Ablauf zum Schritt S57 fort, um "54" als den Binarisierungsschwellenwert TH1 zu setzen, und der Schritt S58 führt die einfache Binarisierung mit diesem Binarisierungsschwellenwert TH1 aus.
- Wie vorstehend erklärt, wird der Binarisierungsschwellenwert so bestimmt, daß der Versatz zu einem vorbestimmten Wert konvergiert.
- Im vorstehenden wurde das Binarisierungsverfahren für die Luminanzhierarchiezahl "1" erklärt. Im folgenden wird die Binarisierung für die Zeichen mittlerer Luminanz mit der Luminanzhierarchiezahl "2" wieder unter Bezugnahme auf das Flussdiagramm in Fig. 15 erklärt.
- Zuerst berechnet der Schritt S51 das Histogramm des Objektbilds. Wenn der Schritt S36 in Fig. 14 bereits den getrennten Bereich (schwarzen Zeichenbereich) mit der Luminanzhierarchiezahl "1" gelöscht hat und der Schritt S37 die Luminanzhierarchiezahl auf "2" gesetzt hat, kann der Schritt S51 die Frequenz der Luminanzwerte entsprechend der Luminanzhierarchiezahl "2" in den Bildelementen des Bilds anders als die bereits getrennten Bereiche mit der Luminanzhierarchiezahl "1" berechnen.
- Als ein Ergebnis nimmt das im Schritt S51 erhaltene Histogramm eine Form wie in Fig. 17 gezeigt an. Es ist zu beachten, daß die Figuren 13 und 17 verschiedene Maßstäbe in der Ordinate besitzen. Die Schritte S52 bis S58 werden auf dieselbe Weise ausgeführt wie im vorstehenden Fall für die Luminanzhierarchiezahl "1", aber der in diesen Schritten bestimmte Binarisierungsschwellenwert TH2 ist natürlich verschieden von dem vorstehend erwähnten Binarisierungsschwellenwert TH1.
- Im folgenden wird eine genauere Erklärung für die Bestimmung des vorstehend erwähnten Binarisierungsschwellenwerts TH2 unter Verwendung des Beispiels des in Fig. 17 gezeigten Histogramms gegeben.
- Fig. 18 ist eine Darstellung, die die Veränderung von Parametern in dem in Fig. 18 gezeigten Bereichstrennungs-Vor- Verfahren auf einem Bild mit einem Histogramm, wie in Fig. 17 gezeigt, gezeigt. In Fig. 18 sind die Parameter durch die Anzahl von Zyklen durch die Schritte S53 und S54 in dem in Fig. 15 gezeigte Flussdiagramm gezeigt.
- Im ersten Zyklus durch die Schritte S53 und S54 werden der Mittelwert AV und das statistische Maß SK als "186" und "- 53,4" für START = 0 und ENDE = 255 berechnet. Wenn das statistische Maß SK kleiner als "-1,0" ist, setzt der Schritt S59 START = 0 und ENDE 186.
- Im zweiten Zyklus werden der Mittelwert AV und das statistische Maß SK jeweils als "122" und "4,2" für START = 0 und ENDE = 255 berechnet. Wenn das statistische Maß SK "1,0" überschreitet, setzt der Schritt S510 START = 0 und ENDE = 186.
- Im dritten Zyklus werden der Mittelwert AV und das statistische Maß SK jeweils als "149" und "5,8" für START = 122 und ENDE = 186 berechnet. Wenn das statistische Maß SK "1,0" überschreitet, setzt der Schritt S510 START = 149 und ENDE = 186.
- Im vierten Zyklus werden der Mittelwert AV und das statistische Maß SK jeweils als "167" und "-0,5" für START = 149 und ENDE = 186 berechnet. Wenn das statistische Maß SK größer als "-1,0" und kleiner als "1,0" ist, sind die Bedingungen in den Schritten S55, S56 nicht erfüllt. Somit schreitet der Ablauf zu Schritt S57 fort, um den Binarisierungsschwellenwert TH2 = 167 zu setzen, und der Schritt S58 führt die einfache Binarisierung mit diesem Binarisierungsschwellenwert TH2 aus.
- Wie im vorstehenden erklärt, wird das Binarisierungsverfahren für die Bereiche mit der Luminanzhierarchiezahl "2" durchgeführt.
- Der Binarisierungsschwellenwert TH1 für die Luminanzhierarchiezahl "1" und der Binarisierungsschwellenwert TH2 für die Luminanzhierarchiezahl "2" werden wie in Fig. 19 gezeigt korreliert. Das Histogramm in Fig. 19 ist dasselbe wie das in Fig. 13 und stellt die Frequenz der Luminanz aller Bildelemente dar. Zuerst wird eine Binarisierung für die Luminanzhierarchiezahl "1" mit dem Binarisierungsschwellenwert TH1 = 54 ausgeführt, wodurch der "schwarze" Bereich A von dem weißen Bereich B getrennt wird. Dann wird eine Binarisierung für die Luminanzhierarchiezahl "2" mit dem Binarisierungsschwellenwert TH2 = 167 auf die Bildelemente in dem Bereich B nach der Löschung des Bereichs A ausgeführt, wodurch ein "schwarzer" Bereich C von einem weißen Bereich D getrennt wird.
- Erfindungsgemäss werden, wie in Fig. 19 gezeigt, alle Bildelemente in drei Bereiche getrennt, nämlich einen Bereich A mit Luminanzen 0 bis 54, einen Bereich C mit Luminanzen 54 bis 167 und einen Bereich D mit Luminanzen 167 bis 255.
- Das Bereichstrennungsverfahren gemäss Fig. 533 in Fig. 14 ist dasselbe wie das gemäss dem in den Figuren 6 und 7 gezeigten ersten Ausführungsbeispiel und wird daher nicht weiter erklärt werden.
- Auch das Bereichstrennungs-Nach-Verfahren gemäss Schritt S34 in Fig. 14 besteht darin, zwischen den getrennten Bereichen einen Bereich zu beseitigen, der einen Fehler in der Trennung darstellt, und ist dasselbe wie die Entwurf-Rausch-Reduzierung (LNR) gemäss Schritt. S504 des ersten Ausführungsbeispiels in Fig. 2, und der Inhalt dieses Verfahrens ist derselbe wie bereits in Bezug auf die Figuren 8 bis 12 erklärt.
- Im folgenden werden die Einzelheiten der Bildverarbeitung durch Luminanzhierarchie im Schritt S24 in Fig. 12 unter Bezugnahme auf ein Flussdiagramm in Fig. 20 erklärt.
- Zuerst liest ein Schritt S161 die Bereichsdaten für die Luminanzhierarchiezahl "1", die aus dem Eingabebild im Schritt S36 in Fig. 14 gelöscht und in der Speichereinheit 5 gespeichert sind. Dann unterscheidet ein Schritt S162 durch das Attribut der Bereichsdaten, ob der Bereich ein Zeichenbereich ist. Im Fall eines Zeichenbereichs schreitet der Ablauf zu einem Schritt S163 fort, um eine einfache Binarisierung mit einem Schwellenwertoptimum für die Texterkennung durch das OCR zu bewirken, wie es später genauer beschrieben wird, und dann bewirkt ein Schritt S164 das OCR-Verfahren. Wenn es kein Zeichenbereich ist, wird der Bereich als ein Bildbereich betrachtet und in einem Schritt S165 durch ein Pseudohalbtonverfahren, wie beispielsweise das Fehlerdispersionsverfahren oder das Ditherverfahren, binarisiert.
- Dann unterscheidet ein Schritt S166, ob immer noch ein unverarbeiteter Bereich verbleibt, und der Ablauf schreitet zu jeweils einem Schritt S162 oder S167 fort, wenn ein derartiger unverarbeiteter Bereich bleibt oder nicht. Der Schritt S167 unterscheidet, ob die laufenden Bereichsdaten eine Luminanzhierarchiezahl "1" besitzen, und, wenn sie "1" sind, schreitet der Ablauf zu einem Schritt S168 fort, aber, wenn sie es nicht sind, wird die Bildverarbeitung durch Luminanzhierarchie beendet. Der Schritt S168 liest die Bereichsdaten für die Luminanzhierarchiezahl "2" und der Ablauf kehrt zu Schritt S162 zurück.
- Wie vorstehend erklärt, bewirkt das vorliegende Ausführungsbeispiel eine Zeichenerkennung für jeden Zeichenbereich in jedem hierarchischen Luminanzpegel.
- Im folgenden werden die Einzelheiten des Zeichenerkennungs- Vor-Verfahrens gemäss Schritt S163 in Fig. 20 unter Bezugnahme auf ein Flussdiagramm in Fig. 21 erklärt, das die Merkmale der das Zeichenerkennungs-Vor-Verfahren bildenden Binarisierung am besten darstellt.
- Zuerst liest ein Schritt S171 die Höhe H und die Breite W aus den Bereichsdaten in einem Zeilenbereich in dem Zeichenbereich. Dann stellt ein Schritt S172 die Auflösung SR der Bildeingabeeinrichtung 2, wie beispielsweise des Scanners, ein und ein Schritt S173 liest das 8-Bit Mehrpegel-Bild des zu verarbeitenden Zeilenbereichs in die Arbeitsspeichereinrichtung. Dann berechnet ein Schritt S174 das Histogramm (Frequenz der Digitalwerte "0" bis "255") des verarbeiteten Zeilenbereichs und ein Schritt S175 liest ein Schwarzverhältnis BR, das gemäss der Beziehung zwischen der Höhe H des Zeilenbereichs und der Auflösung SR der Bildeingabeeinrichtung 2 vorbestimmt ist. Das Schwarzverhältnis BR, das später genauer zu erklären ist, wird, wie bereits im Fall eines vertikal geschriebenen Textes erwähnt, bestimmt, aber im Fall eines horizontal geschriebenen Textes, wird es gemäss der Beziehung zwischen der Breite W des Zeichenbereichs und der Auflösung SR bestimmt.
- Ein nachfolgender Schritt S176 bestimmt einen Binarisierungsschwellenwert auf der Grundlage des BR, wie später genauer beschrieben wird, und ein Schritt S177 bewirkt eine einfache Binarisierung mit dem im Schritt S176 bestimmten Schwellenwert. Schließlich unterscheidet ein Schritt S178, ob noch irgendein unverarbeiteter Zeilenbereich verbleibt, und das vorstehend erklärte Verfahren wird wiederholt, bis alle Zeilenbereiche in dem Zeichenbereich binarisiert sind.
- Nun wird das Schwarzverhältnis BR, das durch die Beziehung zwischen der Höhe H des Zeilenbereichs und der Auflösung SR der Eingabeeinrichtung 2 bestimmt ist, unter Bezugnahme auf Fig. 21 genauer erklärt.
- Wie in Fig. 22 gezeigt, wird BR für jede Punktgröße des Zeichens gesetzt. Die Punktgröße des Zeichens wird berechnet durch:
- P = (72,0/SR) · H ... (8)
- Wie aus Gleichung (8) verständlich, kann die Punktgröße P eines Zeichens in dem Objektzeilenbereich aus der Höhe H des Zeilenbereichs und der Auflösung SR berechnet werden. Somit wird das Schwarzverhältnis BR für den Zeilenbereich, das die beste Erkennung des Zeichens jeder Punktgröße ermöglicht, experimentell wie in Fig. 22 gezeigt bestimmt. Als ein Beispiels wird für eine Höhe "56" des Zeilenbereichs und für eine Eingabeauflösung von 400 dpi die Punktgröße des Zeichens in diesem Zeilenbereichs als "10" Punkte berechnet. In diesem Fall wird BR als "14" ausgewählt, basierend auf einem experimentellen Ergebnis, daß die Zeichenerkennungsrate für die Zeichen mit 10 Punkten am höchsten wird, wenn das Schwarzverhältnis in dem Bereich 14% beträgt.
- Wenn das Zeichenerkennungs-Vor-Verfahren unabhängig für einen Bereich mit der Luminanzhierarchiezahl "1" und für einen Bereich mit der Luminanzhierarchiezahl "2" ausgeführt wird, kann auf diese Weise eine sichere Zeichenerkennung nach einer geeigneten Binarisierung gemäss dem jeweiligen Histogramm erreicht werden.
- Im folgenden wird in der Bildverarbeitungseinrichtung 2 gemäss dem vorliegenden Ausführungsbeispiel ein bestimmtes Beispiel zur Eingabe eines Bilds, einschließlich eines Textes von der Bildeingabeeinrichtung 2 und seines Anzeigens auf der Bildanzeigeeinrichtung 3 erklärt. Als ein Beispiel für das Originalbild wird ein Zeichenbereich genommen, der Zeichen " " in gothischem Stil enthält.
- Zuerst wird das vorstehend erwähnte Originalbild von der Bildeingabeeinrichtung 2 eingegeben. Fig. 23A zeigt einen Fall von schwarzen Zeichen auf einem nahezu weißen Hintergrund, während Fig. 23B einen Fall von grauen Zeichen zeigt. Es wird angenommen, dass der Zeilenbereich eine Höhe H von "34" und die Bildeingabeeinrichtung 2 eine Eingabeauflösung von 400 dpi besitzt. Wenn die Zeichen "6" Punkte aus Gleichung (8) sind, ist BR aus Fig. 22 gegeben als "13". Diese Bilder bilden jeweils in den Figuren 24A und 24B gezeigte Histogramme und die ein Schwarzverhältnis von 13% bildenden Schwellenwerte sind jeweils "29" und "123"". Eine Binarisierung der Bilder gemäss den Figuren 23A und 23B mit diesem Schwellenwerten erzeugen Bilden in den Figuren 25A und 25B, die anzeigen, daß sowohl die schwarzen als auch die grauen Zeichen geeignet binarisiert werden können.
- Wie im vorstehenden erklärt, ermöglicht die geeignete Bestimmung des Binarisierungsschwellenwerts, um das OCR-Verfahren anzupassen, eine Binarisierung ohne Verschlechterung des Mehrpegel-Bilds im Zeilenbereich. Demzufolge kann eine Verbesserung der Erkennungsrate im Zeichenerkennungsverfahren erreicht werden.
- Wie im vorstehenden erklärt, ermöglicht das vorliegende zweite Ausführungsbeispiel eine Zeichenerkennung auf genauere Weise, da es eine sehr präzise Binarisierung für graue Zeichen erreichen kann, auch bei einer Verarbeitung eines Bilds, das gemischt drei oder mehr Luminanzpegel (weiß, grau und schwarz) enthält.
- Das vorstehende zweite Ausführungsbeispiel verwendet drei hierarchische Luminanzpegel, aber die vorliegende Erfindung ist nicht auf ein derartiges Ausführungsbeispiel beschränkt und die Anzahl der Luminanzpegel kann gemäss dem aktuellen Bild bestimmt werden.
- Im vorstehenden zweiten Ausführungsbeispiel wird angenommen, dass das Eingabebild aus 8-Bit Mehrpegel-Daten zusammengesetzt ist, aber die vorliegende Erfindung ist nicht auf einen derartigen Fall beschränkt und auf irgendwelche Bildinformationen anwendbar, die zahlreiche Bits zur Binarisierung enthalten, wie beispielsweise ein Farbbild.
- Auch die Abtastung des Bilds für eine Histogrammberechnung kann auf jedes Bildelement oder ein Bildelement von jeden zahlreichen Bildelementen erfolgen. Auch muss die Berechnung des Mittelwerts AV oder des statistischen Maßes SK nicht notwendigerweise mit 8 Bits durchgeführt werden, aber kann anstelle davon mit einer geringeren Anzahl von Bits für den Zweck eines Erreichens eines höheren Geschwindigkeit oder Verringerung der Speicherkapazität durchgeführt werden.
- Auch ist das statistische Versatzmaß SK durch eine konvergierende Bedingung von ±1,0 definiert, aber eine derartige Bedingung ist nicht beschränkend und es kann irgendeine Konfiguration zur Bestimmung der Binarisierungsschwellenwerte durch den Versatz SK angenommen werden.
- Auch wurde in der vorstehenden Erklärung des zweiten Ausführungsbeispiels das Schwarzverhältnis BR im Fall von gothischem Stil erklärt, aber andere Zeichenstile können natürlich auf eine ähnliche Weise verarbeitet werden. Auch kann BR gemäss dem Zeichenstil verändert werden.
- Auch werden im vorstehenden zweiten Ausführungsbeispiel die Schwarzverhältnisse BR im Voraus in einer Tabelle gesetzt und der BR-Wert für jeden Zeichenbereich wird gemäss der Höhe des Zeichenbereichs und der Auflösung der Bildeingabeeinrichtung ausgewählt, aber der BR-Wert kann durch den Bediener für jeden Zeichenbereich beliebig gesetzt werden. Anders gesagt, der BR- Wert kann durch irgendeine geeignete Einrichtung bestimmt werden.
- Weiterhin wird in dem vorstehenden zweiten Ausführungsbeispiel der Schwellenwert für jeden Zeilenbereich in dem Zeichenbereich bestimmt, aber das Schwellenwerteinstellverfahren ist nicht auf ein derartiges Beispiel beschränkt. Beispielsweise kann eine bestimmte Beschränkung auf den Schwellenwert derart angewendet werden, dass die Schwellenwerte in einem selben Zeichenbereich sich nicht bedeutend unterscheiden, indem andere Schwellenwerte in demselben Zeichenbereich betrachtet werden.
- Es ist auch möglich, die Zeichenerkennung durch Unterscheidung des grauen Zeichenbereichs und des schwarzen Zeichenbereichs zu bewirken, indem die Luminanzhierarchieinformationen in die Bereichsdaten eingeschlossen werden.
- Wie vorstehend erklärt, ermöglicht das zweite Ausführungsbeispiel eine sehr präzise Binarisierung für jeden Luminanzpegel auch bei einer Verarbeitung eines Bilds, das gemischt drei oder mehr Luminanzpegel enthält, indem eine Binarisierung mit einem Binarisierungsschwellenwert ausgeführt wird, der für jeden hierarchischen Luminanzpegel und dann Bereich für jeden hierarchischen Luminanzpegel berechnet wird, wobei eine exakte Bereichstrennung über eine Vielzahl von Luminanzpegeln erreicht werden kann.
- Es ist auch möglich, die Zeichenerkennung durch Unterscheidung des grauen Zeichenbereichs und des schwarzen Zeichenbereichs zu bewirken, da jeder Bereich in zahlreiche hierarchische Luminanzpegel unterschieden werden kann.
- Weiterhin ermöglicht das zweite Ausführungsbeispiel, wie im vorstehenden erklärt, eine Zeichenerkennung für jeden Luminanzpegel auf präzisiere Weise, da eine hochpräzise Binarisierung für jeden Luminanzpegel möglich ist, auch wenn ein Bild verarbeitet wird, das gemischt drei oder mehr Luminanzpegel enthält, indem eine Binarisierung mit einem für einen hierarchischen Luminanzpegel berechneten ersten Binarisierungsschwellenwert ausgeführt wird, gefolgt von einer Bereichstrennung, dann Ausführen einer Binarisierung mit einem zweiten Binarisierungsschwellenwert für die Bereiche ausschließlich des bereits getrennten Bereichs, und Bewirken der Zeichenerkennung auf den so binarisierten Zeichenbereich, wodurch eine Verbesserung in der Erkennungsrate für beispielsweise die grauen Zeichen erreicht wird.
- Es ist auch möglich, die Zeichenerkennung durch Unterscheidung des grauen Zeichenbereichs und des schwarzen Zeichenbereichs zu bewirken, da jeder Bereich in zahlreiche hierarchische Luminanzpegel unterschieden werden kann.
- Die vorliegende Erfindung ist nicht nur auf ein System zusammengesetzt aus einer Vielzahl von Ausstattungen, wie beispielsweise einer Bildabtasteinrichtung bzw. einem Bildscanner, einer Druckeinrichtungssteuereinrichtung, einer Druckeinrichtung, usw., sondern auch auf eine Einrichtung bestehend aus einer einzelnen Ausstattung, wie beispielsweise eine Farbkopiereinrichtung. Auch ist die vorliegende Erfindung nicht auf die Hardware in der Bildverarbeitungseinrichtung wie in den vorstehenden Ausführungsbeispielen beschränkt, sondern ist auch auf einen Fall anwendbar, in dem die vorliegende Erfindung durch die Zufuhr eines in einem geeigneten Träger, wie beispielsweise einer Magnetplatte gespeicherten Programm zu einem System oder einer Einrichtung erreicht wird.
- Die vorliegende Erfindung wurde durch bevorzugte Ausführungsbeispiele erklärt, aber die vorliegende Erfindung ist nicht auf derartige Ausführungsbeispiele beschränkt und zahlreichen Modifikationen innerhalb des Schutzumfangs der anhängenden Ansprüche unterworfen.
Claims (9)
1. Bildverarbeitungsverfahren mit den Schritten:
Berechnen eines Histogramms der Frequenz des Auftretens
jedes einer Vielzahl von verschiedenen Pegeln einen
Mehrfachpegelbilds
gekennzeichnet durch die Schritte:
Bestimmen eines Bereichs des Histogramms durch Berechnen
des Mittelwerts der Frequenzen eines Anfangsbereichs des
Histogramms und der Abweichung der Frequenzen in diesem
Anfangsbereich, und iterativ Verkleinern des Bereichs unter
Verwendung berechneter Mittelwerte von Frequenzen und einer
Abweichung bei jeder Iteration, bis die Abweichung der
Frequenzen in einem Bereich innerhalb eines vorbestimmten
Bereichs ist, und
Setzen eines Binarisierungsschwellenwerts auf der Grundlage
des Mittelwerts der Frequenzen in dem Endbereich der
Iteration.
2. Verfahren nach Anspruch 1, wobei bei jeder Iteration die
Abweichung aus der Differenz zwischen dem Pegel jedes
Bildelements in dem Bereich und dem Mittelwert der
Frequenzen der verschiedenen Pegel in dem Bereich berechnet
wird.
3. Verfahren nach Anspruch 1, wobei die Abweichung aus einer
ungerade nummerierten Potenz der Differenz zwischen dem
Pegel jedes Bildelements und dem Mittelwert der Frequenzen
der verschiedenen Pegel in dem Bereich berechnet wird.
4. Verfahren nach einem der vorhergehenden Ansprüche, wobei,
wenn eine berechnete Abweichung außerhalb des vorbestimmten
Bereichs und positiv ist, der nächste Bereich des
Histogramms von einem Startpunkt am Mittelwert der
Frequenzen, von dem die Abweichung berechnet wurde, zu
einem Endpunkt am Maximalwert des Bereichs ausgewählt wird,
und, wenn die berechnete Abweichung außerhalb des
vorbestimmten Bereichs und negativ ist, der nächste Bereich
von einem Startpunkt am Minimalwert des Bereichs der
Frequenzen in dem Bereich zu einem Endpunkt am Mittelwert
der Frequenzen ausgewählt wird.
5. Verfahren nach einem der vorhergehenden Ansprüche,
weiterhin mit dem Schritt:
Binarisieren des Mehrfachpegelbilds mit dem
Binarisierungsschwellenwert.
6. Bildverarbeitungseinrichtung mit:
einer Berechungseinrichtung (6) zur Berechnung eines
Histogramms der Frequenz eines Auftretens jedes einer
Vielzahl von verschiedenen Pegeln eines Mehrfachpegelbilds,
weiterhin gekennzeichnet durch:
eine Bestimmungseinrichtung zur Bestimmung eines Bereichs
des Histogramms durch Berechnung des Mittelwerts eines
Anfangbereichs und der Abweichung der Frequenzen in diesem
Anfangsbereich und zur iterativen Verkleinerung des
Bereichs unter Verwendung berechneter Mittelwerte von
Frequenzen und einer Abweichung bei jeder Iteration, bis
die Abweichung der Frequenzen in einem Bereich innerhalb
eines vorbestimmten Bereichs ist, und
einer Schwellenwerteinstelleinrichtung (7) zur Einstellung
eines Binarisierungsschwellenwerts auf der Grundlage des
Mittelwerts der Frequenzen in dem Endbereich der Iteration.
7. Vorrichtung nach Anspruch 6, wobei
die Bestimmungseinrichtung (7), wenn die berechnete
Abweichung außerhalb eines vorbestimmten Bereichs und
positiv ist, einen neuen Bereich des Histogramms von einem
Startpunkt am Mittelwert der Frequenzen des Bereichs zu
einem Endpunkt am Maximalwert des Bereichs, und, wenn die
Abweichung außerhalb des vorbestimmten Bereichs und negativ
ist, den neuen Bereich von einem Startpunkt am Minimum der
Frequenzen in dem Bereich zu einem Endpunkt am Mittelwert
der Frequenzen in dem Bereich auswählt.
8. Vorrichtung nach Anspruch 6 oder 7, weiterhin
gekennzeichnet durch:
eine Eingabeeinrichtung (4) zur Eingabe von
Mehrfachpegelbilddaten und
einer Binarisierungseinrichtung (8) zur Binarisierung des
Mehrfachpegelbilds mit dem Binarisierungsschwellenwert.
9. Vorrichtung nach Anspruch 8, weiterhin gekennzeichnet
durch:
eine Einrichtung zur Auftrennung der binarisierten
Bilddaten in Bereiche.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02290095A JP3733155B2 (ja) | 1995-02-10 | 1995-02-10 | 画像処理装置及びその方法 |
JP07022895A JP3106080B2 (ja) | 1995-02-10 | 1995-02-10 | 画像処理装置及びその方法 |
JP02289995A JP3733154B2 (ja) | 1995-02-10 | 1995-02-10 | 画像処理装置及びその方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69618262D1 DE69618262D1 (de) | 2002-02-07 |
DE69618262T2 true DE69618262T2 (de) | 2002-08-08 |
Family
ID=27284010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69618262T Expired - Lifetime DE69618262T2 (de) | 1995-02-10 | 1996-02-09 | Bilderverarbeitungsgerät und -verfahren |
Country Status (3)
Country | Link |
---|---|
US (1) | US5920655A (de) |
EP (1) | EP0731599B1 (de) |
DE (1) | DE69618262T2 (de) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6269186B1 (en) * | 1996-12-20 | 2001-07-31 | Canon Kabushiki Kaisha | Image processing apparatus and method |
JP3472094B2 (ja) * | 1997-08-21 | 2003-12-02 | シャープ株式会社 | 領域判定装置 |
JP2000036033A (ja) * | 1998-07-21 | 2000-02-02 | Toshiba Eng Co Ltd | 明暗検査装置および明暗検査方法 |
JP4018310B2 (ja) * | 1999-04-21 | 2007-12-05 | 株式会社リコー | 画像二値化装置、画像撮像装置、画像二値化方法、画像撮像方法およびその方法の各工程としてコンピュータを機能させるためのプログラムを記録したコンピュータ読取可能な記録媒体 |
US6738496B1 (en) * | 1999-11-01 | 2004-05-18 | Lockheed Martin Corporation | Real time binarization of gray images |
FR2802921B1 (fr) * | 1999-12-24 | 2002-08-23 | Inst Francais Du Petrole | Production d'isobutene de haute purete et de propylene a partir de coupes d'hydrocarbures a quatre atomes de carbone |
JP3717357B2 (ja) * | 2000-01-07 | 2005-11-16 | 理想科学工業株式会社 | 2値化閾値算出方法および装置 |
JP4189506B2 (ja) * | 2000-06-09 | 2008-12-03 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理のための装置、方法及び記録媒体 |
EP1173003B1 (de) * | 2000-07-12 | 2009-03-25 | Canon Kabushiki Kaisha | Bildverarbeitungsverfahren und Bildverarbeitungsvorrichtung |
JP4366011B2 (ja) * | 2000-12-21 | 2009-11-18 | キヤノン株式会社 | 文書処理装置及び方法 |
US6909803B2 (en) * | 2000-12-22 | 2005-06-21 | Canon Kabushiki Kaisha | Text color detection for copier image processing |
JP4596219B2 (ja) * | 2001-06-25 | 2010-12-08 | ソニー株式会社 | 画像処理装置および方法、記録媒体、並びにプログラム |
JP4008428B2 (ja) * | 2004-04-26 | 2007-11-14 | 富士通株式会社 | 画像圧縮方法 |
US7715656B2 (en) * | 2004-09-28 | 2010-05-11 | Qualcomm Incorporated | Magnification and pinching of two-dimensional images |
JP4646797B2 (ja) * | 2005-02-01 | 2011-03-09 | キヤノン株式会社 | 画像処理装置及びその制御方法、プログラム |
US7734092B2 (en) * | 2006-03-07 | 2010-06-08 | Ancestry.Com Operations Inc. | Multiple image input for optical character recognition processing systems and methods |
US8189917B2 (en) * | 2008-09-25 | 2012-05-29 | Sharp Laboratories Of America, Inc. | Methods and systems for locating text in a digital image |
JP5208043B2 (ja) * | 2009-04-16 | 2013-06-12 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
US8611662B2 (en) | 2011-11-21 | 2013-12-17 | Nokia Corporation | Text detection using multi-layer connected components with histograms |
JP6303332B2 (ja) * | 2013-08-28 | 2018-04-04 | 富士通株式会社 | 画像処理装置、画像処理方法および画像処理プログラム |
JP5992567B1 (ja) * | 2015-03-20 | 2016-09-14 | 株式会社Pfu | 日付識別装置 |
JPWO2017009910A1 (ja) | 2015-07-10 | 2017-07-13 | 楽天株式会社 | 電子書籍表示装置、電子書籍表示方法、及びプログラム |
US9563961B1 (en) | 2016-01-19 | 2017-02-07 | Xerox Corporation | Method and system for image processing |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6066575A (ja) * | 1983-09-22 | 1985-04-16 | Canon Inc | 画像処理装置 |
US4701807A (en) * | 1983-09-22 | 1987-10-20 | Canon Kabushiki Kaisha | Method and apparatus for processing an image |
JPS63211974A (ja) * | 1987-02-27 | 1988-09-05 | Toshiba Corp | 画像処理装置 |
US5091963A (en) * | 1988-05-02 | 1992-02-25 | The Standard Oil Company | Method and apparatus for inspecting surfaces for contrast variations |
JP2744619B2 (ja) * | 1988-06-28 | 1998-04-28 | 富士通株式会社 | 画像処理装置 |
US5097520A (en) * | 1989-01-20 | 1992-03-17 | Ricoh Company, Ltd. | Method of obtaining optimum threshold values |
US4918543A (en) * | 1989-01-24 | 1990-04-17 | Eastman Kodak Company | Apparatus for thresholding an image signal |
JPH03131173A (ja) * | 1989-10-17 | 1991-06-04 | Canon Inc | 画像処理方式 |
JP2712863B2 (ja) * | 1991-03-12 | 1998-02-16 | 国際電信電話株式会社 | 疑似階調画像の階層的符号化方式 |
JPH04306970A (ja) * | 1991-04-04 | 1992-10-29 | Canon Inc | 画像処理方法及び装置 |
JP3313447B2 (ja) * | 1993-03-19 | 2002-08-12 | 株式会社リコー | 画像処理装置 |
-
1996
- 1996-02-07 US US08/597,871 patent/US5920655A/en not_active Expired - Lifetime
- 1996-02-09 DE DE69618262T patent/DE69618262T2/de not_active Expired - Lifetime
- 1996-02-09 EP EP96300909A patent/EP0731599B1/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0731599A2 (de) | 1996-09-11 |
EP0731599A3 (de) | 1997-09-17 |
DE69618262D1 (de) | 2002-02-07 |
US5920655A (en) | 1999-07-06 |
EP0731599B1 (de) | 2002-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69618262T2 (de) | Bilderverarbeitungsgerät und -verfahren | |
DE4103229C2 (de) | ||
DE69604481T2 (de) | Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern | |
DE69226846T2 (de) | Verfahren zur Bestimmung von Wortgrenzen im Text | |
DE3446880C2 (de) | ||
DE68921813T2 (de) | Verfahren und Vorrichtung zur Setzung von Farbtrennregeln. | |
DE69422446T2 (de) | Mustererkennung | |
DE3881392T2 (de) | System und Verfahren für automatische Segmentierung. | |
DE69734855T2 (de) | Vorrichtung und Verfahren zur Extraktion eines Objektes in einem Bild | |
DE68923349T2 (de) | Bildreduzierungsvorrichtung. | |
DE3225415C2 (de) | ||
DE69333694T2 (de) | Verfahren und Anordnung zur Bildverarbeitung | |
DE3224319C2 (de) | Verfahren und Einrichtung zum Bestimmen der Art der Schwärzungsgradpegelverteilung einer Bildfläche | |
DE4311172C2 (de) | Verfahren und Einrichtung zum Identifizieren eines Schrägenwinkels eines Vorlagenbildes | |
DE4001613C2 (de) | Binärumsetzungsverfahren | |
DE69715076T2 (de) | Vorrichtung zur Erzeugung eines Binärbildes | |
DE69216190T2 (de) | Verfahren und Vorrichtung zum Umsetzen von Bildsignalen die ein Bild mit Gradation darstellen | |
DE3856034T2 (de) | Bildverarbeitungsgerät | |
DE60132315T2 (de) | Verbessertes verfahren zur bildbinarisierung | |
DE69624758T2 (de) | Bildsegmentierungssystem und -verfahren | |
DE69225365T2 (de) | Bildsignalkodierungsvorrichtung | |
DE4117038C2 (de) | Zeilenbereich-Segmentierungsverfahren | |
DE2757456A1 (de) | Korrelator fuer videoverarbeitung | |
DE3503508A1 (de) | Verfahren und vorrichtung zum erzeugen eines signals erhoehter bildschaerfe | |
DE69423607T2 (de) | Verfahren zum klassifizieren von bildern mit ausgabeabbildungen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition |