-
HINTERGRUND DER ERFINDUNG
-
Gebiet der Erfindung
-
Die Erfindung betrifft einen Detektor
für eine Dokumentenschieflage
nach dem Oberbegriff des Anspruchs 1. Ein solcher Detektor erfaßt die Schieflage
eines in einen digitalen Bildprozessor eingegebenen Bilds, beispielsweise
eines Bilds, welches in einen optischen Zeichenleser (OCR) eingegeben wird,
der ein Dokumentenbild als Seiteneinheit verarbeitet. Der Begriff „Dokumentenbild" bedeutet Dokumenten-Daten
in Form eines elektronischen Bilds, welches man erhält, indem
man die als Druckprodukt vorliegende Vorlage mit Hilfe eines Bildscanners oder
dergleichen ausliest.
-
Beschreibung
des einschlägigen
Standes der Technik
-
Bei der Verarbeitung eines Dokumentenbilds unter
Verwendung eines OCR gibt es beispielsweise Fälle, an denen ein eingegebenes
Bild schief liegt, beispielsweise aufgrund der Schieflage der Vorlage in
Bezug auf einen Bildscanner, der das Dokumentenbild liest. Um in
exakter Weise eine Zeichenerkennung und dergleichen auch für ein schief
liegendes Dokumentenbild vornehmen zu können, muß die Neigung oder Schieflage
des eingegebenen Bilds korrigiert werden, oder man muß die Schieflage
bei den späteren
Verarbeitungsvorgängen
berücksichtigen.
Aus diesem Grund wird die Schieflage eines Dokumentenbilds festgestellt.
-
Als Verfahren zum Nachweisen der
Schieflage eines Dokumentenbilds wurden vorgeschlagen: (a) ein Verfahren,
welches das Dokumentenbild um jeweils einen sehr kleinen Winkel
dreht, um eine Randverteilung zu erhalten, wobei der Drehwinkel
als Schieflage des Manuskripts angesehen wird, wenn die Verteilung
am ausgeprägtesten
ist (Research Report for Institute of Electronics and Conmunication Engineers
of Japan (IECE), PRL 80–70,
Seiten 9–16);
(2) ein Verfahren, welches eine räumliche Verteilung von Zeichen
oder Zeichenketten einer Vorlage mit Hilfe einer zweidimensionalen
Fouriertransformation berechnet und den Schieflagenwinkel abschätzt anhand
der räumlichen
Verteilung (Thesis Journal for IECE, 1984/11, Band 670, Nr. 9, Seiten 1044–1051);
(3) ein Verfahren, welches ein Dokumentenbild in mehrere parallele
Streifenflächen
etwa rechtwinklig zur Zeilenrichtung unterteilt, eine Teil-Randverteilung
für einen
solchen Streifenflächenbereich
berechnet und den Schieflagenwinkel aus der Phasenverschiebung unter
den Spitzenpunkten der Randverteilungen für benachbarte Streifenflächenbereiche
erkennt (Thesis Journal for IECE, 1983/1, Band J66-D, Nr. 1, Seiten
111–118);
und weitere Verfahren.
-
Bekannt sind außerdem: eine Methode, die die
Summe der Absolutwerte von Differenzen zwischen kumulierten Dichtewerten
an benachbarten Abtastzeilen in einer Randverteilung berechnet,
wobei die Randverteilung durch den Abtastvorgang in der Richtung
etwa rechtwinklig zur Zeilenrichtung der Vorlage gewonnen wird,
und wobei die Schräglage derart
berechnet wird, daß die
Summe einen Maximumwert erreicht (japanische Patentveröffentlichungen
62 (1987)-52337 und 63 (1988)-25391); eine Methode, die ein Dokumentenbild
in Streifenflächen
mit zwei oder mehr Breiten aufteilt, auf die Streifenflächen projizierte
Bilder ermittelt und den Neigungswinkel ermittelt anhand einer Differenz
zwischen den Breiten der Streifenflächen und einer Schwankung zwischen
den projizierten Bildern (japanische ungeprüfte Patentveröffentlichung
63 (1988)-292382); eine Methode, die ein Zeichen durch die umschreibende
rechteckige oder Randverteilung in eine graphische Darstellung bringt
und die Neigung des graphisch dargestellten Zeichenfeldes erkennt
anhand der Relation der Feldstellung benachbart zu der Fläche des
graphisch dargestellten Zeichens (japanische ungeprüfte Patentveröffentlichung
2 (1990)-44486); eine Methode, die Randverteilungen aus mehreren
Teilen einer Zeichenkette extrahiert, die Lage der Zeichenkette
aus jeder Randverteilung abschätzt
und die Schieflage der gesamten Zeichenkette abschätzt (japanische
ungeprüfte
Patentveröffentlichung
3 (1991)-212780),
und ähnliches.
-
Bei den oben angesprochenen Verfahren sind
allerdings komplizierte und zeitraubende Prozesse erforderlich,
so zum Beispiel der Bild-Drehvorgang und die zweidimensionale Fouriertransformation.
Außerdem
ist der Prozeß zum
Berechnen einer großen
Anzahl von Randverteilungen und deren Vergleich erforderlich, und
bei einer Vereinfachung dieses Vorgangs gibt es das Problem, daß sich die
Genauigkeit der Schieflagenerkennung verringert.
-
Wenn außerdem die Zeilenrichtung einer Vorlage,
das heißt
bei vertikalem oder horizontalem Schreiben, vorab bekannt ist, so
sind einige Nachweisprinzipien anwendbar, allerdings wird bei einer Vorlage,
deren Zeilenrichtung für
die Zeichenkette unbekannt ist, sowie einer Vorlage, die sowohl
vertikale als auch horizontal verlaufende Schritte enthält, die
Phasenverschiebung zwischen den Teil-Randverteilungen ungewiß, und bei
einigen Nachweisverfahren ist das Erkennen der Schiefe schwierig.
Darüber hinaus
sind einige der Verfahren deshalb nicht anwendbar, weil die Besonderheiten
der Randverteilung unterschiedlich ist zwischen einem japanischen Dokument
und einem Dokument mit alphabetischer Schrift, während andere Verfahren zu Fehlern
beim Nachweis der Schiefe führen.
-
Nach dem Oberbegriff des Anspruchs
1 zeigt die JP-61 160 180 einen Detektor für eine Dokumentenschieflage,
der allerdings keine Randverteilungs-Korrektureinrichtung enthält und auch
nicht über
eine Schiefendetektoreinrichtung verfügt.
-
Die US-4 251 799 zeigt ein optisches
Zeichenerkennungssystem, welches von Grundlinieninformation Gebrauch
macht. Zu diesem Zweck wird die Grundlinie jeder Zeile der Vorlage
extrahiert, wobei der durch unter die Grundlinie ragenden Teile
der Zeichen verursachte Fehler minimiert wird. Der Durchschnitt
der Basislinie wird aufgrund eines Teillinien-Histogramms ermittelt,
und hierdurch wird eine Schieflageninformation für die Grundlinie erhalten.
-
Die US-5 781 660 zeigt ein Bildverarbeitungssystem
mit einer Randverteilungs-Korrektureinrichtung,
betrieben zur Ausführung
eines Schwellenwertnachweises bezüglich eines Endbereichs jedes Histogramms
der Randverteilung, die in dieselbe Richtung wie die Zeilenrichtung
projiziert wird. Wenn das Ausmaß des
Endbereichs kleiner als ein Schwellenwert ist, wird ein solcher
Endbereich entfernt.
-
Um das obige Ziel erfindungsgemäß zu erreichen,
wird ein Detektor für
eine Dokumentenschieflage nach Anspruch 1 geschaffen, der zwei alternative Lösungen bietet.
-
Daher kann der Nachweis einer Schieflage oder
Neigung unabhängig
davon geführt
werden, ob eine Vorlage vertikal oder horizontal beschriftet ist. Durch
Korrigieren lediglich der Histogramme der Randverteilung, die in
der Richtung projiziert ist, die für die Schieflagenerfassung
und den Nachweis der Schieflage erforderlich ist, läßt sich
der Vorgang vereinfachen. Da außerdem
jedes Histogramm der Randverteilung korrigiert wird, beispielsweise
im Hinblick auf die Besonderheiten einer alphabetischen Zeichenkette,
kann die Schieflage eines alphabetischen Vorlagenbilds ebenso wie
eines japanischen Dokumentenbilds mit einem hohen Maß an Genauigkeit
erkannt werden, wobei die Beurteilung der Zeilenrichtung und das
Erkennen der Schieflage grundsätzlich
synthetisch mit hoher Geschwindigkeit bei hoher Genauigkeit erfolgen
kann.
-
Insbesondere die Komplexität der Schieflagenerkennung
eines Dokumentenbilds wurde dadurch verbessert, daß ein einfaches
Nachweisverfahren eingesetzt wurde, welches die Teil-Randverteilungen
für die
Zeichenketten des Dokumentenbilds extrahiert und die Schieflage
des Dokumentenbilds anhand der Phasenverschiebung zwischen einander benachbarten,
korrigierten Histogrammen erfaßt wird.
Falls Information über
die Zeilenrichtung einer Vorlage nicht vorgegeben ist, oder falls
eine Vorlage sowohl vertikale als auch horizontale Schrift enthält, erfolgt
ein Erkennen der Zeilenrichtung, bevor die Schieflage ermittelt
wird, und es werden ausschließlich
die Randverteilungsdaten in der ermittelten Zeilenrichtung verwendet.
Auf diese Weise läßt sich
eine weitere Vereinfachung der Schieflagenerkennung bewerkstelligen.
-
Erfindungsgemäß vergleicht die Zeilenrichtungs-Detektoreinrichtung
die Anzahl von Histogrammen zwischen periodischen Leerstellen in
der horizontalen Randverteilung mit der Anzahl von Histogrammen
zwischen periodischen Leerstellen in der vertikalen Randverteilung
und beurteilt, daß die
Projektionsrichtung der Randverteilung, in welcher die Anzahl von
Histogrammen zwischen periodischen Leerstellen größer ist,
die Zeilenrichtung ist. Außerdem
kann die Zeilenrichtungs-Detektoreinrichtung die Anzahl periodischer
Leerstellen in der horizontalen Randverteilung mit der Anzahl periodischer
Leerstellen in der vertikalen Randverteilung vergleichen und beurteilen,
daß die
Projektionsrichtung der Randverteilung, in der die Anzahl periodischer
Leerstellen größer ist,
die Zeilenrichtung ist. Eine Beurteilung der Zeilenrichtung, die
sich für
das Erkennen der Schieflage eignet, kann bezüglich eines Originals vorgenommen
werden, welches sowohl vertikale als auch horizontale Schrift enthält.
-
Bei einer weiteren bevorzugten Ausführungsform
der Erfindung detektiert die Schiefendetektoreinrichtung die Neigung
des Dokumentenbilds anhand der Neigung einer gestreckten Linie,
die die Mittelpunkte von mehreren korrigierten Histogrammen verbindet,
die zu derselben Zeichenkette gehören. Daher läßt sich
die Schieflagenerkennung exakt bei hohen Geschwindigkeiten vornehmen.
Außerdem
kann die Schiefendetektoreinrichtung die Schieflage des Dokumentenbilds
anhand der Neigung einer gestreckten Linie ermitteln, welche die Mittelpunkte
solcher korrigierter Histogramme verbindet, die zu mehreren Zeichenketten
gehören.
In diesem Fall wird die Schieflage basierend auf möglichst zahlreichen
korrigierten Histogrammen über
eine Mehrzahl von Zeichenketten hinweg detektiert. Im Ergebnis sind
genauere Ergebnisse erzielbar.
-
In einer noch weiteren bevorzugten
Form der Erfindung führt
die Randverteilungs-Korrektureinrichtung
eine Schwellenwertdetektierung (einen Begrenzungsprozeß) bezüglich eines
Endbereichs jedes Histogramms der Randverteilung durch, die in derselben
Richtung wie die Zeilenrichtung projiziert wurde, um auf diese Weise
den Endbereich dann zu entfernen, wenn die Höhe des Endbereichs geringer
ist als ein vorbestimmter Schwellenwert. Bezüglich eines alphabetischen
Dokuments, in welchem Buchstaben keine gleichmäßige Größe besitzen, wird also ein
hohes Maß an
Schieflagenerkennung erreicht, genauso viel wie bei einem japanischen
Dokument.
-
KURZE BESCHREIBUNG
DER ZEICHNUNGEN
-
1 ist
ein Blockdiagramm eines Systems mit einem Detektor für eine Dokumentenschieflage gemäß einer
Ausführungsform
der Erfindung,
-
2A ist
ein Diagramm, das ein Beispiel für ein
Dokumentenbild zeigt,
-
2B ist
ein Diagramm, welches horizontale Randverteilungen zeigt, die von
dem in 2A gezeigten
Dokumentenbild erhalten werden,
-
2C ist
ein Diagramm, das vertikale Randverteilungen zeigt, die von einem
Dokumentenbild nach 2A erhalten
werden,
-
3 ist
ein Diagramm zum Erläutern,
wie jedes die Randverteilung für
eine Zeichenkette bildende Histogramm gewonnen wird,
-
4A ist
ein Diagramm, das die Schieflage einer Zeichenkette darstellt, die
vor der Korrektur der Randverteilung erhalten wird,
-
4B ist
ein Diagramm, welches die Schieflage einer Zeichenkette darstellt,
welche nach dem Korrigieren der Randverteilung gewonnen wird.
-
BESCHREIBUNG
DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
-
Eine bevorzugte Ausführungsform
eines Detektors für
eine Dokumentenschieflage gemäß der Erfindung
wird im folgenden detailliert unter Bezugnahme auf die Zeichnungen
erläutert.
-
1 zeigt
den Gesamtaufbau eines Dokumentenbild-Verarbeitungssystems mit dem
Dokumentenschiefendetektor gemäß der Erfindung.
Das Dokumentenbild-Verarbeitungssystem
enthält
einen Bildscanner 1, der eine Dokumentenvorlage als digitale
Bilddaten eingibt, einen Bildspeicher 2, der die Daten
des angegebenen Dokumentenbilds speichert, den Dokumentenschiefendetektor 3,
der die Schieflage des Dokumentenbilds erkennt, und eine zentrale
Verarbeitungseinheit (CPU) 4, die das gesamte System steuert.
-
Der Dokumentenschiefendetektor 3 enthält eine
Randverteilungs-Extrahiereinrichtung 301, die eine horizontale
Randverteilung und eine vertikale Randverteilung für das Dokumentenbild
extrahiert, eine Zeilenrichtungs-Detektoreinrichtung 302,
welche die Zei lenrichtung jeder Zeichenkette des Dokumentenbilds
erkennt, eine Randverteilungs-Korrektureinrichtung 303,
die einen Schwellenwertprozeß bezüglich der
in Zeilenrichtung projizierten Randverteilung durchführt, und
eine Schiefendetektoreinrichtung 304, welche die Schiefe
oder die Neigung der Zeilenrichtung des Dokumentenbilds erkennt.
-
Die Randverteilungs-Extrahiereinrichtung 301 extrahiert
zwei Arten von Teil-Horizontal- und -Vertikal-Randverteilungen
für Zeichenketten
aus den digitalen Dokumentenbilddaten (vergleiche die unten beschriebene 2A), die in dem Bildspeicher 2 gespeichert
sind. Das heißt:
das Dokumentenbild wird in eine Mehrzahl kleiner Streifenflächen unterteilt,
was mit Hilfe vertikaler Trennlinien geschieht, und jedes Streifenfläche wird
in horizontaler Richtung projiziert, wodurch eine horizontale Randverteilung extrahiert
wird (vergleiche 2B).
In ähnlicher
Weise wird das Dokumentenbild durch horizontale Trennlinien in eine
Mehrzahl kleiner Streifenflächen aufgeteilt,
und jede Streifenfläche
wird in vertikaler Richtung projiziert, wodurch eine vertikale Randverteilung
extrahiert wird (vergleiche 2C).
Die extrahierten vertikalen und horizontalen Randverteilungen werden
an die Zeilenrichtungs-Detektoreinrichtung 302 gegeben,
welche die Zeilenrichtung der Zeichenkette erkennt.
-
Die Zeilenrichtungs-Detektoreinrichtung 302 vergleicht
die vertikalen und horizontalen Randverteilungen, um dadurch die
Zeilenrichtung der Zeichenkette des eingegebenen Dokumentenbilds
abzuschätzen,
das heißt
abzuschätzen,
ob die Zeichenkette in vertikaler oder horizontaler Schreibrichtung verläuft. Insbesondere
wird die Anzahl von (unten noch zu beschreibenden) Histogrammen
zwischen periodischen Leerräumen
in der vertikalen Randverteilung (oder die Anzahl periodischer Leerräume in der
vertikalen Randverteilung) verglichen mit der Anzahl von Histogrammen
zwischen periodischen Leerräumen
in der horizontalen Randverteilung (oder der Anzahl von periodischen
Leerräumen
in der horizontalen Randverteilung), und die Projektionsrichtung der
Randverteilung, in der die Anzahl von Histogrammen zwischen periodischen
Leerräumen
(oder die Anzahl periodischer Leerräume) größer ist, wird als die Zeilenrichtung
eingeschätzt.
Das Ergebnis wird an die Randverteilungs-Korrektureinrichtung 303 geliefert.
-
Die Randverteilungs-Korrektureinrichtung 303 führt einen
Randverteilungs-Korrekturprozeß bezüglich der
vertikalen oder horizontalen Randverteilung durch, die in dieselbe
Richtung wie die von der Zeilenrichtungs-Detektoreinrichtung 302 abgeschätzte Zeilenrichtung
projiziert ist. Mit Hilfe des Randverteilungs-Korrekturprozesses
wird ein Endbereich jedes Histogramms der Randverteilung entfernt,
wenn ein Wert oder Pegel des Endbereichs kleiner als ein vorbestimmter
Schwellenwert ist. Das Ergebnis wird an die Schiefendetektoreinrichtung 304 gegeben.
-
Die Schiefendetektoreinrichtung 304 ermittelt
die Schieflage jeder Zeichenkette aus der Phasenverschiebung zwischen
den einander benachbarten, korrigierten Histogrammen der Randverteilung. Insbesondere
werden die Mittelpunkte einer Mehrzahl korrigierter Histogramme
für dieselbe
Zeichenkette verknüpft
und durch ein Verfahren des kleinsten Quadrats zu einer Zeile gebildet,
und die Schieflage der Zeile wird für jede der mehreren Zeichenketten berechnet.
Der durchschnittliche Wert der Schiefen oder Neigungen der mehreren
Zeichenketten wird als die Schieflage des eingegebenen Dokumentenbilds erkannt.
Die erkannte Schieflage des Dokumentenbilds wird an die CPU 4 gesendet
und bei den nachfolgenden Prozessen eingesetzt.
-
Im folgenden wird jeder Vorgang im
einzelnen für
das horizontal beschriebene Dokumentenbild nach den 2 bis 4 als
Beispiel beschrieben. 2A zeigt
ein horizontal beschriebenes alphabetisches Dokumentenbild 10,
welches eine Schieflage aufweist (Eingabebilddaten). Die Randverteilungs-Extrahiereinrichtung 301 teilt
dieses Dokumentenbild 10 in mehrere parallele Streifenflächen in
vertikaler und horizontaler Richtung auf und extrahiert horizontale
und vertikale Teilrandverteilungen für die Zeichenketten in jeder
Streifenfläche.
Insbesondere wird das Dokumentenbild 10 in vertikaler Richtung von
vertikalen Trennlinien 11 in acht parallele Streifenflächen aufgeteilt.
Jede vertikale Streifenfläche wird
in horizontaler Richtung projiziert, wodurch eine horizontale Randverteilung 21 gemäß 2B extrahiert wird. Das
Dokumentenbild 10 wird außerdem in horizontaler Richtung
durch horizontale Trennlinien 12 in elf parallele Streifenflächen unterteilt.
Jede horizontale Streifenfläche
wird in vertikaler Richtung projiziert, wodurch eine vertikale Randverteilung 22 gemäß 2C extrahiert wird.
-
Die Randverteilungen 21 und 22 für die Zeichenketten
werden jeweils durch mehrere Histogramme gebildet. Das heißt, die
Randverteilungen werden gemäß 3 gebildet durch Scannen
oder Abtasten der kleinen Fläche,
die durch die vertikalen Trennlinien 11 eingeschlossen
ist, so daß die
Fläche in
horizontaler Richtung rechtwinklig zu der vertikalen Trennlinie 11 projiziert
wird, wobei die Anzahl schwarzer Pixel, die auf jeder horizontalen
Abtastzeile erscheinen, wenn das Dokumentenbild 10 (die
Zeichenkette) innerhalb der kleinen Fläche mit vorbestimmten Schrittweisen
abgetastet wird (die Anzahl von Abtastoperationen, welche einen
Zeichenbereich abtasten), wird als ein Histogramm ausgedrückt. Man beachte,
daß die
Anzahl schwarzer Pixel in einem abgetasteten Zeichenbereich gezählt werden
kann.
-
Die Zeilenrichtungs-Detektoreinrichtung 302 vergleicht
die horizontale Randverteilung 21 nach 2B mit der vertikalen Umfangsverteilung 22 nach 2C und erkennt die Zeilenrichtung
der Zeichenkette des Dokumentenbilds 10. Bei diesem Beispiel handelt
es sich um ein horizontal beschriebenes Dokument. Da die horizontale
Randverteilung 21 durch Abtasten (oder Projizieren) von
Zeichenketten in der Richtung im wesentlichen parallel zur Zeilenrichtung erhalten
wird, befindet sich in dieser horizontalen Randverteilung 21 eine
Leerstelle oder ein Leerraum äquivalent
zu einem Zwischenraum zwischen den Zeilen in klarer und periodischer
Darstellungsweise zwischen den Histogramm-Anhäufungen,
die jeder Zeile entsprechen. Da andererseits die vertikale Randverteilung 22 durch
Abtasten (oder Projizieren) von Zeichenketten in der Richtung etwa
rechtwinklig zur Zeilenrichtung erhalten wird, gibt es in dieser
vertikalen Randverteilung 22 keine periodischen Leerstellen,
wie sie oben angesprochen wurden, und es kommt zu horizontal langgestreckten
Histogrammen.
-
Wie oben beschrieben, erscheinen
beträchtliche
charakteristische Merkmale entsprechend der Zeilenrichtung des Dokumentenbilds 10 sowohl
in der horizontalen Randverteilung 21 als auch in der vertikalen
Randverteilung 22. Daher werden diese besonderen Merkmale
zum Nachweis oder zum Erkennen der Zeilenrichtung ausgenutzt. Insbesondere wird
in der horizontalen Randverteilung 21 und der vertikalen
Randverteilung 22 die Anzahl periodischer Histogramm-Anhäufungen
gezählt,
die in regelmäßigen oder
mehr Intervallen existieren (oder es wird die Anzahl periodischer
Leerstellen oder Leerräume gezählt). Die
Anhäufungs-
oder Leerraum-Zählung
in der horizontalen Randverteilung 21 wird mit dem entsprechenden
Wert für
die vertikale Randverteilung 22 verglichen, und es wird
diejenige Richtung als Zeilenrichtung der Zeichenkette erkannt,
bei der es sich um die Projektionsrichtung (oder Abtastrichtung)
der Randverteilung 21 oder 22 handelt, in der
die Anhäufungs-
oder Leerraumzählung
größer ist.
Im Fall der 2A beträgt der vorgenannte
Zählwert
für die
horizontale Randverteilung 21 (2B) 150 oder mehr, sie beträgt für die vertikale
Randverteilung 22 (2C)
20 oder weniger. Weil die Zählung
für die horizontale
Randverteilung 21, projiziert und gewonnen in horizontaler
Richtung, größer ist,
entspricht die Zeilenrichtung der Zeichenketten des Dokumentenbilds 10 der
horizontalen Richtung. Damit sendet die Zeilenrichtungs-Detektoreinrichtung 302 nur
die Daten der horizontalen Randverteilung 21 aus 2B, die in horizontaler
Richtung projiziert und gewonnen wurden, zu der Randverteilungs-Verarbeitungseinrichtung 303.
-
Man beachte, daß bei einem Original, auf dem
das Dokumentenbild 10 Zeichenketten sowohl in vertikaler
als auch in horizontaler Richtung enthält, es mehr Zeichenketten in
der Zeilenrichtung gibt, die der Projektionsrichtung der Randverteilung
entspricht, in der der vorgenannte Zählwert größer ist, so daß dadurch,
daß man
nur die Randverteilungsdaten in dieser Richtung an die Randverteilungs-Verarbeitungsrichtung 303 sendet,
eine hohe Genauigkeit der Schieflagenerkennung möglich ist, die im folgenden erläutert wird.
-
4 zeigt
den Vorgang in der Randverteilungs-Korrektureinrichtung 303 wird
der Schiefendetektoreinrichtung 304. Wie bereits beschrieben,
detektiert die Schiefendetektoreinrichtung 304 im wesentlichen
die Neigung einer geraden Linie, welche die Mittelpunkte der vertikalen
Breiten (der vertikalen Längen
in 4 der die Randverteilung 21 bildenden Histogramme
verbindet, jedoch gibt es im Fall eines alphabetischen Dokuments
Fälle,
in denen die Schieflage nicht mit der tatsächlichen Schieflage übereinstimmt.
Diese Fehlanpassung wird korrigiert durch die Randverteilungs-Korrektureinrichtung 303.
-
Zu dem genannten Zweck führt die
Randverteilungs-Korrektureinrichtung 303 den Randverteilungs-Korrekturprozeß bezüglich der
Randverteilung 21 aus, die von der Zeilenrichtungs-Detektoreinrichtung 302 kommt. 4A zeigt einen Teil einer
alphabetischen Zeichenkette und ein Beispiel für die Randverteilung 21 dieses
Abschnitts. Im Fall einer alphabetischen Zeichenkette mit aufeinanderfolgenden Kleinbuchstaben
ragt die Oberlänge
des Buchstabens „d" sowie die Unterlänge des
Buchstabens „g" gegenüber dem
Grundbereich (welcher durch gestrichelte Linien dargestellt ist)
der Zeichenkette vor, und deshalb haben die die alphabetische Zeichenkette bildenden
Buchstaben keine gleichmäßige Größe. Wenn
daher die Randverteilung 21 unverändert verarbeitet wird, paßt der Schieflagenwinkel
der geraden Linie L0, die die Mittelpunkte S der Histogramme der
Randverteilung 21 miteinander verbindet, nicht überein mit
der Neigung der tatsächlichen
Zeichenkette, so daß es
zu einem Fehler kommt. Aus diesem Grund führt die Randverteilungs-Korrektureinrichtung 303 den
Schwellenwertprozeß bezüglich eines Endbereichs
jedes Histogramms der Randverteilung 21 aus, um dadurch
den Endbereich dann zu beseitigen, wenn der Wert in dem Endbereich
kleiner als ein vorbestimmter Schwellenwert ist. Wie in 4B gezeigt ist, beseitigen
die korrigierten Histogramme 21a den Einfluß der herausragenden
Bereiche einer alphabetischen Zeichenkette, wie sie oben erläutert wurden,
und sie entsprechen dem Grundbereich (der durch gestrichelte Linien
angegeben ist) der Zeichenkette. Die Schieflage oder Neigung der
geraden Linie L1, die Mittelpunkte S der korrigierten Histogramme 21a verbindet,
paßt zu
der Schieflage der Zeichenkette mit einem höheren Maß an Genauigkeit. Die durch
die korrigierten Histogramme 21a gebildete Randverteilung 21 wird
an die Schiefendetektoreinrichtung 304 gegeben.
-
Die Schiefendetektoreinrichtung 304 detektiert
die zentralen oder Mittelstellen S, S ..., und S der benachbarten
Histogramme 21a der Randverteilung 21, die als
zu einer einzelnen Zeichenkette gehörig beurteilt wird, und sie
berechnet die gerade Linie L1, die diese Mittelpunkte S so weit
wie möglich
verbindet, wozu die Methode des kleinsten Quadrats verwendet wird.
Die Neigung dieser geraden Linie L1 wird als Schieflage für die Zeichenkette
hergenommen. Die Schieflage einer solchen Geraden wird für sämtliche
Zeichenketten des Dokumentenbildes 10 berechnet, und der
Durchschnittswert der berechneten Schiefen sämtlicher Zeichenketten wird
erkannt oder festgelegt als die Schieflage des Dokumentenbilds 10.
-
Man beachte, daß selbst dann, wenn der oben
erläuterte
Prozeß des
Korrigierens der Randverteilung bei einem japanischen Dokumentenbild vorgenommen
wird, ein geringes Maß an
vorstehenden Bereichen entfernt wird und es nur geringen Einfluß auf die
Schieflagenerkennung einer geraden Linie sowohl in einem japanischen
als auch in einem al phabetischen Dokument hat, so daß eine zufriedenstellende
Schieflagenerkennung vorgenommen werden kann.