DE60006731T2 - Detektionsgerät des Neigungswinkels eines Dokumentes - Google Patents

Detektionsgerät des Neigungswinkels eines Dokumentes Download PDF

Info

Publication number
DE60006731T2
DE60006731T2 DE60006731T DE60006731T DE60006731T2 DE 60006731 T2 DE60006731 T2 DE 60006731T2 DE 60006731 T DE60006731 T DE 60006731T DE 60006731 T DE60006731 T DE 60006731T DE 60006731 T2 DE60006731 T2 DE 60006731T2
Authority
DE
Germany
Prior art keywords
distribution
edge distribution
document image
horizontal
vertical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE60006731T
Other languages
English (en)
Other versions
DE60006731D1 (de
Inventor
Shen Inashiki-gun Xueming
Nagao Inashiki-gun Kagenori
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Riso Kagaku Corp
Original Assignee
Riso Kagaku Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Riso Kagaku Corp filed Critical Riso Kagaku Corp
Application granted granted Critical
Publication of DE60006731D1 publication Critical patent/DE60006731D1/de
Publication of DE60006731T2 publication Critical patent/DE60006731T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00684Object of the detection
    • H04N1/00718Skew
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00729Detection means
    • H04N1/00734Optical detectors
    • H04N1/00737Optical detectors using the scanning elements as detectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3877Image rotation
    • H04N1/3878Skew detection or correction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Description

  • HINTERGRUND DER ERFINDUNG
  • Gebiet der Erfindung
  • Die Erfindung betrifft einen Detektor für eine Dokumentenschieflage nach dem Oberbegriff des Anspruchs 1. Ein solcher Detektor erfaßt die Schieflage eines in einen digitalen Bildprozessor eingegebenen Bilds, beispielsweise eines Bilds, welches in einen optischen Zeichenleser (OCR) eingegeben wird, der ein Dokumentenbild als Seiteneinheit verarbeitet. Der Begriff „Dokumentenbild" bedeutet Dokumenten-Daten in Form eines elektronischen Bilds, welches man erhält, indem man die als Druckprodukt vorliegende Vorlage mit Hilfe eines Bildscanners oder dergleichen ausliest.
  • Beschreibung des einschlägigen Standes der Technik
  • Bei der Verarbeitung eines Dokumentenbilds unter Verwendung eines OCR gibt es beispielsweise Fälle, an denen ein eingegebenes Bild schief liegt, beispielsweise aufgrund der Schieflage der Vorlage in Bezug auf einen Bildscanner, der das Dokumentenbild liest. Um in exakter Weise eine Zeichenerkennung und dergleichen auch für ein schief liegendes Dokumentenbild vornehmen zu können, muß die Neigung oder Schieflage des eingegebenen Bilds korrigiert werden, oder man muß die Schieflage bei den späteren Verarbeitungsvorgängen berücksichtigen. Aus diesem Grund wird die Schieflage eines Dokumentenbilds festgestellt.
  • Als Verfahren zum Nachweisen der Schieflage eines Dokumentenbilds wurden vorgeschlagen: (a) ein Verfahren, welches das Dokumentenbild um jeweils einen sehr kleinen Winkel dreht, um eine Randverteilung zu erhalten, wobei der Drehwinkel als Schieflage des Manuskripts angesehen wird, wenn die Verteilung am ausgeprägtesten ist (Research Report for Institute of Electronics and Conmunication Engineers of Japan (IECE), PRL 80–70, Seiten 9–16); (2) ein Verfahren, welches eine räumliche Verteilung von Zeichen oder Zeichenketten einer Vorlage mit Hilfe einer zweidimensionalen Fouriertransformation berechnet und den Schieflagenwinkel abschätzt anhand der räumlichen Verteilung (Thesis Journal for IECE, 1984/11, Band 670, Nr. 9, Seiten 1044–1051); (3) ein Verfahren, welches ein Dokumentenbild in mehrere parallele Streifenflächen etwa rechtwinklig zur Zeilenrichtung unterteilt, eine Teil-Randverteilung für einen solchen Streifenflächenbereich berechnet und den Schieflagenwinkel aus der Phasenverschiebung unter den Spitzenpunkten der Randverteilungen für benachbarte Streifenflächenbereiche erkennt (Thesis Journal for IECE, 1983/1, Band J66-D, Nr. 1, Seiten 111–118); und weitere Verfahren.
  • Bekannt sind außerdem: eine Methode, die die Summe der Absolutwerte von Differenzen zwischen kumulierten Dichtewerten an benachbarten Abtastzeilen in einer Randverteilung berechnet, wobei die Randverteilung durch den Abtastvorgang in der Richtung etwa rechtwinklig zur Zeilenrichtung der Vorlage gewonnen wird, und wobei die Schräglage derart berechnet wird, daß die Summe einen Maximumwert erreicht (japanische Patentveröffentlichungen 62 (1987)-52337 und 63 (1988)-25391); eine Methode, die ein Dokumentenbild in Streifenflächen mit zwei oder mehr Breiten aufteilt, auf die Streifenflächen projizierte Bilder ermittelt und den Neigungswinkel ermittelt anhand einer Differenz zwischen den Breiten der Streifenflächen und einer Schwankung zwischen den projizierten Bildern (japanische ungeprüfte Patentveröffentlichung 63 (1988)-292382); eine Methode, die ein Zeichen durch die umschreibende rechteckige oder Randverteilung in eine graphische Darstellung bringt und die Neigung des graphisch dargestellten Zeichenfeldes erkennt anhand der Relation der Feldstellung benachbart zu der Fläche des graphisch dargestellten Zeichens (japanische ungeprüfte Patentveröffentlichung 2 (1990)-44486); eine Methode, die Randverteilungen aus mehreren Teilen einer Zeichenkette extrahiert, die Lage der Zeichenkette aus jeder Randverteilung abschätzt und die Schieflage der gesamten Zeichenkette abschätzt (japanische ungeprüfte Patentveröffentlichung 3 (1991)-212780), und ähnliches.
  • Bei den oben angesprochenen Verfahren sind allerdings komplizierte und zeitraubende Prozesse erforderlich, so zum Beispiel der Bild-Drehvorgang und die zweidimensionale Fouriertransformation. Außerdem ist der Prozeß zum Berechnen einer großen Anzahl von Randverteilungen und deren Vergleich erforderlich, und bei einer Vereinfachung dieses Vorgangs gibt es das Problem, daß sich die Genauigkeit der Schieflagenerkennung verringert.
  • Wenn außerdem die Zeilenrichtung einer Vorlage, das heißt bei vertikalem oder horizontalem Schreiben, vorab bekannt ist, so sind einige Nachweisprinzipien anwendbar, allerdings wird bei einer Vorlage, deren Zeilenrichtung für die Zeichenkette unbekannt ist, sowie einer Vorlage, die sowohl vertikale als auch horizontal verlaufende Schritte enthält, die Phasenverschiebung zwischen den Teil-Randverteilungen ungewiß, und bei einigen Nachweisverfahren ist das Erkennen der Schiefe schwierig. Darüber hinaus sind einige der Verfahren deshalb nicht anwendbar, weil die Besonderheiten der Randverteilung unterschiedlich ist zwischen einem japanischen Dokument und einem Dokument mit alphabetischer Schrift, während andere Verfahren zu Fehlern beim Nachweis der Schiefe führen.
  • Nach dem Oberbegriff des Anspruchs 1 zeigt die JP-61 160 180 einen Detektor für eine Dokumentenschieflage, der allerdings keine Randverteilungs-Korrektureinrichtung enthält und auch nicht über eine Schiefendetektoreinrichtung verfügt.
  • Die US-4 251 799 zeigt ein optisches Zeichenerkennungssystem, welches von Grundlinieninformation Gebrauch macht. Zu diesem Zweck wird die Grundlinie jeder Zeile der Vorlage extrahiert, wobei der durch unter die Grundlinie ragenden Teile der Zeichen verursachte Fehler minimiert wird. Der Durchschnitt der Basislinie wird aufgrund eines Teillinien-Histogramms ermittelt, und hierdurch wird eine Schieflageninformation für die Grundlinie erhalten.
  • Die US-5 781 660 zeigt ein Bildverarbeitungssystem mit einer Randverteilungs-Korrektureinrichtung, betrieben zur Ausführung eines Schwellenwertnachweises bezüglich eines Endbereichs jedes Histogramms der Randverteilung, die in dieselbe Richtung wie die Zeilenrichtung projiziert wird. Wenn das Ausmaß des Endbereichs kleiner als ein Schwellenwert ist, wird ein solcher Endbereich entfernt.
  • Um das obige Ziel erfindungsgemäß zu erreichen, wird ein Detektor für eine Dokumentenschieflage nach Anspruch 1 geschaffen, der zwei alternative Lösungen bietet.
  • Daher kann der Nachweis einer Schieflage oder Neigung unabhängig davon geführt werden, ob eine Vorlage vertikal oder horizontal beschriftet ist. Durch Korrigieren lediglich der Histogramme der Randverteilung, die in der Richtung projiziert ist, die für die Schieflagenerfassung und den Nachweis der Schieflage erforderlich ist, läßt sich der Vorgang vereinfachen. Da außerdem jedes Histogramm der Randverteilung korrigiert wird, beispielsweise im Hinblick auf die Besonderheiten einer alphabetischen Zeichenkette, kann die Schieflage eines alphabetischen Vorlagenbilds ebenso wie eines japanischen Dokumentenbilds mit einem hohen Maß an Genauigkeit erkannt werden, wobei die Beurteilung der Zeilenrichtung und das Erkennen der Schieflage grundsätzlich synthetisch mit hoher Geschwindigkeit bei hoher Genauigkeit erfolgen kann.
  • Insbesondere die Komplexität der Schieflagenerkennung eines Dokumentenbilds wurde dadurch verbessert, daß ein einfaches Nachweisverfahren eingesetzt wurde, welches die Teil-Randverteilungen für die Zeichenketten des Dokumentenbilds extrahiert und die Schieflage des Dokumentenbilds anhand der Phasenverschiebung zwischen einander benachbarten, korrigierten Histogrammen erfaßt wird. Falls Information über die Zeilenrichtung einer Vorlage nicht vorgegeben ist, oder falls eine Vorlage sowohl vertikale als auch horizontale Schrift enthält, erfolgt ein Erkennen der Zeilenrichtung, bevor die Schieflage ermittelt wird, und es werden ausschließlich die Randverteilungsdaten in der ermittelten Zeilenrichtung verwendet. Auf diese Weise läßt sich eine weitere Vereinfachung der Schieflagenerkennung bewerkstelligen.
  • Erfindungsgemäß vergleicht die Zeilenrichtungs-Detektoreinrichtung die Anzahl von Histogrammen zwischen periodischen Leerstellen in der horizontalen Randverteilung mit der Anzahl von Histogrammen zwischen periodischen Leerstellen in der vertikalen Randverteilung und beurteilt, daß die Projektionsrichtung der Randverteilung, in welcher die Anzahl von Histogrammen zwischen periodischen Leerstellen größer ist, die Zeilenrichtung ist. Außerdem kann die Zeilenrichtungs-Detektoreinrichtung die Anzahl periodischer Leerstellen in der horizontalen Randverteilung mit der Anzahl periodischer Leerstellen in der vertikalen Randverteilung vergleichen und beurteilen, daß die Projektionsrichtung der Randverteilung, in der die Anzahl periodischer Leerstellen größer ist, die Zeilenrichtung ist. Eine Beurteilung der Zeilenrichtung, die sich für das Erkennen der Schieflage eignet, kann bezüglich eines Originals vorgenommen werden, welches sowohl vertikale als auch horizontale Schrift enthält.
  • Bei einer weiteren bevorzugten Ausführungsform der Erfindung detektiert die Schiefendetektoreinrichtung die Neigung des Dokumentenbilds anhand der Neigung einer gestreckten Linie, die die Mittelpunkte von mehreren korrigierten Histogrammen verbindet, die zu derselben Zeichenkette gehören. Daher läßt sich die Schieflagenerkennung exakt bei hohen Geschwindigkeiten vornehmen. Außerdem kann die Schiefendetektoreinrichtung die Schieflage des Dokumentenbilds anhand der Neigung einer gestreckten Linie ermitteln, welche die Mittelpunkte solcher korrigierter Histogramme verbindet, die zu mehreren Zeichenketten gehören. In diesem Fall wird die Schieflage basierend auf möglichst zahlreichen korrigierten Histogrammen über eine Mehrzahl von Zeichenketten hinweg detektiert. Im Ergebnis sind genauere Ergebnisse erzielbar.
  • In einer noch weiteren bevorzugten Form der Erfindung führt die Randverteilungs-Korrektureinrichtung eine Schwellenwertdetektierung (einen Begrenzungsprozeß) bezüglich eines Endbereichs jedes Histogramms der Randverteilung durch, die in derselben Richtung wie die Zeilenrichtung projiziert wurde, um auf diese Weise den Endbereich dann zu entfernen, wenn die Höhe des Endbereichs geringer ist als ein vorbestimmter Schwellenwert. Bezüglich eines alphabetischen Dokuments, in welchem Buchstaben keine gleichmäßige Größe besitzen, wird also ein hohes Maß an Schieflagenerkennung erreicht, genauso viel wie bei einem japanischen Dokument.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 ist ein Blockdiagramm eines Systems mit einem Detektor für eine Dokumentenschieflage gemäß einer Ausführungsform der Erfindung,
  • 2A ist ein Diagramm, das ein Beispiel für ein Dokumentenbild zeigt,
  • 2B ist ein Diagramm, welches horizontale Randverteilungen zeigt, die von dem in 2A gezeigten Dokumentenbild erhalten werden,
  • 2C ist ein Diagramm, das vertikale Randverteilungen zeigt, die von einem Dokumentenbild nach 2A erhalten werden,
  • 3 ist ein Diagramm zum Erläutern, wie jedes die Randverteilung für eine Zeichenkette bildende Histogramm gewonnen wird,
  • 4A ist ein Diagramm, das die Schieflage einer Zeichenkette darstellt, die vor der Korrektur der Randverteilung erhalten wird,
  • 4B ist ein Diagramm, welches die Schieflage einer Zeichenkette darstellt, welche nach dem Korrigieren der Randverteilung gewonnen wird.
  • BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
  • Eine bevorzugte Ausführungsform eines Detektors für eine Dokumentenschieflage gemäß der Erfindung wird im folgenden detailliert unter Bezugnahme auf die Zeichnungen erläutert.
  • 1 zeigt den Gesamtaufbau eines Dokumentenbild-Verarbeitungssystems mit dem Dokumentenschiefendetektor gemäß der Erfindung. Das Dokumentenbild-Verarbeitungssystem enthält einen Bildscanner 1, der eine Dokumentenvorlage als digitale Bilddaten eingibt, einen Bildspeicher 2, der die Daten des angegebenen Dokumentenbilds speichert, den Dokumentenschiefendetektor 3, der die Schieflage des Dokumentenbilds erkennt, und eine zentrale Verarbeitungseinheit (CPU) 4, die das gesamte System steuert.
  • Der Dokumentenschiefendetektor 3 enthält eine Randverteilungs-Extrahiereinrichtung 301, die eine horizontale Randverteilung und eine vertikale Randverteilung für das Dokumentenbild extrahiert, eine Zeilenrichtungs-Detektoreinrichtung 302, welche die Zei lenrichtung jeder Zeichenkette des Dokumentenbilds erkennt, eine Randverteilungs-Korrektureinrichtung 303, die einen Schwellenwertprozeß bezüglich der in Zeilenrichtung projizierten Randverteilung durchführt, und eine Schiefendetektoreinrichtung 304, welche die Schiefe oder die Neigung der Zeilenrichtung des Dokumentenbilds erkennt.
  • Die Randverteilungs-Extrahiereinrichtung 301 extrahiert zwei Arten von Teil-Horizontal- und -Vertikal-Randverteilungen für Zeichenketten aus den digitalen Dokumentenbilddaten (vergleiche die unten beschriebene 2A), die in dem Bildspeicher 2 gespeichert sind. Das heißt: das Dokumentenbild wird in eine Mehrzahl kleiner Streifenflächen unterteilt, was mit Hilfe vertikaler Trennlinien geschieht, und jedes Streifenfläche wird in horizontaler Richtung projiziert, wodurch eine horizontale Randverteilung extrahiert wird (vergleiche 2B). In ähnlicher Weise wird das Dokumentenbild durch horizontale Trennlinien in eine Mehrzahl kleiner Streifenflächen aufgeteilt, und jede Streifenfläche wird in vertikaler Richtung projiziert, wodurch eine vertikale Randverteilung extrahiert wird (vergleiche 2C). Die extrahierten vertikalen und horizontalen Randverteilungen werden an die Zeilenrichtungs-Detektoreinrichtung 302 gegeben, welche die Zeilenrichtung der Zeichenkette erkennt.
  • Die Zeilenrichtungs-Detektoreinrichtung 302 vergleicht die vertikalen und horizontalen Randverteilungen, um dadurch die Zeilenrichtung der Zeichenkette des eingegebenen Dokumentenbilds abzuschätzen, das heißt abzuschätzen, ob die Zeichenkette in vertikaler oder horizontaler Schreibrichtung verläuft. Insbesondere wird die Anzahl von (unten noch zu beschreibenden) Histogrammen zwischen periodischen Leerräumen in der vertikalen Randverteilung (oder die Anzahl periodischer Leerräume in der vertikalen Randverteilung) verglichen mit der Anzahl von Histogrammen zwischen periodischen Leerräumen in der horizontalen Randverteilung (oder der Anzahl von periodischen Leerräumen in der horizontalen Randverteilung), und die Projektionsrichtung der Randverteilung, in der die Anzahl von Histogrammen zwischen periodischen Leerräumen (oder die Anzahl periodischer Leerräume) größer ist, wird als die Zeilenrichtung eingeschätzt. Das Ergebnis wird an die Randverteilungs-Korrektureinrichtung 303 geliefert.
  • Die Randverteilungs-Korrektureinrichtung 303 führt einen Randverteilungs-Korrekturprozeß bezüglich der vertikalen oder horizontalen Randverteilung durch, die in dieselbe Richtung wie die von der Zeilenrichtungs-Detektoreinrichtung 302 abgeschätzte Zeilenrichtung projiziert ist. Mit Hilfe des Randverteilungs-Korrekturprozesses wird ein Endbereich jedes Histogramms der Randverteilung entfernt, wenn ein Wert oder Pegel des Endbereichs kleiner als ein vorbestimmter Schwellenwert ist. Das Ergebnis wird an die Schiefendetektoreinrichtung 304 gegeben.
  • Die Schiefendetektoreinrichtung 304 ermittelt die Schieflage jeder Zeichenkette aus der Phasenverschiebung zwischen den einander benachbarten, korrigierten Histogrammen der Randverteilung. Insbesondere werden die Mittelpunkte einer Mehrzahl korrigierter Histogramme für dieselbe Zeichenkette verknüpft und durch ein Verfahren des kleinsten Quadrats zu einer Zeile gebildet, und die Schieflage der Zeile wird für jede der mehreren Zeichenketten berechnet. Der durchschnittliche Wert der Schiefen oder Neigungen der mehreren Zeichenketten wird als die Schieflage des eingegebenen Dokumentenbilds erkannt. Die erkannte Schieflage des Dokumentenbilds wird an die CPU 4 gesendet und bei den nachfolgenden Prozessen eingesetzt.
  • Im folgenden wird jeder Vorgang im einzelnen für das horizontal beschriebene Dokumentenbild nach den 2 bis 4 als Beispiel beschrieben. 2A zeigt ein horizontal beschriebenes alphabetisches Dokumentenbild 10, welches eine Schieflage aufweist (Eingabebilddaten). Die Randverteilungs-Extrahiereinrichtung 301 teilt dieses Dokumentenbild 10 in mehrere parallele Streifenflächen in vertikaler und horizontaler Richtung auf und extrahiert horizontale und vertikale Teilrandverteilungen für die Zeichenketten in jeder Streifenfläche. Insbesondere wird das Dokumentenbild 10 in vertikaler Richtung von vertikalen Trennlinien 11 in acht parallele Streifenflächen aufgeteilt. Jede vertikale Streifenfläche wird in horizontaler Richtung projiziert, wodurch eine horizontale Randverteilung 21 gemäß 2B extrahiert wird. Das Dokumentenbild 10 wird außerdem in horizontaler Richtung durch horizontale Trennlinien 12 in elf parallele Streifenflächen unterteilt. Jede horizontale Streifenfläche wird in vertikaler Richtung projiziert, wodurch eine vertikale Randverteilung 22 gemäß 2C extrahiert wird.
  • Die Randverteilungen 21 und 22 für die Zeichenketten werden jeweils durch mehrere Histogramme gebildet. Das heißt, die Randverteilungen werden gemäß 3 gebildet durch Scannen oder Abtasten der kleinen Fläche, die durch die vertikalen Trennlinien 11 eingeschlossen ist, so daß die Fläche in horizontaler Richtung rechtwinklig zu der vertikalen Trennlinie 11 projiziert wird, wobei die Anzahl schwarzer Pixel, die auf jeder horizontalen Abtastzeile erscheinen, wenn das Dokumentenbild 10 (die Zeichenkette) innerhalb der kleinen Fläche mit vorbestimmten Schrittweisen abgetastet wird (die Anzahl von Abtastoperationen, welche einen Zeichenbereich abtasten), wird als ein Histogramm ausgedrückt. Man beachte, daß die Anzahl schwarzer Pixel in einem abgetasteten Zeichenbereich gezählt werden kann.
  • Die Zeilenrichtungs-Detektoreinrichtung 302 vergleicht die horizontale Randverteilung 21 nach 2B mit der vertikalen Umfangsverteilung 22 nach 2C und erkennt die Zeilenrichtung der Zeichenkette des Dokumentenbilds 10. Bei diesem Beispiel handelt es sich um ein horizontal beschriebenes Dokument. Da die horizontale Randverteilung 21 durch Abtasten (oder Projizieren) von Zeichenketten in der Richtung im wesentlichen parallel zur Zeilenrichtung erhalten wird, befindet sich in dieser horizontalen Randverteilung 21 eine Leerstelle oder ein Leerraum äquivalent zu einem Zwischenraum zwischen den Zeilen in klarer und periodischer Darstellungsweise zwischen den Histogramm-Anhäufungen, die jeder Zeile entsprechen. Da andererseits die vertikale Randverteilung 22 durch Abtasten (oder Projizieren) von Zeichenketten in der Richtung etwa rechtwinklig zur Zeilenrichtung erhalten wird, gibt es in dieser vertikalen Randverteilung 22 keine periodischen Leerstellen, wie sie oben angesprochen wurden, und es kommt zu horizontal langgestreckten Histogrammen.
  • Wie oben beschrieben, erscheinen beträchtliche charakteristische Merkmale entsprechend der Zeilenrichtung des Dokumentenbilds 10 sowohl in der horizontalen Randverteilung 21 als auch in der vertikalen Randverteilung 22. Daher werden diese besonderen Merkmale zum Nachweis oder zum Erkennen der Zeilenrichtung ausgenutzt. Insbesondere wird in der horizontalen Randverteilung 21 und der vertikalen Randverteilung 22 die Anzahl periodischer Histogramm-Anhäufungen gezählt, die in regelmäßigen oder mehr Intervallen existieren (oder es wird die Anzahl periodischer Leerstellen oder Leerräume gezählt). Die Anhäufungs- oder Leerraum-Zählung in der horizontalen Randverteilung 21 wird mit dem entsprechenden Wert für die vertikale Randverteilung 22 verglichen, und es wird diejenige Richtung als Zeilenrichtung der Zeichenkette erkannt, bei der es sich um die Projektionsrichtung (oder Abtastrichtung) der Randverteilung 21 oder 22 handelt, in der die Anhäufungs- oder Leerraumzählung größer ist. Im Fall der 2A beträgt der vorgenannte Zählwert für die horizontale Randverteilung 21 (2B) 150 oder mehr, sie beträgt für die vertikale Randverteilung 22 (2C) 20 oder weniger. Weil die Zählung für die horizontale Randverteilung 21, projiziert und gewonnen in horizontaler Richtung, größer ist, entspricht die Zeilenrichtung der Zeichenketten des Dokumentenbilds 10 der horizontalen Richtung. Damit sendet die Zeilenrichtungs-Detektoreinrichtung 302 nur die Daten der horizontalen Randverteilung 21 aus 2B, die in horizontaler Richtung projiziert und gewonnen wurden, zu der Randverteilungs-Verarbeitungseinrichtung 303.
  • Man beachte, daß bei einem Original, auf dem das Dokumentenbild 10 Zeichenketten sowohl in vertikaler als auch in horizontaler Richtung enthält, es mehr Zeichenketten in der Zeilenrichtung gibt, die der Projektionsrichtung der Randverteilung entspricht, in der der vorgenannte Zählwert größer ist, so daß dadurch, daß man nur die Randverteilungsdaten in dieser Richtung an die Randverteilungs-Verarbeitungsrichtung 303 sendet, eine hohe Genauigkeit der Schieflagenerkennung möglich ist, die im folgenden erläutert wird.
  • 4 zeigt den Vorgang in der Randverteilungs-Korrektureinrichtung 303 wird der Schiefendetektoreinrichtung 304. Wie bereits beschrieben, detektiert die Schiefendetektoreinrichtung 304 im wesentlichen die Neigung einer geraden Linie, welche die Mittelpunkte der vertikalen Breiten (der vertikalen Längen in 4 der die Randverteilung 21 bildenden Histogramme verbindet, jedoch gibt es im Fall eines alphabetischen Dokuments Fälle, in denen die Schieflage nicht mit der tatsächlichen Schieflage übereinstimmt. Diese Fehlanpassung wird korrigiert durch die Randverteilungs-Korrektureinrichtung 303.
  • Zu dem genannten Zweck führt die Randverteilungs-Korrektureinrichtung 303 den Randverteilungs-Korrekturprozeß bezüglich der Randverteilung 21 aus, die von der Zeilenrichtungs-Detektoreinrichtung 302 kommt. 4A zeigt einen Teil einer alphabetischen Zeichenkette und ein Beispiel für die Randverteilung 21 dieses Abschnitts. Im Fall einer alphabetischen Zeichenkette mit aufeinanderfolgenden Kleinbuchstaben ragt die Oberlänge des Buchstabens „d" sowie die Unterlänge des Buchstabens „g" gegenüber dem Grundbereich (welcher durch gestrichelte Linien dargestellt ist) der Zeichenkette vor, und deshalb haben die die alphabetische Zeichenkette bildenden Buchstaben keine gleichmäßige Größe. Wenn daher die Randverteilung 21 unverändert verarbeitet wird, paßt der Schieflagenwinkel der geraden Linie L0, die die Mittelpunkte S der Histogramme der Randverteilung 21 miteinander verbindet, nicht überein mit der Neigung der tatsächlichen Zeichenkette, so daß es zu einem Fehler kommt. Aus diesem Grund führt die Randverteilungs-Korrektureinrichtung 303 den Schwellenwertprozeß bezüglich eines Endbereichs jedes Histogramms der Randverteilung 21 aus, um dadurch den Endbereich dann zu beseitigen, wenn der Wert in dem Endbereich kleiner als ein vorbestimmter Schwellenwert ist. Wie in 4B gezeigt ist, beseitigen die korrigierten Histogramme 21a den Einfluß der herausragenden Bereiche einer alphabetischen Zeichenkette, wie sie oben erläutert wurden, und sie entsprechen dem Grundbereich (der durch gestrichelte Linien angegeben ist) der Zeichenkette. Die Schieflage oder Neigung der geraden Linie L1, die Mittelpunkte S der korrigierten Histogramme 21a verbindet, paßt zu der Schieflage der Zeichenkette mit einem höheren Maß an Genauigkeit. Die durch die korrigierten Histogramme 21a gebildete Randverteilung 21 wird an die Schiefendetektoreinrichtung 304 gegeben.
  • Die Schiefendetektoreinrichtung 304 detektiert die zentralen oder Mittelstellen S, S ..., und S der benachbarten Histogramme 21a der Randverteilung 21, die als zu einer einzelnen Zeichenkette gehörig beurteilt wird, und sie berechnet die gerade Linie L1, die diese Mittelpunkte S so weit wie möglich verbindet, wozu die Methode des kleinsten Quadrats verwendet wird. Die Neigung dieser geraden Linie L1 wird als Schieflage für die Zeichenkette hergenommen. Die Schieflage einer solchen Geraden wird für sämtliche Zeichenketten des Dokumentenbildes 10 berechnet, und der Durchschnittswert der berechneten Schiefen sämtlicher Zeichenketten wird erkannt oder festgelegt als die Schieflage des Dokumentenbilds 10.
  • Man beachte, daß selbst dann, wenn der oben erläuterte Prozeß des Korrigierens der Randverteilung bei einem japanischen Dokumentenbild vorgenommen wird, ein geringes Maß an vorstehenden Bereichen entfernt wird und es nur geringen Einfluß auf die Schieflagenerkennung einer geraden Linie sowohl in einem japanischen als auch in einem al phabetischen Dokument hat, so daß eine zufriedenstellende Schieflagenerkennung vorgenommen werden kann.

Claims (4)

  1. Detektor für eine Dokumentschieflage, umfassend eine Randverteilungs-Extrahiereinrichtung (301), die ein eingegebenes Dokumentenbild durch mehrere vertikale Trennlinien (11) in mehrere kleine Flächenbereiche unterteilt und eine horizontale Randverteilung (21) extrahiert, erhalten durch Projizieren jedes kleinen Flächenbereichs in einer horizontalen Richtung, und außerdem das eingegebene Dokumentenbild durch mehrere horizontale Trennlinien (12) in mehrere kleine Flächenbereiche unterteilt und eine vertikale Randverteilung (22) extrahiert, gewonnen durch Projizieren jedes kleinen Flächenbereichs in einer vertikalen Richtung, wobei die horizontale Randverteilung (21) gebildet wird durch Verteilungsanhäufungen, erhalten durch Projizieren von Zeichenketten des Dokumentenbilds in horizontaler Richtung, und die vertikale Randverteilung (22) gebildet wird durch Verteilungsanhäufungen, die erhalten werden durch Projizieren der Zeichenketten in vertikaler Richtung, eine Zeilenrichtungs-Detektoreinrichtung (302), die eine Zeilenrichtung eines Dokumentenbilds dadurch erfaßt, daß sie die horizontale Randverteilung (21) und die vertikale Randverteilung (22), die von der Randverteilungs-Extrahiereinrichtung (301) extrahiert wurden, miteinander vergleicht, gekennzeichnet durch eine Randverteilungs-Korrektureinrichtung (303), die die Verteilungsanhäufungen derjenigen Randverteilung korrigiert, die in der gleichen Richtung wie die von der Zeilenrichtungs-Detektoreinrichtung (302) erfaßte Zeilenrichtung projiziert wird, und eine Schiefen-Detektoreinrichtung (304), die eine Schiefe des Dokumentenbilds nachweist anhand einer Phasenverschiebung zwischen den korrigierten, einander benachbarten Verteilungsanhäufungen, wobei die Zeilenrichtungs-Detektoreinrichtung (302) entweder die Anzahl von Verteilungsanhäufungen zwischen periodischen Freiräumen in der horizontalen Randverteilung (21) mit der Anzahl von Verteilungsanhäufungen zwischen periodischen Freiräumen in der vertikalen Randverteilung (22) vergleicht und beurteilt, daß die Projektionsrichtung der Randverteilung, in der die Verteilungsanhäufungen zwischen den periodischen Freiräumen größer ist, die Zeilenrichtung ist, oder die Anzahl periodischer Freiräume in der horizontalen Randverteilung (21) mit der Anzahl periodischer Freiräume in der vertikalen Randverteilung (22) vergleicht, und beurteilt, daß die Projektionsrichtung der Randverteilung, in der die Anzahl periodischer Freiräume größer ist, die Zeilenrichtung ist.
  2. Detektor nach Anspruch 1, bei dem die Schiefen-Detektoreinrichtung (302) die Schiefe des Dokumentenbildes ermittelt anhand der Neigung einer geraden Linie, die die Mittelpunkte mehrerer der zu der gleichen Zeichenkette gehörenden korrigierten Verteilungsanhäufungen verbindet.
  3. Detektor nach Anspruch 2, bei dem die Schiefen-Detektoreinrichtung (302) die Schiefe des Dokumentenbildes ermittelt anhand der Neigung von geraden Linien, welche die Mittelpunkte der korrigierten Verteilungsanhäufungen, die zu mehreren Zeichenketten gehören, verbinden.
  4. Detektor nach Anspruch 1, bei dem die Randverteilungs-Korrektureinrichtung (303) eine Schwellenwertdetektion an einem Endbereich jeder Verteilungsanhäufung der Randverteilung vornimmt, die in der gleichen Richtung wie die Zeilenrichtung projiziert wird, um dadurch den Endbereich zu beseitigen, wenn ein Wert an dem Endbereich kleiner ist als ein vorbestimmter Schwellenwert.
DE60006731T 1999-03-01 2000-02-28 Detektionsgerät des Neigungswinkels eines Dokumentes Expired - Fee Related DE60006731T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP05261699A JP4323606B2 (ja) 1999-03-01 1999-03-01 文書画像傾き検出装置
JP5261699 1999-03-01

Publications (2)

Publication Number Publication Date
DE60006731D1 DE60006731D1 (de) 2004-01-08
DE60006731T2 true DE60006731T2 (de) 2004-09-23

Family

ID=12919743

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60006731T Expired - Fee Related DE60006731T2 (de) 1999-03-01 2000-02-28 Detektionsgerät des Neigungswinkels eines Dokumentes

Country Status (4)

Country Link
US (1) US6683983B1 (de)
EP (1) EP1033864B1 (de)
JP (1) JP4323606B2 (de)
DE (1) DE60006731T2 (de)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3854024B2 (ja) * 1999-11-30 2006-12-06 株式会社Pfu 文字認識前処理装置及び方法並びにプログラム記録媒体
JP2002024762A (ja) * 2000-06-30 2002-01-25 Toshiba Corp 文書認識装置及びその方法
US6971060B1 (en) * 2001-02-09 2005-11-29 Openwave Systems Inc. Signal-processing based approach to translation of web pages into wireless pages
US7058220B2 (en) * 2002-04-29 2006-06-06 Hewlett-Packard Development Company, L.P. Method and system for processing images using histograms
JP4552681B2 (ja) * 2005-02-14 2010-09-29 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法、および画像処理プログラム
JP4634261B2 (ja) * 2005-09-09 2011-02-16 株式会社リコー 画像形成装置、画像処理装置、画像出力装置、携帯端末、画像処理システム、画像形成方法、画像処理方法、画像出力方法、画像形成プログラム、画像処理プログラムおよび画像出力プログラム
US8176414B1 (en) * 2005-09-30 2012-05-08 Google Inc. Document division method and system
JP4807618B2 (ja) * 2006-03-06 2011-11-02 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
DE102006059659B4 (de) * 2006-12-18 2009-12-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung, Verfahren und Computerprogramm zur Erkennung von Schriftzeichen in einem Bild
KR101035739B1 (ko) * 2009-02-13 2011-05-20 전남대학교산학협력단 문자 인식의 왜곡을 보정하는 방법
US8218875B2 (en) * 2010-06-12 2012-07-10 Hussein Khalid Al-Omari Method and system for preprocessing an image for optical character recognition
JP6103918B2 (ja) * 2012-12-18 2017-03-29 キヤノン株式会社 画像処理装置および画像処理方法
US10362187B2 (en) * 2015-07-17 2019-07-23 Kyocera Document Solutions Inc. Image forming apparatus
JP6642833B2 (ja) * 2016-10-28 2020-02-12 京セラドキュメントソリューションズ株式会社 画像処理装置
JP6794284B2 (ja) * 2017-01-31 2020-12-02 キヤノン株式会社 カメラ機能を有する携帯可能な情報処理装置、その表示制御方法、及びプログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4251799A (en) * 1979-03-30 1981-02-17 International Business Machines Corporation Optical character recognition using baseline information
JPS55135972A (en) * 1979-04-10 1980-10-23 Toshiba Corp Character line direction discrimination circuit
JPS61160180A (ja) * 1985-01-08 1986-07-19 Nippon Telegr & Teleph Corp <Ntt> 文字列方向判別装置
JPS6252337A (ja) 1985-08-29 1987-03-07 Sanyo Electric Co Ltd 一体型空気調和機
US4699577A (en) * 1986-05-06 1987-10-13 Parker Hannifin Corporation Internal gear device with improved rotary valve
JPS63292382A (ja) 1987-05-26 1988-11-29 Fujitsu Ltd 文字列傾き検出装置
US5001766A (en) * 1988-05-16 1991-03-19 At&T Bell Laboratories Apparatus and method for skew control of document images
JP2669661B2 (ja) 1988-08-05 1997-10-29 日本電信電話株式会社 文書画像処理方法
JP2893747B2 (ja) * 1989-08-31 1999-05-24 日本電気株式会社 文書画像傾き検出方法及びその装置
JPH03212780A (ja) * 1990-01-18 1991-09-18 Fuji Xerox Co Ltd 文字列傾き検出装置
EP0472313B1 (de) * 1990-08-03 1998-11-11 Canon Kabushiki Kaisha Gerät und Verfahren zur Bildverarbeitung
JPH04177583A (ja) * 1990-11-09 1992-06-24 Seiko Epson Corp 傾き角検出方法
JP3320759B2 (ja) * 1991-12-26 2002-09-03 株式会社東芝 文書画像傾き検出装置およびその方法
JP3108979B2 (ja) * 1994-07-28 2000-11-13 セイコーエプソン株式会社 画像処理方法および画像処理装置
JP3534128B2 (ja) * 1995-01-24 2004-06-07 オムロン株式会社 書類の上下方向検知方法及び装置
US5889884A (en) * 1995-05-23 1999-03-30 Minolta Co., Ltd. Image forming apparatus capable of recognizing top and bottom of document image
JPH0951422A (ja) * 1995-08-09 1997-02-18 Minolta Co Ltd 画像編集装置

Also Published As

Publication number Publication date
US6683983B1 (en) 2004-01-27
EP1033864A3 (de) 2001-07-25
JP2000251082A (ja) 2000-09-14
JP4323606B2 (ja) 2009-09-02
EP1033864A2 (de) 2000-09-06
EP1033864B1 (de) 2003-11-26
DE60006731D1 (de) 2004-01-08

Similar Documents

Publication Publication Date Title
DE60006731T2 (de) Detektionsgerät des Neigungswinkels eines Dokumentes
DE3633743C2 (de)
DE10036110B4 (de) Verfahren zur Bestimmung des Schrägwinkels eines zweidimensionalen Barcodes
DE3716787C2 (de)
DE69728482T2 (de) Zweidimensionaler Codeleser
DE69432585T2 (de) Verfahren und Gerät zur Auswahl von Text und/oder Non-Text-Blöcken in einem gespeicherten Dokument
DE19814075B4 (de) Verfahren zum Abtasten und Erkennen mehrerer Fotografien und zum Beseitigen von Randfehlern
DE102008034304B4 (de) Bildverarbeitungsgerät
DE3615906C2 (de)
DE69628711T2 (de) Verfahren und Vorrichtung zum Korrigieren von Pixelwerten eines digitalen Bildes
EP2702757B1 (de) Scan-verfahren für ein grossformatiges scanner-system mit stitching-verfahren
DE19736696C2 (de) Bildverarbeitungsvorrichtung
DE10026704B4 (de) Bildverarbeitungssystem zum Abtasten eines rechtwinkligen Dokuments
DE69835358T2 (de) Verfahren zur Korrektur der Verzerrung beim Abtasten eines optischen Codes
DE69926205T2 (de) Artefaktentfernungstechnik für schiefenkorrigierte bilder
DE19924144C2 (de) Schiefekorrekturapparat und -verfahren
DE3523042C2 (de)
DE102008052601A1 (de) Bildprozessor, Bildverarbeitungsverfahren und Computerprogrammprodukt
DE19500382A1 (de) Verfahren und Einrichtung zum Kompensieren von Substratverzerrungen in einem automatischen optischen Prüfsystem für Leiterplatten
EP1260933A2 (de) Verfahren zum Erfassen von zweidimensionalen Codes
DE10025332A1 (de) Verfahren zum Lesen eines zweidimensionalen Barcodes
EP0296516B1 (de) Verfahren zur Erkennung von Zeichen und Objekten
EP0301384B1 (de) Schaltungsanordnung zur Aufbereitung von schrägstehenden, insbesondere handgeschriebenen Zeichen
DE2829808A1 (de) Verfahren und vorrichtung zum lesen von zeichen
DE69722605T2 (de) Verfahren und vorrichtung zur bilderkennung sowie ihre anwendung in einem kopiergerät und einem drucker

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee