DE10009761A1 - Image recording method involves determining line spacing based on image data and from separation of successive characters, edge sharpness from character edges - Google Patents

Image recording method involves determining line spacing based on image data and from separation of successive characters, edge sharpness from character edges

Info

Publication number
DE10009761A1
DE10009761A1 DE10009761A DE10009761A DE10009761A1 DE 10009761 A1 DE10009761 A1 DE 10009761A1 DE 10009761 A DE10009761 A DE 10009761A DE 10009761 A DE10009761 A DE 10009761A DE 10009761 A1 DE10009761 A1 DE 10009761A1
Authority
DE
Germany
Prior art keywords
image data
character
line
characters
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE10009761A
Other languages
German (de)
Inventor
Wilfried Kochert
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oce Document Technologies GmbH
Original Assignee
CGK Computer Gesellschaft Konstanz mbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CGK Computer Gesellschaft Konstanz mbH filed Critical CGK Computer Gesellschaft Konstanz mbH
Priority to DE10009761A priority Critical patent/DE10009761A1/en
Priority to PCT/EP2001/002028 priority patent/WO2001065473A1/en
Publication of DE10009761A1 publication Critical patent/DE10009761A1/en
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/142Image acquisition using hand-held instruments; Constructional details of the instruments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/166Normalisation of pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

The method involves scanning a line of characters in a document to read image data and providing the image data for optical character recognition. The line spacing is determined based on the image data and is derived from the separation of successive characters. In addition edge sharpness is determined from character edges and is used to check the line spacing derived from character separations. Independent claims are also included for the following: an image acquisition device.

Description

Die Erfindung betrifft ein Bildaufnahmeverfahren und eine Bildaufnahmevorrichtung zur Aufnahme von Bilddaten einer Zei­ chenzeile, wobei eine Aufnahmevorrichtung zur Abtastung einer Vorlage, um die Bilddaten einer Zeichenzeile zu lesen, und einer Verarbeitungsvorrichtung vorgesehen sind, um unter Be­ rücksichtigung einer tatsächlichen Zeichenteilung die Bildda­ ten für eine OCR-Erkennung vorzubereiten, um so verzerrungs­ freie Bilddaten zu erhalten.The invention relates to an image recording method and Image recording device for recording image data of a time chenzeile, wherein a recording device for scanning a Template for reading the image data of a character line, and a processing device are provided to under Be considering an actual character division the image da to prepare for OCR detection in order to avoid distortion to get free image data.

In den letzten Jahren ist die OCR-Erkennung, also die Umwand­ lung von Bilddaten in Textdaten, zunehmend wichtiger gewor­ den. Voraussetzung für eine einwandfreie OCR-Erkennung ist es allerdings, dass die Bilddaten der OCR-Software mit einer gleichbleibend guten Qualität zugeführt werden.In the past few years, OCR recognition, i.e. conversion image data into text data, increasingly important the. It is a prerequisite for correct OCR recognition however, that the image data of the OCR software with a consistently good quality.

Wenn die Bilddaten für die OCR-Erkennung über eine Bildauf­ nahmevorrichtung, beispielsweise einen Scanner, eingelesen werden, stellt sich das Problem, dass die erhaltenen Bildda­ ten aufgrund von Scannereigenschaften nicht verzerrungsfrei sind, was zu Schwierigkeiten bei der OCR-Erkennung führen kann. Dies ist insbesondere bei handgeführten Scannern ein ernstes Problem.When the image data for OCR detection is on an image device, such as a scanner, read the problem arises that the obtained image da due to scanner properties not distortion-free are causing difficulties in OCR detection can. This is especially true with handheld scanners serious problem.

Bei einem handgeführten Scanner werden die Zeichen je nach Geschwindigkeit beim Scannen, die zwischen 5 und 150 cm/sek. liegen kann, beliebig stark verzerrt. Um dieses Problem zu lösen, gab es bisher zwei Ansätze. Zum einen offenbart US- 5,250,804 einen handgehaltenen Scanner mit einem Taktrad. Wenn der Scanner über eine Vorlage bewegt wird, dreht sich das Taktrad und gibt ein Maß für die Geschwindigkeit, das an den Computer übermittelt wird. Ein Nachteil dieser Bauweise ist es, dass nur sehr geringe Scanngeschwindigkeiten möglich sind, eine sehr saubere Scannführung erforderlich ist, und dass das Taktrad eine sehr begrenzte Lebensdauer hat.With a hand-held scanner, the characters are different Scanning speed between 5 and 150 cm / sec. can lie, distorted as much as desired. To solve this problem solve, there have been two approaches so far. For one, U.S. 5,250,804 a hand-held scanner with a clock wheel. When the scanner is moved over an original, it rotates the clock wheel and gives a measure of the speed that the computer is transmitted. A disadvantage of this design  it is possible that only very low scanning speeds a very clean scan guide is required, and that the cycle wheel has a very limited lifespan.

Ein zweiter Ansatz sieht vor, ein zweidimensionales Photo­ diodenarray in der Lesevorrichtung einzusetzen. Wird dieses Photodiodenarray hinreichend groß gewählt, ist es möglich, ein Normzeichen mit einem Scannzyklus zu erfassen. Der Nach­ teil hierbei ist, dass zweidimensionale Arrays relativ teuer sind, und dass breite Normschriften nicht gelesen und erkannt werden können, da Teile eines Zeichens vom Flächensensor nicht erfasst werden.A second approach is a two-dimensional photo insert diode array in the reading device. will this If the photodiode array is sufficiently large, it is possible to to capture a standard character with a scan cycle. The night Part of this is that two-dimensional arrays are relatively expensive and that wide standard fonts are not read and recognized parts of a character from the area sensor cannot be recorded.

Aufgabe der Erfindung ist es, ein verbessertes Bildaufnahme­ verfahren und eine verbesserte Bildaufnahmevorrichtung zu schaffen, die weitgehend verbesserungsfrei arbeiten.The object of the invention is an improved image recording method and an improved image recording device create that work largely without improvement.

Erfindungsgemäß wird diese Aufgabe durch ein Verfahren nach Anspruch 1 beziehungsweise eine Vorrichtung nach Anspruch 11 gelöst. Die abhängigen Ansprüche betreffen weitere vorteil­ hafte Aspekte der Erfindung.According to the invention, this object is achieved by a method Claim 1 or a device according to claim 11 solved. The dependent claims relate to further advantages Adherent Aspects of the Invention.

Bei dem erfindungsgemäßen Verfahren zur Aufnahme von Bildda­ ten einer Zeichenzeile wird eine Zeichenzeile einer Vorlage zum Lesen von Bilddaten abgetastet und die Bilddaten für eine OCR-Erkennung vorbereitet, wobei die Zeichenteilung beruhend auf den Bilddaten bestimmt wird.In the inventive method for recording image A character line becomes a character line of a template scanned for reading image data and the image data for a OCR recognition prepared, based on character division on which image data is determined.

Bei einem solchen Verfahren ist die Verwendung eines Taktra­ des, welches relativ schnell kaputt gehen kann, entbehrlich. Zudem lassen sich Scanngeschwindigkeiten von mehr als 1 m/Sek. erreichen. Die Anforderungen an die Genauigkeit der Scannerführung sind geringer und das Verfahren ist einfacher durchführbar, da keinerlei bewegliche Teile verwendet werden. One such method is the use of a taktra the one that can break relatively quickly can be dispensed with. In addition, scanning speeds of more than 1 m / sec. to reach. The accuracy requirements of the Scanner guidance is less and the procedure is easier feasible since no moving parts are used.  

Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Verfah­ rens ist dadurch gekennzeichnet, dass die Zeichenteilung aus dem Abstand aufeinanderfolgender Zeichen bestimmt wird. Hier­ durch wird in einfacher Weise ein jeweils aktuelles Maß für die Zeichenteilung erhalten.An advantageous embodiment of the inventive method rens is characterized in that the character division the spacing of successive characters is determined. Here is a current measure for in a simple manner get the character division.

Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Verfah­ rens ist dadurch gekennzeichnet, dass zusätzlich die Über­ gangsschärfe an den Zeichenkanten bestimmt wird, wobei die Übergangsschärfe zur Überprüfung der aus dem Abstand zwischen aufeinanderfolgenden Zeichen ermittelten Zeichenteilung dient. Hierdurch läßt sich die Zuverlässigkeit der ermittel­ ten Zeichenteilung erhöhen, was insbesondere dann von Bedeu­ tung ist, wenn die Zeichen in horizontaler Richtung Unterbre­ chung aufweisen, so dass irrelevante Zeichenzwischenräume entstehen, die zu einer fehlerhaften Ermittlung der Zeichen­ teilung führen könnten.An advantageous embodiment of the inventive method rens is characterized in that in addition the over gait sharpness is determined at the drawing edges, the Transitional sharpness for checking the distance between successive characters determined character division serves. In this way, the reliability of the can be determined Increase the number of characters, which is particularly important is when the characters in the horizontal direction are interrupted have so that irrelevant spaces between characters arise that lead to incorrect identification of the characters could lead to division.

Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Verfah­ rens ist dadurch gekennzeichnet, dass die gelesenen Bilddaten komprimiert werden. Da insbesondere bei langsamem Scannen sehr große Datenmengen entstehen können, läßt sich auf diese Weise ein wesentliches Maß an Speicherplatz und -zeit einspa­ ren.An advantageous embodiment of the inventive method rens is characterized in that the read image data be compressed. Because especially with slow scanning very large amounts of data can arise on this Save a significant amount of storage space and time ren.

Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Verfah­ ren ist dadurch gekennzeichnet, dass die komprimierten Bild­ daten als die Grauwerte in einem SRAM einer Zeichenerken­ nungseinheit für Grauwert-Videodaten abgespeichert werden. Das Abspeichern in Form von Grauwerten hat gegenüber dem Ab­ speichern in binarisierter Form den Vorteil, dass sich durch die Analyse von Weiß-schwarz- beziehungsweise Schwarz-weiß- Übergängen relevante Zeichenteile von Zeichen näher untersu­ chen lassen. An advantageous embodiment of the inventive method ren is characterized in that the compressed image data as the gray values in a SRAM of a character recognition unit for gray scale video data can be saved. Saving in the form of gray values compared to Ab store in binary form the advantage that the analysis of white-black or black-white Examine transitions of relevant parts of characters from characters let it  

Die erfindungsgemäße Bildaufnahmevorrichtung zur Aufnahme von Bilddaten einer Zeichenzeile enthält eine Aufnahmevorrichtung zur Abtastung einer Vorlage, um die Bilddaten einer Zeichen­ zeile zu lesen und eine Verarbeitungsvorrichtung, um unter Berücksichtigung einer tatsächlichen Zeichenteilung die Bild­ daten für eine OCR-Erkennung vorzubereiten, um so verzer­ rungsfreie Bilddaten zu erhalten. Die erfindungsgemäße Vor­ richtung ist dadurch gekennzeichnet, dass die Verarbeitungs­ vorrichtung ausgestattet ist, um den Abstand zwischen aufein­ anderfolgenden Zeichen der Zeichenzeile und somit ein Maß für die tatsächliche Zeichenzeile zu bestimmen.The image recording device according to the invention for recording Image data of a character line contains a recording device to scan a template to the image data of a character line to read and a processing device to under Taking into account an actual character split the picture prepare data for OCR recognition in order to maintenance-free image data. The invention before direction is characterized in that the processing device is equipped to adjust the distance between subsequent characters of the character line and thus a measure for to determine the actual character line.

Ein Vorteil der Erfindung besteht darin, dass kein Taktrad nötig ist, somit also keine mechanischen Teile vorliegen, die relativ schnell kaputtgehen können. Mit der erfindungsgemäßen Vorrichtung sind Scanngeschwindigkeiten von mehr als 1 m/sek. möglich. Auch die Anforderungen an die Genauigkeit der Scan­ nerführung sind geringer als beim Stand der Technik. Die ge­ samte Vorrichtung wird durch das Vermeiden mechanischer Teile billiger, robuster und einfacher in der Handhabung.An advantage of the invention is that there is no clock wheel is necessary, so there are no mechanical parts that can break relatively quickly. With the invention Device are scanning speeds of more than 1 m / sec. possible. Also the requirements for the accuracy of the scan nerführung are less than in the prior art. The ge Entire device is avoided by avoiding mechanical parts cheaper, more robust and easier to use.

Eine vorteilhafte Ausgestaltung der erfindungsgemäßen Bild­ aufnahmevorrichtung ist dadurch gekennzeichnet, dass die Ver­ arbeitungsvorrichtung in der Lage ist, den Abstand zwischen aufeinanderfolgenden Zeichen zu ermitteln und aus diesem Ab­ stand die Zeichenteilung bestimmen.An advantageous embodiment of the image according to the invention Recording device is characterized in that the Ver working device is able to the distance between to determine successive characters and from this Ab stood to determine the character division.

Eine vorteilhafte Ausgestaltung der erfindungsgemäßen Bild­ aufnahmevorrichtung ist dadurch gekennzeichnet, dass die Ver­ arbeitungsvorrichtung derart ausgestaltet ist, dass sie zu­ sätzlich die Übergangsschärfe an den Zeichenkanten bestimmt, wobei die Übergangsschärfe ein Maß für die Zeichenteilung ist. In Abhängigkeit der Geschwindigkeit des Scannvorgangs gibt es an Schwarz-Weiß- bzw. Weiß-Schwarz-Übergängen soge­ nannte Graukegel. Die Größe dieser Graukegel ist ebenfalls ein Maß für die Scanngeschwindigkeit bzw. für die Zeichentei­ lung. Insbesondere bei schlechten Vorlagen, bei denen einzel­ ne Zeichen der abzuscannenden Zeichenzeile unvollständig wie­ dergegeben sind, bietet die Bestimmung der Übergangsschärfe eine zusätzliche Überprüfungsmöglichkeit für den vorhergehend bestimmten Zeichenabstand. Die Vorrichtung wird auf diese Art noch leichter in der Handhabung.An advantageous embodiment of the image according to the invention Recording device is characterized in that the Ver work device is designed such that it additionally determines the sharpness of transition at the edges of the drawing, where the transition sharpness is a measure of the character division is. Depending on the speed of the scanning process there are so-called black-white or white-black transitions called gray cone. The size of this gray cone is also  a measure of the scanning speed or the drawing part lung. Especially with bad originals, where single ne characters of the character line to be scanned incomplete like are given, offers the determination of the transition sharpness an additional verification option for the previous one certain character spacing. The device is in this way even easier to use.

Eine vorteilhafte Ausgestaltung der erfindungsgemäßen Bild­ aufnahmevorrichtung ist dadurch gekennzeichnet, dass die Ver­ arbeitungsvorrichtung zusätzlich die Übergangsschärfe an den Zeichenkanten bestimmt, wobei die Übergangsschärfe zur Über­ prüfung der aus dem Zeichenabstand ermittelten Zeichenteilung dient.An advantageous embodiment of the image according to the invention Recording device is characterized in that the Ver work device additionally the transition sharpness to the Character edges determined, the transition sharpness to the over Checking the character division determined from the character spacing serves.

Eine vorteilhafte Ausgestaltung der erfindungsgemäßen Bild­ aufnahmevorrichtung ist dadurch gekennzeichnet, dass die Auf­ nahmevorrichtung als handgeführter Scanner ausgeschaltet ist. Von diesem handgeführten Scanner werden die gewonnenen Bild­ daten durch ein geeignetes Mittel, beispielsweise ein Kabel oder eine Infrarotschnittstelle, an die Verarbeitungsvorrich­ tung der Bildaufnahmevorrichtung übertragen. Insbesondere bei handgeführten Scannern variiert die Scanngeschwindigkeit sehr stark. Um dennoch eine effiziente OCR-Erkennung durchführen zu können, ist daher eine zuverlässige Gewinnung verzerrungs­ freier Daten erforderlich.An advantageous embodiment of the image according to the invention Recording device is characterized in that the on is turned off as a handheld scanner. The image obtained is taken from this hand-held scanner data by a suitable means, such as a cable or an infrared interface to the processing device tion of the image pickup device transmitted. Especially at handheld scanners vary the scanning speed a lot strong. To still perform efficient OCR detection To be able to do so is a reliable extraction distortion free data required.

Eine vorteilhafte Ausgestaltung der erfindungsgemäßen Bild­ aufnahmevorrichtung ist dadurch gekennzeichnet, dass die Vor­ richtung einen Speicher um die Bilddaten zwischenzuspeichern. In dem Speicher können daher in vorteilhafter Weise die abge­ tasteten Bilddaten und die entzerrten Bilddaten vor der Ver­ arbeitung durch die OCR-Software zwischengespeichert werden. An advantageous embodiment of the image according to the invention Recording device is characterized in that the front towards a memory to buffer the image data. In the memory, the abge can therefore advantageously keyed image data and the rectified image data before Ver work through the OCR software.  

Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Verfah­ rens ist dadurch gekennzeichnet, dass es das Komprimieren der eingelesenen Bilddaten und Speichern als Grauwerte in einem SRAM-Puffer, das Abspeichern von Grauwertstützpunkten zum Bilden einer komprimierten Tapete, das Bilden von Zeichenmit­ tenabständen aufeinanderfolgender Zeichen, das Bilden von Scanngeschwindigkeitswerten und Eintragen dieser Scannge­ schwindigkeitswerte in die komprimierte Tapete und das Dekom­ primieren der komprimierten Tapete umfasst. Auf diese Weise läßt sich ein geschwindigkeitskorrigiertes Band von Zeichen erhalten, welches anschließend einer OCR-Zeichenerkennung zu­ geführt werden kann.An advantageous embodiment of the inventive method rens is characterized in that it is compressing the Image data read in and saved as gray values in one SRAM buffer, the storage of gray value support points for Forming a compressed wallpaper, forming characters with spacing of consecutive characters, the formation of Scanning speed values and entering this scan speed values in the compressed wallpaper and the decoration priming the compressed wallpaper includes. In this way can be a speed corrected band of characters received, which then an OCR character recognition can be performed.

Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Verfah­ rens ist dadurch gekennzeichnet, dass zum Bilden der Grau­ wertstützpunkte die als Grauwerte abgespeicherten Bilddaten zeilenweise unter Bildung von Grauwertdifferenzen zu einem für jede Zeile ermittelten Weißwert untersucht werden, wobei bei Überschreiten einer vorbestimmten Grauwertdifferenz ein Grauwertstützpunkt in den SRAM-Puffer eingetragen wird. An­ hand der auf diese Weise ermittelten Grauwertstützpunkte las­ sen sich die zu einer Zeile gehörenden relevanten Pixel in einfacher Weise durch Addition der Differenz der Grauwert­ stützpunkte zwischen minimalem und maximalem Grauwert anhand einer dynamisch einstellbaren Schwelle ermitteln.An advantageous embodiment of the inventive method rens is characterized in that to form the gray the image data stored as gray values line by line with gray value differences to one white value determined for each line are examined, whereby when a predetermined gray value difference is exceeded Gray value base is entered in the SRAM buffer. On read the gray-scale reference points determined in this way the relevant pixels belonging to a line simply by adding the difference of the gray values based on the minimum and maximum gray value determine a dynamically adjustable threshold.

Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Verfah­ rens ist dadurch gekennzeichnet, dass vor dem Bilden von Zei­ chenmittenabständen aufeinanderfolgender Zeichen Grauwerte unterhalb eines jeweiligen Schwellenwertes auf 0 gesetzt wer­ den, wobei die Schwellenwerte jeweils zeilenweise abhängig von einem maximalen, in horizontaler Richtung ermittelten Grauwert gebildet werden, wodurch sich eine Schattenbildung der Zeichen durchführen läßt. An advantageous embodiment of the inventive method rens is characterized in that before Zei center distances of consecutive characters gray values below a respective threshold value to 0 who the, the threshold values depending line by line from a maximum determined in the horizontal direction Gray value are formed, which creates a shadow who has characters carried out.  

Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Verfah­ rens ist dadurch gekennzeichnet, dass die Scanngeschwindig­ keitswerte aus den Mittenabständen aufeinanderfolgender Zei­ chen mittels einer Mehrheitssuche bestimmt werden. Durch die Mehrheitssuche lassen sich Verfälschungen aufgrund von Unter­ brechungen im Zeichen oder bei Zeichen ohne Weißlücke vermei­ den.An advantageous embodiment of the inventive method rens is characterized in that the scanning speed values from the center distances of consecutive times be determined by means of a majority search. Through the Majority search can be falsifications due to sub Avoid refractions in characters or for characters without white gaps the.

Eine vorteilhafte Ausgestaltung des erfindungsgemäßen Verfah­ rens ist dadurch gekennzeichnet, dass bei der Ermittlung der Scanngeschwindigkeiten die Steigungsmaße der Schwarz-weiß- beziehungsweise Weiß-schwarz-Übergänge der Zeichenteile in horizontaler Richtung ermittelt werden. Hierdurch werden Stö­ rungen bei der Ermittlung der Zeichenteilung bei verstümmel­ ten Zeichen mit irrelevanten Zeichenzwischenräumen vermieden.An advantageous embodiment of the inventive method rens is characterized in that when determining the Scan speeds the pitch dimensions of the black and white or white-black transitions of the drawing parts in horizontal direction can be determined. As a result, interference in the determination of the character division in mutilated Avoid characters with irrelevant spaces between characters.

Ausführungsbeispiele der Erfindung ergeben sich aus der vor­ liegenden Beschreibung der beiliegenden Zeichnungen, in denen zeigt:Embodiments of the invention result from the front enclosed description of the accompanying drawings, in which shows:

Fig. 1 Rohbilddaten nach der Abtastung mit einem handgeführ­ ten Scanner; Fig. 1 raw image data after scanning with a hand-held scanner;

Fig. 2 die entzerrten Bilddaten; Fig. 2 is the equalized image data;

Fig. 3 die Grauwertverteilung der Zeile 28 aus Fig. 1; Fig. 3, the gray value distribution of the line 28 of Fig. 1;

Fig. 4 die Grauwertverteilung der Zeilen 27, 28 und 29 eines Ausschnittes aus Fig. 1; Fig. 4, the gray value distribution of the lines 27, 28 and 29 a detail from FIG. 1;

Fig. 5 eine Darstellung der Grauwertstützpunktverteilung; Fig. 5 is an illustration of the gray value distribution base;

Fig. 6 ein Flussdiagramm des erfindungsgemäßen Verfahrens. Fig. 6 is a flow diagram of the method according to the invention.

Im Folgenden wird die Erfindung detailliert anhand einer be­ vorzugten Ausführungsform beschrieben.In the following the invention will be described in detail with reference to a preferred embodiment described.

Erfindungsgemäß werden OCR-Zeichen optisch abgetastet, die so erhaltenen Videodaten komprimiert, die Zwischenräume der OCR- Zeichen aufgefunden und der Abstand zweier Zeichen ermittelt, um dadurch ein Maß für die aktuelle Zeichenteilung zu bekom­ men. Die Kompression der Videodaten ist nicht nötig, aber sinnvoll, da bei langsamem Scannen sehr große Datenmengen entstehen können und damit viel Speicher und Rechenzeit benö­ tigt wird. Bei der Dekomprimierung der Videodaten wird die Zeichenteilung strichgenau berücksichtigt. Die Soll-Zeichen­ teilung für gängige OCR-Normschriften beträgt im Normalfall zehn Zeichen pro Zoll. Auf diese Zeichenteilung werden die Zeichen normiert.According to the invention, OCR characters are scanned optically received video data compressed, the spaces of the OCR Characters found and the distance between two characters determined,  to get a measure of the current character division men. The compression of the video data is not necessary, however makes sense because very large amounts of data are involved in slow scanning can arise and thus require a lot of memory and computing time is done. When decompressing the video data, the The division of characters is taken into account precisely. The debit sign The division for common OCR standard fonts is normally ten characters per inch. On this division of characters the Characters standardized.

In manchen Fällen kann es bei Zeichen vorkommen, dass sie in horizontaler Richtung Unterbrechungen haben, so dass ein ir­ relevanter Zeichenzwischenraum erkannt wird. Diese Zwischen­ räume können zu einer falschen Zeichenteilung führen. Aus diesem Grund wird in der erfindungsgemäßen Ausführungsform ein zweiter Algorithmus angewendet, der die Scanngeschwindig­ keit von Zeichen näherungsweise ermittelt. Das Ergebnis dient dazu, herauszufinden, ob bzw. welche Zeichenteilung plausibel ist.In some cases, characters may appear in horizontal interruptions, so that an ir relevant space between characters is recognized. This intermediate spaces can lead to incorrect character division. Out this is why in the embodiment of the invention a second algorithm is applied which makes the scanning speed approximation of characters. The result serves to find out whether or which character division is plausible is.

Der zweite Algorithmus betrachtet den Weiß-Schwarz- bzw. den Schwarz-Weiß-Übergang einer Linie eines Zeichens in horizon­ taler Richtung. In der Zeichenzeile werden relevante Zeichen­ teile von Zeichen gesucht. Relevant sind Zeichenteile, wenn sie größer als zwei Zeichenpixel breit sind und von einem Zeichen mit einer annähernd senkrechten Zeichenkante stammen. Hierfür werden die Nachbarpixel in vertikaler Richtung unter­ sucht. Wenn ein derartig relevanter Zeichenteil vorliegt, kann die Länge des "Graukeils" am Weiß-Schwarz- bzw. Schwarz- Weiß-Übergang, nämlich die Unschärfe der Kante, ein Maß für die Abtastgeschwindigkeit geben. Hierfür ist es erforderlich, dass die Videodaten nicht binarisiert, sondern Grauwerte ent­ halten. The second algorithm looks at the white-black or the Black and white transition of a line of a sign into horizon valley direction. Relevant characters appear in the character line parts of characters wanted. Parts of the drawing are relevant if they are larger than two character pixels wide and one Characters come with an approximately vertical character edge. For this purpose, the neighboring pixels are under in the vertical direction is looking for. If there is such a relevant part of the drawing, can the length of the "gray wedge" on the white-black or black White transition, namely the blur of the edge, a measure of give the scanning speed. For this it is necessary that the video data is not binarized, but gray values hold.  

Am Ende entsteht eine geschwindigkeitskorrigierte und somit entzerrte Zeichenzeile. Diese Zeichenzeile kann nun einer OCR-Zwischenerkennung zugeführt werden, die die Bilddaten in Textdaten umwandelt.In the end, a speed-corrected and thus arises equalized character line. This line of characters can now be one OCR intermediate recognition are supplied, which the image data in Converts text data.

Entsprechend einer bevorzugten Ausführungsform führt die er­ findungsgemäße Bildaufnahmevorrichtung folgende Verarbei­ tungsprozedur durch. Zunächst wird mit einer Aufnahmevorrich­ tung eine Zeichenzeile abgescannt. Das Ergebnis dieses Scann­ vorgangs ist in Fig. 1 gezeigt. Durch die unterschiedlich schnelle Bewegung der Aufnahmevorrichtung über die Zeichen­ zeile entsteht eine Verzerrung der einzelnen Zeichen. Diese Verzerrung erschwert es den gängigen OCR-Programmen die abge­ tastete Zeichenzeile in Text umzuwandeln.In accordance with a preferred embodiment, the image recording device according to the invention carries out the following processing procedure. First, a line of characters is scanned with a recording device. The result of this scanning process is shown in Fig. 1. The movement of the recording device across the line of characters causes the individual characters to be distorted. This distortion makes it difficult for conventional OCR programs to convert the scanned character line into text.

Das erfindungsgemäße Verfahren zur Aufnahme von Bilddaten wird im Folgenden anhand des in Fig. 6 dargestellten Fluss­ diagramms detailliert erläutert.The method according to the invention for recording image data is explained in detail below with reference to the flow diagram shown in FIG. 6.

Mittels der in Fig. 6 dargestellten Programmabfolge werden die eingelesenen Videodaten komprimiert und in das SRAM einer Zeichenerkennungseinheit für Grauwert-Videodaten mit 6 Bit Grauwerten abgespeichert. Nachdem der Beleg gescannt wurde, werden die komprimierten Daten dekomprimiert und geschwindig­ keitskorrigiert in den Bildspeicher abgespeichert und von dort wieder in das SRAM als sogenannte Tapete abgespeichert. Nachdem die Tapete wieder in den Bildspeicher übertragen wur­ de, kann das Programm zur Zeichenerkennung durchgeführt wer­ den.By means of the program sequence shown in Fig. 6 is compressed, the read video data and stored in the SRAM of a character recognition unit for gray level video data of 6 bit gray values. After the receipt has been scanned, the compressed data is decompressed and speed-corrected and stored in the image memory and from there again in the SRAM as so-called wallpaper. After the wallpaper has been transferred back to the image memory, the character recognition program can be carried out.

Gemäß Fig. 6 läuft das beim handgeführten Lesen der Bildda­ ten verwendete Programm folgendermaßen ab:According to FIG. 6, the program used for hand-held reading of the image data runs as follows:

Zunächst wird mittels eines Programms 200 ein Programm 202 zur Bildung von Stützpunkten für die komprimierte Tapete initialisiert. Bei Durchführung des Programms 200 wird ein SRAM-Puffer aufgebaut. In diesem Puffer werden die Daten von 64 Zeilen abgespeichert. Pro Zeile gibt es vier Werte: Spal­ tenadresse, Weißwert, letzter abgespeicherter Grauwert und Status.First of all, a program 202 for forming support points for the compressed wallpaper is initialized using a program 200 . When program 200 is executed, an SRAM buffer is built up. The data of 64 lines are stored in this buffer. There are four values per line: column address, white value, last saved gray value and status.

Die Hardware arbeitet im Transparentmodus, das heißt, die Grauwerte des Scanners werden unverfälscht in die Zeichener­ kennungseinheit für Grauwert-Videodaten eingetragen. Der Weißwert wird aus den ersten 32 Pixeln der jeweiligen Zeile gebildet, indem der weißeste Wert gesucht wird. Der Status ist am Anfang Null.The hardware works in transparent mode, that is, the Gray values of the scanner are falsified in the drawing Identifier unit for gray scale video data entered. The The first 32 pixels of the respective line become white formed by looking for the whitest value. The status is zero at the beginning.

Nach dieser Initialisierung des SRAM-Puffers werden die Spal­ tenadressen und die Zeilenadressen der Pixel der Anfangsspal­ te in den Puffer eingetragen. Dies sind Pixel von 64 Zeilen. Am Ende einer Spalte wird ein Zeilenendecode (0xc000) und die Zeilenadresse des letzten Pixels eingetragen.After this initialization of the SRAM buffer, the Spal tenadressen and the row addresses of the pixels of the start column te entered in the buffer. These are pixels of 64 lines. At the end of a column there is an end of line code (0xc000) and the Row address of the last pixel entered.

Anschließend wird das Programm 202 zur Bildung der Stützpunk­ te für die komprimierte Tapete durchgeführt. Hierbei werden pro Spalte die Pixel von Zeile 0 bis Zeile 63 untersucht, ob sie in horizontaler Richtung rechts Grauwertdifferenzen von größer als 3 in Bezug auf den Weißwert aufweisen. Ist das nicht der Fall, wird das nächste Pixel (die nächste Zeile) in horizontaler Richtung untersucht.The program 202 for forming the bases for the compressed wallpaper is then carried out. The pixels from row 0 to row 63 are examined for each column to determine whether they have gray value differences of greater than 3 in relation to the white value in the horizontal direction on the right. If this is not the case, the next pixel (the next line) is examined in the horizontal direction.

Ist die jeweilige Grauwertdifferenz größer als 3, wird in der vorherigen Zeile (n - 1) der Status 1 gesetzt. Mit der nächsten Spalte wird dieses Pixel (Grauwertstützpunkt) dann in den Speicher SRAMZ mit der Spaltenadresse und Zeilenadresse abge­ speichert. In der entsprechenden Zeile im Puffer WEZ wird der Status 8 eingetragen. Diese Zeile wird nun spaltenweise ver­ folgt. In den SRAMZ-Puffer wird immer dann ein Pixel mit Spaltenadresse und Zeilenadresse übertragen, wenn die Grauwertdifferenz größer als 3 wird oder wenn ein Umkehrpunkt vorhanden ist (weiß, schwarz, weiß oder schwarz, weiß, schwarz). Erreicht ein Grauwert bis auf 3 Grauwertstufen den Weißwert, wird der Status auf 4 gesetzt. Mit der nächsten Spalte wird das Pixel nach FRAMZ übertragen und der Status in dieser Zeile wird auf 0 gesetzt. Jetzt wird eine neue Grau­ wertdifferenz gesucht.If the respective gray value difference is greater than 3, the previous line (n - 1) set status 1. With the next one This pixel (gray value base) is then in the column Storage SRAMZ with the column address and row address saves. In the corresponding line in the WEZ buffer, the Status 8 entered. This row is now verded in columns follows. A pixel is then always added to the SRAMZ buffer Column address and row address transmitted when the gray value difference  becomes greater than 3 or if a reversal point is present (white, black, white or black, white, black). Reaches a gray value down to 3 gray value levels White value, the status is set to 4. With the next one Column, the pixel is transferred to FRAMZ and the status in this line is set to 0. Now there is a new gray value difference sought.

So wie mit dieser Zeile wird mit allen Zeilen verfahren.The same procedure is used for all lines.

In Zeile 63 ist das Spaltenende erreicht. In den Speicher SRAMZ wird der Zeilenendecode 0xc000 eingetragen. Es werden so viele Spalten abgearbeitet, wie im Bildspeicher vorhanden sind. Die Bilddaten werden vom Programm 204 in das SRAM ein­ getragen. Liegen keine Bilddaten mehr vor, wird das Programm 202 verlassen und das Programm 204 aufgerufen.Line 63 has reached the end of the column. The line end code 0xc000 is entered in the memory SRAMZ. As many columns are processed as there are in the image memory. The image data is entered into the SRAM by the program 204 . If there is no more image data, program 202 is exited and program 204 is called.

Das Programm 204 dient zum Abspeichern der Grauwerte von den Stützpunkten. Hierbei werden die Adressen der Pixel aus dem Puffer SRAMZ geholt und die Pixel im Bildspeicher adressiert. Die ausgelesenen Grauwerte (Byte) werden wortweise verpackt und in den Puffer WEZ (gleicher Name, neuer Puffer) in das SRAM eingetragen. Am Anfang einer Spalte wird die Spaltena­ dresse und am Ende einer Spalte der Zeilenendecode (0xc000) ins SRAM eingetragen.The program 204 is used to store the gray values from the base points. The addresses of the pixels are fetched from the SRAMZ buffer and the pixels in the image memory are addressed. The read gray values (bytes) are packed word by word and entered in the buffer WEZ (same name, new buffer) in the SRAM. The column address is entered at the beginning of a column and the end of line code (0xc000) is entered in the SRAM at the end of a column.

Sind alle bisher gescannten Pixel im SRAM, wird untersucht, ob der Beleg noch vorliegt (Belegimpulsbildung). Ist dies der Fall, wird die Anzahl der Spalten berechnet, die der Ein­ schreibzähler inzwischen in den Bildspeicher geschrieben hat. Diese Anzahl wird dem Programm 202 mitgeteilt, welches wieder aufgerufen wird. If all previously scanned pixels are in the SRAM, it is checked whether the receipt is still present (receipt impulse formation). If this is the case, the number of columns is calculated which the write-in counter has meanwhile written into the image memory. This number is communicated to the program 202 , which is called again.

Liegt kein Beleg mehr vor, wird die Schleife verlassen, und das Programm 206 wird aufgerufen. In dem Puffer WEZ liegen jetzt die komprimierten Bilddaten.If there is no more document, the loop is exited and program 206 is called. The compressed image data are now in the buffer WEZ.

Das Programm 206 dient zum Suchen der gedruckten Zeile inner­ halb der gesamten Tapete. Es ermittelt die Oberkante und die Unterkante der gesamten Zeile. Eingangsdaten sind die kompri­ mierten Bilddaten aus dem Puffer WEZ. Das Programm 206 findet die relevanten Pixel, die zu einer Zeile gehören. Es addiert in jeder Zeile die Differenz der Grauwert-Stützpunkte zwi­ schen minimalem und maximalem Grauwert. Mit einer dynamisch einstellbaren Schwelle wird am Ende die obere und untere Kan­ te der Zeile gefunden.Program 206 is used to find the printed line within the entire wallpaper. It determines the top and bottom of the entire line. Input data are the compressed image data from the buffer WEZ. Program 206 finds the relevant pixels belonging to a line. In each line, it adds up the difference between the gray value interpolation points between the minimum and maximum gray value. With a dynamically adjustable threshold, the upper and lower edge of the line is found at the end.

Das Programm 208 dient zum Holen abgespeicherter Grauwerte und zur Schattenbildung von Zeichen. Hierbei wird der vom Programm 206 ausgegebene Bereich ermittelt, pro Spalte der maximale Grauwert bestimmt und für diese Spalte abgespei­ chert. Hierbei handelt es sich um die Grauwerte der kompri­ mierten Bilddaten. Parallel dazu wird pro Zeile eine Schwelle gebildet, die abhängig von einem maximalen Grauwert ist, der in horizontaler Richtung gebildet wird. Diese Schwelle wird nach jeder Spalte in jeder Zeile um zwei Grauwertstufen de­ krementiert (schwarz = 3f, weiß = 0). Mit der nächsten Spalte kann ein neuer Grauwert (Grauwertstützpunkt) in dieser Zeile vorhanden sein. Der neue wird mit dem alten verglichen, der größere wird abgespeichert. Der Maximalwert der Schwelle be­ trägt 15, der Minimalwert 4. Liegt der Grauwert unterhalb der ermittelten Schwelle, wird er auf 0 gesetzt. Diese neuen Grauwerte werden in das SRAM geschrieben (neuer Puffer REZ).The program 208 is used to fetch stored gray values and to shade characters. The area output by the program 206 is determined, the maximum gray value per column is determined and stored for this column. These are the gray values of the compressed image data. In parallel, a threshold is formed for each line, which is dependent on a maximum gray value that is formed in the horizontal direction. After each column, this threshold is decremented by two gray value levels in each row (black = 3f, white = 0). With the next column there can be a new gray value (gray value base) in this line. The new one is compared with the old one, the larger one is saved. The maximum value of the threshold is 15, the minimum value 4. If the gray value is below the determined threshold, it is set to 0. These new gray values are written into the SRAM (new buffer REZ).

Anschließend wird das Programm 210 durchgeführt, mittels dem die Zeichenmittenstände von Zeichen ermittelt werden. Aus dem SRAM-Puffer (REZ) werden die Spaltenadressen und maximalen Grauwerte ausgelesen und entsprechende Segmente gebildet. Je nach Größe des maximalen Grauwerts eines Zeichens (Zeichen­ segments) werden bis zu 3 Weißspalten zwischen den Zeichen­ segmenten zugelassen, so dass ein Zeichen aus mehreren Seg­ menten bestehen kann. Bei sehr schwach gedruckten Zeichen kommen häufig Unterbrechungen innerhalb des Zeichens vor. Von dem gegebenenfalls zusammengesetzten Zeichen wird die Zei­ chenmitte berechnet. Die Zeichenmittenadresse und die Zei­ chenbreite werden in den SRAM-Puffer (WEZ) eingetragen. Das Dateiende wird mit 0xffff gekennzeichnet.Subsequently, the program 210 is carried out, by means of which the middle positions of characters are determined. The column addresses and maximum gray values are read out from the SRAM buffer (REZ) and corresponding segments are formed. Depending on the size of the maximum gray value of a character (character segments), up to 3 white columns are allowed between the character segments, so that a character can consist of several segments. In the case of very weakly printed characters, there are often breaks within the character. The middle of the character is calculated from the possibly composed character. The character center address and the character width are entered in the SRAM buffer (WEZ). The end of the file is marked with 0xffff.

Anschließend wird aus den Daten des Puffers (WEZ) der Zei­ chenabstand zweier Zeichen ermittelt und an die Stelle der Zeichenbreite wieder in den Puffer (WEZ) eingetragen. Zuvor wird noch überprüft, ob eine größere Weißlücke zwischen den Zeichen besteht. Hierzu wird von dem Zeichenabstand die vier­ fache Zeichenbreite subtrahiert. Ist der verbleibende Abstand größer als 32, liegt eine größere Weißlücke vor. Im Zeichen­ abstand (später = V-Wert) wird das höchste Bit 1 gesetzt. Der V-Wert ist ein Maß für die Geschwindigkeit des Belegs. Ist der V-Wert 1,0, liegt die Normgeschwindigkeit vor. Das es sich um handgeführtes Lesen handelt, kann die Beleggeschwin­ digkeit variieren. Wenn also eine größere Zeichenlücke vor­ handen ist, muss nach dieser Lücke die Geschwindigkeit neu berechnet werden. Dies wird mittels der Programme 212 und 214 durchgeführt, die dieses Bit abfragt.The character spacing of two characters is then determined from the data in the buffer (WEZ) and entered in the buffer (WEZ) instead of the character width. Before that, it is checked whether there is a larger white gap between the characters. For this purpose, four times the character width is subtracted from the character spacing. If the remaining distance is greater than 32, there is a larger white gap. The highest bit 1 is set in the character spacing (later = V value). The V-value is a measure of the speed of the document. If the V value is 1.0, the standard speed is present. The document speed can vary because it is hand-guided reading. If there is a larger character gap, the speed must be recalculated after this gap. This is done by means of programs 212 and 214 , which queries this bit.

Das Programm 212 ermittelt die V-Werte (a und b) für die er­ sten maximal 8 Werte. Der V-Wert (a) entspricht genau dem Mittenabstand zweier benachbarter Zeichen. Ist dieser Abstand 16 Spalten groß, dann liegt die Normgeschwindigkeit vor. Bei 10 Zeichen/Zoll und 160 Micrometer Pixelauflösung beträgt der Zeichenabstand 16 Spalten. Parallel dazu wird das höchste Bit des V-Wertes abgefragt. Ist dieses 1, wird die Bearbeitung beendet und Programm 214 wird aufgerufen. Es wird erst bei dem nächsten Aufruf dieses Programms 212 fortgefahren. Die Programme 212 und 214 werden in einer Schleife solange aufge­ rufen, bis der Endecode 0xffff kommt.The program 212 determines the V values (a and b) for the first maximum of 8 values. The V-value (a) corresponds exactly to the center distance between two adjacent characters. If this distance is 16 columns, then the standard speed is available. With 10 characters / inch and 160 micron pixel resolution, the character spacing is 16 columns. In parallel, the highest bit of the V-value is queried. If this is 1, processing is ended and program 214 is called. It is not continued until the next call to this program 212 . Programs 212 and 214 are called in a loop until the end code 0xffff comes.

Die V-Werte (a) können durch Unterbrechungen im Zeichen oder bei Zeichen ohne Weißlücke stark verfälscht sein. Deshalb wird eine Mehrheitssuche unter den ersten 8 Werten durchge­ führt. Die Zeichenabstände, die am häufigsten vorkommen, be­ stimmen den V-Wert der anderen. Die Häufigkeitsverteilung wird mittels Histogramm ermittelt. Die ermittelten V-Werte werden in den Puffer (WEZ) eingetragen.The V-values (a) can be interrupted in the character or be heavily falsified for characters without a white gap. Therefore a majority search is carried out among the first 8 values leads. The character spacings that occur most frequently are agree the V-value of the others. The frequency distribution is determined using a histogram. The determined V values are entered in the buffer (WEZ).

In Fällen, bei denen Zeichen verstümmelt sind, kann es zu er­ heblichen Störungen bei der Ermittlung der Zeichenteilung kommen, so dass keine eindeutige Entscheidung für einen V- Wert getroffen werden kann. Fehlt zum Beispiel bei einer "0" oben und unten der Querstrich, dann ist der V-Wert für dieses Zeichen um den Faktor 2 zu klein. Bei etwa Normgeschwindig­ keit kann der V-Wert mit Hilfe der Plausibilität korrigiert werden. Wird aber erheblich langsamer als Normgeschwindigkeit gescannt, dann kann auf diese Art der V-Wert nicht mehr kor­ rigiert werden. In diesem Falle werden die Weiß-schwarz- bzw. Schwarz-weiß-Übergänge des Zeichens näher untersucht. Es wer­ den drei unmittelbar übereinander liegende Pixelzeilen in der entsprechenden Spalte betrachtet (siehe Fig. 4). Haben die drei Pixelzeilen annähernd den gleichen Kurvenverlauf und ist die Grauwertdifferenz zwischen dem hellsten und dunkelsten Pixel größer als 15, dann wird ein Steigungsmaß bei jedem Weiß-schwarz-/Schwarz-weiß-Übergang von jeder Zeile ermit­ telt.In cases where characters are garbled, there can be considerable disruptions in the determination of the character division, so that a clear decision for a V value cannot be made. For example, if there is no "0" at the top and bottom of the slash, the V-value for this character is too small by a factor of 2. At about standard speed, the V-value can be corrected using the plausibility. However, if the scanning speed is considerably slower than the standard speed, the V-value can no longer be corrected in this way. In this case, the white-black or black-white transitions of the character are examined in more detail. The three rows of pixels lying directly above one another are viewed in the corresponding column (see FIG. 4). If the three pixel lines have approximately the same curve shape and the gray value difference between the brightest and darkest pixels is greater than 15, then a slope is determined for each white-black / black-white transition from each line.

Dies wird folgendermaßen durchgeführt.This is done as follows.

In Fig. 1 sind die original gescannten Grauwertbilddaten ab­ gebildet. Man sieht, dass die Zeile am Anfang erheblich lang­ samer als am Ende des Belegs gescannt wurde. The original scanned gray-scale image data are shown in FIG. 1. You can see that the line was scanned much longer at the beginning than at the end of the document.

Gemäß Fig. 3 wurde beispielhaft eine Zeile (Zeile 28) her­ ausgegriffen. Die Bilddaten sind so aufgebaut, dass links die Spalte 0 und oben die Zeile 0 ist. Gemäß Fig. 3 ist von der Zeile 28 die Grauwertverteilung dargestellt. Man erkennt, wie sich die Steilheit der Flanke abhängig von der Scanngeschwin­ digkeit verändert. Als erstes wird der Beginn einer Flanke gesucht. Es wird der Weißwert des Belegs ermittelt. Mittels einer Schwelle kann das Pixel gefunden werden, das über die­ ser Schwelle liegt. Jetzt wird von Pixel zu Pixel die Diffe­ renz (d) berechnet und gespeichert, bis die Differenz wieder einen Schwellenwert unterschreitet oder die Polarität wech­ selt. Aus den Differenzen D1 bis Dn wird der maximale Wert dmax ermittelt. Nun wird ein Wert f nach folgender Formel be­ rechnet.According to Fig. 3 is a line (line 28) here has been attacked by way of example. The image data is structured so that column 0 is on the left and row 0 is at the top. Referring to FIG. 3, the gray value distribution is shown by the Line 28. You can see how the slope of the flank changes depending on the scanning speed. The first thing to look for is the start of an edge. The white value of the document is determined. The pixel that lies above this threshold can be found by means of a threshold. Now the difference (d) is calculated from pixel to pixel and stored until the difference again falls below a threshold value or the polarity changes. The maximum value dmax is determined from the differences D1 to Dn. Now a value f is calculated using the following formula.

Die Wert wird nun über eine Tabelle korrigiert, und man er­ hält den V-Wert (b).The value is now corrected using a table, and you holds the V-value (b).

Beispielexample

Zeichen 1: f = 3, 4 Korrekturtabelle ergibt 2,37 = V-Wert (b).
Zeichen 2: f = 2, 3 Korrekturtabelle ergibt 1,50 = V-Wert (b).
Zeichen 3: f = 1,5 Korrekturtabelle ergibt 1,00 = V-Wert (b) = Normgeschwindigkeit.
Character 1: f = 3, 4 correction table gives 2.37 = V value (b).
Character 2: f = 2, 3 correction table gives 1.50 = V-value (b).
Character 3: f = 1.5 correction table results in 1.00 = V value (b) = standard speed.

Hierbei bedeutet zum Beispiel ein V-Wert von 2,37, dass das Zeichen um diesen Faktor in horizontaler Richtung verkleinert werden muss. Bei einem V-Wert = 1 wird das Zeichen nicht ver­ ändert. Here, for example, a V-value of 2.37 means that the Characters reduced by this factor in the horizontal direction must become. With a V value = 1, the character is not used changes.  

Anschließend wird noch eine Wertbildung der V-Werte von drei unmittelbar untereinander liegenden Zeilen durchgeführt. Die­ ser V-Wert (b) ist ein Maß für die Scanngeschwindigkeit. Der V-Wert (b) wird jetzt mit dem V-Wert (a) verglichen. Weicht der V-Wert (b) mehr als 50% vom V-Wert (a) ab, dann wird der V-Wert (b) für den V-Wert eingesetzt.Then there is a value formation of the V values of three lines immediately below each other. The This V-value (b) is a measure of the scanning speed. The V-value (b) is now compared with V-value (a). Gives way the V-value (b) more than 50% from the V-value (a), then the V-value (b) used for the V-value.

Anschließend wird das Programm 214 zur Glättung der V-Werte und zum Abspeichern der Scanngeschwindigkeit in das SRAM durchgeführt. Hierbei wird der Mittelwert von 4 V-Werten ge­ bildet. Die letzten drei V-Werte (Belegende) bekommen den Wert des zuletzt ermittelten V-Wertes. Bei der Glättung wird vorher abgefragt, ob der nächste Wert einen zu großen Abstand zum vorhergehenden hat. Ist dies der Fall, wird er gleich dem vorhergehenden gesetzt, da eine zu große Abweichung der Ge­ schwindigkeit von Zeichen zu Zeichen nicht vorkommen kann.Subsequently, the program 214 for smoothing the V values and for storing the scanning speed in the SRAM is carried out. Here, the average of 4 V values is formed. The last three V-values (end of document) get the value of the last determined V-value. During smoothing, you are asked whether the next value is too far apart from the previous one. If this is the case, it is set equal to the previous one, since an excessive deviation in the speed from character to character cannot occur.

Ist bei einem V-Wert das höchste Bit 1, so wird dieser V-Wert noch überschrieben, und Programm 212 wird aufgerufen. Mit den Endcode 0xffff wird die Schleife verlassen. Anschließend wird Programm 216 aufgerufen.If the highest bit is 1 for a V value, this V value is still overwritten and program 212 is called. The loop is exited with the end code 0xffff. Program 216 is then called.

Mittels Programm 216 wird der ermittelte V-Wert in die "kom­ primierte Tapete" (Puffer REZ) eingetragen. In Puffer WEZ be­ findet sich die Spaltenmittenadresse der Zeichen und der V- Werte.The determined V-value is entered into the "compressed wallpaper" (buffer REZ) by means of program 216 . The column center address of the characters and the V values are in the buffer WEZ.

Dies wird folgendermaßen durchgeführt:This is done as follows:

Im RAM Puffer REZ und WEZ sind jeweils die Spaltenadressen am Anfang einer Spalte abgespeichert. Die Spaltenadressen laufen syncron zueinander. Es wird nun die Spaltenadresse 1 des Puf­ fers REZ als Startadresse genommen und die V-Wert aufaddiert. Da es sich um eine komprimierte Tapete handelt, muss nicht notwendigerweise eine Spaltenadresse 2 existieren. Ist die nächste Spaltenadresse zum Beispiel 5, dann muss der V-Wert n-mal auf die Spaltenadresse 1 addiert werden. Mit jeder Ad­ dition wird eine fortlaufende Adresse inkrementiert. Während der Addition wird die neue Spaltenadresse mit der im Puffer WEZ verglichen. Ist die neue Spaltenadresse ganzzahlig größer als die Puffer WEZ, wird die fortlaufende Adresse als neue Adresse in REZ übernommen.The column addresses are in the RAM buffer REZ and WEZ Saved at the beginning of a column. The column addresses are running in sync with each other. Now the column address 1 of the puf he REZ taken as the start address and the V-value added. Since it is a compressed wallpaper, it does not have to necessarily a column address 2 exist. Is the  next column address for example 5, then the V value can be added n times to column address 1. With every ad a consecutive address is incremented. While the new column address with the one in the buffer WEZ compared. The new column address is an integer larger as the WEZ buffers, the consecutive address becomes the new one Address adopted in REZ.

Die Beleggeschwindigkeit kann schneller, gleich oder langsa­ mer als die Sollgeschwindigkeit sein. Ist sie schneller, wer­ den die Bilddaten gespreizt. Ist die Beleggeschwindigkeit lang, werden die Bilddaten gestaucht, und entspricht die Be­ leggeschwindigkeit der Normgeschwindigkeit, dann verändern sich die Bilddaten nicht.The document speed can be faster, the same or slow mer than the target speed. Is she faster who which the image data spread. Is the document speed long, the image data is compressed and corresponds to the loading Leg speed of the standard speed, then change the image data is not.

Alle Programme 206 bis 216 wurden auf den komprimierten Bild­ daten durchgeführt. Das Programm 218 dient zur Initialisie­ rung des Programms 120, welches die komprimierte Tapete wie­ der dekomprimiert.All programs 206 through 216 were performed on the compressed image data. The program 218 serves to initialize the program 120 , which decompresses the compressed wallpaper like that.

Außerdem speichert das Programm 220 die dekomprimierte Tapete im Bildspeicher ab.In addition, program 220 stores the decompressed wallpaper in the image memory.

Hierbei werden Spalte für Spalte die im Puffer REZ abgespei­ cherten Grauwertstützpunkte zeilenweise miteinander verbunden und im Bildspeicher abgespeichert. Hierbei werden der Spal­ tenabstand zwischen den Grauwertpixeln und die Höhe der Grau­ werte berücksichtigt, so dass es unterschiedliche Grauwert­ keile in horizontaler Richtung gibt. Auf diese Weise entsteht ein in horizontaler Richtung korrigiertes Bild im Bildspei­ cher, das zur Zeichenerkennung verwendet wird.Column by column are saved in the REZ buffer secured gray value interpolation points connected in rows and stored in the image memory. Here the Spal distance between the gray value pixels and the height of the gray values taken into account so that there are different gray values wedges in the horizontal direction. In this way it is created an image corrected in the horizontal direction in the image file used for character recognition.

Das Programm 222 überträgt die Bilddaten des Bildspeichers in den FRAM Puffer (neuer WEZ). Hier liegen nach Beendigung der Bearbeitung des Scannvorgangs die endgültigen Bilddaten (sie­ he Fig. 2).Program 222 transfers the image data from the image memory into the FRAM buffer (new GMT). After the processing of the scanning process has ended, the final image data are located here (see FIG. 2).

Da der Bildspeicher nur 64 Spalten groß ist, zur Rekonstruk­ tion der Bilddaten aus der komprimierten Tapete aber etwa 30 Spalten benötigt werden, muss nach 32 Spalten die Hälfte des Bildspeichers in das SRAM abgespeichert werden. Das Programm 220 kann dann den Bildspeicher wieder laden.Since the image memory is only 64 columns in size, but about 30 columns are required to reconstruct the image data from the compressed wallpaper, half of the image memory must be saved in the SRAM after 32 columns. The program 220 can then reload the image memory.

Die Schleife aus den Programmen 220 und 222 wird solange durchgeführt, bis keine Daten mehr im SRAM-Puffer REZ vorhan­ den sind.The loop from programs 220 and 222 is carried out until there is no more data in the SRAM buffer REZ.

Danach wird die Zeichenerkennungssoftware 224 aufgerufen. Bei der Ermittlung der Scanngeschwindigkeitswerte ist die Er­ mittlung der Steigungsmaße bei jedem der Weiß-schwarz- bezie­ hungsweise Schwarz-weiß-Übergänge jeder Zeile nur dann erfor­ derlich, wenn bei der Ermittlung der Scanngeschwindigkeits­ werte über den Mittenabstand zweier benachbarter Zeichen Un­ sicherheiten in der Zeichenteilung bestehen. Dies kann der Fall sein, wenn Zeichen unterbrochen sind oder es keine Weiß­ lücke zwischen den Zeichen gibt. Bei Proportionalschriften sollte die Ermittlung der Scanngeschwindigkeiten über Stei­ gungsmaße der Übergänge generell erfolgen, da bei diesen Schriften die Zeichenteilung nicht konstant ist. Eine exakte Geschwindigkeitskorrektur ist bei Proportionalschriften nicht notwendig, da die Zeichen ohnehin unterschiedlich breit sind, und die ein Problem darstellt, welches durch die Zeichener­ kennung gelöst werden muss.The character recognition software 224 is then called up. When determining the scan speed values, it is only necessary to determine the slope dimensions for each of the white-black or black-white transitions of each line if, when determining the scan speed values over the center distance of two adjacent characters, uncertainties in the character division consist. This can be the case if characters are interrupted or there is no white gap between the characters. In the case of proportional fonts, the scanning speeds should generally be determined using the pitch of the transitions, since the character division is not constant in these fonts. An exact speed correction is not necessary for proportional fonts, since the characters are of different widths anyway, and this represents a problem that has to be solved by character recognition.

Obwohl die Erfindung anhand einer bevorzugten Ausführungsform beschrieben wurde, ist klar zu verstehen, dass sie hierauf nicht beschränkt ist. Die Einrichtung eines SRAM-Puffers ist nicht zwingend notwendig, sondern vorteilhaft. Selbstver­ ständlich kann auch ein anderer Speicher verwendet werden, etwa ein DRAM oder ähnliches. Ebenso sind die in dem ausge­ führten Beispiel angegebenen Zahlenwerte abänderbar. So kön­ nen beispielsweise auch Scanner mit mehr als 64 Zeilen ver­ wendet werden.Although the invention is based on a preferred embodiment has been clearly understood that they are on it is not limited. The establishment of an SRAM buffer is not absolutely necessary, but advantageous. Self ver another memory can also be used,  such as a DRAM or the like. Likewise, they are out example given numerical values can be changed. So can for example, scanners with more than 64 lines be applied.

Claims (16)

1. Verfahren zur Aufnahme von Bilddaten einer Zeichenzeile, wobei eine Zeichenzeile einer Vorlage zum Lesen von Bilddaten abgetastet und die Bilddaten für eine OCR-Erkennung vorberei­ tet werden, dadurch gekennzeichnet, dass die Zei­ chenteilung beruhend auf den Bilddaten bestimmt wird.1. A method for recording image data of a character line, wherein a character line of a template is scanned for reading image data and the image data are prepared for OCR recognition, characterized in that the character division is determined based on the image data. 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Zei­ chenteilung aus dem Abstand aufeinanderfolgender Zeichen be­ stimmt wird.2. The method according to claim 1, characterized in that the Zei division from the spacing of consecutive characters is true. 3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass zusätz­ lich die Übergangsschärfe an den Zeichenkanten bestimmt wird, wobei die Übergangsschärfe zur Überprüfung der aus dem Zei­ chenabstand ermittelten Zeichenteilung dient.3. The method according to claim 2, characterized in that additional the transition sharpness at the edges of the drawing is determined, where the transition sharpness to check the from the Zei character spacing determined serves. 4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass die ge­ lesenen Bilddaten komprimiert werden.4. The method according to any one of claims 1 to 3, characterized in that the ge read image data are compressed. 5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass die kom­ primierten Bilddaten als Grauwerte in einem SRAM einer Zei­ chenerkennungseinheit für Grauwert-Videodaten abgespeichert werden.5. The method according to claim 4, characterized in that the com primed image data as gray values in a SRAM of a time Chen detection unit for gray scale video data stored become. 6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, das es die Schritte
  • - Komprimieren der eingelesenen Bilddaten und Speichern als Grauwerte in einem SRAM-Puffer
  • - Abspeichern von Grauwertstützpunkten zum Bilden einer komprimierten Tapete
  • - Bilden von Zeichenmittenabständen aufeinanderfolgender Zeichen
  • - Bilden von Scanngeschwindigkeitswerten und Eintragen dieser Scanngeschwindigkeitswerte in die komprimierte Tapete
  • - Dekomprimieren der komprimierten Tapete
umfasst.
6. The method according to any one of claims 1 to 5, characterized in that there are the steps
  • - Compression of the read image data and storage as gray values in an SRAM buffer
  • - Saving gray-scale bases to form a compressed wallpaper
  • - Forming character center distances of successive characters
  • - Forming scan speed values and entering these scan speed values in the compressed wallpaper
  • - Decompress the compressed wallpaper
includes.
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass beim Bilden der Grauwertstützpunkte die als Grauwerte abge­ speicherten Bilddaten zeilenweise unter Bildung von Grauwert­ differenzen zu einem für jede Zeile ermittelten Weißwert un­ tersucht werden, wobei bei Überschreiten einer vorbestimmten Grauwertdifferenz jeweils ein Grauwertstützpunkt in den SRAM- Puffer eingetragen wird.7. The method according to claim 6, characterized in that when forming the gray value support points, the saved image data line by line with formation of gray value differences to a white value determined for each line un be examined, when exceeding a predetermined Gray value difference each a gray value base in the SRAM Buffer is entered. 8. Verfahren nach Anspruch 6 oder 7, dadurch gekennzeichnet, dass vor dem Bilden von Zeichenmittenabständen aufeinanderfolgender Zei­ chen Grauwerte unterhalb eines jeweiligen Schwellenwertes auf 0 gesetzt werden, wobei die Schwellenwerte jeweils zeilenwei­ se abhängig von einem maximalen, in horizontaler Richtung er­ mittelten Grauwert gebildet werden.8. The method according to claim 6 or 7, characterized in that before Forming character center distances of consecutive times gray values below a respective threshold value 0 are set, with the threshold values line by line depending on a maximum, in the horizontal direction mean gray value are formed. 9. Verfahren nach einem der Ansprüche 6 bis 8, dadurch gekennzeichnet, dass die Scanngeschwindigkeitswerte aus den Mittenabständen aufeinan­ derfolgender Zeichen mittels einer Mehrheitssuche bestimmt werden.9. The method according to any one of claims 6 to 8,  characterized in that the Scanning speed values from the center distances the following characters are determined by means of a majority search become. 10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass bei der Ermittlung der Scanngeschwindigkeiten die Steigungsmaße der Schwarz-weiß- beziehungsweise Weiß-schwarz-Übergänge der je­ weiligen Zeichenteile in horizontaler Richtung ermittelt wer­ den.10. The method according to claim 9, characterized in that at the Determination of the scanning speeds the pitch dimensions of the Black-white or white-black transitions of each parts of the drawing determined in the horizontal direction the. 11. Bildaufnahmevorrichtung zur Aufnahme von Bilddaten einer Zeichenzeile mit
einer Aufnahmevorrichtung zur Abtastung einer Vorlage, um die Bilddaten einer Zeichenzeile zu lesen, und
einer Verarbeitungsvorrichtung, um unter Berücksichtigung ei­ ner tatsächlichen Zeichenzeile die Bilddaten für eine OCR- Erkennung vorzubereiten, um so verzerrungsfreie Bilddaten zu erhalten,
dadurch gekennzeichnet, dass die Ver­ arbeitungsvorrichtung ausgestattet ist, um die Zeichenteilung beruhend auf den Bilddaten zu bestimmen.
11. Image recording device for recording image data with a character line
a recording device for scanning an original to read the image data of a character line, and
a processing device for preparing the image data for OCR recognition, taking into account an actual character line, so as to obtain distortion-free image data,
characterized in that the processing device is equipped to determine the character division based on the image data.
12. Bildaufnahmevorrichtung nach Anspruch 11, dadurch gekennzeichnet, dass die Ver­ arbeitungsvorrichtung ausgestattet ist, um den Abstand zwi­ schen aufeinanderfolgenden Zeichen zu ermitteln und aus die­ sem Abstand die Zeichenteilung bestimmen.12. Image recording device according to claim 11, characterized in that the ver work device is equipped to the distance between to determine consecutive characters and from the This distance determine the character division. 13. Bildaufnahmevorrichtung nach Anspruch 11, dadurch gekennzeichnet, dass die Ver­ arbeitungsvorrichtung die Übergangsschärfe an den Zeichenkanten bestimmt, wobei die Übergangsschärfe ein Maß für die Zei­ chenteilung ist.13. Image recording device according to claim 11, characterized in that the ver working device the transition sharpness at the drawing edges  determined, the transition sharpness a measure of the time division is. 14. Vorrichtung nach Anspruch 12, dadurch gekennzeichnet, dass die Ver­ arbeitungsvorrichtung zusätzlich die Übergangsschärfe an den Zeichenkanten bestimmt, wobei die Übergangsschärfe zur Über­ prüfung der aus dem Zeichenabstand ermittelten Zeichenteilung dient.14. The apparatus according to claim 12, characterized in that the ver work device additionally the transition sharpness to the Character edges determined, the transition sharpness to the over Checking the character division determined from the character spacing serves. 15. Bildaufnahmevorrichtung nach Anspruch 11, dadurch gekennzeichnet, dass die Auf­ nahmevorrichtung ein handgeführter Scanner ist.15. Image recording device according to claim 11, characterized in that the on is a handheld scanner. 16. Bildaufnahmevorrichtung nach Anspruch 11, dadurch gekennzeichnet, dass die Vor­ richtung einen Speicher aufweist, um die Bilddaten zwischen­ zuspeichern.16. The image recording device according to claim 11, characterized in that the pre direction has a memory to the image data between save.
DE10009761A 2000-03-01 2000-03-01 Image recording method involves determining line spacing based on image data and from separation of successive characters, edge sharpness from character edges Ceased DE10009761A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE10009761A DE10009761A1 (en) 2000-03-01 2000-03-01 Image recording method involves determining line spacing based on image data and from separation of successive characters, edge sharpness from character edges
PCT/EP2001/002028 WO2001065473A1 (en) 2000-03-01 2001-02-22 Image recording method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10009761A DE10009761A1 (en) 2000-03-01 2000-03-01 Image recording method involves determining line spacing based on image data and from separation of successive characters, edge sharpness from character edges

Publications (1)

Publication Number Publication Date
DE10009761A1 true DE10009761A1 (en) 2001-09-20

Family

ID=7632965

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10009761A Ceased DE10009761A1 (en) 2000-03-01 2000-03-01 Image recording method involves determining line spacing based on image data and from separation of successive characters, edge sharpness from character edges

Country Status (2)

Country Link
DE (1) DE10009761A1 (en)
WO (1) WO2001065473A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5250804A (en) * 1992-09-10 1993-10-05 Ultima Electronic Corp. Lost scan line detecting method and device for a handheld scanner having a lost line counter
US5999666A (en) * 1997-09-09 1999-12-07 Gobeli; Garth W. Device and method for optical scanning of text

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4635290A (en) * 1983-12-20 1987-01-06 Nec Corporation Sectioning apparatus and method for optical character reader systems
US4949391A (en) * 1986-09-26 1990-08-14 Everex Ti Corporation Adaptive image acquisition system
EP0279655A3 (en) * 1987-02-17 1990-12-05 Soricon Corporation Data acquisition control method and system for a hand held reader
DE69523970T2 (en) * 1994-04-15 2002-07-04 Canon Kk Document storage and retrieval system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5250804A (en) * 1992-09-10 1993-10-05 Ultima Electronic Corp. Lost scan line detecting method and device for a handheld scanner having a lost line counter
US5999666A (en) * 1997-09-09 1999-12-07 Gobeli; Garth W. Device and method for optical scanning of text

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HIROMICHI FUJISAWA et.al "Segmentation Methods for Character Recognition: From Segmentation to Document Structure Analyses" Proc. of the IEEE, Vol. 80, No. 7, July 1992, S. 1079-1092 *

Also Published As

Publication number Publication date
WO2001065473A1 (en) 2001-09-07

Similar Documents

Publication Publication Date Title
DE3633743C2 (en)
DE69125471T2 (en) Method for automatic distinction between graphic information and text information from image data
EP0131676B1 (en) Method for automatically digitizing the contours of line graphics, e.g. characters
DE69432585T2 (en) Method and device for selecting text and / or non-text blocks in a stored document
DE69926205T2 (en) ARTIFICIAL REMOVAL TECHNOLOGY FOR SLOW CORRECTED IMAGES
DE3315108C2 (en)
DE3101552C2 (en) Method for preparing image signals for further processing in a color correction device
DE3881392T2 (en) System and method for automatic segmentation.
DE60308739T2 (en) Automatic image quality evaluation method and correction technique
DE3406817C2 (en)
DE3444701C2 (en)
DE60132315T2 (en) IMPROVED PROCESS FOR IMAGE BINARIZATION
DE68922772T2 (en) String determination procedure.
DE2740483A1 (en) FEATURE DETECTOR
EP0176910A1 (en) Method for automatic skew correction in the obtention of a text document having the form of digital scan values
DE3538219A1 (en) READING ARRANGEMENT FOR LINE MARKINGS
DE69925354T2 (en) Image processing system to reduce vertical patterns on scanned images
DE19924144C2 (en) Skew correction apparatus and procedure
DE3110222A1 (en) METHOD FOR PARTIAL SMOOTHING RETOUCHING IN ELECTRONIC COLOR IMAGE REPRODUCTION
DE19956158A1 (en) Image binarisation method for scanned greytone images e.g. newspaper article, uses 2 different conversion methods for providing 2 binary images from scanned greytone image, combined to provide output binary image
DE112010001320T5 (en) Image processing apparatus, image processing method, image processing program and storage medium
DE102008013789A1 (en) Apparatus, method and program for eliminating character disturbances
DE2829808A1 (en) METHOD AND DEVICE FOR READING SIGNS
DE69722605T2 (en) METHOD AND DEVICE FOR IMAGE RECOGNITION AND ITS USE IN A COPIER AND A PRINTER
EP3123393B1 (en) Method for the optical detection of symbols

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8131 Rejection