EP1133751A1 - Method for determining the position of text lines in text recognition tasks - Google Patents

Method for determining the position of text lines in text recognition tasks

Info

Publication number
EP1133751A1
EP1133751A1 EP99950528A EP99950528A EP1133751A1 EP 1133751 A1 EP1133751 A1 EP 1133751A1 EP 99950528 A EP99950528 A EP 99950528A EP 99950528 A EP99950528 A EP 99950528A EP 1133751 A1 EP1133751 A1 EP 1133751A1
Authority
EP
European Patent Office
Prior art keywords
text
line
determined
maximum
minimum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP99950528A
Other languages
German (de)
French (fr)
Inventor
Walter Aigner
Bertram Zagler
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of EP1133751A1 publication Critical patent/EP1133751A1/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Definitions

  • the invention relates to a method for determining the position of lines of text in text recognition tasks.
  • the invention is therefore based on the object of specifying a method with which the position and course of lines of text can be determined.
  • a cell gap is determined when the function has a combination of a maximum with a minimum, in which the minimum has a value smaller than the functional minimum + number of pixels over the width of the image cutout / 15 + 2 * number of pixels over the width of the image / 15 * maximum function / number of pixels over the width of the image portion and the decrease in the function values after the maximum is a value larger (maximum function - minimum function) / 2 has.
  • the brightness distribution of a captured image section along the horizontal is determined and the function obtained in this way represents the beginning of the line by a sudden increase in the function value. This makes it easy to determine the beginning of the line with little effort. Furthermore, for the determination of the position of the text lines it can be ensured that only images that actually contain text lines and a user error such as e.g. placing the reader pen too far to the left of the beginning of the line does not affect cell detection.
  • Fig.l a text excerpt as it is typically captured by a hand-held reading device, and the hystogram and
  • a line histogram is determined for the captured image section. The values of all pixels of this line (0 for white and 1 for black) are added up to each line. The result is a function f (y) with
  • the row index of the picture means Width Width (number of columns) of the picture section.
  • parameters for the assessment of the image are derived. These are:
  • Mini margin value min. + Number of pixels across the width of the image / 15, but at most 2 * number of pixels across the width of the image / 15
  • Minimum threshold mini margin + (2 * number of pixels over the width of the image / 15 * (value max / number of pixels over the width of the image)) but at most 3 * number of pixels over the width of the Section of image / 15
  • the captured image is now assessed with regard to the presence of text lines and line spaces.
  • the course of the curve is examined to determine whether there are values that are lower than the parameter minimum threshold. If this is the case, the affected area is qualified as a valid minimum and thus as a possible space between cells.
  • the coincidence of a valid maximum with a valid minimum marks the transition from a text cell to a space between cells.
  • the parameter mini margin is used to precisely determine this transition.
  • the point at which the curve crosses this threshold between a valid maximum and a valid minimum is defined as the line edge.
  • a column histogram is used to determine the left edge of a row
  • the left edge of the text is (if there is at least one line) defined by a sudden increase in the function value f (x).
  • the tracking of the lines i.e.
  • the information about the further course of the lines which is particularly important in the case of hand-held reading devices due to the fluctuations that occur with them, is based on the position of the recognized characters.
  • the recognized characters are divided into the following large groups: Small characters (e.g. 'a') 0, 7 * character height
  • Baselme character (eg A ', ⁇ .'): The lower edge of the character corresponds to the lower edge of the text line, regardless of the size of the character;
  • Short characters eg ⁇ g ','['): the lower edge of the character corresponds to the lower limit, regardless of the size of the character; Special characters: these characters can be related to their
  • Averaging (e.g.: 3)
  • the 'Increase' is limited by the plausibility limit CYC MAX ZEILENVERSATZ (in the pocket reader: 15 °).

Abstract

The invention relates to a method for determining the position of text lines in text recognition tasks, wherein the distribution of brightness of a detected image segment is determined along a vertical and said distribution of brightness is then filtered, wherein the maximum and minimum values of the function thus obtained are determined, on the basis of which extreme threshold values are calculated that are used for differentiating between text lines and line spacing. The method is particularly advantageous for electronic hand-held read devices.

Description

Verfahren zur Bestimmung der Lage von Textzeilen bei TexterkennungsaufgabenProcedure for determining the position of lines of text in text recognition tasks
Die Erfindung betrifft ein Verfahren zur Bestimmung der Lage von Textzeilen bei Texterkennungsaufgaben.The invention relates to a method for determining the position of lines of text in text recognition tasks.
Bei der automatischen Erkennung von Texten, d.h. bei der Umwandlung der grafischen Information eines Dokumentes in Textzeichen, die mittels elektronischen Textverarbeitungs- Programmen weiterverarbeitet werden können, ist e ne wesentliche Voraussetzung für einen erfolgreichen Erkennungsvorgang die genaue Bestimmung der Lage und der Große der einzelnen Zeichen. Voraussetzung dafür ist wiederum die Kenntnis der Lage und der Maße der Textzeilen.With the automatic recognition of texts, i.e. When converting the graphic information of a document into text characters that can be further processed using electronic word processing programs, a precise prerequisite for a successful recognition process is the exact determination of the position and size of the individual characters. Knowledge of the position and dimensions of the text lines is a prerequisite for this.
Bei handgefuhrten Lesevorrichtungen kommt es überdies zu einem nichtlinearen Verlauf der Textzeilen in dem erfaßten Bildausschnitt. Hier besteht die Notwendigkeit, den Verlauf einer Textzeile zu bestimmen.In the case of hand-held reading devices, there is also a non-linear course of the text lines in the captured image section. Here it is necessary to determine the course of a line of text.
Der Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren anzugeben, mit dem Lage und Verlauf von Textzeilen bestimmt werden können.The invention is therefore based on the object of specifying a method with which the position and course of lines of text can be determined.
Dies geschieht erfindungsgemaß mit einem Verfahren der eingangs genannten Art, bei dem die Helligkeitsverteilung eines erfaßten Bildausschnittes entlang der Vertikale ermittelt wi d und diese Helligkeitsverteilung gefiltert wird, bei dem Maximumwert und Minimumwert der solcherart erhaltenen Funktion ermittelt werden und auf der Grundlage dieser Extrema Schwellwerte berechnet werden, die als Grundlage für die Unterscheidung zwischen Textzeile und Zellenzwischenraum dienen. Das erfmdungsgemaße Verfahren ermöglicht d e Feststellung der Zeilenlage und Hohe mit geringem Aufwand und damit sehr schnell, sodaß dieseThis is done according to the invention with a method of the type mentioned at the outset, in which the brightness distribution of a captured image section along the vertical is determined and this brightness distribution is filtered, the maximum value and minimum value of the function obtained in this way are determined and threshold values are calculated on the basis of these extremes , which serve as the basis for the distinction between text line and cell space. The method according to the invention enables the line position and height to be determined with little effort and thus very quickly, so that this
Information unmittelbar erhalten wird woαurch ein schneller Erkennungsvorgang ermöglicht wird. Dies ist besonders bei Lesevorrichtungen von Bedeutung, die nur begrenzte elektronische Speicher zur Verfugung haben und deshalb eine rasche Umsetzung der speicherintensiven Bildinformation in Textinformation noch wahrend der Bildaufnahme erfordern.Information is obtained immediately, which enables a quick recognition process. This is particularly the case with Readers of importance, which have only limited electronic memory available and therefore require a rapid conversion of the memory-intensive image information into text information while the image is being captured.
Vorteilhaft ist eine Ausgestaltung des Verfahrens in der Weise, daß ein Zellenzwischenraum dann festgestellt wird, wenn die Funktion eine Kombination eines Maximums mit einem Minimum aufweist, bei der das Minimum einen Wert kleiner als Funktionsminimum + Anzahl der Bildpunkte über die Brei te des Bιldausschnι t tes/15 + 2 *Anzahl der Bildpunkte über die Brei te des Bιlda usschnι t tes/15 * Funktionsmaximum/ Anzahl der Bildpunkte über die Brei te des Bildausschni ttes aufweist und der Abfall der Funktionswerte nach dem Maximum einen Wert großer (Funktionsmaximum - Funktionsminimum) /2 aufweist.It is advantageous to design the method in such a way that a cell gap is determined when the function has a combination of a maximum with a minimum, in which the minimum has a value smaller than the functional minimum + number of pixels over the width of the image cutout / 15 + 2 * number of pixels over the width of the image / 15 * maximum function / number of pixels over the width of the image portion and the decrease in the function values after the maximum is a value larger (maximum function - minimum function) / 2 has.
Diese Ausgestaltung hat sich in der Praxis durch sehr gute Ergebnisse bewahrt.In practice, this design has been preserved through very good results.
Ebenfalls vorteilhaft ist eine weitere Ausgestaltung des Verfahrens m der Weise, daß zur Feststellung des linkenAnother embodiment of the method is also advantageous in such a way that to determine the left
Rands einer Zeile die Helligkeitsverteilung eines erfaßten Bildausschnittes entlang der Horizontale ermittelt wird und die solcherart erhaltene Funktion den Zeilenbeginn durch einen sprunghaften Anstieg des Funktionswertes darstellt. Damit ist der Zeilenbeginn auf einfache Weise mit geringem Aufwand zu ermitteln. Weiterhin kann für die Ermittlung der Lage der Textzeilen gewährleistet werden, αaß dabei nur Bilder berücksichtigt werden, die tatsächlich Textzeilen enthalten und ein Benutzerfehler wie z.B. das Absetzen des Lesestiftes zu weit links von dem Zeilenbeginn die Zellenermittlung nicht beeinflußt.Edge of a line, the brightness distribution of a captured image section along the horizontal is determined and the function obtained in this way represents the beginning of the line by a sudden increase in the function value. This makes it easy to determine the beginning of the line with little effort. Furthermore, for the determination of the position of the text lines it can be ensured that only images that actually contain text lines and a user error such as e.g. placing the reader pen too far to the left of the beginning of the line does not affect cell detection.
Gunstig ist es, wenn nach der erstmaligen Feststellung der Lage einer Zeile der weitere Verlauf derselben durch Auswertung der Information über die erkannten Textzeichen ermittelt wird. Durch die Auswertung des Ergebnisses der Zeichenklassifikation ist eine besonders genaue Bestimmung des Zellenverlaufs möglich.It is advantageous if, after the position of a line has been determined for the first time, the further course of the same is determined by evaluating the information about the recognized text characters. By evaluating the result of the Character classification allows a particularly precise determination of the cell course.
Die Erfindung wird anhand von Figuren naher erläutert. Es zeigen beispielhaft:The invention is explained in more detail with reference to figures. The following are examples:
Fig.l einen Textausschnitt wie er typisch von einer handgefuhrten Lesevorrichtung erfaßt wird, sowie das daraus ermittelte Hystogramm undFig.l a text excerpt as it is typically captured by a hand-held reading device, and the hystogram and
Fig.2 das gefilterte Hystogramm mit den eingetragenen Parametern zur Beurteilung des Bildes.2 shows the filtered hystogram with the entered parameters for assessing the image.
Der Ablauf des erfindungsgemaßen Verfahrens ist wie folgt: Zu dem erfaßten Bildausschnitt wird ein Zeilenhistogramm ermittelt. Dabei werden zu ηeder Zeile die Werte aller Bildpunkte dieser Zeile (0 für Weiß und 1 für Schwarz) aufsummiert. Ergebnis ist eine Funktion f(y) mitThe sequence of the method according to the invention is as follows: A line histogram is determined for the captured image section. The values of all pixels of this line (0 for white and 1 for black) are added up to each line. The result is a function f (y) with
Wιdth-\ f(y) = Y iBlackPixeϊ) wobei Wιdth- \ f (y) = Y iBlackPixeϊ) where
;=0; = 0
y den Zeilenindex des Bildes bedeutet Width Breite (Spaltenanzahl) des Bildausschnittes angibt.y The row index of the picture means Width Width (number of columns) of the picture section.
Diese Funktion hat bei Vorliegen eines Textes einen typischenThis function is typical when a text is available
Verlauf wie er beispielhaft in Fig. 1 dargestellt ist.Course as it is shown as an example in Fig. 1.
In einem weiteren Schritt erfolgt eine Filterung gemäßIn a further step, filtering takes place in accordance with
mit y Index im Zeilenhistogramm with y index in the line histogram
G Gewichtung entsprechend einer exponentiellen Glattungskurve i Index der Glattungskurve Wahrend des Filtervorganges werden auch der absolute Maximumwert Va l uemax d.h. d-_e Anzahl der schwarzen Bildpunkte (Black Pixel) der dunkelsten Zeile und das absolute Minimum Val uemin d. h. die Anzahl der schwarzen Bildpunkte (Black Pixel) der hellsten Zeile ermittelt.G Weighting according to an exponential smoothing curve i Index of the smoothing curve During the filtering process, the absolute maximum value Va l uemax ie d-_e number of black pixels (black pixels) of the darkest line and the absolute minimum value u uin ie the number of black pixels (black pixels) of the brightest line are determined.
Aus diesen beiden Werten werden Parameter für die Beurteilung des Bildes abgeleitet. Diese sind:From these two values, parameters for the assessment of the image are derived. These are:
Grubenlimi t = ( Val uemax - Val uemin) /2 mindestens aber Anzahl der Bildpunkte über die Brei te des Bi lda usschni t tes/30Pit limit = (Val uemax - Val uemin) / 2 but at least the number of pixels across the width of the image section / 30
Minimarand = Valuemin + Anzahl der Bildpunkte über die Brei te des Bιlda usschnι ttes/15 höchstens aber 2* Anzahl der Bildpunkte über die Brei te des Bilda usschni t tes/ 15Mini margin = value min. + Number of pixels across the width of the image / 15, but at most 2 * number of pixels across the width of the image / 15
Minimaschwelle = Minimarand + ( 2 * Anzahl der Bildpunkte über die Brei te des Bιlda usschnι t tes/15 * (Valuemax/ Anzahl der Bildpunkte über die Brei te des Bilda usschni ttes) ) höchstens aber 3* Anzahl der Bildpunkte ber die Brei te des Bilda usschni t tes/ 15Minimum threshold = mini margin + (2 * number of pixels over the width of the image / 15 * (value max / number of pixels over the width of the image)) but at most 3 * number of pixels over the width of the Section of image / 15
Anhand der Funktion f ' (y) und der ermittelten Schwellwerte wie sie beispielhaft in Fig. 2 dargestellt sind, wird nun das erfaßte Bild hinsichtlich des Vorliegens von Textzeilen und Zeilenzwischenraumen beurteilt.On the basis of the function f '(y) and the determined threshold values, as are shown by way of example in FIG. 2, the captured image is now assessed with regard to the presence of text lines and line spaces.
Dazu wird der Kurvenverlauf darauf untersucht, ob Werte vorliegen, die geringer als der Parameter Minimaschwelle sind. Ist dies der Fall, dann wird der betroffene Bereich als gültiges Minimum und damit als möglicher Zellenzwischenraum qualifiziert .For this purpose, the course of the curve is examined to determine whether there are values that are lower than the parameter minimum threshold. If this is the case, the affected area is qualified as a valid minimum and thus as a possible space between cells.
Ein tatsachlicher Zellenzwischenraum liegt jedoch nur dann vor, wenn durch ein angrenzendes Maximum mit einer gewissen Ausprägung das Vorhandensein einer Textzeile angezeigt wird. Diese gültigen Maxima sind durch ein anschließendes Absinken des Kurvenwertes um einen Betrag > Grubenl imi t definiert.However, there is only an actual cell gap if there is an adjacent maximum with a certain one The presence of a line of text is displayed. These valid maxima are defined by a subsequent decrease in the curve value by an amount> pit limit.
Das Zusammentreffen eines gültigen Maximums mit einem gültigen Minimum kennzeichnet den Übergang von einer Textzelle zu einem Zellenzwischenraum. Zur genauen Bestimmung dieses Überganges dient der Parameter Minimarand.The coincidence of a valid maximum with a valid minimum marks the transition from a text cell to a space between cells. The parameter mini margin is used to precisely determine this transition.
Der Punkt in dem die Kurve zwischen einem gültigen Maximum und einem gültigen Minimum diese Schwelle schneidet, wird als Zeilenkante festgelegt.The point at which the curve crosses this threshold between a valid maximum and a valid minimum is defined as the line edge.
Zur Bestimmung des linken Randes einer Zeile wird ein Spaltenhistogramm gemäßA column histogram is used to determine the left edge of a row
Heιght-\ f(x) = ∑ (BlαckPixel)Heιght- \ f (x) = ∑ (BlαckPixel)
x Spaltenindex des Bildausschnittesx Column index of the image section
Height . ...Bild-HoheHeight. ... image height
erstellt, in Worten die Farbinformation der Bildpunkte ηeder Spalte des erfaßten Bildausschnittes wird aufsummiert. Der linke Textrand ist (bei Vorhandensein zumindest einer Zeile) durch einen sprunghaften Anstieg des Funktionswertes f(x) definiert.created, in words the color information of the pixels η of the column of the captured image section is added up. The left edge of the text is (if there is at least one line) defined by a sudden increase in the function value f (x).
Die Nachfuhrung der Zeilen, d.h. die Information über den weiteren Verlauf der Zeilen, die besonders bei handgefuhrten Lesevorrichtungen aufgrund der bei diesen auftretenden Schwankungen von Bedeutung ist, erfolgt auf der Grundlage der Position der erkannten Zeichen.The tracking of the lines, i.e. The information about the further course of the lines, which is particularly important in the case of hand-held reading devices due to the fluctuations that occur with them, is based on the position of the recognized characters.
Dazu werden die erkannten Zeichen in folgende Großengruppen eingeteilt : Kleine Zeichen (z.B. 'a') 0, 7*ZeιlenhoheFor this purpose, the recognized characters are divided into the following large groups: Small characters (e.g. 'a') 0, 7 * character height
Große Zeichen (z.B. ΛA','g') Zeilenhohe Übergroße Zeichen (z.B. x [ λ , ' j ' ) Zeιlenhohe+0, 3*ZeιlenhoheLarge characters (eg Λ A ',' g ') line height Oversized characters (e.g. x [ λ , 'j') Zeιlenhohe + 0, 3 * Zeιlenhohe
(Unterlangen)(Descenders)
Sonderzeichen: die Zeichen lassen sich von der Große nicht eindeutig zuordnenSpecial characters: the characters cannot be clearly assigned by the size
Für die Ermittlung der neuen Textzeilenunterkante werden folgende Zeichengruppen unterschieden:A distinction is made between the following character groups to determine the new bottom line of text lines:
Baselme-Zeichen (z.B. A' , Λ . ' ) : die Zeichenunterkante entspricht der Textzeilenunterkante, unabhängig von der Große des Zeichens;Baselme character (eg A ', Λ .'): The lower edge of the character corresponds to the lower edge of the text line, regardless of the size of the character;
Unterlangenzeic en (z.B. Λg' ,'['): die Zeichenunterkante entspricht der Unterlangengrenze, unabhängig von der Große des Zeichens; Sonderzeichen: diese Zeichen lassen sich bezuglich ihrerShort characters (eg Λ g ','['): the lower edge of the character corresponds to the lower limit, regardless of the size of the character; Special characters: these characters can be related to their
Unterkante nicht eindeutig zuordnen.Do not assign the bottom edge clearly.
Auf der Grundlage dieser Zuordnungen und einem im Zuge des Klassifikationsverfahrens erhaltenen Wahrscheinlichkeits-wert G betreffend die korrekte Klassifizierung des Zeichens wird nun die neue Zeilenhohe Height wie folgt ermittelt:Based on these assignments and a probability value G obtained in the course of the classification process regarding the correct classification of the character, the new line height is now determined as follows:
G = Wahrscheinlichkeit * CYC MAX WEIGHTG = probability * CYC MAX WEIGHT
CYC MAX EXTRPAR-1CYC MAX EXTRPAR-1
2 OldHeιght[i] + NewHeight * G Height ι=02 OldHeιght [i] + NewHeight * G Height ι = 0
CYC MAX EXTRPAR + GCYC MAX EXTRPAR + G
G Gewichtung der aus dem aktuellenG Weighting from the current
Zeichen abgeleiteten Zeilenhohe Wahrscheinlichkeit Wahrscheinlichkeit der korrektenCharacter derived line high probability probability of correct
Ze chenklassifikation (Wertebereich zwischen 0 und 1)Character classification (range of values between 0 and 1)
CYC_MAX_WEIGHT Maximale Gewichtung der neuenCYC_MAX_WEIGHT Maximum weighting of the new
Zeichenposition (z.B.: 5)Character position (e.g. 5)
Height Nachgefuhrte Zeilenhohe (Großbuchstabenhohe) CYC_MAX_EXTRPAR Große des Ringpuffers für dieHeight Tracked line height (capital letter height) CYC_MAX_EXTRPAR size of the ring buffer for the
Mittelung (z.B. : 3)Averaging (e.g.: 3)
OldHeight [ ] RingpufferOldHeight [] ring buffer
NewHeight Aus aktuellem Zeichen abgeleitete Zellenhohe (Großbuchstabenhohe)NewHeight Cell height derived from current character (capital letter height)
I Index im RingpufferI index in the ring buffer
Die Ermittlung des Verlaufs der Textzeilenunterkante erfolgt gemäß :The course of the bottom line of the text line is determined according to:
λλ
G = Wahrscheinlichkeit + - *CYC MAX WEIGHTG = probability + - * CYC MAX WEIGHT
CYC_MAX_WEIGHT7CYC_MAX_WEIGHT7
Oldlncrease + Newlncrease * GOldlncrease + Newlncrease * G
Increase = \ + GIncrease = \ + G
Increase * DeltaX + 50 Base = NewBase + Increase * DeltaX + 50 Base = NewBase +
100100
G Gewichtung der neuen ZeichenpositionG Weighting of the new character position
Wahrscheinlichkeit Wahrscheinlichkeit der korrektenProbability probability of correct
Zeichenklassifikation CYC_MAX_WEIGHT Maximale Gewichtung der neuenCharacter classification CYC_MAX_WEIGHT Maximum weighting of the new
Zeichenposition (z.B.: 5)Character position (e.g. 5)
Increase Nachgefuhrte aktuelle Steigung derIncrease tracked current slope of the
Baselme in %Baselme in%
Oldlncrease Vorherige Steigung der Easeline in % Newlncrease Aus Postition des aktuellen Zeichens errechnete Steigung der Baselme in %Oldlncrease Previous slope of the Easeline in% Newlncrease Slope of the Baselme calculated from the position of the current character in%
Base Nachgefuhrte Baselmeposition (gerundet auf ganzzahligen Wert)Base Tracked base position (rounded to integer value)
NewBase Aus Position des aktuellen Zeichens errechnete BaselinepositionNewBase Baseline position calculated from the position of the current character
DeltaX X-Abstand im Image der beidenDeltaX X distance in the image of the two
Mittelpunkte der zuletzt extrahierten ZeichenCenters of the most recently extracted characters
Die ' Increase' wird durch das Plausibilitatslimit CYC MAX ZEILENVERSATZ (im Pocket Reader: 15°) limitiert. The 'Increase' is limited by the plausibility limit CYC MAX ZEILENVERSATZ (in the pocket reader: 15 °).

Claims

Patentansprücheclaims
1) Verfahren zur Bestimmung der Lage von Textzeilen bei Texterkennungsaufgaben, dadurch gekennzeichnet, daß die Helligkeitsverteilung eines erfaßten Bildausschnittes entlang der Vertikale ermittelt wird und diese Helligkeitsverteilung gefiltert wird, daß Maximumwerte und Minimumwerte der solcherart erhaltenen Funktion ermittelt werden und auf der Grundlage dieser Extrema Schwellwerte berechnet werden die als Grundlage für die Unterscheidung zwischen Textzeile und Zeilenzwischenraum dienen.1) Method for determining the position of text lines in text recognition tasks, characterized in that the brightness distribution of a captured image section along the vertical is determined and this brightness distribution is filtered, that maximum values and minimum values of the function obtained in this way are determined and threshold values are calculated on the basis of these extremes will serve as the basis for the distinction between text line and line space.
2) Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß ein Zeilenzwischenraum dann festgestellt wird, wenn die Funktion eine Kombination eines Maximums mit einem Minimum aufweist, bei der das Minimum einen Wert kleiner als2) Method according to claim 1, characterized in that a line space is determined when the function has a combination of a maximum with a minimum, in which the minimum is a value less than
Funktionsminimum + Anzahl der Bildpunkte über die Brei te des Bilda usschni ttes/15 + 2 * Anzahl der Bildpunkte über die Brei te des Bildausschni ttes/15 * Funktionsmaximum/Anzahl der Bildpunkte über die Brei te des Bildausschni ttes aufweist und der Abfall der Funktionswerte nach dem Maximum einen Wert größer (Funktionsmaximum - Funktionsminimum) /2 aufweist.Functional minimum + number of pixels over the width of the image section / 15 + 2 * number of image points over the width of the image section / 15 * functional maximum / number of pixels over the width of the image section and the drop in the function values after has a value greater than the maximum (functional maximum - functional minimum) / 2.
3) Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß zur Feststellung des linken Rands einer Zeile die3) Method according to claim 1 or 2, characterized in that to determine the left edge of a line
Helligkeitsverteilung eines erfaßten Bildausschnittes entlang der Horizontale ermittelt wird und die solcherart erhaltene Funktion den Zeilenbeginn durch einen sprunghaften Anstieg des Funktionswertes darstellt.Brightness distribution of a captured image section along the horizontal is determined and the function obtained in this way represents the beginning of the line by a sudden increase in the function value.
4) Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß nach der erstmaligen Feststellung der Lage einer Zeile der weitere Verlauf derselben durch Auswertung der Information über die erkannten Textzeichen ermittelt wird. 4) Method according to one of claims 1 to 3, characterized in that after the first determination of the position of a line, the further course of the same is determined by evaluating the information about the recognized text characters.
EP99950528A 1998-09-30 1999-09-16 Method for determining the position of text lines in text recognition tasks Withdrawn EP1133751A1 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
AT162398 1998-09-30
AT162398 1998-09-30
PCT/EP1999/006842 WO2000019358A1 (en) 1998-09-30 1999-09-16 Method for determining the position of text lines in text recognition tasks

Publications (1)

Publication Number Publication Date
EP1133751A1 true EP1133751A1 (en) 2001-09-19

Family

ID=3517425

Family Applications (1)

Application Number Title Priority Date Filing Date
EP99950528A Withdrawn EP1133751A1 (en) 1998-09-30 1999-09-16 Method for determining the position of text lines in text recognition tasks

Country Status (4)

Country Link
EP (1) EP1133751A1 (en)
CA (1) CA2348633A1 (en)
MX (1) MXPA01003116A (en)
WO (1) WO2000019358A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8023697B1 (en) 2011-03-29 2011-09-20 Kaspersky Lab Zao System and method for identifying spam in rasterized images

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5633957A (en) * 1994-09-16 1997-05-27 Compaq Computer Corporation Method and apparatus for determining positional guidelines of handwritten data

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO0019358A1 *

Also Published As

Publication number Publication date
MXPA01003116A (en) 2003-05-15
WO2000019358A1 (en) 2000-04-06
CA2348633A1 (en) 2000-04-06

Similar Documents

Publication Publication Date Title
DE3633743C2 (en)
DE4445386C1 (en) Separation of foreground and background information on document
DE3716787C2 (en)
DE69432585T2 (en) Method and device for selecting text and / or non-text blocks in a stored document
DE2831582C2 (en) Method for identifying a person and device for carrying out the method
DE60217299T2 (en) HOLISTIC-ANALYTICAL DETECTION OF HAND-WRITTEN TEXT
EP0040796A2 (en) Method for the automatic differentiation between image and text or graphic regions on printed originals
DE60132315T2 (en) IMPROVED PROCESS FOR IMAGE BINARIZATION
DE2844156C2 (en)
DE19953608B4 (en) Apparatus and method for recognizing a font of a text in a document processing system
DE2247942A1 (en) CHARACTER RECOGNITION METHOD TO IMPROVE THE RECOGNITION OF DISTURBED CHARACTERS
DE3107521A1 (en) METHOD FOR AUTOMATICALLY DETECTING IMAGE AND TEXT OR GRAPHIC AREAS ON PRINT ORIGINALS
DE19705757A1 (en) Computer-based hand-written character recognition
DE19511470C1 (en) Reference character evaluation on basis of identical patterns
DE60005293T2 (en) Method and device for processing electronic documents
EP0402868B1 (en) Method for recognizing previously located character represented as digital grey-value images, in particular of character stamped into metal surfaces
DE3241673C2 (en) Method for compressing data of two-valued image representations
EP2082357B1 (en) Device, method and computer program for identifying characters in an image
DE112021000371T5 (en) DIGITAL IMAGE EDITING
DE2749018A1 (en) CONTROL SYSTEM FOR CHECKING THE GENUINEITY OF IDS
EP3123393B1 (en) Method for the optical detection of symbols
DE4407998C2 (en) Method and device for recognizing a pattern on a document
DE3622222A1 (en) CHARACTER RECOGNITION IN TWO-DIMENSIONAL SIGNALS
EP1133751A1 (en) Method for determining the position of text lines in text recognition tasks
EP0753231B1 (en) Method and device for binarising pixel data

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20010618

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE

GRAH Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOS IGRA

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20030729