MXPA01003116A - Procedimiento para determinar la posicion de renglones de texto en tareas de reconocimiento de texto. - Google Patents

Procedimiento para determinar la posicion de renglones de texto en tareas de reconocimiento de texto.

Info

Publication number
MXPA01003116A
MXPA01003116A MXPA01003116A MXPA01003116A MXPA01003116A MX PA01003116 A MXPA01003116 A MX PA01003116A MX PA01003116 A MXPA01003116 A MX PA01003116A MX PA01003116 A MXPA01003116 A MX PA01003116A MX PA01003116 A MXPA01003116 A MX PA01003116A
Authority
MX
Mexico
Prior art keywords
function
text
line
maximum
minimum
Prior art date
Application number
MXPA01003116A
Other languages
English (en)
Inventor
Walter Aigner
Original Assignee
Siemens Ag Oesterreich
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Ag Oesterreich filed Critical Siemens Ag Oesterreich
Publication of MXPA01003116A publication Critical patent/MXPA01003116A/es

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

Se presenta un procedimiento para determinar la posicion de renglones de texto en el caso de tareas de reconocimiento de texto, en donde se determina la distribucion de zonas claras de una seccion de imagen abarcada a lo largo de la vertical y esta distribucion de zonas claras es filtrada, en donde se determinan el valor maximo y el valor minimo de una funcion obtenida de esta manera y con base en estos extremos se calculan valores limites que sirven como base para la diferenciacion entre renglon de texto y espacio entre renglones. El procedimiento es especialmente provechoso en el caso del empleo de dispositivos de lectura electronicos manejados manualmente.

Description

PROCEDIMIENTO PARA DETERMINAR LA POSICIÓN DE RENGLONES DE TEXTO EN TAREAS DE RECONOCIMIENTO DE TEXTO La invención se refiere a uri procedimiento para determinar la posición de renglones de texto en tareas de reconocimiento de texto, en donde se determina la separación de zonas claras de una sección a lo largo de la vertical a través de la formación de histograma a 1o largo de los renglones, y esta distribución de espacios claros es aplanada, por lo que se determina un valor máximo y un valor mínimo de la función obtenida de esta forma y con base en estos extremos se calculan valores limites que sirven como base para la diferenciación entre renglón de texto y espacio intermedio entre los renglones. En el caso del reconocimiento automático de textos, es decir, en el caso de la transformación de una información gráfica de un documento en caracteres de texto, que pueden ser procesados adicionalmente a través de programas de procesamiento de texto electrónicos, una precondición importante para un proceso de reconocimiento exitoso es la determinación precisa de la posición y del tamaño de los caracteres individuales. Una precondición para esto es otra vez el conocimiento de la posición y del tamaño de los renglones de texto. En el caso de dispositivos de lectura manejados manualmente se encuentra además un desarrollo no lineal de los renglones de texto en la sección abarcada. En este caso existe la necesidad de determinar el trayecto de un renglón de texto. Un procedimiento del tipo mencionado en la introducción se conoce a partir del documerito EP 0702 329 A2. Este documento describe un procedimiento y un dispositivo para determinar el trayecto de renglones en el caso de apuntes manuscritos. Para este propósito los puntos jie símbolo son aplanados mediante suma renglón por renglón y son analizados para determinar la posición de los renglones. El objeto de la presente invención es mejorar este procedimiento. Esto se logra de conformidad con la presente invención con un procedimiento del tipo mencionado en la introducción, en donde el espacio entre renglones es determinado cuando la función presenta una combinación de un máximo con un mínimo, en donde el minimo es un valor menor que el mínimo de función más número de puntos de imagen a lo ancho de la sección de imagen/15 + 2* número de puntos de imagen a lo ancho de la sección de imagen/15 * máximo de función/número de puntos de imagen a lo ancho de la sección de imagen, y la baja de los valores de función después del máximo presenta un valor mayor que (máximo de función minimo de función) 12 . Este desarrollo ha logrado excelentes resultados en la práctica. Es provechoso tener un desarrollo del procedimiento de tal manera que para determinar el borde izquierdo de un renglón, se determina la distribución de partes claras de una sección de imagen abarcada a lo lajrgo de una linea horizontal y la función obtenida de esta forma representa el inicio del renglón a través de una elevación repentina del valor de la función. De esta forma el inicio de un renglón puede ser determinado de manera sencilla. Además se debe asegurar para determinar la posición de renglones de texto que solamente se toman en cuenta imágenes ?;ue contienen renglones de texto reales y un error del usuario como por ejemplo la colocación de un lápiz de lectura demasiado lejos hacia la izquierda con relación al inicio de los renglones no afecta la determinación de renglones. Es provechoso, después de la determinación inicial de la posición de un renglón determinar el desarrollo posterior del mismo a través de la evaluación de la información sobre los renglones de texto conocidos. Mediante esta evaluación del resultado de la clasificación de caracteres se puede obtener una determinación especialmente precisa del desarrollo de un renglón. La invención se explicará óon mayores detalles con base en figuras. La figura 1 es una sección de texto típica de lo que es abarcado por un dispositivo de lectura manejado manualmente, asi como el histograma determinado de esta forma y La figura 2 es el histograma filtrado con los parámetros exponencial i índice de curva de .aplanamiento Durante el proceso de filtración se determinan también el valor máximo absoluto Val ueircax es decir el número de puntos de imagen negros (Black Pixel) del renglón más oscuro y el número mínimo absoluto Val uemí n, es decir el número de puntos de imagen negros (Black Pixe1) del renglón más claro, A partir de estos dos valores se determinan parámetros para la calificación de la imagen Estos parámetros son: limite de hueco = (Val uemax Val uemin) /2 por lo menos sin embargo el número de puntos de imagen a lo ancho de la sección de i Imagen/ 30. v Borde minimo = Val uemin + úmero de puntos de imagen a lo ancho de la sección de i imagen/1 5 máximo sin embargo 2* número de puntos de imagen a lo ancho de la sección de imagen/15 Lími te mínimo = borde mínimo + (2* número de puntos de imagen a lo ancho de la sección de imagen/ 15 * (Val uemax/ número de puntos de imagen a lo ancho de la sección de imagen) ) máximo sin embargo 3 * número de pv ntos de imagen a lo ancho de la sección de imagen/ 15 Con base en la función f ' (y) y con base a los valores límites determinados como por ejemplo se ilustra en la figura 2, se califica ahora una imagen abarcada en cuanto a la presencia de renglones de texto y espa ios en blanco entre renglones.
Para este propósito se estudia el desarrollo de la curva, para determinar si se encuentran valores que son menores que el parámetro umbral mínimo Si es el caso, entonces la zona en cuestión es calificaba como mínimo válido y por consiguiente como posible e?pacio intermedio entre renglones. Un espacio intermedio entre renglón real se encuentra sin embargo solamente en el caso en el cual se señala la existencia de un renglón de texto a través de un máximo contiguo con una cierta cltaridad. Estos máximos válidos se definen a través de una disminución subsiguiente del valor de la curva por una cantidad mayor que el límite de hueco. La conjunción de UQ máximo válido con un mínimo válido representa la transición de. un renglón de texto a un espacio entre renglones. Para una determinación precisa de esta transición se emplea el parámetro borde mínimo. El punto en el cual la curva entre un máximo válido y un mínimo válido corta este límite se determina como borde de renglón. Para determinar el borde izquierdo de un renglón se determina un histograma de columna de conformidad con lo siguiente tfeig- t-l /(x) =. T ( BlackPixel) x índice de colur?na de la sección de imagen Height altura de imagen la información de color de los puntos de imagen de cada palo hacia abajo, independientemente del tamaño de los caracteres; Caracteres especiales : estos caracteres no pueden clasificarse claramente con base a su borde inferior. Con base en estas clasificaciones y con base en un valor de probabilidad obtenido durante el proceso de clasificación G que se refiere a la clasificación correcta del carácter, se determina ahora la nueva altura de renglón Height de la siguiente manera: G = probabil idad* CYC MAX WEÍGHT CYC MAX EXTRP?R-t ¿) OldHeighl[i] + NewH ight * G Heighl = - IcO CYC MAX EXTRPAR f G G = peso de la altura de renglón determinada a partir de los caracteres actuales Probabilidad = probabili .dad de clasificación correcta de caracteres (rango de valor entre 0 y 1) CYC_MAX_WEIGHT = peso máxime de la nueva posición de carácter (por ejemplo: 5) Height - altura proyectada de renglón (altura de mayúsculas) CYC_MAX_EXTRPAR = tamaño de la altura anterior (por ejemplo: 3) OldHeightU = altura anterior NewHeight = altura de rengJLón derivada del carácter actual (tamaño de mayúscula) i = índice de altura anterior La determinación del desarrollo del borde inferior de renglón de texto se efectúa de conformidad con lo siguiente: G = (probabilidad + ) *CYC MAX WEIGHT CYC MAX WEIGHT Increase = — Oldlncrease + Newlncrqase * G í+s Increase * DeltaX +50 Base = New Base + 100 G = peso de la nueva posición de carácter probabilidad = probabilidad de clasificación correcta de carácter CYC_MAX_WEIGHT = peso máximjo de la nueva posición de carácter (por ejemplo: 5) Increase = elevación actual proyectada con relación a la línea basal en porcentaje Oldlncrease = elevación anterior con relación a la línea basal en porcentaje Newlncrease = elevación alculada de la línea basal en porcentaje a partir de la posición del carácter actual Base = posición de línea basal proyectada (redondeada a un valor entero) NewBase = posición de línea basal calculada a partir de la posición del carácter actual

Claims (1)

  1. REIVINDICACIONES Un procedimiento para determinar la posición de renglones de texto en tareas de reconocimiento de texto en donde se determina la distribución de zonas claras de una sección de imagen abarcada a lo largo de la vertical por medie de la formación de un histograma a lo largo del rengl.ón, y esta distribución de zonas claras es aplanada, en donde se determinan valores máximos y valores mihimos de una función obtenida de esta forma y con base en estos extremos se calculan límites que sirven como base para la diferenciación entre renglones de texto y espacio intermedio entre renglones, que se caracteriza porque un espacio intermedio entre reriglones es determinado cuando la función presenta una combinación de un máximo con un mínimo, en donde el mínimo tiene un valor menor que mínimo de función más número de puntos de imagen a lo ancho de la sección de imagen/15 + 2 * número de puntos de imagen a l> ancho de la sección de imagen/15 * máximo de función/número de puntos de imagen a lo ancho de la sección de imagen y la disminución de los valores de función después de un máximo presenta un valor mayor (máximo de función - mínimo de función) 12 . Procedimiento de conformidad con la reivindicación 1, caracterizado porque para determinar el borde izquierdo de un renglón se determina la distribución de zonas claras de una sección de imagen abarcada a lo largo de una línea ho >rizontal y la función obtenida de esta forma representa el inicio de renglón a través de un incremento repentino del valor de la función. Procedimiento de conformidad con cualesquiera de las reivindicaciones 1 o 2, que se caracteriza porque después de una primer :a determinación de la posición de un renglón, se determina el desarrollo subsecuente de dicho renglón a través de la evaluación de la información sobre los caracteres de texto reconocidos, v
MXPA01003116A 1998-09-30 1999-09-16 Procedimiento para determinar la posicion de renglones de texto en tareas de reconocimiento de texto. MXPA01003116A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
AT162398 1998-09-30
PCT/EP1999/006842 WO2000019358A1 (de) 1998-09-30 1999-09-16 Verfahren zur bestimmung der lage von textzeilen bei texterkennungsaufgaben

Publications (1)

Publication Number Publication Date
MXPA01003116A true MXPA01003116A (es) 2003-05-15

Family

ID=3517425

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA01003116A MXPA01003116A (es) 1998-09-30 1999-09-16 Procedimiento para determinar la posicion de renglones de texto en tareas de reconocimiento de texto.

Country Status (4)

Country Link
EP (1) EP1133751A1 (es)
CA (1) CA2348633A1 (es)
MX (1) MXPA01003116A (es)
WO (1) WO2000019358A1 (es)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8023697B1 (en) 2011-03-29 2011-09-20 Kaspersky Lab Zao System and method for identifying spam in rasterized images

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5633957A (en) * 1994-09-16 1997-05-27 Compaq Computer Corporation Method and apparatus for determining positional guidelines of handwritten data

Also Published As

Publication number Publication date
WO2000019358A1 (de) 2000-04-06
EP1133751A1 (de) 2001-09-19
CA2348633A1 (en) 2000-04-06

Similar Documents

Publication Publication Date Title
US10088600B2 (en) Weather recognition method and device based on image information detection
CA1155551A (en) Method and apparatus for automatic recognition of image and text area on a master
US6778700B2 (en) Method and apparatus for text detection
CN110210440B (zh) 一种表格图像版面分析方法及系统
CN109784342A (zh) 一种基于深度学习模型的ocr识别方法及终端
CN101599125A (zh) 复杂背景下图像处理的二值化方法
CA2379952A1 (en) Apparatus and method for verifying a scanned image
JP5830338B2 (ja) 帳票認識方法および帳票認識装置
CN107766854B (zh) 一种基于模板匹配实现快速页码识别的方法
CN112818952A (zh) 煤岩分界线的识别方法、装置及电子设备
EP0676891A2 (en) Method of thresholding document images
EP0159880A2 (en) Apparatus for evaluating density and evenness of printed patterns
US5454049A (en) Automatic threshold function for machine vision
CN109858484B (zh) 一种基于偏斜评价的多类别变换车牌校正方法
MXPA01003116A (es) Procedimiento para determinar la posicion de renglones de texto en tareas de reconocimiento de texto.
JP5887242B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JPH0256688A (ja) 文字切出し装置
CA2186754A1 (en) Method and device for binarising pixel data
CA2648054C (en) Apparatus and method for detection and analysis of imagery
JP4409713B2 (ja) 文書画像認識装置及び記録媒体
JP2812256B2 (ja) 文字認識装置および方法
JPH08272902A (ja) 異字体異品質文字の認識方法
JP2002016801A (ja) デジタル画像の二値化しきい値選択方法
CN112215783B (zh) 一种图像噪点识别方法、装置、存储介质及设备
JP3645403B2 (ja) 文字読取装置および文字読取方法