PROCEDIMIENTO PARA DETERMINAR LA POSICIÓN DE RENGLONES DE TEXTO EN TAREAS DE RECONOCIMIENTO DE TEXTO La invención se refiere a uri procedimiento para determinar la posición de renglones de texto en tareas de reconocimiento de texto, en donde se determina la separación de zonas claras de una sección a lo largo de la vertical a través de la formación de histograma a 1o largo de los renglones, y esta distribución de espacios claros es aplanada, por lo que se determina un valor máximo y un valor mínimo de la función obtenida de esta forma y con base en estos extremos se calculan valores limites que sirven como base para la diferenciación entre renglón de texto y espacio intermedio entre los renglones. En el caso del reconocimiento automático de textos, es decir, en el caso de la transformación de una información gráfica de un documento en caracteres de texto, que pueden ser procesados adicionalmente a través de programas de procesamiento de texto electrónicos, una precondición importante para un proceso de reconocimiento exitoso es la determinación precisa de la posición y del tamaño de los caracteres individuales. Una precondición para esto es otra vez el conocimiento de la posición y del tamaño de los renglones de texto. En el caso de dispositivos de lectura manejados manualmente se encuentra además un desarrollo no lineal de los renglones
de texto en la sección abarcada. En este caso existe la necesidad de determinar el trayecto de un renglón de texto. Un procedimiento del tipo mencionado en la introducción se conoce a partir del documerito EP 0702 329 A2. Este documento describe un procedimiento y un dispositivo para determinar el trayecto de renglones en el caso de apuntes manuscritos. Para este propósito los puntos jie símbolo son aplanados mediante suma renglón por renglón y son analizados para determinar la posición de los renglones. El objeto de la presente invención es mejorar este procedimiento. Esto se logra de conformidad con la presente invención con un procedimiento del tipo mencionado en la introducción, en donde el espacio entre renglones es determinado cuando la función presenta una combinación de un máximo con un mínimo, en donde el minimo es un valor menor que el mínimo de función más número de puntos de imagen a lo ancho de la sección de imagen/15 + 2* número de puntos de imagen a lo ancho de la sección de imagen/15 * máximo de función/número de puntos de imagen a lo ancho de la sección de imagen, y la baja de los valores de función después del máximo presenta un valor mayor que (máximo de función minimo de función) 12 . Este desarrollo ha logrado excelentes resultados en la práctica. Es provechoso tener un desarrollo del procedimiento de tal manera que para determinar el borde izquierdo de un renglón,
se determina la distribución de partes claras de una sección de imagen abarcada a lo lajrgo de una linea horizontal y la función obtenida de esta forma representa el inicio del renglón a través de una elevación repentina del valor de la función. De esta forma el inicio de un renglón puede ser determinado de manera sencilla. Además se debe asegurar para determinar la posición de renglones de texto que solamente se toman en cuenta imágenes ?;ue contienen renglones de texto reales y un error del usuario como por ejemplo la colocación de un lápiz de lectura demasiado lejos hacia la izquierda con relación al inicio de los renglones no afecta la determinación de renglones. Es provechoso, después de la determinación inicial de la posición de un renglón determinar el desarrollo posterior del mismo a través de la evaluación de la información sobre los renglones de texto conocidos. Mediante esta evaluación del resultado de la clasificación de caracteres se puede obtener una determinación especialmente precisa del desarrollo de un renglón. La invención se explicará óon mayores detalles con base en figuras. La figura 1 es una sección de texto típica de lo que es abarcado por un dispositivo de lectura manejado manualmente, asi como el histograma determinado de esta forma y La figura 2 es el histograma filtrado con los parámetros
exponencial i índice de curva de .aplanamiento Durante el proceso de filtración se determinan también el valor máximo absoluto Val ueircax es decir el número de puntos de imagen negros (Black Pixel) del renglón más oscuro y el número mínimo absoluto Val uemí n, es decir el número de puntos de imagen negros (Black Pixe1) del renglón más claro, A partir de estos dos valores se determinan parámetros para la calificación de la imagen Estos parámetros son: limite de hueco = (Val uemax Val uemin) /2 por lo menos sin embargo el número de puntos de imagen a lo ancho de la sección de i Imagen/ 30. v Borde minimo = Val uemin + úmero de puntos de imagen a lo ancho de la sección de i imagen/1 5 máximo sin embargo 2* número de puntos de imagen a lo ancho de la sección de imagen/15 Lími te mínimo = borde mínimo + (2* número de puntos de imagen a lo ancho de la sección de imagen/ 15 * (Val uemax/ número de puntos de imagen a lo ancho de la sección de imagen) ) máximo sin embargo 3 * número de pv ntos de imagen a lo ancho de la sección de imagen/ 15 Con base en la función f ' (y) y con base a los valores límites determinados como por ejemplo se ilustra en la figura 2, se califica ahora una imagen abarcada en cuanto a la presencia de renglones de texto y espa ios en blanco entre renglones.
Para este propósito se estudia el desarrollo de la curva, para determinar si se encuentran valores que son menores que el parámetro umbral mínimo Si es el caso, entonces la zona en cuestión es calificaba como mínimo válido y por consiguiente como posible e?pacio intermedio entre renglones. Un espacio intermedio entre renglón real se encuentra sin embargo solamente en el caso en el cual se señala la existencia de un renglón de texto a través de un máximo contiguo con una cierta cltaridad. Estos máximos válidos se definen a través de una disminución subsiguiente del valor de la curva por una cantidad mayor que el límite de hueco. La conjunción de UQ máximo válido con un mínimo válido representa la transición de. un renglón de texto a un espacio entre renglones. Para una determinación precisa de esta transición se emplea el parámetro borde mínimo. El punto en el cual la curva entre un máximo válido y un mínimo válido corta este límite se determina como borde de renglón. Para determinar el borde izquierdo de un renglón se determina un histograma de columna de conformidad con lo siguiente tfeig- t-l /(x) =. T ( BlackPixel)
x índice de colur?na de la sección de imagen Height altura de imagen la información de color de los puntos de imagen de cada
palo hacia abajo, independientemente del tamaño de los caracteres; Caracteres especiales : estos caracteres no pueden clasificarse claramente con base a su borde inferior. Con base en estas clasificaciones y con base en un valor de probabilidad obtenido durante el proceso de clasificación G que se refiere a la clasificación correcta del carácter, se determina ahora la nueva altura de renglón Height de la siguiente manera: G = probabil idad* CYC MAX WEÍGHT CYC MAX EXTRP?R-t ¿) OldHeighl[i] + NewH ight * G Heighl = - IcO CYC MAX EXTRPAR f G
G = peso de la altura de renglón determinada a partir de los caracteres actuales Probabilidad = probabili .dad de clasificación correcta de caracteres (rango de valor entre 0 y 1) CYC_MAX_WEIGHT = peso máxime de la nueva posición de carácter (por ejemplo: 5) Height - altura proyectada de renglón (altura de mayúsculas) CYC_MAX_EXTRPAR = tamaño de la altura anterior (por ejemplo: 3) OldHeightU = altura anterior NewHeight = altura de rengJLón derivada del carácter actual (tamaño de mayúscula)
i = índice de altura anterior La determinación del desarrollo del borde inferior de renglón de texto se efectúa de conformidad con lo siguiente: G = (probabilidad + ) *CYC MAX WEIGHT CYC MAX WEIGHT
Increase = — Oldlncrease + Newlncrqase * G í+s
Increase * DeltaX +50 Base = New Base + 100
G = peso de la nueva posición de carácter probabilidad = probabilidad de clasificación correcta de carácter CYC_MAX_WEIGHT = peso máximjo de la nueva posición de carácter (por ejemplo: 5) Increase = elevación actual proyectada con relación a la línea basal en porcentaje Oldlncrease = elevación anterior con relación a la línea basal en porcentaje Newlncrease = elevación alculada de la línea basal en porcentaje a partir de la posición del carácter actual Base = posición de línea basal proyectada (redondeada a un valor entero) NewBase = posición de línea basal calculada a partir de la posición del carácter actual