CORRECCIÓN DE DISTORSIONES EN EL PROCESO DE FORMAS
CAMPO DE LA INVENCIÓN La presente invención se refiere, generalmente, a procesos de imágenes de documentos y, específicamente, a correcciones de distorsiones en estas imágenes de documentos . ANTECEDENTES DE LA INVENCIÓN En muchos sistemas que forman imágenes en documentos, un número grande de formas son explorados en una computadora, las cuales luego procesan las imágenes del documento resultantes para extraer la información pertinente. Tipicamente, las formas comprenden modelos impresos previamente, que contienen campos antes definidos, que se han llenado con caracteres a mano o impresos en máquina. Para extraer la información que se ha llenado, la computadora debe primero identificar los campos del modelo y luego descifrar los caracteres que aparecen en los campos. Varios métodos de análisis de imágenes y reconocimiento de caracteres ópticos ("OCT") se conocen en el arte para estos propósitos . Con el fin de identificar los campos del modelo y asignar los caracteres para corregir campos, una técnica común es para que la computadora registre cada imagen de
documento con una imagen de referencia del modelo. Una vez que el modelo se registra, puede excluirse de la imagen del documento, dejando sólo los caracteres escritos a mano en sus ubicaciones apropiadas sobre la página. Dicho registro puede ser dificil, sin embargo, debido a las distorsiones introducidas en la exploración de la forma original, que incluyen el torcido, rotación, alabeado y otros cambios en la escala. Un método para tratar estas distorsiones se describe en la patente de EE.UU., No. 5,182,656, cuya descripción se incorpora aquí como referencia. La imagen se divide en un número de segmentos relativamente pequeños, que traslapan. Cada uno de los segmentos es luego desplazado con el fin de llevarlo en alineamiento con un segmento correspondiente, apropiado, de la imagen modelo de referencia. Transformaciones más complejas, tal como las rotaciones o cambios de escala, no se realizan en estos segmentos. La transformación de toda la imagen es así representada como una combinación de los desplazamientos de los segmentos pequeños, que pueden aproximarse a las rotaciones y cambios de escala, si los segmentos se han suficientemente pequeños. La Figura 1 es una ilustración esquemática que muestra un detalle de una imagen de un documento 20 de forma de llenado, útil en comprender el método de la patente de
EE.UU., No. 5,182,656, y de métodos similares conocidos en el arte. Aquí un nombre, que comprende los caracteres 24, se ha llenado en un cuadro 22 provisto por un modelo en el documento 20. Este cuadro está levemente girado con relación a su posición horizontal apropiada en el modelo de referencia. Con el fin de corregir esta rotación y para otras distorsiones en la imagen explorada, la imagen del documento se divide en segmentos 26, 28, 30, 32, etc. Esta imagen se analiza para determinar la transformación de desplazamiento apropiada que se va a aplicar a cada uno de los segmentos, según se especifica en la patente. La Figura 2 es una ilustración esquemática de los segmentos 26, 28, 30 y 32 en sus posiciones transformadas, respectivas. Para compensar la rotación, se aplica un diferente desplazamiento a cada uno de los segmentos. Los desplazamientos relativos son exagerados en la figura para claridad de ilustración. Asimismo, se ha introducido un traslape entre los segmentos transformados, tal como puede resultar de una distorsión de escala en la imagen explorada, por ejemplo. En estas áreas, la patente, antes mencionada, sugiere realizar una operación "O" para cada pixel (elemento de imagen) , con el fin de evitar tener un segmento sobre-escrito sobre otro. La Figura 3 ilustra esquemáticamente los resultados de los desplazamientos mostrados en la Figura 2.
Los caracteres 24 son interrumpidos en las porciones superiores respectivas 34 y las porciones inferiores 36, debido a que los caracteres ocurren ^casualmente para cruzar los límites entre los segmentos 26 y 30 y entre los segmentos 28 y 32. En consecuencia, aunque el cuadro 22 pueda estar en el extremo, será registrado exitosamente con el cuadro correspondiente en la imagen del modelo de referencia, los caracteres dentro del cuadro son difíciles o imposibles de computar por el descifrador. Este documento probablemente tendrá que ser pasado a un operador humano para la entrada de datos, agregando sustancialmente el costo del proceso del documento. Lo que es peor, la computadora puede interpretar mal los caracteres distorsionados, conduciendo a un error en los datos extraídos desde la forma. La patente de EE.UU., No. 5,793,887, cuya descripción se incorpora aquí como referencia, describe otro método para el alineamiento de imágenes para la eliminación del modelo. En este caso, una imagen del documento rellena y una imagen del modelo de referencia, son divididas en bandas verticales. Las bandas se desplazan en relación mutua, con el fin de correlacionar las líneas en la imagen del documento con las líneas en las bandas correspondientes de la imagen del modelo de referencia. Si fuera necesario, el procedimiento es luego repetido usando bandas horizontales.
Así, este método puede también conducir a la desintegració de los caracteres, como se ilustra en la Figura 3.
COMPENDIO DE LA INVENCIÓN Es un objeto de la presente invención suministra métodos y aparatos mejorados para el proceso de imágenes y, particularmente, para el proceso de imágenes de documentos de formas de llenado. Es un objeto más de algunos aspectos de l presente invención suministrar métodos y aparatos para el proceso de imágenes de documentos que mejoren la capacida de leer los caracteres en dichas imágenes, en la presenci de distorsiones y rotaciones de las imágenes. Es un objeto particular de estos aspectos de la presente invenció remediar los problemas de la capacidad de lectura que pudieran surgir debido al desalineamiento entre segmentos de dichas imágenes que se desplazan para el fin del registro del modelo. En modalidades preferidas de la presente invención, una imagen de documento de entrada, que contiene caracteres llenados en un modelo de forma, se procesa con el fin de registrar este modelo en la imagen, con una imagen de modelo de referencia. Cualquier método adecuado, conocido en el arte, se puede usar para este propósito. Regiones de interés, definidas como regiones que contienen los
caracteres de llenado, se identifican en la image procesada. Cada una de estas regiones se comprueb preferiblemente con el fin de determinar si la capacidad d lectura de las caracteres en la región ha sido afectad adversamente por las transformaciones aplicadas en el proceso de la imagen para registrarla con el modelo d referencia. Típicamente, aunque no exclusivamente, tales efectos adversos resultan cuando diferentes partes de l región fallan en diferentes segmentos de la imagen, a la cual se aplican diferentes transformaciones. Los contenidos de cada una de las regiones afectadas (o de todas las regiones) son luego borrados de la imagen procesada y so reemplazados por los contenidos de la región correspondiente de la imagen de entrada. De esta manera, todos los caracteres en la imagen de entrada son colocados e ubicaciones correctas con relación al modelo de referencia, sustancialmente sin efecto adverso en la capacidad de lectura de los caracteres. Aunque se describen aquí modalidades preferidas - con referencia a las imágenes que forman el documento, se apreciará que los principios de la presente invención pueden similarmente ser aplicados a otros contextos, igualmente. Ocurre frecuentemente en el proceso de imágenes que una transformación digital aplicada a una imagen no es exacta, en el sentido que el desplazamiento resultante entre dos
píxeles vecinos es diferente del desplazamiento teórico. Esta inexactitud puede ser debida a las transformaciones d segmento locales, como se describió antes, o a otro errores, tal como el redondeo o decimales. Si hay área d interés particular en la imagen, tal como un bloque de text u otras características de imagen significantes, el métod de la presente invención puede ser usado ventajosamente par aumentar la capacidad de lectura y/o claridad de lo detalles en estas áreas. Por lo tanto, se proporciona, de acuerdo con un modalidad preferida de la presente invención, un método par procesar una imagen de entrada, este método incluye: aplicar una o más transformaciones a la imagen d entrada, por lo cual se aplican diferentes desplazamientos diferentes píxeles en la imagen de entrada, para así genera una imagen de salida; seleccionar en la imagen de salida una región qu contiene un contenido de interés; ubicar en la imagen de entrada la región que corresponde a la región seleccionada en la imagen de salida; y sustituir el contenido de la región ubicada en la imagen de entrada por el contenido de la región seleccionada en la imagen de salida.
Preferiblemente, la aplicación de una o más transformaciones incluye dividir la imagen de entrada e segmentos, y determinar una transformación que se va aplicar a cada segmento. En una modalidad preferida, l imagen de entrada incluye un desalineamiento del modelo e la región, que se llena con el contenido de interés, determinar la transformación que se va a aplicar a cad segmento a cada segmento, incluye encontrar una o más traslaciones del segmento que compensen aproximadamente un distorsión de la imagen de entrada con relación a un modelo de referencia, por lo cual la imagen de salida es registrad con el modelo de referencia. Típicamente, esta una o más traslaciones compensan la rotación de la imagen de entrada en relación con el modelo de referencia. Asimismo, típicamente, la aplicación de una o más transformaciones incluye aplicar diferentes transformaciones a dos o más segmentos que se unen mutuamente, y la selección de la región incluye seleccionar una región que se divide entre dos o más segmentos a los cuales se aplican diferentes transformaciones. Preferiblemente, la imagen de entrada incluye un modelo que delinea la región, que se llena con el contenido de interés, y seleccionar la región incluye identificar un campo del modelo que se intenta para recibir el contenido de interés. Alternativamente, o adicionalmente, la selección de
la región incluye remover el moldeo de la imagen de salida seleccionar una porción de la imagen remanente, después qu se ha removido el modelo. Además, preferiblemente, la selección de la regió incluye seleccionar una región responsiva a una o má transformaciones, aplicadas a la imagen de entrada. En un modalidad preferida, el contenido de interés incluy caracteres alfanumérico, y la selección de la región incluy seleccionar una región en que probablemente una o más transformaciones han afectado adversamente la capacidad d lectura de los caracteres en la región. Preferiblemente, la ubicación de la región incluye encontrar la región de la imagen de entrada que se transformó en la región seleccionada de la imagen de salid por una o más transformaciones. Además, preferiblemente, la substitución del contenido de la región ubicada incluye encontrar los componentes conectados en la región ubicada y copiar los componentes conectados a la región seleccionada en la imagen de salida. Más preferiblemente, la copia de los componentes conectados incluye encontrar, para cada uno de estos componentes conectados, en la región ubicada, una operació de traslación, que será aplicada a todos los puntos en el componente conectado. Preferiblemente, el hallazgo de la operación de traslación incluye, para cada uno de los
componentes conectados, escoger un punto sobre o en un vecindad del componente conectado y determinar un traslación que se aplique a ese punto por una o má transformaciones, aplicadas a la imagen de entrada. En un modalidad preferida, el hallazgo de los componente conectados incluye encontrar caracteres en la imagen. En una modalidad preferida más, el contenido d interés incluye caracteres alfanuméricos, y el métod incluye aplicar el reconocimiento de caracteres ópticos a contenido sustituido en la región seleccionada. Igualmente se suministra, de acuerdo con un modalidad preferida de la presente invención, un aparat para el proceso de una imagen de entrada de un documento, que incluye un modelo, que tiene una o más regiones que s llenan con el contenido, el aparato incluye un procesador d forma, el cual se adapta para aplicar una o má transformaciones a la imagen de entrada, para así genera una imagen de salida en la cual el modelo se registra, co un moldeo de referencia, para seleccionar al menos una d las regiones llenadas en la imagen de salida, para ubicar e la imagen de entrada al menos una región llenada que corresponde a cuando menos una región seleccionada en la imagen de salida, y para sustituir el contenido de al menos una región ubicada en la imagen de entrada para el contenido
de cuando menos una región seleccionada en la imagen d salida. Preferiblemente, el contenido llenado en una o má regiones incluye caracteres alfanumérico, y el procesado aplica el reconocimiento de caracteres ópticos al contenid sustituido en al menos una región seleccionada, para así extraer el contenido del documento. Además, preferiblemente, el aparato incluye un dispositivo que forma imágenes, el cual se adapta para explorar el documento, para así genera la imagen de entrada. Se suministra, adicionalmente, de acuerdo con un modalidad preferida de la presente invención, un producto de software (programa) de computadora, -para el proceso de un imagen de entrada, el producto incluye un medio que se pued leer por computadora, en el cual se almacenan instrucciones del programa, estas instrucciones, cuando se leen por l computadora, causan que esta computadora aplique una o más transformaciones a la imagen de entrada, por lo cual se aplican diferentes desplazamientos a diferentes píxeles en la imagen de entrada, para así generar una imagen de salida, para seleccionar en esta imagen de ~ salida una región que contiene el contenido de interés, para ubicar en la imagen de entrada la región que corresponde a la región seleccionada en la imagen de salida, y para sustituir el contenido de la región ubicada en la imagen de entrada por
el contenido de la región seleccionada en la imagen d salida. En una modalidad preferida, la imagen de entrad incluye un modelo que delinea la región, el cual se llen con el contenido de interés, y las instrucciones causan qu la computadora aplique una o más transformaciones para as registrar la imagen de salida con un modelo de referencia. La presente invención se comprenderá má completamente de la siguiente descripción detallada de la modalidades preferidas, tomadas junto con los dibujos, e los cuales:
BREVE DESCRIPCIÓN DE LOS DIBUJOS La Figura 1 es una ilustración esquemática de u detalle de una imagen de un documento de forma llenado, útil en comprender la presente invención; la Figura 2 es una ilustración esquemática, qu muestra los desplazamientos relativos aplicados a segmentos de la imagen de la Figura 1 en el curso del proceso de l imagen, usando un método conocido en el arte; la Figura 3 es una ilustración esquemática, que muestra la imagen de la Figura 1, en seguida del proceso de la imagen, usando el método de la Figura 2; la Figura 4 es una ilustración esquemática representativa de un sistema para el proceso de imágenes de
documentos, de acuerdo con una modalidad preferida de l presente invención; la Figura 5 es un diagrama de flujo, que ilustr esquemáticamente un método para el proceso de imágenes, d acuerdo con una modalidad preferida de la present invención; y la Figura 6 es una ilustración esquemática, qu muestra los resultados del proceso de la imagen de documento de la Figura 1, usando el método de la Figura 5.
DESCRIPCIÓN DETALLADA DE LAS MODALIDADES PREFERIDAS La Figura 4 es una ilustración esquemática, representativa, de un sistema 40 para almacenar y exhibi imágenes de documentos, de acuerdo con una modalida preferida de la presente invención. El sistema 40 comprend un escáner 42, o cualquier tipo adecuado de dispositivo qu captura imágenes, conocido en el arte, el cual recibe .explora un documento, que comprende una forma impres previamente, tal como el documento 20, que se llena co caracteres escritos a mano, mecanografiados o impresos. El escáner captura una imagen del documento y transporta los datos de imagen correspondientes a un procesador 46 de formas, que comprende típicamente una computadora adecuada para fines generales. Alternativamente, la imagen entra al procesador desde otra fuente. Este procesador 46 registra la
imagen del documento con una imagen modelo de referencia, que se almacena en una memoria 48, tal como un disc magnético u óptico. El procesador luego corrige la imagen e las distorsiones que pudieran haber ocurrido en lo caracteres, debido al proceso de registro, como se describ abajo. Opcionalmente, el procesador luego lee lo caracteres, usando métodos de reconocimiento de caractere ópticos (OCT) conocidos en el arte. Las funciones de proceso de imagen del procesado 46 se realizan preferiblemente usando un software que oper en el procesador, el cual realiza una modalidad de l presente invención, como se describe en detalle abajo. Est software puede ser suministrado en medios tangibles, ta como disquetes o CD-ROM, y cargados en el procesador. Alternativamente, el software puede ser descargado a procesador por medio de una conexión de red, u otro enlac electrónico. Asimismo, alternativamente, el procesador 4 puede comprender elementos dedicados alambrados o u procesador de señales digitales, para llevar a cabo alguna o todas las etapas del proceso de imágenes. La Figura 5 es un diagrama de flujo que ilustr esquemáticamente un método para el proceso de imágenes e documentos de formas llenados, de acuerdo con una modalida preferida de la presente invención. Este método remedia l distorsión e interrupciones de los caracteres en la imagen,
debidos a los desplazamientos locales y otra transformaciones aplicadas en registrar la imagen del documento con un modelo de referencia. En una etapa 50 d transformación de imagen, se aplican una o más transformaciones a una imagen de entrada para así llevar u modelo en la imagen en registro con un modelo de referenci almacenado. La imagen de entrada comprende preferiblement una imagen binaria, que se deriva ele los datos explorados por el escáner 42, usando cualquier método adecuado d proceso de imágenes, conocido en el arte. Alternativamente, la imagen de entrada puede comprender una imagen de escal gris o de color. Sustancialmente, cualquier método adecuado puede ser usado para transformar la imagen en la etapa 50, tal como los descritos en las patentes de EE.UU., antes mencionadas, Nos. 5,182,656 y 5,793,887. La imagen de salida resultante probablemente contendrá regiones en que la capacidad de lectura de los caracteres se afectó adversamente, como se muestra en la Figura 3, por ejemplo. Preferiblemente, las transformaciones que se aplican a cada segmento de la imagen de entrada, son guardadas para referencia ulterior. Una etapa 52 de identificación de región, el procesador 46 identifica regiones de interés en la imagen de salida. Estas son regiones del modelo que se llenan y pueden haber sido afectadas adversamente en la etapa 50 de
transformación. Preferiblemente, las regiones se selecciona de una lista de campos conocidos en el modelo. Alternativa adicionalmente, las regiones son seleccionadas removiendo e modelo de la imagen, después del registro, como se describi en las patentes, antes mencionadas, y se encuentran en la áreas de llenado que permanecen. Opcionalmente, en la etap 54 de evaluación de daño, el procesador determina en cuále de las regiones de interés los caracteres se ha distorsionado en la etapa 50 de transformación. Éste será e caso, por ejemplo, cuando dos o más partes de una regió dada, tal como la región contenida dentro del cuadro 2
(Figuras 1 y 3) , caen en diferentes segmentos de la imagen, a la cual se aplican transformaciones significantement diferentes. Estas regiones "dañadas" se seleccionan para e proceso subsiguiente, mientras las regiones en que todos lo segmentos se transforman en sustancialmente el mismo camino, no necesitan ser procesadas ulteriormente. En una etapa 5 de borrado del contenido, 56, los caracteres (u otr contenido) en las regiones seleccionadas de interés so borrados de la imagen de salida. Con el fin de reemplazar los contenidos borrados, el procesador 46 encuentra, para cada una de las regiones d interés seleccionadas, una región de fuente correspondient en la imagen de entrada, en una etapa 58 que encuentra l región de entrada. Preferiblemente, la región de fuente s
encuentra trabajando hacia atrás a través de la transformaciones que se aplican para llegar a la regió seleccionada en la imagen de salida en la etapa 50. En un etapa 60 de encuentro de componente, el procesador 4 encuentra los componentes conectados en la región de fuente, como es conocido en el arte. Estos componentes conectado son grupos contiguos o casi contiguos, de píxeles, qu cumplen con los criterios morfológicos que los identifica con alta probabilidad de pertenecer a los caracteres escritos. Los caracteres 24 en la Figura 1 cumplen con tale criterios, por ejemplo. Preferiblemente, en la etapa 58, los límites d cada una de las regiones de fuente se reinan para sí exclui los componentes conectados que son contenidos sól parcialmente en el campo del modelo que corresponde a l región de fuente. Para lograr este refinamiento, la hiler vacia superior extrema (es decir, una hilera que contiene sólo píxeles blancos) se encuentra en la región, y la siguiente hilera no vacía, debajo de ella, se registra como un candidato de arriba. Similarmente, la hilera vacía más baja en el campo se encuentra, y la siguiente hilera no vacía se registra como un candidato del .fondo. Si los candidatos superior y de fondo no están en conflicto (por ejemplo, por traslape), los límites de la región son redefinidos para ser los candidatos -superior y de fondo. Un
procedimiento similar se aplica a los costados izquierdo derecho de la región. Estas etapas pueden resultar en algú encogimiento de la región. Los límites de la regió (ajustados) pueden de nuevo ser expandidos en toda direcciones, en la etapa 60, para así incluir todos lo componentes conectados de todos los píxeles dejados dentr de la región. Si esta etapa resulta, sin embargo, e cualquier costado de la región que se agranda por más de u umbral predefinido (por ejemplo del 20%) más allá de lo límites originales del campo correspondiente, la región s excluye preferiblemente de las etapas restantes del proces de la Figura 5. De esta manera, los artefactos en la image de salida, debido a los componentes conectados extraños, qu pueden no pertenecer dentro de este campo de modelo, s evitan. Para cada componente conectado encontrado en l región de interés, el procesador 46 determina, en una etap 62 de transformación de posición, una transformació apropiada de las coordenadas de posición, con el fin d trasladar el componente a una posición correspondiente en la región seleccionada de la imagen de salida. Preferiblemente, un punto en el componente conectado se escoge, tal como su centro de gravedad o, alternativamente, una de sus esquinas. El procesador luego determina la traslación de red que se aplicó a este punto escogido en la transformación de la
lí
imagen de entrada en la imagen de salida. En una etapa 64 d pegar 64, esta misma traslación de red se aplica a todos lo puntos en el componente conectado. En esta forma, lo componentes conectados son pegados uno por uno en la posiciones apropiadas en la región de interés en lugar d los contenidos previos de la región, que son borrados en l etapa 56. Alternativamente, la etapa 60 puede ser saltada, una transformación sencilla de traslación puede se determinada y aplicada para pegar todos los contenidos de l región de interés desde la imagen de entrada a la imagen d salida. La Figura 6 es una ilustración esquemática de cuadro 22 y los caracteres 24, como se ven en la imagen d salida, generada de acuerdo con el método de la Figura 5. Las porciones interrumpidas 34 y 36 de los caracteres se ha borrado, y en su lugar se han pegado los caractere originales en el cuadro desde la imagen de entrada de l Figura 1. Debido a la rotación de la imagen de entrada, cad uno de los caracteres en la imagen de salida, mostrados e la Figura 5, también aparecen girados levemente, puesto qu se aplicó la misma transformación en la etapa 64 en todos los puntos en el carácter. Esta rotación es superad fácilmente, sin embargo, por los programas de OCT conocidos en el arte, y la mayoría de los problemas de interrupción de los caracteres, vistos en la Figura 3, se evitan.
Aunque se describieron aquí modalidade preferidas, con referencia al proceso de formas basadas e modelos, los principios de la presente invención pueden se aplicados similarmente a procesos de otos tipos de imágenes, igualmente. Frecuentemente ocurren en varios contextos d proceso de imágenes que una transformación digital aplicad a una imagen no es exacta, en el sentido que e desplazamiento resultante entre dos pixel vecinos e diferente del desplazamiento teórico. Este inexactitud pued ser debida a las transformaciones del segmento local, com se describió antes, o a otros errores, tal como el redonde o la forma decimal. Si hay un bloque de texto en la image que debe ser leído (independientemente de la presencia de u modelo) , el método de la presente invención puede ser usad ventajosamente bajo estas circunstancias para aumentar s capacidad de lectura. Como otro ejemplo, en una image aérea, que gira y se alabea para compensar las condiciones de la imagen, la presente invención puede ser usada para preservar la visibilidad de ciertos detalles en esa imagen, que son de interés particular y así deben ser presentados con distorsiones mínimas. Aplicaciones ulteriores, tal como esas, serán evidentes a los expertos en la materia. Se apreciará así que las modalidades preferidas, antes descritas, son mencionadas en forma de ejemplo, y que la presente invención no se limita a lo particularmente
mostrado y descrito anteriormente. Más bien, el alcance d la presente invención incluye tanto combinaciones om subcombinaciones de las varias características descrita aquí anteriormente, al igual que las variaciones y su modificaciones, que serán aparentes a las personas expertas en la material, de la lectura de la descripción anterior las cuales no se describieron en la técnica anterior.