MXPA02008494A - Correccion de distorsiones en el proceso de formas. - Google Patents

Correccion de distorsiones en el proceso de formas.

Info

Publication number
MXPA02008494A
MXPA02008494A MXPA02008494A MXPA02008494A MXPA02008494A MX PA02008494 A MXPA02008494 A MX PA02008494A MX PA02008494 A MXPA02008494 A MX PA02008494A MX PA02008494 A MXPA02008494 A MX PA02008494A MX PA02008494 A MXPA02008494 A MX PA02008494A
Authority
MX
Mexico
Prior art keywords
region
content
image
input image
transformations
Prior art date
Application number
MXPA02008494A
Other languages
English (en)
Inventor
Aviad Zlotnick
Original Assignee
Ibm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ibm filed Critical Ibm
Publication of MXPA02008494A publication Critical patent/MXPA02008494A/es

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T5/80
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

La presente invencion se refiere, generalmente, a procesos de imagenes de documentos y, especificamente, a correcciones de distorsiones en estas imagenes de documentos.

Description

CORRECCIÓN DE DISTORSIONES EN EL PROCESO DE FORMAS CAMPO DE LA INVENCIÓN La presente invención se refiere, generalmente, a procesos de imágenes de documentos y, específicamente, a correcciones de distorsiones en estas imágenes de documentos . ANTECEDENTES DE LA INVENCIÓN En muchos sistemas que forman imágenes en documentos, un número grande de formas son explorados en una computadora, las cuales luego procesan las imágenes del documento resultantes para extraer la información pertinente. Tipicamente, las formas comprenden modelos impresos previamente, que contienen campos antes definidos, que se han llenado con caracteres a mano o impresos en máquina. Para extraer la información que se ha llenado, la computadora debe primero identificar los campos del modelo y luego descifrar los caracteres que aparecen en los campos. Varios métodos de análisis de imágenes y reconocimiento de caracteres ópticos ("OCT") se conocen en el arte para estos propósitos . Con el fin de identificar los campos del modelo y asignar los caracteres para corregir campos, una técnica común es para que la computadora registre cada imagen de documento con una imagen de referencia del modelo. Una vez que el modelo se registra, puede excluirse de la imagen del documento, dejando sólo los caracteres escritos a mano en sus ubicaciones apropiadas sobre la página. Dicho registro puede ser dificil, sin embargo, debido a las distorsiones introducidas en la exploración de la forma original, que incluyen el torcido, rotación, alabeado y otros cambios en la escala. Un método para tratar estas distorsiones se describe en la patente de EE.UU., No. 5,182,656, cuya descripción se incorpora aquí como referencia. La imagen se divide en un número de segmentos relativamente pequeños, que traslapan. Cada uno de los segmentos es luego desplazado con el fin de llevarlo en alineamiento con un segmento correspondiente, apropiado, de la imagen modelo de referencia. Transformaciones más complejas, tal como las rotaciones o cambios de escala, no se realizan en estos segmentos. La transformación de toda la imagen es así representada como una combinación de los desplazamientos de los segmentos pequeños, que pueden aproximarse a las rotaciones y cambios de escala, si los segmentos se han suficientemente pequeños. La Figura 1 es una ilustración esquemática que muestra un detalle de una imagen de un documento 20 de forma de llenado, útil en comprender el método de la patente de EE.UU., No. 5,182,656, y de métodos similares conocidos en el arte. Aquí un nombre, que comprende los caracteres 24, se ha llenado en un cuadro 22 provisto por un modelo en el documento 20. Este cuadro está levemente girado con relación a su posición horizontal apropiada en el modelo de referencia. Con el fin de corregir esta rotación y para otras distorsiones en la imagen explorada, la imagen del documento se divide en segmentos 26, 28, 30, 32, etc. Esta imagen se analiza para determinar la transformación de desplazamiento apropiada que se va a aplicar a cada uno de los segmentos, según se especifica en la patente. La Figura 2 es una ilustración esquemática de los segmentos 26, 28, 30 y 32 en sus posiciones transformadas, respectivas. Para compensar la rotación, se aplica un diferente desplazamiento a cada uno de los segmentos. Los desplazamientos relativos son exagerados en la figura para claridad de ilustración. Asimismo, se ha introducido un traslape entre los segmentos transformados, tal como puede resultar de una distorsión de escala en la imagen explorada, por ejemplo. En estas áreas, la patente, antes mencionada, sugiere realizar una operación "O" para cada pixel (elemento de imagen) , con el fin de evitar tener un segmento sobre-escrito sobre otro. La Figura 3 ilustra esquemáticamente los resultados de los desplazamientos mostrados en la Figura 2.
Los caracteres 24 son interrumpidos en las porciones superiores respectivas 34 y las porciones inferiores 36, debido a que los caracteres ocurren ^casualmente para cruzar los límites entre los segmentos 26 y 30 y entre los segmentos 28 y 32. En consecuencia, aunque el cuadro 22 pueda estar en el extremo, será registrado exitosamente con el cuadro correspondiente en la imagen del modelo de referencia, los caracteres dentro del cuadro son difíciles o imposibles de computar por el descifrador. Este documento probablemente tendrá que ser pasado a un operador humano para la entrada de datos, agregando sustancialmente el costo del proceso del documento. Lo que es peor, la computadora puede interpretar mal los caracteres distorsionados, conduciendo a un error en los datos extraídos desde la forma. La patente de EE.UU., No. 5,793,887, cuya descripción se incorpora aquí como referencia, describe otro método para el alineamiento de imágenes para la eliminación del modelo. En este caso, una imagen del documento rellena y una imagen del modelo de referencia, son divididas en bandas verticales. Las bandas se desplazan en relación mutua, con el fin de correlacionar las líneas en la imagen del documento con las líneas en las bandas correspondientes de la imagen del modelo de referencia. Si fuera necesario, el procedimiento es luego repetido usando bandas horizontales.
Así, este método puede también conducir a la desintegració de los caracteres, como se ilustra en la Figura 3.
COMPENDIO DE LA INVENCIÓN Es un objeto de la presente invención suministra métodos y aparatos mejorados para el proceso de imágenes y, particularmente, para el proceso de imágenes de documentos de formas de llenado. Es un objeto más de algunos aspectos de l presente invención suministrar métodos y aparatos para el proceso de imágenes de documentos que mejoren la capacida de leer los caracteres en dichas imágenes, en la presenci de distorsiones y rotaciones de las imágenes. Es un objeto particular de estos aspectos de la presente invenció remediar los problemas de la capacidad de lectura que pudieran surgir debido al desalineamiento entre segmentos de dichas imágenes que se desplazan para el fin del registro del modelo. En modalidades preferidas de la presente invención, una imagen de documento de entrada, que contiene caracteres llenados en un modelo de forma, se procesa con el fin de registrar este modelo en la imagen, con una imagen de modelo de referencia. Cualquier método adecuado, conocido en el arte, se puede usar para este propósito. Regiones de interés, definidas como regiones que contienen los caracteres de llenado, se identifican en la image procesada. Cada una de estas regiones se comprueb preferiblemente con el fin de determinar si la capacidad d lectura de las caracteres en la región ha sido afectad adversamente por las transformaciones aplicadas en el proceso de la imagen para registrarla con el modelo d referencia. Típicamente, aunque no exclusivamente, tales efectos adversos resultan cuando diferentes partes de l región fallan en diferentes segmentos de la imagen, a la cual se aplican diferentes transformaciones. Los contenidos de cada una de las regiones afectadas (o de todas las regiones) son luego borrados de la imagen procesada y so reemplazados por los contenidos de la región correspondiente de la imagen de entrada. De esta manera, todos los caracteres en la imagen de entrada son colocados e ubicaciones correctas con relación al modelo de referencia, sustancialmente sin efecto adverso en la capacidad de lectura de los caracteres. Aunque se describen aquí modalidades preferidas - con referencia a las imágenes que forman el documento, se apreciará que los principios de la presente invención pueden similarmente ser aplicados a otros contextos, igualmente. Ocurre frecuentemente en el proceso de imágenes que una transformación digital aplicada a una imagen no es exacta, en el sentido que el desplazamiento resultante entre dos píxeles vecinos es diferente del desplazamiento teórico. Esta inexactitud puede ser debida a las transformaciones d segmento locales, como se describió antes, o a otro errores, tal como el redondeo o decimales. Si hay área d interés particular en la imagen, tal como un bloque de text u otras características de imagen significantes, el métod de la presente invención puede ser usado ventajosamente par aumentar la capacidad de lectura y/o claridad de lo detalles en estas áreas. Por lo tanto, se proporciona, de acuerdo con un modalidad preferida de la presente invención, un método par procesar una imagen de entrada, este método incluye: aplicar una o más transformaciones a la imagen d entrada, por lo cual se aplican diferentes desplazamientos diferentes píxeles en la imagen de entrada, para así genera una imagen de salida; seleccionar en la imagen de salida una región qu contiene un contenido de interés; ubicar en la imagen de entrada la región que corresponde a la región seleccionada en la imagen de salida; y sustituir el contenido de la región ubicada en la imagen de entrada por el contenido de la región seleccionada en la imagen de salida.
Preferiblemente, la aplicación de una o más transformaciones incluye dividir la imagen de entrada e segmentos, y determinar una transformación que se va aplicar a cada segmento. En una modalidad preferida, l imagen de entrada incluye un desalineamiento del modelo e la región, que se llena con el contenido de interés, determinar la transformación que se va a aplicar a cad segmento a cada segmento, incluye encontrar una o más traslaciones del segmento que compensen aproximadamente un distorsión de la imagen de entrada con relación a un modelo de referencia, por lo cual la imagen de salida es registrad con el modelo de referencia. Típicamente, esta una o más traslaciones compensan la rotación de la imagen de entrada en relación con el modelo de referencia. Asimismo, típicamente, la aplicación de una o más transformaciones incluye aplicar diferentes transformaciones a dos o más segmentos que se unen mutuamente, y la selección de la región incluye seleccionar una región que se divide entre dos o más segmentos a los cuales se aplican diferentes transformaciones. Preferiblemente, la imagen de entrada incluye un modelo que delinea la región, que se llena con el contenido de interés, y seleccionar la región incluye identificar un campo del modelo que se intenta para recibir el contenido de interés. Alternativamente, o adicionalmente, la selección de la región incluye remover el moldeo de la imagen de salida seleccionar una porción de la imagen remanente, después qu se ha removido el modelo. Además, preferiblemente, la selección de la regió incluye seleccionar una región responsiva a una o má transformaciones, aplicadas a la imagen de entrada. En un modalidad preferida, el contenido de interés incluy caracteres alfanumérico, y la selección de la región incluy seleccionar una región en que probablemente una o más transformaciones han afectado adversamente la capacidad d lectura de los caracteres en la región. Preferiblemente, la ubicación de la región incluye encontrar la región de la imagen de entrada que se transformó en la región seleccionada de la imagen de salid por una o más transformaciones. Además, preferiblemente, la substitución del contenido de la región ubicada incluye encontrar los componentes conectados en la región ubicada y copiar los componentes conectados a la región seleccionada en la imagen de salida. Más preferiblemente, la copia de los componentes conectados incluye encontrar, para cada uno de estos componentes conectados, en la región ubicada, una operació de traslación, que será aplicada a todos los puntos en el componente conectado. Preferiblemente, el hallazgo de la operación de traslación incluye, para cada uno de los componentes conectados, escoger un punto sobre o en un vecindad del componente conectado y determinar un traslación que se aplique a ese punto por una o má transformaciones, aplicadas a la imagen de entrada. En un modalidad preferida, el hallazgo de los componente conectados incluye encontrar caracteres en la imagen. En una modalidad preferida más, el contenido d interés incluye caracteres alfanuméricos, y el métod incluye aplicar el reconocimiento de caracteres ópticos a contenido sustituido en la región seleccionada. Igualmente se suministra, de acuerdo con un modalidad preferida de la presente invención, un aparat para el proceso de una imagen de entrada de un documento, que incluye un modelo, que tiene una o más regiones que s llenan con el contenido, el aparato incluye un procesador d forma, el cual se adapta para aplicar una o má transformaciones a la imagen de entrada, para así genera una imagen de salida en la cual el modelo se registra, co un moldeo de referencia, para seleccionar al menos una d las regiones llenadas en la imagen de salida, para ubicar e la imagen de entrada al menos una región llenada que corresponde a cuando menos una región seleccionada en la imagen de salida, y para sustituir el contenido de al menos una región ubicada en la imagen de entrada para el contenido de cuando menos una región seleccionada en la imagen d salida. Preferiblemente, el contenido llenado en una o má regiones incluye caracteres alfanumérico, y el procesado aplica el reconocimiento de caracteres ópticos al contenid sustituido en al menos una región seleccionada, para así extraer el contenido del documento. Además, preferiblemente, el aparato incluye un dispositivo que forma imágenes, el cual se adapta para explorar el documento, para así genera la imagen de entrada. Se suministra, adicionalmente, de acuerdo con un modalidad preferida de la presente invención, un producto de software (programa) de computadora, -para el proceso de un imagen de entrada, el producto incluye un medio que se pued leer por computadora, en el cual se almacenan instrucciones del programa, estas instrucciones, cuando se leen por l computadora, causan que esta computadora aplique una o más transformaciones a la imagen de entrada, por lo cual se aplican diferentes desplazamientos a diferentes píxeles en la imagen de entrada, para así generar una imagen de salida, para seleccionar en esta imagen de ~ salida una región que contiene el contenido de interés, para ubicar en la imagen de entrada la región que corresponde a la región seleccionada en la imagen de salida, y para sustituir el contenido de la región ubicada en la imagen de entrada por el contenido de la región seleccionada en la imagen d salida. En una modalidad preferida, la imagen de entrad incluye un modelo que delinea la región, el cual se llen con el contenido de interés, y las instrucciones causan qu la computadora aplique una o más transformaciones para as registrar la imagen de salida con un modelo de referencia. La presente invención se comprenderá má completamente de la siguiente descripción detallada de la modalidades preferidas, tomadas junto con los dibujos, e los cuales: BREVE DESCRIPCIÓN DE LOS DIBUJOS La Figura 1 es una ilustración esquemática de u detalle de una imagen de un documento de forma llenado, útil en comprender la presente invención; la Figura 2 es una ilustración esquemática, qu muestra los desplazamientos relativos aplicados a segmentos de la imagen de la Figura 1 en el curso del proceso de l imagen, usando un método conocido en el arte; la Figura 3 es una ilustración esquemática, que muestra la imagen de la Figura 1, en seguida del proceso de la imagen, usando el método de la Figura 2; la Figura 4 es una ilustración esquemática representativa de un sistema para el proceso de imágenes de documentos, de acuerdo con una modalidad preferida de l presente invención; la Figura 5 es un diagrama de flujo, que ilustr esquemáticamente un método para el proceso de imágenes, d acuerdo con una modalidad preferida de la present invención; y la Figura 6 es una ilustración esquemática, qu muestra los resultados del proceso de la imagen de documento de la Figura 1, usando el método de la Figura 5.
DESCRIPCIÓN DETALLADA DE LAS MODALIDADES PREFERIDAS La Figura 4 es una ilustración esquemática, representativa, de un sistema 40 para almacenar y exhibi imágenes de documentos, de acuerdo con una modalida preferida de la presente invención. El sistema 40 comprend un escáner 42, o cualquier tipo adecuado de dispositivo qu captura imágenes, conocido en el arte, el cual recibe .explora un documento, que comprende una forma impres previamente, tal como el documento 20, que se llena co caracteres escritos a mano, mecanografiados o impresos. El escáner captura una imagen del documento y transporta los datos de imagen correspondientes a un procesador 46 de formas, que comprende típicamente una computadora adecuada para fines generales. Alternativamente, la imagen entra al procesador desde otra fuente. Este procesador 46 registra la imagen del documento con una imagen modelo de referencia, que se almacena en una memoria 48, tal como un disc magnético u óptico. El procesador luego corrige la imagen e las distorsiones que pudieran haber ocurrido en lo caracteres, debido al proceso de registro, como se describ abajo. Opcionalmente, el procesador luego lee lo caracteres, usando métodos de reconocimiento de caractere ópticos (OCT) conocidos en el arte. Las funciones de proceso de imagen del procesado 46 se realizan preferiblemente usando un software que oper en el procesador, el cual realiza una modalidad de l presente invención, como se describe en detalle abajo. Est software puede ser suministrado en medios tangibles, ta como disquetes o CD-ROM, y cargados en el procesador. Alternativamente, el software puede ser descargado a procesador por medio de una conexión de red, u otro enlac electrónico. Asimismo, alternativamente, el procesador 4 puede comprender elementos dedicados alambrados o u procesador de señales digitales, para llevar a cabo alguna o todas las etapas del proceso de imágenes. La Figura 5 es un diagrama de flujo que ilustr esquemáticamente un método para el proceso de imágenes e documentos de formas llenados, de acuerdo con una modalida preferida de la presente invención. Este método remedia l distorsión e interrupciones de los caracteres en la imagen, debidos a los desplazamientos locales y otra transformaciones aplicadas en registrar la imagen del documento con un modelo de referencia. En una etapa 50 d transformación de imagen, se aplican una o más transformaciones a una imagen de entrada para así llevar u modelo en la imagen en registro con un modelo de referenci almacenado. La imagen de entrada comprende preferiblement una imagen binaria, que se deriva ele los datos explorados por el escáner 42, usando cualquier método adecuado d proceso de imágenes, conocido en el arte. Alternativamente, la imagen de entrada puede comprender una imagen de escal gris o de color. Sustancialmente, cualquier método adecuado puede ser usado para transformar la imagen en la etapa 50, tal como los descritos en las patentes de EE.UU., antes mencionadas, Nos. 5,182,656 y 5,793,887. La imagen de salida resultante probablemente contendrá regiones en que la capacidad de lectura de los caracteres se afectó adversamente, como se muestra en la Figura 3, por ejemplo. Preferiblemente, las transformaciones que se aplican a cada segmento de la imagen de entrada, son guardadas para referencia ulterior. Una etapa 52 de identificación de región, el procesador 46 identifica regiones de interés en la imagen de salida. Estas son regiones del modelo que se llenan y pueden haber sido afectadas adversamente en la etapa 50 de transformación. Preferiblemente, las regiones se selecciona de una lista de campos conocidos en el modelo. Alternativa adicionalmente, las regiones son seleccionadas removiendo e modelo de la imagen, después del registro, como se describi en las patentes, antes mencionadas, y se encuentran en la áreas de llenado que permanecen. Opcionalmente, en la etap 54 de evaluación de daño, el procesador determina en cuále de las regiones de interés los caracteres se ha distorsionado en la etapa 50 de transformación. Éste será e caso, por ejemplo, cuando dos o más partes de una regió dada, tal como la región contenida dentro del cuadro 2 (Figuras 1 y 3) , caen en diferentes segmentos de la imagen, a la cual se aplican transformaciones significantement diferentes. Estas regiones "dañadas" se seleccionan para e proceso subsiguiente, mientras las regiones en que todos lo segmentos se transforman en sustancialmente el mismo camino, no necesitan ser procesadas ulteriormente. En una etapa 5 de borrado del contenido, 56, los caracteres (u otr contenido) en las regiones seleccionadas de interés so borrados de la imagen de salida. Con el fin de reemplazar los contenidos borrados, el procesador 46 encuentra, para cada una de las regiones d interés seleccionadas, una región de fuente correspondient en la imagen de entrada, en una etapa 58 que encuentra l región de entrada. Preferiblemente, la región de fuente s encuentra trabajando hacia atrás a través de la transformaciones que se aplican para llegar a la regió seleccionada en la imagen de salida en la etapa 50. En un etapa 60 de encuentro de componente, el procesador 4 encuentra los componentes conectados en la región de fuente, como es conocido en el arte. Estos componentes conectado son grupos contiguos o casi contiguos, de píxeles, qu cumplen con los criterios morfológicos que los identifica con alta probabilidad de pertenecer a los caracteres escritos. Los caracteres 24 en la Figura 1 cumplen con tale criterios, por ejemplo. Preferiblemente, en la etapa 58, los límites d cada una de las regiones de fuente se reinan para sí exclui los componentes conectados que son contenidos sól parcialmente en el campo del modelo que corresponde a l región de fuente. Para lograr este refinamiento, la hiler vacia superior extrema (es decir, una hilera que contiene sólo píxeles blancos) se encuentra en la región, y la siguiente hilera no vacía, debajo de ella, se registra como un candidato de arriba. Similarmente, la hilera vacía más baja en el campo se encuentra, y la siguiente hilera no vacía se registra como un candidato del .fondo. Si los candidatos superior y de fondo no están en conflicto (por ejemplo, por traslape), los límites de la región son redefinidos para ser los candidatos -superior y de fondo. Un procedimiento similar se aplica a los costados izquierdo derecho de la región. Estas etapas pueden resultar en algú encogimiento de la región. Los límites de la regió (ajustados) pueden de nuevo ser expandidos en toda direcciones, en la etapa 60, para así incluir todos lo componentes conectados de todos los píxeles dejados dentr de la región. Si esta etapa resulta, sin embargo, e cualquier costado de la región que se agranda por más de u umbral predefinido (por ejemplo del 20%) más allá de lo límites originales del campo correspondiente, la región s excluye preferiblemente de las etapas restantes del proces de la Figura 5. De esta manera, los artefactos en la image de salida, debido a los componentes conectados extraños, qu pueden no pertenecer dentro de este campo de modelo, s evitan. Para cada componente conectado encontrado en l región de interés, el procesador 46 determina, en una etap 62 de transformación de posición, una transformació apropiada de las coordenadas de posición, con el fin d trasladar el componente a una posición correspondiente en la región seleccionada de la imagen de salida. Preferiblemente, un punto en el componente conectado se escoge, tal como su centro de gravedad o, alternativamente, una de sus esquinas. El procesador luego determina la traslación de red que se aplicó a este punto escogido en la transformación de la lí imagen de entrada en la imagen de salida. En una etapa 64 d pegar 64, esta misma traslación de red se aplica a todos lo puntos en el componente conectado. En esta forma, lo componentes conectados son pegados uno por uno en la posiciones apropiadas en la región de interés en lugar d los contenidos previos de la región, que son borrados en l etapa 56. Alternativamente, la etapa 60 puede ser saltada, una transformación sencilla de traslación puede se determinada y aplicada para pegar todos los contenidos de l región de interés desde la imagen de entrada a la imagen d salida. La Figura 6 es una ilustración esquemática de cuadro 22 y los caracteres 24, como se ven en la imagen d salida, generada de acuerdo con el método de la Figura 5. Las porciones interrumpidas 34 y 36 de los caracteres se ha borrado, y en su lugar se han pegado los caractere originales en el cuadro desde la imagen de entrada de l Figura 1. Debido a la rotación de la imagen de entrada, cad uno de los caracteres en la imagen de salida, mostrados e la Figura 5, también aparecen girados levemente, puesto qu se aplicó la misma transformación en la etapa 64 en todos los puntos en el carácter. Esta rotación es superad fácilmente, sin embargo, por los programas de OCT conocidos en el arte, y la mayoría de los problemas de interrupción de los caracteres, vistos en la Figura 3, se evitan.
Aunque se describieron aquí modalidade preferidas, con referencia al proceso de formas basadas e modelos, los principios de la presente invención pueden se aplicados similarmente a procesos de otos tipos de imágenes, igualmente. Frecuentemente ocurren en varios contextos d proceso de imágenes que una transformación digital aplicad a una imagen no es exacta, en el sentido que e desplazamiento resultante entre dos pixel vecinos e diferente del desplazamiento teórico. Este inexactitud pued ser debida a las transformaciones del segmento local, com se describió antes, o a otros errores, tal como el redonde o la forma decimal. Si hay un bloque de texto en la image que debe ser leído (independientemente de la presencia de u modelo) , el método de la presente invención puede ser usad ventajosamente bajo estas circunstancias para aumentar s capacidad de lectura. Como otro ejemplo, en una image aérea, que gira y se alabea para compensar las condiciones de la imagen, la presente invención puede ser usada para preservar la visibilidad de ciertos detalles en esa imagen, que son de interés particular y así deben ser presentados con distorsiones mínimas. Aplicaciones ulteriores, tal como esas, serán evidentes a los expertos en la materia. Se apreciará así que las modalidades preferidas, antes descritas, son mencionadas en forma de ejemplo, y que la presente invención no se limita a lo particularmente mostrado y descrito anteriormente. Más bien, el alcance d la presente invención incluye tanto combinaciones om subcombinaciones de las varias características descrita aquí anteriormente, al igual que las variaciones y su modificaciones, que serán aparentes a las personas expertas en la material, de la lectura de la descripción anterior las cuales no se describieron en la técnica anterior.

Claims (26)

  1. REIVINDICACIONES 1. Un método para el proceso de una imagen d entrada, este método comprende: Aplicar una o más transformaciones a una imagen d entrada, por lo cual se aplican diferentes desplazamientos diferentes píxeles en esta imagen^ de entrada, para así generar una imagen de salida; seleccionar en la imagen de salida, una región que contiene el contenido de interés; ubicar en la imagen de entrada la región qu corresponde a la región seleccionada en la imagen de salida; y sustituir el contenido de la región ubicada en l imagen de entrada por el contenido de la región seleccionad en la imagen de salida.
  2. 2. Un método de acuerdo con la reivindicación 1, en que la aplicación de una o más transformaciones comprende dividir la imagen de entrada en segmentos, y determinar una transformación, que se va a aplicar, a cada segmento.
  3. 3. Un método de acuerdo con la reivindicación 2, en que la imagen de entrada incluye un modelo que delinea la región, el cual se llena con el contenido de interés, donde la determinación de la transformación que se va a aplicar a cada segmento comprende encontrar una o más traslaciones del segmento, que compensan aproximadamente un distorsión de la imagen de entrada con relación a un model de referencia, por lo cual la imagen de salida se registr con el modelo de referencia.
  4. 4. Un método de acuerdo con la reivindicación 3, en que esta una o más traslaciones compensan la rotación d la imagen de entrada con relación al modelo de referencia.
  5. 5. Un método de acuerdo con la reivindicación 2, en que la aplicación de una o más transformaciones comprend aplicar diferentes transformaciones a dos o más segmentos mutuamente adyacentes.
  6. 6. Un método de acuerdo con la reivindicación 5, en que la selección de la región comprende seleccionar un región que se dividió entre los dos o más segmentos a los cuales se aplicaron diferentes transformaciones.
  7. 7. Un método de acuerdo con cualquiera de las reivindicaciones 1 a 6, en que la imagen de entrada incluye un moldeo que delinea la región, el cual se llena con el contenido de interés, y donde la selección de la regió comprende identificar un campo del modelo que se intenta para recibir el contenido de interés.
  8. 8. Un método de acuerdo con cualquiera de la reivindicaciones 1 a 6, en que la imagen de entrada incluy un modelo que delinea la región, el cual se llena con e contenido de interés, y donde la selección de la regió comprende remover el modelo de la imagen de salida seleccionar una porción de la imagen remanente, después d remover el modelo.
  9. 9. Un método de acuerdo con cualquiera de la reivindicaciones 1 a 6, en que la selección de la regió comprende seleccionar una región responsiva a esta una o má transformaciones aplicadas a la imagen de entrada.
  10. 10. Un método de acuerdo con la reivindicación 9, en que el contenido de interés comprende caractere alfanuméricos, y donde la selección de la región comprend seleccionar una región en la cual probablemente esta una más transformaciones han afectado adversamente la capacida de lectura de los caracteres en la región.
  11. 11. Un método de acuerdo - con cualquiera de la reivindicaciones 1 a 6, en que la ubicación de la regió comprende encontrar la región de la imagen de entrada qu fue transformada en la región seleccionada de la imagen d salida por esta una o más transformaciones.
  12. 12. Un método de acuerdo con cualquiera de las reivindicaciones 1 a 6, en que la sustitución del contenido de la región ubicada comprende encontrar componentes conectados en dicha región ubicada, y copiar los componentes conectados a la región seleccionada en la imagen de salida.
  13. 13. Un método de acuerdo con la reivindicación 12, en que el copiado de los componentes conectados comprende encontrar, en cada uno de los componentes conectados en la región ubicada, una operación de traslación que se va a aplicar a todos los puntos en el componente conectado.
  14. 14. Un método de acuerdo con la reivindicación 13, en que encontrar la operación de traslación comprende, para cada uno de los componentes conectados, escoger un punto sobre o dentro de una vecindad del componente conectado determinar una traslación que se aplicó en ese punto por esta una o más transformaciones aplicadas a la imagen de entrada.
  15. 15. Un método de acuerdo con la reivindicación 12, en que encontrar los componentes conectados comprende encontrar los caracteres en la imagen.
  16. 16. Un método de acuerdo con cualquiera de las reivindicaciones 1 a 6, en que el contenido de interés comprende caracteres alfanuméricos, y donde el método comprende aplicar el reconocimiento de caracteres ópticos al contenido sustituido en la región seleccionada.
  17. 17. Aparato para el proceso de una imagen d entrada de un documento, que incluye un modelo, que tien una o más regiones que se llenan con un contenido, est aparato comprende un procesador de forma, el cual se adapt para aplicar una o más transformaciones a la imagen d entrada, para así generar una imagen de salida, en la cual el modelo se registra con un modelo de referencia, par seleccionar al menos una de las regiones llenadas en l imagen de salida, para ubicar, en la imagen de entrada, al menos una región llenada, que corresponde a esta al menos una región seleccionada en la imagen de salida, y sustitui el contenido de esta al menos una región ubicada en l imagen de entrada para el contenido de esta al menos un región seleccionada en la imagen de salida.
  18. - 18. Aparato de acuerdo con la reivindicación 17, en que el contenido llenado en esta una o más regiones comprende caracteres alfanuméricos, y donde el procesado aplica el reconocimiento de caracteres ópticos al contenido sustituido en esta al menos una región seleccionada, para así extraer el contenido desde el documento.
  19. 19. Aparato de acuerdo con la reivindicación 18, que comprende un dispositivo que forma imágenes, el cual se adapta para explorar el documento, para así generar la imagen de entrada.
  20. 20. Un producto de software de computadora, para el proceso de una imagen de entrada, este producto comprende un medio que se puede leer por computadora, en el cual se almacenan las instrucciones del programa, dichas instrucciones, cuando se leen por una computadora, causan que la computadora aplique una o más transformaciones a la imagen de entrada, por lo cual se aplican diferentes desplazamientos a diferentes píxeles en la imagen de entrada, para así generar una imagen de salida, para seleccionar en esta imagen de salida una región que contiene un contenido de interés, para ubicar en la imagen de entrada la región que corresponde a la región seleccionada en la imagen de salida, y para sustituir el contenido de la regió ubicada en la imagen de entrada para el contenido de la región selaccionada en la imagen de salida.
  21. 21. Un producto, de acuerdo con la reivindicación 20, en que las instrucciones causan que la computadora divida la imagen de entrada en segmentos, y para determinar una transformación que se va a aplicar a cada segmento.
  22. 22. Un producto, de acuerdo con la reivindicación 20, en que el contenido de interés comprende caracteres alfanuméricos, y donde las instrucciones causan que la computadora seleccione una región para la sustitución de su contenido, cuando probablemente esta una o más transformaciones han afectado adversamente la capacidad d lectura de los caracteres en la región seleccionada.
  23. 23. Un producto, de acuerdo con cualquiera de las reivindicaciones 20 a 22, en que las instrucciones causa que la computadora encuentra componentes conectados en l región ubicada y para copia los componentes conectados a cuando menos una región seleccionada en la imagen de salida.
  24. 24. Un producto, de acuerdo con la reivindicació 23, en que las instrucciones causan que la computadora encuentre, para cada uno de los componentes conectados en la región ubicada, una operación de traslación que se va a aplicar a todos los puntos en el componente conectado.
  25. 25. Un producto, de acuerdo con cualquiera de las reivindicaciones 20 a 22, en que el contenido de interés comprende caracteres alfanuméricos, y donde las instrucciones además causan que la computadora aplique el reconocimiento de caracteres ópticos al contenido sustituido en la región seleccionada.
  26. 26. Un producto, de acuerdo con cualquiera de las reivindicaciones 20 a 22, en que la imagen de entrada incluye un modelo que delinea la región, el cual se llena con el contenido de interés, y donde las instrucciones causan que la computadora aplique esta una o más transformaciones, para así registrar la imagen de salida co un modelo de referencia.
MXPA02008494A 2000-03-08 2001-02-25 Correccion de distorsiones en el proceso de formas. MXPA02008494A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/521,399 US6658166B1 (en) 2000-03-08 2000-03-08 Correction of distortions in form processing
PCT/IL2001/000175 WO2001067380A1 (en) 2000-03-08 2001-02-25 Correction of distortions in form processing

Publications (1)

Publication Number Publication Date
MXPA02008494A true MXPA02008494A (es) 2002-12-13

Family

ID=24076587

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA02008494A MXPA02008494A (es) 2000-03-08 2001-02-25 Correccion de distorsiones en el proceso de formas.

Country Status (12)

Country Link
US (1) US6658166B1 (es)
EP (1) EP1277166B1 (es)
JP (1) JP3989733B2 (es)
KR (1) KR100476357B1 (es)
AT (1) ATE391963T1 (es)
AU (1) AU2001235943A1 (es)
BR (1) BR0109100A (es)
CA (1) CA2397872C (es)
DE (1) DE60133539T2 (es)
IL (1) IL151544A0 (es)
MX (1) MXPA02008494A (es)
WO (1) WO2001067380A1 (es)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7012624B2 (en) * 2003-12-29 2006-03-14 Arcsoft, Inc. Texture synthesis for repairing damaged images
US7602995B2 (en) * 2004-02-10 2009-10-13 Ricoh Company, Ltd. Correcting image distortion caused by scanning
US7668404B2 (en) * 2004-06-30 2010-02-23 Lexmark International, Inc. Method and system of deskewing an image using monochrome conversion to separate foreground from background
US20060045344A1 (en) * 2004-09-02 2006-03-02 Adi, Llc Handprint recognition test deck
US7711204B2 (en) * 2005-05-02 2010-05-04 Samsung Electronics Co., Ltd. 1-D image restoration using a sliding window method
US20080235263A1 (en) * 2007-03-02 2008-09-25 Adi, Llc Automating Creation of Digital Test Materials
US8055104B2 (en) * 2007-03-02 2011-11-08 Adi, Llc Process performance evaluation for Enterprise data systems
US8195003B2 (en) * 2008-06-30 2012-06-05 International Business Machines Corporation Method of correcting digital image distortion caused by a sheet-fed scanner
US9384391B2 (en) 2014-10-03 2016-07-05 Xerox Corporation Methods and systems for processing documents
US11210507B2 (en) 2019-12-11 2021-12-28 Optum Technology, Inc. Automated systems and methods for identifying fields and regions of interest within a document image
US11227153B2 (en) 2019-12-11 2022-01-18 Optum Technology, Inc. Automated systems and methods for identifying fields and regions of interest within a document image

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5067162A (en) 1986-06-30 1991-11-19 Identix Incorporated Method and apparatus for verifying identity using image correlation
US4832477A (en) 1986-09-30 1989-05-23 Aisin Seiki Kabushiki Kaisha Door mirror assembly for automotive vehicles
IL91220A (en) 1989-08-04 1995-03-30 Ibm Israel Compression of information
US5191525A (en) 1990-01-16 1993-03-02 Digital Image Systems, Corporation System and method for extraction of data from documents for subsequent processing
EP0594901A1 (en) * 1992-10-27 1994-05-04 International Business Machines Corporation Image compression method
US5793887A (en) 1993-11-16 1998-08-11 International Business Machines Corporation Method and apparatus for alignment of images for template elimination
US5715325A (en) 1995-08-30 1998-02-03 Siemens Corporate Research, Inc. Apparatus and method for detecting a face in a video image

Also Published As

Publication number Publication date
DE60133539T2 (de) 2009-06-18
DE60133539D1 (de) 2008-05-21
BR0109100A (pt) 2002-12-17
EP1277166A1 (en) 2003-01-22
CA2397872C (en) 2007-02-06
IL151544A0 (en) 2003-04-10
WO2001067380A1 (en) 2001-09-13
AU2001235943A1 (en) 2001-09-17
JP2004500659A (ja) 2004-01-08
EP1277166A4 (en) 2007-03-07
US6658166B1 (en) 2003-12-02
EP1277166B1 (en) 2008-04-09
CA2397872A1 (en) 2001-09-13
JP3989733B2 (ja) 2007-10-10
ATE391963T1 (de) 2008-04-15
KR20020081405A (ko) 2002-10-26
KR100476357B1 (ko) 2005-03-16

Similar Documents

Publication Publication Date Title
KR0159831B1 (ko) 디지탈 화상의 결함위치 자동식별방법
US4985930A (en) Image data filing system and image data correcting method
JP3878401B2 (ja) 画像処理装置、画像処理方法およびそれを記録した記録媒体
US8077976B2 (en) Image search apparatus and image search method
JP3594228B2 (ja) 枠消し装置、枠消し方法、およびオーサリング装置
JP4535584B2 (ja) ディジタル画像処理方法
JPH06124358A (ja) 用紙上のマークを検出する方法
EP2270746A2 (en) Method for detecting alterations in printed document using image comparison analyses
US7969631B2 (en) Image processing apparatus, image processing method and computer readable medium storing image processing program
JP4159720B2 (ja) 表認識方法と表認識装置と文字認識装置及び表認識プログラムを記録した記憶媒体
US20050196071A1 (en) Black white image scaling for optical character recognition
MXPA02008494A (es) Correccion de distorsiones en el proceso de formas.
JPH0581424A (ja) ノイズ除去方法
US7715650B2 (en) Method and apparatus for digital processing of images
EP1202213A2 (en) Document format identification apparatus and method
JP2012060452A (ja) 画像処理装置、その方法およびプログラム
JP4420440B2 (ja) 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体
JP2003046746A (ja) 画像処理方法及び画像処理装置
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
JP7310151B2 (ja) マーク選定装置および画像処理装置
JPH11184965A (ja) 帳票識別登録装置
JPH10154191A (ja) 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体
JPH1196296A (ja) 帳票イメージ処理方法および装置
JP2018185810A (ja) 情報処理装置、その制御方法とプログラム
JP2923004B2 (ja) 画像生成装置

Legal Events

Date Code Title Description
FG Grant or registration