MXPA02008296A

MXPA02008296A - Metodo mejorado para binarizacion de imagen.

Info

Publication number: MXPA02008296A
Application number: MXPA02008296A
Authority: MX
Inventors: Aviad Zlotnick
Original assignee: Ibm
Priority date: 2000-03-02
Filing date: 2001-02-21
Publication date: 2002-12-09
Also published as: IL151545A0; US6351566B1; DE60132315D1; EP1269394A4; JP2003525560A; DE60132315T2; IL151545A; BRPI0108856B1; WO2001065465A3; ATE383625T1; AU2001235931A1; EP1269394A2; JP3953817B2; BR0108856A; CA2397805A1; WO2001065465A2; EP1269394B1; CA2397805C; BRPI0108856B8

Abstract

Un metodo para binarizar una imagen de alimentacion a nivel de grises (20), incluye una pluralidad de pixeles que tienen valores a nivel de grises respectivos. Un umbral inferior y un umbral superior se determinan. Un primer valor binario se asigna a los pixeles en la imagen a nivel de grises, que tiene valor a nivel de grises sobre el umbral superior, y un segundo valor binario se asigna a los pixeles en la imagen a nivel de grises que tiene valor a nivel de grises por debajo del umbral inferior. Los pixeles en un grupo intermedio tienen valores a nivel de grises entre los umbrales inferior y superior, se procesan para determinar asignaciones optimas de los pixeles en el grupo intermedio al primer y segundo valores binarios.

Description

MÉTODO MEJORADO PARA BINARIZACION DE IMAGEN CAMPO DE LA INVENCIÓN La presente invención se refiere en general a métodos y aparatos para procesamiento de imágenes y específicamente a métodos para binarización de imágenes a nivel de grises. ANTECEDENTES DE LA INVENCIÓN Los métodos para binarización de imagen son bien conocidos en la especialidad. Hablando en general, estos métodos toman una imagen a nivel de grises, en donde cada pixel tiene un valor de nivel de gris de múltiples bits correspondiente y lo convierte en una imagen binaria, en donde cada pixel tiene un valor binario, ya sea negro (frente) o blanco (fondo) . La binarización se utiliza particularmente para simplificar imágenes de documentos, a fin de procesar y almacenar información que se imprime o escribe en el documento. El método de binarización más rápido y más simple es fijar simplemente un umbral y determinar que todos los pixeles que tienen un valor de nivel de gris sobre el umbral sean blancos, mientras que aquéllos que están por debajo del umbral sean negros. Este método, sin embargo, frecuentemente resulta en pérdida o confusión de la información contenida en la imagen a nivel de grises. Esta información se incorpora primordialmente en bordes que aparecen en la imagen, y no depende tanto de la brillantez absoluta de los pixeles como de su brillantez relativa en relación a sus vecinos. De esta manera, dependiendo de la selección del umbral, un borde significante en la imagen a nivel de grises desaparecerá en la imagen binaria si los pixeis en ambos lados del borde se binarizan al mismo valor. Por otro lado, artefactos en la imagen binaria con la apariencia de bordes, pueden ocurrir en un área de transición continua en la imagen a nivel de grises, cuando los pixeles con valores de nivel de gris muy semejantes caen en lados opuestos del umbral selecto. Estos problemas se ejemplifican por las siguientes tablas. La tabla I representa valores de pixel en una imagen de 5 x 5 , en donde valores superiores representan los pixeles más brillantes: TABLA I Si esta imagen se binariza utilizando un umbral de 85, el resultado será como se ilustra en la Tabla II: TABLA II Los grandes espacios que circundan el pixel en la esquina inferior derecha se representan en la imagen binarizada, pero todos los otros espacios se pierden. (El término "espacio" se emplea en el contexto de la presente solicitud y en las reivindicaciones, para denotar la diferencia absoluta a nivel de gris entre un par de pixeles vecinos) . Por otra parte, si el umbral se ajusta a 15, la imagen binaria resultante será como se ilustra en la Tabla III: TABLA III El espacio con tamaño 6 entre las hileras 2 y 3, que probablemente corresponden a un borde real en la imagen, se representa en la imagen binaria. Los grandes espacios en la esquina inferior derecha se pierden, sin embargo. Al mismo tiempo, pequeños espacios (de tamaño 2) entre las hileras 4 y 5, que pueden deberse a ruido o interferencia, se representan en la imagen binaria. De esta manera, bordes significantes en la imagen a nivel de gris se pierden, mientras que espacios significantes se deja que generen artefactos. Por las razones ejemplificadas por estas tablas, algoritmos de binarización prácticos permiten que varíe el umbral de binarización. Estos algoritmos generalmente hacen consideraciones respecto al contenido de imagen para determinar el mejor umbral para utilizar sobre toda la imagen o en áreas específicas de la imagen. Las consideraciones pueden relacionarse a los tamaños de objetos en la imagen, propiedades de histograma, niveles de ruido u otras propiedades de imagen. Debido a que dependen de estas consideraciones, los algoritmos de binarización tienden a trabajar bien en el tipo específico de imágenes u objetos para los cuales se diseñan, para fallar en otros. Por ejemplo, un algoritmo de binarización orientado a texto, pueden trabajar bien en una imagen de documento que contiene texto en un fondo simple, pero puede fallar cuando el fondo está texturizado. Además, imágenes de documentos frecuentemente contienen características salientes diferentes a texto simple, tales como símbolos, líneas y cuadros, que son importantes para conservar en la imagen binaria y se pierden cuando se utiliza binarización orientada a texto. La "trinarización" de imagen se ha sugerido como un método para procesar imágenes a nivel de grises, aunque no en el contexto de formación de imagen de documento. Típicamente, un rango de valores de pixel de "gris" se define intermedio a los bajos valores de rango de negro y los altos valores del rango blanco. La imagen trinaría resultante se ha encontrado que es útil en una cantidad de aplicaciones de correlación de imagen y reconocimiento de imagen . Por ejemplo, la patente de los E.U.A. No. 5,067,162, cuya descripción se incorpora aquí por referencia, describe un método y aparato para verificar identidad utilizando correlación de imagen, típicamente basado en análisis de huellas dactilares. A fin de eliminar incertidumbre y variabilidad en determinaciones de borde en la imagen de huella dactilar, se utiliza una técnica de trinarización para dividir todos pixeles en uno de tres niveles: negro, gris o blanco. Un histograma de valores de gris de la imagen a escala de gris se determina, y se establecen valores umbral de negro-gris y gris-blanco de acuerdo con iguales distribuciones de un tercio. Todos los pixeles que tienen valores de gris más oscuros que el valor umbral de negro-gris, se convierten en pixeles negros; todos los pixeles que tienen valores de gris más claros que el valor umbral de gris-blanco, se convierten en pixeles blancos; y todos los otros pixeles se ignoran en cálculos de correlación subsecuentes. De esta manera, los pixeles negro y blanco representan con alta confianza regiones de resaltos y valles de la huella dactilar, mientras que los pixeles grises representan las regiones de transición entre los resaltos y valles. Como otro ejemplo, la patente de los E.U.A. No. 5,715,325, cuya descripción aquí se incorpora por referencia, describe aparatos y métodos para detectar una cara en una imagen de video. Imágenes de cara se procesan para eliminar detalle fino y proporcionan un marcado contraste, resultando en una imagen que es casi binarizada (con bloques oscuros y bloques claros) pero aún contiene algunos bloques que no pueden categorizarse claramente. Para promover simplicidad en procesamiento, la imagen se trata como una imagen trinaría, en donde regiones oscuras se identifican con negativos (-1), regiones claras se identifican con (1) , y regiones no definibles se identifican con ceros (0) . La imagen trinaría luego se compara con plantillas diferentes de caras, para encontrar una correspondencia óptima. COMPENDIO DE LA INVENCIÓN Un objetivo de la presente invención es proporcionar métodos y aparatos mejorados para procesamiento de imagen y particularmente para procesar imágenes de documentos . Un objetivo adicional de algunos aspectos de la presente invención es proporcionar métodos mejorados para binarización de imagen. Un objetivo aún adicional de algunos aspectos de la presente invención es proporcionar un método para trinarización de una imagen. En modalidades preferidas de la presente invención, una imagen de alimentación a nivel de grises se trinariza, generalmente como una etapa preparatoria para generar un imagen de salida binaria. La imagen de alimentación primero se analiza a fin de caracterizar variaciones entre los valores a nivel de grises de los pixeles en la imagen, tales como espacios entre los valores de pixeles vecinos. Con base en estas variaciones, se determinaron umbrales de binarización superiores e inferiores, de manera tal que pixeles que tienen valores a nivel de grises sobre el umbral superior se clasifican como blancos, y aquéllos por debajo del umbral inferior se clasifican como negros. Los pixeles que tienen valores a nivel de grises entre los umbrales inferior y superior referidos a continuación como pixeles intermedios o de gris, luego se procesan de preferencia para determinar una clasificación óptima de estos pixeles como negro o blanco. De preferencia, los umbrales de binarización superior e inferior se eligen en una forma diseñada para incrementar el número de bordes significantes en la imagen de alimentación que se conservan en la imagen binaria de salida, mientras que se disminuye el número de bordes de artefacto que ocurren. El generar la imagen binaria de esta manera transporta las características sobresalientes de la imagen de alimentación claramente, substancialmente sin dependencia del tipo de contenido de imagen. Un rango de diferentes valores de umbral se evalúa contra las variaciones a nivel de grises entre los pixeles, a fin de elegir umbrales superior e inferior óptimos. De preferencia, la evaluación se basa en análisis estadístico de los espacios a nivel de gris entre los pixeles. En forma alterna o adicional, otros análisis estadísticos y señales de información, tales como bordes actuales encontrados en algoritmos de detección de borde, pueden utilizarse para seleccionar los umbrales. En algunas modalidades preferidas de la presente invención, los pixeles intermedios se clasifican con base en su relación con otros pixeles vecinos. De preferencia, pixeles que son significativamente más brillantes que un promedio de sus vecinos, se clasifican como blancos, mientras que aquéllos significativamente más oscuros que el promedio, se clasifican como negros. Esta clasificación no requiere depender de los umbrales superior e inferior selectos. Pixeles que no difieren significativamente del promedio de sus vecinos, se clasifican típicamente utilizando un umbral, tal como un promedio de los umbrales superior e inferior. En forma alterna, pueden aplicarse otros métodos para clasificar o de otra forma procesar los pixeles intermedios. En una modalidad preferida, un algoritmo de binarización orientado a texto se aplica a la imagen a nivel de grises, y los pixeles intermedios se clasifican utilizando los resultados de este algoritmo. En otra modalidad preferida, los valores a nivel de grises de los pixeles intermedios se almacenan junto con los valores binarios de los otros pixeles. El almacenar la imagen de esta manera requiere bastante menos memoria que la imagen a nivel de grises completa, pero casi toda la información significante de la imagen se conserva para utilizar cuando la imagen se recupera para posterior procesamiento o para ver por un operador humano. Por lo tanto se proporciona, de acuerdo con una modalidad preferida de la presente invención, un método para binarización de imagen, que incluye: recibir una imagen de alimentación a nivel de grises que incluyen una pluralidad de pixeles que tienen valores a nivel de grises, respectivos; determinar un umbral inferior y un umbral superior, que es mayor que el umbral inferior por una diferencia selecta; asignar un primer valor binario a los pixeles en la imagen a nivel de grises que tiene valores de nivel de grises sobre el umbral superior y un segundo valor binario a los pixeles en la imagen a nivel de gris que tienen valores a nivel de grises inferiores al umbral inferior; y procesar los pixeles en un grupo intermedio que tiene valores a nivel de grises entre los umbrales inferior y superior a fin de determinar asignaciones óptimas de los pixeles en el grupo intermedio con el primer y segundo valores binarios . De preferencia, determinar los umbrales inferior y superior incluye analizar variaciones entre los valores a nivel de grises de los pixeles en la imagen de alimentación y determinar los umbrales en respuesta a las variaciones analizadas. Más preferiblemente, el analizar las variaciones entre los valores de nivel de grises incluye encontrar bordes en la imagen de alimentación, y determinar los umbrales incluye seleccionar los umbrales a fin de conservar los bordes en una imagen de salida constituida por los valores binarios asignados. En forma adicional o alterna, analizar las variaciones entre las imágenes a nivel de grises, incluye encontrar espacios entre los nivel de grises de pixeles vecinos, y determinar los umbrales incluye seleccionar los umbrales a fin de conservar los espacios que son significantes en preferencia a los espacios que no son significantes en una imagen de salida constituida por los valores binarios asignados. De preferencia, seleccionar los umbrales incluye definir los espacios que son significantes como aquéllos cuya magnitud absoluta es mayor que la diferencia selecta entre los umbrales superior e inferior. Más preferiblemente, seleccionar los umbrales incluye elegir los umbrales superior e inferior a fin de llevar al máximo una calificación de mérito calculada para múltiples pares diferentes de umbrales superior e inferior, en donde la clasificación se correlaciona en forma positiva con el número de espacios significantes conservados en la imagen de salida por los umbrales selectos, y se correlaciona negativamente con el número de espacios que no son significantes que se conservan y el número de espacios significantes que no se conservan en la imagen de salida por los umbrales selectos . De preferencia, determinar los umbrales incluye seleccionar los umbrales a fin de conservar información de borde en una imagen de salida constituida por los valores binarios asignados. Más preferiblemente, seleccionar los umbrales incluye elegir los umbrales substancialmente sin dependencia del tipo de características de imagen al cual pertenece la información. Adicionalmente o en forma alterna, seleccionar los umbrales incluye encontrar un valor promedio óptimo de los umbrales superior e inferior y encontrar un valor óptimo de la diferencia selecta entre los umbrales . Además, de preferencia procesar los pixeles en el grupo intermedio, incluye analizar variaciones entre los valores de nivel de grises de los pixeles en la imagen de alimentación y determinar las asignaciones de los pixeles al primer y segundo valores binarios en respuesta a las variaciones analizadas. Más preferiblemente, determinar las asignaciones en respuesta a las variaciones analizadas incluye encontrar una diferencia significante entre el valor a nivel de grises de uno de los pixeles y los valores a nivel de grises de los otros pixeles en su vecindad, y asignar el pixel al primer o segundo valores binarios en respuesta a la diferencia. En una modalidad preferida, el procesamiento de los pixeles en el grupo intermedio incluye aplicar un método de binarización optimizado para texto, para determinar las asignaciones óptimas de los pixeles en el grupo intermedio. De preferencia, el método incluye enviar de salida una imagen binaria constituida por los valores binarios asignados de los pixeles. También se proporciona, de acuerdo con una modalidad preferida de la presente invención, un método para procesar una imagen de alimentación a nivel de grises, que incluye una pluralidad de pixeles que tienen valores a nivel de grises respectivos, el método incluye: analizar variaciones entre los valores a nivel de gris de los pixeles en la imagen de alimentación; en respuesta a las variaciones analizadas, determinar un umbral inferior y un umbral superior, que es mayor que el umbral inferior por un tamaño de espacio selecto; asignar un primer valor binario a los pixeles en la imagen a nivel de grises que tiene valores de nivel de grises sobre el umbral superior y un segundo valor binario a los pixeles en la imagen a nivel de grises que tiene valores de nivel de grises por debajo del umbral inferior; Y generar una imagen de salida trinaría, en donde los pixeles asignados a los primeros y segundos valores binarios se representan por sus valores binarios respectivos, y los pixeles en un grupo intermedio tienen valores de nivel de grises entre los umbrales inferior y superior, se representan por sus valores a nivel de grises respectivos . En una modalidad preferida, generar la imagen de salida trinaría incluye exhibir la imagen de salida. En otra modalidad preferida, generar la imagen de salida trinaría incluye almacenar la imagen de salida en una memoria. Además se proporciona, de acuerdo con una modalidad preferida de la presente invención, un aparato para binarización de imagen, que incluye un procesador de imagen, que se acopla para recibir una imagen de alimentación a nivel de grises que incluye una pluralidad de pixeles que tiene valores a nivel de grises respectivos, y que se adapta para determinar un umbral inferior y un umbral superior, que es mayor que el umbral inferior por una diferencia selecta, para asignar un primer valor binario a los pixeles en la imagen a nivel de grises que tiene un valor de nivel de grises sobre el umbral superior y un segundo valor binario a los pixeles en la imagen a nivel de grises, que tiene valores a nivel de grises por debajo del umbral inferior, y procesar los pixeles en un grupo intermedio que tiene valores a nivel de grises entre los umbrales inferior y superior, a fin de determinar asignaciones óptimas de los pixeles en el grupo intermedio del primer y segundo valores binarios . Además se proporciona, de acuerdo con una modalidad preferida de la presente invención, un aparato para procesar una imagen de alimentación a nivel de grises, que incluye una pluralidad de pixeles con valores a nivel de grises respectivos, el aparato incluye un procesador de imagen, que se adapta para analizar variaciones entre los valores a nivel de grises de los pixeles en la imagen alimentada, y en respuesta a variaciones analizadas, determinar un umbral inferior y un umbral superior, que es mayor que el umbral inferior por un tamaño de espacio selecto, y asignar un primer valor binario a los pixeles en la imagen a nivel de grises que tiene valores a nivel de grises sobre el umbral superior y un segundo valor binario a los pixeles en la imagen a nivel de grises que tienen valores a nivel de grises inferiores al umbral inferior, de esta manera para generar una imagen de salida trinaría, en donde los pixeles asignados al primer y segundo valores binarios se representan por sus valores binarios respectivos, y los pixeles en un grupo intermedio tienen valores a nivel de grises entre los umbrales inferior y superior, se representan por sus valores a nivel de grises respectivos . En una modalidad preferida, el aparato incluye un exhibidor, que se acopla al procesador para recibir y exhibir la imagen de salida trinaría. En otra modalidad preferida, el aparato incluye una memoria de almacenamiento que se acopla al procesador, para recibir y almacenar la imagen de salida trinaría. Aún más se proporciona, de acuerdo con una modalidad preferida de la presente invención, un producto de soporte lógico de computadora para procesar una imagen de alimentación, que incluye un medio legible por computadora con instrucciones de programa almacenadas, estas instrucciones cuando se leen por una computadora, provocan que la computadora reciba una imagen de alimentación a nivel de grises incluyendo una pluralidad de pixeles que tienen valores a nivel de grises respectivos, para determinar un umbral inferior y un umbral superior, pero es mayor que el umbral inferior por una diferencia selecta, para asignar un primer valor binario a los pixeles en la imagen a nivel de grises, que tiene valores a nivel de grises sobre el umbral superior y un segundo valor binario, a los pixeles en la imagen a nivel de grises que tiene un valor de nivel de grises inferiores al umbral inferior, y procesar los pixeles en un grupo intermedio que tienen valores a nivel de gris entre los umbrales inferior y superior a fin de determinar asignaciones óptimas de los pixeles en el grupo intermedio al primer y segundo valores binarios . Además, se proporciona de acuerdo con una modalidad preferida de la presente invención, un producto de soporte lógico de computadora para procesar una imagen de alimentación a nivel de grises, que incluye una pluralidad de pixeles con valores a nivel de grises respectivos, el producto incluye un medio legible por computadora que tiene instrucciones de programa almacenadas, estas instrucciones cuando se leen por una computadora, provocan que la computadora analice variaciones entre el valor a nivel de grises de los pixeles en la imagen de alimentación y en respuesta a las variaciones analizadas, determinar un umbral inferior y un umbral superior, que es mayor que el umbral inferior por un tamaño de espacio selecto, para asignar un primer valor binario a los pixeles en la imagen a nivel de grises que tiene valores a nivel de grises sobre el umbral superior y un segundo valor binario a los pixeles en la imagen a nivel de grises que tiene un valor a nivel de grises inferior al umbral inferior, y para generar una imagen de salida trinaría, en donde los pixeles asignados al primer y segundo valores binarios, se representan por sus valores binarios respectivos, y los pixeles en un grupo intermedio tienen valores a nivel de grises entre los umbrales inferior y superior se representan por sus valores a nivel de grises respectivos. La presente invención se comprenderá más completamente a partir de la siguiente descripción detallada de las modalidades preferidas de la misma, que se toma en conjunto con los dibujos en donde: BREVE DESCRIPCIÓN DE LOS DIBUJOS La Figura 1 es una reproducción esquemática de una imagen a nivel de grises capturada por un explorador o digitalizador, como se conoce en la técnica. Las Figuras 2 y 3 son reproducciones esquemáticas de imágenes binarias generadas al procesar la imagen a nivel de grises de la Figura 1 utilizando métodos conocidos de binarización; La Figura 4 es una ilustración gráfica esquemática del aparato de procesamiento de imagen de acuerdo con una modalidad preferida de la presente invención; La Figura 5 es un diagrama de flujo que ilustra esquemáticamente un método para binarización de imagen, de acuerdo con una modalidad preferida de la presente invención; La Figura 6 es un diagrama de flujo que ilustra esquemáticamente detalles del método de la Figura 5, de acuerdo con una modalidad preferida de la presente invención; y La Figura 7 es una reproducción esquemática de una imagen binaria generada al procesar la imagen a nivel de grises de la Figura 1, utilizando el método de las Figuras 5 y 6. DESCRIPCIÓN DETALLADA DE MODALIDADES PREFERIDAS Las Figuras 1-3 son reproducciones esquemáticas de imágenes de un cheque 20, presentado por la razón de comparar diferentes métodos de binarización de imagen. La Figura 1 es una imagen a nivel de grises del cheque como se captura por un explorador o digitalizador de documentos. El cheque incluye caracteres impresos 22 en un fondo texturizado 24, junto con otras características tales como líneas 26 y un logotipo 28. Este cheque puede ser presentado por un contribuyente junto con sus formas de retorno de impuestos. Todas las formas se digitalizan, y sus imágenes se almacenan por las autoridades fiscales para posterior referencia. Las imágenes típicamente se binarizan antes de almacenamiento a fin de reducir el volumen de datos almacenados. En general es importante que las líneas, logotipo y otros detalles de identificación se conserven en la imagen, de manera tal que el cheque (u otro documento) pueda identificarse claramente cuando se recupera del almacenamiento. La Figura 2 muestra una imagen 30 del cheque después de binarización, utilizando un algoritmo que trabaja generalmente bien en imágenes de documento. El algoritmo se diseña para documentos que tienen un fondo plano y fallan en el fondo texturizado del cheque. La Figura 3 muestra una imagen 35 del cheque después de binarización utilizando un algoritmo que se "ajusta" específicamente para texto. El algoritmo se describe en la solicitud de patente de los E.U.A No. 09/310,287, otorgada a la cesionaria de la presente solicitud de patente, y aquélla descripción aquí se incorpora por referencia. En este caso, los caracteres son claros, pero se pierden porciones de líneas 26 y logotipo 28. Las dificultades ilustradas por las Figuras 2 y 3 se superan por modalidades preferidas de la presente invención. Ahora se hace referencia a la Figura 4, que es una representación gráfica esquemática del aparato de procesamiento de imagen 40, de acuerdo con una modalidad preferida de la presente invención. El aparato comprende un digitalizador 42, o cualquier otro tipo conveniente de dispositivo para captura de imagen conocido en la especialidad, que recibe y digitaliza un documento, tal como un cheque 20 (la Figura 1) . El digitalizador captura una imagen a escala de grises del documento y transporta los datos de imagen correspondientes a un procesador de imagen 44, que comprende típicamente una computadora de propósito general conveniente. En forma alterna, la imagen se alimenta al procesador de otra fuente. El procesador 44 procesa la imagen a escala de grises para generar imagen trinaría del documento, y luego además procesa la imagen trinaría para generar una imagen binaria, utilizando los métodos descritos a continuación. La imagen trinaría o binaria típicamente se exhibe en un monitor 46 y/o almacena en una memoria masiva 48 para recuperación posterior. Las imágenes también pueden imprimirse o transmitirse sobre una red, así como someterse a mayor procesamiento, utilizando métodos de reconocimiento óptico de caracteres (OCR = Optical Character Recognition) conocidos en la especialidad, por ejemplo. Las funciones de procesamiento de imagen del procesador 44 de preferencia se realizan utilizando soporte lógico que corre en el procesador, que implementa una modalidad de la presente invención, como se describe en detalle a continuación. El soporte lógico puede suministrarse en un medio tangible tal como discos flexibles, o CD-ROM, y cargarse en el procesador. En forma alterna, el soporte lógico puede descargarse al procesador por una conexión de red u otro enlace electrónico. Además en forma alterna, el procesador 44 puede comprender elementos de cableado físico dedicados o un procesador de señal digital para llevar a cabo algunas o todas las etapas de procesamiento de imagen. La Figura 5 es un diagrama de flujo que ilustra esquemáticamente un método para binarizar imágenes a nivel de grises, de acuerdo con una modalidad preferida de la presente invención. Una imagen a nivel de grises, tal como la imagen de la Figura 1, se alimenta al procesador 44 en una etapa de alimentación de imagen 50. Los valores a nivel de grises de los pixeles y particularmente los espacios entre los valores de pixeles vecinos, se analizan en una etapa de optimización 52, para encontrar un valor medio óptimo T y una valor de diferencia D. T y D definen un valor umbral superior, dado por T + D/2, y un valor de umbral inferior, dado por T - D/2. En una etapa de trinarización 54, todos los pixeles en la imagen de alimentación se clasifican en tres grupos: aquéllos que tienen valores a nivel de grises por debajo del umbral inferior se marcan como negro (o frente - típicamente binario 1) ; aquéllos sobre el umbral superior se marcan como blanco (o fondo - binario 0) ; y aquéllos intermedios a los umbrales superior e inferior se marcan como gris. El resultado, es un imagen trinaría que puede exhibirse en el monitor 46 o almacenarse en memoria 48. En la etapa 52, los valores de T y D se eligen para incrementar el número de bordes significantes en la imagen de alimentación que se conservan en la imagen binaria de salida, mientras que se disminuye el número de borde de artefacto que ocurre. Para este propósito, definimos un "espacio significante" entre dos pixeles vecinos como un espacio cuyo tamaño absoluto es mayor que D. Decimos que un espacio"representa" en una imagen binaria de salida I (T) , generada utilizando T como el umbral de binarización, y los pixeles en cualquier lado del espacio tienen valores binarios diferentes en I (T) . En otras palabras, el espacio se representa si uno de los pixeles en la imagen de alimentación tiene un valor de nivel de grises mayor que T, y el otro es menor que T. Los valores óptimos de T y D luego de preferencia se encuentran al maximizar una función de mérito de T y D que se elige para cumplir con los siguientes criterios: 1. Correlaciona positivamente con el número de espacios significantes en la imagen de alimentación que se representan en I (T) ; 2. Correlaciona negativamente con el número de espacios insignificantes en la imagen de alimentación que se representan en I (T) ; y 3. Correlaciona negativamente con el número de espacios significantes en la imagen de alimentación que no se representan en I (T) . Para calcular esta función de mérito, sea N(T,D) , una cuenta ponderada de espacios insignificantes en la imagen de alimentación que se representa en I (T) . De preferencia, la ponderación es tal que entre más pequeño sea el espacio que se representa en I (T) , mayor será su peso) . En otra palabras, cada espacio contado en N(T,D) tiene un pixel con un valor a nivel de grises mayor que T, y el otro pixel con un valor a nivel de grises menor que T, con la diferencia absoluta entre valores nivel de grises que no son mayores que D. Sea MAX que denota el valor a nivel de grises más alto en la imagen, de manera tal que N(T,MAX) es la cuenta ponderada de todo los espacios representados en I (T) . Sea G(D) una cuenta ponderada del número de espacios significantes en la imagen, es decir espacios que tienen una diferencia absoluta mayor que D entre los valores a nivel de grises de pixel. Los siguientes métricas luego se definen: 1. bueno(T,D) = N (T,MAX) - N (T, D) , la cuenta ponderada de espacios significantes representados en I (T) ; 2. artefactos (T,D) = N(T,D), espacios insignificantes representados en I (T) ; 3. faltante (T,D) = G(D) - bueno (T,D), espacios significantes que faltan en I (T) . Estas métricas corresponden a los tres criterios anteriormente enlistados. La calificación de mérito de cualquier par (T,D) luego se da por: Calificación (T,D) = bueno (T,D) - artefactos (T, D) - faltante (T,D) El par (T,D) que da la calificación más alta se elige para utilizar en la etapa 54. Esta calificación de mérito y método para seleccionar T y D se describieron anteriormente a manera de ejemplo y pueden emplearse otras calificaciones y métodos para optimizar T y D. Por ejemplo, los pesos o ponderaciones asignadas a los espacios pueden variarse. También, aunque "espacios" se define aquí con referencia a pixeles vecinos, los pixeles no requieren ser inmediatamente vecinos, sino pueden en su lugar estar separados una pequeña distancia. Además, puede no ser necesario el evaluar todos los espacios en la imagen, sino más bien pueden tomarse muestras representativas. Además, ya que el propósito de evaluar los espacios es primordialmente elegir valores de T y D que conservarán bordes reales en la imagen binaria, un operador de borde, tal como una transformada Sobel, puede emplearse para identificar bordes en la imagen a escala de gris. T y D luego pueden optimizarse sobre los espacios de pixel que corresponden a estos bordes. Otras señales de información en la imagen a escala de gris, tal como perfiles de intensidad de forma V ("bordes de techo" - comúnmente encontrados en líneas delgadas y características de texto) , similarmente pueden emplearse para este propósito. Otros métodos para seleccionar los valores de umbral superior e inferior serán aparentes para aquéllos con destreza en la especialidad y se consideran dentro del alcance de la presente invención. Ahora regresando a la Figura 5, en una etapa de procesamiento de pixel gris 56, los pixeles intermedios se procesan por separado, y de preferencia se les asignan valores binarios. Un método preferido para binarizar los pixeles intermedios se describe previamente con referencia a la Figura 6. En una modalidad alterna, un algoritmo de binarización orientado a texto, tal como aquel empleado para generar la imagen 35 en la Figura 3, se aplica a la imagen de alimentación a nivel de gris. Los pixeles intermedios (gris) de la etapa 54, y opcionalmente los pixeles blancos, por igual, luego se les asignan los valores binarios generados por el algoritmo de binarización orientado a texto. Otros métodos para procesar los pixeles intermedios serán aparentes para aquéllos con destreza en la especialidad y se consideran dentro del alcance de la presente invención. En forma alterna, los pixeles intermedios no se binarizan, y sus valores a nivel de grises se almacenan y exhiben junto con los valores binarios de los otros pixeles. Una vez que todos los pixeles se han binarizado, la imagen binaria se envía de salida para exhibición, almacenamiento o adicional procesamiento en una etapa de salida 58. Opcionalmente, la imagen trinaría se envía de salida por igual . La Figura 6 es un diagrama de flujo que ilustra esquemáticamente detalles de la etapa de procesamiento de pixel gris 56, de acuerdo con una modalidad preferida de la presente invención. La esencia del método de la Figura 6 es que los pixeles que resaltan como significativamente más brillantes o más oscuros que sus vecinos, se marcan respectivamente como blanco o negro. De esta manera, para cada uno de los pixeles intermedios, un promedio local de los valores a nivel de grises de los pixeles en su vecindad se determina, en una etapa de promediado 60. En una etapa de pixel negro 62, aquéllos pixeles cuyos valores de nivel de gris son menos que el promedio local por una diferencia mayor que D, se les asignan para ser negro binario. Pixeles cuyos valores de nivel de gris son mayores que el promedio local en más de D se les asignan blanco binario, a una etapa de pixel blanco 64. En forma alterna, otra valor de diferencia conveniente puede emplearse en lugar de D en las etapas 62 y 64. Además en forma alterna o adicional, pueden emplearse otras medidas y operadores tales como operadores de borde, para encontrar los pixeles que resaltan entre los pixeles intermedios. Los pixeles restantes, que no se han categorizado en la etapa 62 o 64, se procesan en una etapa de formación de umbral 66. De preferencia, estos pixeles simplemente se binarizan respecto al umbral T, de manera tal que pixeles con valores a nivel de grises mayores que T se asignan a blanco binario, y los otros pixeles a negro binario. En forma alterna, otro método para formar umbral puede emplearse. La Figura 7 es una representación esquemática de una imagen binaria 70 de un cheque 20, generado utilizando el método de las Figuras 5 y 6, de acuerdo con una modalidad preferida de la presente invención. Mientras que los caracteres 22 no son tan claros como en la Figura 3, las líneas 26 y el logo tipo 28 se reproducen en forma precisa . Aunque modalidades preferidas se describieron previamente con referencia a formación de imagen de documento, se entenderá que los principios de la presente invención similarmente pueden emplearse en otras aplicaciones de procesamiento de imagen. Por ejemplo, los métodos aquí descritos pueden adaptarse para detectar bordes con una intensidad dada, relativamente uniforme en una imagen, y para distinguir entre los bordes en la imagen que realmente representan características salientes y aquéllas que surgen debido a artefactos o que de otra forma son insignificantes. El método de la presente invención también puede aplicarse, mutatis mutandis, a imágenes de color y a imágenes de objetos tri-dimensionales . De esta manera se apreciará que las modalidades preferidas anteriormente descritas se citan a manera de ejemplo, y que la presente invención no se limita a lo que se ha mostrado y descrito particularmente con anterioridad. Por el contrario, el alcance de la presente invención incluye tanto combinaciones como sub-combinaciones de las diversas características descritas previamente, así como variaciones y modificaciones de las mismas que se le ocurrirán a personas con destreza en la especialidad ante lectura de la descripción anterior y que no se describe en la técnica previa.

Claims

REIVINDICACIONES

1. Un método para binarización de imagen, caracterizado porque comprende: recibir una imagen de alimentación a nivel de grises, que comprende una pluralidad de pixeles que tienen valores a nivel de grises respectivos; analizar variaciones entre los valores a nivel de grises de los pixeles en la imagen de alimentación para determinar estadísticas de imagen con relación a espacios entre los valores a nivel de grises de los pixeles vecinos; en respuesta a las estadísticas de la imagen, determinar un umbral inferior y un umbral superior, que es mayor que el umbral inferior por una diferencia selecta; asignar un primer valor binario a los pixeles en la imagen a nivel de grises que tienen valores a nivel de grises sobre el umbral superior y un segundo valor binario a los pixeles en la imagen a nivel de grises que tiene valores a nivel de grises debajo del umbral inferior; y procesar los pixeles en un grupo intermedio que tiene valores a nivel de grises entre los umbrales inferior y superior para determinar asignaciones óptimas de los pixeles en el grupo intermedio al primer y segundo valores binarios.

2. Un método de conformidad con la reivindicación 1 , caracterizado porque analizar las variaciones entre los valores a nivel de grises comprende encontrar bordes en la imagen de alimentación, y en donde determinar los umbrales comprende seleccionar los umbrales para conservar los bordes en una imagen de salida constituida por valores binarios asignados.

3. Un método de conformidad con la reivindicación 1, caracterizado porque determinar los umbrales comprende seleccionar los umbrales para conservar los espacios que son significantes en preferencia a los espacios que no son significantes en una imagen de salida constituida por los valores binarios asignados .

4. Un método de conformidad con la reivindicación 3, caracterizado porque seleccionar los umbrales comprende definir los espacios que son significantes como aquéllos cuya magnitud absoluta es mayor que la diferencia selecta entre los umbrales superior e inferior.

5. Un método de conformidad con la reivindicación 4, caracterizado porque comprende seleccionar los umbrales comprende seleccionar los umbrales superior re inferior, a fin de llevar al máximo una calificación de mérito calculada para múltiples pares diferentes de umbrales superior e inferior, en donde la calificación se correlaciona positivamente con el número de espacios significantes conservados en la imagen de salida por los umbrales selectos, y se correlaciona negativamente con el número de espacios que no son significantes que se conservan y el número de espacios significantes que no se conservan en la imagen de salida por los umbrales selectos.

6. Un método de conformidad con cualquiera de las reivindicaciones 1-5, caracterizado porque determinar los umbrales comprende seleccionar los umbrales a fin de conservar información de borde en una imagen de salida constituida por los valores binarios asignados.

7. Un método de conformidad con la reivindicación 6, caracterizado porque seleccionar los umbrales comprende elegir los umbrales substancialmente sin dependencia del tipo de características de imagen al cual pertenece la información.

8. Un método de conformidad con la reivindicación 6, caracterizado porque seleccionar los umbrales comprende encontrar un valor promedio óptimo de los umbrales superior e inferior y encontrar un valor óptimo de la diferencia selecta entre los umbrales.

9. Un método de conformidad con cualquiera de las reivindicaciones 1-5, caracterizado porque el procesamiento de los pixeles en el grupo intermedio comprende analizar variaciones entre los valores a nivel de grises de los pixeles en la imagen de alimentación y determinar las asignaciones de los pixeles al primer y segundo valores binarios en respuesta a las variaciones analizadas .

10. Un método de conformidad con la reivindicación 9 , caracterizado porque determinar las asignaciones en respuesta a la variaciones analizadas comprende encontrar una diferencia significante entre el valor a nivel de grises de uno de los pixeles y los valores a nivel de grises de otros pixeles en su vecindad, y asignar el pixel al primero o segundo valor binario en respuesta a la diferencia.

11. Un método de conformidad con cualquiera de las reivindicaciones 1-5, caracterizado porque el procesar los pixeles en el grupo intermedio comprende aplicar un método de binarización optimizado para texto, para determinar las asignaciones óptimas de los pixeles en el grupo intermedio.

12. Un método de conformidad con cualquiera de 5 las reivindicaciones 1-5, caracterizado porque comprende enviar de salida una imagen binaria constituida por los valores binarios asignados de los pixeles.

13. Un método para procesar una imagen de alimentación a nivel de grises, que incluye una 10 pluralidad de pixeles que tiene valores a nivel de grises respectivos, el método se caracteriza porque comprende: analizar variaciones entre los valores a nivel de grises de los pixeles en la imagen de alimentación; en respuesta a las variaciones analizadas, 15 determinar un umbral inferior y un umbral superior, que es mayor que el umbral inferior por un tamaño de espacio selecto; asignar un primer valor binario a los pixeles en la imagen a nivel de grises que tiene valores a nivel 20 de grises sobre el umbral superior y un segundo valor binario a los pixeles en la imagen a nivel a gris que tiene valores a nivel de grises inferiores al umbral inferior; y -•- --*•-'--«- .^~«-.. - - --<-ui--«-^---i. generar una imagen de salida, en donde los pixeles asignados al primer y segundo valores binarios se representan por sus valores binarios respectivos y los pixeles en un grupo intermedio que tienen valores a nivel de grises entre los umbrales inferior y superior, se representan por sus valores a nivel de grises respectivos .

14. Un método de conformidad con la reivindicación 13, caracterizado porque determinar los umbrales comprende seleccionar los umbrales a fin de conservar información de borde en la imagen de salida.

15. Un método de conformidad con la reivindicación 13 ó 14, caracterizado porque generar la imagen de salida comprende exhibir la imagen de salida.

16. Un método de conformidad con la reivindicación 13 ó 14, caracterizado porque generar la imagen de salida comprende almacenar la imagen de salida en una memoria.

17. Un aparato para binarización de imagen, que comprende un procesador de imagen, que se acopla para recibir una imagen de alimentación a nivel de grises, que comprende una pluralidad de pixeles que tienen valores a nivel de grises respectivos, y que se adaptan para analizar variaciones entre las imágenes a nivel de grises de los pixeles en la imagen de alimentación para determinar estadísticas de imagen con relación a espacios entre los valores a nivel de grises de los pixeles vecinos; y en respuesta a las estadísticas de la imagen, 5 determinar un umbral inferior y un umbral superior, que es mayor que el umbral inferior por una diferencia selecta, asignar un primer valor binario a los pixeles en la imagen a nivel de grises que tienen valores a nivel de grises sobre el umbral superior y un segundo valor 10 binario a los pixeles en la imagen a nivel de grises que tiene valores a nivel de grises debajo del umbral inferior; y procesar los pixeles en un grupo intermedio que tiene valores a nivel de grises entre los umbrales inferior y superior para determinar asignaciones óptimas 15 de los pixeles en el grupo intermedio al primer y segundo valores binarios.

18. El aparato de conformidad con la reivindicación 17, caracterizado porque el procesador se adapta para determinar las asignaciones de los pixeles en 20 el grupo intermedio al primero y segundo valores binarios en respuesta a las variaciones analizadas.

19. El aparato de conformidad con la reivindicación 17 ó 18, caracterizado porque el procesador se adapta para seleccionar los umbrales a fin "***J**^Í ^-' — - — - -•-» - -• -- -'- - —'- - - - - - --•>- de conservar información de borde en una imagen de salida constituida por los valores binarios asignados, substancialmente sin dependencia del tipo de característica de imagen al cual pertenece la información.

20. El aparato de conformidad con la reivindicación 17 ó 18, caracterizado porque el procesador se adapta para aplicar un método de binarización optimizado para texto, para determinar las asignaciones óptimas de los pixeles en el grupo intermedio .

21. el aparato de conformidad con la reivindicación 17 ó 18, caracterizado porque el procesador se adapta para enviar una imagen binaria constituida por los valores binarios asignados de los pixeles .

22. Un aparato para procesar una imagen de alimentación a nivel de grises, que incluye una pluralidad de pixeles, que tienen valores a nivel de grises respectivos, el aparato comprende un procesador de imagen, que se adapta para analizar variaciones entre los valores a nivel de grises de los pixeles en la imagen de alimentación y, en respuesta a las variaciones analizadas, determinar un umbral inferior y un umbral ..»^..... ---*.*.. superior, que es mayor que el umbral inferior por un tamaño de espacio selecto, y asignar un primer valor binario a los pixeles en la imagen a nivel de grises que tiene valores a nivel de grises sobre el umbral superior y un segundo valor binario a los pixeles en la imagen a nivel de grises que tiene valores a nivel de grises por debajo del umbral inferior, para de esta manera generar una imagen de salida, en donde los pixeles asignados al primer y segundo valores binarios se representan por sus valores binarios respectivos, y los pixeles en un grupo intermedio que tiene valores de nivel de grises entre los umbrales inferior y superior, se representan por sus valores a nivel de grises respectivos.

23. El aparato de conformidad con la reivindicación 22, caracterizado porque comprende un exhibidor, acoplado al procesador a fin de recibir y exhibir la imagen de salida.

24. El aparato de conformidad con la reivindicación 22 ó 23, caracterizado porque comprende una memoria de almacenamiento, que se acopla al procesador a fin de recibir y almacenar la imagen de salida.

25. Un producto de soporte lógico de computadora, para procesar una imagen de alimentación, que comprende un medio legible por computadora que tiene instrucciones de programa almacenadas en él, estas instrucciones, cuando se leen por una computadora, provocan que la computadora reciba una imagen de alimentación a nivel de grises que comprende una pluralidad de pixeles que tiene valores a nivel de grises respectivos, para analizar variaciones entre valores a nivel de grises de los pixeles en la imagen de alimentación para determinar estadísticas de imagen con respecto a espacios entre los valores a nivel de grises de pixeles vecinos y en respuesta a las estadísticas determinar un umbral inferior y un umbral superior, que es mayor que el umbral inferior por una diferencia selecta, para asignar un primer valor binario a los pixeles en la imagen a nivel de grises que tiene valores a nivel de grises sobre el umbral superior y un segundo valor binario a los pixeles en la imagen a nivel de grises que tiene valores de nivel de grises inferior al umbral inferior, y procesar los pixeles en un grupo intermedio que tiene valores a nivel de grises entre los umbrales inferior y superior, para determinar asignaciones óptimas de los pixeles en el grupo intermedio al primer y segundo valores binarios.

26. Un producto de conformidad con la reivindicación 25, caracterizado porque las instrucciones además provocan que la computadora envíe de salida una imagen binaria constituida por valores binarios asignados 5 de los pixeles.

27. Un producto de soporte lógico de computadora para procesar una imagen de alimentación a nivel de grises, que incluye una pluralidad de pixeles que tiene valores a nivel de grises respectivos, el 10 producto comprende un medio legible por computadora que tiene instrucciones de programa ahí almacenadas, estas instrucciones, cuando se leen por una computadora provocan que la computadora analice variaciones entre los valores a nivel de grises de los pixeles en la imagen de 15 alimentación y en respuesta a las variaciones analizadas, determinar un umbral inferior y un umbral superior, que es mayor que el umbral inferior por un tamaño de espacio selecto, para asignar un primer valor binario a los pixeles en la imagen a nivel de grises que tiene valores 20 de nivel de grises sobre el umbral superior y un segundo valor binario a los pixeles en la imagen a nivel de grises que tiene valores a nivel de grises por debajo del umbral inferior, y generar una imagen de salida, en donde los pixeles asignados al primer y segundo valores ^^«^.-^•-fa, binarios se representan por sus valores binarios respectivos, y los pixeles en un grupo intermedio que tienen valores a nivel de grises entre los umbrales inferior y superior se representan por sus valores a nivel de grises respectivos.