ES2275474T3 - Metodo de segmentacion de caracteres para reconocimiento de placas de matricula de vehiculos. - Google Patents

Metodo de segmentacion de caracteres para reconocimiento de placas de matricula de vehiculos. Download PDF

Info

Publication number
ES2275474T3
ES2275474T3 ES00307697T ES00307697T ES2275474T3 ES 2275474 T3 ES2275474 T3 ES 2275474T3 ES 00307697 T ES00307697 T ES 00307697T ES 00307697 T ES00307697 T ES 00307697T ES 2275474 T3 ES2275474 T3 ES 2275474T3
Authority
ES
Spain
Prior art keywords
characters
image
regions
recognition
license plate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES00307697T
Other languages
English (en)
Inventor
Jenn-Kwei Tyan
Claus Neubauer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens Corporate Research Inc
Original Assignee
Siemens Corporate Research Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Corporate Research Inc filed Critical Siemens Corporate Research Inc
Application granted granted Critical
Publication of ES2275474T3 publication Critical patent/ES2275474T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Devices For Checking Fares Or Tickets At Control Points (AREA)

Abstract

Método para segmentar y reconocer placas de matrícula que comprende las etapas de: capturar (10) una imagen de una placa de matrícula; procesar (11) previamente la imagen para preparar la imagen para la segmentación y el reconocimiento; dividir (114) directamente regiones de la imagen de la placa de matrícula en supuestas regiones de caracteres; reconocer (115) las supuestas regiones de caracteres en la imagen de la placa de matrícula y proporcionar una puntuación de seguridad basada en una probabilidad de coincidencia correcta; si los supuestos caracteres tienen una puntuación de seguridad por debajo de un valor umbral, fusionar (116) inversamente supuestas regiones de caracteres adyacentes para evaluar regiones en la imagen para determinar si puede lograrse una mayor seguridad al combinar regiones; reconocer las supuestas regiones de caracteres fusionadas inversamente en la placa de matrícula; y si las supuestas regiones de caracteres fusionadas inversamente tienen una puntuación de seguridad por debajo del valor umbral, repetir las etapas de fusión inversa y de reconocimiento; en el que la etapa de procesamiento previo de la imagen para preparar la imagen para la segmentación y el reconocimiento incluye las etapas de: refinar (18) una posición de la placa de matrícula: determinando una altura de los caracteres en la imagen de la placa de matrícula empleando una función de proyección; calculando una variancia espacial para determinar una posición central de los caracteres; empleando la posición central y la altura de los caracteres para reducir un tamaño de una región de interés detectando los bordes de un límite de placa y calculando una longitud de los bordes para identificar la región de interés.

Description

Método de segmentación de caracteres para reconocimiento de placas de matrícula de vehículos.
Antecedentes 1. Campo técnico
Esta descripción se refiere al reconocimiento de caracteres y, más en particular, a un método de segmentación de caracteres en una placa de matrícula para su reconocimiento.
2. Descripción de la técnica relacionada
En el pasado se han desarrollado diversos sistemas en la técnica anterior basados en la visión por ordenador para leer un número de placa de matrícula. Estos sistemas normalmente consisten en tres módulos principales: localización de la placa, segmentación de caracteres y reconocimiento de caracteres. En un esquema de modo en serie, la segmentación de caracteres es necesaria para realizar el reconocimiento de caracteres que se basa totalmente en caracteres aislados. Los caracteres segmentados de manera incorrecta no se reconocerán probablemente correctamente. De hecho, la mayoría de errores de reconocimiento en los sistemas de bucle abierto convencionales no se debe a una falta de capacidad de reconocimiento sino a errores de segmentación en diferentes niveles de la imagen. Resulta difícil desarrollar una segmentación de caracteres robusta para el reconocimiento de placas de matrícula. Las razones son principalmente que la resolución limitada de los caracteres de la placa junto con la suciedad, arañazos, sombras y sesgos etc., normalmente degradan el rendimiento de la segmentación. Además, el entorno exterior sujeto a grandes variaciones de cambios de iluminación
\hbox{podría hacer muy complicado  el desarrollo
de un esquema de segmentación fiable.}
La segmentación de caracteres basada en la proyección de píxeles se usa ampliamente en los sistemas de reconocimiento óptico de caracteres (OCR, del inglés "optical carácter recognition") convencionales. En general, los sistemas convencionales dan un buen resultado para la mayoría de tareas de reconocimiento de texto impreso a máquina. La ventaja de tales sistemas es que se gana en velocidad de ejecución. Si los caracteres en una placa de matrícula están en perfectas condiciones, es decir, están suficientemente separados o intactos, la segmentación de caracteres puede efectuarse directamente a partir de la función de proyección. Sin embargo, en escenarios de la vida real normalmente no se dispone de imágenes de placas de matrícula limpias e iluminadas de manera uniforme.
LU Y: "Machine printed character segmentation - an overview" Pattern Recognition, Pergamon Press Inc. Elmsford, N.Y., EE.UU., vol. 28,nº 1, 1995, páginas 67-80, da a conocer un método para la segmentación y el reconocimiento de caracteres impresos que se dividen en supuestas regiones de caracteres. Los segmentos se vuelven a dividir en segmentos más pequeños si contienen múltiples caracteres. El documento EP 0862132 también da a conocer un método para la segmentación y el reconocimiento de placas de matrícula en el que se capturan imágenes y se procesan previamente y hay una división de regiones en supuestas regiones de caracteres. Cuando hay un espacio más ancho de la media entre dos caracteres sucesivos, puede haber una nueva segmentación para comprobar si hay caracteres adicionales. R.M Bozinovic y S.N. Srihari en "Off-Line Cursive Script Word Recognition" (IEEE Transc. Pattern Analysis and Machine Intelligence, enero de 1989) presentan un proceso de reconocimiento de caracteres que emplea la segmentación directa y la reagrupación de regiones de caracteres. Según este artículo, todas las hipótesis de letras obtenidas agrupando una, dos o tres regiones de caracteres se evalúan frente a las letras y símbolos del alfabeto (a...z), entonces las hipótesis de letras con puntuación de alta seguridad se consideran en combinación con las hipótesis de letras que han obtenido altas puntuaciones en el ciclo anterior etc. Sin embargo, estos métodos de la técnica anterior puede que no proporcionen un reconocimiento de caracteres completo en todas las circunstancias.
Por lo tanto, existe una necesidad de un método de segmentación robusto para la segmentación de caracteres en una pluralidad de diferentes condiciones de iluminación y ambientales.
Sumario de la invención
Un método para la segmentación y el reconocimiento de placas de matrícula, según la presente invención, que puede implementarse usando un dispositivo de almacenamiento de programas legible por ordenador, que incorpora de manera tangible un programa de instrucciones ejecutable por el ordenador para realizar las etapas del método, incluye capturar una imagen de una placa de matrícula y procesar previamente la imagen para preparar la imagen para la segmentación y el reconocimiento. La imagen se divide directamente en supuestas regiones de caracteres de la imagen de la placa de matrícula. Las supuestas regiones de caracteres en la imagen de la placa de matrícula se reconocen y se les proporciona una puntuación de seguridad basada en una probabilidad de coincidencia correcta. Si los supuestos caracteres tienen una puntuación de seguridad por debajo de un valor umbral, se realiza una fusión inversa de supuestas regiones de caracteres adyacentes. Se reconocen las supuestas regiones de caracteres fusionados inversamente en la placa de matrícula y, si las supuestas regiones de caracteres fusionadas inversamente tienen una puntuación de seguridad por debajo del valor umbral, se repiten las etapas de fusión inversa y reconocimiento.
La etapa de procesamiento previo de la imagen para preparar la imagen para la segmentación y el reconocimiento incluye las etapas de refinar una posición de la placa de matrícula determinando una altura de los caracteres en la imagen de la placa de matrícula empleando una función de proyección, calcular una varianza espacial para determinar una posición central de los caracteres, emplear la posición central y la altura de los caracteres para reducir un tamaño de una región de interés detectando los bordes de un límite de placa y calcular una longitud de los bordes para identificar una región de interés.
En realizaciones alternativas, que pueden emplear el dispositivo de almacenamiento de programas, la etapa de reconocer supuestas regiones de caracteres en la imagen de la placa de matrícula puede incluir determinar regiones con una puntuación de seguridad por debajo de un umbral, y la etapa de dividir directamente regiones puede incluir la etapa de segmentar caracteres que se tocan o se solapan en supuestas regiones de caracteres adyacentes empleando una función de discriminación basada en proyecciones del contorno de los caracteres. La etapa de segmentar caracteres que se tocan o se solapan puede aplicarse de manera recursiva para lograr el valor umbral de una puntuación de seguridad. La etapa de reconocer supuestas regiones de caracteres en la imagen de la placa de matrícula y proporcionar una puntuación de seguridad basada en una probabilidad de una coincidencia correcta puede incluir la etapa de reconocer caracteres en la imagen de la placa de matrícula empleando
\hbox{al menos una de entre una
red neuronal y una correlación de plantillas.}
En otras realizaciones adicionales, la etapa de reconocer las supuestas regiones de caracteres fusionadas inversamente en la placa de matrícula puede incluir la etapa de reconocer caracteres en la imagen de la placa de matrícula empleando al menos una de entre una red neuronal y una correlación de plantillas. La etapa de procesar previamente la imagen para preparar la imagen para la segmentación y el reconocimiento puede incluir las etapas de detectar la inclinación previa en la imagen de la placa de matrícula detectando bordes y seleccionando puntos distintivos para determinar una matriz de proyección en los bordes, seleccionar la matriz de proyección que tiene el mayor coste para determinar un ángulo de rotación y corregir la imagen de la placa de matrícula según el ángulo de rotación. La etapa de procesamiento previo de la imagen para preparar la imagen para la segmentación y el reconocimiento puede incluir las etapas de proporcionar un perfil de proyección de intensidades de píxeles a través de líneas verticales de píxeles de la imagen, filtrar el perfil de proyección e identificar ubicaciones de caracteres en la imagen ilustradas por áreas por debajo de un valor umbral en el perfil de proyección filtrado. Preferiblemente se realiza la etapa de extraer caracteres reconocidos de la imagen de la placa de matrícula. Puede incluirse la etapa de comparar caracteres reconocidos y bloques de caracteres de códigos de placas de matrícula predeterminados y convenciones para comprobar la precisión del reconocimiento.
Estos y otros objetos, características y ventajas de la presente invención resultarán evidentes a partir de la siguiente descripción detallada de realizaciones ilustrativas de la misma, que debe leerse en conexión con los dibujos acompañantes.
Breve descripción de los dibujos
Esta memoria presentará detalladamente la siguiente descripción de realizaciones preferidas con referencia a las siguientes figuras en las que:
La figura 1 es un diagrama de flujo que muestra un método de reconocimiento de placas de matrícula según la presente invención;
la figura 2 es una gráfica del coste frente al ángulo de inclinación para determinar un ángulo de inclinación para las placas de matrícula según la presente invención;
la figura 3 es una gráfica de S(j) frente a píxeles para determinar la altura de caracteres para los caracteres de la placa de matrícula según la presente invención;
la figura 4 es un diagrama de bloques que muestra diferentes fases del refinamiento de la posición de la placa según la presente invención;
la figura 5A ilustra píxeles de caracteres solapados que han de segmentarse según la presente invención;
la figura 5B es una proyección del contorno para determinar las posiciones de los caracteres de la figura 5A que han de segmentarse según la presente invención;
la figura 5C es una gráfica del coste de discriminación para determinar una ubicación para segmentar los caracteres de la figura 5A según la presente invención;
la figura 5D ilustra perfiles superior e inferior para determinar las alturas de los caracteres de la figura 5A que han de segmentarse según la presente invención;
la figura 6A ilustra píxeles para caracteres que se tocan y que han de segmentarse según la presente invención;
la figura 6B es una proyección del contorno para determinar las posiciones de los caracteres de la figura 6A que han de segmentarse según la presente invención;
la figura 6C es una gráfica del coste de discriminación para determinar una ubicación para la segmentación de los caracteres de la figura 6A según la presente invención;
la figura 6D ilustra perfiles superior e inferior para determinar las alturas de los caracteres de la figura 6A que han de segmentarse según la presente invención;
la figura 7 es un diagrama de flujo de un método de segmentación basado en el reconocimiento según la presente invención;
la figura 8 ilustra supuestas regiones de caracteres determinadas por un proceso de división directa según la presente invención;
la figura 9 es un árbol de decisión empleado para realizar una fusión inversa según la presente invención; y
las figuras 10A y 10B muestran ejemplos de k variable, una constante para ajustar límites de caracteres, usada para proporcionar una mayor puntuación de seguridad en el reconocimiento de caracteres.
Descripción detallada de realizaciones preferidas
La presente invención se refiere al reconocimiento de caracteres y, más en particular, a un método robusto para segmentar caracteres en una placa de matrícula para su reconocimiento. El reconocimiento automático de placas de matrícula de vehículos es particularmente útil para aplicaciones de gran precisión en las que se lleva a cabo la identificación de coches. El reconocimiento de placas de matrícula de vehículos es beneficioso en la monitorización y control del tráfico así como en el mantenimiento de registros del tráfico en tránsito, por ejemplo en una entrada a un aparcamiento. Para mejorar el rendimiento de la segmentación de caracteres, la presente invención realiza un procesamiento previo de las imágenes para tratar el sesgo de la placa y refinar la posición de la placa tras rotar la imagen. Esto es necesario para preparar los datos para un procesamiento posterior. Las imágenes de vehículos se deterioran debido a caracteres separados y que se tocan. La incapacidad de reconocer y segmentar estos caracteres tiene como resultado que el proceso de segmentación sea responsable de la mayoría de errores experimentados en los sistemas de reconocimiento.
La presente invención proporciona un método para separar de manera más precisa caracteres que se tocan y fusionar caracteres separados. La presente invención proporciona una función de discriminación potente y eficaz para identificar caracteres que se tocan basándose en un análisis diferencial de la distancia del contorno de caracteres. La presente invención también separa caracteres salientes que se solapan con caracteres vecinos.
En lugar de un esquema de funcionamiento de bucle abierto, la presente invención emplea un método de segmentación recursiva de manera condicional que puede extraer caracteres individuales, por ejemplo, de una placa de matrícula, con precisión y eficacia. Los métodos de la invención están interrelacionados entre segmentación y reconocimiento para comprobar si los caracteres de la placa se han segmentado correctamente basándose en el resultado del reconocimiento de caracteres. En una realización, para un procedimiento de división directa, se aplica selectivamente una función de discriminación a las supuestas regiones de caracteres que determina el mejor punto de separación si los caracteres se tocan o se solapan. A continuación, sigue un procedimiento de fusión inversa para recuperar la falsa segmentación debida a caracteres separados. Tanto el procedimiento de división como de fusión emplean la retroalimentación de clasificación de la etapa de reconocimiento de caracteres.
La invención cuenta con un clasificador que incluye una correlación de plantilla y redes neuronales. Esto aumenta ventajosamente la potencia de reconocimiento y proporciona mejores resultados de segmentación. La presente invención incluye además características basadas en reglas y características de medición en la segmentación de la placa. Esto incluye las normas y códigos de registro que establecen la apariencia de las placas (por ejemplo, códigos de ciudad/locales), campos alfanuméricos y tamaño de fuente del carácter. Ha de indicarse que los caracteres reconocidos por la presente invención en las placas de matrícula pueden variar y los caracteres pueden no estar fijados de manera uniforme.
Debería entenderse que los elementos mostrados en las figuras 1 y 7 pueden implementarse en varias formas de hardware, software o combinaciones de los mismos. Preferiblemente, estos elementos se implementan en software en uno o más procesamientos digitales de carácter general programado de manera apropiada que presentan un procesador y una memoria e interfaces de entrada/salida.
En referencia ahora de manera específica y detallada a los dibujos en los que los números de referencia iguales identifican elementos similares o idénticos en todas las diversas vistas, e inicialmente a la figura 1, se muestra un diagrama de bloque/flujo según la presente invención. En el bloque 10, se captura o adquiere una imagen, preferiblemente por una cámara digital que presenta un procesador y una memoria. En el bloque 11, la imagen se localiza para enfocar un área de interés (por ejemplo, una placa de matrícula). Esto puede designarse como localización aproximada.
En el bloque 12, se realiza un procesamiento previo de la imagen o segmentación para mejorar la tasa de reconocimiento. Sin un procesamiento previo adecuado, las posteriores etapas de segmentación y reconocimiento podrían resultar difíciles. Diversos métodos de procesamiento previo para el reconocimiento de redes neuronales, por ejemplo, pueden incluir ecualización de imágenes y/o caracteres. En el bloque 14, efectos tales como efectos de luz (por ejemplo, iluminación, distancia y/u orientación) deben tenerse en cuenta para lograr una imagen de referencia buena. Un ejemplo de estos efectos que es importante para el posterior procesamiento, es la normalización del brillo. El procesamiento específico para la segmentación, la detección de la inclinación de la placa (bloque 16) y el refinamiento de la posición de la placa de matrícula (bloque 18) se dan a continuación.
En el bloque 16, se detecta la inclinación o sesgo de la placa y se tiene en cuenta. La inclinación o sesgo de la placa tiene un efecto perjudicial sobre la segmentación de caracteres. Detectar la inclinación de una imagen placa de matrícula y corregirla mejora la precisión de la segmentación y el reconocimiento. Para estimar la inclinación de la placa de matrícula, su precisión depende de rasgos selectivos en la imagen de la placa.
Los algoritmos de detección de la inclinación para placas de matrícula de la técnica anterior se basan en píxeles locales mínimos y máximos extraídos de las regiones de caracteres. Un análisis de la distancia de dispersión de los píxeles distintivos a través de un conjunto de proyecciones ortogonales determina un posible ángulo de inclinación. Sin embargo, la precisión está sujeta al fondo del carácter. Si la placa tiene suciedad, ruido o iluminación no uniforme, entonces los puntos distintivos no deseados puede incluirse y la precisión resultante no es satisfactoria. En lugar de ello, la presente invención emplea el uso de puntos distintivos obtenidos de los bordes superior e inferior de los caracteres junto con un límite de placa, que es paralelo en la dimensión horizontal.
Un detector de bordes se aplica para identificar todos los bordes de carácter y los bordes de la placa en la dirección horizontal. Los puntos dominantes de los bordes se seleccionan entonces usando un umbral adaptativo basado en la desviación media y estándar. Por ejemplo, dado un ángulo de \theta grados girado con respecto a la posición central de la imagen, se calcula una proyección vertical de los puntos obtenidos en la etapa anterior, lo que da una matriz de proyección unidimensional P(\theta). Usando un tamaño de intervalo (bin) con una unidad de píxel en la resolución muestreada debido al pequeño ángulo de rotación, el ángulo de inclinación se determina como sigue. Para cada dirección de proyección, se calcula una función de coste, C(\theta), la suma del cuadrado de los valores acumulados de cada intervalo. Por lo tanto, C(\theta) se obtiene como:
(1)C(\theta) = \sum\limits^{n}_{i=1} p^{2}_{i} (\theta)
siendo P_{i}(\theta) el valor del intervalo de orden i encontrado para el ángulo \theta, y n el número de intervalos. El ángulo que da el C(\theta) máximo corresponde al ángulo de inclinación correcto. De hecho, debido una resolución de grado de la proyección, el C(\theta) máximo puede interpolarse adicionalmente a través de una función de ajuste cuadrático para mejorar la precisión. En una realización, el tiempo de cálculo se reduce limitando un intervalo de ángulo estimado. El intervalo de ángulo estimado puede limitarse dentro de una inclinación de 10 grados de modo que una búsqueda exhaustiva todavía pueda tener un buen resultado sin perjudicar la velocidad. Si la placa está inclinada en un ángulo grande, una búsqueda exhaustiva podría llevar tiempo, una búsqueda de aproximada a fina (tal como una búsqueda binaria o Fibonacci) puede resultar útil para reducir la cantidad de búsqueda necesaria para encontrar un máximo. Los métodos de mínimos cuadrados no lineales pueden emplearse también. El ángulo de inclinación se tiene en cuenta para ayudar al reconocimiento de caracteres de la placa.
En referencia a la figura 2, se traza un gráfico de la función de coste C(\theta) (coste) frente a un ángulo de rotación o ángulo de inclinación. Una placa de matrícula que ha de reconocerse, en este ejemplo, está inclinada en un ángulo con respecto al eje horizontal. El gráfico determina que un ángulo de inclinación de aproximadamente 4 grados está presente en la imagen de entrada de la placa de matrícula (por ejemplo, el coste más alto). Este ángulo se corrige entonces para dar una imagen con un ángulo de rotación de aproximadamente cero grados ajustando la imagen de la placa de matrícula.
En el bloque 18, se lleva a cabo el refinamiento de la posición de la placa. La imagen de salida de la localización (bloque 11) de la placa de matrícula normalmente da un área más amplia que incluye no sólo los caracteres de la placa sino también el marco de la placa y, posiblemente, el cuerpo del vehículo. Es necesario realizar una localización refinada que descarte regiones innecesarias pero que mantenga los caracteres de la placa. La presente invención realiza el refinamiento de la posición de la placa en las dimensiones vertical y horizontal teniendo en cuenta características tales como el límite de placa, el fondo de la placa y los caracteres de la placa.
En general, la mejor característica para facilitar el refinamiento de la posición es la presencia del límite de la placa en la imagen donde forma una forma rectangular y un entorno con zona texturizada. Al detectar los bordes verticales y horizontales y buscar la máxima longitud de los bordes de cada lado, el refinamiento puede realizarse de forma precisa. Sin embargo, para algunas placas de matrícula, si no pueden detectarse uno o más bordes debido a un fondo homogéneo con el cuerpo del vehículo, entonces pueden obtenerse errores importantes. En estos casos, se miden las características de los caracteres de la placa, es decir, altura y anchura.
La presente invención estima la altura de los caracteres en la imagen con la inclinación correcta. Se emplea una signatura de un número de transición de trazo como una característica de medición que corresponde a la existencia de un carácter. Suponiendo que una región candidata de placa tiene la dimensión MxN (píxeles), la función S(j) de proyección se define como la suma de todas las signaturas de caracteres en la fila:
(2)S(j) = \sum\limits^{M-1}_{i=0} r(i,j), 0\leq j\leq N-1
siendo r(i,j) el número de transiciones (objeto-fondo o fondo-objeto) en el píxel (i,j). Esta característica se calcula en la posible imagen binarizada de placa, es decir donde se sitúa la supuesta imagen de la placa de matrícula. La binarización se basa preferiblemente en una media local y una desviación estándar local sobre la imagen. El umbral en el píxel (i,j) se calcula como:
(3)T(i,j) = m(i,j) + k \cdot d(i,j)
siendo m(i,j) y d(i,j) los valores de la media de muestreo y la desviación estándar en una proximidad local de (i,j), respectivamente. En una realización preferida, una proximidad de 16x16 sirve para conservar detalles locales y minimizar efectos de ruido. El valor de k se usa para ajustar qué cantidad del límite del carácter se toma como parte de la imagen dada. Por ejemplo, k = -0,2 para dar caracteres de imprenta bien separados. Ha de observarse que una k constante puede dar como resultado variación de anchura entre caracteres debido a la iluminación no uniforme. El efecto de k correspondiente a un resultado de reconocimiento se ilustrará más adelante. Estadísticamente, el número de transición promedio por fila de zona texturizada es mucho mayor que el de zonas no texturizadas. Si S(j) se segmenta de manera adecuada, el resultado de la distancia de difusión máxima corresponderá a las alturas de los caracteres.
En referencia a la figura 3, se muestra una función S(j) de proyección en la que la altura de los caracteres es la distancia desde los valores de S(j) por encima de un umbral. El umbral de S(j) se obtiene de manera adaptativa basándose en un valor medio y en una desviación estándar de S(j). Una vez determinada la altura de los caracteres, se extrae posteriormente la región de interés en la dimensión vertical.
La anchura de los números de placa puede estimarse basándose en el conocimiento previo de la relación de la anchura de la placa y la altura de la placa, y sólo tiene que determinarse la posición central del número de placa en el eje horizontal. Puede implementare un método de variancia espacial para estimar esta posición. Si la variancia espacial se calcula a lo largo de una línea de la placa de matrícula (por ejemplo, horizontal), las regiones con una alta variancia espacial correspondes a regiones de texto, y las regiones con una baja variancia espacial corresponden a regiones sin texto. Por tanto, la posición asociado a la variancia mayor puede seleccionarse como la posición central del número de placa en el eje horizontal.
Con el análisis de los bordes de la placa, la precisión del refinamiento puede mejorarse y puede eliminarse una detección falsa. Después de haberse realizado el refinamiento a lo largo del eje horizontal, la región de interés se extrae nuevamente y se vuelve a muestrear a una resolución fija para una posterior segmentación y clasificación. La figura 4 muestra el resultado del refinamiento de la posición de la placa en diferentes fases del proceso.
En el bloque 20, se lleva a cabo la segmentación de caracteres. Esto incluye identificar los caracteres en la placa de matrícula separando imágenes de los caracteres para su reconocimiento. (Véase también el bloque 110 de la figura 7). Según la invención, el bloque 22 emplea una segmentación basada en el reconocimiento. En el bloque 22 se realiza la segmentación de caracteres que se tocan/solapan, si es necesario. Resolver la segmentación de caracteres que se tocan es importante para cualquier aplicación de reconocimiento óptico de caracteres (OCR). Se han desarrollado diversas técnicas en la técnica anterior que sufren una incapacidad para discriminar entre caracteres salientes (es decir, caracteres que se solapan con caracteres vecinos) o caracteres que se tocan con caracteres adyacentes.
La invención emplea una función de discriminación basada en la proyección del contorno. Considerando un carácter que se toca con la anchura W, una función V_{c}(k) de proyección de contorno se define como:
(4)V_{c}(k) = (k)inferior - (k)superior, k = 1,2,3,...,W
en la que la función (k)superior da una posición superior en el eje vertical vista desde el perfil superior del contorno externo de los caracteres que se tocan, y la función (k)inferior da una posición inferior en el eje vertical vista desde el perfil inferior del contorno externo de los caracteres que se tocan. Véase las figuras 5D y 6D para los perfiles superior e inferior del carácter saliente "17" en la figura 5A y los caracteres que se tocan "48" en la figura 6A, respectivamente. Utilizando la función de proyección anterior con varias columnas adyacentes, la función F_{c}(k) de discriminación de segmentación se define entonces como sigue:
\hskip1,8cm
1
siendo d una desviación de la posición de un carácter actual hacia posiciones de caracteres adyacentes. El intervalo de suma desde n1 hasta n2 indica todas las desviaciones posibles determinadas empíricamente basándose en el tamaño de los caracteres y la condición solapada en el texto. Dada la robustez de la presente invención, se encontró que n1=1 y n2=2 daban como resultado una buena capacidad de discriminación. También se contemplan otros valores para n1 y n2. Las figuras 5B y 6B muestran proyecciones V_{c}(k) de contorno en función de (k) para las figuras 5A y 6A, respectivamente. Las figuras 5C y 6C ilustran los valores de la función de discriminación, F_{c}(k) en función de k. Cada desviación d participa en los valores de la función de discriminación con aumentos significativos cercanos al punto de contacto de los caracteres. Empleando un umbral adecuado, se seleccionan posibles puntos de separación para ubicaciones en las que dividir la imagen. Debería observarse que la proyección de contorno propuesta sólo se aplica para caracteres sospechosos de haber fracasado durante la clasificación. Es redundante comprobar aquellos caracteres segmentados si pueden reconocerse con una buena medición de seguridad. Además, la proyección de contorno propuesta puede combinarse con una proyección de píxeles para identificar caracteres que se tocan que se mezclan con caracteres en minúsculas en documentos impresos a máquina.
La segmentación basada en el reconocimiento del bloque 22 se realiza según la presente invención. La segmentación basada en el reconocimiento busca en la imagen componentes de caracteres que coincidan con las clases en su alfabeto. El reconocimiento compara plantillas o emplea un clasificador estadístico para identificar caracteres y devolver una puntuación de seguridad basada en una probabilidad de que el carácter se haya identificado correctamente.
El principio de funcionamiento de la presente invención es bastante diferente de la segmentación de bucle abierto basada en distinguir los límites en todas las fuentes desde las regiones interiores, pero está unido íntimamente con el reconocimiento de caracteres. Las segmentaciones basadas en el reconocimiento de la técnica anterior utilizan una ventana deslizante de anchura variable para proporcionar secuencias de segmentaciones candidatas que se confirman por el reconocimiento de caracteres. La imagen de entrada puede generar múltiples secuencias variando la colocación y el tamaño de la ventana. La mejor secuencia asociada con la medición de mayor seguridad se escoge como un resultado de segmentación. Sin embargo, el problema con los métodos de la técnica anterior es que es difícil escoger una ventana adecuada en la prueba inicial, particularmente de caracteres separados de manera proporcional. Tsujimoto y Asada, en "Resolving ambiguity in segmenting touching characters", Primera Conferencia Internacional sobre análisis y reconocimiento de documentos, págs. 701-709, octubre de 1991, desarrollaron un algoritmo de segmentación-y-reconocimiento recursivo para segmentar caracteres que se tocan. Introdujeron una función de coste de separación que encuentra posiciones de separación provisionales, y después confirma esas posiciones de separación buscando un árbol de decisión construido por los resultados del reconocimiento. Desafortunadamente, su trabajo podría requerir un gran esfuerzo de cálculo si hay implicadas más posiciones de separación para construir un árbol de decisión.
En referencia a la figura 7, según la invención, se muestra un método de segmentación recursiva de manera condicional que implementa un procedimiento de división directa y fusión inversa y se basa en la salida del reconocimiento. En el bloque 100, se realiza una segmentación previa sobre una imagen, por ejemplo una imagen de placa de matricula como descrito anteriormente. En el bloque 110, se realiza una segmentación inicial. La imagen de entrada se segmenta en regiones basándose en una proyección vertical que puede eliminar muchos posibles errores para la prueba inicial. Como una desviación de la proyección de píxeles negros convencional, la función de proyección se obtiene seleccionando el píxel más oscuro de cada columna. La proyección vertical incluye aplicar un filtro de paso bajo al perfil de proyección. Entonces, las posiciones diferenciadas entre caracteres se determinan mediante la resta de la función de proyección original y la función de filtrado. El motor de reconocimiento se emplea preferiblemente como una comprobación. Si la imagen segmentada incluye una puntuación de seguridad por debajo de un umbral, el proceso se repite después de haber dividido o combinado caracteres sospechosos.
Tras la segmentación inicial, cada región resultante (es decir, región supuesta o potencial de carácter) puede clasificarse como un carácter separado, un carácter individual, un carácter que se toca o un símbolo desconocido. Si la placa de matrícula tiene una buena calidad de imagen, casi todas las regiones segmentadas pueden clasificarse con una medición de seguridad alta que indica un carácter reconocido en esta fase. Sin embargo, la mayoría de imágenes de placas de matrícula no se encuentran en esta condición. Si las regiones dan como resultado caracteres no reconocidos, cada uno de ellos se comprobará por un análisis de componentes para eliminar por filtrado pequeños componentes tales como tornillos o pernos presentes en la imagen de la placa de matrícula.
En el bloque 114 se aplica entonces la función de discriminación descrita para separar caracteres que se tocan a aquellas regiones de tamaño excesivo para ver si pueden dividirse adicionalmente. Resulta práctico asumir que el coste asociado de la función de discriminación es superior al umbral definido de modo que pueda evitarse una división innecesaria. El procedimiento de división directa del bloque 114 va seguido inmediatamente de un reconocimiento recursivo que vuelve al bloque 114 hasta que no se encuentren puntos de separación en regiones sospechosas en la que se obtiene una puntuación de seguridad baja para reconocer el carácter en cuestión. En la figura 8 se muestra un ejemplo en el que seis regiones de caracteres (1-6), tal como se indica entre flechas, indican posiciones en las que dividir la imagen del carácter.
En el bloque 116 se realiza un proceso de fusión inversa para evaluar regiones en la imagen para determinar si puede lograrse una mayor seguridad combinando regiones. Se trata de un proceso de reconocimiento recursivo tal como se indica por el bucle de retroalimentación en la figura 7. En referencia a la figura 9, cada nodo 200 para cada región 1-6 de caracteres sospechosos (véase la figura 8) podría formar un carácter real dependiendo del reconocimiento de la región. Cuando un nodo puede clasificarse con una medición de seguridad significativa, el resultado se almacena en el nodo relevante. Entonces se procesan los nodos posteriores que son las posibles combinaciones de las regiones restantes. Los nodos que dan un reconocimiento pobre no se evalúan adicionalmente (por ejemplo nodos con * en la figura 8). Cada evaluación posterior se limita a sólo la proximidad en la región en cuestión y a sus 2 nodos adyacentes contiguos. Esto reduce el tiempo de cálculo. El árbol se construye hasta que no quedan regiones. El camino más probable a través del árbol se seleccionará como la segmentación correcta, y el reconocimiento correspondiente estará disponible inmediatamente. Si ninguno de los caminos da como resultado un buen reconocimiento, pueden evaluarse ramas menos probables. Por ejemplo, considerando la figura 8, la región 1 se determina en el nodo 200a como que no incluye un carácter reconocido (se coloca un * en el nodo). El proceso considera entonces las regiones 1 y 2 en el nodo 200b. Se reconoce una "N" con suficiente seguridad. En el nodo 200c se comprueban las regiones 1, 2 y 3, pero la evaluación no da resultados con un nivel de seguridad suficiente. El procesamiento continúa tal como se muestra.
En el bloque 115 se realiza el reconocimiento de caracteres según la presente invención. El reconocimiento de caracteres puede realizarse de una pluralidad de formas diferentes. En realizaciones particularmente útiles, pueden emplearse una red neuronal, correspondencia de plantillas o una combinación de ambas. La correspondencia de plantillas se describirá ahora más detalladamente.
El método de segmentación de la presente invención depende para su precisión del método de reconocimiento de caracteres que se aplica a las regiones divididas. Es independiente de ese algoritmo en el sentido de que puede emplearse cualquier método de reconocimiento con la segmentación. Por lo tanto, además de la red neuronal que sirve como motor OCR, la presente invención implementa la correspondencia de plantillas para facilitar adicionalmente la tarea de reconocimiento. La correspondencia de plantillas se aplica a regiones segmentadas encerradas por rectángulos con componentes conectados en las regiones que presentan un tamaño medio. Además, las regiones (con un carácter o parte del mismo) se reconocen por la red neuronal con una medición de seguridad menor (por debajo de un umbral). En tal caso, la región de interés se binariza primero y se ajusta a escala al mismo tamaño de las plantillas en una base de datos. Por ejemplo, 15x25 o 20x30 píxeles. Un índice de correspondencia normalizado con el intervalo de -1 y 1 se define como la medición de seguridad obtenida por la comparación píxel a píxel entre la imagen simbólica guardada y la imagen de objeto de entrada. A medida que la medición de seguridad se aproxima a 1, se clasifican las imágenes guardadas (muestras virtuales) asociadas con símbolos de carácter, lo que implica una correspondencia perfecta (seguridad 1) de que la imagen de entrada es la misma que la de la guardada, y viceversa. Puede elegirse un umbral de aproximadamente 0,5 para eliminar por filtrado caracteres no correspondientes. El umbral puede ajustarse según la aplicación. La correspondencia de plantillas proporciona una búsqueda exhaustiva en una base de datos almacenada que incluye una variedad de imágenes de símbolos, incluyendo diferentes tamaños y estilos del mismo carácter, varios efectos de iluminación, sombras, imágenes borrosas, etc.
En el proceso de correspondencia, debería observarse que los píxeles de fondo que coinciden normalmente no se tienen en cuenta, ya que desvía enormemente el índice de correspondencia. Sin embargo, si se considera un orificio como una estructura, el conjunto de píxeles de fondo en el orificio se acepta como un carácter. Para ello, los orificios se marcan con un valor de píxel distinto de los usados para los píxeles de fondo y de objetos. Entonces, se combina una caja adicional (es decir, los píxeles de orificios) para la correspondencia. Esencialmente, los píxeles de orificios se tratan del mismo modo que los píxeles de objetos, pero son una clase distinta y no coinciden con un píxel de objeto.
El método de Niblack puede adaptarse para la binarización de imágenes basándose en la media local y la desviación estándar local sobre la imagen. (Véase por ejemplo O.D. Trier, et al., "Goal-directed evaluation of binarization methods", IEEE Transaction on Pattern Analysis and Machine Intelligence, vol. 17, nº 12, págs. 1191-1201, diciembre de 1995). En la ecuación 3, el valor de k se usa para ajustar qué cantidad del límite del carácter se toma como parte de la imagen dada. A medida que el entorno de la imagen cambia, es probable que las anchuras de los caracteres varíen en diferentes niveles. Una k constante puede no ser adecuada para dar una buena correlación. Por lo tanto, se derivan múltiples umbrales basándose en la variación de k. En una realización, si k aumenta de -0,5 a 0,5 en un intervalo de 0,25, es una buena selección que abarca una gran variación en símbolos del conjunto de datos. Las figuras 10A y 10B muestran cómo los diferentes umbrales afectan a los límites de los caracteres. La imagen 400 y 410 son la imagen que va a cotejarse. Al variar k puede obtenerse una mejor correspondencia para cada imagen. La imagen 400 tiene una mayor seguridad cuando k=0,5 en la figura 10A, y la imagen 410 tiene una seguridad mayor cuando k=0,0 en la figura 10B.
Los inventores llevaron a cabo experimentos según la presente invención empleando una cámara inteligente. El rendimiento del sistema se basó en la tasa de reconocimiento global de placas de matrícula enteras a distancias variables y con efectos de iluminación variables. Los cambios de iluminación se realizaron variando la apertura de la lente con número f 2, 2,4 y 4. Debería observarse que la tasa de reconocimiento definida aquí es en términos de número de placas de matrícula en lugar de número de caracteres.
Un bucle cerrado de la fase de reconocimiento y segmentación aumenta la robustez respecto a los efectos de cambios ambientales. Aunque la presente invención se ha demostrando usando placas de matrícula alemanas, los algoritmos son generales y pueden extenderse a diferentes nacionalidades de placas de matrícula así como a otras tareas de reconocimiento de caracteres.
En el sistema de reconocimiento de placas de matrícula automatizado, muchos errores de lectura están provocados por una segmentación de caracteres inadecuada. En particular, la segmentación de caracteres se vuelve difícil cuando las imágenes adquiridas de los vehículos están gravemente deterioradas. La presente invención utiliza técnicas de visión por ordenador y propone un método segmentación basado en el reconocimiento junto con una correspondencia de plantillas y una red neuronal. Esto mejora la precisión del sistema de reconocimiento que tiene como objetivo leer automáticamente placas de matrícula. En la presente memoria se describen mejoras algorítmicas para una segmentación basada en proyecciones. En la fase de procesamiento previa, se desarrollan métodos de refinamiento de la posición y la detección de sesgos de la placa, para preparar los datos para el procesamiento posterior. Para separar caracteres que se tocan se presenta una función de discriminación basada en un análisis diferencial de la distancia del contorno de caracteres. Se desarrolla una segmentación recursiva de manera condicional con la retroalimentación del reconocimiento para dividir de manera efectiva caracteres que se tocan y fundir caracteres separados.
Una vez descritas las realizaciones preferidas para el método de segmentación de caracteres para el reconocimiento de placas de matrícula de vehículos (que pretenden ser ilustrativas y no limitativas), ha de observarse que los expertos en la técnica pueden realizar modificaciones y variaciones a la luz de las enseñanzas anteriores. Por lo tanto, ha de entenderse que pueden realizarse cambios en las realizaciones particulares de la invención descritas que se encuentren dentro del alcance de la invención tal como se expone en las reivindicaciones adjuntas.

Claims (11)

  1. \global\parskip0.930000\baselineskip
    1. Método para segmentar y reconocer placas de matrícula que comprende las etapas de:
    capturar (10) una imagen de una placa de matrícula;
    procesar (11) previamente la imagen para preparar la imagen para la segmentación y el reconocimiento;
    dividir (114) directamente regiones de la imagen de la placa de matrícula en supuestas regiones de caracteres;
    reconocer (115) las supuestas regiones de caracteres en la imagen de la placa de matrícula y proporcionar una puntuación de seguridad basada en una probabilidad de coincidencia correcta;
    si los supuestos caracteres tienen una puntuación de seguridad por debajo de un valor umbral, fusionar (116) inversamente supuestas regiones de caracteres adyacentes para evaluar regiones en la imagen para determinar si puede lograrse una mayor seguridad al combinar regiones;
    reconocer las supuestas regiones de caracteres fusionadas inversamente en la placa de matrícula; y
    si las supuestas regiones de caracteres fusionadas inversamente tienen una puntuación de seguridad por debajo del valor umbral, repetir las etapas de fusión inversa y de reconocimiento;
    en el que la etapa de procesamiento previo de la imagen para preparar la imagen para la segmentación y el reconocimiento incluye las etapas de:
    refinar (18) una posición de la placa de matrícula:
    determinando una altura de los caracteres en la imagen de la placa de matrícula empleando una función de proyección;
    calculando una variancia espacial para determinar una posición central de los caracteres;
    empleando la posición central y la altura de los caracteres para reducir un tamaño de una región de interés detectando los bordes de un límite de placa y calculando una longitud de los bordes para identificar la región de interés.
  2. 2. Dispositivo de almacenamiento de programas legible por ordenador, que incorpora de manera tangible un programa de instrucciones ejecutable por el ordenador para realizar las etapas del método para segmentar y reconocer placas de matrícula, comprendiendo el método las etapas de:
    capturar (10) una imagen de una placa de matrícula;
    procesar (11) previamente la imagen para preparar la imagen para la segmentación y el reconocimiento;
    dividir (114) directamente regiones de la imagen de la placa de matrícula en supuestas regiones de caracteres;
    reconocer (115) las supuestas regiones de caracteres en la imagen de la placa de matrícula y proporcionar una puntuación de seguridad basada en una probabilidad de coincidencia correcta;
    si los supuestos caracteres tienen una puntuación de seguridad por debajo de un valor umbral, fusionar (116) inversamente supuestas regiones de caracteres adyacentes para evaluar regiones en la imagen para determinar si puede lograrse una mayor seguridad al combinar regiones;
    reconocer las supuestas regiones de caracteres fusionadas inversamente en la placa de matrícula; y
    si las supuestas regiones de caracteres fusionadas inversamente tienen una puntuación de seguridad por debajo del valor umbral, repetir las etapas de fusión inversa y de reconocimiento;
    en el que la etapa de procesamiento previo de la imagen para preparar la imagen para la segmentación y el reconocimiento incluye las etapas de:
    refinar (18) una posición de la placa de matrícula:
    determinando una altura de los caracteres en la imagen de la placa de matrícula empleando una función de proyección;
    calculando una variancia espacial para determinar una posición central de los caracteres;
    empleando la posición central y la altura de los caracteres para reducir un tamaño de una región de interés detectando los bordes de un límite de placa y calculando una longitud de los bordes para identificar la región de interés.
  3. 3. Método según la reivindicación 1 o dispositivo de almacenamiento de programas según la reivindicación 2, en los que la etapa de reconocer (115) supuestas regiones de caracteres en la imagen de la placa de matrícula incluye determinar regiones con una puntuación de seguridad por debajo de un umbral, y la etapa de dividir (114) directamente regiones incluye la etapa de segmentar caracteres que se tocan o solapan en supuestas regiones de caracteres adyacentes empleando una función de discriminación basada en proyecciones de contorno de los caracteres.
  4. 4. Método o dispositivo de almacenamiento de programas según la reivindicación 3, en los que la etapa de segmentar caracteres que se tocan o se solapan se aplica de forma iterativa para lograr el valor umbral de una puntuación de seguridad.
  5. 5. Método o dispositivo de almacenamiento de programas según la reivindicación 1 ó 2, en los que la etapa de reconocer (115) supuestas regiones de caracteres en la imagen de la placa de matrícula y proporcionar una puntuación de seguridad basada en una probabilidad de una coincidencia correcta incluye la etapa de reconocer caracteres en la imagen de la placa de matrícula empleando al menos una red neuronal y una correspondencia de plantillas.
  6. 6. Método o dispositivo de almacenamiento de programas según la reivindicación 1 ó 2, en los que la etapa de reconocer las supuestas regiones de caracteres fusionadas inversamente en la placa de matrícula incluye la etapa de reconocer caracteres en la imagen de la placa de matrícula empleando al menos una red neuronal y una correspondencia de plantillas.
  7. 7. Método o dispositivo de almacenamiento de programas según la reivindicación 1 ó 2, en los que la etapa de procesamiento previo de la imagen para preparar la imagen para la segmentación y el reconocimiento incluye las etapas de:
    detectar una inclinación previa (16) en la imagen de la placa de matrícula detectando bordes y seleccionado puntos distintivos para determinar una matriz de proyección en los bordes;
    seleccionar la matriz de proyección que tiene un mayor coste para determinar un ángulo de rotación; y
    corregir la imagen de la placa de matrícula según el ángulo de rotación.
  8. 8. Método o dispositivo de almacenamiento de programas según la reivindicación 1 ó 2, en los que la etapa de procesamiento previo de la imagen para preparar la imagen para la segmentación y el reconocimiento incluye las etapas (14) de:
    proporcionar un perfil de proyección de intensidades de píxeles a través de líneas verticales de píxeles de la imagen;
    filtrar el perfil de proyección; e
    identificar ubicaciones de los caracteres en la imagen ilustrada por el área por debajo de un valor umbral en el perfil de proyección filtrado.
  9. 9. Método o dispositivo de almacenamiento de programas según la reivindicación 1 ó 2, que comprenden además la etapa de extraer caracteres reconocidos de la imagen de la placa de matrícula.
  10. 10. Método o dispositivo de almacenamiento de programas según la reivindicación 1 ó 2, que comprenden además la etapa de comparar caracteres reconocidos y bloques de caracteres con códigos de placas de matrícula predeterminados y convenciones para comprobar la precisión del reconocimiento.
  11. 11. Método según cualquiera de las reivindicaciones de método anteriores:
    en el que la división (14) directa de regiones de la imagen de la placa de matrícula en supuestas regiones de caracteres es mediante segmentación de caracteres que se tocan o se solapan en supuestas regiones de caracteres adyacentes, empleando una función de discriminación basada en proyecciones de contorno de los caracteres;
    y en el que la fusión (116) inversa de supuestas regiones de caracteres adyacentes tiene lugar si los supuestos caracteres tienen una puntuación de seguridad por debajo de un valor umbral distinto del debido a caracteres que se tocan o solapan;
    comprendiendo además las etapas de comparar caracteres reconocidos y bloques de caracteres con códigos de placas de matrícula predeterminados y convenciones para comprobar la precisión del reconocimiento; y
    extrayendo los caracteres reconocidos de la imagen de la placa de matrícula.
ES00307697T 1999-09-15 2000-09-07 Metodo de segmentacion de caracteres para reconocimiento de placas de matricula de vehiculos. Expired - Lifetime ES2275474T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US396952 1999-09-15
US09/396,952 US6473517B1 (en) 1999-09-15 1999-09-15 Character segmentation method for vehicle license plate recognition

Publications (1)

Publication Number Publication Date
ES2275474T3 true ES2275474T3 (es) 2007-06-16

Family

ID=23569273

Family Applications (1)

Application Number Title Priority Date Filing Date
ES00307697T Expired - Lifetime ES2275474T3 (es) 1999-09-15 2000-09-07 Metodo de segmentacion de caracteres para reconocimiento de placas de matricula de vehiculos.

Country Status (5)

Country Link
US (1) US6473517B1 (es)
EP (1) EP1085456B1 (es)
AT (1) ATE346350T1 (es)
DE (1) DE60031929T2 (es)
ES (1) ES2275474T3 (es)

Families Citing this family (132)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7230582B1 (en) * 1999-02-12 2007-06-12 Fisher-Rosemount Systems, Inc. Wearable computer in a process control environment
WO2000078036A1 (de) * 1999-06-15 2000-12-21 Infineon Technologies Ag Verfahren und schaltungsanordnung zur kontrastverbesserung eines bildes
US6785417B1 (en) 2000-08-22 2004-08-31 Microsoft Corp Method and system for searching for words in ink word documents
US6771817B1 (en) 2000-08-22 2004-08-03 Microsoft Corporation Method and system for extending ink word data structures while maintaining version compatibility
US6754386B1 (en) * 2000-08-22 2004-06-22 Microsft Corporation Method and system of matching ink processor and recognizer word breaks
US6801660B1 (en) 2000-08-22 2004-10-05 Microsoft Corporation Method and system for maintaining alternates in association with recognized words
US6836759B1 (en) 2000-08-22 2004-12-28 Microsoft Corporation Method and system of handling the selection of alternates for recognized words
US7031553B2 (en) * 2000-09-22 2006-04-18 Sri International Method and apparatus for recognizing text in an image sequence of scene imagery
US6823084B2 (en) * 2000-09-22 2004-11-23 Sri International Method and apparatus for portably recognizing text in an image sequence of scene imagery
US7738706B2 (en) * 2000-09-22 2010-06-15 Sri International Method and apparatus for recognition of symbols in images of three-dimensional scenes
US6714694B1 (en) * 2000-11-27 2004-03-30 Xerox Corporation Method for sliding window image processing of associative operators
US6873732B2 (en) * 2001-07-09 2005-03-29 Xerox Corporation Method and apparatus for resolving perspective distortion in a document image and for calculating line sums in images
US20030113015A1 (en) * 2001-12-18 2003-06-19 Toshiaki Tanaka Method and apparatus for extracting text information from moving image
JP2004005364A (ja) * 2002-04-03 2004-01-08 Fuji Photo Film Co Ltd 類似画像検索システム
US6986106B2 (en) 2002-05-13 2006-01-10 Microsoft Corporation Correction widget
US7379421B1 (en) * 2002-07-23 2008-05-27 At&T Delaware Intellectual Property, Inc. System and method for forwarding messages
US7137076B2 (en) * 2002-07-30 2006-11-14 Microsoft Corporation Correcting recognition results associated with user input
US7382277B2 (en) * 2003-02-12 2008-06-03 Edward D. Ioli Trust System for tracking suspicious vehicular activity
US20040167861A1 (en) * 2003-02-21 2004-08-26 Hedley Jay E. Electronic toll management
EP1463301A1 (en) * 2003-03-19 2004-09-29 Thomson Licensing S.A. Method for identification of tokens in video sequences
EP1460835B1 (en) * 2003-03-19 2018-11-14 InterDigital Madison Patent Holdings Method for identification of tokens in video sequences
JP4189654B2 (ja) * 2003-04-18 2008-12-03 セイコーエプソン株式会社 画像処理装置
US20050084134A1 (en) * 2003-10-17 2005-04-21 Toda Sorin M. License plate recognition
US20060030985A1 (en) * 2003-10-24 2006-02-09 Active Recognition Technologies Inc., Vehicle recognition using multiple metrics
US7848573B2 (en) * 2003-12-03 2010-12-07 Microsoft Corporation Scaled text replacement of ink
US7506271B2 (en) * 2003-12-15 2009-03-17 Microsoft Corporation Multi-modal handwriting recognition correction
TWI231702B (en) * 2004-01-16 2005-04-21 Univ Nat Taiwan Science Tech Segment based image registration method
US7447358B2 (en) * 2004-03-31 2008-11-04 Intel Corporation Image segmentation using branch and bound analysis
FR2872660B1 (fr) * 2004-07-05 2006-12-22 Eastman Kodak Co Appareil de prise de vue et procede pour la formation d'images annotees
IL162878A0 (en) * 2004-07-06 2005-11-20 Hi Tech Solutions Ltd Multi-level neural network based characters identification method and system
US7460711B2 (en) * 2004-08-27 2008-12-02 Avago Technologies Ecbu Ip (Singapore) Pte. Ltd. Efficient method for reading meter values by processing digital images of a meter
US7302098B2 (en) * 2004-12-03 2007-11-27 Motorola, Inc. Character segmentation method and apparatus
US7231288B2 (en) * 2005-03-15 2007-06-12 Visteon Global Technologies, Inc. System to determine distance to a lead vehicle
WO2007023715A1 (en) * 2005-08-25 2007-03-01 Ricoh Company, Ltd. Image processing method and apparatus, digital camera, and recording medium recording image processing program
US7613328B2 (en) * 2005-09-09 2009-11-03 Honeywell International Inc. Label detection
US20070058856A1 (en) * 2005-09-15 2007-03-15 Honeywell International Inc. Character recoginition in video data
US7382280B2 (en) * 2005-10-17 2008-06-03 Cleverdevices, Inc. Parking violation recording system and method
US20130163822A1 (en) * 2006-04-04 2013-06-27 Cyclops Technologies, Inc. Airborne Image Capture and Recognition System
US20130163823A1 (en) * 2006-04-04 2013-06-27 Cyclops Technologies, Inc. Image Capture and Recognition System Having Real-Time Secure Communication
DE102007012458A1 (de) 2007-03-15 2008-09-18 Robert Bosch Gmbh Verfahren zur Objektbildung
JP5011508B2 (ja) * 2007-04-27 2012-08-29 日本電産サンキョー株式会社 文字列認識方法及び文字列認識装置
WO2009052578A1 (en) * 2007-10-24 2009-04-30 Sensen Networks Pty Ltd Verification of identification of an image characteristic over multiple images
US8023770B2 (en) * 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for identifying the orientation of a digital image
US8023741B2 (en) 2008-05-23 2011-09-20 Sharp Laboratories Of America, Inc. Methods and systems for detecting numerals in a digital image
KR101035744B1 (ko) * 2008-12-08 2011-05-20 삼성전자주식회사 카메라를 이용한 문자 인식 장치 및 방법
US8306327B2 (en) * 2008-12-30 2012-11-06 International Business Machines Corporation Adaptive partial character recognition
DE102009006829A1 (de) 2009-01-30 2010-08-05 Siemens Aktiengesellschaft Verfahren und System zur Ermittlung von Verkehrsinformation
TWI384408B (zh) * 2009-04-30 2013-02-01 Ind Tech Res Inst 影像辨識以及輸出方法與其系統
TWI381321B (zh) 2009-04-30 2013-01-01 Ind Tech Res Inst 重組多張影像與辨識方法以及影像擷取與辨識系統
CN101882219B (zh) * 2009-05-08 2013-09-11 财团法人工业技术研究院 图像辨识以及输出方法及其系统
TWI409718B (zh) * 2009-12-04 2013-09-21 Huper Lab Co Ltd 移動中車輛之車牌定位方法
TWI478074B (zh) * 2010-12-01 2015-03-21 Inst Information Industry 文字辨識方法、裝置以及儲存其之電腦可讀取紀錄媒體
KR101727137B1 (ko) * 2010-12-14 2017-04-14 한국전자통신연구원 텍스트 영역의 추출 방법, 추출 장치 및 이를 이용한 번호판 자동 인식 시스템
CN102043959B (zh) * 2010-12-28 2012-09-26 青岛海信网络科技股份有限公司 车牌字符分割方法
EP2666123A4 (en) 2011-01-18 2017-03-08 RTC Vision Ltd. System and method for improved character recognition in distorted images
US8483440B2 (en) * 2011-04-13 2013-07-09 Xerox Corporation Methods and systems for verifying automatic license plate recognition results
CN102222226B (zh) * 2011-06-21 2013-01-23 杭州电子科技大学 一种基于先验分析的迭代式车牌字符分割方法
US8731244B2 (en) * 2011-07-28 2014-05-20 Xerox Corporation Systems and methods for improving image recognition
DE102011053052B3 (de) * 2011-08-26 2013-02-28 Jenoptik Robot Gmbh Verfahren und Vorrichtung zur Identifikation von Kraftfahrzeugen zur Verkehrsüberwachung
US8644561B2 (en) 2012-01-18 2014-02-04 Xerox Corporation License plate optical character recognition method and system
US8831381B2 (en) 2012-01-26 2014-09-09 Qualcomm Incorporated Detecting and correcting skew in regions of text in natural images
US9064191B2 (en) 2012-01-26 2015-06-23 Qualcomm Incorporated Lower modifier detection and extraction from devanagari text images to improve OCR performance
EP2645305A3 (en) * 2012-03-26 2014-05-14 Tata Consultancy Services Limited A system and method for processing image for identifying alphanumeric characters present in a series
US8781172B2 (en) * 2012-03-30 2014-07-15 Xerox Corporation Methods and systems for enhancing the performance of automated license plate recognition applications utilizing multiple results
US8934676B2 (en) 2012-05-04 2015-01-13 Xerox Corporation Robust character segmentation for license plate images
CN102722707A (zh) * 2012-06-11 2012-10-10 复旦大学 基于连通区域和间隙模型的车牌字符分割方法
US9047540B2 (en) 2012-07-19 2015-06-02 Qualcomm Incorporated Trellis based word decoder with reverse pass
US9076242B2 (en) 2012-07-19 2015-07-07 Qualcomm Incorporated Automatic correction of skew in natural images and video
US9183458B2 (en) 2012-07-19 2015-11-10 Qualcomm Incorporated Parameter selection and coarse localization of interest regions for MSER processing
US9262699B2 (en) 2012-07-19 2016-02-16 Qualcomm Incorporated Method of handling complex variants of words through prefix-tree based decoding for Devanagiri OCR
US9141874B2 (en) 2012-07-19 2015-09-22 Qualcomm Incorporated Feature extraction and use with a probability density function (PDF) divergence metric
CN103065138B (zh) * 2012-12-06 2015-07-15 中通服公众信息产业股份有限公司 一种机动车牌号的识别方法
CN103207998A (zh) * 2012-12-24 2013-07-17 电子科技大学 一种基于支持向量机的车牌字符分割方法
JP6080586B2 (ja) * 2013-02-13 2017-02-15 株式会社ファインデックス 文字認識システム、文字認識プログラム及び文字認識方法
US9122953B2 (en) 2013-04-15 2015-09-01 Xerox Corporation Methods and systems for character segmentation in automated license plate recognition applications
US9002066B2 (en) * 2013-05-06 2015-04-07 Xerox Corporation Methods, systems and processor-readable media for designing a license plate overlay decal having infrared annotation marks
US9082038B2 (en) 2013-05-29 2015-07-14 Xerox Corporation Dram c adjustment of automatic license plate recognition processing based on vehicle class information
US9042647B2 (en) * 2013-06-06 2015-05-26 Xerox Corporation Adaptive character segmentation method and system for automated license plate recognition
CN103530600B (zh) * 2013-06-06 2016-08-24 东软集团股份有限公司 复杂光照下的车牌识别方法及系统
US9530310B2 (en) 2013-11-01 2016-12-27 Xerox Corporation Method and system for detecting and tracking a vehicle of interest utilizing a network of traffic image-capturing units
US9213910B2 (en) 2013-11-06 2015-12-15 Xerox Corporation Reinforcement learning approach to character level segmentation of license plate images
EP3097512B1 (en) * 2014-01-24 2021-03-24 Sanofi-Aventis Deutschland GmbH A supplemental device for attachment to an injection device for recording and displaying a dose value set by the user using optical character recognition (ocr)
JP5821994B2 (ja) * 2014-04-21 2015-11-24 富士ゼロックス株式会社 画像処理装置、画像形成装置およびプログラム
EP3167408B1 (en) * 2014-07-10 2023-12-13 Sanofi-Aventis Deutschland GmbH A device and method for performing optical character recognition
CN104239878B (zh) * 2014-08-30 2017-05-10 电子科技大学 一种基于概率极值搜索的车牌字符识别方法
CN104268978B (zh) * 2014-09-24 2017-02-15 苏州佳世达光电有限公司 纸钞序号辨识方法
US9460367B2 (en) * 2014-11-26 2016-10-04 Xerox Corporation Method and system for automating an image rejection process
US9400936B2 (en) * 2014-12-11 2016-07-26 Xerox Corporation Methods and systems for vehicle tag number recognition
US9536315B2 (en) 2015-01-13 2017-01-03 Xerox Corporation Annotation free license plate recognition method and system
CN104616009B (zh) * 2015-02-13 2018-05-18 广州广电运通金融电子股份有限公司 一种字符切割识别方法
JP6487255B2 (ja) * 2015-03-31 2019-03-20 日本電産サンキョー株式会社 文字切り出し装置、文字認識装置、および文字切り出し方法
US10901967B2 (en) 2015-04-09 2021-01-26 Veritoll, Llc License plate matching systems and methods
US9501707B2 (en) 2015-04-16 2016-11-22 Xerox Corporation Method and system for bootstrapping an OCR engine for license plate recognition
US9418305B1 (en) 2015-04-29 2016-08-16 Xerox Corporation Segmentation free approach to automatic license plate recognition
WO2017013719A1 (ja) * 2015-07-17 2017-01-26 楽天株式会社 文字認識装置、文字認識方法及び文字認識プログラム
CN105447487A (zh) * 2015-08-27 2016-03-30 中山大学 一种车牌识别系统的评测方法及系统
US11587327B2 (en) 2015-10-01 2023-02-21 Intellivision Technologies Corp Methods and systems for accurately recognizing vehicle license plates
US10706330B2 (en) 2015-10-01 2020-07-07 Intellivision Technologies Corp Methods and systems for accurately recognizing vehicle license plates
CN105259252B (zh) * 2015-10-15 2018-09-21 浙江大学 超声相控阵检测聚乙烯电熔接头缺陷类型自动识别方法
US9836646B2 (en) * 2015-10-15 2017-12-05 I.R.I.S. Method for identifying a character in a digital image
CN105447457A (zh) * 2015-11-15 2016-03-30 安徽清新互联信息科技有限公司 一种基于自适应特征的车牌字符识别方法
CN105405298B (zh) * 2015-12-24 2018-01-16 浙江宇视科技有限公司 一种车牌标识的识别方法和装置
US10068146B2 (en) 2016-02-25 2018-09-04 Conduent Business Services, Llc Method and system for detection-based segmentation-free license plate recognition
CN107273892B (zh) * 2017-06-12 2020-06-16 北京智芯原动科技有限公司 一种车牌字符分割方法及装置
US10950124B2 (en) 2017-08-22 2021-03-16 Q-Free Netherlands B.V. License plate recognition
CN107704857B (zh) * 2017-09-25 2020-07-24 北京邮电大学 一种端到端的轻量级车牌识别方法及装置
US11823359B2 (en) * 2017-10-06 2023-11-21 Google Llc Systems and methods for leveling images
CN109960978A (zh) * 2017-12-25 2019-07-02 大连楼兰科技股份有限公司 基于图像分层技术的车辆检测系统及装置
GB2571530B (en) * 2018-02-28 2020-09-23 Canon Europa Nv An image processing method and an image processing system
CN110728278A (zh) * 2018-07-16 2020-01-24 杭州海康威视数字技术股份有限公司 车牌识别方法及装置
CN109117822A (zh) * 2018-08-31 2019-01-01 贵州大学 一种基于深度学习的零件实例分割识别方法
CN109165635A (zh) * 2018-09-27 2019-01-08 珠海格力电器股份有限公司 显示屏中光符标记的视觉检测系统及其方法与智能终端
CN109635804A (zh) * 2018-12-06 2019-04-16 北京联合大学 一种基于SIFT和kNN的车牌识别方法及系统
CN111325210B (zh) * 2018-12-14 2024-06-18 北京京东尚科信息技术有限公司 用于输出信息的方法和装置
CN109753914B (zh) * 2018-12-28 2023-05-30 安徽清新互联信息科技有限公司 一种基于深度学习的车牌字符识别方法
CN109815956B (zh) * 2018-12-28 2022-12-09 安徽清新互联信息科技有限公司 一种基于自适应位置分割的车牌字符识别方法
CN109766805B (zh) * 2018-12-28 2022-12-09 安徽清新互联信息科技有限公司 一种基于深度学习的双层车牌字符识别方法
US10616443B1 (en) * 2019-02-11 2020-04-07 Open Text Sa Ulc On-device artificial intelligence systems and methods for document auto-rotation
US11227174B1 (en) 2019-06-10 2022-01-18 James Alves License plate recognition
CN110443251A (zh) * 2019-08-13 2019-11-12 树根互联技术有限公司 仪表图像识别方法及装置
CN110598703B (zh) * 2019-09-24 2022-12-20 深圳大学 一种基于深度神经网络的ocr识别方法及装置
CN111709417B (zh) * 2020-05-28 2023-09-22 西安理工大学 一种矿车车牌识别方法
CN111881741B (zh) * 2020-06-22 2024-06-14 浙江大华技术股份有限公司 车牌识别方法、装置、计算机设备和计算机可读存储介质
US12002274B2 (en) * 2020-08-24 2024-06-04 Electronic Transaction Consultants, Llc Gamified alphanumeric character identification
CN112381088A (zh) * 2020-11-11 2021-02-19 上善智城(苏州)信息科技有限公司 一种油罐车车牌识别方法及系统
CN112733856B (zh) * 2020-12-31 2022-08-09 成都福立盟环保大数据有限公司 一种大型车辆放大车牌的识别方法
CN113516123B (zh) * 2021-05-14 2023-11-24 南京工程学院 一种针对轮胎压印字符的检测识别方法
US11615634B2 (en) * 2021-07-01 2023-03-28 International Business Machines Corporation Character recognition of license plate under complex background
CN114627653B (zh) * 2022-05-12 2022-08-02 浙江电马云车科技有限公司 基于双目识别的5g智能道闸管理系统
CN115082923B (zh) * 2022-08-24 2022-11-08 成都工业学院 一种基于机器视觉的牛奶包装盒生产日期识别方法
CN116109663B (zh) * 2023-04-04 2023-06-23 山东大学第二医院 基于多阈值分割的胃部ct影像分割方法
CN117894009B (zh) * 2024-03-14 2024-05-31 江西交通职业技术学院 一种基于智能视觉的车牌识别系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5998283A (ja) * 1982-11-27 1984-06-06 Hitachi Ltd パターン切出しおよび認識方法、ならびにそのシステム
JPS6274181A (ja) * 1985-09-27 1987-04-04 Sony Corp 文字認識装置
EP0446630A3 (en) * 1990-03-12 1993-02-24 International Business Machines Corporation Method and apparatus for segmenting characters in an amount field on a financial document
JPH07505966A (ja) * 1992-03-20 1995-06-29 コモンウエルス サイエンティフィック アンド インダストリアル リサーチ オーガナイゼーション 物体モニタシステム
CA2135240A1 (en) * 1993-12-01 1995-06-02 James F. Frazier Automated license plate locator and reader
JP3805005B2 (ja) * 1994-11-09 2006-08-02 キヤノン株式会社 画像処理装置及び光学的文字認識装置及びそれらの方法
US5799276A (en) * 1995-11-07 1998-08-25 Accent Incorporated Knowledge-based speech recognition system and methods having frame length computed based upon estimated pitch period of vocalic intervals
SG71018A1 (en) * 1997-03-01 2000-03-21 Inst Of Systems Science Nat Un Robust identification code recognition system

Also Published As

Publication number Publication date
EP1085456A3 (en) 2004-03-03
ATE346350T1 (de) 2006-12-15
US6473517B1 (en) 2002-10-29
EP1085456B1 (en) 2006-11-22
DE60031929D1 (de) 2007-01-04
DE60031929T2 (de) 2007-03-15
EP1085456A2 (en) 2001-03-21

Similar Documents

Publication Publication Date Title
ES2275474T3 (es) Metodo de segmentacion de caracteres para reconocimiento de placas de matricula de vehiculos.
US6553131B1 (en) License plate recognition with an intelligent camera
US7362883B2 (en) Lane marker recognition method
Yoon et al. Blob extraction based character segmentation method for automatic license plate recognition system
Al-Hmouz et al. License plate localization based on a probabilistic model
Lee et al. License plate detection using local structure patterns
Babbar et al. A new approach for vehicle number plate detection
JP3969894B2 (ja) 顔画像処理装置
Gilly et al. A survey on license plate recognition systems
Kročka et al. Automatic license plate recognition using OpenCV
Khan et al. Comparison of various edge detection filters for ANPR
Azad et al. Real-time and efficient method for accuracy enhancement of edge based license plate recognition system
Salahshoor et al. Application of intelligent systems for iranian license plate recognition
El-Said Shadow aware license plate recognition system
Nguwi et al. Number plate recognition in noisy image
Lu A lane detection, tracking and recognition system for smart vehicles
Deb et al. Projection and least square fitting with perpendicular offsets based vehicle license plate tilt correction
JP2851348B2 (ja) ナンバープレート読み取り装置
Deb et al. Vehicle license plate detection algorithm based on color space and geometrical properties
Tyan et al. Character segmentation algorithm for recognition of vehicle license plate
Jobin et al. Automatic number plate recognition system using modified stroke width transform
Syed et al. Color edge enhancement based fuzzy segmentation of license plates
KR20110074638A (ko) 기계 지능을 이용하여 빛의 영향과 오염물질에 훼손된 차량 번호판 영상의 강건한 문자영역추출시스템 및 방법
Deb et al. Vehicle license plate extraction based on color and geometrical features
Kumar Phase-edge based approach for pedestrian segmentation using NIR camera and tracking for driver assistance