ES2263092T3 - Procedimiento para el reconocimiento optico de caracteres alfanumericos. - Google Patents

Procedimiento para el reconocimiento optico de caracteres alfanumericos.

Info

Publication number
ES2263092T3
ES2263092T3 ES04015595T ES04015595T ES2263092T3 ES 2263092 T3 ES2263092 T3 ES 2263092T3 ES 04015595 T ES04015595 T ES 04015595T ES 04015595 T ES04015595 T ES 04015595T ES 2263092 T3 ES2263092 T3 ES 2263092T3
Authority
ES
Spain
Prior art keywords
character
characters
contours
curves
polygonal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES04015595T
Other languages
English (en)
Inventor
Jurgen Reichenbach
Achim Nubling
Thomas Schopp
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sick AG
Original Assignee
Sick AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sick AG filed Critical Sick AG
Application granted granted Critical
Publication of ES2263092T3 publication Critical patent/ES2263092T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Holo Graphy (AREA)

Abstract

Procedimiento para el reconocimiento óptico de caracteres alfanuméricos con las siguientes etapas: a) en una base de datos se depositan los contornos exteriores y los contornos interiores poligonales de caracteres de referencia y su asociación de la posición geométrica mutua como curvas de referencia transformadas y normalizadas en el espacio de las tangentes; b) el contorno exterior y los contornos interiores de un carácter a reconocer son explorados ópticamente y son convertidos en datos binarios; c) el contorno exterior y los contornos interiores del carácter a reconocer son aproximados a través de un polígono, cuyas secciones rectas son transformadas y normalizadas para la generación de curvas de caracteres en el espacio de las tangentes; d) para comparar los caracteres a reconocer con los caracteres de referencia de una manera invariable en la rotación, se desplazan al menos la curva de caracteres del contorno exterior y las curvas de referencia de los contornos exteriores de una manera mutua en el espacio de las tangentes, hasta que la superficie incluida entre la curva de caracteres y la curva de referencia respectiva alcanza un mínimo; e) la superficie calculada entonces entre las curvas de caracteres para el contorno exterior y los contornos interiores del carácter a reconocer y las curvas de referencia respectivas para los con tornos exteriores y los contornos interiores de los caracteres de referencia se utiliza como medida para la desviación entre el carácter y el carácter de referencia respectivo y aquel carácter de referencia, en el que esta desviación es mínima, se establece como reconocido, caracterizado porque todas las desviaciones del con torno exterior y de los contornos interiores se utilizan para hacer coincidir la curva de carácter y las curvas de referencia de una variante invariable en la rotación.

Description

Procedimiento para el reconocimiento óptico de caracteres alfanuméricos.
La invención se refiere a un procedimiento para el reconocimiento óptico de caracteres alfanuméricos.
El reconocimiento óptico de caracteres alfanuméricos, que se designa habitualmente como Reconocimiento de Caracteres Ópticos (OCR), sirve para transmitir textos impresos escritos o, si se desea, también textos manuscritos de una manera automática en una forma de datos, que puede ser procesada por medio de un procesamiento electrónico de datos. Los caracteres a reconocer son explorados ópticamente y binarizados, de manera que se genera un fichero, que es analizado por medio de un software adecuado y es convertido en un conjunto de datos compatibles con ordenador.
Hasta ahora se conoce utilizar especialmente caracteres normalizados, los llamados escritos OCR, que facilitan una comparación con caracteres de referencia memorizados. Esta comparación se realiza de acuerdo con diferentes procedimientos.
En el llamado Pattern Marching se compara el patrón de caracteres, detectado a través de la exploración óptica, con caracteres de referencia memorizados a través de la superposición de los patrones, con el fin de determinar la mejor coincidencia posible. Este procedimiento es extraordinariamente problemático cuando deben reconocerse diferentes escritos, tamaños de caracteres e impresiones de caracteres.
El procedimiento designado como Feature Recognition se asocian a los caracteres ciertos rasgos característicos, como trazos verticales y horizontales, puntos de cruce y arcos. Los caracteres a reconocer se investigan con relación a estas características y se comparan con las formas de los patrones memorizadas. Este procedimiento depende, por lo tanto, menos del tipo de escritura y/o del tamaño y, por consiguiente, es más fiable.
En el llamado análisis de corte angular se corta el carácter a reconocer en diferentes ángulos por un conjunto de rectas. Se analizan el número de los puntos de ennegrecimiento sobre las rectas así como el número de los puntos de intersección de las rectas con el carácter a reconocer y se comparan por cálculo con los caracteres de referencia memorizados.
Se conoce a partir de la ponencia del Dr. Rolf Lakämper con el título "The ASR-algorithm (Advanced Shape Recognition") del 145.04.2022, presentada en la Universidad de temple, Filadelfia, cuyo resumen se puede llamar en Internet bajo la dirección www.cis.temple.edu/general/colloquiums.html, un procedimiento para el procesamiento de imágenes. Este algoritmo se basa en un reconocimiento del contorno de objetos bidimensionales. El algoritmo ha sido desarrollado para la robótica. Con la ayuda de dos algoritmos se abstraen los objetos en una primera etapa a través de un levantamiento poligonal y se transforman en una segunda etapa en un espacio de tangentes.
En otra publicación de login Jan Latecki y Rolf Lakämper "Shape Similarity Measure Based on Correspondence of Visual Parts" IEEE Transactions on Pattern Análisis and Machine Intelligence, IEEE, Inc,. Nueva York, US Vol. 22, Nº 10, Octubre del 2000, se describe un método para la detección de objetos bidimensionales. Los objetos son representados de una manera simplificada a través de levantamiento poligonal. Los puntos angulares de los polígonos con relevancia reducida s eliminados en este caso. Para la identificación de los objetos se transforma un levantamiento poligonal en un espacio de tangentes.
Se conoce a partir del documento US 5 048 099 un procedimiento para la identificación de texto impreso dentro de una zona no enmarcada. Con la ayuda del procedimiento se identifica en enmarque. El enmarque debe formar en este caso una curva cerrada. A este respecto, se determina si la curva o el texto enmarcado por la curva presenta contornos externos y con tornos internos. En virtud de las características del contorno interno y del contorno exterior se puede determinar si se trata de un enmarque de texto. El procedimiento se aplica para extraer pasajes de texto marcados manualmente.
Estos procedimientos conocidos dependen en gran medida de que los caracteres a reconocer estén presentes en un escrito normalizado o sean lo más aproximados posible a un escrito normalizado de este tipo.
La invención tiene el cometido de poner a disposición un procedimiento para el reconocimiento óptico de caracteres alfanuméricos, que presenta una capacidad de reconocimiento mejorada, que se aproxima en gran medida a la capacidad de abstracción humana de características de similitud.
Este cometido se soluciona de acuerdo con la invención por medio de un procedimiento con las características de la reivindicación 1.
Las configuraciones ventajosas de la invención están indicadas en las reivindicaciones dependientes relacionadas en cada caso.
La invención parte de un procedimiento que se conoce bajo la designación Advanced Shape Recognition (ASR). Este procedimiento se emplea, por ejemplo, en la técnica de automatización para un reconocimiento de piezas de una manera independiente de la posición. En este procedimiento se explora el contorno exterior de una parte y se aproxima en primer lugar a través de un levantamiento poligonal. El levantamiento poligonal es transformado en el espacio de las tangentes, es decir, se convierte en una curva, que está definida a través de la longitud y el ángulo de las secciones de rectas consecutivas respectivas del polígono. La curva calculada de esta manera de la parte explorada es comparada con curvas de referencia memorizadas, que reproducen los contornos exteriores de las piezas a diferenciar. Este procedimiento conocido tiene la ventaja de que se puede llevar a cabo la comparación de una manera independiente de la posición, puesto que la curva es invariable en la rotación en el espacio de tangentes. Una rotación de la pieza y de su contorno exterior corresponde a un desplazamiento lineal de la curva en el espacio de las tangentes. A través de un desplazamiento mutuo de la curva explorada con la curva de referencia se pueden llevar estas curvas a una posición coincidente para la comparación.
El procedimiento conocido en sí se modifica y se desarrolla de acuerdo con la invención para la identificación de caracteres alfanuméricos. A tal fin se normalizan las curvas de referencia depositadas en la base de datos, que corresponden a los caracteres de referencia, y de la misma manera se normalizan las curvas de caracteres, generadas a través de la exploración de los caracteres a reconocer, en el espacio de las tangentes. Esta normalización significa que los levantamientos poligonales de la curva de referencia y de la curva de caracteres se llevan a la misma longitud. Esta normalización de las curvas en el espacio de las tangentes corresponde a un incremento lineal o bien a una reducción lineal del levantamiento poligonal y, por lo tanto, al contorno del carácter a reconocer. A través de esta normalización, la identificación de los caracteres se vuelve independiente del tamaño de la escritura de los caracteres a reconocer.
Además, de acuerdo con la invención, no sólo se evalúa el contorno exterior de los caracteres alfanuméricos, sino también sus contornos interiores. El contorno exterior y los contornos interiores de los caracteres de referencia se depositan en la base de datos como conjunto de curvas de referencia en el espacio de las tangentes. De una manera correspondiente, en el carácter a reconocer, el contorno exterior y los contornos interiores son detectados y son transformados en curvas de caracteres correspondientes en el espacio de las tangentes. El número y forma de los contornos interiores así como su asociación de la posición geométrica representan una característica adicional de los caracteres alfanuméricos, que es importante para el reconocimiento de los caracteres. Existen caracteres, que solamente presentan un contorno exterior y no presentan ningún contorno interior, por ejemplo la letra I o la cifra 2. Además, existen caracteres con un solo contorno interior, por ejemplo la letra P o el número 9. Por último, existen caracteres con dos contornos interiores, por ejemplo la letra B o la cifra 8. Un conjunto de curvas de referencia de un carácter de referencia está constituido, por lo tanto, en cada caso por una curva de referencia del contorno exterior y por dos curvas de referencia de los contornos interiores, donde ninguna, una o las dos curvas de referencia de los contornos interiores reproducen un levantamiento poligonal.
Si un carácter presenta uno o dos contornos interiores, entonces las curvas del contorno exterior y de los contornos interiores son invariantes en rotación en su asociación, como corresponde a la asociación geométrica fija predeterminada de los contornos interiores y del contorno exterior del carácter. Por lo tanto, en la comparación de las curvas es suficiente desplazar la curva de caracteres del contorno exterior y la curva de referencia del contorno exterior respectivamente entre sí, para verificar la semejanza de los caracteres. Cuando las curvas normalizadas del contorno exterior se hacen coincidir a través de desplazamiento lineal en el espacio de las tangentes, es decir, la rotación de los levantamientos poligonales, se hacen coincidir forzosamente también las curvas de los contornos interiores. Esto simplifica los procesos de cálculo para la operación de comparación.
Por lo tanto, en general, solamente se utilizan las curvas de los contornos exteriores para hacer coincidir la curva de caracteres con las curvas de referencia. Para la comparación de la semejanza, es decir, para la determinación de las desviaciones entre las curvas de caracteres y las curvas de referencia se utilizan, en cambio, tanto las curvas de los contornos exteriores como también las curvas de los contornos interiores que están presentes en cada caso. De esta manera se obtiene una capacidad elevada de reconocimiento de caracteres del procedimiento de acuerdo con la invención.
Evidentemente, también es posible utilizar, adicionalmente a las curvas del contorno exterior, también las curvas de los contornos interiores de las mismas, y hacer coincidir las curvas de caracteres con las curvas de referencia para la comparación de la semejanza. Esto mejora el reconocimiento de los caracteres sobre todo en el caso de perturbaciones en la impresión de los caracteres. No obstante, puesto que este modo de proceder está unido con un gasto de cálculo elevado, se puede considerar, en general, el desplazamiento de las curvas como suficiente para hacer coincidir las curvas para la comparación de la semejanza.
Para hacer que el reconocimiento de caracteres sea más independiente de las inexactitudes en la representación de los caracteres o bien de la impresión de los caracteres y de pequeñas distorsiones y deformaciones de los caracteres, se simplifican de una manera preferida los levantamientos poligonales aproximados de los caracteres explorados a reconocer a través de un procedimiento de comparación. Este procedimiento de comparación corresponde a una cierta abstracción de la forma de los caracteres y conduce a una reducción considerable de la cantidad de datos a procesar.
Se puede conseguir una simplificación adicional porque ciertas secciones poligonales, es decir, varias secciones rectas consecutivas del levantamiento poligonal se agrupan para formar un arco de polígono del carácter y estos arcos de polígono se utilizan para la comparación de la semejanza. También de esta manera es posible una reducción de la cantidad de datos y del gasto de cálculo.
Las ventajas esenciales del procedimiento de acuerdo con la invención consisten, por lo tanto, en que el reconocimiento de los caracteres y la comparación con los caracteres de referencia es invariable frente a la rotación y a la escala, es decir, es independiente de la posición y de la alineación del carácter a reconocer y de su tamaño.
Además, se consigue una dependencia reducida de la comparación de los caracteres con respecto a las distorsiones y deformaciones de la representación de los caracteres y de las perturbaciones e inexactitudes en la impresión de los caracteres. La comparación del contorno exterior y de los contornos interiores da como resultado una capacidad de reconocimiento elevada de los caracteres alfanuméricos. La curva de tangentes como característica para la forma de los caracteres está próxima a la capacidad de abstracción humana en el reconocimiento de las formas, lo que significa una independencia mayor de la forma de la escritura. El procedimiento se puede emplear, por lo tanto, de múltiples maneras y da como resultado una fiabilidad elevada en el reconocimiento de los caracteres.
A continuación se explica en detalle la invención con la ayuda de un ejemplo de realización. En este caso, en el dibujo adjunto:
La figura 1 muestra la transformación de un polígono bidimensional en el espacio de las tangentes.
La figura 2 muestra el principio de la comparación de las fases.
La figura 3 muestra la comparación de la forma de un carácter a reconocer con un carácter de referencia.
La figura 4 muestra el desglose de un polígono en arcos y
La figura 5 muestra la transformación de un carácter alfanumérico con contorno exterior y contorno interior en el espacio de las tangentes.
El objetivo de la invención es detectar y reconocer ópticamente de una manera automática caracteres alfanuméricos, es decir, especialmente letras y cifras. Los caracteres a reconocer pueden estar presentes en el presente caso en una disposición espacial discrecional, como es el caso, por ejemplo, cuando deben identificarse escrituras sobre objetos que están presentes de forma desordenada.
A tal fin, deben detectarse en primer lugar adicionalmente los caracteres a identificar. Una instalación de exploración es alineada y enfocada sobre los caracteres a determinar. Toda la imagen de los caracteres a identificar es registrada entonces por medio de una cámara línea por línea o bidimensionalmente en forma de una matriz y es convertida en un conjunto de datos binarios para el procesamiento de cálculo siguiente.
A continuación debe segmentarse, en general, toda la imagen de los caracteres a identificar, es decir, que los caracteres alfanuméricos individuales contenidos en toda la imagen deben distinguirse entre sí y deben ser identificados de forma individual. Estas etapas del procedimiento se conocen en sí.
Para el reconocimiento de los caracteres alfanuméricos que están presentes digitalizados y segmentados de esta manera se utiliza el algoritmo que se describe a continuación.
En primer lugar se aproximan el contorno exterior así como uno dos contornos interiores eventualmente presentes del carácter a reconocer a través de un polígono cerrado. Los levantamientos poligonales del contorno exterior y de los contornos interiores son transformados entonces en el espacio de las tangentes, como se ha explicado esto en la figura 1 en el ejemplo de un polígono, que se parece a una figura humana. El levantamiento poligonal representado en la figura 1a en el plano X-Y se descompone en sus secciones rectas individuales. Las secciones rectas consecutivas en el sentido de las agujas del reloj son numeradas de forma correlativa comenzando, por ejemplo, con la numeración inicial 0 en la axila derecha y se identifica en cada caso a través de la longitud de la sección recta y de su ángulo frente a la sección recta precedente. En el espacio de las tangentes representado en la figura 1b se reproducen las secciones de rectas consecutivas de tal forma que su longitud se registra como abscisa y el ángulo con respecto a la sección de rectas precedente se representa como ordenada. Puesto que se trata de un levantamiento poligonal cerrado, se obtiene en general un ángulo de 360º, que aparece como salto entre la recta inicial y la recta final en el espacio de las tangentes.
La curva de caracteres que resulta a través de esta transformación en el espacio de las tangentes representa, por lo tanto, una reproducción unívoca invertible de la forma del polígono en el plano bidimensional de la figura 1aa.
Para posibilitar una comparación independiente del tamaño, es decir, invariable en la escala con caracteres de referencia, se normaliza toda la longitud del levantamiento poligonal, es decir, la longitud de la curva de caracteres en el espacio de las tangentes, a 1. Esto corresponde a un incremento proporcional o bien a una reducción proporcional de los contornos del carácter explorado a reconocer sobre un tamaño unitario normalizado.
Los caracteres a reconocer presentan, en general, en su contorno exterior y en sus contornos interiores perturbaciones, irregularidades y errores, que resultan en la impresión o bien durante la aplicación de los caracteres. Estas perturbaciones e irregularidades forman en el levantamiento poligonal aproximado secciones de rectas y puntos angulares, que presentan solamente desviaciones relativamente reducidas frente a las secciones rectas siguientes. Para reducir la influencia que tales perturbaciones e irregularidades ejercer dificultando el reconocimiento de los caracteres, se lleva a cabo de una manera preferida la compensación de fases descrita a continuación, que conduce a una cierta abstracción, es decir, simplificación de los contornos del carácter explorado y, por lo tanto, a una simplificación de las curvas de caracteres en el espacio de las tangentes.
Para esta compensación de las fases se emplea un algoritmo, que evalúa la llamada "relevancia visual" del punto angular respectivo del levantamiento poligonal. Esta simplificación designada también como "Evolución" se explica con la ayuda del ejemplo de la figura 2.
Una sección poligonal con las secciones rectas o, p, q, r, que se representa en la figura 2a, presenta un punto angular formado por las secciones de rectas p y q. La figura 2b muestra la curva de este levantamiento poligonal transformada en el espacio de las tangentes.
Para determinar la importancia del punto angular formado por las rectas p y q para la identificación visual de los caracteres, se sustituyen las secciones de rectas p y q por una sección recta s. El ángulo "y" entre la sección recta p y la sección recta s se determina en este caso de tal forma que en el espacio de las tangentes, entre la sección recta p y la sección recta s así como entre la sección recta q y la sección recta s se forma en cada caso una superficie F del mismo tamaño, como se representa en la figura 2b. La superficie F da como resultado en el espacio normalizado de las tangentes:
F = [(a - \beta)] \cdot p \cdot q
P + p
Como se puede reconocer a partir de esta fórmula, puede resultar un valor grande de F, es decir, una relevancia visual alta tanto a través de una modificación fuerte del ángulo en el punto angular como también a través de secciones de rectas largas en este punto angular.
Para la simplificación del levantamiento poligonal se calcula en primer lugar el punto angular del levantamiento poligonal con la relevancia visual mínima y se elimina de la manera descrita y se sustituye por una sección recta. En este caso, se modifica de una manera forzosa la relevancia visual de los puntos angulares vecinos a este punto angular. Su relevancia visual debe calcularse ahora otra vez. Estas etapas son proseguidas de forma iterativa para todos los puntos angulares, hasta que solamente permanecen todavía aquellos puntos angulares, cuya relevancia visual está por encima de un valor umbral determinado. Este valor umbral es seleccionado de acuerdo con dos condiciones. Por una parte, debe simplificarse en la mayor medida posible la forma del carácter a reconocer, es decir, que debe reducirse en la mayor medida posible la cantidad de datos que está presente para la comparación siguiente de la forma, con el fin de mantener en límites el gasto de cálculo. Por otra parte, la simplificación no debe perjudicar la capacidad de reconocimiento claro de los contornos. Un valor umbral ponderado que cumple estos requerimientos es aproximadamente 0,3 < F > 0,5.
Las curvas de caracteres simplificadas, dado el caso, a través de la comparación de las fases descrita anteriormente en el espacio de las tangentes de los caracteres detectados a reconocer son comparados a continuación con curvas de referencia normalizadas, que están depositadas como reproducción de caracteres de referencia en una base de datos. La comparación se lleva a cabo de la manera que se explica con la ayuda de la figura 3.
La figura 3a muestra el contorno exterior detectado de la manera indicada anteriormente de un carácter a reconocer y su curva de carácter transformada en el espacio de las tangentes.
La figura 3b muestra el carácter de referencia correspondiente y su curva de referencia normalizada depositada en la base de datos.
Hay que reconocer que en el ejemplo de realización representado, coinciden el contorno exterior del carácter a reconocer y el contorno exterior del carácter de referencia. De una manera correspondiente, también la curva del carácter a reconocer y la curva de referencia tienen la misma forma en el espacio de las tangentes. No obstante, debido a la disposición casual del carácter a reconocer en su detección óptica, su alineación está girada con respecto a la alineación del carácter de referencia. Esta diferente orientación de la posición de los caracteres a reconocer y de los caracteres de referencia corresponde a un desplazamiento de la curva de caracteres y de la curva de referencia en el espacio de las tangentes, como se explica claramente a través de una comparación de las figuras 3aa y 3b. La curva de caracteres detectada y las curvas de referencia respectivas depositadas en la base de datos son superponen ahora por cálculo para la comparación de la forma, como se representa en la figura 3c. La superficie formada entre la curva de caracteres y la curva de referencia respectiva es en este caso una medida para la similitud de las dos curvas. En la figura 3 resulta una superficie relativamente grande entre la curva de caracteres y la curva de referencia, lo que corresponde a una semejanza reducida. La curva de caracteres y la curva de referencia se desplazan ahora en el espacio de las tangentes por cálculo de esta manera relativamente entre sí hasta que la superficie, formada entre estas curvas, alcanza un mínimo. Este desplazamiento de las curvas en el espacio de las tangentes corresponde a una rotación de los contornos de los caracteres, como se representa en la figura 3a en cada caso por medio de un flecha.
El mínimo, calculado de esta manera, de la superficie entre la curva de caracteres del carácter explorado a reconocer y la curva de referencia respectiva se utiliza como medida para la desviación del carácter a reconocer con respecto al carácter de referencia comparado en cada caso. Aquel carácter de referencia en el que esta desviación adopta el valor mínimo, es decir, cuando la superficie mínima calculada entre la curva de caracteres y la curva de referencia es mínima, se determina como carácter reconocido.
Otra forma de realización de la invención se explica con la ayuda de la figura 4.
Como se muestra en la figura 4, el levantamiento poligonal, que representa el contorno del carácter, se descompone en arcos poligonales individuales. En este caso, se agrupan las secciones rectas consecutivas, respectivamente, del levantamiento poligonal para formar un arco poligonal, en el que las secciones rectas presentan en cada caso un ángulo en el mismo sentido de giro con respecto a la sección recta precedente. El levantamiento poligonal se descompone en este caso, por lo tanto, en arcos poligonales, que se suceden de forma alternativa cóncavos y convexos. En la figura 4 se configura, por ejemplo, el arco poligonal A1 de forma cóncava, es decir, que en una pasada del polígono en el sentido de las agujas del reloj, el ángulo de las secciones rectas se modifica en el sentido contrario a las agujas del reloj. El arco poligonal A2 que sigue a continuación está configurado, en cambio, convexo hacia fuera, es decir, que el ángulo entre las secciones rectas consecutivas se modifica en el sentido de las agujas del reloj. De una manera correspondiente, el arco poligonal A3 está configurado de nuevo cóncavo y el arco poligonal A4 está configurado otra vez convexo.
En la comparación de las formas de las curvas en el espacio de las tangentes se comparan en esta forma de realización en cada caso los arcos poligonales individuales del carácter explorado a reconocer con los arcos poligonales de los caracteres de referencia depositados en la base de datos. Como se puede reconocer en la figura 4, las secciones rectas son evaluadas en cada caso dos veces durante la transición entre las secciones cóncavas y convexas del arco, por una parte como sección de recta extrema del arco poligonal precedente y, por otra parte, como sección recta inicial del arco poligonal siguiente.
Se reconoce como carácter correcto en la comparación de la forma aquel carácter de referencia, en el que la suma de las desviaciones de los arcos poligonales individuales comparados entre sí es mínima.
La evaluación de la semejanza de los caracteres con la ayuda de los arcos poligonales cóncavos y convexos consecutivos conduce a una adaptación más fuerte de la comparación de las formas a la capacidad de abstracción humana y a la representación de la forma humana. Se pueden reconocer de una manera correcta con una selectividad más elevada también caracteres que están desplazados o distorsionados más fuertemente con respecto a los caracteres de referencia, si coinciden en una medida suficiente con el carácter de referencia en la secuencia de secciones convexas y cóncavas del arco. Los desplazamientos y los giros angulares de las secciones de arco individuales entre sí tienen una influencia reducida sobre el reconocimiento de los caracteres, puesto que el reconocimiento de las formas de las secciones de arcos está desacoplado en cierta medida entre sí debido a la evaluación doble de las secciones de rectas extremas e iniciales que se solapan.
De acuerdo con la invención, los caracteres se definen a través de tres contornos respectivos. Un contorno exterior está presente en cada carácter alfanumérico. Los caracteres se distinguen en el número de los contornos interiores. Existen caracteres que no presentan ningún contorno interior, otros caracteres, que solamente presentan un contorno interior y, por último, existen caracteres que presentan dos contornos interiores. Para los caracteres de referencia están depositados en cada caso tres contornos en la base de datos, una curva de referencia para el contorno exterior y dos curvas de referencia para los contornos interiores. En los caracteres, que no presentan ningún contorno interior o solamente un contorno exterior, resulta en cada caso una recta horizontal continua para los contornos interiores no presentes.
En los caracteres a detectar se calculan en cada caso el contorno exterior y, si están presentes, los contornos interiores. En la comparación de la forma de las curvas de caracteres y de las curvas de referencia en el espacio de las tangentes se comparan entonces no sólo los contornos exteriores, sino también los contornos interiores. La semejanza óptima se consigue, por lo tanto, cuando todas las desviaciones del contorno exterior y de los contornos interiores es mínima. Si un carácter a reconocer presenta, en comparación con un carácter de referencia, un número diferente de contornos interiores, entonces en la comparación, debido a la ausencia de un contorno interior en uno de los caracteres, resulta una desviación fuerte, incluso cuando los contornos exteriores de los caracteres no se diferencian en una medida demasiado grande.
La figura 5 muestra la transformación de la letra A en tres curvas de caracteres en el espacio de las tangentes. Puesto que la letra A solamente presenta un contorno interior, resulta para el segundo contorno interior una "curva cero" para la comparación de la forma con las curvas de referencia.
Puesto que en los caracteres alfanuméricos, el contorno interior presenta una posición geométrica fija con respecto al contorno exterior, solamente es necesario en primer lugar en la comparación de la forma de los caracteres a reconocer con los caracteres de referencia hacer coincidir, de la manera descrita con la ayuda de la figura 3, los contornos exteriores de los caracteres a comparar entre sí, es decir, la curva del carácter del contorno exterior con la curva de referencia del contorno exterior. En esta rotación de los caracteres o bien en el desplazamiento de las curvas en el espacio de las tangentes se hacen coincidir de la misma forma de una manera forzada los contornos interiores. Una determinación de las desviaciones solamente se lleva a cabo para las tres curvas cuando los contornos exteriores se han colocado en coincidencia. Evidentemente también es posible utilizar ya durante la rotación de los caracteres, descrita con la ayuda de la figura 3, los contornos interiores con el fin de hacer coincidir las curvas de caracteres y las curvas de referencia. Esto puede conducir a una exactitud más elevada de la identificación de los caracteres, pero ello significa también un gasto mayor en el procesamiento de los datos.

Claims (4)

1. Procedimiento para el reconocimiento óptico de caracteres alfanuméricos con las siguientes etapas:
a)
en una base de datos se depositan los contornos exteriores y los contornos interiores poligonales de caracteres de referencia y su asociación de la posición geométrica mutua como curvas de referencia transformadas y normalizadas en el espacio de las tangentes;
b)
el contorno exterior y los contornos interiores de un carácter a reconocer son explorados ópticamente y son convertidos en datos binarios;
c)
el contorno exterior y los contornos interiores del carácter a reconocer son aproximados a través de un polígono, cuyas secciones rectas son transformadas y normalizadas para la generación de curvas de caracteres en el espacio de las tangentes;
d)
para comparar los caracteres a reconocer con los caracteres de referencia de una manera invariable en la rotación, se desplazan al menos la curva de caracteres del contorno exterior y las curvas de referencia de los contornos exteriores de una manera mutua en el espacio de las tangentes, hasta que la superficie incluida entre la curva de caracteres y la curva de referencia respectiva alcanza un mínimo;
e)
la superficie calculada entonces entre las curvas de caracteres para el contorno exterior y los contornos interiores del carácter a reconocer y las curvas de referencia respectivas para los con tornos exteriores y los contornos interiores de los caracteres de referencia se utiliza como medida para la desviación entre el carácter y el carácter de referencia respectivo y aquel carácter de referencia, en el que esta desviación es mínima, se establece como reconocido, caracterizado porque todas las desviaciones del con torno exterior y de los contornos interiores se utilizan para hacer coincidir la curva de carácter y las curvas de referencia de una variante invariable en la rotación.
2. Procedimiento de acuerdo con la reivindicación 1, caracterizado porque los caracteres de referencia y los caracteres a reconocer se definen en cada caso a través de un contorno exterior y dos contornos interiores, que se comparan para el reconocimiento de los caracteres, en el que en cada carácter, los contornos interiores que no están presentes, dado el caso, se representan por medio de una recta en el espacio de las tangentes.
3. Procedimiento de acuerdo con una de las reivindicaciones anteriores, caracterizado porque en la aproximación poligonal de los contornos del carácter a reconocer, se aplica una compensación de las fases, para eliminar puntos angulares del levantamiento poligonal con relevancia visual reducida.
4. Procedimiento de acuerdo con una de las reivindicaciones anteriores, caracterizado porque los levantamientos poligonales de los contornos de los caracteres de referencia y de los caracteres a reconocer se descomponen en arcos poligonales cóncavos y convexos que alternan de una manera consecutiva, porque la comparación de la semejanza se lleva a cabo por separado para los arcos poligonales individuales y porque como medida para la desviación se utiliza la suma de las superficies, que están incluidas entre las curvas de caracteres y las curvas de referencia respectivas de los arcos poligonales individuales.
ES04015595T 2003-08-18 2004-07-02 Procedimiento para el reconocimiento optico de caracteres alfanumericos. Expired - Lifetime ES2263092T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10337831A DE10337831A1 (de) 2003-08-18 2003-08-18 Verfahren zur optischen Erkennung von alphanumerischen Zeichen
DE10337831 2003-08-18

Publications (1)

Publication Number Publication Date
ES2263092T3 true ES2263092T3 (es) 2006-12-01

Family

ID=34089170

Family Applications (1)

Application Number Title Priority Date Filing Date
ES04015595T Expired - Lifetime ES2263092T3 (es) 2003-08-18 2004-07-02 Procedimiento para el reconocimiento optico de caracteres alfanumericos.

Country Status (6)

Country Link
US (1) US7346213B2 (es)
EP (1) EP1510964B1 (es)
AT (1) ATE326730T1 (es)
DE (2) DE10337831A1 (es)
DK (1) DK1510964T3 (es)
ES (1) ES2263092T3 (es)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006088222A1 (ja) * 2005-02-15 2006-08-24 Kite Image Technologies Inc. 手書き文字認識方法、手書き文字認識システム、手書き文字認識プログラム及び記憶媒体
GR1006531B (el) 2008-08-04 2009-09-10 Διαμορφωση εντυπου πολλαπλων επιλογων αναγνωσιμου με ηλεκτρονικο μεσο και συστημα και μεθοδος για την ερμηνεια κατ' ελαχιστον μιας επιλογης του χρηστη
JP2012208553A (ja) * 2011-03-29 2012-10-25 Sony Corp 画像処理装置、および画像処理方法、並びにプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4783829A (en) * 1983-02-23 1988-11-08 Hitachi, Ltd. Pattern recognition apparatus
DE3825582A1 (de) * 1988-07-28 1990-02-01 Ralf A Sood Verfahren und anordnung zum erkennen von zeichen und/oder objekten
US5054098A (en) * 1990-05-21 1991-10-01 Eastman Kodak Company Method of detecting the skew angle of a printed business form
US5048099A (en) * 1990-05-21 1991-09-10 Eastman Kodak Company Polygon-based method for automatic extraction of selected text in a digitized document
DK0604687T3 (da) * 1992-12-30 2000-10-23 Koninkl Kpn Nv Fremgangsmåde til afledning af tegneegenskaber i et tegngenkendelsessystem
DE19531392C1 (de) * 1995-08-26 1997-01-23 Aeg Electrocom Gmbh Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen
US5841905A (en) * 1996-10-25 1998-11-24 Eastman Kodak Company Business form image identification using projected profiles of graphical lines and text string lines

Also Published As

Publication number Publication date
US20050041870A1 (en) 2005-02-24
EP1510964A1 (de) 2005-03-02
EP1510964B1 (de) 2006-05-17
DE10337831A1 (de) 2005-03-24
ATE326730T1 (de) 2006-06-15
DE502004000570D1 (de) 2006-06-22
DK1510964T3 (da) 2006-09-18
US7346213B2 (en) 2008-03-18

Similar Documents

Publication Publication Date Title
ES2309304T3 (es) Procedimiento de entrada/salida de informaciones utilizando una plantilla de puntos.
US6548768B1 (en) Determination of a position code
EP0233628A2 (en) Hand dimension verification
EP2091004A2 (en) Correcting for geometrical perspective distortion
EP1703434B1 (en) Information i/o method using a dot pattern
US20020048404A1 (en) Apparatus and method for determining spatial orientation
AU2013330103B2 (en) Valuable document authentication method and device
EP1197065A1 (en) Recording of information
SE516522C2 (sv) Positionsbestämning
KR20040025568A (ko) 슬라이스 데이터의 이동량 및 기울기에 기초한 재구성화상 데이터의 생성
KR20120042975A (ko) 스트림 도트 패턴, 스트림 도트 패턴의 형성 방법, 스트림 도트 패턴을 사용한 정보 입출력 방법 및 도트 패턴
SE519014C2 (sv) Metod och anordning för igenkänning av ett handskrivet mönster
JP4594952B2 (ja) 文字認識装置及び文字認識方法
JP4455055B2 (ja) 位置コードを達成し且つ位置コードをデコーディングするための方法
US20130142442A1 (en) System and method for document location and recognition
US6226417B1 (en) Method and system for recognizing a rotated image pattern with reduced processing time and memory space
US4731861A (en) Method of optical character recognition
ES2263092T3 (es) Procedimiento para el reconocimiento optico de caracteres alfanumericos.
Cao et al. A probabilistic method for keyword retrieval in handwritten document images
JPS63182793A (ja) 文字切り出し方式
US8005262B2 (en) System and method for video object identification
Vavulin et al. Digital macro-photogrammetry in documentation of old Turkic runiform inscriptions in the Altai Mountains
CN111723586A (zh) 一种文本识别方法、装置、存储介质以及电子设备
JP2001175862A (ja) 帳票識別装置
JP2017173925A (ja) 光学文字認識装置