ES2263092T3 - Procedimiento para el reconocimiento optico de caracteres alfanumericos. - Google Patents
Procedimiento para el reconocimiento optico de caracteres alfanumericos.Info
- Publication number
- ES2263092T3 ES2263092T3 ES04015595T ES04015595T ES2263092T3 ES 2263092 T3 ES2263092 T3 ES 2263092T3 ES 04015595 T ES04015595 T ES 04015595T ES 04015595 T ES04015595 T ES 04015595T ES 2263092 T3 ES2263092 T3 ES 2263092T3
- Authority
- ES
- Spain
- Prior art keywords
- character
- characters
- contours
- curves
- polygonal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000003287 optical effect Effects 0.000 title claims description 8
- 230000000007 visual effect Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 description 8
- 238000006073 displacement reaction Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012015 optical character recognition Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/182—Extraction of features or characteristics of the image by coding the contour of the pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Holo Graphy (AREA)
Abstract
Procedimiento para el reconocimiento óptico de caracteres alfanuméricos con las siguientes etapas: a) en una base de datos se depositan los contornos exteriores y los contornos interiores poligonales de caracteres de referencia y su asociación de la posición geométrica mutua como curvas de referencia transformadas y normalizadas en el espacio de las tangentes; b) el contorno exterior y los contornos interiores de un carácter a reconocer son explorados ópticamente y son convertidos en datos binarios; c) el contorno exterior y los contornos interiores del carácter a reconocer son aproximados a través de un polígono, cuyas secciones rectas son transformadas y normalizadas para la generación de curvas de caracteres en el espacio de las tangentes; d) para comparar los caracteres a reconocer con los caracteres de referencia de una manera invariable en la rotación, se desplazan al menos la curva de caracteres del contorno exterior y las curvas de referencia de los contornos exteriores de una manera mutua en el espacio de las tangentes, hasta que la superficie incluida entre la curva de caracteres y la curva de referencia respectiva alcanza un mínimo; e) la superficie calculada entonces entre las curvas de caracteres para el contorno exterior y los contornos interiores del carácter a reconocer y las curvas de referencia respectivas para los con tornos exteriores y los contornos interiores de los caracteres de referencia se utiliza como medida para la desviación entre el carácter y el carácter de referencia respectivo y aquel carácter de referencia, en el que esta desviación es mínima, se establece como reconocido, caracterizado porque todas las desviaciones del con torno exterior y de los contornos interiores se utilizan para hacer coincidir la curva de carácter y las curvas de referencia de una variante invariable en la rotación.
Description
Procedimiento para el reconocimiento óptico de
caracteres alfanuméricos.
La invención se refiere a un procedimiento para
el reconocimiento óptico de caracteres alfanuméricos.
El reconocimiento óptico de caracteres
alfanuméricos, que se designa habitualmente como Reconocimiento de
Caracteres Ópticos (OCR), sirve para transmitir textos impresos
escritos o, si se desea, también textos manuscritos de una manera
automática en una forma de datos, que puede ser procesada por medio
de un procesamiento electrónico de datos. Los caracteres a
reconocer son explorados ópticamente y binarizados, de manera que se
genera un fichero, que es analizado por medio de un software
adecuado y es convertido en un conjunto de datos compatibles con
ordenador.
Hasta ahora se conoce utilizar especialmente
caracteres normalizados, los llamados escritos OCR, que facilitan
una comparación con caracteres de referencia memorizados. Esta
comparación se realiza de acuerdo con diferentes procedimientos.
En el llamado Pattern Marching se compara el
patrón de caracteres, detectado a través de la exploración óptica,
con caracteres de referencia memorizados a través de la
superposición de los patrones, con el fin de determinar la mejor
coincidencia posible. Este procedimiento es extraordinariamente
problemático cuando deben reconocerse diferentes escritos, tamaños
de caracteres e impresiones de caracteres.
El procedimiento designado como Feature
Recognition se asocian a los caracteres ciertos rasgos
característicos, como trazos verticales y horizontales, puntos de
cruce y arcos. Los caracteres a reconocer se investigan con
relación a estas características y se comparan con las formas de los
patrones memorizadas. Este procedimiento depende, por lo tanto,
menos del tipo de escritura y/o del tamaño y, por consiguiente, es
más fiable.
En el llamado análisis de corte angular se corta
el carácter a reconocer en diferentes ángulos por un conjunto de
rectas. Se analizan el número de los puntos de ennegrecimiento sobre
las rectas así como el número de los puntos de intersección de las
rectas con el carácter a reconocer y se comparan por cálculo con los
caracteres de referencia memorizados.
Se conoce a partir de la ponencia del Dr. Rolf
Lakämper con el título "The ASR-algorithm
(Advanced Shape Recognition") del 145.04.2022, presentada en la
Universidad de temple, Filadelfia, cuyo resumen se puede llamar en
Internet bajo la dirección
www.cis.temple.edu/general/colloquiums.html, un procedimiento
para el procesamiento de imágenes. Este algoritmo se basa en un
reconocimiento del contorno de objetos bidimensionales. El algoritmo
ha sido desarrollado para la robótica. Con la ayuda de dos
algoritmos se abstraen los objetos en una primera etapa a través de
un levantamiento poligonal y se transforman en una segunda etapa en
un espacio de tangentes.
En otra publicación de login Jan Latecki y Rolf
Lakämper "Shape Similarity Measure Based on Correspondence of
Visual Parts" IEEE Transactions on Pattern Análisis and Machine
Intelligence, IEEE, Inc,. Nueva York, US Vol. 22, Nº 10, Octubre
del 2000, se describe un método para la detección de objetos
bidimensionales. Los objetos son representados de una manera
simplificada a través de levantamiento poligonal. Los puntos
angulares de los polígonos con relevancia reducida s eliminados en
este caso. Para la identificación de los objetos se transforma un
levantamiento poligonal en un espacio de tangentes.
Se conoce a partir del documento US 5 048 099 un
procedimiento para la identificación de texto impreso dentro de una
zona no enmarcada. Con la ayuda del procedimiento se identifica en
enmarque. El enmarque debe formar en este caso una curva cerrada. A
este respecto, se determina si la curva o el texto enmarcado por la
curva presenta contornos externos y con tornos internos. En virtud
de las características del contorno interno y del contorno exterior
se puede determinar si se trata de un enmarque de texto. El
procedimiento se aplica para extraer pasajes de texto marcados
manualmente.
Estos procedimientos conocidos dependen en gran
medida de que los caracteres a reconocer estén presentes en un
escrito normalizado o sean lo más aproximados posible a un escrito
normalizado de este tipo.
La invención tiene el cometido de poner a
disposición un procedimiento para el reconocimiento óptico de
caracteres alfanuméricos, que presenta una capacidad de
reconocimiento mejorada, que se aproxima en gran medida a la
capacidad de abstracción humana de características de similitud.
Este cometido se soluciona de acuerdo con la
invención por medio de un procedimiento con las características de
la reivindicación 1.
Las configuraciones ventajosas de la invención
están indicadas en las reivindicaciones dependientes relacionadas en
cada caso.
La invención parte de un procedimiento que se
conoce bajo la designación Advanced Shape Recognition (ASR). Este
procedimiento se emplea, por ejemplo, en la técnica de
automatización para un reconocimiento de piezas de una manera
independiente de la posición. En este procedimiento se explora el
contorno exterior de una parte y se aproxima en primer lugar a
través de un levantamiento poligonal. El levantamiento poligonal es
transformado en el espacio de las tangentes, es decir, se convierte
en una curva, que está definida a través de la longitud y el ángulo
de las secciones de rectas consecutivas respectivas del polígono. La
curva calculada de esta manera de la parte explorada es comparada
con curvas de referencia memorizadas, que reproducen los contornos
exteriores de las piezas a diferenciar. Este procedimiento conocido
tiene la ventaja de que se puede llevar a cabo la comparación de
una manera independiente de la posición, puesto que la curva es
invariable en la rotación en el espacio de tangentes. Una rotación
de la pieza y de su contorno exterior corresponde a un
desplazamiento lineal de la curva en el espacio de las tangentes. A
través de un desplazamiento mutuo de la curva explorada con la
curva de referencia se pueden llevar estas curvas a una posición
coincidente para la comparación.
El procedimiento conocido en sí se modifica y se
desarrolla de acuerdo con la invención para la identificación de
caracteres alfanuméricos. A tal fin se normalizan las curvas de
referencia depositadas en la base de datos, que corresponden a los
caracteres de referencia, y de la misma manera se normalizan las
curvas de caracteres, generadas a través de la exploración de los
caracteres a reconocer, en el espacio de las tangentes. Esta
normalización significa que los levantamientos poligonales de la
curva de referencia y de la curva de caracteres se llevan a la
misma longitud. Esta normalización de las curvas en el espacio de
las tangentes corresponde a un incremento lineal o bien a una
reducción lineal del levantamiento poligonal y, por lo tanto, al
contorno del carácter a reconocer. A través de esta normalización,
la identificación de los caracteres se vuelve independiente del
tamaño de la escritura de los caracteres a reconocer.
Además, de acuerdo con la invención, no sólo se
evalúa el contorno exterior de los caracteres alfanuméricos, sino
también sus contornos interiores. El contorno exterior y los
contornos interiores de los caracteres de referencia se depositan
en la base de datos como conjunto de curvas de referencia en el
espacio de las tangentes. De una manera correspondiente, en el
carácter a reconocer, el contorno exterior y los contornos
interiores son detectados y son transformados en curvas de
caracteres correspondientes en el espacio de las tangentes. El
número y forma de los contornos interiores así como su asociación de
la posición geométrica representan una característica adicional de
los caracteres alfanuméricos, que es importante para el
reconocimiento de los caracteres. Existen caracteres, que solamente
presentan un contorno exterior y no presentan ningún contorno
interior, por ejemplo la letra I o la cifra 2. Además, existen
caracteres con un solo contorno interior, por ejemplo la letra P o
el número 9. Por último, existen caracteres con dos contornos
interiores, por ejemplo la letra B o la cifra 8. Un conjunto de
curvas de referencia de un carácter de referencia está constituido,
por lo tanto, en cada caso por una curva de referencia del contorno
exterior y por dos curvas de referencia de los contornos
interiores, donde ninguna, una o las dos curvas de referencia de los
contornos interiores reproducen un levantamiento poligonal.
Si un carácter presenta uno o dos contornos
interiores, entonces las curvas del contorno exterior y de los
contornos interiores son invariantes en rotación en su asociación,
como corresponde a la asociación geométrica fija predeterminada de
los contornos interiores y del contorno exterior del carácter. Por
lo tanto, en la comparación de las curvas es suficiente desplazar
la curva de caracteres del contorno exterior y la curva de
referencia del contorno exterior respectivamente entre sí, para
verificar la semejanza de los caracteres. Cuando las curvas
normalizadas del contorno exterior se hacen coincidir a través de
desplazamiento lineal en el espacio de las tangentes, es decir, la
rotación de los levantamientos poligonales, se hacen coincidir
forzosamente también las curvas de los contornos interiores. Esto
simplifica los procesos de cálculo para la operación de
comparación.
Por lo tanto, en general, solamente se utilizan
las curvas de los contornos exteriores para hacer coincidir la
curva de caracteres con las curvas de referencia. Para la
comparación de la semejanza, es decir, para la determinación de las
desviaciones entre las curvas de caracteres y las curvas de
referencia se utilizan, en cambio, tanto las curvas de los
contornos exteriores como también las curvas de los contornos
interiores que están presentes en cada caso. De esta manera se
obtiene una capacidad elevada de reconocimiento de caracteres del
procedimiento de acuerdo con la invención.
Evidentemente, también es posible utilizar,
adicionalmente a las curvas del contorno exterior, también las
curvas de los contornos interiores de las mismas, y hacer coincidir
las curvas de caracteres con las curvas de referencia para la
comparación de la semejanza. Esto mejora el reconocimiento de los
caracteres sobre todo en el caso de perturbaciones en la impresión
de los caracteres. No obstante, puesto que este modo de proceder
está unido con un gasto de cálculo elevado, se puede considerar, en
general, el desplazamiento de las curvas como suficiente para hacer
coincidir las curvas para la comparación de la semejanza.
Para hacer que el reconocimiento de caracteres
sea más independiente de las inexactitudes en la representación de
los caracteres o bien de la impresión de los caracteres y de
pequeñas distorsiones y deformaciones de los caracteres, se
simplifican de una manera preferida los levantamientos poligonales
aproximados de los caracteres explorados a reconocer a través de un
procedimiento de comparación. Este procedimiento de comparación
corresponde a una cierta abstracción de la forma de los caracteres
y conduce a una reducción considerable de la cantidad de datos a
procesar.
Se puede conseguir una simplificación adicional
porque ciertas secciones poligonales, es decir, varias secciones
rectas consecutivas del levantamiento poligonal se agrupan para
formar un arco de polígono del carácter y estos arcos de polígono
se utilizan para la comparación de la semejanza. También de esta
manera es posible una reducción de la cantidad de datos y del gasto
de cálculo.
Las ventajas esenciales del procedimiento de
acuerdo con la invención consisten, por lo tanto, en que el
reconocimiento de los caracteres y la comparación con los
caracteres de referencia es invariable frente a la rotación y a la
escala, es decir, es independiente de la posición y de la alineación
del carácter a reconocer y de su tamaño.
Además, se consigue una dependencia reducida de
la comparación de los caracteres con respecto a las distorsiones y
deformaciones de la representación de los caracteres y de las
perturbaciones e inexactitudes en la impresión de los caracteres.
La comparación del contorno exterior y de los contornos interiores
da como resultado una capacidad de reconocimiento elevada de los
caracteres alfanuméricos. La curva de tangentes como característica
para la forma de los caracteres está próxima a la capacidad de
abstracción humana en el reconocimiento de las formas, lo que
significa una independencia mayor de la forma de la escritura. El
procedimiento se puede emplear, por lo tanto, de múltiples maneras
y da como resultado una fiabilidad elevada en el reconocimiento de
los caracteres.
A continuación se explica en detalle la
invención con la ayuda de un ejemplo de realización. En este caso,
en el dibujo adjunto:
La figura 1 muestra la transformación de un
polígono bidimensional en el espacio de las tangentes.
La figura 2 muestra el principio de la
comparación de las fases.
La figura 3 muestra la comparación de la forma
de un carácter a reconocer con un carácter de referencia.
La figura 4 muestra el desglose de un polígono
en arcos y
La figura 5 muestra la transformación de un
carácter alfanumérico con contorno exterior y contorno interior en
el espacio de las tangentes.
El objetivo de la invención es detectar y
reconocer ópticamente de una manera automática caracteres
alfanuméricos, es decir, especialmente letras y cifras. Los
caracteres a reconocer pueden estar presentes en el presente caso en
una disposición espacial discrecional, como es el caso, por ejemplo,
cuando deben identificarse escrituras sobre objetos que están
presentes de forma desordenada.
A tal fin, deben detectarse en primer lugar
adicionalmente los caracteres a identificar. Una instalación de
exploración es alineada y enfocada sobre los caracteres a
determinar. Toda la imagen de los caracteres a identificar es
registrada entonces por medio de una cámara línea por línea o
bidimensionalmente en forma de una matriz y es convertida en un
conjunto de datos binarios para el procesamiento de cálculo
siguiente.
A continuación debe segmentarse, en general,
toda la imagen de los caracteres a identificar, es decir, que los
caracteres alfanuméricos individuales contenidos en toda la imagen
deben distinguirse entre sí y deben ser identificados de forma
individual. Estas etapas del procedimiento se conocen en sí.
Para el reconocimiento de los caracteres
alfanuméricos que están presentes digitalizados y segmentados de
esta manera se utiliza el algoritmo que se describe a
continuación.
En primer lugar se aproximan el contorno
exterior así como uno dos contornos interiores eventualmente
presentes del carácter a reconocer a través de un polígono cerrado.
Los levantamientos poligonales del contorno exterior y de los
contornos interiores son transformados entonces en el espacio de las
tangentes, como se ha explicado esto en la figura 1 en el ejemplo
de un polígono, que se parece a una figura humana. El levantamiento
poligonal representado en la figura 1a en el plano
X-Y se descompone en sus secciones rectas
individuales. Las secciones rectas consecutivas en el sentido de
las agujas del reloj son numeradas de forma correlativa comenzando,
por ejemplo, con la numeración inicial 0 en la axila derecha y se
identifica en cada caso a través de la longitud de la sección recta
y de su ángulo frente a la sección recta precedente. En el espacio
de las tangentes representado en la figura 1b se reproducen las
secciones de rectas consecutivas de tal forma que su longitud se
registra como abscisa y el ángulo con respecto a la sección de
rectas precedente se representa como ordenada. Puesto que se trata
de un levantamiento poligonal cerrado, se obtiene en general un
ángulo de 360º, que aparece como salto entre la recta inicial y la
recta final en el espacio de las tangentes.
La curva de caracteres que resulta a través de
esta transformación en el espacio de las tangentes representa, por
lo tanto, una reproducción unívoca invertible de la forma del
polígono en el plano bidimensional de la figura 1aa.
Para posibilitar una comparación independiente
del tamaño, es decir, invariable en la escala con caracteres de
referencia, se normaliza toda la longitud del levantamiento
poligonal, es decir, la longitud de la curva de caracteres en el
espacio de las tangentes, a 1. Esto corresponde a un incremento
proporcional o bien a una reducción proporcional de los contornos
del carácter explorado a reconocer sobre un tamaño unitario
normalizado.
Los caracteres a reconocer presentan, en
general, en su contorno exterior y en sus contornos interiores
perturbaciones, irregularidades y errores, que resultan en la
impresión o bien durante la aplicación de los caracteres. Estas
perturbaciones e irregularidades forman en el levantamiento
poligonal aproximado secciones de rectas y puntos angulares, que
presentan solamente desviaciones relativamente reducidas frente a
las secciones rectas siguientes. Para reducir la influencia que
tales perturbaciones e irregularidades ejercer dificultando el
reconocimiento de los caracteres, se lleva a cabo de una manera
preferida la compensación de fases descrita a continuación, que
conduce a una cierta abstracción, es decir, simplificación de los
contornos del carácter explorado y, por lo tanto, a una
simplificación de las curvas de caracteres en el espacio de las
tangentes.
Para esta compensación de las fases se emplea un
algoritmo, que evalúa la llamada "relevancia visual" del punto
angular respectivo del levantamiento poligonal. Esta simplificación
designada también como "Evolución" se explica con la ayuda del
ejemplo de la figura 2.
Una sección poligonal con las secciones rectas
o, p, q, r, que se representa en la figura 2a, presenta un punto
angular formado por las secciones de rectas p y q. La figura 2b
muestra la curva de este levantamiento poligonal transformada en el
espacio de las tangentes.
Para determinar la importancia del punto angular
formado por las rectas p y q para la identificación visual de los
caracteres, se sustituyen las secciones de rectas p y q por una
sección recta s. El ángulo "y" entre la sección recta p y la
sección recta s se determina en este caso de tal forma que en el
espacio de las tangentes, entre la sección recta p y la sección
recta s así como entre la sección recta q y la sección recta s se
forma en cada caso una superficie F del mismo tamaño, como se
representa en la figura 2b. La superficie F da como resultado en el
espacio normalizado de las tangentes:
F = [(a -
\beta)] \cdot p \cdot
q
P +
p
Como se puede reconocer a partir de esta
fórmula, puede resultar un valor grande de F, es decir, una
relevancia visual alta tanto a través de una modificación fuerte
del ángulo en el punto angular como también a través de secciones de
rectas largas en este punto angular.
Para la simplificación del levantamiento
poligonal se calcula en primer lugar el punto angular del
levantamiento poligonal con la relevancia visual mínima y se
elimina de la manera descrita y se sustituye por una sección recta.
En este caso, se modifica de una manera forzosa la relevancia visual
de los puntos angulares vecinos a este punto angular. Su relevancia
visual debe calcularse ahora otra vez. Estas etapas son proseguidas
de forma iterativa para todos los puntos angulares, hasta que
solamente permanecen todavía aquellos puntos angulares, cuya
relevancia visual está por encima de un valor umbral determinado.
Este valor umbral es seleccionado de acuerdo con dos condiciones.
Por una parte, debe simplificarse en la mayor medida posible la
forma del carácter a reconocer, es decir, que debe reducirse en la
mayor medida posible la cantidad de datos que está presente para la
comparación siguiente de la forma, con el fin de mantener en límites
el gasto de cálculo. Por otra parte, la simplificación no debe
perjudicar la capacidad de reconocimiento claro de los contornos. Un
valor umbral ponderado que cumple estos requerimientos es
aproximadamente 0,3 < F > 0,5.
Las curvas de caracteres simplificadas, dado el
caso, a través de la comparación de las fases descrita anteriormente
en el espacio de las tangentes de los caracteres detectados a
reconocer son comparados a continuación con curvas de referencia
normalizadas, que están depositadas como reproducción de caracteres
de referencia en una base de datos. La comparación se lleva a cabo
de la manera que se explica con la ayuda de la figura 3.
La figura 3a muestra el contorno exterior
detectado de la manera indicada anteriormente de un carácter a
reconocer y su curva de carácter transformada en el espacio de las
tangentes.
La figura 3b muestra el carácter de referencia
correspondiente y su curva de referencia normalizada depositada en
la base de datos.
Hay que reconocer que en el ejemplo de
realización representado, coinciden el contorno exterior del
carácter a reconocer y el contorno exterior del carácter de
referencia. De una manera correspondiente, también la curva del
carácter a reconocer y la curva de referencia tienen la misma forma
en el espacio de las tangentes. No obstante, debido a la
disposición casual del carácter a reconocer en su detección óptica,
su alineación está girada con respecto a la alineación del carácter
de referencia. Esta diferente orientación de la posición de los
caracteres a reconocer y de los caracteres de referencia corresponde
a un desplazamiento de la curva de caracteres y de la curva de
referencia en el espacio de las tangentes, como se explica
claramente a través de una comparación de las figuras 3aa y 3b. La
curva de caracteres detectada y las curvas de referencia respectivas
depositadas en la base de datos son superponen ahora por cálculo
para la comparación de la forma, como se representa en la figura
3c. La superficie formada entre la curva de caracteres y la curva de
referencia respectiva es en este caso una medida para la similitud
de las dos curvas. En la figura 3 resulta una superficie
relativamente grande entre la curva de caracteres y la curva de
referencia, lo que corresponde a una semejanza reducida. La curva de
caracteres y la curva de referencia se desplazan ahora en el espacio
de las tangentes por cálculo de esta manera relativamente entre sí
hasta que la superficie, formada entre estas curvas, alcanza un
mínimo. Este desplazamiento de las curvas en el espacio de las
tangentes corresponde a una rotación de los contornos de los
caracteres, como se representa en la figura 3a en cada caso por
medio de un flecha.
El mínimo, calculado de esta manera, de la
superficie entre la curva de caracteres del carácter explorado a
reconocer y la curva de referencia respectiva se utiliza como medida
para la desviación del carácter a reconocer con respecto al
carácter de referencia comparado en cada caso. Aquel carácter de
referencia en el que esta desviación adopta el valor mínimo, es
decir, cuando la superficie mínima calculada entre la curva de
caracteres y la curva de referencia es mínima, se determina como
carácter reconocido.
Otra forma de realización de la invención se
explica con la ayuda de la figura 4.
Como se muestra en la figura 4, el levantamiento
poligonal, que representa el contorno del carácter, se descompone
en arcos poligonales individuales. En este caso, se agrupan las
secciones rectas consecutivas, respectivamente, del levantamiento
poligonal para formar un arco poligonal, en el que las secciones
rectas presentan en cada caso un ángulo en el mismo sentido de giro
con respecto a la sección recta precedente. El levantamiento
poligonal se descompone en este caso, por lo tanto, en arcos
poligonales, que se suceden de forma alternativa cóncavos y
convexos. En la figura 4 se configura, por ejemplo, el arco
poligonal A1 de forma cóncava, es decir, que en una pasada del
polígono en el sentido de las agujas del reloj, el ángulo de las
secciones rectas se modifica en el sentido contrario a las agujas
del reloj. El arco poligonal A2 que sigue a continuación está
configurado, en cambio, convexo hacia fuera, es decir, que el
ángulo entre las secciones rectas consecutivas se modifica en el
sentido de las agujas del reloj. De una manera correspondiente, el
arco poligonal A3 está configurado de nuevo cóncavo y el arco
poligonal A4 está configurado otra vez convexo.
En la comparación de las formas de las curvas en
el espacio de las tangentes se comparan en esta forma de
realización en cada caso los arcos poligonales individuales del
carácter explorado a reconocer con los arcos poligonales de los
caracteres de referencia depositados en la base de datos. Como se
puede reconocer en la figura 4, las secciones rectas son evaluadas
en cada caso dos veces durante la transición entre las secciones
cóncavas y convexas del arco, por una parte como sección de recta
extrema del arco poligonal precedente y, por otra parte, como
sección recta inicial del arco poligonal siguiente.
Se reconoce como carácter correcto en la
comparación de la forma aquel carácter de referencia, en el que la
suma de las desviaciones de los arcos poligonales individuales
comparados entre sí es mínima.
La evaluación de la semejanza de los caracteres
con la ayuda de los arcos poligonales cóncavos y convexos
consecutivos conduce a una adaptación más fuerte de la comparación
de las formas a la capacidad de abstracción humana y a la
representación de la forma humana. Se pueden reconocer de una manera
correcta con una selectividad más elevada también caracteres que
están desplazados o distorsionados más fuertemente con respecto a
los caracteres de referencia, si coinciden en una medida suficiente
con el carácter de referencia en la secuencia de secciones convexas
y cóncavas del arco. Los desplazamientos y los giros angulares de
las secciones de arco individuales entre sí tienen una influencia
reducida sobre el reconocimiento de los caracteres, puesto que el
reconocimiento de las formas de las secciones de arcos está
desacoplado en cierta medida entre sí debido a la evaluación doble
de las secciones de rectas extremas e iniciales que se solapan.
De acuerdo con la invención, los caracteres se
definen a través de tres contornos respectivos. Un contorno
exterior está presente en cada carácter alfanumérico. Los caracteres
se distinguen en el número de los contornos interiores. Existen
caracteres que no presentan ningún contorno interior, otros
caracteres, que solamente presentan un contorno interior y, por
último, existen caracteres que presentan dos contornos interiores.
Para los caracteres de referencia están depositados en cada caso
tres contornos en la base de datos, una curva de referencia para el
contorno exterior y dos curvas de referencia para los contornos
interiores. En los caracteres, que no presentan ningún contorno
interior o solamente un contorno exterior, resulta en cada caso una
recta horizontal continua para los contornos interiores no
presentes.
En los caracteres a detectar se calculan en cada
caso el contorno exterior y, si están presentes, los contornos
interiores. En la comparación de la forma de las curvas de
caracteres y de las curvas de referencia en el espacio de las
tangentes se comparan entonces no sólo los contornos exteriores,
sino también los contornos interiores. La semejanza óptima se
consigue, por lo tanto, cuando todas las desviaciones del contorno
exterior y de los contornos interiores es mínima. Si un carácter a
reconocer presenta, en comparación con un carácter de referencia,
un número diferente de contornos interiores, entonces en la
comparación, debido a la ausencia de un contorno interior en uno de
los caracteres, resulta una desviación fuerte, incluso cuando los
contornos exteriores de los caracteres no se diferencian en una
medida demasiado grande.
La figura 5 muestra la transformación de la
letra A en tres curvas de caracteres en el espacio de las tangentes.
Puesto que la letra A solamente presenta un contorno interior,
resulta para el segundo contorno interior una "curva cero"
para la comparación de la forma con las curvas de referencia.
Puesto que en los caracteres alfanuméricos, el
contorno interior presenta una posición geométrica fija con
respecto al contorno exterior, solamente es necesario en primer
lugar en la comparación de la forma de los caracteres a reconocer
con los caracteres de referencia hacer coincidir, de la manera
descrita con la ayuda de la figura 3, los contornos exteriores de
los caracteres a comparar entre sí, es decir, la curva del carácter
del contorno exterior con la curva de referencia del contorno
exterior. En esta rotación de los caracteres o bien en el
desplazamiento de las curvas en el espacio de las tangentes se hacen
coincidir de la misma forma de una manera forzada los contornos
interiores. Una determinación de las desviaciones solamente se lleva
a cabo para las tres curvas cuando los contornos exteriores se han
colocado en coincidencia. Evidentemente también es posible utilizar
ya durante la rotación de los caracteres, descrita con la ayuda de
la figura 3, los contornos interiores con el fin de hacer coincidir
las curvas de caracteres y las curvas de referencia. Esto puede
conducir a una exactitud más elevada de la identificación de los
caracteres, pero ello significa también un gasto mayor en el
procesamiento de los datos.
Claims (4)
1. Procedimiento para el reconocimiento óptico
de caracteres alfanuméricos con las siguientes etapas:
- a)
- en una base de datos se depositan los contornos exteriores y los contornos interiores poligonales de caracteres de referencia y su asociación de la posición geométrica mutua como curvas de referencia transformadas y normalizadas en el espacio de las tangentes;
- b)
- el contorno exterior y los contornos interiores de un carácter a reconocer son explorados ópticamente y son convertidos en datos binarios;
- c)
- el contorno exterior y los contornos interiores del carácter a reconocer son aproximados a través de un polígono, cuyas secciones rectas son transformadas y normalizadas para la generación de curvas de caracteres en el espacio de las tangentes;
- d)
- para comparar los caracteres a reconocer con los caracteres de referencia de una manera invariable en la rotación, se desplazan al menos la curva de caracteres del contorno exterior y las curvas de referencia de los contornos exteriores de una manera mutua en el espacio de las tangentes, hasta que la superficie incluida entre la curva de caracteres y la curva de referencia respectiva alcanza un mínimo;
- e)
- la superficie calculada entonces entre las curvas de caracteres para el contorno exterior y los contornos interiores del carácter a reconocer y las curvas de referencia respectivas para los con tornos exteriores y los contornos interiores de los caracteres de referencia se utiliza como medida para la desviación entre el carácter y el carácter de referencia respectivo y aquel carácter de referencia, en el que esta desviación es mínima, se establece como reconocido, caracterizado porque todas las desviaciones del con torno exterior y de los contornos interiores se utilizan para hacer coincidir la curva de carácter y las curvas de referencia de una variante invariable en la rotación.
2. Procedimiento de acuerdo con la
reivindicación 1, caracterizado porque los caracteres de
referencia y los caracteres a reconocer se definen en cada caso a
través de un contorno exterior y dos contornos interiores, que se
comparan para el reconocimiento de los caracteres, en el que en cada
carácter, los contornos interiores que no están presentes, dado el
caso, se representan por medio de una recta en el espacio de las
tangentes.
3. Procedimiento de acuerdo con una de las
reivindicaciones anteriores, caracterizado porque en la
aproximación poligonal de los contornos del carácter a reconocer,
se aplica una compensación de las fases, para eliminar puntos
angulares del levantamiento poligonal con relevancia visual
reducida.
4. Procedimiento de acuerdo con una de las
reivindicaciones anteriores, caracterizado porque los
levantamientos poligonales de los contornos de los caracteres de
referencia y de los caracteres a reconocer se descomponen en arcos
poligonales cóncavos y convexos que alternan de una manera
consecutiva, porque la comparación de la semejanza se lleva a cabo
por separado para los arcos poligonales individuales y porque como
medida para la desviación se utiliza la suma de las superficies,
que están incluidas entre las curvas de caracteres y las curvas de
referencia respectivas de los arcos poligonales individuales.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10337831A DE10337831A1 (de) | 2003-08-18 | 2003-08-18 | Verfahren zur optischen Erkennung von alphanumerischen Zeichen |
DE10337831 | 2003-08-18 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2263092T3 true ES2263092T3 (es) | 2006-12-01 |
Family
ID=34089170
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES04015595T Expired - Lifetime ES2263092T3 (es) | 2003-08-18 | 2004-07-02 | Procedimiento para el reconocimiento optico de caracteres alfanumericos. |
Country Status (6)
Country | Link |
---|---|
US (1) | US7346213B2 (es) |
EP (1) | EP1510964B1 (es) |
AT (1) | ATE326730T1 (es) |
DE (2) | DE10337831A1 (es) |
DK (1) | DK1510964T3 (es) |
ES (1) | ES2263092T3 (es) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006088222A1 (ja) * | 2005-02-15 | 2006-08-24 | Kite Image Technologies Inc. | 手書き文字認識方法、手書き文字認識システム、手書き文字認識プログラム及び記憶媒体 |
GR1006531B (el) | 2008-08-04 | 2009-09-10 | Διαμορφωση εντυπου πολλαπλων επιλογων αναγνωσιμου με ηλεκτρονικο μεσο και συστημα και μεθοδος για την ερμηνεια κατ' ελαχιστον μιας επιλογης του χρηστη | |
JP2012208553A (ja) * | 2011-03-29 | 2012-10-25 | Sony Corp | 画像処理装置、および画像処理方法、並びにプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4783829A (en) * | 1983-02-23 | 1988-11-08 | Hitachi, Ltd. | Pattern recognition apparatus |
DE3825582A1 (de) * | 1988-07-28 | 1990-02-01 | Ralf A Sood | Verfahren und anordnung zum erkennen von zeichen und/oder objekten |
US5054098A (en) * | 1990-05-21 | 1991-10-01 | Eastman Kodak Company | Method of detecting the skew angle of a printed business form |
US5048099A (en) * | 1990-05-21 | 1991-09-10 | Eastman Kodak Company | Polygon-based method for automatic extraction of selected text in a digitized document |
DK0604687T3 (da) * | 1992-12-30 | 2000-10-23 | Koninkl Kpn Nv | Fremgangsmåde til afledning af tegneegenskaber i et tegngenkendelsessystem |
DE19531392C1 (de) * | 1995-08-26 | 1997-01-23 | Aeg Electrocom Gmbh | Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen |
US5841905A (en) * | 1996-10-25 | 1998-11-24 | Eastman Kodak Company | Business form image identification using projected profiles of graphical lines and text string lines |
-
2003
- 2003-08-18 DE DE10337831A patent/DE10337831A1/de not_active Withdrawn
-
2004
- 2004-07-02 DK DK04015595T patent/DK1510964T3/da active
- 2004-07-02 EP EP04015595A patent/EP1510964B1/de not_active Expired - Lifetime
- 2004-07-02 AT AT04015595T patent/ATE326730T1/de not_active IP Right Cessation
- 2004-07-02 DE DE502004000570T patent/DE502004000570D1/de not_active Expired - Lifetime
- 2004-07-02 ES ES04015595T patent/ES2263092T3/es not_active Expired - Lifetime
- 2004-08-13 US US10/917,887 patent/US7346213B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20050041870A1 (en) | 2005-02-24 |
EP1510964A1 (de) | 2005-03-02 |
EP1510964B1 (de) | 2006-05-17 |
DE10337831A1 (de) | 2005-03-24 |
ATE326730T1 (de) | 2006-06-15 |
DE502004000570D1 (de) | 2006-06-22 |
DK1510964T3 (da) | 2006-09-18 |
US7346213B2 (en) | 2008-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2309304T3 (es) | Procedimiento de entrada/salida de informaciones utilizando una plantilla de puntos. | |
US6548768B1 (en) | Determination of a position code | |
EP0233628A2 (en) | Hand dimension verification | |
EP2091004A2 (en) | Correcting for geometrical perspective distortion | |
EP1703434B1 (en) | Information i/o method using a dot pattern | |
US20020048404A1 (en) | Apparatus and method for determining spatial orientation | |
AU2013330103B2 (en) | Valuable document authentication method and device | |
EP1197065A1 (en) | Recording of information | |
SE516522C2 (sv) | Positionsbestämning | |
KR20040025568A (ko) | 슬라이스 데이터의 이동량 및 기울기에 기초한 재구성화상 데이터의 생성 | |
KR20120042975A (ko) | 스트림 도트 패턴, 스트림 도트 패턴의 형성 방법, 스트림 도트 패턴을 사용한 정보 입출력 방법 및 도트 패턴 | |
SE519014C2 (sv) | Metod och anordning för igenkänning av ett handskrivet mönster | |
JP4594952B2 (ja) | 文字認識装置及び文字認識方法 | |
JP4455055B2 (ja) | 位置コードを達成し且つ位置コードをデコーディングするための方法 | |
US20130142442A1 (en) | System and method for document location and recognition | |
US6226417B1 (en) | Method and system for recognizing a rotated image pattern with reduced processing time and memory space | |
US4731861A (en) | Method of optical character recognition | |
ES2263092T3 (es) | Procedimiento para el reconocimiento optico de caracteres alfanumericos. | |
Cao et al. | A probabilistic method for keyword retrieval in handwritten document images | |
JPS63182793A (ja) | 文字切り出し方式 | |
US8005262B2 (en) | System and method for video object identification | |
Vavulin et al. | Digital macro-photogrammetry in documentation of old Turkic runiform inscriptions in the Altai Mountains | |
CN111723586A (zh) | 一种文本识别方法、装置、存储介质以及电子设备 | |
JP2001175862A (ja) | 帳票識別装置 | |
JP2017173925A (ja) | 光学文字認識装置 |