ES2754612T3 - Procedimiento de reconocimiento de caracteres en relieve, producto programa de ordenador y dispositivo correspondientes - Google Patents

Procedimiento de reconocimiento de caracteres en relieve, producto programa de ordenador y dispositivo correspondientes Download PDF

Info

Publication number
ES2754612T3
ES2754612T3 ES17189487T ES17189487T ES2754612T3 ES 2754612 T3 ES2754612 T3 ES 2754612T3 ES 17189487 T ES17189487 T ES 17189487T ES 17189487 T ES17189487 T ES 17189487T ES 2754612 T3 ES2754612 T3 ES 2754612T3
Authority
ES
Spain
Prior art keywords
image
characters
bank card
identification
base image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES17189487T
Other languages
English (en)
Inventor
Pierre Quentin
Rémi Geraud
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Worldline MS France
Original Assignee
Ingenico Group SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ingenico Group SA filed Critical Ingenico Group SA
Application granted granted Critical
Publication of ES2754612T3 publication Critical patent/ES2754612T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18124Extraction of features or characteristics of the image related to illumination properties, e.g. according to a reflectance or lighting model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/10544Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation by scanning of the records by radiation in the optical part of the electromagnetic spectrum
    • G06K7/10821Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation by scanning of the records by radiation in the optical part of the electromagnetic spectrum further details of bar or optical code scanning devices
    • G06K7/10861Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation by scanning of the records by radiation in the optical part of the electromagnetic spectrum further details of bar or optical code scanning devices sensing of data fields affixed to objects or articles, e.g. coded labels
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • G06V20/653Three-dimensional objects by matching three-dimensional models, e.g. conformal mapping of Riemann surfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/17Mechanical parametric or variational design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Electromagnetism (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Toxicology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

Procedimiento de reconocimiento de caracteres, puesto en práctica por mediación de un dispositivo electrónico, que incluye una etapa de reconocimiento, en una imagen representativa de un objeto que comprende al menos un carácter en relieve, llamada imagen base, de al menos un carácter en relieve de dicha imagen base, comprendiendo el procedimiento: - una fase de tratamiento (11) de al menos una imagen, comprendiendo dicha fase al menos una puesta en práctica de un modelo reflexivo de Phong y entregando al menos una imagen de identificación (P3, IRx); - una fase de identificación de caracteres (12) en función de la imagen base y de dicha al menos una imagen de identificación, que comprende una etapa de reconocimiento de los caracteres de la imagen base con el concurso de dicha al menos una imagen de identificación; caracterizado por que dicha fase de tratamiento (11) de dicha al menos una imagen comprende una etapa de construcción de un mapa de normales, que representa normales de los puntos sobre al menos una zona de la imagen base, entregando dicha imagen de identificación, comprendiendo la etapa de construcción: - una etapa de identificación de una zona plana sobre dicha imagen base; - una etapa de determinación de una condición de iluminación a partir de una intensidad luminosa de un píxel o de un grupo de píxeles sobre la zona plana; - una etapa de cálculo de normales de dichos puntos de dicha al menos una zona según la condición de iluminación determinada.

Description

DESCRIPCIÓN
Procedimiento de reconocimiento de caracteres en relieve, producto programa de ordenador y dispositivo correspondientes
1. Campo
La presente técnica se refiere al reconocimiento óptico de caracteres (OCR: “Optical Character Recognition” en inglés). Más concretamente, la presente técnica concierne al reconocimiento óptico de caracteres en relieve. La presente técnica es de aplicación particular en la lectura de los caracteres en relieve sobre soportes físicos como, por ejemplo, una tarjeta bancaria.
2. Técnica anterior
El comercio electrónico se está haciendo cada vez más imprescindible en la vida cotidiana. Son conocidos varios modos de pago para efectuar las compras en línea, por ejemplo, mediante tarjeta bancaria, mediante un servicio intermediario tal como “Paypal” o mediante una transferencia bancaria. De entre los modos de pago conocidos, el más extendido y propuesto por casi todos los sitios de comercio en línea es el pago por tarjeta bancaria.
Cuando un usuario compra bienes con su tarjeta bancaria en un sitio Internet, es preciso suministrar la información de su tarjeta bancaria. La información puede comprender, por ejemplo, un número de la tarjeta (PAN “Primar/ Account Number’) de dieciséis dígitos, una fecha de expiración, un nombre del titular de la tarjeta y un código de verificación (CVC de MasterCard o CVV de tarjeta Visa). El usuario debe leer toda esta información e introducirla manualmente en una página Web con el fin de efectuar el pago en línea. La lectura visual y la introducción manual de la información son complejas y susceptibles de resultar afectadas por errores humanos que tendrían como consecuencia la pérdida en volumen de ventas.
Se ha propuesto implementar una técnica OCR convencional para leer la información pertinente sobre la tarjeta e introducirla automáticamente en la página Web, en lugar del usuario. La técnica OCR está adaptada para reconocer los textos estándar, que están impresos con tinta negra sobre un papel plano. Sin embargo, ésta encaja un clamoroso fracaso cuando se trata de la lectura de la información sobre una tarjeta bancaria. En efecto, la información sobre una tarjeta bancaria está en relieve (según la norma ISO/IEC 7812) con una estampación en caliente (“foil stamping" en inglés), con el fin de facilitar la lectura de los usuarios. Por consiguiente, el aspecto de las letras y de los dígitos en relieve es muy diferente de aquél de las letras y de los dígitos impresos con tinta negra sobre un papel plano y blanco. Así, la técnica OCR convencional, que está adaptada para reconocer impresos sobre un papel plano y blanco, no está en disposición de reconocer caracteres en relieve. Por otro lado, el fondo de una tarjeta bancaria muchas veces está coloreado y decorado profusamente. Además, con el tiempo y el uso, tiende a desaparecer la tinta que está estampada sobre los caracteres de la tarjeta bancaria. A partir de ese momento, es muy difícil distinguir cualquier carácter sobre la tarjeta. Esto plantea problemas suplementarios para la técnica OCR convencional.
La aplicación “card.io" propone una solución que implementa la técnica OCR convencional para reconocer los caracteres en relieve sobre una tarjeta bancaria a partir de una imagen capturada por una cámara. No obstante, a causa del problema relativo a los caracteres en relieve, esta solución precisa de unas condiciones específicas de iluminación, por ejemplo, la iluminación por la lámpara de destellos de una cámara de fotos o de un teléfono móvil. Esto disminuye rápidamente la carga de la batería de la cámara de fotos o del teléfono móvil. Además, en ocasiones, la aplicación ni siquiera logra un resultado fiable y/o un tiempo de respuesta aceptable. Un ejemplo, en la técnica anterior, es el documento JIANMEI LI ET AL: "Contrast enhancement for images of raised characters on region of interest", INTELLIGENT CONTROL AND AUTOMATION (WCICA), 2010 8TH WORLD CONGRESS ON, IEEE, PISCATAWAY, NJ, USA, 7 de julio de 2010 (2010-07-07), páginas 6258-6261, XP031736890, ISBN: 978-1-4244­ 6712-9.
Es, por tanto, necesario encontrar una solución que permita reconocer caracteres en relieve de manera rápida y fiable, sin dictar unas condiciones específicas de iluminación en la captura de la imagen de los caracteres en relieve.
3. Sumario
La técnica que se propone no presenta el problema del estado de la técnica. Más en particular, la técnica que se propone se refiere a un procedimiento de reconocimiento de caracteres, procedimiento puesto en práctica por mediación de un dispositivo electrónico, procedimiento del tipo que consiste en reconocer, en una imagen representativa de un objeto que comprende al menos un carácter en relieve, llamada imagen base, al menos un carácter en relieve de dicha imagen base.
Tal procedimiento comprende:
- una fase de tratamiento de al menos una imagen, comprendiendo dicha fase al menos una puesta en práctica de un modelo reflexivo de Phong y entregando al menos una imagen de identificación;
- una fase de identificación de caracteres en función de la imagen base y de dicha al menos una imagen de identificación.
De acuerdo con una característica particular, dicha fase de tratamiento de dicha al menos una imagen comprende una etapa de construcción de un mapa de normales, que representa normales de los puntos sobre al menos una zona de la imagen base, entregando dicha imagen de identificación.
A diferencia de una imagen base, el mapa de normales ya no comprende la información relativa a la luminancia y a los colores. Así, la identificación de los caracteres es más simple y fiable.
De acuerdo con una característica particular, dicha fase de tratamiento de dicha al menos una imagen comprende una etapa de generación, previa o a solicitud, mediante el modelo de Phong, de las imágenes modelo de caracteres en relieve según una pluralidad de condiciones de iluminación predeterminadas, que entrega una pluralidad de conjuntos de imágenes de referencia; y dicha fase de identificación comprende:
- una etapa de comparación de al menos ciertas porciones de la imagen base con al menos algunas de las imágenes de referencia, que entrega una lista de imágenes de referencia seleccionadas, llamada lista de imágenes de identificación, que se corresponden con los caracteres en la imagen base; y
- una etapa de reconocimiento de los caracteres de la imagen base de la tarjeta bancaria con el concurso de la lista de imágenes de identificación.
De acuerdo con una característica particular, los caracteres en relieve están sobre una tarjeta bancaria en dicha imagen base.
De este modo, los caracteres sobre la tarjeta bancaria pueden ser reconocidos mediante el procedimiento, sin precisar de una lectura visual y una introducción manual por parte de un usuario.
De acuerdo con una característica particular, el procedimiento comprende una fase de tratamiento preliminar de una imagen de la tarjeta bancaria capturada mediante una cámara, que entrega dicha imagen base.
De acuerdo con una característica particular, dicha fase de tratamiento preliminar comprende:
- detección de bordes de la tarjeta bancaria, entregando una imagen intermedia;
- selección de líneas en la imagen intermedia;
- cálculo de las intersecciones de las líneas, entregando cuatro esquinas de la tarjeta bancaria; y
- transformación de la imagen intermedia, de modo que las cuatro esquinas coincidan con cuatro esquinas de un rectángulo, entregando dicha imagen base.
De este modo, la fase de tratamiento preliminar permite mejorar la calidad de la imagen capturada. Los caracteres sobre la tarjeta bancaria en la imagen base son reconocidos con más facilidad.
De acuerdo con una característica particular, la etapa de construcción comprende:
- una etapa de identificación de una zona plana de dicha tarjeta bancaria sobre dicha imagen base;
- una etapa de determinación de una condición de iluminación a partir de una intensidad luminosa de un píxel o de un grupo de píxeles sobre la zona plana de la tarjeta bancaria;
- una etapa de cálculo de normales de dichos puntos de dicha al menos una zona según la condición de iluminación determinada.
De este modo, la condición de luces se determina con el concurso de una superficie plana de la tarjeta bancaria. El mapa de normales se puede determinar de manera simple y fiable.
De acuerdo con una característica particular, la etapa de determinación y la etapa de cálculo utilizan la siguiente ecuación según el modelo de iluminación de Phong:
Figure imgf000003_0001
en la que:
- ka e [0,1] es una constante relacionada con la componente ambiente;
- kd e [0,1] es una constante relacionada con la componente difusa;
- ks e [0,1] es una constante relacionada con la componente especular;
- a >> 1 es una constante relacionada con el brillo del material;
- m es el número de fuentes de luz;
- Ip representa una intensidad reflejada total en un punto dado;
- L es un vector director de la luz;
- Ñ es un vector director de la normal a la superficie;
- R es un vector director de la dirección en la que la luz se reflejaría en un espejo, R = 2(L • Ñ)Ñ - L.
De acuerdo con una característica particular, dicha etapa de cálculo comprende las siguientes etapas:
- identificación de un valor mínimo de los píxeles de dicha al menos una zona de dicha imagen base;
- deducción de dicho valor mínimo sobre los valores de los píxeles de dicha al menos una zona.
De este modo, se elimina la componente ambiente. El cálculo de las normales de los puntos de la zona objetivo se ve simplificado.
De acuerdo con una característica particular, dicha fase de identificación de dichos caracteres comprende:
- una etapa de recorte de dicho mapa de normales, que entrega una lista de secciones de dicho mapa de normales, correspondiéndose cada sección con un carácter en dicha al menos una zona;
- una etapa de construcción de una lista de vectores actuales a partir de dicha lista de secciones, representando cada vector actual una sección;
- una etapa de comparación de dichos vectores actuales con una lista de vectores modelo construida previamente a partir de las cartografías normales de los caracteres conocidos, correspondiéndose cada vector modelo con un carácter conocido;
- una etapa de determinación de una lista de caracteres actuales que se corresponde con dicha lista de vectores actuales.
La comparación de los vectores es más simple de realizar. Basta con calcular una distancia entre dos vectores. Así, se simplifica la fase de identificación de los caracteres.
De acuerdo con una característica particular, dichos caracteres conocidos comprenden letras mayúsculas A a Z del alfabeto latino y los diez dígitos árabes 0 a 9.
De este modo, la lista de los vectores modelo corresponde solamente a los caracteres frecuentes. No es necesario construir una gran lista de vectores modelo. La etapa de comparación también se ve simplificada, pues se reduce el número de vectores modelo.
De acuerdo con una característica particular, dichos vectores actuales y dichos vectores modelo son de m x n en dimensiones, teniendo cada uno de dichos mapas de normales de los caracteres conocidos un tamaño de m x n píxeles.
De acuerdo con una característica particular, dicha al menos una zona comprende una zona de un número de dicha tarjeta bancaria, y por que dicha lista de caracteres actuales comprende dicho número de dicha tarjeta bancaria. De acuerdo con una característica particular, dicho procedimiento comprende, además, una etapa de verificación de dicho número de dicha tarjeta bancaria según la fórmula de Luhn.
De este modo, es posible verificar la validez de los dígitos de un número de tarjeta bancaria determinada mediante el procedimiento.
De acuerdo con otro aspecto, la invención también se refiere a un dispositivo electrónico de reconocimiento de caracteres, dispositivo electrónico del tipo que comprende medios de reconocimiento, en una imagen representativa de un objeto que comprende al menos un carácter en relieve, llamada imagen base, de al menos un carácter en relieve de dicha imagen base.
Tal dispositivo comprende:
- medios de tratamiento de al menos una imagen, comprendiendo dicha fase al menos una puesta en práctica de un modelo reflexivo de Phong y entregando al menos una imagen de identificación;
- medios de identificación de caracteres en función de la imagen base y de dicha al menos una imagen de identificación.
De acuerdo con una implementación específica, las diferentes etapas de los procedimientos según la invención se llevan a la práctica mediante uno o varios equipos lógicos o programas de ordenador, que comprenden instrucciones lógicas destinadas a ser ejecutadas por un procesador de un dispositivo informático, tal como un terminal, según la invención y que está diseñado para regir la ejecución de las diferentes etapas de los procedimientos.
En consecuencia, la invención también está encaminada a un programa, susceptible de ser ejecutado por un ordenador o por un procesador de datos, incluyendo este programa instrucciones para regir la ejecución de las etapas de un procedimiento tal como se ha mencionado anteriormente.
Este programa puede utilizar cualquier lenguaje de programación y presentarse en forma de código fuente, código objeto, o de código intermedio entre código fuente y código objeto, tal como en una forma compilada parcialmente, o en cualquier otra forma deseable.
La invención también se encamina a un soporte de información legible por un procesador de datos y que incluye instrucciones de un programa tal y como se ha mencionado anteriormente.
El soporte de información puede ser cualquier entidad o dispositivo capaz de almacenar el programa. Por ejemplo, el soporte puede incluir un medio de almacenamiento, tal como una ROM, por ejemplo un CD-ROM o una r Om de circuito microelectrónico, o también un medio de registro magnético, por ejemplo un disquete (“floppy disc”) o un disco duro.
Por otra parte, el soporte de información puede ser un soporte transmisible, tal como una señal eléctrica u óptica, que se puede conducir a través de un cable eléctrico u óptico, por radio o por otros medios. El programa según la invención se puede descargar en particular por una red de tipo Internet.
Alternativamente, el soporte de información puede ser un circuito integrado en el que va incorporado el programa, estando adaptado el circuito para ejecutar o para ser utilizado en la ejecución del procedimiento en cuestión.
De acuerdo con una forma de realización, la invención se lleva a la práctica por medio de componentes de soporte lógico y/o de soporte físico. En esta línea, el término "módulo" puede corresponder, en este documento, tanto a un componente de soporte lógico, como a un componente de soporte físico o a un conjunto de componentes de soporte físico y lógico.
Un componente de soporte lógico corresponde a uno o varios programas de ordenador, uno o varios subprogramas de un programa o, de manera más general, a todo elemento de un programa o de un soporte lógico apto para llevar a la práctica una función o un conjunto de funciones, según lo descrito a continuación en relación con el módulo de que se trate. Tal componente de soporte lógico es ejecutado por un procesador de datos de una entidad física (terminal, servidor, pasarela, encaminador, etc.) y está posibilitado de acceso a los recursos de soporte físico de esta entidad física (memorias, soportes de grabación, buses de comunicación, tarjetas electrónicas de entrada/salida, interfaces de usuario, etc.).
De la misma manera, un componente de soporte físico corresponde a todo elemento de un conjunto de soporte físico (o hardware) apto para llevar a la práctica una función o un conjunto de funciones, según lo descrito a continuación en relación con el módulo de que se trate. Puede ser un componente de soporte físico programable o con procesador integrado para la ejecución de soporte lógico, por ejemplo un circuito integrado, una tarjeta inteligente, una tarjeta de memoria, una tarjeta electrónica para la ejecución de un microprograma (firmware), etc.
Por supuesto, cada componente del sistema anteriormente descrito pone en práctica sus propios módulos de lógica.
Las diferentes formas de realización antes mencionadas, así como las características de que constan son combinables entre sí para la puesta en práctica de la invención. Por ejemplo, la presente técnica puede ser llevada a la práctica por igual en todo tipo de soporte que comprenda caracteres repujados, y no queda limitada en modo alguno a la tarjeta bancaria.
4. Figuras
Otras características y ventajas se pondrán más claramente de manifiesto con la lectura de la siguiente descripción de una forma particular de realización de la divulgación, dada a título de mero ejemplo ilustrativo y no limitativo, y de los dibujos que se acompañan, de los cuales:
- la figura 1 ilustra las fases del procedimiento de reconocimiento de caracteres en relieve según la técnica que se propone;
- la figura 2 ilustra las etapas de una fase de tratamiento preliminar de una imagen de la tarjeta bancaria capturada mediante una cámara;
- la figura 3 ilustra el cambio de la imagen de la tarjeta bancaria capturada en la fase de tratamiento preliminar; - la figura 4 ilustra el aspecto de los caracteres en relieve sobre una tarjeta bancaria calculado según las condiciones de luz conocidas;
- la figura 5 ilustra una superficie plana y una zona de texto en relieve sobre una tarjeta bancaria estándar;
- la figura 6 ilustra
Figure imgf000006_0001
las etapas de la fase de construcción de un mapa de normales;
- la figura 7 ilustra
Figure imgf000006_0002
las etapas de la fase de identificación de los caracteres;
- la figura 8 ilustra
Figure imgf000006_0003
seis imágenes del dígito “0” en relieve restauradas según seis condiciones de luz diferentes; y
- la figura 9 ilustra una estructura simplificada de un dispositivo de reconocimiento de caracteres en relieve según la técnica que se propone.
5. Descripción detallada
5.1. Principio general
Como se ha hecho explícito anteriormente, los equipos lógicos de reconocimiento de caracteres tienen muchas dificultades para reconocer los caracteres impresos en relieve, ya sea sobre las tarjetas bancarias, o bien sobre otros soportes (panel de señalización, letreros, etc.). De una manera general, el tratamiento informatizado de una imagen para reconocer en ella una forma o caracteres plantea problemas en cuanto las condiciones de iluminación son inadecuadas. La presente técnica, por el contrario, permite tomar ventaja ingeniosamente de las condiciones de iluminación para facilitar el reconocimiento de caracteres impresos en relieve (caracteres alfabéticos, numéricos o también caracteres en braille). En lo que sigue, nos centramos esencialmente en describir un proceso de reconocimiento sobre tarjeta bancaria, pero se da por supuesto que la presente técnica puede aplicarse en otros numerosos campos, y especialmente el reconocimiento de caracteres en braille.
El principio general reside en un método de construcción basado especialmente en el modelo reflexivo de Phong. Este método se lleva a la práctica para permitir el reconocimiento de los caracteres en relieve. Más en particular, en una primera forma de realización, el método de construcción se aplica en una imagen base que comprende caracteres que han de reconocerse, y permite construir una imagen derivada (denominada mapa de normales) que comprende los caracteres que han de reconocerse en una forma reconocible con más facilidad (es decir, la imagen ya no está en relieve). En una segunda forma de realización, se aplica un método de construcción sobre una serie de caracteres, en función de unas condiciones de iluminación determinadas, con el fin de producir imágenes de referencia de los caracteres (imágenes de síntesis) en relieve, utilizándose a continuación las imágenes de referencia para identificar caracteres que han de reconocerse en una imagen base.
La utilización de una y/u otra de estas formas de realización (o de ciertas características de estas formas de realización) para efectuar el reconocimiento está posibilitada por varios factores. Uno de estos factores radica en el conocimiento, a priori, del espesor de los caracteres en relieve (o repujados) que han de reconocerse. Bien sea para los caracteres de las tarjetas bancarias, o también para los caracteres o las palabras en braille, hay normas que dictan un espesor de estos caracteres. Para la tarjeta bancaria, este espesor normalizado del repujado permite asegurar la inserción de la tarjeta en los lectores de tarjetas, por ejemplo: cada carácter repujado tiene, pues, un máximo espesor constante y conocido. Por otro lado, otro factor conocido es la planitud de la superficie que se sitúa fuera de los caracteres (por ejemplo, la superficie de una tarjeta bancaria es plana, como también la superficie de un texto en braille). Como se describe en lo sucesivo, estos dos factores permiten determinar un mapa de normales (o de altitud), que se utiliza a continuación para reconocer con más facilidad los caracteres.
De este modo, en una primera forma de realización, se efectúa una construcción de un mapa de normales (“normal map" en inglés) que representa normales de los puntos sobre una zona objetivo que comprende caracteres en relieve en una imagen base. Un punto en una imagen corresponde a un píxel de la imagen. Cada píxel del mapa de normales es, en realidad, un vector que suministra la información de elevación y de inclinación de su superficie, es decir, de la superficie del téxel sobre el que se aplicará el mapa de normales. Los caracteres en la zona objetivo pueden ser identificados a partir del mapa de normales (o de altitud). En efecto, el mapa de normales permite caracterizar las formas de los caracteres en relieve sobre una zona objetivo. La identificación de los caracteres a partir de las formas de los caracteres en relieve es más fácil y rápida, ya que un mapa de normales (a diferencia de una imagen base) ya no comprende la información relativa a la luminancia y a los colores. Así, los caracteres identificados mediante el procedimiento según la técnica que se propone son más fiables. En la solución del estado de la técnica, la identificación de los caracteres se realiza a partir de una imagen (fotografía) sobre la cual se capturan caracteres en relieve (sobre una tarjeta bancaria, por ejemplo). La información relativa a la luminancia y a los colores de la imagen complica y ralentiza el proceso de identificación y hace poco fiable el resultado.
La imagen base puede ser una fotografía de un objeto (un soporte físico) que comprende caracteres en relieve. La fotografía puede ser capturada mediante cualquier dispositivo (p. ej., una cámara de fotos, un teléfono inteligente, una tableta tal como un iPad®, etc.) que comprende una cámara. De acuerdo con otra forma de realización, esta imagen base puede resultar de una fase de tratamiento preliminar de una fotografía capturada. Este tratamiento preliminar comprende todo tipo de operaciones para retocar la fotografía (el recorte, la rotación, el ajuste de parámetros, la deformación, etc.) y entrega una imagen base. Así, la fase de construcción se puede realizar a partir de una imagen más fiable y adaptada para el reconocimiento óptico.
De una manera general, como se ilustra en relación con la figura 1, cualquiera que sea la forma de realización adoptada para efectuar el reconocimiento de los caracteres, se propone un procedimiento de reconocimiento de caracteres en relieve en una imagen base, que comprende:
- una fase de tratamiento preliminar 10 de una imagen (P1) de un objeto que comprende caracteres en relieve: esta fase de tratamiento preliminar transforma la imagen (P1) en un formato estándar y operable, llamado imagen base (P2). Este tratamiento permite mejorar la precisión y la fiabilidad del procedimiento en su conjunto; esta fase de tratamiento preliminar puede ser opcional, en particular cuando la calidad de la imagen capturada es satisfactoria; - una fase de tratamiento 11 de al menos una imagen, que comprende una puesta en práctica de un modelo reflexivo de Phong;
- una fase de identificación de caracteres 12 en función de la imagen base y de la fase de tratamiento realizada anteriormente.
Cuando el modelo de Phong trata la imagen base, tal como se ha reseñado en la primera forma de realización anterior, la fase de tratamiento 11 se lleva a la práctica para tratar la imagen base (P2) y comprende:
- una etapa de construcción 11-1 de un mapa de normales, que representa direcciones normales de los puntos sobre al menos una zona de la imagen base; el mapa de normales caracteriza la forma de una zona objetivo de la imagen; el mapa de normales no comprende la información de la luminancia y de los colores de la imagen base; para los requerimientos de la presente, el mapa de normales se denomina asimismo imagen de identificación;
y la fase de identificación 12 comprende:
- una etapa de búsqueda 12-1 de los caracteres en al menos una zona de dicha imagen de identificación (el mapa de normales); en esta fase, los caracteres son identificados según la forma caracterizada por el mapa de normales de la zona objetivo; en el caso en que los caracteres se hallan sobre una tarjeta bancaria, esta fase de identificación puede tener en cuenta especificaciones conocidas (por ejemplo: ISO/IEC 7810 ID-1) de la tarjeta bancaria (el tamaño de la tarjeta, las ubicaciones de las zonas de caracteres en relieve, el tipo de letra de los caracteres, etc.).
Cuando el modelo de Phong trata imágenes de referencia, tal como se ha reseñado en la segunda forma de realización anterior, la fase de tratamiento 11 comprende:
- la generación, mediante el modelo de Phong, de las imágenes de referencia de caracteres en relieve según unas condiciones de iluminación diferentes; la selección de imágenes de referencia, entregando imágenes de identificación; también se señala que las imágenes de referencia (de síntesis) pueden ser generadas sobre la marcha si el dispositivo que pone en práctica el procedimiento posee suficientes capacidades de cálculo (en vez de ser generadas previamente en unas condiciones dadas);
y la fase de identificación 12 comprende:
- la comparación de al menos ciertas porciones de la imagen base de la tarjeta bancaria con al menos algunas de las imágenes de identificación, entregando una lista de imágenes de identificación seleccionadas que se corresponden con los caracteres en la imagen base; y la determinación de los caracteres en la imagen base de la tarjeta bancaria con el concurso de la lista de las imágenes de identificación.
Pasamos seguidamente a describir en detalle las tres fases del procedimiento según la técnica que se propone. Se asume que la imagen capturada es una fotografía de una tarjeta bancaria que comprende caracteres en relieve (por ejemplo, un número PAN, una fecha de expiración y/o un nombre del titular).
5.2. Primera forma de realización: construcción del mapa de normales
5.2.1. Fase de tratamiento preliminar
El tratamiento preliminar de la imagen de la tarjeta bancaria comprende las operaciones descritas a continuación en relación con las figuras 2 y 3:
- una etapa de detección 101 de los bordes de la tarjeta bancaria; esta etapa se puede realizar de diferentes maneras, por ejemplo, una operación de difuminación gaussiana (“Gaussian Bluf’ en inglés) seguida de un filtrado de Canny (detector de Canny) para detectar contornos; los parámetros de la operación de difuminación gaussiana y del filtro de Canny están configurados para reducir el ruido de la imagen en función de la calidad de la imagen; esta etapa entrega una imagen intermedia P1';
- una etapa de selección de líneas 102 en la imagen intermedia P1'; esta etapa localiza las líneas principales en P1 y selecciona las líneas más “espesas” sin incluir polígonos ya identificados; se puede realizar utilizando la transformada de Hough;
- una etapa de cálculo 103 de las intersecciones de las líneas seleccionadas anteriormente, entregando cuatro esquinas (C1, C2, C3, C4) de la tarjeta bancaria;
- una etapa de transformación 104 de la imagen intermedia P1', de modo que las cuatro esquinas (C1, C2, C3, C4) coincidan con cuatro esquinas de un rectángulo, entregando una imagen base P2; esta transformación implementa una función homográfica inversa;
el tratamiento preliminar antes descrito se puede realizar, por ejemplo, utilizando la librería “OpenCV”.
Interesa señalar que la fase de tratamiento preliminar no siempre es necesaria. En efecto, cuando la imagen capturada es de buena calidad (la tarjeta bancaria es sensiblemente en forma rectangular), es posible ejecutar directamente la fase de construcción del mapa de normales a partir de esta imagen capturada.
5.2.2. Fase de construcción del mapa de normales
5.2.2.1. Modelo de iluminación de Phong
La fase de construcción se fundamenta en el modelo de iluminación de Phong. La iluminación de Phong es un modelo local, es decir, el cálculo se lleva a cabo en cada punto (píxel) de una imagen. Este modelo empírico permite calcular de manera fidedigna la luz reflejada por un punto estudiado. Para ello, combina tres elementos: la luz ambiental, la luz difusa y la luz especular. El objetivo es calcular la intensidad luminosa que va a ser emitida por reflexión por el punto estudiado, iluminado por una fuente supuesta puntual, en una dirección precisa (la del observador). Para ello, la luz es separada en tres componentes:
- la componente ambiente representa los parásitos provenientes de algo distinto a la fuente de interés, por ejemplo, la luz reflejada por otros puntos; la luz ambiental se supone igual en cualquier punto del espacio;
- la luz incidente es reflejada en todas las direcciones; la componente difusa indica la intensidad que regresa teniendo en cuenta la inclinación con la que la luz llega a la superficie, pero suponiendo que la intensidad es la misma, cualquiera que sea la dirección que toma el rayo reflejado;
- pese a todo, hay más luz devuelta en la dirección de la reflexión geométrica (aquella en la que regresaría el rayo al incidir en un espejo); el cometido de la componente especular es tenerla en cuenta.
Se definen para cada material unas constantes características:
- ka e [0,1] es una constante relacionada con la componente ambiente;
- kd e [0,1] es una constante relacionada con la componente difusa en todas las direcciones;
- ks e [0,1] es una constante relacionada con la componente especular;
- a >> 1 es una constante relacionada con el brillo del material: a mayor a, más brillante es la superficie.
Denominamos por ia, id e is la intensidad de las luces incidentes ambiental, difusa y especular. Ia, Id e Is son las intensidades reflejadas de un punto (píxel) estudiado de una imagen. Ip es el total de las intensidades reflejadas de este punto (píxel) estudiado.
Se definen los siguientes vectores directores: L para la luz, Ñ para la normal del punto estudiado a la superficie, R para la dirección en la que se reflejaría la luz en un espejo, V para la dirección de vista del observador.
R se deduce mediante la siguiente relación:
R = 2 ( Ñ - Í ) Ñ - L (1)
El total de las intensidades reflejadas de un punto estudiado se representa mediante la ecuación que sigue:
I p = ¡a ¡d 4 (2)
en la que:
Ia = (3)
Id = id -kd(L-Ñ) (4)
4 = isks(R* V)a (5)
Para varias fuentes luminosas, se obtiene como fórmula completa:
Figure imgf000009_0001
Por simplicidad, se supone que hay una sola fuente de luz. Se obtiene de este modo una ecuación simplificada del total de las densidades reflejadas de un punto estudiado:
IP = iaka idk d ( Í * Ñ ) isks(R*V )a (6)
Utilizando la ecuación (5) ó (6), es posible prever el aspecto (las intensidades reflejadas de los puntos en forma de una imagen) de los caracteres en relieve según una condición dada de luz (la forma y el material de los caracteres en relieve son conocidos con anterioridad).
La figura 4 es una imagen del aspecto de los caracteres “0” sobre una tarjeta bancaria según una condición dada de luz. Esta imagen está calculada utilizando la ecuación (5). En efecto, la forma de la tarjeta bancaria y la forma de los caracteres sobre la tarjeta bancaria cumplen las normas conocidas (cf. ISO/IEC 7812). Así, se conoce La normal Ñ de cada punto de la tarjeta bancaria. Son conocidas, asimismo, las constancias características ka, kd, ks y a del material de la tarjeta bancaria. Los parámetros ia , id, is y £, V, R vienen dados según las condiciones de iluminación. De este modo, se puede calcular el total de las densidades reflejadas Ip de cada punto sobre la tarjeta bancaria. Se obtiene, de este modo, la imagen de la figura 5, que reúne todos los puntos de la tarjeta bancaria.
El cálculo de esta imagen se puede realizar de maneras diversas. El cálculo de esta imagen se puede realizar, por ejemplo, utilizando librerías existentes, tal como “OpenGL".
5.2.2.2. Fase de construcción de un mapa de normales
A continuación se detalla, en relación con las figuras 5 y 6, la fase de construcción de un mapa de normales.
El principio general de esta fase de construcción consiste en calcular la normal Ñ de un punto estudiado utilizando la ecuación (5) ó (6). En efecto, una vez que se captura una imagen de caracteres en relieve sobre una tarjeta bancaria, se conoce el valor Ip de cada punto (píxel) de la imagen. Son conocidas, asimismo, las constancias características ka , kd , ks y a del material de la tarjeta bancaria (ya que se conoce el material de la tarjeta). Las condiciones de iluminación se pueden deducir utilizando el valor Ip de un punto sobre una superficie plana de la imagen de la tarjeta bancaria. La figura 6 ilustra una zona que tiene una superficie plana SP y una zona de caracteres en relieve CR sobre una imagen de una tarjeta bancaria CB. Las ubicaciones de la zona que tiene una superficie plana y de la zona de caracteres en relieve son conocidas, ya que, en términos generales, se cumplen las normas de las tarjetas bancarias. De este modo, es posible identificar 111 la zona que tiene una superficie plana SP sobre una imagen de una tarjeta bancaria CB.
Todos los puntos sobre la superficie plana SP tienen una normal Ñ conocida que es perpendicular a la superficie SP. Así, se pueden determinar 111 las condiciones de iluminación (incluyendo, en particular, el vector director L) implementando el modelo de iluminación de Phong (la ecuación (5) ó (6)) en un punto sobre la superficie plana SP (la normal Ñ del punto es conocida).
Cuando se analiza un punto en la zona de los caracteres en relieve CR, la componente ambiente iaka puede ser eliminada sustrayendo el valor mínimo de intensidad luminosa a los puntos sobre la tarjeta bancaria. Así, si se toma la ecuación (6) al principio, se obtiene:
IP - iaka = idkd( l * Ñ) isks(R * V) a) (7)
La parte a la derecha de la ecuación comprende la componente difusa idkd( í * Ñ ) y la componente especular ( isks(R * P )“ ). Estas dos componentes únicamente dependen de la normal Ñ (los demás parámetros son conocidos). La normal Ñ, que mejor se corresponde con la intensidad luminosa de cada punto en la zona de los caracteres en relieve de la tarjeta bancaria, se puede calcular 112 utilizando técnicas de minimización estándar. El vector director de la normal Ñ de cada punto en la zona de los caracteres en relieve se puede registrar en un mapa de normales P3 (o de altitudes).
De acuerdo con otra forma de realización, el mapa de normales (o de altitudes) puede abarcar toda la superficie de la tarjeta bancaria (no únicamente sobre la zona de los caracteres en relieve). Este mapa de normales (o de altitudes) caracteriza la forma de la superficie de la tarjeta bancaria que comprende caracteres en relieve. Así, los caracteres pueden ser identificados a partir de este mapa de normales P3 (o de altitudes) en la fase de identificación descrita en la sección subsiguiente.
5.2.3. Fase de identificación de los caracteres
Como anteriormente se ha explicado, el mapa de normales (o de altitudes) caracteriza la forma de los caracteres en relieve sobre la tarjeta bancaria. Así, es posible reconocer los caracteres utilizando algoritmos OCR conocidos que permiten identificar caracteres a partir de un mapa de normales (o de altitudes).
De acuerdo con una forma de realización de la técnica que se propone, la fase de identificación de los caracteres se realiza utilizando un algoritmo que exige menos recursos computacionales. De acuerdo con este algoritmo, la fase de identificación de los caracteres comprende las siguientes etapas (ilustrado en relación con la figura 7):
- seleccionar 121 una zona de los caracteres en relieve de la tarjeta bancaria en el mapa de normales (o de altitudes), cuando el mapa de normales abarca toda la superficie de la tarjeta bancaria; esta etapa puede tener en cuenta una geometría estándar, conocida, de la tarjeta bancaria; si el mapa de normales se genera para una zona de los caracteres en relieve, podría omitirse esta etapa de selección;
- recortar 122 dicho mapa de normales, entregando una lista de secciones de dicho mapa de normales, correspondiéndose cada sección con un carácter en la zona de los caracteres; en efecto, la ubicación de los caracteres sobre la tarjeta bancaria es conocida según las normas de las tarjetas bancarias: así, es posible recortar el mapa de normales según las especificaciones de la norma de las tarjetas bancarias; adicionalmente, entre dos caracteres adyacentes en relieve, normalmente hay una superficie plana de anchura predeterminada: esta superficie de anchura predeterminada se puede utilizar igualmente para recortar los caracteres en relieve; cada sección puede tener un tamaño de n píxeles de ancho y m píxeles de alto; de acuerdo con una forma particular de realización, cada sección es de forma cuadrada con un tamaño de n píxeles de ancho y n píxeles de alto;
- construcción 123 de una lista de vectores actuales a partir de dicha lista de secciones, correspondiéndose cada vector actual con una sección; así, cada vector es de n x m dimensiones o de n2 dimensiones, cuando las secciones son de forma cuadrada;
- comparación 124 de dichos vectores actuales con una lista de vectores modelo construida previamente a partir de mapas de normales de caracteres en relieve conocidos, correspondiéndose cada vector modelo con un carácter en relieve conocido; los vectores corrientes y los vectores modelo son de iguales dimensiones n x m o n x n. Los vectores modelo se corresponden con los mapas de normales de los caracteres en relieve sobre una tarjeta bancaria estándar; los caracteres comprenden generalmente las letras mayúsculas A-Z, los dígitos 0-9; así, una lista esencial puede comprender los vectores modelo de los caracteres antes descritos; esta lista esencial de vectores modelo se puede presentar como {V0, V1, ..., V9, VA, ..., VZ}; la lista puede comprender, asimismo, los vectores modelo de los signos de puntuación (“.”, “,”, etc.) y/o las letras minúsculas a-z; cada vector actual puede compararse con todos los vectores en la lista de vectores modelo, con el fin de determinar el vector modelo más próximo al vector actual (que tiene una distancia mínima con el vector actual); interesa señalar que la lista de los vectores modelo puede construirse previamente y almacenarse en una memoria, y que la comparación puede efectuarse sobre los diferentes modelos en paralelo e independientemente para cada modelo;
- determinación 125 de una lista de caracteres actuales correspondiente a dicha lista de vectores actuales; el carácter representado por el vector modelo más próximo a un vector actual puede considerarse como el carácter representado por el vector actual: se obtiene, de este modo, una lista de caracteres representados por los vectores actuales.
Los caracteres identificados pueden ser utilizados en lo sucesivo para rellenar automáticamente zonas de introducción de datos de un formulario presentado en una pantalla; esta manera de operar permite al usuario verificar que la fase de reconocimiento se ha desarrollado correctamente. Los caracteres reconocidos pueden ser utilizados en diversas aplicaciones, como, por ejemplo, el pago en línea. En este caso, se pueden emprender otras operaciones con posterioridad al reconocimiento de los caracteres, con el fin de asegurarse de que los datos reconocidos son correctos.
Así, por ejemplo, los caracteres en relieve exhibidos en una tarjeta bancaria suelen comprender un número de la tarjeta (p. ej., número PAN “Primar/ Account Number’ en inglés) cuya validez aparente puede verificarse, mediante la fórmula de Luhn, que se conoce asimismo por ser el algoritmo “módulo 10”. Se trata de una fórmula de suma de comprobación (Checksum) utilizada para validar los números de las tarjetas bancarias. De este modo, la fase de identificación de los caracteres del número de tarjeta bancaria puede comprender una etapa de verificación del número de la tarjeta bancaria con el concurso de este algoritmo “módulo 10”. Si el número detectado no es válido, se puede ejecutar una nueva etapa de comparación. En esta nueva etapa de comparación, se identifica, para cada vector actual, un vector modelo que es, por ejemplo, el segundo más próximo al vector actual (el vector modelo cuya distancia es la segunda más pequeña con el vector actual). Mediante los vectores modelo identificados, se selecciona aquél cuya distancia es la más pequeña con su correspondiente vector actual. El dígito representado por el vector modelo seleccionado sustituye al dígito correspondiente en el número no válido de la tarjeta bancaria.
De acuerdo con otra forma de realización de la técnica que se propone, en la etapa de comparación, cada vector actual se compara con todos los vectores en la lista de vectores modelo. Se pueden seleccionar los dos o tres primeros vectores modelo que son más próximos al vector actual (que tienen las distancias más pequeñas con el vector actual). De este modo, se obtienen dos o tres vectores modelo para cada vector actual. Dicho de otro modo, cada vector actual puede presentar probablemente uno de los dos o tres dígitos representados por los dos o tres vectores modelo. En la etapa de determinación, los dígitos de un número de la tarjeta bancaria se determinan según dos criterios:
- el número es válido según la fórmula de Luhn; y
- los vectores modelo que representan los dígitos del número tienen una distancia total mínima.
Así, se ve mejorada la fiabilidad del procedimiento.
5.3. Segunda forma de realización: generación de imágenes de referencia (de síntesis) y reconocimiento de los caracteres en relieve
Las anteriores secciones describen la construcción de un mapa de normales y la identificación de los caracteres en relieve a partir del mapa de normales.
En otra forma de realización de la técnica que se propone, no es necesario reconstruir el mapa de normales. Los caracteres en relieve sobre la imagen base pueden identificarse según un procedimiento de reconocimiento de los caracteres en relieve específico. En esta forma de realización, se utilizan modelos de caracteres, previamente iluminados, según unas condiciones de iluminación predeterminadas (por ejemplo, una cuarentena de condiciones de iluminación). Se dispone, pues, para cada carácter, de una serie de imágenes modelo de ese carácter, correspondiéndose cada imagen modelo con una condición de iluminación particular. Estas imágenes modelo se denominan imágenes de referencia (IRxx). La figura 7 ilustra seis imágenes de referencia del dígito “0” (IR0) en relieve restauradas según unas condiciones de iluminación diferentes. En efecto, las imágenes de referencia son restauradas según el modelo de iluminación de Phong anteriormente descrito, ya que las formas de los caracteres en relieve sobre una tarjeta bancaria son conocidas (las normales N son conocidas). De este modo, un carácter en relieve puede corresponderse con una pluralidad de imágenes de referencia según diferentes condiciones de iluminación. Las imágenes de los caracteres (0-9, A-Z, a-z, y caracteres especiales) restauradas según una condición de iluminación dada constituyen un conjunto de imágenes de referencia (EIRxx). Por ejemplo, es posible generar cuarenta conjuntos de imágenes de referencia, según cuarenta condiciones de iluminación de referencia, y ello para cada carácter (0-9, A-Z, a-z, y caracteres especiales). Estos conjuntos de imágenes de referencia se guardan a continuación en una memoria, de donde podrán ser leídos o descargados u obtenidos de cualquier manera, con el fin de ser comparados con caracteres de la imagen base, según el procedimiento descrito en lo sucesivo.
Este procedimiento de reconocimiento comprende las siguientes etapas:
- obtención de las imágenes de referencia de caracteres en relieve según diferentes condiciones de iluminación; los caracteres pueden comprender los dígitos 0-9, las letras mayúsculas A-Z, las letras minúsculas a-z y/o caracteres especiales; en función de lo que se desee reconocer; la obtención de estas imágenes de referencia puede comprender la lectura de las mismas de una memoria predeterminada, o bien la descarga de las mismas a través de una red de comunicación, en función de las formas de realización;
- comparación de al menos ciertas porciones de la imagen base de la tarjeta bancaria con al menos algunas de las imágenes de referencia de los caracteres según al menos una condición de iluminación, entregando una lista de imágenes de referencia seleccionadas: las imágenes de referencia seleccionadas pertenecen (idóneamente) a un mismo conjunto de imágenes de referencia según una condición de iluminación idéntica; adicionalmente, se supone que se corresponden lo mejor posible con las imágenes base de los caracteres; las imágenes de referencia seleccionadas se denominan imágenes de identificación y constituyen un subconjunto de los conjuntos de imágenes de referencia;
- una etapa de determinación de los caracteres actuales en la imagen base de la tarjeta bancaria con el concurso de la lista de las imágenes de identificación.
De acuerdo con una forma particular de realización, el procedimiento puede comprender, con posterioridad a la etapa de obtención, una etapa de determinación de una condición de iluminación de la imagen base de la tarjeta bancaria. Un ejemplo de determinación de una condición de iluminación con el concurso de una superficie plana de la tarjeta bancaria se encuentra descrito en detalle más arriba.
Una vez que se determina la condición de iluminación de la imagen base, el procedimiento comprende una etapa de filtrado de los conjuntos de imágenes de referencia, con el fin de seleccionar tan sólo, de entre los conjuntos de imágenes de referencia existentes, un número reducido de conjuntos, correspondientes a las condiciones de iluminación de la imagen base. Lo ideal sería seleccionar un solo conjunto de imágenes de referencia, que constituye el conjunto de imágenes de identificación. En este caso, un carácter reconocido sobre la tarjeta bancaria se corresponde con una sola imagen de identificación del conjunto de imágenes de identificación: así, la lista de imágenes de identificación se constituye a partir de un único conjunto de imágenes de referencia. La etapa de determinación de los caracteres se ve facilitada, ya que se reduce ampliamente el número de las imágenes de identificación (hay un solo conjunto de imágenes de identificación).
Como complemento, también se puede utilizar la fórmula de Luhn para verificar la validez del número de la tarjeta bancaria. En efecto, los caracteres en relieve sobre la tarjeta bancaria necesariamente comprenden los dígitos de un número de la tarjeta bancaria.
También se señala que las imágenes de referencia (de síntesis) pueden ser generadas sobre la marcha si el aparato (en el que se pone en práctica el reconocimiento) posee suficientes capacidades de cálculo. Un interés de esta variante está en que ofrece un compromiso entre las capacidades de almacenamiento (ya no hay necesidad de almacenar de antemano N modelos, siendo N potencialmente muy grande) y cálculo (en adelante, hay que calcular las imágenes que se necesitan). El otro interés de esta variante está en que se pueden determinar de manera más fina las condiciones de iluminación, mediante un método de optimización tal como Esperanza-Maximización. Concretamente: el algoritmo minimiza, por turno, el error en la iluminación (medido comparando con la zona no repujada de la tarjeta) y el error en la lectura de caracteres (medido comparando la imagen de referencia y la zona repujada, eventualmente con penalización si el código Luhn es incorrecto).
5.4. Dispositivo de reconocimiento de caracteres en relieve
En relación con la figura 9, se presenta una estructura simplificada de un dispositivo de reconocimiento de caracteres en relieve que pone en práctica el procedimiento según una forma de realización de la técnica que se propone. Sólo están ilustrados los elementos principales relativos a la puesta en práctica del procedimiento.
El dispositivo comprende una memoria M que comprende una memoria intermedia, una unidad de proceso P equipada, por ejemplo, con un microprocesador y pilotada por una aplicación o un programa de ordenador Mp que pone en práctica el procedimiento de reconocimiento de caracteres en relieve según una forma de realización de la técnica que se propone.
Con la inicialización, las instrucciones de código del programa de ordenador Mp se cargan, por ejemplo, en una memoria RAM, antes de ser ejecutadas por el procesador de la unidad de proceso P. La unidad de proceso P recibe como entrada una señal emitida por un emisor. El microprocesador de la unidad de proceso P pone en práctica el procedimiento de reconocimiento de caracteres en relieve, según las instrucciones del programa de ordenador Mp.
Preferentemente, el dispositivo comprende una cámara que permite capturar una imagen de un objeto (por ejemplo, una tarjeta bancaria) que comprende caracteres en relieve. La unidad de proceso del dispositivo puede, en lo sucesivo, ejecutar las instrucciones del programa de ordenador para poner en práctica el procedimiento de reconocimiento de los caracteres. El dispositivo (con cámara o sin ella) puede comprender un módulo de comunicación por cable (USB, Ethernet, etc.) o inalámbrico (Wifi, Bluetooth®, etc.) para recibir una imagen de una tarjeta bancaria con origen en otro dispositivo electrónico (una cámara, un ordenador, un servidor, etc.).
Como es lógico, los ejemplos de realización anteriormente expuestos no son más que a título indicativo. Un experto en la materia está en condiciones de comprender las ventajas que brinda la presente técnica y, especialmente, las ventajas que brinda el procedimiento de reconocimiento de caracteres en relieve. Resulta obvio que tal procedimiento puede ser utilizado en otros contextos sin salir del ámbito de la presente técnica.

Claims (12)

REIVINDICACIONES
1. Procedimiento de reconocimiento de caracteres, puesto en práctica por mediación de un dispositivo electrónico, que incluye una etapa de reconocimiento, en una imagen representativa de un objeto que comprende al menos un carácter en relieve, llamada imagen base, de al menos un carácter en relieve de dicha imagen base, comprendiendo el procedimiento:
- una fase de tratamiento (11) de al menos una imagen, comprendiendo dicha fase al menos una puesta en práctica de un modelo reflexivo de Phong y entregando al menos una imagen de identificación (P3, IRx);
- una fase de identificación de caracteres (12) en función de la imagen base y de dicha al menos una imagen de identificación, que comprende una etapa de reconocimiento de los caracteres de la imagen base con el concurso de dicha al menos una imagen de identificación; caracterizado por que dicha fase de tratamiento (11) de dicha al menos una imagen comprende una etapa de construcción de un mapa de normales, que representa normales de los puntos sobre al menos una zona de la imagen base, entregando dicha imagen de identificación, comprendiendo la etapa de construcción:
- una etapa de identificación de una zona plana sobre dicha imagen base;
- una etapa de determinación de una condición de iluminación a partir de una intensidad luminosa de un píxel o de un grupo de píxeles sobre la zona plana;
- una etapa de cálculo de normales de dichos puntos de dicha al menos una zona según la condición de iluminación determinada.
2. Procedimiento según la reivindicación 1, caracterizado por que dicha fase de tratamiento (11) de dicha al menos una imagen comprende una etapa de generación, previa o a solicitud, mediante el modelo de Phong, de las imágenes modelo de caracteres en relieve según una pluralidad de condiciones de iluminación predeterminadas, que entrega una pluralidad de conjuntos de imágenes de referencia;
y por que dicha fase de identificación (12) comprende:
- una etapa de comparación de al menos ciertas porciones de la imagen base con al menos algunas de las imágenes de referencia, que entrega una lista de imágenes de referencia seleccionadas, llamada lista de imágenes de identificación, que se corresponden con los caracteres en la imagen base; y
- una etapa de reconocimiento de los caracteres de la imagen base con el concurso de la lista de imágenes de identificación.
3. Procedimiento según la reivindicación 1, caracterizado por que los caracteres en relieve están situados sobre una tarjeta bancaria en dicha imagen base.
4. Procedimiento según la reivindicación 3, caracterizado por comprender una fase de tratamiento preliminar de una imagen de la tarjeta bancaria capturada mediante una cámara, que entrega dicha imagen base.
5. Procedimiento según la reivindicación 4, caracterizado por que dicha fase de tratamiento preliminar comprende las siguientes etapas:
- detección de bordes de la tarjeta bancaria, entregando una imagen intermedia P1';
- selección de líneas en la imagen intermedia P1';
- cálculo de las intersecciones de las líneas, entregando cuatro esquinas (C1, C2, C3, C4) de la tarjeta bancaria; y - transformación de la imagen intermedia P1', de modo que las cuatro esquinas (C1, C2, C3, C4) coincidan con cuatro esquinas de un rectángulo, entregando dicha imagen base.
6. Procedimiento según la reivindicación 5, caracterizado por que la etapa de determinación y la etapa de cálculo utilizan la ecuación que sigue según el modelo de iluminación de Phong:
Figure imgf000013_0001
en la que:
ka e [0,1] es una constante relacionada con la componente ambiente;
kd e [0,1] es una constante relacionada con la componente difusa;
ks e [0,1] es una constante relacionada con la componente especular;
- a >> 1 es una constante relacionada con el brillo del material;
- m es el número de fuentes de luz;
- Ip representa una intensidad reflejada total en un punto dado;
- L es un vector director de la luz;
- Ñ es un vector director de la normal a la superficie;
- R es un vector director de la dirección en la que la luz se reflejaría en un espejo, R = 2(L • Ñ)Ñ - L.
7. Procedimiento según la reivindicación 1, caracterizado por que dicha fase de identificación de dichos caracteres comprende:
- una etapa de recorte de dicho mapa de normales, que entrega una lista de secciones de dicho mapa de normales, correspondiéndose cada sección con un carácter en dicha al menos una zona;
- una etapa de construcción de una lista de vectores actuales a partir de dicha lista de secciones, representando cada vector actual una sección;
- una etapa de comparación de dichos vectores actuales con una lista de vectores modelo construida previamente a partir de las cartografías normales de los caracteres conocidos, correspondiéndose cada vector modelo con un carácter conocido;
- una etapa de determinación de una lista de caracteres actuales que se corresponde con dicha lista de vectores actuales.
8. Procedimiento según la reivindicación 7, caracterizado por que dichos vectores actuales y dichos vectores modelo son de m x n en dimensiones, teniendo cada uno de dichos mapas de normales de los caracteres conocidos un tamaño de m x n píxeles.
9. Procedimiento según la reivindicación 7, caracterizado por que dicha al menos una zona comprende una zona de un número de una tarjeta bancaria, y por que dicha lista de caracteres actuales comprende dicho número de dicha tarjeta bancaria.
10. Procedimiento según la reivindicación 9, caracterizado por comprender, además, una etapa de verificación de dicho número de dicha tarjeta bancaria según la fórmula de Luhn.
11. Dispositivo electrónico de reconocimiento de caracteres en relieve en una imagen base, caracterizado por comprender una unidad de proceso configurada para implementar uno cualquiera de los procedimientos según las reivindicaciones 1 a 10.
12. Producto programa de ordenador, que comprende instrucciones de código de programa para la puesta en práctica del procedimiento según una cualquiera de las reivindicaciones 1 a 10, cuando dicho programa se ejecuta en un ordenador.
ES17189487T 2016-09-05 2017-09-05 Procedimiento de reconocimiento de caracteres en relieve, producto programa de ordenador y dispositivo correspondientes Active ES2754612T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR1658228A FR3055721B1 (fr) 2016-09-05 2016-09-05 Procede de reconnaissance de caracteres en reliefs, produit programme d'ordinateur et dispositif correspondants

Publications (1)

Publication Number Publication Date
ES2754612T3 true ES2754612T3 (es) 2020-04-20

Family

ID=57539393

Family Applications (1)

Application Number Title Priority Date Filing Date
ES17189487T Active ES2754612T3 (es) 2016-09-05 2017-09-05 Procedimiento de reconocimiento de caracteres en relieve, producto programa de ordenador y dispositivo correspondientes

Country Status (6)

Country Link
US (1) US10489668B2 (es)
EP (1) EP3291141B1 (es)
CA (1) CA2978138A1 (es)
ES (1) ES2754612T3 (es)
FR (1) FR3055721B1 (es)
PL (1) PL3291141T3 (es)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3057067B1 (en) * 2015-02-16 2017-08-23 Thomson Licensing Device and method for estimating a glossy part of radiation
US11436366B2 (en) * 2019-01-21 2022-09-06 Bitdefender IPR Management Ltd. Parental control systems and methods for detecting an exposure of confidential information
US20230009564A1 (en) * 2019-12-05 2023-01-12 Canaan Bright Sight Co., Ltd Character segmentation method and apparatus, and computer-readable storage medium
US11495036B1 (en) * 2021-01-29 2022-11-08 Scandit Ag Segmenting images for optical character recognition
CN113627395B (zh) * 2021-09-17 2023-11-17 平安银行股份有限公司 文本识别方法、装置、介质及电子设备

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3627991A (en) * 1970-02-24 1971-12-14 North American Rockwell Pattern reader
US4845770A (en) * 1986-11-20 1989-07-04 Oki Electric Industry Co., Ltd. Method and apparatus for processing embossed card
US6631364B1 (en) * 1997-03-26 2003-10-07 National Research Council Of Canada Method of searching 3-Dimensional images
US6618117B2 (en) * 1997-07-12 2003-09-09 Silverbrook Research Pty Ltd Image sensing apparatus including a microcontroller
US6628808B1 (en) * 1999-07-28 2003-09-30 Datacard Corporation Apparatus and method for verifying a scanned image
JP2004178529A (ja) * 2002-11-26 2004-06-24 Taizo Otani カード作成発行エンボス検査装置
JP2006221431A (ja) * 2005-02-10 2006-08-24 Oki Electric Ind Co Ltd エンボス文字読取装置
US8224018B2 (en) * 2006-01-23 2012-07-17 Digimarc Corporation Sensing data from physical objects
US9672510B2 (en) * 2008-01-18 2017-06-06 Mitek Systems, Inc. Systems and methods for automatic image capture and processing of documents on a mobile device
JP5430456B2 (ja) * 2010-03-16 2014-02-26 キヤノン株式会社 幾何特徴抽出装置、幾何特徴抽出方法、及びプログラム、三次元計測装置、物体認識装置
US9565370B2 (en) * 2014-05-30 2017-02-07 Apple Inc. System and method for assisting in computer interpretation of surfaces carrying symbols or characters
US20160019431A1 (en) * 2014-07-15 2016-01-21 Google Inc. Extracting card identification data using card types

Also Published As

Publication number Publication date
US10489668B2 (en) 2019-11-26
PL3291141T3 (pl) 2019-12-31
FR3055721B1 (fr) 2019-10-18
US20180068196A1 (en) 2018-03-08
EP3291141B1 (fr) 2019-07-24
EP3291141A1 (fr) 2018-03-07
FR3055721A1 (fr) 2018-03-09
CA2978138A1 (fr) 2018-03-05

Similar Documents

Publication Publication Date Title
ES2754612T3 (es) Procedimiento de reconocimiento de caracteres en relieve, producto programa de ordenador y dispositivo correspondientes
CN108875731B (zh) 目标识别方法、装置、系统及存储介质
US20190303650A1 (en) Automatic object recognition method and system thereof, shopping device and storage medium
CN112102402B (zh) 闪光灯光斑位置识别方法、装置、电子设备及存储介质
CN110264645A (zh) 一种商品的自助收银方法和设备
US11823358B2 (en) Handwritten content removing method and device and storage medium
KR20190010640A (ko) 문서의 광학 문자 인식 기법
US10474888B1 (en) Detecting a fragmented object in an image
JP2014531636A (ja) 物体を識別する方法及び機構
EA025922B1 (ru) Способ автоматической аутентификации защищенного документа
CN109348731A (zh) 一种图像匹配的方法及装置
CN106650743B (zh) 图像强反光检测方法和装置
CN108780506A (zh) 使用纸张表面和移动相机的伪造品检测方案
CN109948521A (zh) 图像纠偏方法和装置、设备及存储介质
US11151374B2 (en) Method and system for generating a surface signature
US11341612B1 (en) Method and system for automatic correction and generation of facial images
EP4171051A1 (en) Collation device, program, and collation method
CN116798041A (zh) 图像识别方法、装置和电子设备
Beglov Object information based on marker recognition
Papp et al. Embedding QR code onto triangulated meshes using horizon based ambient occlusion
JP6749519B1 (ja) 多角形検出装置、多角形検出方法、及び多角形検出プログラム
Koliaskina et al. MIDV-Holo: A Dataset for ID Document Hologram Detection in a Video Stream
EP4156120B1 (en) Collation device, program, and collation method
US11908221B1 (en) Methods and systems for determining the authenticity of an identity document
CN112150496B (zh) 照片处理方法、装置、电子设备及可读存储介质