ES2920383T3 - Métodos y un sistema para verificar la identidad de un artículo impreso - Google Patents

Métodos y un sistema para verificar la identidad de un artículo impreso Download PDF

Info

Publication number
ES2920383T3
ES2920383T3 ES15755854T ES15755854T ES2920383T3 ES 2920383 T3 ES2920383 T3 ES 2920383T3 ES 15755854 T ES15755854 T ES 15755854T ES 15755854 T ES15755854 T ES 15755854T ES 2920383 T3 ES2920383 T3 ES 2920383T3
Authority
ES
Spain
Prior art keywords
artifacts
unverified
article
original
printed article
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15755854T
Other languages
English (en)
Inventor
Michael L Soborski
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sys Tech Solutions Inc
Original Assignee
Sys Tech Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US14/561,215 external-priority patent/US20150083801A1/en
Application filed by Sys Tech Solutions Inc filed Critical Sys Tech Solutions Inc
Application granted granted Critical
Publication of ES2920383T3 publication Critical patent/ES2920383T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K17/00Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations
    • G06K17/0022Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations arrangements or provisious for transferring data to distant stations, e.g. from a sensing device
    • G06K17/0025Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations arrangements or provisious for transferring data to distant stations, e.g. from a sensing device the arrangement consisting of a wireless interrogation device in combination with a device for optically marking the record carrier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K5/00Methods or arrangements for verifying the correctness of markings on a record carrier; Column detection devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00005Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to image data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00838Preventing unauthorised reproduction
    • H04N1/0084Determining the necessity for prevention
    • H04N1/00843Determining the necessity for prevention based on recognising a copy prohibited original, e.g. a banknote
    • H04N1/00846Determining the necessity for prevention based on recognising a copy prohibited original, e.g. a banknote based on detection of a dedicated indication, e.g. marks or the like
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00838Preventing unauthorised reproduction
    • H04N1/0084Determining the necessity for prevention
    • H04N1/00843Determining the necessity for prevention based on recognising a copy prohibited original, e.g. a banknote
    • H04N1/00848Determining the necessity for prevention based on recognising a copy prohibited original, e.g. a banknote by detecting a particular original
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/23Reproducing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3269Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of machine readable codes or marks, e.g. bar codes or glyphs

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Facsimiles In General (AREA)
  • Inspection Of Paper Currency And Valuable Securities (AREA)
  • Inking, Control Or Cleaning Of Printing Machines (AREA)

Abstract

Un método para verificar una identidad de un elemento impreso incluye capturar una imagen del elemento impreso no verificado, en el que el elemento impreso no verificado incluye artefactos y al menos algunos de los artefactos no eran productibles para producir el artículo impreso no verificado; extraer información asociada con los artefactos del artículo impreso no verificado; clasificación de la información asociada con los artefactos del artículo impreso no verificado; recuperar información clasificada almacenada asociada con artefactos de un elemento impreso original de un dispositivo de almacenamiento; y en cada uno de los primeros y segundo rango de magnitudes, comparando la información clasificada asociada con los artefactos del artículo impreso no verificado con la información clasificada asociada con los artefactos del artículo impreso original. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Métodos y un sistema para verificar la identidad de un artículo impreso
Referencia cruzada a aplicaciones relacionadas
La presente solicitud reivindica la prioridad de la Solicitud de patente provisional de EE. UU 61/945.917 presentada el 28 de febrero de 2014, y de la Solicitud de patente de EE. UU 14/561.215 presentada el 4 de diciembre de 2014. Esta solicitud está relacionada con la patente de EE. UU N.° 8.950.662 presentada el 10 de febrero de 2015, y con la Solicitud de patente provisional de EE. UU 61/605.369 presentada el 1 de marzo de 2012; 61/676,113 presentada el 26 de julio de 2012; y 61/717.711 presentada el 24 de octubre de 2012.
Campo técnico
La presente divulgación se relaciona en general con la tecnología de visión de máquina y, más particularmente, con métodos y un sistema para verificar la identidad de un artículo impreso.
Antecedentes
Algunos métodos actuales para verificar la identidad de un artículo impreso generalmente se basan en marcas evidentes o encubiertas aplicadas deliberadamente a un artículo, generalmente mediante impresión. Otros métodos se basan en variaciones naturales en un sustrato de material (orientación de fibra en papel, por ejemplo) para usarse como un identificador único. En la tecnología existente existen deficiencias significativas. Estas incluyen la necesidad de añadir deliberadamente marcas evidentes o encubiertas al artículo además de cualquier marca ya presente en el artículo para otros fines. En el caso del método de variación de sustrato, es necesario un sistema especializado que perciba las variaciones. Además, para sustratos que no presentan un rasgo única fácilmente identificable (algunas películas de plástico, por ejemplo), este método no se puede emplear. Estas deficiencias reducen seriamente la utilidad de estos métodos en los campos técnicos considerados aquí. El estado de la técnica es conocido a partir del documento US 2013/228619.
Dibujos
Si bien las reivindicaciones adjuntas establecen los rasgos de las presentes técnicas con particularidad, estas técnicas, junto con sus objetos y ventajas, pueden entenderse mejor a partir de la siguiente descripción detallada tomada junto con los dibujos adjuntos de los cuales:
La Figura 1 es una ilustración de un caso de una marca impresa utilizada por métodos según una realización.
La Figura 2 es una ilustración de la marca en la Figura 1 con los rasgos del borde de la marca extraídas por claridad. La Figura 3 es una ilustración de un segundo caso de la misma marca que en la Figura 1, que puede representar una versión falsificada de la marca de la Figura 1.
La Figura 4 es una ilustración de la marca en la Figura 3 con los rasgos de borde de la marca extraídas por claridad. La Figura 5 es un ejemplo de una matriz de datos 2D imprimida por un proceso de transferencia térmica, que ilustra algunos rasgos que pueden usarse en los presentes métodos.
La Figura 6 es una ilustración que compara los rasgos de las secciones superiores izquierdas de la Figura 2 y la Figura 4.
La Figura 7 es un ejemplo de una fotocopia de una matriz de datos similar a la de la Figura 5.
La Figura 8 es un diagrama esquemático de un sistema informático.
La Figura 9 es un diagrama de bloques de un sistema informático operativo para llevar a cabo un proceso según una realización.
La Figura 10 es un diagrama de flujo de una realización de un método para grabar una nueva marca.
La Figura 11 es un diagrama de la ponderación de los rasgos característicos.
La Figura 12 es un diagrama de flujo de una realización de un método para evaluar una marca.
La Figura 13 es un gráfico comparativo de magnitudes de artefactos.
La Figura 14 es un detalle de la Figura 13, a una escala mayor que la Figura 13.
La Figura 15 es un código de barras 1D que ilustra algunos rasgos que pueden usarse en una realización.
La Figura 16 es un gráfico de una aproximación polinomial de una serie de autocorrelación para un artículo genuino con un símbolo de "candidato" genuino.
La Figura 17 es un gráfico de una serie de potencias para los datos genuinos de la Figura 16.
La Figura 18 es un gráfico similar a la Figura 17 para los datos de "candidato" en la Figura 16.
La Figura 19 es un gráfico similar a la Figura 17 para un símbolo de "candidato" falsificado.
La Figura 20 es un gráfico similar a la Figura 17 para los datos falsificados usados en la Figura 19.
La Figura 21 es un gráfico de momentos de inercia para una medición de contraste.
Descripción
La presente divulgación se relaciona con el uso de variaciones que anteriormente se consideraban demasiado pequeñas para ser fiables para la validación para detectar ciertas categorías de copias mecánicas de artículos genuinos.
Aspectos de la presente divulgación se encuentran en el campo técnico de la lucha contra la falsificación y la serialización de artículos con el fin de la seguridad de la cadena de suministro de seguimiento y localización. Según un primer aspecto de la presente invención, se proporciona un método para verificar la identidad de un artículo no verificado como se define en la reivindicación 1. Según un segundo aspecto de la presente invención, se proporciona un sistema para verificar la identidad de un artículo no verificado como se define en la reivindicación 13. Según un tercer aspecto de la presente invención, se proporciona un medio legible por ordenador que tiene almacenadas instrucciones ejecutables por ordenador como se define en la reivindicación 16.
En una realización, por ejemplo, un artículo original impreso usando un proceso de transferencia térmica o chorro de tinta tiene típicamente áreas impresas muy uniformes, sólidas, negras u otras. Los procesos de impresión electrostática tienden a producir áreas impresas en las que los negros son más grises a bajas resoluciones y moteados a altas resoluciones. La diferencia es sutil, pero mediante las técnicas divulgadas en esta memoria descriptiva, la diferencia se puede detectar con suficiente confianza, en una proporción suficiente de casos, para ayudar a distinguir un original impreso por transferencia térmica de una fotocopia de ese original.
Una realización divulgada proporciona un método para verificar la identidad de un artículo impreso, que comprende: examinar un artículo no verificado en busca de artefactos no verificados específicos del artículo no verificado; extraer información asociada con los artefactos no verificados; recuperar datos almacenados que contienen información asociada con artefactos originales de un artículo original desde un dispositivo de almacenamiento; clasificar la información no verificada según la magnitud de una característica de los artefactos no verificados o de los artefactos originales; comparar la información clasificada asociada con los artefactos no verificados y la información asociada con los artefactos originales correspondientemente clasificados por separado para artefactos en un primer intervalo de magnitudes y artefactos en un segundo intervalo de magnitudes, en donde el segundo intervalo incluye artefactos más pequeños que un artefacto más pequeño en el primer intervalo; y cuando una diferencia entre la información asociada con los artefactos no verificados y la información asociada con los artefactos originales es mayor para el segundo intervalo que para el primer intervalo en más de una cantidad de umbral, identificar el artículo no verificado como una copia.
En la presente solicitud, "impreso" debe entenderse en sentido amplio, incluyendo cualquier proceso que genere un símbolo que podría imitarse razonablemente mediante un proceso de formación de imágenes. Los métodos divulgados están especialmente (aunque no exclusivamente) relacionados con la detección de fotocopias, por lo que un "artículo impreso" incluye cualquier cosa que plausiblemente pueda ser fotocopiada. Eso incluye no solo procesos para aplicar un patrón de tinta, pigmento, tinte o similar de un color (no necesariamente negro o negruzco) a un sustrato de un segundo color (no necesariamente blanco o blanquecino), sino también procesos ablativos, en los que inicialmente está presente una capa superficial o revestimiento del segundo color, y parte de ella se elimina para crear el patrón. Las referencias a una "impresora" deben entenderse correspondientemente en sentido amplio.
Como se explica con más detalle a continuación, los "artefactos más pequeños que un artefacto más pequeño en el primer intervalo" pueden incluir, o consistir en, ubicaciones en las que no hay ningún artefacto, o ningún artefacto detectable sobre el ruido estadístico del sistema de detección. o solo se detecta ruido.
La diferencia puede ser una diferencia promedio o agregada en o proporción de magnitudes de artefactos o una medida estadística de variación en magnitudes de artefactos.
Una realización comprende además, antes de comparar por separado: comparar la información asociada con los artefactos no verificados y la información asociada con los artefactos originales para artefactos que tienen magnitudes en el primer intervalo; evaluar una probabilidad estadística de que la información de los artefactos no verificados coincida con la información de los artefactos originales; en caso de que la probabilidad estadística supere un primer umbral, determinar que el artículo no verificado es un artículo original verificado; en caso de que la probabilidad estadística esté por debajo de un segundo umbral inferior al primer umbral, determinar que el artículo no verificado no es un artículo original; y llevar a cabo la etapa de comparar por separado únicamente en el caso de que la probabilidad estadística se encuentre entre los umbrales primero y segundo.
El primer intervalo puede consistir en un número predeterminado de artefactos que tienen las magnitudes más grandes, y/o el segundo intervalo puede consistir en un número predeterminado de artefactos que tienen las magnitudes más pequeñas o las magnitudes más pequeñas por encima de un umbral de detección. Los intervalos primero y segundo pueden superponerse.
Una realización comprende además calcular una serie de autocorrelación de la información de artefactos clasificados no verificados para cada uno de los intervalos primero y segundo, donde la comparación comprende por separado comparar la serie de autocorrelación original y no verificada para cada uno de los intervalos primero y segundo. Los datos almacenados pueden comprender datos que representan series de autocorrelación de los artefactos de artículos originales clasificados para cada uno de los intervalos primero y segundo, o la serie de autocorrelación para los artefactos de artículos originales puede generarse solo en el momento de la comparación.
Al menos algunos de los artefactos pueden ser artefactos de un símbolo que codifica datos y admite la detección de errores, y la extracción de información que representa los artefactos no verificados puede incluir la determinación de un estado de error de un símbolo que tiene los artefactos no verificados. El estado de error puede indicar que parte del símbolo está dañado, y la comparación puede comprender entonces descartar artefactos en la parte dañada del símbolo.
En general, "descontar" un artefacto incluye otorgar a ese artefacto una clasificación estadística más baja que otros artefactos comparables, ubicar ese artefacto en una clase separada de artefactos que no se pueden cuantificar y/o clasificar con precisión, tratar ese artefacto de la misma manera que una ubicación con ningún artefacto detectado de esa categoría, e ignorando totalmente ese artefacto. Se pueden aplicar diferentes de esos enfoques en diferentes puntos incluso dentro de una sola realización.
La comparación puede incluir la corrección de las propiedades de al menos uno de los aparatos que crearon los artefactos originales, el aparato utilizado para examinar el artículo original en busca de la información que representa los artefactos originales y el aparato utilizado para examinar el artículo no verificado en busca de la información que representa los artefactos no verificados.
Los artefactos pueden ser de distintas categorías. Determinar si la información de los artefactos no verificados coincide con la información de los artefactos originales puede comprender comparar los artefactos originales y no verificados en cada categoría y combinar los resultados de las comparaciones. La corrección puede comprender entonces ponderar la combinación según una tendencia conocida del aparato que creó los artefactos originales para producir artefactos en diferentes categorías con diferentes frecuencias o diferentes valores de una característica.
Una realización comprende además: examinar un artículo impreso original en busca de artefactos específicos del artículo; extraer información asociada con los artefactos; clasificar la información según una característica de los artefactos; y almacenar datos que representan la información clasificada como dichos datos almacenados en un dispositivo de almacenamiento no transitorio legible por ordenador separado del artículo original.
Al menos algunos de los artefactos pueden ser artefactos que no fueron controlablemente producibles al producir el artículo original.
El artículo original puede comprender una marca que comprende un identificador y al menos un artefacto, en donde el identificador se asocia con el artículo original y el al menos un artefacto no altera la asociación. El almacenamiento puede comprender entonces almacenar la información para que sea al menos parcialmente localizable utilizando el identificador.
Una realización proporciona un sistema para verificar la identidad de un artículo mediante el método anterior, que comprende un escáner de verificación que puede funcionar para examinar un artículo no verificado y extraer información que representa artefactos no verificados del artículo no verificado, y un procesador que puede funcionar para recuperar datos almacenados de un dispositivo de almacenamiento. que contienen información que representa los artefactos originales clasificados de un artículo original, comparar la información de los artefactos originales y no verificados, y producir una salida que depende del resultado de la comparación.
Una realización proporciona un sistema para verificar la identidad de un artículo mediante el método anterior, que comprende un escáner de artículo original que puede funcionar para examinar un artículo y extraer información que representa artefactos del artículo, un codificador que puede funcionar para clasificar la información según una característica de los artefactos y para codificar la información extraída en datos legibles por ordenador, y un dispositivo de almacenamiento legible por ordenador que puede funcionar para almacenar los datos.
El sistema puede comprender además un productor de artículos originales que puede funcionar para producir un artículo original, en donde los artefactos son rasgos del artículo que se producen cuando el productor del artículo original produce el artículo, y al menos algunos de los artefactos no son controlables por el productor de artículos originales.
El sistema puede comprender además al menos un artículo original para el que se almacenan datos de artefacto clasificados en un dispositivo de almacenamiento legible por ordenador.
Una realización proporciona un medio de almacenamiento no transitorio legible por ordenador que almacena instrucciones legibles por ordenador que, cuando se ejecutan en un procesador informático adecuado, verifican la identidad de un artículo según cualquiera de los métodos anteriores.
Una realización proporciona un método para verificar la identidad de un artículo impreso, que comprende: formación de imágenes de áreas impresas de un artículo impreso no verificado; extraer información asociada con el contraste espacial de las áreas impresas; recuperar de un dispositivo de almacenamiento datos almacenados que contienen información asociada con el contraste espacial de áreas impresas correspondientes de un artículo original; comparar la información asociada con el contraste espacial de las áreas impresas del artículo impreso no verificado y el artículo impreso original; y cuando una diferencia entre la información asociada con el contraste espacial de las áreas impresas del artículo impreso no verificado y el artículo impreso original es mayor que una cantidad de umbral, identificar el artículo no verificado como una copia.
La información asociada con el contraste espacial de las áreas impresas puede ser un momento de inercia de una matriz de aparición simultánea de nivel de gris.
La información respectiva de una pluralidad de marcas u otros artículos impresos puede almacenarse en un dispositivo de almacenamiento, por ejemplo en forma de base de datos, y utilizando el identificador de una de dichas marcas, la información respectiva de un número de marcas menor que dicha pluralidad de marcas y que comprende dicha marca puede ser recuperable. En un ejemplo, el identificador puede identificar un grupo o categoría de artículos. Entonces, el identificador se puede usar para recuperar de la base de datos solo la información almacenada relacionada con los artículos de ese grupo o categoría, lo que reduce el alcance de una búsqueda posterior para identificar la información de un único artículo. En otro ejemplo, el menor número de marcas puede ser solo una marca. Por ejemplo, el identificador puede ser un Identificador Único (UID) que identifique explícitamente solo un único artículo, y la información puede almacenarse para que pueda recuperarse utilizando el UID.
La información almacenada puede incluir información indicativa de un tipo de impresora implicado en la creación de los artefactos originales. La información almacenada puede incluir información indicativa de una resolución del aparato implicado en el examen del artículo original.
Cuando los artefactos son de distintas categorías, determinar si la información de los artefactos no verificados coincide con la información de los artefactos originales puede comprender comparar los artefactos detectados en cada categoría y combinar los resultados de las comparaciones, y la corrección puede comprender entonces ponderar la combinación según una tendencia conocida del aparato que creó los artefactos originales para producir artefactos en diferentes categorías con diferentes frecuencias o diferentes magnitudes.
La extracción de información puede comprender además determinar un tipo de impresora utilizada para producir los artefactos, donde los artefactos son de una pluralidad de categorías distintas. La codificación y el almacenamiento de la información de los artefactos originales clasificados puede comprender entonces al menos una clasificación de diferentes categorías de artefactos según el tipo de impresora y almacenar datos que indican el tipo de impresora como parte de los datos almacenados. La información puede ser útil, porque diferentes tipos de impresoras pueden producir diferentes categorías de artefactos con diferentes intervalos de magnitud, con mayor o menor frecuencia, o con otras variaciones que pueden afectar la forma de evaluar o el peso que se debe dar a las diferentes categorías de artefactos.
En los datos almacenados se puede incorporar otra información relacionada con el artículo original además de la información que representa los artefactos originales. La otra información del artículo original puede incluir un número de serie específico para el artículo original. Tal otra información puede recuperarse luego de los datos almacenados recuperados además de la información que representa los artefactos originales.
Cuando al menos algunos^ de los artefactos son artefactos de un símbolo que codifica datos, y los datos codificados incluyen un Identificador Único (UID) para un caso individual del símbolo u otros datos de identificación, los datos almacenados pueden almacenarse para que sean recuperables bajo un identificador derivable del UID u otros datos de identificación. Cuando los demás datos de identificación solo identifiquen parcialmente el símbolo, por ejemplo, identifiquen una categoría o grupo de artículos más pequeños que todos los artículos para los que se almacenan datos en una base de datos, los datos pueden almacenarse de modo que los datos almacenados para la categoría o grupo son recuperables bajo un identificador derivable de los otros datos de identificación. Los datos almacenados para un artículo original individual deseado pueden recuperarse luego mediante una búsqueda adicional dentro del grupo recuperado.
Cuando codificar la información de los artefactos originales clasificados comprende calcular una serie de autocorrelación de la información de los artefactos originales clasificados, la codificación puede comprender además representar o aproximar la serie de autocorrelación como un polinomio a un orden fijo. La aproximación puede ser a un polinomio de un orden predeterminado, y los coeficientes pueden aproximarse a una precisión predeterminada.
Donde codificar la información de los artefactos originales clasificados comprende calcular una serie de autocorrelación de la información de los artefactos originales clasificados, comparar puede comprender calcular una serie de autocorrelación de la información de los artefactos no verificados y comparar las dos series de autocorrelación. Comparar puede comprender además o alternativamente comparar series de potencias de Transformada Discreta de Fourier (DFT) de las dos series de autocorrelación, y luego puede comprender comparar al menos una de las funciones de Curtosis y Sesgo de Distribución de la serie de potencias DFT.
El escáner de verificación puede acoplarse a un dispositivo de punto de venta. El escáner de verificación se puede incorporar en un teléfono celular.
En muchas realizaciones, se prefiere que los artefactos sean rasgos que no afecten, o al menos no disminuyan, la función o el valor comercial de la marca, artículo u objeto en el que aparecen.
Puede obtenerse una mejor comprensión de diversos rasgos y ventajas de los presentes métodos y dispositivos con referencia a la siguiente descripción detallada de realizaciones ilustrativas y dibujos adjuntos. Aunque estos dibujos representan realizaciones de los métodos y dispositivos contemplados, no deben interpretarse como realizaciones anticipadas alternativas o equivalentes evidentes para los expertos en la técnica.
En una realización, un método funciona sobre marcas que se aplican a artículos. Estas marcas pueden tener el propósito de identificar de manera única un artículo, como por ejemplo con un número de serie, o pueden ser marcas que tienen otros fines, como la marca, el etiquetado o la decoración. Estas marcas pueden imprimirse, grabarse, moldearse, formarse, transferirse o aplicarse de otro modo al artículo mediante diversos procesos. Las marcas se adquieren de forma que puedan ser procesadas en formato electrónico. Los métodos de adquisición electrónica son variados y pueden incluir, entre otros, cámaras de visión de máquina, lectores de códigos de barras, formadores de imágenes de barrido lineal, escáneres de cama plana, dispositivos portátiles de mano de formación de imágenes o muchos otros medios.
Con referencia ahora a los dibujos, en la Figura 1 se muestra un ejemplo de una marca impresa indicada generalmente por el número de referencia 20 a la que se pueden aplicar los presentes métodos. En este ejemplo, la marca impresa es un código de barras bidimensional. Este código de barras es un soporte de datos de información, donde la información se codifica como un patrón de áreas claras 22 y áreas oscuras 24 en la marca. Un caso ideal del código de barras 2D consistiría en una cuadrícula rectangular, con cada celda o "módulo" 22, 24 en la cuadrícula en blanco o negro, representando un bit de datos.
La Figura 2 proporciona una vista mejorada de algunas de las variaciones presentes en la marca mostrada en la Figura 1. La Figura 2 muestra solamente los bordes 26 entre las áreas claras y oscuras de la marca mostrada en la Figura 1. Rasgos tales como la linealidad de bordes, las discontinuidades de región y la forma de rasgo dentro de la marca mostrada en la Figura 1 son fácilmente evidentes. Numerosas irregularidades a lo largo de los bordes de los rasgos impresos de la marca son claramente visibles. Obsérvese que esta ilustración se proporciona por claridad y no es necesariamente una etapa de procesamiento de los presentes métodos. En algunas de las realizaciones postuladas en esta memoria, tal extracción de bordes es beneficiosa y, por lo tanto, se utiliza. En algunas de las realizaciones, se extraen rasgos distintos a los bordes.
La Figura 3 muestra un ejemplo de una segunda marca impresa, indicada generalmente por el número de referencia 30, que puede representar una falsificación de la marca 20 mostrada en la Figura 1, o puede representar un segundo caso único de la marca con fines de identificación. Esta segunda marca impresa 30 es también un código de barras bidimensional. Este segundo código de barras 30, cuando se lee con un lector de código de barras bidimensional, presenta exactamente la misma información decodificada que la marca 20 de la Figura 1. Cuando se adquiere la marca 30 de la Figura 3, la presente realización identifica de nuevo rasgos significativos y los captura como datos de "firma" que identifican de forma única la marca. Como en el caso de la Figura 1, estos datos de firma se derivan de las características físicas y ópticas de la geometría y la apariencia de la marca y, además, pueden incluir datos codificados en la marca, si la marca fuera un símbolo portador de datos, como un código de barras bidimensional. Las propiedades de la marca evaluadas para crear los datos de firma suelen ser las mismas propiedades utilizadas en la evaluación del primer caso de la marca, de modo que las dos firmas son directamente comparables.
La Figura 4 proporciona una vista mejorada de algunas de las variaciones presentes en la marca 30 mostrada en la Figura 3. La Figura 4 muestra solamente los bordes 32 de la marca mostrada en la Figura 3, de forma similar a la Figura 2. Los rasgos y variaciones correspondientes, como la linealidad de bordes, las discontinuidades de región y la forma de rasgo dentro de la marca mostrada en la Figura 3 son fácilmente evidentes. Ejemplos de algunos de los rasgos que pueden usarse se muestran con más detalle en la Figura 5, que se discute con más detalle a continuación.
La Figura 6 muestra una comparación cercana de los rasgos de la esquina superior izquierda de la Figura 2 y la Figura 4. Como puede verse más claramente en la Figura 6, las dos marcas impresas 20, 30 de las Figuras 1 y 3, aunque idénticas en cuanto a sus datos claramente codificados, contienen numerosas diferencias en una escala más fina, resultantes de las imperfecciones del proceso de impresión utilizado para aplicar las marcas. Estas diferencias son duraderas, por lo general casi tan duraderas como la propia marca, y son únicas a efectos prácticos, especialmente cuando se combina un gran número de diferencias entre los símbolos de la Figura 1 y la Figura 3. Además, las diferencias son difíciles, si no casi imposibles, de falsificar, porque del símbolo original se tendría que formar una imagen y reimprimir a una resolución mucho más alta que la impresión original, sin introducir nuevas imperfecciones de impresión distinguibles. Si bien aquí solo se muestra la sección de esquina superior izquierda de las marcas, los rasgos diferenciables entre las dos marcas mostradas en las Figuras 1 y 3 recorren la totalidad de las marcas y pueden ser utilizadas por la presente realización.
La Figura 5 es un ejemplo de un código de barras 2D impreso con una impresora de transferencia térmica. Como puede verse en la Figura 5, la impresora de transferencia térmica produce una imagen con negros sólidos. Los procesos ablativos, en los que un sustrato tiene inicialmente un revestimiento negro continuo, partes del cual se eliminan para producir las áreas blancas de la Figura 5, también puede producir una imagen con negros sólidos. La Figura 7 es un ejemplo de una fotocopia de un código de barras 2D, similar en estructura general al código de barras de la Figura 5. Como puede verse en la Figura 7, el proceso electrostático utilizado por las fotocopiadoras tiende a producir un efecto moteado o manchado, de modo que muchas celdas del código de barras que se percibirían como negras sólidas en la Figura 5 se perciben en la Figura 7 como gris en lugar de negro y/o como negro con vacíos blancos. El significado de esta diferencia se explica con más detalle a continuación.
Haciendo referencia a la Figura 8, una realización de un sistema informático indicado generalmente por el número de referencia 50 comprende, entre otros equipos, un procesador o CPU 52, dispositivos de entrada y salida 54, 56, incluido un dispositivo de adquisición de imágenes 58, memoria de acceso aleatorio (RAM) 60, memoria de únicamente lectura (ROM) 62, y discos magnéticos u otro almacenamiento a largo plazo 64 para programas y datos. El sistema informático 50 puede incluir una impresora 65 para generar marcas 20, o la impresora 65 puede ser un dispositivo separado. El sistema informático 50 se puede conectar a través de una interfaz 66 a una red externa 68 u otros medios de comunicación, y a través de la red 68 a un servidor 70 con almacenamiento a largo plazo 72. Aunque no se muestra en aras de la simplicidad, varios sistemas informáticos similares 20 se pueden conectar al servidor 70 a través de la red 68.
Haciendo referencia a la Figura 9, en una realización de un sistema informático, el dispositivo de adquisición de imágenes suministra datos de imágenes a un procesador de extracción y codificación de firmas 74, que puede ser un software que se ejecuta en la CPU principal 52 del sistema informático 50, o puede ser un coprocesador dedicado. El procesador de extracción y codificación de firmas 74 suministra datos de firma al almacenamiento de datos de firmas de marcas accesibles en red 76, que puede ser un almacenamiento a largo plazo 72 del servidor 70. El motor de búsqueda de firmas de marcas accesibles en red 78, que puede ser un software que se ejecuta en el servidor principal La CPU 52 del sistema informático 50, o puede ser un coprocesador dedicado, recibe datos de firma del procesador de extracción y codificación de firmas 74 y/o del almacenamiento de datos de firma 76. El procesador de comparación de firmas 80 normalmente compara una firma extraída por el procesador de extracción y codificación de firmas 74 de una marca 30 escaneada recientemente con una firma previamente almacenada en el almacenamiento de datos de firma 76 y asociada con una marca genuina 20. Como se muestra simbólicamente por la separación entre la parte superior de la Figura 9, relativa a la captura y almacenamiento de firmas de marcas genuinas, y la parte inferior de la Figura 9, en relación con la captura, comparación y verificación de firma de la marca candidata, el sistema informático 50 que escanea la marca candidata 30 puede ser diferente del sistema informático 50 que escanea la marca original 20. Si son diferentes, por lo general comparten el acceso al almacenamiento de datos de firma 76, o se pasa una copia de los datos de firma almacenados desde el almacenamiento 76 en el sistema de captura de marcas genuinas 50 al sistema de evaluación de marcas candidatas 50.
Con más detalle, y con referencia a la Figura 10, en una realización de un método según la invención, en la etapa 102 una marca, que en este ejemplo se ilustra como código de barras 2D similar al mostrado en la Figura 1, se aplica a un objeto, o a una etiqueta que se aplica posteriormente a un objeto, por la impresora 65. Como ya se ha explicado, una impresora que aplica un código de barras 2D típicamente introduce una cantidad significativa de artefactos que son demasiado pequeños para afectar a la legibilidad de los datos visibles codificados por el código de barras, y son demasiado pequeños para que su apariencia sea controlable en el proceso de impresión, pero son visibles (posiblemente solo bajo aumento) y duraderos. Si una impresora en particular no produce naturalmente un buen suministro de artefactos, algunas impresoras pueden incluir variaciones aleatorias o pseudoaleatorias en su salida.
En la etapa 104, la marca es adquirida por un dispositivo de formación de imágenes 58 u otro dispositivo de adquisición de datos adecuado. El dispositivo de formación de imágenes puede ser de cualquier forma conveniente, incluidos los dispositivos convencionales o los dispositivos que se desarrollarán más adelante. La única limitación real en esta realización es que el dispositivo de formación de imágenes recopila datos sobre la apariencia de la marca a un nivel de detalle considerablemente más fino que la salida controlable del dispositivo que aplicó la marca. En el ejemplo mostrado en las Figuras 1-4, el detalle es la forma de los límites entre las áreas claras y oscuras, con una resolución considerablemente más fina que el tamaño de los módulos del código de barras 2D impreso. A continuación se describen otros ejemplos de rasgos adecuados. Si la marca se usa como medida contra la falsificación, es más fuerte si el dispositivo de formación de imágenes recopila datos a un nivel de detalle más fino que la salida controlable de un dispositivo que probablemente se usará para aplicar o crear una marca falsificada. Sin embargo, eso puede no ser necesario si es posible mantener en secreto el hecho de que detalles particulares de una determinada marca se utilizan para ese fin.
En la etapa 106, se decodifica un Número de Identificador Único (UID) incluido en los datos visibles de la marca 20.
51 la impresora 65 está en el mismo sistema informático 50 que el dispositivo de adquisición de imágenes 58, el UID se puede pasar de uno a otro, evitando la necesidad de decodificar el UID de la imagen adquirida por el dispositivo de adquisición de imágenes 58. Si la marca 20 no incluye un UID, en esta etapa normalmente se requerirá alguna otra información que identifique de manera única el caso específico de la marca 20.
En las etapas 110 y 112, el procesador de extracción y codificación de firmas 74 analiza la imagen de la marca 20 para identificar rasgos significativos. En la etapa 120, los datos relacionados con esos rasgos se almacenarán en el almacenamiento de datos de firma 76 como datos de "firma" que identifican de forma única la marca 20. Estos datos de firma se derivan de las características físicas y ópticas de la geometría y apariencia de la marca, y además, pueden incluir datos que se codifican en la marca, si la marca fuera un símbolo portador de datos, como un código de barras bidimensional. Las propiedades de la marca evaluadas para crear los datos de firma pueden incluir, entre otras, la forma del rasgo, el contraste del rasgo, la linealidad de bordes, las discontinuidades de región, las marcas extrañas, los defectos de impresión, el color, la pigmentación, las variaciones de contraste, las relaciones de aspecto del rasgo, las ubicaciones de rasgos y tamaño de rasgo.
Cuando una parte de la marca no contiene rasgos significativos, los datos de esa parte de la marca aún pueden almacenarse en forma de información de que una parte específica de la marca no contiene rasgos significativos. En el caso de un código de barras 2D o un símbolo similar que se divide naturalmente en distintas celdas o módulos, se puede almacenar una lista de módulos negros sin rasgos significativos. Para este propósito, "rasgos no significativos" puede incluir celdas sin rasgos detectables, o celdas con rasgos detectables tan pequeños que se consideran prudentemente como mero ruido aleatorio, o ambas.
En particular, como se explica a continuación, el proceso de detección de fotocopias de la presente descripción suele ser más eficaz cuando se proporciona un suministro de módulos que, en la marca original, se sabe que son de color negro sólido, sin vacíos blancos y con un gris muy oscuro.
Con referencia ahora también a la Figura 5, en el siguiente ejemplo, desviación en la pigmentación de módulo promedio o intensidad de marcado 92, sesgo de posición de módulo 94 en relación con una cuadrícula de mejor ajuste, la presencia o ubicación de marcas extrañas o vacíos 96 en el símbolo y la forma (linealidad) de los bordes continuos largos 98 en el símbolo se utilizan como rasgos variables ejemplares. Estos actúan como las métricas principales que forman la firma de símbolo único. Las ilustraciones de algunos de estos rasgos se muestran en la Figura 5.
En el caso de que la marca sea un símbolo portador de datos, tal como un código de barras bidimensional, la presente realización puede aprovechar la información adicional incorporada y codificada en el símbolo. La información que se codifica, por ejemplo, un número de serie único o no único, puede incluirse como parte de los datos de firma o usarse para indexar los datos de firma para una recuperación más fácil.
Además, en el caso de un código de barras bidimensional u otro soporte de datos para el que se pueda establecer una medida de calidad, en la etapa 108 se puede extraer opcionalmente información que representa la calidad del símbolo e incluirla como parte de los datos de firma.
La información de calidad puede usarse para detectar cambios en la marca 20 que podrían provocar una falsa determinación de la marca como falsificación, ya que estos cambios pueden alterar los datos de firma de la marca. Algunas de las medidas de calidad que se pueden usar son, entre otras, la corrección de errores no utilizados y el daño de patrón fijo, tal como se define en la especificación ISO 15415 "Procesos de calificación de matriz de datos" u otro estándar comparable. Estas medidas hacen posible detectar áreas que contribuirían con datos de firma que han sido alterados por daño a la marca y así descartarlos al comparar los datos de firma de una marca con los datos de firma almacenados de la marca genuina.
Ponderación de métricas de firma
En este ejemplo, la facilidad con la que cada una de las cuatro métricas ilustradas en la Figura 5 se puede extraer depende de la resolución de formación de imágenes, y las métricas se pueden disponer en el orden de la resolución requerida para extraer datos útiles relacionados con cada una de las cuatro métricas, como se muestra en la Figura 11. En orden de menor a mayor resolución, estos son la pigmentación del módulo, el sesgo de posición de módulo, la ubicación de vacío/marca y la proyección de forma de borde. Sin embargo, como se explicará con más detalle a continuación, algunas métricas son más útiles que otras para la detección de fotocopias y, por lo tanto, se puede utilizar una ponderación diferente en esa etapa.
El aumento de la fidelidad y la resolución de imagen permite un análisis cada vez más preciso, haciendo uso de análisis de precisión progresivamente más altos. Por ejemplo, en una imagen de baja resolución, quizás solo la pigmentación promedio de módulo 92 y el sesgo de posición de módulo 94 se puedan extraer con una confianza significativa, por lo que esos resultados tienen más peso para determinar la coincidencia de firma de un símbolo candidato con los datos genuinos almacenados. Con una imagen de alta resolución, el procesamiento puede continuar hasta la métrica de proyección de borde fino 98 y utilizarla como la consideración de mayor peso en la determinación de coincidencia de firmas. Si hay desacuerdos entre otras medidas (de menor peso) con respecto a la firma esperada, pueden deberse a daños en el símbolo o artefactos del dispositivo de captura de imágenes. Sin embargo, es muy poco probable que el daño, la alteración del símbolo 20 o los artefactos de la cámara modifiquen un código 30 falsificado para que coincida con alta precisión con la métrica de firma de proyección de borde 98 del artículo válido 20. Por lo tanto, la proyección de borde, si está altamente correlacionada y exhibe una magnitud adecuada en el intervalo dinámico, puede reemplazar las métricas de menor resolución para respaldar una alta confianza de coincidencia.
Además, en una realización, utilizando un código de matriz de datos 2D como ejemplo, el uso de información de corrección de errores, proporcionada por los algoritmos de decodificación estándar de esa simbología, se utiliza para ponderar adicionalmente los datos métricos de la firma de forma adecuada. Si una región de datos dentro del símbolo se corrompe por daño a la marca y esa región produce un desacuerdo con los datos de firma almacenados mientras que otras regiones no corrompidas están de acuerdo, el peso de votación de la región corrompida se disminuye. Este mecanismo evita que las corrupciones de símbolos detectables presenten un resultado falso negativo en una comparación de métrica de símbolo candidato con los datos de firma de símbolo genuino. La memoria descriptiva ISO 16022 "Símbolo de matriz de datos" describe un ejemplo de cómo se pueden distribuir los códigos de corrección de errores (ECC) dentro de una matriz de datos 2D y cómo se pueden identificar las regiones corruptas y no corruptas dentro de una matriz de datos.
Filtrado de magnitud
Como se explicará con más detalle a continuación, en la presente realización se seleccionan dos intervalos de magnitudes diferentes. El primer intervalo puede consistir en un número predeterminado de los artefactos de mayor magnitud que están presentes. El segundo intervalo puede consistir en un número predeterminado de los artefactos de menor magnitud que se pueden detectar de manera fiable, o en un número predeterminado de artefactos en un intervalo inmediatamente debajo del primer intervalo, o en un intervalo más bajo que el primer intervalo pero superpuesto con él. El segundo intervalo puede consistir, en su totalidad o en parte, en ubicaciones sin artefactos detectables lo suficientemente grandes como para distinguirlos de manera fiable del ruido aleatorio. Se seleccionan y evalúan suficientes rasgos para completar ambos intervalos.
En las etapas 114 y 116, los rasgos de firma candidata para el primer intervalo se evalúan para garantizar que posean la magnitud adecuada para actuar como parte de cada métrica de firma. Esta etapa asegura que los rasgos que forman cada métrica de firma posean una "señal" real para codificar como una característica distintiva de la marca. Si no se aplican umbrales mínimos a candidatos de contribuyente de firma, se puede permitir que una firma quede fácilmente subsumida por el ruido en cualquier intento posterior de validar una marca con la firma genuina almacenada, lo que hace que el proceso de validación sea muy susceptible a las limitaciones de calidad y fidelidad de los dispositivos utilizados para capturar los datos de marca para el análisis de firma. Al garantizar que las métricas de firmas se formen únicamente por rasgos que satisfagan estos umbrales mínimos de magnitud, la capacidad de realizar una verificación exitosa de firmas de marcas con una amplia variedad de dispositivos de adquisición (teléfonos celulares equipados con cámara, cámaras de visión de máquina, formadores de imágenes de baja calidad o baja resolución, etc.) y en una amplia gama de entornos ambientales (iluminación variada, baja o no uniforme, etc.) puede garantizarse o facilitarse en gran medida.
En una realización, usando un código de matriz de datos 2D como ejemplo, en las etapas 110, 112 y 114 se extraen rasgos candidatos para las cuatro métricas de firma 92, 94, 96, 98 y se ordenan por magnitud. Como se ha descrito anteriormente, la marca 20 se adquiere de manera que los rasgos se pueden procesar en forma electrónica, típicamente como una imagen en color o en escala de grises. Como etapa preliminar, la matriz de datos 2D se analiza primero como un todo y se determina una cuadrícula de "mejor ajuste" que define las posiciones "ideales" de los límites entre las celdas de la matriz. Luego, los rasgos candidatos se seleccionan encontrando los rasgos que se desvían más del estado "normal" u "óptimo" de los atributos de marcas para la métrica particular que se está analizando. Considerando el ejemplo de código de matriz de datos 2D mostrado en la Figura 5, algunos atributos adecuados son:
1. Módulos 92 cuyo color, pigmentación o intensidad de marca promedio son los más cercanos al umbral promedio global que diferencia los módulos oscuros de los módulos claros según lo determinado por los algoritmos de lectura de matriz de datos, es decir, los módulos oscuros "más claros" y los módulos claros "más oscuros". En una fotocopia, como se ilustra en las Figuras 5 y 7, a bajas resoluciones una proporción significativa de módulos oscuros pueden presentar un color medio más claro que en la marca original.
2. Módulos 94 que se marcan en una posición que es la más desviada de la ubicación idealizada según lo definido por una cuadrícula de mejor ajuste aplicada al símbolo general 20. Dos métodos para identificar estos módulos son: (a) extraer las posiciones de borde de módulo de marca candidata y comparar esas posiciones de borde con sus posiciones esperadas definidas por una cuadrícula idealizada de mejor ajuste para todo el símbolo 20; (b) extraer un histograma de la región fronteriza entre dos módulos adyacentes de polaridad opuesta (claro/oscuro u oscuro/claro), con la región de muestra superpuesta en el mismo porcentaje de cada módulo en relación con la cuadrícula de mejor ajuste, y evaluar la desviación del histograma a partir de una distribución bimodal 50/50.
3. Las marcas extrañas o vacíos 96 en los módulos de símbolos, ya sean claros u oscuros, se definen como módulos que poseen una amplia gama de luminancia o densidad de pigmento; es decir, un módulo que posee niveles de pigmentación en ambos lados del umbral promedio global que diferencia los módulos oscuros de los módulos claros, siendo los mejores candidatos de firma aquellos con histogramas de luminancia bimodal que tienen la mayor distancia entre los modos dominantes más externos. En una fotocopia, como se ilustra en las Figuras 5 y 7, a altas resoluciones, una proporción significativa de módulos oscuros pueden presentar vacíos blancos que no estaban presentes en la marca original.
4. La forma de los bordes continuos largos 98 en el símbolo, midiendo su continuidad/linealidad o grado de discontinuidad/no linealidad. Un método para extraer estos datos es una proyección de valor de luminancia de todo un píxel, con una longitud de proyección de un módulo, desplazada de la cuadrícula de mejor ajuste por la mitad del módulo, que discurre perpendicularmente a la línea de cuadrícula que delimita ese borde en la cuadrícula de mejor ajuste para el símbolo. El fotocopiado típicamente afecta a la métrica de forma de borde de manera similar a la falsificación. Sin embargo, la magnitud del cambio en la métrica de forma de borde de la fotocopia típicamente no es suficiente para una detección fiable. En los experimentos, solo alrededor del 50 % de las fotocopias fueron rechazadas como aparentemente falsificadas debido a cambios en la métrica de la forma de borde.
5. El Momento de Inercia (MI) de una Matriz de Aparición Simultánea de Nivel de Gris (GLCM) de los módulos 92. Esta medida es muy sensible al manchado del módulo, lo que es útil para la detección de fotocopias.
La matriz de datos 2D es un buen ejemplo, porque consiste en celdas cuadradas en blanco y negro, en las que los rasgos descritos anteriormente se ven fácilmente. Sin embargo, los mismos principios pueden, por supuesto, aplicarse a otras formas de marca visible con codificación de datos o sin codificación de datos.
Una vez que se han identificado los rasgos candidatos que cumplen con los criterios descritos anteriormente, los rasgos candidatos se ordenan en la etapa 114 en una lista por orden de magnitud. Para definir el primer intervalo, los rasgos candidatos pueden luego someterse en la etapa 116 al filtrado de límite de magnitud encontrando la primer rasgo en cada lista que no satisface la magnitud mínima establecida para cualificar como contribuyente a esa métrica. El umbral se puede establecer en cualquier nivel conveniente lo suficientemente bajo como para incluir un número razonable de rasgos que no se pueden reproducir fácilmente, y lo suficientemente alto para excluir rasgos que no son razonablemente duraderos o que están cerca del ruido de fondo del dispositivo de adquisición de imágenes 58.
El umbral inferior para el segundo intervalo se puede configurar para incluir rasgos que están demasiado cerca del umbral de ruido para ser satisfactorios individualmente para el primer intervalo, pero que aún pueden analizarse significativamente a nivel estadístico. En esta realización, el extremo de baja magnitud de la lista ordenada se trunca desde el punto de umbral y los rasgos restantes (mayor magnitud) se almacenan, junto con sus ubicaciones en la marca, como datos de firma para esa métrica. Preferiblemente, se almacenan todas los rasgos por encima del umbral de truncamiento, y eso incluye implícitamente en la firma la información de que no hay rasgos de firma por encima del umbral de filtro de magnitud en ninguna otra parte de la marca. Cuando los intervalos primero y segundo sean contiguos o se superpongan, pueden almacenarse como una sola lista. Eso evita duplicar los rasgos en la región de superposición.
En una realización, se usa un conjunto completo de rasgos posibles, por ejemplo, cuando la marca es un código de barras 2D y la métrica es el gris de un módulo nominalmente negro, se pueden usar todos los módulos nominalmente negros del código de barras. Entonces, el primer intervalo puede consistir en un número predeterminado de los módulos negros más pálidos, y el segundo intervalo puede consistir luego en un número predeterminado de los módulos negros más oscuros. No se puede garantizar que alguno de los módulos negros sea perfectamente negro, pero los experimentos muestran que sería excepcional que una impresora de transferencia térmica en buen estado no produjera un número suficiente de módulos suficientemente negros para los fines del presente proceso.
Algunas métricas pueden ser de poco valor para la detección de fotocopias, por ejemplo, como se ilustra en la Figura 7, el manchado es mucho menos pronunciado en los módulos nominalmente blancos que en los módulos nominalmente negros. Por lo tanto, no se pueden utilizar datos de segundo intervalo para esas métricas. Sin embargo, puede ser preferible almacenar el conjunto de datos completo para todas las métricas, tanto en aras de la simplicidad como para permitir que esos datos se vuelvan a analizar si los algoritmos analíticos se mejoran posteriormente.
Como se sabe de antemano que diferentes tecnologías de dispositivos de marcado presentan rasgos de firma superiores o inferiores en diferentes atributos para su uso en la creación de datos de firma de métricas, el tipo de dispositivo de marcado se puede usar para preponderar las métricas en lo que se denomina un perfil de ponderación. Por ejemplo, si las marcas genuinas se crean utilizando una impresora de transferencia térmica, es poco probable que las proyecciones de bordes paralelas a la dirección de movimiento del material del sustrato lleven una magnitud de firma suficiente para codificar como parte de los datos de firma genuina. Sin embargo, una fotocopia de la marca genuina probablemente mostrará artefactos de fotocopia a lo largo de esas proyecciones de borde, y la ausencia de artefactos en la marca genuina puede hacer que los artefactos de fotocopia sean más visibles y más fáciles de evaluar. Este conocimiento de varios comportamientos del dispositivo de marcado puede usarse durante la captura de los datos originales de firma genuina. Si se emplean, todas las métricas utilizadas en la creación de la firma de marca genuina se ponderan según corresponda para los comportamientos conocidos de ese tipo de dispositivo de marcado en particular, y el mapeo de énfasis/desénfasis resultante de las métricas se convierte en un perfil de ponderación de métricas. En la etapa 118, este perfil de ponderación de métricas, basado en el tipo de dispositivo de marcado utilizado para crear la marca original, se almacena como parte de los datos de firma.
En la etapa 120, las métricas de firma se almacenan como listas ordenadas de rasgos, en orden descendente de magnitud. En el extremo inferior de la lista, el orden puede ser en gran medida arbitrario, porque será principalmente ruido. Sin embargo, en esta realización se necesita un orden porque se utilizará en una etapa posterior para hacer coincidir los rasgos candidatos con los rasgos originales. La entrada de lista para cada función incluye información que localiza la posición en la marca de la que se extrajo ese rasgo.
En esta realización, el registro de cada símbolo se indexa bajo un contenido de identificador único (típicamente un número de serie) incluido en los datos codificados explícitamente en el símbolo. El registro puede almacenarse en un servidor o dispositivo de almacenamiento de datos accesible por red, o puede almacenarse localmente donde sea necesario. Las copias se pueden distribuir al almacenamiento local en múltiples ubicaciones.
Métricas de firma de baja amplitud
Si el caso de un símbolo 20, o una región identificable dentro del símbolo, carece de cualquier rasgo de firma que satisfaga la magnitud mínima para el primer intervalo para una o más de las métricas de firma, en una realización, ese hecho en sí se almacena como parte de los datos de firma, utilizando así la falta de variación significativa de rasgos como parte de la información de identificación única para ese símbolo. En este caso, un símbolo sometido a verificación contra esos datos se considera genuino solo si también posee rasgos de firma cero que satisfacen la magnitud mínima para la(s) métrica(s) en cuestión, o al menos rasgos significativos suficientes para pasar una prueba estadística. En estos casos, la ponderación de esa métrica en particular disminuye, ya que una región sin características distintivas es un rasgo de identificación menos robusto que una región con características distintivas significativas. Un símbolo o región sin un rasgo de firma significativa es más útil negativamente. La ausencia de rasgos significativos tanto de la marca genuina 20 como de la marca candidata 30 es solo una prueba débil de que la marca candidata es genuina. La presencia de un rasgo significativo en una marca candidata 30, donde la marca genuina 20 no tiene ningún rasgo significativo coincidente, es una evidencia más fuerte de que la marca candidata es falsificada.
Se hace una excepción para los rasgos de una magnitud de firma apreciable que se puede atribuir al daño de símbolo en el símbolo candidato 30, revelado a través del uso antes mencionado de la información de corrección de errores de símbolo de los algoritmos de decodificación de esa simbología en particular, y sujeto a los principios de la ponderación de métricas de fidelidad de firma de imagen capturada como se ha descrito anteriormente.
En el caso extremo en el que tanto la marca genuina 20 como la marca candidata 30 contienen ÚNICAMENTE datos de subumbral (como en 2 símbolos "perfectos"), serían indistinguibles por el proceso del presente ejemplo porque ese proceso se basa en alguna variación medible en la marca genuina o falsificada para actuar como una forma de detección. Eso no es un problema en la práctica, ya que ninguno de los escenarios de uso actualmente contemplados (típicamente, impresión en línea a alta velocidad) produce símbolos perfectos. En particular, una fotocopia de un símbolo "perfecto" típicamente dará como resultado un símbolo que parece ser perfecto para los artefactos en el primer intervalo, pero muestra artefactos de fotocopia de baja magnitud en el segundo intervalo.
Análisis
Haciendo referencia a la Figura 12, en una realización, las métricas de firma se almacenan como una lista ordenada, en orden descendente de magnitud, e incluyen información que localiza su posición en la marca de la que se extrajeron. En una realización, usando un código matriz de datos 2D como ejemplo, el proceso mediante el cual se evalúa una marca o símbolo candidato para determinar si es genuino es el siguiente:
En la etapa 152, el dispositivo de adquisición de imágenes 58 adquiere una imagen de la marca candidata 30.
En la etapa 154, se descodifican los datos explícitos en la marca candidata 30 y se extrae su contenido de identificador único (UID).
En la etapa 156, el UID se usa para buscar los datos métricos de la firma almacenados originalmente para el símbolo original 20 que tiene ese UID. Los datos almacenados pueden recuperarse del almacenamiento local 64 o pueden recuperarse de un servidor o dispositivo de almacenamiento de datos accesible en red 72. En el caso de una marca candidata 30 que no contiene un UID, se puede obtener otra información de identificación relacionada con la marca candidata 30. Alternativamente, la base de datos completa de firmas de marcas genuinas en el almacenamiento 64 o 72 puede buscarse después de la etapa 164 a continuación, para intentar localizar una firma genuina que coincida con la firma de marca candidata.
En la etapa 158, en el caso de un código de barras bidimensional u otro soporte de datos para el que se pueda establecer una medida de calidad, se pueden obtener medidas de calidad para la marca candidata 30, similares a las obtenidas en la etapa 108 para la marca genuina 20. Las medidas de calidad pueden usarse en las etapas de análisis subsiguientes para reducir el peso dado a una marca, o partes de una marca, que parecen haberse dañado desde que se aplicó. Además, si las medidas de calidad del símbolo original 20 se almacenaron como parte de los datos de firma genuinos, las medidas de calidad almacenadas se pueden verificar con los datos de firma extraídos de la marca candidata 30.
En la etapa 160, los rasgos significativos de la firma se extraen de la imagen de la marca candidata 30 que se adquirió en la etapa 152. Se buscan rasgos significativos en toda la marca candidata 30 (excepto las secciones que han sido descalificadas como corruptas por Corrección de errores). Además, la información que especifica las ubicaciones dentro del símbolo de las que se extrajeron los datos de firma del símbolo original y genuino se utiliza para especificar de dónde extraer los datos de firma del símbolo candidato. Eso asegura que se observa un rasgo presente en la marca 20 pero ausente en la marca 30. Los rasgos extraídos son tanto para ambos intervalos primero y segundo.
En la etapa 162, los rasgos de la firma se codifican para su análisis.
En la etapa 164, los datos de firma para al menos el primer intervalo (de gran magnitud) extraído del símbolo candidato 30 se ordenan en el mismo orden que la lista original del símbolo original 20. Para el primer intervalo, los artefactos originales y candidatos pueden ordenarse independientemente en orden de magnitud. Para el segundo intervalo, en esta realización, los artefactos originales y candidatos se ordenan en el mismo orden por referencia a los datos de ubicación almacenados para los artefactos originales. Eso permite comparar cada módulo de la marca candidata con el módulo en la misma ubicación de la marca original.
En la etapa 166, los datos de firma candidata para el primer intervalo se comparan con los datos de firma originales almacenados para el primer intervalo. Los datos se someten a una operación estadística que revela la correlación numérica entre los dos conjuntos de datos. Cada métrica se somete a un análisis numérico individual que arroja una medida que refleja la confianza individual del símbolo candidato como artículo genuino para esa métrica. Si la marca no contiene datos de UID y no hay disponibles datos de identificación alternativos, puede ser necesario buscar a través de una base de datos de marcas similares, usando los procedimientos discutidos con referencia a la Figura 16 a continuación. Por ejemplo, en el caso de las Figuras 1 y 3, puede ser necesario buscar entre todas las marcas genuinas 20 que tengan el mismo patrón evidente de módulos en blanco y negro. El objetivo de la búsqueda es identificar, o no identificar, una sola marca genuina 20 que sea únicamente similar a la marca candidata 30.
En la etapa 168, donde el perfil de ponderación de métricas se almacenó como parte de los datos de firma genuina, esta información se usa para enfatizar y/o desenfatizar las métricas según sea apropiado para el tipo de dispositivo de marcado usado para crear las marcas genuinas originales.
En la etapa 172, por exclusión, se espera que todas las ubicaciones dentro de una marca no representada en la lista ordenada de ubicaciones de rasgos que satisfacen el umbral de magnitud mínima para el primer intervalo estén desprovistas de rasgos de firma significativas al analizar una marca genuina. Esta condición se evalúa examinando la magnitud de rasgo de firma en todas las ubicaciones dentro de una marca candidata donde se esperan rasgos por debajo del umbral, y ajustando los resultados para la métrica adecuada hacia el negativo cuando se encuentran rasgos que superan el umbral mínimo. Si los rasgos significativos se encuentran en una región que se ha determinado que ha sido dañada cuando se ha evaluado la corrección de error de símbolo u otros atributos de calidad, el ajuste se disminuye o no se lleva a cabo en absoluto, según la ubicación del daño en relación con el punto de extracción de rasgo y la naturaleza de la métrica particular implicada. Por ejemplo, si se extrae una discrepancia en un rasgo de firma en relación con la marca original 20 de un módulo de la marca candidata 30 que está cerca, pero no es la misma, de los módulos dañados, el ajuste negativo de la métrica porque de ese rasgo puede verse disminuido en una proporción que refleja una confianza reducida en la firma métrica, porque el módulo anterior, al estar cerca de una región dañada conocida, bien puede haber sufrido daños que afectan la métrica pero cae por debajo del umbral detectable de la calidad o mecanismo de evaluación ECC de la simbología. Si la discrepancia se extrae directamente de un módulo dañado, o si la métrica es uno de los tipos que abarca varios módulos y ese tramo incluye el dañado, el ajuste no se aplicará en absoluto.
En la etapa 174, estos valores de confianza individuales se usan luego para determinar una confianza general en el símbolo candidato 30 como genuino (o falsificado), con los valores de confianza individuales ponderados apropiadamente como se ha descrito anteriormente usando información de fidelidad de imagen, resolución y daño de símbolo.
En la etapa 176, se determina si el resultado está suficientemente definido para ser aceptable. Si la comparación de los datos de firma arroja un resultado indeterminado (por ejemplo, las métricas individuales tienen indicaciones contradictorias que no se pueden resolver mediante el uso del mecanismo de ponderación de datos), se solicita al usuario que envía el símbolo para su verificación que vuelva a enviar otra imagen del símbolo para el procesamiento, y el proceso vuelve a la etapa 152.
Por razones prácticas, el número de reintentos permitidos es limitado. En la etapa 178, se determina si se ha excedido el límite de reintentos. Si es así, se evita una nueva devolución para volver a escanear.
Si el resultado de la etapa 176 es indeterminado, entonces en la etapa 180 los datos en el segundo intervalo (menor magnitud) tanto para la marca original como para la marca candidata pueden recuperarse y compararse mediante un proceso similar a las etapas 166 a 178. Alternativamente, la etapa 180 también puede realizarse para las marcas que se identifican en la etapa 176 como genuinas. Alternativamente, la comparación para el segundo intervalo se puede realizar en las etapas 166 a 178 en paralelo con la comparación para el primer intervalo. Eso puede ahorrar tiempo, aunque si en una alta proporción de casos no se necesita el resultado del segundo intervalo, puede ser menos eficiente. Sin embargo, mientras que la comparación para el primer intervalo se dirige en gran medida a artefactos individuales coincidentes, la comparación para el segundo intervalo es estadística y se dirige en gran medida a medir el grado de uniformidad de los artefactos.
En la etapa 182, se notifican los resultados y finaliza el proceso.
Haciendo referencia a la Figura 13, se muestra un gráfico de la magnitud de un conjunto de artefactos. Los artefactos se ordenan a lo largo del eje X en orden descendente de magnitud, arriba del eje Y, en la firma original del artículo genuino, tal como se almacenó en la etapa 120 y se recuperó en la etapa 156. Para precisión de la comparación de segundo intervalo, se usan las mismas ubicaciones en la marca en la etapa 110 y en la etapa 160, incluso si algunas de esas ubicaciones parecen no mostrar artefactos significativos en ninguno de las etapas. También se trazan las magnitudes correspondientes, tal como podrían adquirirse en la etapa 152, para una marca genuina y para una marca de fotocopia. Como puede verse en la Figura 13, incluso la marca genuina, escaneada en la etapa 152, muestra una variación aleatoria significativa de los datos originales almacenados, debido al deterioro de la marca con el tiempo y porque en la etapa 152 se usó un escáner, por ejemplo, la cámara de un teléfono inteligente, de menor calidad que en la etapa 104. Sin embargo, la marca de fotocopia muestra una variación aleatoria mucho mayor hacia el lado derecho de la Figura 13, donde la marca escaneada originalmente en la etapa 104 tiene artefactos de baja magnitud. Así, comparando la variación de magnitud en dos intervalos, uno a la izquierda en la Figura 13 y uno a la derecha en la Figura 13, la fotocopia se puede reconocer con un sorprendentemente alto grado de precisión y confianza, incluso sin intentar evaluar los valores absolutos de las magnitudes de los artefactos.
Se puede utilizar cualquier medida estadística conveniente de falta de uniformidad, como la desviación típica o la suma de errores. Los intervalos primero y segundo pueden elegirse empíricamente para una marca genuina particular y métricas de artefactos particulares. Para marcas similares a la utilizada para generar el conjunto de datos mostrado en la Figura 13, se obtuvieron resultados satisfactorios usando los puntos de datos 1 a 100 para el primer intervalo y 61 a 160 para el segundo intervalo. El conjunto de 160 puntos de datos representaba todos los módulos nominalmente negros en la matriz de datos utilizada para el experimento. Sin embargo, como puede verse en la Figura 13, la diferencia entre los escaneos de verificación para las marcas candidatas genuinas y fotocopiadas es mayor para los puntos de datos de aproximadamente 110 a 160, que se muestran con más detalle en la Figura 14.
Por lo tanto, si la uniformidad de los artefactos en la marca candidata en el segundo intervalo es menor que la uniformidad de los artefactos en la marca original en el segundo intervalo, y la diferencia es desproporcionada con respecto a la diferencia correspondiente para el primer intervalo, eso puede indicar que la marca candidata es una fotocopia. El resultado de esta prueba puede usarse para ajustar el resultado de la etapa 178. Debido a que esta prueba adicional está disponible, algunos resultados que de otro modo podrían haberse clasificado como genuinos o falsos, pero que están cerca de la frontera, pueden tratarse como indeterminados en la etapa 178 y reconsiderado en vista de la prueba de la fotocopia en el trámite 180. Un resultado que indica que la marca candidata no es una fotocopia no suele ser convincente, porque hay muchas otras formas de copiar una marca. Sin embargo, un resultado que indique que la marca candidata es una fotocopia puede justificar la degradación de la marca candidata de "genuina" a "indeterminada", especialmente si la calificación de "genuina" estaba en la frontera, o de "indeterminada" a "falsificada".
Una vez que el análisis se ha completado con éxito, los resultados del análisis de comparación se informan en la etapa 182. El informe puede ser aprobado/fallido, o puede indicar el nivel de confianza en el resultado. Estos resultados pueden mostrarse localmente o transferirse a un sistema informático en red u otro dispositivo para realizar otras acciones. Si el resultado sigue siendo indeterminado cuando se alcanza el límite de reintentos, también pasa a la etapa 182, donde el resultado indeterminado puede informarse como tal.
Tras el almacenamiento de los datos de firma extraídos de la marca 20 mostrada en la Figura 1, el presente método es capaz de reconocer esa misma marca como genuina cuando se presenta como marca candidata 30 en virtud del hecho de que, cuando se analiza mediante el mismo proceso, se determina que posee los mismos datos de firma, al menos en un nivel medido de confianza estadística. De manera similar, el presente método es capaz de identificar una copia falsificada 30 de la marca 20 mostrada en la Figura 1, o distinguir un caso único diferente 30 de la marca, reconociendo que los datos de firma, por ejemplo, tal como se extraen del caso de la marca en la Figura 3, no coincide con la almacenada originalmente cuando la marca genuina mostrada en la Figura 1 se procesó originalmente.
En lugar o además de usar el resultado de detección de fotocopia de la etapa 180 para ayudar a determinar si la marca candidata 30 es genuina, el resultado puede usarse con fines de diagnóstico o investigación. Por ejemplo, puede ser útil saber que un falsificador fotocopia persistentemente marcas genuinas 20, e identificar el volumen y la extensión geográfica de las actividades del falsificador puede ayudar a identificar al falsificador. Debido a que las máquinas fotocopiadoras no son idénticas, en algunos casos las características de los artefactos en las marcas fotocopiadas pueden ser lo suficientemente distintivas para identificar a diferentes falsificadores.
Mediciones de referencia local para datos métricos para inmunidad ambiental
Para hacer aún más robusta la extracción de datos de firma precisos, siempre que sea posible, los métodos de esta invención utilizan la referenciación local de área dentro del símbolo analizado para componer los datos de firma. Esto proporciona una mayor inmunidad a cosas como la distorsión del sustrato antes mencionada, la iluminación no uniforme del símbolo candidato cuando se adquiere para el procesamiento, la óptica no ideal o de baja calidad en el dispositivo de adquisición, o muchas otras variables ambientales o sistemáticas. Para una realización, las localizaciones de referencia métrica son:
1. El color promedio de módulo, la pigmentación o la intensidad de marcas hacen referencia a los vecinos más cercanos del estado de módulo opuesto (oscuro frente a claro o claro frente a oscuro). Cuando una celda se identifica como rasgo significativo 92 con una densidad de pigmentación promedio desviada, es posible que sea necesario volver a evaluar las celdas para las que era un vecino más cercano, descartando la celda desviada identificada como referencia.
2. El sesgo de posición de cuadrícula de módulo hace referencia a la cuadrícula de mejor ajuste del símbolo general y, como tal, tiene una localización de referencia adaptativa nativa.
3. El análisis de marcas extrañas o vacíos en los módulos de símbolo utiliza referencias locales de color, pigmentación o intensidad de marca de módulo, es decir, el histograma de luminancia de la imagen dentro del propio módulo analizado proporciona valores de referencia para los métodos aplicados.
4. Los métodos de proyección utilizados para extraer las formas de los bordes continuos largos en el símbolo son de naturaleza diferencial y tienen inmunidad nativa a las variables de impacto típicas.
Con referencia ahora a la Figura 15, una realización alternativa es similar al proceso descrito con referencia a la Figura 5, pero puede usar tipos de marca distintos al símbolo 2D. Por ejemplo, el símbolo puede ser un código de barras lineal 1D, el logotipo de una empresa, etc. La Figura 15 muestra algunos rasgos de un código de barras lineal 1D 200 que puede usarse como métricas de firma. Estos incluyen: variaciones en la anchura y/o espacio entre las barras 202; variaciones en el color, pigmentación o intensidad promedio 204; vacíos en barras negras 206 (o puntos negros en rayas blancas); o irregularidades en la forma de los bordes de las barras 208. Si se requieren áreas negras sólidas para la detección de fotocopias, se pueden tomar de partes de las franjas negras más anchas que no muestran artefactos 204 o 206.
Análisis por el método de autocorrelación
En las realizaciones descritas anteriormente, la lista sin procesar de datos para cada métrica se compara primero con el índice de distribución y se somete a una correlación normalizada con un conjunto de métricas extraídas de orden similar de un símbolo candidato. Estos resultados de correlación se utilizan luego para llegar a una decisión de coincidencia/no coincidencia (genuina o falsificada). Para ello, el almacenamiento de la firma incluye necesariamente el orden de los módulos de símbolos genuinos originales, así como los propios valores de las métricas entrenadas, completos para cada métrica. Además de la necesidad de almacenamiento exhaustivo, los datos sin procesar no están "normalizados", porque cada métrica tiene su propia escala, a veces sin frontera, lo que complica la selección de profundidades de bits de almacenamiento. Una implementación típica de las realizaciones descritas anteriormente tiene un tamaño de firma almacenada de aproximadamente 2 kilobytes.
Con referencia ahora a las Figuras 16 a 20, se aplica una realización alternativa de métodos de posprocesamiento, almacenamiento y comparación de métricas después de que las métricas del artefacto original se hayan extraído y puesto a disposición como una lista asociada de distribución de índices (asociable por posición de módulo en el símbolo). Basándose en la autocorrelación, la aplicación de este nuevo método de posprocesamiento puede, al menos en algunas circunstancias, generar varios beneficios significativos en comparación con las firmas de las realizaciones anteriores. En la Solicitud de patente de EE. UU. publicación 2013/0228619, se explicó que al generar la función de autocorrelación en la etapa 120 y almacenar solo los datos de autocorrelación, se podría lograr una reducción significativa en el tamaño del paquete de datos. En los métodos ahora descritos, esa reducción puede no obtenerse necesariamente, porque la ubicación y el orden de ordenamiento se almacenan al menos para los artículos de datos del segundo intervalo. Sin embargo, la autocorrelación sigue proporcionando una forma robusta y eficaz de comparar los conjuntos de datos originales y candidatos.
Cuando en las realizaciones descritas anteriormente, el análisis de un conjunto particular de datos métricos toma la forma de comparar las métricas sin procesar ordenadas extraídas de un símbolo candidato con las métricas sin procesar ordenadas similares extraídas del símbolo genuino, el método de autocorrelación compara la serie de autocorrelación de los datos de métricas de símbolos candidatos ordenados con la serie de autocorrelación de los datos de símbolos genuinos ordenados (almacenados); efectivamente, las autocorrelaciones ahora están correlacionadas. Las series de autocorrelación se generan por separado para los intervalos primero y segundo, y se comparan los resultados de la correlación de los dos pares de autocorrelaciones.
Para los datos de primer intervalo, puede ser posible una autocorrelación válida simplemente ordenando cada uno de los conjuntos de datos originales y candidatos por separado en orden descendente de magnitud de los artefactos. Eso es posible porque una marca candidata genuina tendrá artefactos muy similares a los de la marca original. Sin embargo, para el segundo intervalo, la correlación entre los datos de candidato original y genuino suele ser demasiado baja. Por lo tanto, el orden de ordenamiento original se almacena en la etapa 120, y se usa el mismo orden para ordenar los datos candidatos en la etapa 164, al menos para los datos de segundo intervalo. Por lo general, es más eficaz usar el orden de ordenamiento almacenado también para los datos de primer intervalo.
Para mayor claridad, la conocida operación estadística
Figure imgf000014_0001
es la ecuación de correlación normalizada común, donde: r es el resultado de la correlación, n es la longitud de la lista de datos métricos, y x e y son los conjuntos de datos de métricas genuinas y candidatas.
Cuando la operación se implementa como autocorrelación, ambos conjuntos de datos x e y son iguales.
Para producir la serie de autocorrelación, la correlación se realiza varias veces, desplazando cada vez la serie x por una posición de índice adicional relativa a la serie y (recordando que y es una copia de x). A medida que avanza el desplazamiento, el conjunto de datos "retorna" al principio a medida que se supera el último índice de la serie de datos y debido al desplazamiento del índice x; esto a menudo se logra de manera más práctica duplicando los datos y y "deslizando" los datos x desde el desplazamiento 0 hasta el desplazamiento n para generar la serie de autocorrelación.
Al implementar el enfoque de autocorrelación, no es necesario incluir los valores de los datos de firma como parte de los datos finales. En la autocorrelación, una serie de datos simplemente se correlaciona consigo misma. Entonces, donde anteriormente era necesario entregar tanto el orden de extracción (ordenamiento) como los valores de datos de firma genuinos al dispositivo de verificación para su validación, ahora solo se necesita proporcionar el orden de ordenamiento/extracción para la operación de serie de autocorrelación. Sin embargo, debido a que el orden de ordenamiento y los datos de magnitud se almacenan al menos para el extremo de baja magnitud del intervalo, se ha encontrado que en algunas realizaciones es más compacto almacenar los valores de datos de firma reales y generar solo la curva de autocorrelación original cuando se necesita en la etapa 166.
En una realización, se calcula rxy, donde cada término x; es un artefacto representado por su magnitud y ubicación, y cada término yi = x<i+j>, donde j es el desplazamiento de los dos conjuntos de datos, para j = 0 a (n-1). Debido a la xi, se ordenan por magnitud, y la magnitud son los dígitos más significativos de xi, hay una correlación muy fuerte en o cerca de j = 0, cayendo rápidamente hacia j = n/2. Como y es una copia de x, j y n-j son intercambiables. Por lo tanto, la serie de autocorrelación siempre forma la curva en forma de U mostrada en la Figura 16, que es necesariamente simétrico respecto a j = 0 y j = n/2. Por tanto, de hecho es necesario calcular únicamente la mitad de la curva, aunque en la Figura 16 se muestra toda la curva de j = 0 a j = n para mayor claridad.
En una realización, los datos de métricas sin procesar se extraen del símbolo candidato y se ordenan en el mismo orden de ordenamiento que los datos de métrica originales, que pueden indicarse como parte de los datos de firma originales si no están predeterminados.
Luego, los datos de métricas candidatas se autocorrelacionan para cada uno de los intervalos primero y segundo. La serie de autocorrelación candidata resultante puede entonces correlacionarse con las curvas de autocorrelación originales para esa métrica o, alternativamente, los dos pares de curvas pueden compararse calculando un error de ajuste de curvas entre las curvas de cada par. Esta correlación se ilustra gráficamente en las Figuras 17 y 20. Esta puntuación de correlación final se convierte en la puntuación de "coincidencia" individual para esa métrica en particular. Una vez completadas todas las métricas, las puntuaciones de "coincidencia" se utilizan para tomar la decisión de genuino/falsificación para el símbolo candidato.
Además, se puede hacer un uso adicional de las curvas de autocorrelación aplicando análisis de series de potencias a los datos a través de la transformada discreta de Fourier (DFT). Para mayor claridad, la conocida operación
Figure imgf000015_0001
es la transformada discreta de Fourier, donde: Xk es el k-ésimo componente de frecuencia, n es la longitud de la lista de datos de métricas y x es el conjunto de datos de métricas.
A continuación, se calcula la serie de potencias de los datos DFT. A continuación, se analiza la magnitud de cada componente de frecuencia, representado por un número complejo en la serie DFT, y se descarta el componente de fase. Los datos resultantes describen la distribución de la energía espectral de datos métricos, de baja a alta frecuencia, y se convierten en la base para análisis adicionales. Ejemplos de estas series de potencias se muestran gráficamente en las Figuras 17, 18 y 20.
Se emplean dos análisis de dominio de frecuencia: Curtosis y una medida de la distribución de energía alrededor de la frecuencia de la banda central del espectro total, denominada sesgo de distribución. La curtosis es una operación estadística común utilizada para medir el "pico" de una distribución, útil aquí para señalar la presencia de frecuencias estrechamente agrupadas con banda limitada en los datos de la serie de potencia. El presente ejemplo emplea una función de curtosis modificada, definida por
Figure imgf000015_0002
donde: Y es la media de los datos de magnitud de la serie de potencias, s es la desviación típica de las magnitudes y N es el número de frecuencias espectrales discretas analizadas.
El sesgo de distribución se calcula como
Figure imgf000016_0001
donde N es el número de frecuencias espectrales discretas analizadas.
La suave curva polinomial de las firmas métricas de símbolos genuinos (que surgen del ordenamiento por magnitud) produce características reconocibles en la firma espectral cuando se analiza en el dominio de frecuencia. Un símbolo candidato, cuando los datos métricos se extraen en el mismo orden prescrito por los datos de firma genuina, presentará una distribución de energía espectral similar si el símbolo es genuino; es decir, el orden de ordenamiento genuino "concuerda" con las magnitudes métricas del candidato. El desacuerdo en las magnitudes ordenadas u otras señales superpuestas (como artefactos de fotocopia) tiende a aparecer ya que componentes de alta frecuencia que de otro modo estarían ausentes en los espectros de símbolos genuinos, lo que proporciona una medida adicional de la autenticidad del símbolo. Sin embargo, sin el análisis adicional descrito en la presente memoria descriptiva, el componente de alta frecuencia en los datos candidatos de primer intervalo no es suficientemente distintivo para ser un indicador fiable de una fotocopia. Esto aborda la posibilidad de que una serie de autocorrelación falsificada aún pueda satisfacer el umbral mínimo de coincidencia estadística del símbolo genuino. Esta es una posibilidad remota, pero es concebible que suceda cuando se usa la correlación normalizada si el intervalo general de los datos es grande en comparación con la magnitud de los errores entre los puntos de datos individuales, y el orden de ordenamiento natural de las magnitudes métricas dominantes resulta estar cerca de la del símbolo genuino. Las características de distribución de la serie de potencia DFT de dicha señal revelarán la mala calidad de la coincidencia a través de las altas frecuencias presentes en los errores de coincidencia de pequeña amplitud de la serie candidata. Tal condición podría ser indicativa de una fotocopia de un símbolo genuino. En términos específicos, aquí se espera una alta Curtosis y una alta Relación de Distribución en los espectros de un símbolo genuino.
Junto con la puntuación de coincidencia de autocorrelación, esta información de distribución de series de potencias se utiliza como una medida de "confianza" en la verificación de un símbolo candidato.
La Figura 16 muestra una comparación de la serie de autocorrelación para una única métrica entre un artículo genuino (aproximación polinomial) y un símbolo candidato (genuino en este caso). Obsérvese el acuerdo cercano; aquí la correlación entre las 2 series de autocorrelación supera el 93 %.
La Figura 17 es una serie de potencias de los datos originales de autocorrelación genuinos usados para la Figura 16. Se puede ver claramente que el espectro está dominado por bajas frecuencias.
La Figura 18 es una serie de potencias similar a la Figura 17 desde una imagen de teléfono celular adquirida del artículo genuino de la Figura 17. Hay algo de ruido de imagen presente, pero el espectro de potencia general se acerca mucho al espectro genuino, con el mismo dominio de los componentes de baja frecuencia.
La Figura 19 muestra una comparación de la serie de autocorrelación para una única métrica entre la aproximación polinomial para un artículo genuino y un símbolo candidato (aquí, una falsificación). Existe un desacuerdo considerable, y la autocorrelación candidata es notablemente más irregular que en la Figura 16.
La correlación numérica entre las dos series es baja (<5 %), y la forma irregular de los datos también es evidente en el análisis DFT (abajo).
La Figura 20 muestra la serie de potencias de la imagen adquirida con el teléfono celular del símbolo falsificado del trazado 4. Obsérvese cómo los componentes de baja frecuencia disminuyen con la energía espectral total ahora distribuida para incluir partes significativas del intervalo de frecuencia más alto.
Evaluación del valor de probabilidad de fotocopia
Si se calcula una puntuación agregada ponderada para todas las métricas disponibles para resultados como los que se muestran en las Figuras 13 y 14, una marca candidata genuina tendrá típicamente una coincidencia considerablemente mejor con la marca original que una marca candidata fotocopiada. La diferencia entre las dos marcas candidatas no es grande, y en una simple comparación entre la marca candidata y los datos originales, no siempre es fácil discriminar entre la fotocopia y el candidato genuino. Sin embargo, como puede verse incluso mediante una simple inspección de la Figura 13, la discrepancia es más pronunciada en los datos de valor bajo que se muestran en primer plano en la Figura 14. Por lo tanto, al evaluar la coincidencia entre los datos de marca original y los datos de marca candidata por separado para intervalos de magnitud alta y baja, y al comparar las dos evaluaciones, se puede hacer una discriminación mucho más segura entre los candidatos originales y fotocopiados.
En un ejemplo, la comparación puede expresarse por P = ABS ((r1 - r2) / (r1 2)) donde: P es una puntuación de probabilidad de fotocopia; r1 es una puntuación de coincidencia agregada entre las firmas genuina y candidata para el primer intervalo (lado izquierdo de la Figura 13); r2 es una puntuación de coincidencia añadida entre las firmas genuinas y candidatas para el segundo intervalo (lado derecho de la Figura 13).
En una prueba usando 135 marcas de muestra y sus fotocopias, usando los 100 artefactos más prominentes (correspondientes a los artefactos 1 a 100 de la Figura 13) para r1 y 100 artefactos menos prominentes (correspondientes a los artefactos 61 a 160 de la Figura 13) para r2, y utilizando una aproximación polinomial del valor de autocorrelación descrito anteriormente para la evaluación, solo 9 calificaciones de candidatos genuinos tenían valores de P superiores a 0.2, y solo uno tenía un valor de P superior a 0.4. Solo 9 marcas de fotocopia tenían valores de P inferiores a 0.2 y solo 21 tenían valores de P inferiores a 0.4. Al elegir un umbral adecuado para P (aproximadamente 0.2 en estos datos), las fotocopias se identificaron con una precisión superior al 85 %.
Varianza estadística de los datos de subumbral
La detección de fotocopias puede avanzar aún más considerando cómo la distribución de datos, el intervalo y la desviación típica del "subumbral" de la marca candidata se comparan con los valores de subumbral original. Para este propósito, los datos de "subumbral" son datos para módulos que en la captura de datos original no mostraron ningún artefacto lo suficientemente grande como para distinguirlos de manera fiable del ruido aleatorio. Si bien los valores de datos exactos generalmente no son útiles para aplicar directamente la autocorrelación u otro análisis a la región de señal pequeña (porque el "ruido" presente en la adquisición de una imagen candidata supera fácilmente cualquier valor "real" de los datos métricos extraídos), los artefactos de fotocopia se añaden a ese ruido de manera medible. Por lo tanto, se puede caracterizar una línea de base de ruido de datos por debajo del umbral en las imágenes candidatas adquiridas, y si esa línea de base se excede en una o más mediciones (sumas de errores, desviación típica, etc.), eso puede tomarse como una indicación de que otro proceso está en funcionamiento añadiendo variabilidad a lo que debería ser un intervalo de datos más pequeño y de menor amplitud.
Usando únicamente la prueba de subumbral del documento US 2013/0228619, que simplemente confirma que no ha aparecido un artefacto detectable en un módulo previamente libre de artefactos, una fotocopia de una marca genuina generalmente no es evidente. Una fotocopia afecta a las métricas de una marca, pero típicamente lo hace al superponer un cambio (ruido visual, varianza de uniformidad, etc.) en cada módulo dentro del símbolo. Por lo tanto, cuando se evalúa a través de la autocorrelación de la lista ordenada, la fotocopia parece genuina: el efecto equivale a un "desplazamiento DC" de la curva de autocorrelación, o la adición de una constante, que tiene un efecto mínimo cuando se calcula el error de ajuste de la curva. Sin embargo, si se observa la región de subumbral desde el punto de vista de la uniformidad del conjunto de datos de subumbral en comparación con el de un artículo genuino (intervalo, desviación típica, etc.), se puede ver que, en efecto, se crea una nueva métrica que caracteriza esa uniformidad. Resulta que, cuando se fotocopian, las regiones altamente uniformes se vuelven menos uniformes de manera caótica; es decir, los datos de subumbral, que tienen una varianza relativamente baja en la marca del artículo genuino, tienden a ser un conjunto de valores más variable en una fotocopia, pero al mismo tiempo permanecen generalmente por debajo del valor límite de subumbral.
Cuando las regiones de subumbral para marcas candidatas a fotocopias y genuinas se trazan frente a los datos de firma originales para la misma marca, como se ilustra en la Figura 14, se puede ver que los valores que componen los datos de subumbral para las fotocopias son mucho más variables que para los datos de artículo genuino.
Se pueden aplicar varios métodos numéricos en la búsqueda de la detección de fotocopias utilizando los datos en esta región. Un primer método es un enfoque de suma de errores. Aquí se calcula la suma acumulada de las diferencias entre los datos de subumbral de firma de marca original y los datos de subumbral de marca candidata. Como puede verse en la Figura 14, esto es visiblemente mayor en las fotocopias que en las marcas candidatas genuinas. En un trazado acumulativo de la suma acumulada contra el número de módulos, las curvas para los datos de firma de fotocopia divergen de los datos de firma originales más rápido que las curvas para los datos de firma de marca candidata genuina. Por lo tanto, es una cuestión simple aplicar un límite de tasa de crecimiento a este valor de suma de errores y usarlo para indicar la presencia de una señal similar a una fotocopia en las regiones de subumbral de los datos de métricas de la firma candidata. También se pueden aplicar otros métodos estadísticos a esta región de datos.
Examinar momentos de inercia de la matriz de aparición simultánea de nivel de gris (GLCM)
En una realización alternativa, se emplea análisis de textura para evaluar regiones homogéneas en busca de variaciones creadas en el proceso de fotocopiado. La inercia (una medida estadística de contraste) en los rasgos de símbolos se compara con la misma inercia registrada durante la extracción de métricas de las firmas de marcas genuinas originales. Un aumento en la estadística de inercia de GLCM indica que la marca candidata puede ser una reproducción fotocopiada de la marca genuina. En algunos casos, por ejemplo, cuando el símbolo se imprime en un sustrato manchado que podría dar una línea de base falsa, la relación entre la inercia del módulo oscuro de destino y la inercia de un módulo claro adyacente puede dar un resultado más preciso que una simple medida de la Inercia para el módulo oscuro. Los rasgos de símbolo elegidos son módulos que son completamente negros en la marca original. Típicamente, se identifican como módulos en la parte inferior de la lista ordenada por magnitud para módulos negros con vacíos blancos o para módulos negros que son más claros que la negrura nominal. Un valor de inercia alto indica un módulo que está manchado en blanco y negro en la escala de tamaño de los píxeles utilizados para generar el GLCM. Si el módulo original tenía una inercia baja y el módulo candidato tiene una inercia mucho mayor, eso implica un aumento en el manchado, lo que puede ser una base sólida para sospechar que el candidato es una fotocopia. Para una comparación simple, se puede calcular la suma de los valores de inercia para todas las celdas analizadas en las marcas original y candidata. Si la suma de la marca candidata supera la suma de la marca original en más de un umbral establecido, se puede considerar que se trata de una fotocopia.
Los resultados de pruebas de momentos de inercia (MI) se midieron para varios conjuntos de pruebas de matriz de datos 2D. Experimentalmente, este método se probó utilizando el mismo conjunto de datos que para los otros métodos, por lo que los píxeles utilizados para el cálculo de GLCM tenían el mismo tamaño que el rasgo más pequeño detectable en las otras métricas, típicamente al menos 500 píxeles por módulo de una matriz de datos 2D estándar. Al aprender la firma de artículo genuino original para esta métrica, se ha evaluado el MI para cada módulo dentro de la marca, luego se ordenó para otorgar el mayor peso a las ubicaciones más homogéneas (valores de MI más bajos). Al evaluar una marca candidata, los valores de MI se extrajeron utilizando el orden de ordenamiento genuino original y se analizaron los datos resultantes. La Figura 21 es un ejemplo de un trazado de MI para los datos genuinos originales y para una marca candidata genuina y una fotocopia de una marca genuina.
A partir de la Figura 21 es evidente que las fotocopias tienden a exhibir valores de MI elevados en comparación con los valores de MI que se encuentran en las mismas regiones dentro de las marcas genuinas. Por lo tanto, es una cuestión sencilla establecer una prueba para esta condición. Las áreas debajo de cada una de las líneas de trazado se pueden integrar para establecer una medida del MI agregado o el área MI (AMI) en las regiones evaluadas dentro de la marca. A continuación, se determina la diferencia dAMI entre la medición del área MI genuina original y la medición del área MI candidata (dAMIgn para las pruebas candidatas genuinas y dAMIpc para las fotocopias).
Resumiendo los resultados de la prueba para la Figura 21 y dos ejemplos similares, se puede ver que:
Figure imgf000018_0001
Puede verse que el resultado dAMI es generalmente más alto en fotocopias de marcas genuinas que el que se encuentra en las propias marcas genuinas. En este punto, se puede aplicar una prueba de umbral simple para indicar la presencia de posibles artefactos de fotocopia dentro de una marca candidata. Esta prueba para artefactos de fotocopia se puede combinar con cualquiera de las pruebas para una marca genuina descritas anteriormente o en nuestro anterior documento US 2013/0228619.
Las ventajas de algunas o todas las realizaciones divulgadas pueden incluir, sin limitación, la capacidad de identificar de manera única un artículo mediante el uso de una marca que se ha colocado en el artículo para otro propósito, sin necesidad de introducir específicamente artículos evidentes o encubiertos para el fines de lucha contra la falsificación. Otra ventaja es que dicha identificación puede ser muy difícil de falsificar. Otras ventajas incluyen la capacidad de integrar las funciones de la presente invención en tecnologías existentes comúnmente utilizadas para leer símbolos de códigos de barras, tales como cámaras de visión de máquina, lectores de códigos de barras y "teléfonos inteligentes" de consumo equipados con cámaras, sin alterar el comportamiento principal, la construcción o usabilidad de los dispositivos. Otra ventaja, en el caso de un código de barras bidimensional, por ejemplo, es la capacidad de utilizar los datos de firma como un medio para proporcionar un soporte de datos redundante con el fin de identificar un artículo.
En un caso en el que el daño a la marca candidata solo la haga parcialmente legible, o imposibilite leer y/o decodificar un símbolo portador de datos, o similar, los rasgos de identificación no dañados de solo una parte de la marca pueden ser suficientes para identificar la marca. Una vez que la marca candidata se identifica así con una marca genuina, la firma de la marca genuina se puede recuperar del almacenamiento, y cualquier información que se incorporó a la firma, como el número de serie del artículo marcado, se puede recuperar de la firma recuperada en lugar de directamente de la marca dañada. Por lo tanto, los datos de firma, ya sea en combinación con la información del símbolo codificado parcialmente recuperada o no, se pueden usar para identificar de manera única un artículo. Esto tiene muchas ventajas, particularmente considerando cómo una marca que contiene datos puede dañarse durante el tránsito de un artículo marcado a través de la cadena de suministro de un fabricante. Este desafío se ha abordado comúnmente en el pasado asegurándose de que se crea un soporte de datos con una calidad o "calificación" muy alta en el punto de marcado. El objetivo era producir una marca de tan alta calidad que aún fuera completamente legible incluso después de sufrir una degradación significativa debido a daños físicos en la cadena de suministro. Eso impuso una carga excesiva de costes y redujo los rendimientos de fabricación para el productor del artículo, ya que se esforzó por garantizar que solo las marcas de la más alta calidad ingresaran a su cadena de suministro. La presente realización tiene la ventaja de eliminar la necesidad de producir marcas de la más alta calidad al mismo tiempo que proporciona una forma de identificar marcas ilegibles que no pueden decodificarse de la manera normal debido al daño del símbolo.
Si bien la descripción escrita anterior permite que alguien con conocimientos ordinarios haga y use lo que se considera actualmente como el mejor modo de hacerlo, aquellos con conocimientos ordinarios comprenderán y apreciarán la existencia de variaciones, combinaciones y equivalentes de la realización específica, método y ejemplos en esta memoria. Por lo tanto, la invención no está limitada por las realizaciones, métodos y ejemplos descritos anteriormente, sino que se extiende a todas las realizaciones y métodos dentro del alcance y el espíritu de la divulgación.
Por ejemplo, se describe un ejemplo de rasgos de un código de barras 2D con referencia a la Figura 5. Se describe un ejemplo de rasgos de un código de barras 1D con referencia a la Figura 15. Como se ha mencionado anteriormente, se pueden usar otros símbolos, como el logotipo de empresa, como símbolo de objetivo. Los rasgos, y las variaciones específicas en esos rasgos, que se utilizan como métricas de firma son casi ilimitadas, y está dentro de la habilidad ordinaria en la técnica, con la comprensión de la presente memoria descriptiva, elegir un símbolo adecuado o disponible, y elegir métricas y rasgos adecuados, para poner en práctica los presentes métodos. En algunas realizaciones, no es necesario aplicar la marca con vistas a extraer datos de firma según los presentes métodos. En su lugar, se podría utilizar una marca que ya se haya creado, siempre que contenga rasgos de artefacto adecuados.
Cuando se aplica una marca original a un artículo original y/o se añade un artículo original a un objeto original, la marca o artículo puede contener información sobre el artículo u objeto. En ese caso, los métodos y sistemas descritos anteriormente pueden incluir la verificación de información sobre el artículo u objeto que se incluye en la marca o el artículo, incluso cuando el artículo u objeto subyacente no se reemplaza o altera físicamente. Por ejemplo, cuando un objeto está marcado con una fecha de caducidad, puede ser deseable rechazar un objeto con una fecha de caducidad alterada como "no auténtico", incluso si el objeto en sí es el objeto original. Las realizaciones de los presentes sistemas y métodos producirán ese resultado, si los artefactos usados para la verificación se encuentran en la fecha de caducidad, por ejemplo, como imperfecciones de impresión. De manera similar, se puede verificar otra información, como números de lote y otros datos de seguimiento del producto.
Las realizaciones se han descrito principalmente en términos de adquisición de un código de barras 2D completo para datos de firma. Sin embargo, la marca puede dividirse en zonas más pequeñas. Cuando la marca original es lo suficientemente grande y tiene suficientes artefactos que son posibles datos de firma, solo se puede adquirir y procesar una o menos zonas. Cuando se adquiere y procesa más de una zona, los datos de firma de diferentes zonas pueden registrarse por separado. Esto es especialmente útil si la marca es un símbolo que codifica datos con corrección de errores y la corrección de errores se relaciona con zonas más pequeñas que el símbolo completo. Entonces, si la corrección de errores indica que parte del símbolo candidato está dañada, los datos de firma de la parte dañada pueden descartarse.
En aras de la simplicidad, se han descrito realizaciones específicas en las que los artefactos son defectos en la impresión de una marca impresa, aplicada directamente al artículo que se va a verificar, o a una etiqueta aplicada a un objeto que se va a verificar. Sin embargo, como ya se ha mencionado, se puede utilizar cualquier rasgo que sea suficientemente detectable y permanente, y suficientemente difícil de duplicar.
Algunas de las realizaciones se han descrito utilizando una base de datos de datos de firma para artículos genuinos, dentro de la que se realiza una búsqueda de datos de firma que coincidan al menos parcialmente con los datos de firma extraídos de una marca candidata. Sin embargo, si el artículo candidato se identifica como un artículo genuino específico de alguna otra manera, una búsqueda puede ser innecesaria y los datos de firma extraídos de la marca candidata pueden compararse directamente con los datos de firma almacenados para el artículo genuino específico.
En consecuencia, debe hacerse referencia a las reivindicaciones adjuntas, en lugar de a la memoria descriptiva anterior, como indicación del alcance de la invención. La presente invención se define por el objeto de las reivindicaciones adjuntas. Se proporcionan aspectos adicionales en las reivindicaciones dependientes.

Claims (20)

REIVINDICACIONES
1. Un método para verificar la identidad de un artículo impreso no verificado, el método comprende:
en un dispositivo de captura de imágenes, capturar una imagen del artículo impreso no verificado,
en donde el artículo impreso no verificado incluye artefactos y al menos algunos de los artefactos no eran controlablemente producibles al producir el artículo impreso no verificado;
en un procesador:
extraer información asociada con los artefactos del artículo impreso no verificado;
clasificar la información asociada con los artefactos del artículo impreso no verificado según la magnitud; recuperar información clasificada almacenada asociada con artefactos de un artículo impreso original desde un dispositivo de almacenamiento;
en un primer intervalo de magnitudes, comparar la información clasificada asociada con los artefactos del artículo impreso no verificado con la información clasificada asociada con los artefactos del artículo impreso original;
en un segundo intervalo de magnitudes, comparar la información clasificada asociada con los artefactos del artículo impreso no verificado con la información clasificada asociada con los artefactos del artículo impreso original,
en donde el segundo intervalo incluye magnitudes inferiores a la magnitud más baja del primer intervalo; y cuando una diferencia entre la información clasificada asociada con los artefactos del artículo impreso no verificado y la información clasificada asociada con los artefactos del artículo original es mayor para el segundo intervalo que para el primer intervalo en más de una cantidad de umbral, identificar el artículo impreso no verificado artículo como una copia.
2. El método de la reivindicación 1, en donde la diferencia es una diferencia promedio o agregada o una proporción de magnitudes de artefactos o una medida estadística de variación en magnitudes de artefactos.
3. El método de la reivindicación 1, que comprende además:
en el primer intervalo de magnitudes, evaluar una probabilidad estadística de que la información asociada con los artefactos del artículo impreso no verificado coincida con la información asociada a los artefactos del artículo impreso original;
en el caso de que la probabilidad estadística supere un primer umbral, determinar que el artículo impreso no verificado es el artículo impreso original;
en el caso de que la probabilidad estadística esté por debajo de un segundo umbral inferior al primer umbral, determinar que el artículo impreso no verificado no es un artículo impreso original; y
llevar a cabo las etapas de comparación únicamente en el caso de que la probabilidad estadística se encuentre entre los umbrales primero y segundo.
4. El método de la reivindicación 1, en donde el primer intervalo incluye un número predeterminado de las magnitudes más altas.
5. El método de la reivindicación 1, en donde dicho segundo intervalo incluye un número predeterminado de las magnitudes más bajas.
6. El método de la reivindicación 1, en donde los intervalos primero y segundo se superponen.
7. El método de la reivindicación 1, que comprende además calcular una serie de autocorrelación de la información clasificada asociada con los artefactos del artículo impreso no verificado para cada uno de los intervalos primero y segundo.
8. El método de la reivindicación 1,
en donde al menos algunos de los artefactos del artículo impreso no verificado son artefactos de un símbolo que codifica datos y admite la detección de errores,
en donde extraer información que representa los artefactos del artículo impreso no verificado incluye determinar un estado de error de un símbolo que tiene los artefactos del artículo impreso no verificado, y
cuando el estado de error indica que parte del símbolo está dañado, descontar artefactos en la parte dañada del símbolo.
9. El método de la reivindicación 1, en donde cada una de las etapas de comparación incluye la corrección de las propiedades de al menos uno de los aparatos que crearon los artefactos originales, un aparato que se usa para examinar el artículo impreso original en busca de la información que representa los artefactos, y un aparato que se usa para examinar el artículo impreso no verificado en busca de la información que representa los artefactos.
10. El método de la reivindicación 9, en donde:
los artefactos del artículo impreso no verificado y del artículo impreso original pertenecen a categorías distintas; comparar, en el primer intervalo de magnitudes, la información clasificada asociada con los artefactos del artículo impreso no verificado con la información clasificada asociada con los artefactos del artículo impreso original comprende realizar la comparación en cada categoría y combinar los resultados de las comparaciones; comparar, en el segundo intervalo de magnitudes, la información clasificada asociada con los artefactos del artículo impreso no verificado con la información clasificada asociada con los artefactos del artículo impreso original comprende realizar la comparación en cada categoría y combinar los resultados de las comparaciones; y la corrección comprende ponderar la combinación según una tendencia conocida del aparato que creó el artículo impreso original para producir artefactos en diferentes categorías con diferentes frecuencias o diferentes valores de una característica.
11. El método de la reivindicación 1, que comprende además:
examinar un artículo impreso original en busca de artefactos específicos del artículo impreso original;
extraer información asociada con los artefactos;
clasificar la información asociada con los artefactos del artículo impreso original según la magnitud; y almacenar datos que representan la información clasificada en un dispositivo de almacenamiento no transitorio legible por ordenador separado del artículo impreso original.
12. El método de la reivindicación 11, en donde:
el artículo impreso original comprende una marca que comprende un identificador y al menos uno de los artefactos, en donde el identificador se asocia con el artículo impreso original y el al menos un artefacto no altera la asociación; y el almacenamiento comprende almacenar la información para que sea al menos parcialmente localizable utilizando el identificador.
13. Un sistema para verificar la identidad de un artículo impreso no verificado, comprendiendo el sistema:
un dispositivo de captura de imágenes que captura una imagen del artículo impreso no verificado,
en donde el artículo impreso no verificado incluye artefactos y al menos algunos de los artefactos no eran controlablemente producibles al producir el artículo impreso no verificado;
un procesador que lleva a cabo etapas que comprenden:
extraer información asociada con los artefactos del artículo impreso no verificado;
clasificar la información asociada con los artefactos del artículo impreso no verificado según la magnitud; recuperar información clasificada almacenada asociada con artefactos de un artículo impreso original desde un dispositivo de almacenamiento;
en un primer intervalo de magnitudes, comparar la información clasificada asociada con los artefactos del artículo impreso no verificado con la información clasificada asociada con los artefactos del artículo impreso original; en un segundo intervalo de magnitudes, comparar la información clasificada asociada con los artefactos del artículo impreso no verificado con la información clasificada asociada con los artefactos del artículo impreso original,
en donde el segundo intervalo incluye magnitudes inferiores a la magnitud más baja del primer intervalo; y cuando una diferencia entre la información clasificada asociada con los artefactos del artículo impreso no verificado y la información clasificada asociada con los artefactos del artículo original es mayor para el segundo intervalo que para el primer intervalo en más de una cantidad de umbral, identificar el artículo impreso no verificado artículo como una copia.
14. El sistema de la reivindicación 13, en donde el artículo impreso no verificado comprende una pluralidad de áreas y la información clasificada asociada con los artefactos del artículo no verificado comprende información asociada con el contraste espacial de al menos algunas de la pluralidad de áreas impresas.
15. El sistema de la reivindicación 14, en donde la información asociada con el contraste espacial de al menos algunas de las áreas impresas es un momento de inercia de una matriz de aparición simultánea de nivel de gris.
16. Un medio legible por ordenador que tiene almacenadas instrucciones ejecutables por ordenador para llevar a cabo un método que comprende:
recibir una imagen de un artículo impreso desde un dispositivo de adquisición de imágenes;
analizar la imagen para identificar imperfecciones en el artículo impreso,
determinar una magnitud para cada una de las imperfecciones identificadas del artículo impreso, dando como resultado una pluralidad de magnitudes asociadas con imperfecciones identificadas;
recuperar una firma de marca genuina de una base de datos de firmas de marca genuina,
en donde la firma de marca genuina se basa en imperfecciones de un artículo impreso original,
en donde la firma de la marca genuina contiene datos de una pluralidad de magnitudes asociadas con las imperfecciones del artículo impreso original;
en un primer intervalo de magnitudes de las imperfecciones identificadas y la firma de marca genuina, comparar las magnitudes identificadas con las de la firma de marca genuina;
en un segundo intervalo de magnitudes de las imperfecciones identificadas y la firma de marca genuina, comparar las magnitudes identificadas con las de la firma de marca genuina;
en donde el segundo intervalo de magnitudes incluye magnitudes inferiores a la magnitud más baja del primer intervalo; y
cuando una diferencia entre las magnitudes asociadas con las imperfecciones identificadas y las magnitudes asociadas con las imperfecciones de la firma de la marca genuina es mayor para el segundo intervalo que para el primer intervalo en más de una cantidad de umbral, identificando el artículo impreso no verificado como una copia.
17. El medio legible por ordenador de la reivindicación 16, en donde la marca impresa incluye información codificada relativa a un artículo fabricado.
18. El medio legible por ordenador de la reivindicación 16, en donde la marca impresa es un logotipo.
19. El medio legible por ordenador de la reivindicación 16, en donde
la información codificada incluye un identificador único, y
uno o más procesadores recuperan la firma de marca genuina de la base de datos utilizando el identificador único.
20. El medio legible por ordenador de la reivindicación 16, en donde el dispositivo de adquisición de imágenes comprende un lector de código de barras.
ES15755854T 2014-02-28 2015-02-24 Métodos y un sistema para verificar la identidad de un artículo impreso Active ES2920383T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201461945917P 2014-02-28 2014-02-28
US14/561,215 US20150083801A1 (en) 2012-03-01 2014-12-04 Unique Identification Information from Marked Features
PCT/US2015/017357 WO2015130697A1 (en) 2014-02-28 2015-02-24 Methods and a system for verifying the identity of a printed item

Publications (1)

Publication Number Publication Date
ES2920383T3 true ES2920383T3 (es) 2022-08-03

Family

ID=54009552

Family Applications (1)

Application Number Title Priority Date Filing Date
ES15755854T Active ES2920383T3 (es) 2014-02-28 2015-02-24 Métodos y un sistema para verificar la identidad de un artículo impreso

Country Status (14)

Country Link
EP (1) EP3111376B1 (es)
JP (1) JP6181885B2 (es)
CN (1) CN106415608B (es)
AU (1) AU2015223174B2 (es)
CA (2) CA2973849C (es)
DK (1) DK3111376T3 (es)
ES (1) ES2920383T3 (es)
IL (1) IL247490B (es)
MX (1) MX360886B (es)
MY (1) MY179087A (es)
RU (1) RU2621006C1 (es)
SA (1) SA516371755B1 (es)
SG (1) SG11201607112SA (es)
WO (1) WO2015130697A1 (es)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2820592T3 (en) 2012-03-01 2018-04-23 Sys Tech Solutions Inc Unique identification information from labeled features
US20150379321A1 (en) 2012-03-01 2015-12-31 Sys-Tech Solutions, Inc. Methods and a system for verifying the authenticity of a mark
US20150169928A1 (en) 2012-03-01 2015-06-18 Sys-Tech Solutions, Inc. Methods and a system for verifying the identity of a printed item
US9940572B2 (en) 2015-02-17 2018-04-10 Sys-Tech Solutions, Inc. Methods and a computing device for determining whether a mark is genuine
KR101889265B1 (ko) * 2015-06-16 2018-08-16 시스-테크 솔루션스 인코포레이티드 마크가 진짜인지를 결정하기 위한 방법들 및 컴퓨팅 디바이스
SG11201807829RA (en) * 2016-03-14 2018-10-30 Sys Tech Solutions Inc Methods and a computing device for determining whether a mark is genuine
EP3686027B1 (de) 2019-01-27 2021-07-14 U-NICA Systems AG Verfahren zum drucken von authentifizierungskennzeichen mit einem amplitudenmodulierten rasterdruck
US20220028053A1 (en) * 2019-03-19 2022-01-27 Hewlett-Packard Development Company, L.P. Extraction and comparison of actual and target surface attribute values
CN111882332A (zh) * 2020-07-31 2020-11-03 浙江水晶光电科技股份有限公司 一种信息验证方法和装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6865337B1 (en) * 2000-08-08 2005-03-08 Conexant Systems, Inc. System and method for detecting modifications of video signals designed to prevent copying by traditional video tape recorders
US20040161153A1 (en) * 2003-02-18 2004-08-19 Michael Lindenbaum Context-based detection of structured defects in an image
US7006630B2 (en) * 2003-06-03 2006-02-28 Matsushita Electric Industrial Co., Ltd. Methods and apparatus for digital content protection
US7532804B2 (en) * 2003-06-23 2009-05-12 Seiko Epson Corporation Method and apparatus for video copy detection
US20050053236A1 (en) * 2003-09-08 2005-03-10 Samii Mohammad M. Printed material verification
US7827171B2 (en) * 2005-09-30 2010-11-02 Pitney Bowes Inc. Copy detection using contour analysis
US20120327450A1 (en) * 2006-07-19 2012-12-27 Advanced Track & Trace Methods and devices for securing and authenticating documents
JP2010507847A (ja) * 2006-10-26 2010-03-11 マンローラント・アーゲー 印刷製品の確率的なマーキング及び追跡のための装置、方法、及びプロセス
EP2045783A1 (en) * 2007-10-02 2009-04-08 Kba-Giori S.A. Method and system for controlled production of security documents, especially banknotes
DE102009016194A1 (de) * 2008-04-23 2009-10-29 Heidelberger Druckmaschinen Ag Verfahren zur Herstellung eines Sicherheitsmerkmals auf einem flachen Substrat
EP2348465A1 (en) * 2009-12-22 2011-07-27 Philip Morris Products S.A. Method and apparatus for storage of data for manufactured items
JP2012141729A (ja) * 2010-12-28 2012-07-26 Jvc Kenwood Corp 真贋判定方法、真贋判定装置、真贋判定システムおよびカラー二次元コード
DK2820592T3 (en) * 2012-03-01 2018-04-23 Sys Tech Solutions Inc Unique identification information from labeled features
CN103279731B (zh) * 2013-06-06 2016-05-25 格科微电子(上海)有限公司 二维码防伪方法及其防伪验证方法

Also Published As

Publication number Publication date
MY179087A (en) 2020-10-27
RU2621006C1 (ru) 2017-05-30
CN106415608A (zh) 2017-02-15
DK3111376T3 (da) 2022-07-11
CA2973849C (en) 2018-12-18
MX2016011165A (es) 2017-02-28
CA2940761C (en) 2017-09-05
CA2940761A1 (en) 2015-09-03
EP3111376B1 (en) 2022-04-06
JP6181885B2 (ja) 2017-08-16
AU2015223174A1 (en) 2016-09-08
CN106415608B (zh) 2020-08-11
CA2973849A1 (en) 2015-09-03
WO2015130697A1 (en) 2015-09-03
SA516371755B1 (ar) 2020-03-22
EP3111376A4 (en) 2017-03-29
IL247490B (en) 2019-03-31
SG11201607112SA (en) 2016-09-29
MX360886B (es) 2018-11-21
EP3111376A1 (en) 2017-01-04
AU2015223174B2 (en) 2017-08-31
JP2017516214A (ja) 2017-06-15

Similar Documents

Publication Publication Date Title
ES2920383T3 (es) Métodos y un sistema para verificar la identidad de un artículo impreso
ES2664722T3 (es) Información de identificación única de rasgos marcados
US10832026B2 (en) Method and system for determining whether a barcode is genuine using a gray level co-occurrence matrix
US10997385B2 (en) Methods and a system for verifying the authenticity of a mark using trimmed sets of metrics
ES2776399T3 (es) Métodos y un sistema para verificar la autenticidad de una marca