ES2381860T3 - Clasificación utilizando máquinas de vectores de soporte y selección de variables - Google Patents
Clasificación utilizando máquinas de vectores de soporte y selección de variables Download PDFInfo
- Publication number
- ES2381860T3 ES2381860T3 ES06795394T ES06795394T ES2381860T3 ES 2381860 T3 ES2381860 T3 ES 2381860T3 ES 06795394 T ES06795394 T ES 06795394T ES 06795394 T ES06795394 T ES 06795394T ES 2381860 T3 ES2381860 T3 ES 2381860T3
- Authority
- ES
- Spain
- Prior art keywords
- variables
- discriminator
- data
- variable
- currency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012706 support-vector machine Methods 0.000 title claims abstract description 30
- 238000000034 method Methods 0.000 claims abstract description 27
- 239000013598 vector Substances 0.000 claims abstract description 27
- 238000012360 testing method Methods 0.000 claims abstract description 9
- 230000006978 adaptation Effects 0.000 claims abstract description 5
- 230000004308 accommodation Effects 0.000 claims abstract 3
- 238000004364 calculation method Methods 0.000 claims abstract 2
- 238000012512 characterization method Methods 0.000 claims abstract 2
- 238000009795 derivation Methods 0.000 claims abstract 2
- 238000005259 measurement Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims 1
- 238000000605 extraction Methods 0.000 claims 1
- 238000004519 manufacturing process Methods 0.000 claims 1
- 238000012549 training Methods 0.000 abstract description 4
- 230000000875 corresponding effect Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2115—Selection of the most significant subset of features by evaluating different subsets according to an optimisation criterion, e.g. class separability, forward selection or backward elimination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2132—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Inspection Of Paper Currency And Valuable Securities (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Abstract
Un método para derivación de un discriminador para clasificar ítems de moneda circulante utilizando una pluralidad de variables para la caracterización de los ítems de moneda, comprendiendo el método la determinación de un subconjunto representativo de las variables para qué dicho discriminador retenga, incluidas las etapas de: entrenar una máquina de vectores de soporte con toda la pluralidad de variables, en donde la máquina de vectores de soporte retorna los vectores soporte que están siendo utilizados para construir un vector discriminante; proyectar los datos medidos de toda la pluralidad de variables para un número predeterminado de ítems de prueba de moneda sobre un vector discriminante; inicializar un conjunto de variables restantes con toda la pluralidad de variables y un conjunto vacío de variables seleccionadas; y repetir, hasta que una cantidad de variables seleccionadas o una adecuación alcancen un valor dado, las etapas de: evaluar un criterio de adecuación que comprende el cálculo de la correlación entre las variables y los datos medidos proyectados para todo el resto de variables para obtener un listado de adecuaciones; encontrar una variable que maximice la adecuación del listado de adecuaciones; añadir esta variable al conjunto de variables seleccionadas; remover esta variable del conjunto de variables restantes; y entrenar nuevamente la máquina de vectores de soporte con las variables seleccionadas y retener un segundo vector discriminante como el discriminador.
Description
Clasificación utilizando máquinas de vectores de soporte y selección de variables.
La invención se relaciona con mejoras en la clasificación. La invención es especialmente aplicable a la clasificación de ítems de dinero circulante o valores, tales como billetes o monedas.
La invención se relaciona con nuestras solicitudes en trámite, EP 1 217 589 y EP 1 516 293 A.
En adelante, SVM significa máquina de vectores de soporte (por sus siglas en inglés), FVS significa selección del vector de características (por sus siglas en inglés) (véase EP 1 516 293 A mencionada anteriormente) y el término forma de introducir un billete se refiere a la alimentación de un billete en un validador en una orientación. Por lo tanto, existen 4 formas de introducir un billete por cada denominación.
Fung et al. describen en "Data Selection for Support Vector Machine Classifiers", publicada en los Proceedings of the Sixth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining 2000, páginas 64 a 70 una formulación para el problema de extracción de un número mínimo de datos de un gran conjunto de datos, con el propósito de generar un clasificador de una máquina de vectores de soporte (SVM) como un problema de minimización cóncava resuelto por medio de un número finito de programas lineales. Este conjunto mínimo de datos, que es el número más pequeño de vectores de soporte que caracterizan completamente un clasificador de separación de superficie plana, es considerablemente más pequeño que aquel requerido por una máquina estándar de vectores de soporte 1-norm con o sin selección de características. El enfoque propuesto también incorpora un procedimiento de selección de características que da como resultado un número mínimo de características de entrada utilizadas por el clasificador.
EP-A1-1 217 589 se relaciona con un método para derivar una función de clasificación para clasificar ítems de dinero circulante utilizando un mapeo desde un primer espacio hasta un segundo espacio y la correspondiente función del kernel.
WO 2004/001683 A se relaciona con un método para derivar una función para clasificar ítems de dinero circulante utilizando una máquina de vectores de soporte y un subconjunto de un conjunto de vectores de datos de entrenamiento.
G. Baudat y F. Anouar: "Feature selection ad projection using kernels", Neurocomputing, col. 55, 27 de junio de 2003 (2003 - 06 - 27), páginas 21 - 38, se relaciona con la selección y proyección de un vector de características utilizando kernels. Un método de kernel es utilizado para elegir a partir de los datos un subconjunto relevante de vectores de características que forman una base en un espacio de características F.
En un aceptador de billetes que consta de medios de transporte, medios sensores, medios de memoria y de procesamiento, escaneo del documento con muchos sensores y muchas longitudes de onda, se produce un gran volumen de datos de múltiples variables que se almacenan en una memoria que puede ser utilizada para discriminar y autenticar los documentos, y para darle denominación a un billete en el caso de un aceptador de billetes de banco. Es deseable que este proceso sea rápido y se sabe que un subconjunto de los datos puede ser suficiente para lograr un mejor resultado. Esta solicitud se relaciona con el hallazgo de un subconjunto óptimo de variables que representan los datos.
Los aspectos de la invención se exponen en las reivindicaciones acompañantes.
Este nuevo algoritmo de denominación se relaciona con la selección de los datos de entrada que se le suministran a un algoritmo de una SVM (máquina de vectores de soporte).
El propósito de la selección de variables es eliminar variables irrelevantes o menos relevantes para los propósitos de clasificación y al mismo tiempo mantener un alto desempeño de separación. La idea es encontrar un conjunto de variables que estén altamente correlacionadas con los datos proyectados sobre el vector de separación obtenido con la SVM cuando se entrena con todas las variables.
El proceso puede ser utilizado para generar entradas de datos para el validador de billetes que son utilizadas con el propósito de denominar billetes a partir de las clases que comprenden un conjunto predefinido de billetes. Las clases pueden ser las 4 formas de introducir un billete de una denominación particular y/o de otras denominaciones. Las variables seleccionadas y los ejes discriminante generado por el proceso pueden ser cargados en la memoria del validador. Ellos son utilizados por el validador para validar posteriormente una nueva muestra presentada a la unidad como un miembro de una de las clases.
Aunque las modalidades de la invención son descritas en el contexto de la denominación de billetes, el proceso puede se puede aplicar ampliamente a cualquier problema de selección de variables, incluido por ejemplo el problema de autenticación en el contexto de validación de un billete.
Las realizaciones de la invención serán descritas con referencia a los dibujos acompañantes en los cuales:
La Fig. 1 es un diagrama esquemático de un sistema de detección de billetes;
La Fig. 2 es una vista en planta desde la parte superior del arreglo del sensor del sistema de detección de la Fig. 1;
La Fig. 3 es una vista en planta desde la parte inferior del arreglo de la fuente de luz del sistema de detección de la Fig. 1;
La Fig. 4 es un gráfico que ilustra la clasificación.
Un sistema de detección de billetes de acuerdo con una realización de la invención es mostrado esquemáticamente en la Fig. 1. El sistema incluye un arreglo de una fuente de luz 2 dispuesto a un lado de un trayecto para transporte del billete, y un arreglo de un sensor de luz 4 dispuesto al otro lado del trayecto para transporte del billete, opuesto al arreglo de la fuente de luz 2. El sistema incluye un medio de transporte para el billete en la forma de cuatro grupos de rodillos 6 para transportar un billete 8 a lo largo del trayecto de transporte entre el arreglo de la fuente de luz 2 y el arreglo del sensor de luz 4. El arreglo de la fuente de luz se conecta a un procesador 10 y el sistema se controla por medio de un controlador 12. Se dispone un difusor 14 para la difusión y mezcla de la luz emitida desde el arreglo de la fuente de luz 2 entre el arreglo de la fuente de luz 2 y el trayecto de transporte del billete.
La Fig. 2 es una vista en planta desde la parte de abajo del arreglo de la fuente de luz 2. Como se muestra, el arreglo de la fuente de luz es un arreglo lineal de una pluralidad de fuentes de luz 9. El arreglo está dispuesto en grupos 11 de seis fuentes, y cada fuente en un grupo emite luz de una longitud de onda diferente, que se escogen como adecuadas para la aplicación, usualmente variedades de azul y rojo. Se dispone una pluralidad de tales grupos 11 en forma lineal a través del trayecto de transporte, de tal manera que las fuentes de luz para cada longitud de onda estén dispuestas a través del trayecto del transporte.
La Fig. 3 es una vista en planta desde la parte superior del arreglo del sensor de luz 4. Como se muestra, el arreglo del sensor de luz incluye ocho sensores de luz circulares dispuestos en una línea a través del trayecto de transporte. Los sensores son de 7 mm de diámetro y los centros están espaciados cada 7 mm en una línea, de tal manera que los sensores están uno al lado del otro.
Las Figs. 2 y 3 no están a escala, y los arreglos de la fuente de luz y del sensor de luz son aproximadamente el mismo tamaño.
En operación, un billete es transportado por lo rodillos 6, bajo el control del controlador 12, a lo largo del trayecto de transporte entre los arreglos de la fuente y del sensor 2, 4. El billete es transportado una distancia predeterminada y luego detenido. Se operan todas las fuentes de luz de una longitud de onda y, después de mezclar la luz en el difusor 14 para difundirla uniformemente sobre el ancho del billete, la luz incide sobre el billete. La luz transmitida a través del billete es detectada por el arreglo del sensor 4, y se derivan señales a partir de los sensores para cada punto de medición sobre el billete correspondiente a cada sensor. En forma similar, las fuentes de luz de todas las otras longitudes de onda son operadas en forma similar en forma sucesiva, derivándose mediciones para los sensores para cada longitud de onda, para la línea correspondiente.
A continuación, se activan lo rodillos 6 para mover el billete nuevamente una distancia predeterminada y se repite la secuencia de iluminación del billete y tomar mediciones para cada longitud de onda por parte de cada sensor.
Repitiendo las etapas anteriores a través de toda la longitud del billete, línea por línea, se derivan mediciones para cada una de las seis longitudes de onda para cada sensor para cada línea del billete, determinadas por la distancia predeterminada por medio de la cual se mueve el billete.
Como se mencionó anteriormente, se escanea el documento por medio de un arreglo de un sensor lineal que mide puntos sobre el documento con una resolución de escaneo predeterminada en ancho y en longitud y para múltiples longitudes de onda.
Debido a que los documentos pueden tener dimensiones diferentes, un escaneo completo puede producir técnicamente grupos de datos de tamaños diferentes. Un algoritmo de discriminación opera por medio de la comparación de objetos utilizando vectores de medición que tienen que ser de un tamaño común. Como en la práctica los documentos pueden tener tamaños diferentes, aunque sólo sea por razones de tolerancia, se define un
área máxima de escaneo que sea común a todos los tamaños para la determinación. Este tamaño común variará con los grupos de billetes objetivo.
Por diseño un clasificador de la SVM trabaja con 2 clases. La discriminación y la selección de variables se lleva a cabo utilizando 2 clases, la primera clase es la clase de referencia y la segunda clase contiene todos los otros billetes diferentes a los de la clase 1. En el caso de la denominación y para propósitos prácticos, los documentos utilizados en la clase 2 son muy parecidos a aquellos de la clase 1 de acuerdo a sus dimensiones. Esto significa que pasan la prueba de longitud y ancho de la clase 1 (por otra parte es trivial separar documentos de diferentes dimensiones). Otros detalles de los clasificadores de las SVM pueden ser encontrados en la literatura del estado del arte.
Las muestras de prueba para la clase de referencia y la segunda clase se miden utilizando un arreglo de sensor como se describió anteriormente, y se procesan los valores medidos como se describe más adelante, para generar una SVM con un conjunto reducido de variables.
Dejemos que X sea el conjunto de datos X = xij, i = 1…M, j = 1…N, donde M es el número de billetes y N es el número de variables. Una variable es la localización de un punto dado y una longitud de onda dada. En otras palabras para cada billete i todas las variables (longitud x ancho x longitud de onda) en un vector xij, J = 1…N. para un billete dado i la variable j es sometida a una normalización restando el promedio de cuatro trayectorias en la longitud de onda asociada.
En forma más detallada, los puntos utilizados para normalización se definen por medio de cuatro trayectorias. El promedio de cuatro trayectorias se calcula para cada longitud de onda y se almacena en un vector {m1, m2, m3, m4, m5, m6}, por ejemplo, para seis longitudes de onda. Luego cada medición de xij de la longitud de onda asociada k se normaliza restando mk.
Por conveniencia, el grupo completo de datos se normaliza antes de aplicar el algoritmo de selección de variables.
La normalización anterior retira de cada variable el efecto global del billete tal como el papel o el polvo o el envejecimiento. Por otro lado, el proceso de escalado tiene que ver con la dispersión del juego completo de billetes. El conjunto de datos X está compuesto de dos grupos: los datos relacionados con la clase de referencia clase 1 y aquellos relacionados con la clase 2: X = (X1, X2). Los dos grupos de datos se escalan utilizando la desviación promedio y desviación estándar de la clase 1. El escalado está dado por:
Una SVM lineal es entrenada con todas las variables X y el eje discriminante resultante W1 está dado por:
donde SVs1 es una matriz (L, N) de vectores de soporte L y Alfa 1 es el vector de multiplicadores de Lagrange de un tamaño L. Véase Vapnik V., “The Nature of Stastistical Learning Theory”, Springer Verlag, 1995 para detalles adicionales.
Los datos se proyectan sobre W1. El éxito está en encontrar las variables que estén altamente correlacionadas con los datos proyectados sobre el eje discriminante W1.
En esta modalidad, el problema de hallar las mejores S variables se resuelve por medio de una selección secuencial hacia adelante. El algoritmo inicia con un conjunto vacío de variables y se añaden variables hasta que se han seleccionado S variables. Se evalúa un criterio de adecuación para el conjunto de variables que combina la variable ya seleccionada y la actual. Se añade la que produzca la máxima adecuación para el conjunto de variables seleccionadas.
Obsérvese que la selección secuencial hacia adelante es solamente uno de muchos algoritmos de selección que podrían ser utilizados tal como selección hacia atrás o paso a paso. Véase, por ejemplo, Fukunaga K.,"Introduction to Statistical Pattern Recognition", Academic Press, INC, 2nd ed. 1990, para detalles adicionales relacionados con algoritmos de selección.
Vamos a mencionar el eje discriminante W1, los datos proyectados
de clase 1 y clase 2, y el conjunto de
datos con las variables seleccionadas Xs entre S = {s1,…,sr}
(4)
Xs = (xij) i = 1…M, j = s1…sr.
Ante todo la proyección P y el conjunto de datos X se centran restando sus promedios:
(5)
X = X - (X)promedio
(6)
Luego se escala el vector P
(7)
Asumiendo que ya hemos seleccionado las variables entre S = {s1,…,sr} y que estamos evaluando la relevancia de la variable j que no se toma aún (j � S). La adecuación define una clase de correlación entre Sj = S u {j} yP.
Donde KSjP = XSj’P y KSjSj = XSj’XSj
La variable que produce la mejor adecuación se añade al conjunto de variables seleccionadas. Dejamos de seleccionar variables cuando la adecuación alcanza un valor dado (0.998) o si hemos seleccionado un número predefinido de variables.
Las etapas del algoritmo pueden resumirse como se expone a continuación:
- 1.
- Construcción del conjunto completo de variables normalizadas.
- 2.
- Luego escalamiento de los datos de acuerdo con (3).
- 3.
- Entrenamiento la SVM con el conjunto completo de variables. La SVM retorna los vectores de soporte que serán utilizados para construir el vector discriminante W1.
- 4.
- Proyección de todos los datos sobre W1: P = X*W1,
- 5.
- Centrado del vector P de acuerdo con (5);
- 6.
- Escalamiento del vector P utilizando su normalización: P = P/(P)normalizado
- 7.
- Escalamiento de X de acuerdo con (6);
- 8.
- Inicialización de la selección: R = {1…N}, S = {};
- 9.
- Repetición
a) Para todas las variables restantes en R, evaluar el criterio de adecuación FSj (8) de la variable j. F es la lista de todas las adecuaciones: F = (FSj)j E R
b) Encontrar la mejor variable que maximice la adecuación: mejor = arg maxj(F)
c) Añadir la mejor variable al conjunto de variables seleccionadas S = S u {mejor};
d) Remover la mejor variable de la lista restante de variables R = {1…, mejor – 1, mejor + 1,…N};
Hasta que el número de variables seleccionadas o la adecuación alcance un valor dado.
10. Reciclar la SVM con las variables seleccionadas y retener el eje discriminante W2 dado por W2 = SVs2t * Alfa2 como el discriminador final. SVs2 y Alfa2 son los vectores de soporte y los multiplicadores de Lagrange de la segunda pasada de la SVM.
La discusión anterior se relaciona con la selección del subconjunto de variables que se utilizan en el probador de billetes. Los parámetros que representan las variables seleccionadas y el eje discriminante se almacenan en la memoria del probador de billetes y se utilizan para una prueba posterior (autentificación, denominación, etc.).
Más específicamente, para probar un billete, se detecta el billete por medio de un arreglo de sensores, y se procesan las mediciones para las variables seleccionadas por medio de la SVM. Se utilizan las mediciones para construir un vector de prueba, que se proyecta sobre el vector discriminante W2. Esto da como resultado un valor escalar que puede ser comparado con uno o más umbrales. Por ejemplo, si el valor escalar es menor o mayor que un umbral dado puede ser tratado ya sea como perteneciente a una clase de referencia o no. En forma similar, para dos umbrales, si el valor escalar está entre dos umbrales puede ser tratado como perteneciente a una clase de referencia o de lo contrario no.
El procesamiento para derivar el subconjunto de variables y el eje discriminante se puede llevar a cabo ya sea en el mismo probador de billetes, o en un dispositivo separado, con los parámetros que representan las variables seleccionadas y almacenando posteriormente el eje discriminante en la memoria de un probador de billetes para un uso posterior.
Como se discutió anteriormente, este enfoque produce un resultado similar en términos de desempeño que utilizando el número original de variables N, pero realmente utilizando más pocas variables, de modo que existan menos procesamiento y por lo tanto resultados más rápidos.
También es posible no normalizar P y utilizar otro rango para los criterios de adecuación. Entre más alto el valor de la adecuación, mejor es la reconstrucción de los datos proyectados. Es conveniente fijar este valor en un nivel dado menor a 1 para evitar problemas numéricos, por ejemplo 0,998 y detener la selección cuando se alcanza este valor.
Las pruebas prácticas en un validador de billetes para diferentes denominaciones han demostrado que aproximadamente alrededor de 20 a 40 variables son suficientes para mantener un alto desempeño cuando algunas otras variantes requieren de más, por ejemplo como 64 variables.
La Fig. 4 muestra los resultados de la SVM para la denominación de 2 denominaciones específicas con todas las variables, en este caso 357 (en la parte superior) y 16 variables (en la parte inferior).
Puede observarse que en este caso, todos los objetos de la segunda clase están a un lado de la clase de referencia y las clases pueden ser separadas por un solo umbral. Alternativamente la clase de referencia puede estar encerrada entre 2 valores que definen una ventana de aceptación para cubrir la posibilidad de que un objeto foráneo pueda ser clasificado al otro lado de la clase de referencia.
En la realización, el subconjunto de variables se selecciona utilizando un clasificador de la SVM, y luego se utiliza el subconjunto seleccionado de variables para la clasificación usando otro clasificador de la SVM. Sin embargo, una vez que se han seleccionado las variables relevantes, que son representativas de las variables originales y de los correspondientes datos de entrada, se puede llevar a cabo cualquier tipo adecuado de clasificación utilizando las variables relevantes, tales como LDA (análisis de discriminante lineal por sus siglas en inglés) o la distancia de Mahalanobis, o similar, como lo sabe la persona capacitada en el arte. Se escoge el subconjunto representativo para reducir el número de variables mientras se mantiene el desempeño adecuado en términos de clasificación, de modo que las variables seleccionadas sean representativas de las variables originales y de los datos correspondientes. Esto se puede evaluar de diferentes maneras, tales como por medio del uso de una función de adecuación como se describió anteriormente.
Las referencias a billetes incluyen otros tipos similares de papeles valor tales como cupones, cheques, e incluyen ejemplos genuinos y falsos de tales documentos. Un sistema puede involucrar el uso de medios, tales como detectores de bordes, para detectar la orientación, tales como inclinación y desplazamiento de un billete con respecto, por ejemplo, a la dirección del transporte y/o el arreglo el sensor o un(os) punto(s) fijo(s). Alternativamente, un sistema puede incluir medios para posicionar un billete en una orientación deseada, tal como con la longitud del billete a lo largo del trayecto de transporte con los bordes paralelos a la dirección del transporte, o en un ángulo deseado con relación a la dirección del transporte y/o al arreglo del sensor.
Las realizaciones descritas son para probadores de billetes. Sin embargo, también se puede aplicar la invención a otros tipos de probadores de valores, tales como probadores de monedas. Por ejemplo, las señales de un probador de monedas que toma las mediciones de las características de la moneda, tales como del material, en una sucesión de puntos a través de la moneda, pueden ser interpoladas para producir una señal representativa de la característica a través de la moneda.
El término "moneda" se emplea para significar cualquier tipo de moneda (ya sea válida o una falsificación), ficha, ficha metálica, arandela, u otro objeto metálico o ítem, y especialmente cualquier objeto metálico o ítem que pueda ser utilizado por un individuo en un intento para operar un sistema o dispositivo operado a través del uso de monedas. Una "moneda válida" se considera que es una moneda auténtica, ficha, o similar, y especialmente una moneda auténtica de un sistema monetario o sistemas en los cuales o con los cuales se pretende operar un sistema
o dispositivo operado a través del uso de monedas y de una denominación que tal dispositivo o sistema operado a través del uso de monedas pretende selectivamente recibir y tratar como un ítem de valor.
Claims (15)
- REIVINDICACIONES1. Un método para derivación de un discriminador para clasificar ítems de moneda circulante utilizando una pluralidad de variables para la caracterización de los ítems de moneda, comprendiendo el método la determinación de un subconjunto representativo de las variables para qué dicho discriminador retenga, incluidas las etapas de:entrenar una máquina de vectores de soporte con toda la pluralidad de variables,en donde la máquina de vectores de soporte retorna los vectores soporte que están siendo utilizados para construir un vector discriminante; proyectar los datos medidos de toda la pluralidad de variables para un número predeterminado de ítems de pruebade moneda sobre un vector discriminante;inicializar un conjunto de variables restantes con toda la pluralidad de variables y un conjunto vacío de variables seleccionadas; y repetir, hasta que una cantidad de variables seleccionadas o una adecuación alcancen un valor dado, las etapas de: evaluar un criterio de adecuación que comprende el cálculo de la correlación entre las variables y los datos medidosproyectados para todo el resto de variables para obtener un listado de adecuaciones; encontrar una variable que maximice la adecuación del listado de adecuaciones; añadir esta variable al conjunto de variables seleccionadas; remover esta variable del conjunto de variables restantes; y entrenar nuevamente la máquina de vectores de soporte con las variables seleccionadas y retener un segundovector discriminante como el discriminador.
-
- 2.
- El método de la reivindicación 1 en donde dicho criterio de adecuación se basa en una correlación de variables.
-
- 3.
- El método de las reivindicaciones 1 ó 2, que comprende además: centrar y escalar la representación obtenida por medio de los datos de proyección medidos.
-
- 4.
- El método de cualquier reivindicación anterior que comprende el escalamiento de los datos medidos.
-
- 5.
- El método de la reivindicación 4 en donde el escalamiento se basa en un subconjunto de los datos medidos.
-
- 6.
- El método de la reivindicación 5 en donde el escalamiento se basa en los datos medidos para una clase de referencia.
-
- 7.
- El método de la reivindicación 6 en donde el escalamiento se basa en el promedio y la desviación estándar.
-
- 8.
- Un método para probar un ítem de moneda utilizando el discriminador derivado utilizando el método de cualquier reivindicación anterior.
-
- 9.
- El método de la reivindicación 8 en donde el ítem de moneda es diferente de los ítems de moneda utilizados para derivar el discriminador.
-
- 10.
- El método de la reivindicación 7 o la reivindicación 8 que comprende la medición del ítem de moneda, la extracción de datos para las variables seleccionadas, y la utilización de los datos para las variables seleccionadas y el discriminador para derivar un valor escalar.
-
- 11.
- El método de la reivindicación 10 que comprende la proyección de los datos para las variables seleccionadas sobre un eje discriminante para derivar el valor escalar.
-
- 12.
- El método de la reivindicación 10 o la reivindicación 11 que comprende la aceptación o el rechazo del ítem de moneda dependiendo de si el escalar está por encima o por debajo de un umbral, o
aceptar el ítem de moneda si el escalar está entre dos umbrales o bien rechazarlo. -
- 13.
- Un método de fabricación de un validador de moneda que comprende el almacenamiento de una representación del discriminador derivado utilizando el método de cualquiera de las reivindicaciones 1 a 7 en el validador.
-
- 14.
- Un programa informático para ejecutar el método de cualquiera de las reivindicaciones 1 a 7.
-
- 15.
- Un validador de moneda que almacena una representación de un discriminador de la SVM y que tiene medios correspondientes al método de cualquiera de las reivindicaciones 1 a 7.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/IB2006/002398 WO2008015489A1 (en) | 2006-07-28 | 2006-07-28 | Classification using support vector machines and variables selection |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2381860T3 true ES2381860T3 (es) | 2012-06-01 |
Family
ID=37779272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES06795394T Active ES2381860T3 (es) | 2006-07-28 | 2006-07-28 | Clasificación utilizando máquinas de vectores de soporte y selección de variables |
Country Status (7)
Country | Link |
---|---|
US (1) | US8706669B2 (es) |
EP (1) | EP2054844B1 (es) |
JP (1) | JP2009545049A (es) |
AT (1) | ATE546792T1 (es) |
AU (1) | AU2006346894B2 (es) |
ES (1) | ES2381860T3 (es) |
WO (1) | WO2008015489A1 (es) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010014700A1 (en) * | 2008-07-29 | 2010-02-04 | Mei, Inc. | Currency discrimination |
AT509022B1 (de) * | 2009-08-14 | 2012-09-15 | Ait Austrian Inst Technology | Verfahren zur qualitätsprüfung eines digitalbilds |
US20110246262A1 (en) * | 2010-04-02 | 2011-10-06 | QMedtrix Systems, Inc. | Method of classifying a bill |
EP2810257B1 (en) | 2012-02-03 | 2017-01-18 | Crane Payment Innovations, Inc. | Apparatus and method for characterizing items of currency |
CN103679263B (zh) * | 2012-08-30 | 2017-03-29 | 重庆邮电大学 | 基于粒子群支持向量机的雷电临近预测方法 |
US20160005045A1 (en) * | 2013-02-25 | 2016-01-07 | Mei, Inc. | System to accept an item of value |
CN105372202B (zh) * | 2015-10-27 | 2019-01-29 | 九江学院 | 转基因棉花品种识别方法 |
CN106204893A (zh) * | 2016-08-10 | 2016-12-07 | 恒银金融科技股份有限公司 | 一种基于支持向量机的纸币检测方法 |
CN107909011B (zh) * | 2017-10-30 | 2021-08-24 | Oppo广东移动通信有限公司 | 人脸识别方法及相关产品 |
CN108320374B (zh) * | 2018-02-08 | 2019-12-03 | 中南大学 | 一种基于图像指纹的多国纸币冠字号字符识别方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CH684222A5 (de) | 1992-03-10 | 1994-07-29 | Mars Inc | Einrichtung zur Klassifizierung eines Musters, insbesondere von einer Banknote oder von einer Münze. |
US7232024B2 (en) * | 1996-05-29 | 2007-06-19 | Cunnins-Allison Corp. | Currency processing device |
JP2002505770A (ja) | 1996-06-28 | 2002-02-19 | コインスター,インコーポレイテッド | 硬貨判別装置および方法 |
GB2344446A (en) | 1998-12-02 | 2000-06-07 | Mars Inc | Classifying currency items |
US6662170B1 (en) * | 2000-08-22 | 2003-12-09 | International Business Machines Corporation | System and method for boosting support vector machines |
EP1217589B1 (en) | 2000-12-15 | 2007-02-21 | MEI, Inc. | Currency validator |
WO2004001683A1 (en) | 2002-06-19 | 2003-12-31 | Mars Incorporated | Currency validator |
EP1376484A1 (en) | 2002-06-25 | 2004-01-02 | Mars Incorporated | Method and apparatus for processing signals in testing currency items |
US8019699B2 (en) * | 2004-09-29 | 2011-09-13 | Panscient, Inc. | Machine learning system |
US20070140551A1 (en) * | 2005-12-16 | 2007-06-21 | Chao He | Banknote validation |
EP1868166A3 (en) | 2006-05-31 | 2007-12-26 | MEI, Inc. | Method and apparatus for validating banknotes |
-
2006
- 2006-07-28 JP JP2009521356A patent/JP2009545049A/ja active Pending
- 2006-07-28 AU AU2006346894A patent/AU2006346894B2/en not_active Ceased
- 2006-07-28 ES ES06795394T patent/ES2381860T3/es active Active
- 2006-07-28 AT AT06795394T patent/ATE546792T1/de active
- 2006-07-28 WO PCT/IB2006/002398 patent/WO2008015489A1/en active Application Filing
- 2006-07-28 EP EP06795394A patent/EP2054844B1/en not_active Not-in-force
- 2006-07-28 US US12/375,158 patent/US8706669B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20090307167A1 (en) | 2009-12-10 |
JP2009545049A (ja) | 2009-12-17 |
EP2054844A1 (en) | 2009-05-06 |
ATE546792T1 (de) | 2012-03-15 |
EP2054844B1 (en) | 2012-02-22 |
WO2008015489A1 (en) | 2008-02-07 |
US8706669B2 (en) | 2014-04-22 |
AU2006346894A1 (en) | 2008-02-07 |
AU2006346894B2 (en) | 2012-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2381860T3 (es) | Clasificación utilizando máquinas de vectores de soporte y selección de variables | |
US7639858B2 (en) | Currency validation | |
US9704031B2 (en) | Media identification | |
JP5219211B2 (ja) | 銀行券の確認方法及びその装置 | |
US8494249B2 (en) | Paper sheet recognition apparatus and paper sheet recognition method | |
US9330517B2 (en) | Coin identification system and method using image processing | |
US8837804B2 (en) | Method and device for testing value documents | |
CN106056752B (zh) | 一种基于随机森林的钞票鉴伪方法 | |
CN101366061A (zh) | 检测改进质量的伪造介质 | |
CN104298989A (zh) | 基于斑马线红外图像特征的鉴伪方法及其系统 | |
US7000754B2 (en) | Currency validator | |
US20210264711A1 (en) | Cash handling machine | |
JP5460658B2 (ja) | サポート・ベクタ・マシン及び変数選択を使用する方法 | |
CN108428279B (zh) | 纸币识别方法及装置 | |
ES2403458T3 (es) | Discriminación de efectivo | |
ES2900855T3 (es) | Procedimiento y dispositivo de prueba de la idoneidad de los documentos de valor | |
US20240021037A1 (en) | Sensor and method for verifying value documents | |
CN109906473A (zh) | 用于对有价文件尤其是钞票分类的装置和方法及有价文件处理系统 | |
US20160232730A1 (en) | Method for Checking a Value Document | |
EP3703018A1 (en) | Cash-handling machine | |
Durak et al. | Feature exploration for mining coronal loops from solar images | |
JP2018156605A (ja) | 紙葉類処理装置、紙葉類処理方法、および、紙葉類処理プログラム | |
Carlson et al. | Selecting training images with support vector machines for composite correlation filters in SAR ATR |