WO2020136297A1 - Método para la eliminación del sesgo en sistemas de reconocimiento biométrico - Google Patents

Método para la eliminación del sesgo en sistemas de reconocimiento biométrico Download PDF

Info

Publication number
WO2020136297A1
WO2020136297A1 PCT/ES2019/070877 ES2019070877W WO2020136297A1 WO 2020136297 A1 WO2020136297 A1 WO 2020136297A1 ES 2019070877 W ES2019070877 W ES 2019070877W WO 2020136297 A1 WO2020136297 A1 WO 2020136297A1
Authority
WO
WIPO (PCT)
Prior art keywords
bias
samples
include instructions
vectors
computer
Prior art date
Application number
PCT/ES2019/070877
Other languages
English (en)
French (fr)
Inventor
Aythami MORALES MORENO
Javier ORTEGA GARCÍA
Julián FIERREZ AGUILAR
Rubén VERA RODRÍGUEZ
Original Assignee
Universidad Autónoma de Madrid
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universidad Autónoma de Madrid filed Critical Universidad Autónoma de Madrid
Publication of WO2020136297A1 publication Critical patent/WO2020136297A1/es

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands

Definitions

  • the present invention relates to a method of eliminating bias due to gender, ethnicity, or age in biometric recognition systems.
  • Discrimination can be defined as differential treatment based on gender, age, ethnicity, or religion. Discrimination is not exclusive to human beings. Machine learning is not without biases and the main techniques used by the industry and the scientific community are very sensitive to these biases. Systems trained to optimize a recognition rate will not determine if they use gender, ethnicity or age characteristics for this. This training focused purely on the recognition rate, regardless of the type of information exploited, is dangerous.
  • One way to reduce bias is to introduce a higher degree of privacy into biometric data.
  • biometric data There are techniques to obfuscate attributes such as gender or ethnicity within biometric data such as the face. These techniques are known as de-identification.
  • de-identification These technologies allow the input data to be transformed to trick attribute detection systems. It is about masking this information to confuse detectors of gender, ethnicity, or age.
  • the main problem with de-identification is that it is intended to introduce privacy into data, not to combat bias.
  • the goal of de-identification systems is to trick trained systems with normal (non-de-identified) samples. These technologies do not eliminate bias, they hide it. Models trained with de-identified samples are able to recognize gender at rates above 95%, even in the most current systems.
  • An object of the present invention is a method of developing fair, more transparent and bias-free artificial intelligence systems.
  • the method can be applied to develop biometric systems whose decision-making is based exclusively on characteristics of the individual not dependent on their gender, ethnicity or age.
  • Another object of the method is the development of a method that allows eliminating the bias of biometric recognition systems already trained through the incorporation of a phase of elimination of potentially discriminating information; and training systems from scratch to eliminate bias in biometric recognition tasks.
  • the proposed method is used to train a system through an iterative process in which information with discriminating potential (eg gender, ethnicity, or age) is removed.
  • the learning method is based on machine learning that maintains recognition performance, while eliminating bias.
  • a set consisting of M samples of Y different people tagged based on attributes such as gender, ethnicity or age is defined.
  • Samples A (Anchor) and samples P (Positive) correspond to samples of the same identity, while samples N (Negative) correspond to different identities.
  • a value s (Bias) is also entered that will measure the bias present in each sample.
  • the method is an extension of the triplet-based learning techniques proposed in [3].
  • the method of the invention comprises the steps of: (i) minimizing the distance between the feature vectors of A and P; (ii) maximize the distance between the vectors of characteristics A and N; and (iii) reduce the bias in the samples.
  • the present invention it is possible to adapt the current biometric recognition technology to the new and demanding legislation (eg GDPR) in terms of discrimination against citizens.
  • GDPR new and demanding legislation
  • it allows to eliminate the bias of biometric recognition systems that, unlike the systems known in the state of the art, focus on offering equal treatment (regardless of gender, ethnicity or age), while ensuring performance of competitive recognition.
  • the present invention eliminates bias from biometric samples. Unlike de-identification systems, they simply mask it. In addition, it eliminates the bias of already trained models, requiring no training from scratch and is compatible with most state-of-the-art biometric recognition technologies. Finally, the proposed method has been tested in one of the most complex tasks, such as unrestricted biometric facial recognition (in the wild).
  • Figure 1 Shows a block diagram of the integration of the proposed technology in pre-trained models.
  • Figure 2. Shows a diagram of the learning process from which the intraclass variability is reduced, while the interclass is maximized and the bias is eliminated.
  • Figures 3A and 3B show the ROC curves for identity verification (figure 3A) and gender classification (figure 3B) before applying the Bit method (solid line) and afterwards (dashed line) in an example application of the the invention.
  • Figures 4A and 4B show the ROC curves for identity verification (figure 4A) and ethnicity classification (figure 4B) before applying the Bit method (solid line) and afterwards (dashed line) in an example application of the the invention.
  • the method of the present invention allows the development of biometric recognition technology without bias in two ways: (a) eliminating the bias of biometric recognition systems already trained through the incorporation of a phase of elimination of potentially discriminating information; and (b) by training systems from scratch to eliminate bias in biometric recognition tasks. Elimination of the bias of facial recognition systems is trained
  • a feature space ( 5 ) is an abstract space where each sample is represented as a point in a d-dimensional space.
  • the proposed method works in this feature space learning a transformation 9i) that allows to go from the biased space 5 to a new P-dimensional feature space s' without bias.
  • proposed method transforms the feature space to a 5 * feature space of dimension P in which the new feature vector y ( c ) does not contain biased information that may unfairly discriminate users.
  • Figure 1 shows the block diagram of the integration of the technology developed with the proposed method in already trained systems.
  • Figure 2 represents the learning process of the proposed method.
  • 3 samples are used (A + P + N).
  • the method is divided into the following steps: a.
  • a database of triplets (?) Is generated from the available M samples of Y identities.
  • the samples are grouped into sets of 3, in which 2 samples belong to the same identity and a third belongs to a different identity.
  • Each of the three samples is run through the pre-trained model and a vector of characteristics s of dimension 1 x ⁇ is generated.
  • a bias detector is trained from the feature vectors and their associated labels (eg gender, ethnicity, age).
  • the bias detector can be based on different classification algorithms and will output a value ft ⁇ ) proportional to the level of bias present in the feature vector s .
  • An example of a bias detector can be a neural network with an input layer and a binary output layer trained with a softmax function or the like.
  • Weights in this layer are trained to find a transformation function fKx) that minimizes the cost function such that:
  • s k, X P, 3 ⁇ 4 are the vectors obtained in step b for each of the triplets 1 of the database T
  • ⁇ T C s i is a scalar that defines the amount of bias present in the feature vectors of each triplet, It is a distance between feature vectors and a constant.
  • the amount of bias represents the ability of an algorithm to detect biased attributes in that feature space.
  • One possible way to calculate it is through an equation like (3): where b is a constant is the output of the trained bias detector
  • Steps c, d and e are repeated until the bias is eliminated.
  • the feature vectors from step b are replaced by those obtained in step e.
  • training the bias detector in step c each time a new bias extraction layer is added.
  • the process ends when the detector implemented in step c is unable to exceed minimum bias detection performance.
  • the end result is a transformation that allows you to eliminate the bias introduced during the pre-trained model training without reducing the usefulness of the feature space.
  • the method is to use the cost function proposed in step e to train the model from sample sets such as those suggested in step a.
  • the dimension of bias in the training it will be eliminated from the beginning and will not be introduced in the model as it happens in those systems trained only from cost functions that evaluate verification / identification performance.
  • the characteristic space s obtained at the end of the training no longer contains the biased information.
  • the proposed method works in the abstract domain of the characteristics space, making it independent of the biometric sample, the pre-trained model or the bias to be eliminated.
  • the results obtained to eliminate bias in facial recognition tasks are shown below for both gender and ethnicity.
  • the test set of the public database Labeled Face in the Wild (LFW), a benchmark in the facial recognition literature, was used.
  • the goal of a bias elimination algorithm is twofold: to eliminate bias and to maintain the performance of the identity recognition system.
  • a pre-trained facial recognition model based on the convolutional network Resnet-50 was used. This model has been chosen for its high performance in different databases acquired in operational environments. Triplets have been used for this experiment (step a of the proposed method) formed from the training subset of the LFW database, while to train the gender detector (step d) a subset of 5000 images (equally distributed among men, women, targets, Blacks and Asians) not included in the LFW database.
  • Figure 3B shows the performance of the pre-trained model before and after adding the bias elimination step. While Figure 3A shows the performance of gender detection for different algorithms. The results show a reduction in the verification performance of 2% (from 98% to 96% of Equal Error Rate) while the performance in gender detection falls above 37% (from 98% to 61% of Equal Error Rate). Therefore, it is observed how the proposed method is able to considerably reduce gender bias, while maintaining competitive verification performance.
  • Figures 4A and 4B show the same experiment for eliminating ethnic bias. In this case, the small drop of 2% is maintained in terms of verification performance, but the elimination of bias is reduced to 16%. Flay must bear in mind that the boundaries between the facial characteristics of different ethnic groups are not always clear.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)

Abstract

Método para eliminación del sesgo (por edad, etnia o género) en sistemas de reconocimiento biométrico, que comprende definir un conjunto de M muestras de Y personas diferentes etiquetadas a partir de atributos como género, etnia o edad, donde las muestras A y las muestras P se corresponden con muestras de la misma identidad, mientras que las muestras N se corresponden con diferentes identidades y donde, además, se introduce además un valor σ correspondiente con el sesgo de cada muestra; y donde el método propuesto se caracteriza porque comprende las etapas necesarias para aprender una función de transformación (see (I)) que genere un nuevo espacio de características que permita: (i) minimizar distancia d(xA, xP) entre vectores de características (xA, xP) de A y P; (ii) maximizar distancia d(xA, xN) entre vectores de características (xA, xN) A y N; y (iii) reducir sesgo σ en las muestras hasta su eliminación y garantizar así una toma de decisiones no sesgada.

Description

MÉTODO PARA LA ELIMINACIÓN DEL SESGO EN SISTEMAS DE
RECONOCIMIENTO BIOMÉTRICO
D E S C R I P C I Ó N
OBJETO DE LA INVENCIÓN
La presente invención está referida a un método para eliminar el sesgo debido al género, etnia o edad en sistemas de reconocimiento biométrico.
ANTECEDENTES DE LA INVENCIÓN
La inteligencia artificial ha dado grandes avances en los últimos años. En determinadas tareas como el reconocimiento biométrico, los sistemas automáticos han conseguido alcanzar e incluso superar el rendimiento humano. Esto ha hecho que la tecnología de reconocimiento biométrico se despliegue a nivel global de forma masiva. Algunos ejemplos de este despliegue masivo son el programa Aadhaar de la India, a través del cual se han registrado los datos biométricos (huella dactilar, cara e iris) de más de 600 millones de ciudadanos; la tecnología de reconocimiento para móviles como TouchID o FaceID de Apple incorporada en cientos de millones de dispositivos; el sistema del FBI con más de 100 millones de huellas dactilares.
Este despliegue se ha visto impulsado por una comunidad científica y una industria muy activas en los últimos 20 años. La comunidad científica y la industria se han centrado en desarrollar sistemas de reconocimiento biométricos cada vez más precisos, económicos y usables. Este desarrollo, sin embargo, no se ha centrado en un aspecto clave como es la discriminación algorítmica. La discriminación se puede definir como un trato diferenciado debido a razones de género, edad, etnia o religión. La discriminación no es exclusiva de los seres humanos. El aprendizaje automático no está libre de sesgos y las principales técnicas utilizadas por la industria y comunidad científica son muy sensibles a estos sesgos. Los sistemas entrenados para optimizar una tasa de reconocimiento, no se fijarán si para ello utilizan características de género, etnia o edad. Este entrenamiento centrado puramente en la tasa de reconocimiento, independientemente del tipo de información explotada, es peligrosa. Se hace necesario desarrollar tecnologías que garanticen el derecho a la no discriminación de los ciudadanos. Este es un derecho fundamental recogido en gran cantidad de tratados y regulaciones internacionales. Así por ejemplo, la Unión Europea puso en vigor en abril de 2018 la nueva regulación general de protección de datos (EU 2016/679 General Data Protection Regulation GDPR). El GDPR define los datos biométricos como datos sensibles por su capacidad para reconocer a las personas e identificar rasgos como sus orígenes étnicos. En el párrafo 71 de esta ley se especifica la obligatoriedad de implementar técnicas apropiadas que prevengan efectos discriminatorios. No existe ningún sistema biométrico comercial que garantice el trato igualitario y la no discriminación de los ciudadanos que lo utilicen. Esto pone en una situación complicada a las empresas comercializadoras ya que podrían estar incumpliendo la legislación vigente.
En lo que respecta a la comunidad científica, existen algunos esfuerzos en desarrollar sistemas que incorporen la discriminación o el sesgo como aspecto a tener en cuenta. Una forma de reducir el sesgo es introducir un mayor grado de privacidad en los datos biométricos. Existen técnicas para ofuscar atributos como el género o la etnia dentro de datos biométricos como la cara. Estas técnicas se conocen como de-identificación. Estas tecnologías permiten trasformar los datos de entrada para engañar a sistemas de detección de atributos. Se trata de enmascarar esta información para confundir a los detectores de género, etnia, o edad. El principal problema de la de-identificación es que está pensada para introducir privacidad en los datos, no para combatir el sesgo. El objetivo de los sistemas de de-identificación es engañar a sistemas entrenados con muestras normales (no de-identificadas). Estas tecnologías no eliminan el sesgo, lo ocultan. Modelos entrenados con muestras de-identificadas, son capaces de reconocer el género con tasas superiores al 95%, incluso en los sistemas más actuales.
La literatura centrada en la reducción del sesgo en muestras biométricas es escasa y tradicionalmente ha estado centrada en reducir el impacto del sesgo en el rendimiento, no en su eliminación. En [1] se propone un sistema de eliminación de sesgo basado en un entrenamiento con dos objetivos: mantener el rendimiento de detección de edad, mientras se elimina el sesgo introducido por el género. El método trata de combatir el sesgo debido a que las mujeres tienden a parecer más jóvenes que los hombres en la base de datos de celebridades utilizada para sus experimentos. La propuesta de [1] se inspira en las técnicas de aprendizaje automático basadas en adaptación a dominio. El método propone un aprendizaje basado en una función de pérdidas relativa a la tarea principal (detección de edad en este caso) y dos funciones de pérdidas relacionadas con la tarea secundaria (detección de género en este caso). Estas dos funciones de perdidas secundarias son opuestas entre si y por tanto se deben entrenar por separado. El sistema se enfoca principalmente a la reducción del sesgo en términos de pérdida de rendimiento en tareas de clasificación como la detección de edad. Un método similar se propone en [2] basado en Redes Convolucionales Multitarea y“joint dynamic loss weight adjustment”. En [2] se añade la etnia además del género y la edad. El objetivo del algoritmo propuesto en [2] es minimizar los efectos de bases de datos sesgadas utilizadas para entrenar algoritmos de clasificación de los atributos mencionados. En la literatura no se han encontrado trabajos que muestren evidencias objetivas de la eliminación del sesgo en tareas como el reconocimiento biométrico de personas.
DESCRIPCIÓN DE LA INVENCIÓN
Es un objeto de la presente invención un método para desarrollar sistemas de inteligencia artificial justos, más trasparentes y libres de sesgo. Entre las diferentes aplicaciones, el método se puede aplicar para desarrollar sistemas biométricos cuya toma de decisión esté basada exclusivamente en características del individuo no dependientes de su género, etnia o edad. Es otro objeto del método el desarrollo de un método que permita eliminar el sesgo de sistemas de reconocimiento biométrico ya entrenados a través de la incorporación de una etapa de eliminación de la información potencialmente discriminante; y el entrenamiento de sistemas desde cero para la eliminación del sesgo en tareas de reconocimiento biométrico. Estos objetos se alcanzan con el método de la reivindicación 1. En realizaciones dependientes se describen realizaciones particulares del método propuesto.
Más concretamente, el método propuesto se utiliza para entrenar un sistema a través de un proceso iterativo en el que se elimina la información con potencial discriminante (e.j. género, etnia o edad). El método de aprendizaje se basa en un aprendizaje automático que mantiene el rendimiento de reconocimiento, mientras se elimina el sesgo. Para ello, se define un conjunto formado por M muestras de Y personas diferentes etiquetadas a partir de atributos como el género, etnia o edad. Las muestras A (Ancla) y las muestras P (Positivas) se corresponden con muestras de la misma identidad, mientras que las muestras N (Negativas) se corresponde con diferentes identidades. Se introduce además un valor s (Bias) que medirá el sesgo presente en cada muestra. El método es una extensión de las técnicas de aprendizaje basadas en tripletes o“triplet loss” propuestas en [3] Estas técnicas de aprendizaje minimizan la distancia entre muestras de la misma clase, mientras que la aumentan para muestras de diferente clase. Con ello se busca mejorar el rendimiento de los sistemas de reconocimiento. Esta patente extiende esta idea y amplía la función de perdidas añadiendo una componente de sesgo a minimizar s y un método iterativo para conseguirlo. Por tanto, el método de la invención comprende las etapas de: (i) minimizar la distancia entre los vectores de características de A y P; (ii) maximizar la distancia entre los vectores de características A y N; y (iii) reducir el sesgo s en las muestras.
Gracias a la presente invención es posible adaptar la tecnología de reconocimiento biométrico actual a la nueva y exigente legislación (e.j. GDPR) en términos de discriminación de los ciudadanos. Además, perite eliminar el sesgo de los sistemas de reconocimiento biométrico que, a diferencia de los sistemas conocidos en el estado de la técnica, se centra en ofrecer un trato igualitario (independientemente de género, etnia o edad), mientras se garantiza un rendimiento de reconocimiento competitivo.
La presente invención elimina el sesgo de las muestras biométricas. A diferencia de los sistemas de de-identificación, que simplemente lo enmascaran. Además, elimina el sesgo de modelos ya entrenados, no requiriendo entrenamientos desde cero y es compatible con la mayoría de las tecnologías de reconocimiento biométrico del estado del arte. Finalmente, el método propuesto ha sido probado en una de las tareas más complejas como es el reconocimiento biométrico facial sin restricciones (in the wild).
A lo largo de la descripción y de las reivindicaciones, la palabra «comprende» y sus variantes no pretenden excluir otras características técnicas, aditivos, componentes o pasos. Para los expertos en la materia, otros objetos, ventajas y características de la invención se desprenderán en parte de la invención y en parte de la práctica de la invención. Los siguientes ejemplos y dibujos se proporcionan a modo de ilustración y no se pretende que restrinjan la presente invención. Además, la invención cubre todas las posibles combinaciones de realizaciones particulares y preferidas aquí indicadas. DESCRIPCIÓN DE LOS DIBUJOS
Para complementar la descripción que se está realizando y con objeto de ayudar a una mejor comprensión de las características de la invención, de acuerdo con un ejemplo preferente de realización práctica de la misma, se acompaña como parte integrante de dicha descripción, un juego de dibujos en donde con carácter ilustrativo y no limitativo, se ha representado lo siguiente:
Figura 1 Muestra un diagrama de bloques de la integración de la tecnología propuesta en modelos ya pre-entrenados.
Figura 2.- Muestra un diagrama del proceso de aprendizaje a partir del cual se reduce la variabilidad intraclase, mientras se maximiza la interclase y se elimina el sesgo.
Figuras 3A y 3B.- Muestran las curvas ROC para verificación de identidad (figura 3A) y clasificación de género (figura 3B) antes de aplicar el método Bit (línea continua) y después (línea discontinua) en un ejemplo de aplicación del método de la invención.
Figuras 4A y 4B.- Muestran las curvas ROC para verificación de identidad (figura 4A) y clasificación de etnia (figura 4B) antes de aplicar el método Bit (línea continua) y después (línea discontinua) en un ejemplo de aplicación del método de la invención.
REALIZACIÓN PREFERENTE DE LA INVENCIÓN
Seguidamente se expone, con ayuda de las figuras anteriores 1 -4B, una descripción detallada de un ejemplo de realización preferente de un método para la eliminación del sesgo en sistemas de reconocimiento biométrico, de acuerdo con la presente invención.
Tal y como se ha indicado anteriormente, el método de la presente invención permite desarrollar tecnología de reconocimiento biométrico sin sesgo de dos modos: (a) eliminando el sesgo de sistemas de reconocimiento biométrico ya entrenados a través de la incorporación de una etapa de eliminación de la información potencialmente discriminante; y (b) mediante el entrenamiento de sistemas desde cero para la eliminación del sesgo en tareas de reconocimiento biométrico. Eliminación del sesgo de sistemas de reconocimiento facial va entrenados
El método propuesto actúa en el espacio de características de un sistema de aprendizaje automático. En reconocimiento de patrones, un espacio de características (5), es un espacio abstracto donde cada muestra es representada como un punto en un espacio d-dimensional. El método propuesto actúa en este espacio de características aprendiendo una transformación 9i ) que permita pasar del espacio sesgado 5 a un nuevo espacio de características P-dimensional s' sin sesgo. Dada una muestra biométrica ^ y un modelo pre-entrenado que extrae un vector de características s en un espacio s de dimensión
Figure imgf000008_0001
e| método propuesto transforma el espacio de características
Figure imgf000008_0002
a un espacio de características 5* de dimensión P en el que el nuevo vector de características y(c) no contenga información sesgada que pueda discriminar de forma injusta a los usuarios. La Figura 1 muestra el diagrama de bloques de la integración de la tecnología desarrollada con el método propuesto en sistemas ya entrenados.
La Figura 2 representa el proceso de aprendizaje del método propuesto. En este ejemplo se utilizan 3 muestras (A+P+N). Para el caso de 3 muestras, el método se divide en los siguientes pasos: a. Se genera una base de datos de tripletes (?) a partir de las M muestras disponibles de Y identidades. Las muestras se agrupan en conjuntos de 3, en los que 2 muestras pertenecen a una misma identidad y una tercera pertenece a otra identidad distinta.
b. Se pasa cada una de las tres muestras por el modelo pre-entrenado y se genera un vector de características s de dimensión 1 x<
c. Se entrena un detector de sesgo a partir de los vectores de características y sus etiquetas asociadas (e.j. género, etnia, edad). El detector de sesgo puede basarse en diferentes algoritmos de clasificación y dará como salida un valor ft^) proporcional al nivel de sesgo presente en el vector de características s. Un ejemplo de detector de sesgo puede ser una red neuronal con una capa de entrada y una capa de salida binaria entrenada con una función softmax o similar. d. Se añade una etapa de extracción de sesgo formada por una red neuronal que incluye una capa de entrada (que será la salida del paso b) y una capa de salida con número de neuronas L.
e. Se entrenan los pesos de esta capa para encontrar una función de transformación fKx) que minimice la función de coste tal que:
f.
Figure imgf000009_0003
donde K&,
Figure imgf000009_0001
¾ son los vectores obtenidos en el paso (b) y donde en un ejemplo no limitativo se calcula este coste a través de la siguiente ecuación (2):
Figure imgf000009_0004
donde sk, XP, ¾ son los vectores obtenidos en el paso b para cada uno de los tripletes 1 de la base de datos T, ¿TCsi es un escalar que definen la cantidad de sesgo presente en los vectores de características de cada triplete,
Figure imgf000009_0002
es una distancia entre vectores de características y a una constante. La cantidad de sesgo representa la capacidad de un algoritmo para detectar atributos sesgados en ese espacio de características. Una posible forma de calcularlo es a través de una ecuación como (3):
Figure imgf000009_0005
donde b es una constante es la salida del detector de sesgo entrenado
Figure imgf000009_0006
previamente en el paso c para la muestra A. se calculan de
Figure imgf000009_0007
forma análoga. g. Se repiten los pasos c, d y e hasta conseguir eliminar el sesgo. Se reemplazan los vectores de características del paso b por los obtenidos en el paso e. Entrenando por tanto el detector de sesgo del paso c cada vez que se añade una nueva capa de extracción de sesgo. h. El proceso acaba cuando el detector implementado en el paso c no es capaz de superar un rendimiento mínimo de detección de sesgo.
El resultado final es una transformación que permite eliminar el sesgo introducido durante el entrenamiento del modelo-pre-entrenado sin reducir la utilidad del espacio de características.
Entrenamiento de sistemas desde cero para la eliminación del sesgo.
En este caso no se parte del modelo pre-entrenado, por lo que se tiene libertad total para entrenar tu propio modelo en base al doble objetivo de rendimiento y eliminación de sesgo. El método consiste en utilizar la función de coste propuesta en el paso e para entrenar el modelo a partir de conjuntos de muestras como los sugeridos en el paso a. Al introducir la dimensión de sesgo en el entrenamiento, este será eliminado desde el principio y no se introducirá en el modelo como si ocurre en aquellos sistemas entrenados solo a partir de funciones de coste que evalúen e rendimiento de verificación/identificación. En este caso, el espacio de características s que se obtiene al finalizar el entrenamiento ya no contiene la información sesgada.
Ejemplo de aplicación del método de la invención
El método propuesto trabaja en el dominio abstracto del espacio de características por lo que es independiente de la muestra biométrica, el modelo pre-entrenado o el sesgo a eliminar. A continuación, se muestran los resultados obtenidos para la eliminación del sesgo en tareas de reconocimiento facial tanto para el caso de género como de etnia.
Para probar el rendimiento del sistema se ha utilizado el conjunto de test de la base de datos pública Labeled Face in the Wild (LFW), referente en la literatura de reconocimiento facial. El objetivo de un algoritmo de eliminación de sesgo es doble: eliminar el sesgo y mantener el rendimiento del sistema de reconocimiento de identidad. Para llevar a cabo los experimentos se ha utilizado un modelo pre- entrenado de reconocimiento facial basado en la red convolucional Resnet-50. Se ha escogido este modelo por sus altas prestaciones en diferentes bases de datos adquiridas en entornos operacionales. Para este experimento se han utilizado tripletes (paso a del método propuesto) formados a partir del subconjunto de entrenamiento de la base de datos LFW, mientras que para entrenar el detector de género (paso d) se ha utilizado un subconjunto de 5000 imágenes (equidistribuidas entre hombres, mujeres, blancos, negros y asiáticos) no incluidas en la base de datos LFW.
La Figura 3B muestra en rendimiento del modelo pre-entrenado antes y después de añadir la etapa de eliminación de sesgo. Mientras que en la Figura 3A se muestra en rendimiento de detección de género para diferentes algoritmos. Los resultados muestran una reducción del rendimiento de verificación de un 2% (del 98% al 96% de Equal Error Rate) mientras que el rendimiento en la detección de género cae por encima del 37% (del 98% al 61% de Equal Error Rate). Se observa por tanto como el método propuesto es capaz de reducir considerablemente el sesgo de género, mientras mantiene un rendimiento de verificación competitivo.
Análogamente, las Figuras 4A y 4B muestran el mismo experimento para la eliminación del sesgo de etnia. En este caso, se mantiene la pequeña caída de un 2% en cuanto al rendimiento de verificación, pero se reduce la eliminación de sesgo a un 16%. Flay que tener en cuenta que las fronteras entre las características faciales de diferentes etnias no siempre son claras.
REFERENCIAS
[1] M. Alvi, A. Zisserman, C. Nellaker, "Turning a Blind Eye: Explicit Removal of Biases and Variation from Deep Neural Network Embeddings", in Proc. of European Conference on Computer Vision, September 2018.
[2] A. Das, A. Dantcheva and F. Bremond, "Mitigating Bias in Gender, Age, and Ethnicity Classification: a Multi-Task Convolution Neural Network Approach", in Proc. of European Conference on Computer Vision Workshops, September 2018.
[3] K. Q. Weinberger, J. Blitzer, and L. K. Saúl,“Distance metric learning for large margin nearest neighbor classification”, Journal of Machine Learning Research, vol. 10, pp. 207-244, 2009.

Claims

R E I V I N D I C A C I O N E S
1.- Un sistema de reconocimiento biométrico que comprende uno o más procesadores; al menos una memoria; y uno o más programas en el que dichos programas están almacenados en una memoria y configurados para ejecutarse mediante el o los procesadores, caracterizado porque los programas incluyen instrucciones para ejecutar las etapas de:
definir un conjunto formado por M muestras de Y personas diferentes etiquetadas a partir de atributos como el género, etnia o edad, de tal forma que las muestras A y las muestras P se corresponden con muestras de la misma identidad, mientras que las muestras N se corresponde con diferentes identidades;
introducir un valor s que se corresponde con el sesgo presente en cada muestra; y aprender una función de transformación que genera un nuevo espacio de
Figure imgf000012_0002
características configurado para: (i) minimizar la distancia
Figure imgf000012_0003
entre los vectores de características de A y P; (ii) maximizar la distancia
Figure imgf000012_0001
entre los vectores de características A y N; y (iii) reducir el valor s en las muestras hasta su eliminación.
2.- El sistema de acuerdo con la reivindicación 1 donde los programas incluyen instrucciones para generar una base de datos de tripletes (T) a partir de las M muestras disponibles de Y identidades de tal forma que las muestras se agrupan en conjuntos de tres, en los que dos muestras pertenecen a una misma identidad y una tercera pertenece a otra identidad distinta.
3.- El sistema de acuerdo con la reivindicación 2 donde los programas incluyen instrucciones para pasar cada una de las tres muestras por el modelo pre-entrenado y generar un vector de características x de dimensión d.
4.- El sistema de una cualquiera de las reivindicaciones 1 a 3 donde los programas incluyen instrucciones para entrenar un detector de sesgo a partir de los vectores de características y sus etiquetas asociadas de género, edad o etnia; donde dicho detector es, al menos, un algoritmo de clasificación y dará como salida un valor proporcional al nivel de sesgo presente en el vector de características
5.- El sistema de una cualquiera de las reivindicaciones 1 a 4 donde los programas incluyen instrucciones para la extracción de sesgo formada por una red neuronal que incluye una capa de entrada y una capa de salida con número de neuronas L.
6.- El sistema de acuerdo con una cualquiera de las reivindicaciones 1 a 5 donde los programas incluyen instrucciones para entrenar los pesos de esta capa para encontrar una función de transformación
Figure imgf000013_0001
J que minimice la función de coste:
Figure imgf000013_0005
donde ¾,
Figure imgf000013_0002
¾ son los vectores obtenidos en el paso b.
7.- El sistema de acuerdo con la reivindicación 6 donde los programas incluyen instrucciones para calcular el coste a través de la siguiente ecuación (2):
Figure imgf000013_0006
donde
Figure imgf000013_0007
x¾¡ son los vectores obtenidos en el paso b para cada uno de los tripletes ¿ de la base de datos T, Kx) es un escalar que definen la cantidad de sesgo presente en los vectores de características de cada triplete,
Figure imgf000013_0003
es una distancia entre vectores de características y ® una constante, donde la cantidad de sesgo representa la capacidad de un algoritmo para detectar atributos sesgados en ese espacio de características.
8.- El sistema de acuerdo con una cualquiera de las reivindicaciones 6 y 7 donde los programas incluyen instrucciones para calcular el escalar
Figure imgf000013_0004
como:
Figure imgf000013_0008
donde b es una constante
Figure imgf000013_0009
es la salida del detector de sesgo entrenado previamente en el paso c para la muestra A.
Figure imgf000013_0010
calculan de forma análoga.
9.- El sistema según una cualquiera de las reivindicaciones 1 a 8 donde los programas incluyen instrucciones para finalizar el proceso iterativo de eliminación del sesgo
Figure imgf000014_0001
3 cuando el detector de sesgo no sea capaz de superar un rendimiento mínimo de detección de sesgo.
10.- Un método implementado por computador para el desarrollo de módulos de eliminación del sesgo en sistemas biométricos de acuerdo con una cualquiera de las reivindicaciones 1 a 9 que comprende definir un conjunto formado por M muestras de Y personas diferentes etiquetadas a partir de atributos como el género, etnia o edad, de tal forma que las muestras A y las muestras P se corresponden con muestras de la misma identidad, mientras que las muestras N se corresponde con diferentes identidades y donde, además, se introduce un valor s que se corresponde con el sesgo presente en cada muestra; y donde el método se caracteriza porque es un método de aprendizaje automático iterativo que comprende aprender una función de transformación <KS) que genera un nuevo espacio de características configurado para: (i) minimizar la distancia
Figure imgf000014_0002
entre los vectores de características de A y P;
(ii) maximizar la distancia d(¾*¾) entre los vectores de características A y N; y (iii) reducir el valor s en las muestras hasta su eliminación.
1 1 .- El método implementado por computador de la reivindicación 10 que comprende generar una base de datos de tripletes (T) a partir de las M muestras disponibles de Y identidades de tal forma que las muestras se agrupan en conjuntos de tres, en los que dos muestras pertenecen a una misma identidad y una tercera pertenece a otra identidad distinta.
12.- El método implementado por computador de la reivindicación 1 1 que comprende pasar cada una de las tres muestras por el modelo pre-entrenado y generar un vector de características x de dimensión d.
13.- El método implementado por computador de una cualquiera de las reivindicaciones 10 a 12 que comprende entrenar un detector de sesgo a partir de los vectores de características y sus etiquetas asociadas de género, edad o etnia; donde dicho detector es, al menos, un algoritmo de clasificación y dará como salida un valor &U) proporcional al nivel de sesgo presente en el vector de características x.
14.- El método implementado por computador de una cualquiera de las reivindicaciones 10 a 13 que comprende una etapa de extracción de sesgo formada por una red neuronal que incluye una capa de entrada y una capa de salida con número de neuronas L.
15.- El método implementado por computador de acuerdo con una cualquiera de las reivindicaciones 10 a 14 que comprenden la etapa de entrenar los pesos de esta capa para encontrar una función de transformación que minimice la función de coste:
Figure imgf000015_0009
Figure imgf000015_0004
donde son los vectores obtenidos en el paso b.
Figure imgf000015_0007
16.- El método implementado por computador de acuerdo con la reivindicación 15, donde el coste se calcula a través de la siguiente ecuación (2):
Figure imgf000015_0005
donde son los vectores obtenidos en el paso b para cada uno de los
Figure imgf000015_0008
tripletes 1 de la base de datos T,
Figure imgf000015_0001
es un escalar que definen la cantidad de sesgo presente en los vectores de características de cada triplete,
Figure imgf000015_0002
es una distancia entre vectores de características y s una constante, donde la cantidad de sesgo representa la capacidad de un algoritmo para detectar atributos sesgados en ese espacio de características.
17.- El método implementado por computador de acuerdo con una cualquiera de las reivindicaciones 15 y 16 donde el escalar
Figure imgf000015_0003
se calcula como:
Figure imgf000015_0006
donde b es una constante es la salida del detector de sesgo entrenado
Figure imgf000016_0002
previamente en el paso c para la muestra A.
Figure imgf000016_0003
j se calculan de forma análoga.
18.- El método implementado por computador según una cualquiera de las reivindicaciones 10 a 17 donde el proceso iterativo de eliminación del sesgo
Figure imgf000016_0001
3 finaliza cuando el detector de sesgo no sea capaz de superar un rendimiento mínimo de detección de sesgo.
19.- Un producto de programa informático con instrucciones configuradas para su ejecución por uno o más procesadores que, cuando son ejecutadas por un sistema de reconocimiento biométrico de acuerdo con una cualquiera de las reivindicaciones 1 a 9 hacen que dicho sistema lleve a cabo el método según cualquiera de las reivindicaciones 10 a 18.
PCT/ES2019/070877 2018-12-24 2019-12-23 Método para la eliminación del sesgo en sistemas de reconocimiento biométrico WO2020136297A1 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
ES201831278A ES2769093A1 (es) 2018-12-24 2018-12-24 Metodo para la eliminacion del sesgo en sistemas de reconocimiento biometrico
ESP201831278 2018-12-24

Publications (1)

Publication Number Publication Date
WO2020136297A1 true WO2020136297A1 (es) 2020-07-02

Family

ID=69714074

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/ES2019/070877 WO2020136297A1 (es) 2018-12-24 2019-12-23 Método para la eliminación del sesgo en sistemas de reconocimiento biométrico

Country Status (2)

Country Link
ES (1) ES2769093A1 (es)
WO (1) WO2020136297A1 (es)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861474A (zh) * 2021-04-23 2021-05-28 腾讯科技(深圳)有限公司 一种信息标注方法、装置、设备及计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002305652A1 (en) * 2001-05-18 2002-12-03 Biowulf Technologies, Llc Methods for feature selection in a learning machine

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
A. DASA. DANTCHEVAF. BREMOND: "Mitigating Bias in Gender, Age, and Ethnicity Classification: a Multi-Task Convolution Neural Network Approach", PROC. OF EUROPEAN CONFERENCE ON COMPUTER VISION WORKSHOPS, September 2018 (2018-09-01)
ALEXANDER HERMANS ET AL: "In Defense of the Triplet Loss for Person Re-Identification", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 22 March 2017 (2017-03-22), XP081280750 *
DAS ABHIJIT ET AL: "Mitigating Bias in Gender, Age and Ethnicity Classification: A Multi-task Convolution Neural Network Approach", 8 September 2018, ROBOCUP 2008: ROBOCUP 2008: ROBOT SOCCER WORLD CUP XII; [LECTURE NOTES IN COMPUTER SCIENCE; LECT.NOTES COMPUTER], SPRINGER INTERNATIONAL PUBLISHING, CHAM, PAGE(S) 573 - 585, ISBN: 978-3-319-10403-4, XP047501090 *
K. Q. WEINBERGERJ. BLITZERL. K. SAUL: "Distance metric learning for large margin nearest neighbor classification", JOURNAL OF MACHINE LEARNING RESEARCH, vol. 10, 2009, pages 207 - 244
KILIAN Q WEINBERGER ET AL: "Distance Metric Learning for Large Margin Nearest Neighbor Classification", JOURNAL OF MACHINE LEARNING RESEARCH, MIT PRESS, CAMBRIDGE, MA, US, vol. 10, 1 June 2009 (2009-06-01), pages 207 - 244, XP058264216, ISSN: 1532-4435 *
M. ALVIA. ZISSERMANC. NELLAKER: "Turning a Blind Eye: Explicit Removal of Biases and Variation from Deep Neural Network Embeddings", PROC. OF EUROPEAN CONFERENCE ON COMPUTER VISION, September 2018 (2018-09-01)
MOHSAN ALVI ET AL: "Turning a Blind Eye: Explicit Removal of Biases and Variation from Deep Neural Network Embeddings", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 6 September 2018 (2018-09-06), XP081079968 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861474A (zh) * 2021-04-23 2021-05-28 腾讯科技(深圳)有限公司 一种信息标注方法、装置、设备及计算机可读存储介质
CN112861474B (zh) * 2021-04-23 2021-07-02 腾讯科技(深圳)有限公司 一种信息标注方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
ES2769093A1 (es) 2020-06-24

Similar Documents

Publication Publication Date Title
JP7297226B2 (ja) 個人情報を保護するために原本データをコンシーリング処理して生成された変造データを認識するために使われる使用者ラーニングネットワークを学習する方法及びテストする方法、そしてこれを利用した学習装置及びテスト装置
Gross et al. Integrating utility into face de-identification
US8005767B1 (en) System and method of classifying events
US8719191B2 (en) Training and verification using a correlated boosted entity model
Abaza et al. Quality based rank-level fusion in multibiometric systems
Robinson et al. Balancing biases and preserving privacy on balanced faces in the wild
Fairhurst et al. Selective review and analysis of aging effects in biometric system implementation
Toh et al. Fusion of auxiliary information for multi-modal biometrics authentication
Duhaim et al. Cheating detection in online exams during COVID-19 pandemic using data mining techniques
WO2020136297A1 (es) Método para la eliminación del sesgo en sistemas de reconocimiento biométrico
Piugie et al. How artificial intelligence can be used for behavioral identification?
Rahman et al. Human face recognition: An eigenfaces approach
Kirchgasser et al. Biometric menagerie in time-span separated fingerprint data
Johnson et al. Predicting large population data cumulative match characteristic performance from small population data
Gonzalez-Garcia et al. Introduction to presentation attacks in signature biometrics and recent advances
Adeoye Multi-mode biometric solution for examination malpractices in Nigerian schools
Yanushkevich et al. Taxonomy and modeling of impersonation in e-border authentication
Scheidat et al. Short term template aging effects on biometric dynamic handwriting authentication performance
Mohammed Anzar et al. On combining multi-normalization and ancillary measures for the optimal score level fusion of fingerprint and voice biometrics
Liu Fingerprint analysis and singular point definition by deep neural network
Hui et al. An assessment of user authentication methods in mobile phones
Wasnik et al. Subjective logic based score level fusion: Combining faces and fingerprints
Ulupinar et al. The importance of standardization in biometric data for digital forensics
De Marsico et al. A new data normalization function for multibiometric contexts: A case study
Indi et al. Person identification based on multi-biometric characteristics

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19856452

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19856452

Country of ref document: EP

Kind code of ref document: A1