WO2024002618A1 - Procédé de reconnaissance biometrique - Google Patents

Procédé de reconnaissance biometrique Download PDF

Info

Publication number
WO2024002618A1
WO2024002618A1 PCT/EP2023/064883 EP2023064883W WO2024002618A1 WO 2024002618 A1 WO2024002618 A1 WO 2024002618A1 EP 2023064883 W EP2023064883 W EP 2023064883W WO 2024002618 A1 WO2024002618 A1 WO 2024002618A1
Authority
WO
WIPO (PCT)
Prior art keywords
group
biometric
recognition
candidate
data
Prior art date
Application number
PCT/EP2023/064883
Other languages
English (en)
Inventor
Stéphane GENTRIC
Original Assignee
Idemia Identity & Security France
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Idemia Identity & Security France filed Critical Idemia Identity & Security France
Publication of WO2024002618A1 publication Critical patent/WO2024002618A1/fr

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/30Post-processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Definitions

  • the present invention relates to a biometric recognition method and device.
  • recognition methods are for example used at the entrance to places with restricted access.
  • a recognition system with one or more biometric capture devices each associated with a gate is for example placed at the entrance to a place with restricted access to control the opening of the gates in the event of validated recognition.
  • Biometric recognition methods and devices are based on the correspondence between the biometric data of an individual candidate for identification and the biometric data of an individual authorized for access which has been stored beforehand.
  • a computer processing unit hosts the database containing the biometric identification data of the individuals authorized to access, these data having been acquired in particular by enrollment, and the computer processing unit executes a correspondence program (or “matching” in English) which compares the biometric data of the candidate individual to the biometric data of the individuals authorized to access stored by means of a correspondence model. Identification is validated when the biometric data of the candidate individual corresponds to the biometric data of one of the individuals authorized to access the database.
  • Biometric recognition systems and in particular their correspondence models, are evaluated by tests on biometric validation databases, including in particular several samples of biometric data for the same person, for example several images of the same person with expressions different faces, and error rates are measured using:
  • the two error rates, FAR and FRR are linked and depend on a decision threshold which is adjusted according to the targeted characteristic of the high or low security biometric recognition system. Indeed, the lower the decision threshold, the higher the false acceptance rate. In this case, the biometric recognition system will accept impostors. Conversely, the higher the decision threshold, the lower the false acceptance rate. The biometric recognition system will then be robust to impostors but will reject legitimate users.
  • the matching program known in itself, is conventionally executed, it compares the biometric data of the candidate individual to the stored biometric data of the individuals authorized to access, by means of similarity scores, which then allows the recognition process to validate or refuse the recognition of the candidate individual among one of the authorized individuals.
  • This correspondence program calculates the pairwise similarity score between said candidate biometric data and one, typically each, of the stored biometric data of the individuals authorized to access.
  • biometric data can be of various natures, they can be extracted from photographs, images, video, 3D images, audio recordings, and characterize facial features, fingerprints, patterns irises of the eyes or even the voice, and are generally acquired by optical or audio means connected to a computer processing unit.
  • the biometric learning data is hosted in a learning database which belongs, for example, to the manufacturer of the recognition device or to the operator of the recognition device.
  • the training database and the validation database of the matching model may be partly or even completely identical.
  • Each biometric data corresponds to a unique individual in the database.
  • several biometric learning data are stored per individual, for example, in the case of facial recognition, several photographs of the individual's face, from different angles or facial expressions in particular.
  • biometric learning data can be stored in the form they have before extraction, for example photograph, image, video, 3D images, sound stream, or be computer coded after extraction, for example from an image the facial biometric characteristics are coded in the form of a biometric vector as described in document FR3083895, the image extraction of the biometric characteristics in the form of a biometric vector being carried out by means of a neural network.
  • the training of this neural network is carried out upstream on a biometric training database whose data is acquired by known dedicated means.
  • One of the aims of the invention is to remedy at least part of the aforementioned drawbacks by providing a fairer biometric recognition method.
  • a biometric recognition method comprising steps of:
  • said recognition method being characterized in that it also comprises steps of:
  • the biometric recognition process is thus made fairer without requiring supplementing the biometric training data base, that is to say without increasing the generation time of the correspondence model, since here we correct a posteriori the results of said model.
  • random selection results in an addition of noise which makes it possible to degrade the performance of the best groups in order to reduce bias by putting the different groups at the “level” of the least performing, which thus improves fairness between the different groups.
  • the addition of noise is controlled because the random drawing is controlled by said probability density function.
  • the use of the correspondence model for calculating the similarity score of the candidate biometric data is not complicated and is conventionally executed on a reference biometric database, for example of individuals authorized to access.
  • transition probability density function is carried out for at least the groups different from the target group but preferably for each of the groups so as not to create diversity at this stage between the target group and the others, The absence of diversity at this stage then makes it possible to determine in a unified manner, without distinction for the target group and another, the recognition score.
  • the at least one transition probability density function corresponds in particular to a field of probability density functions, which then allows discretized processing, in particular matrix processing. From its steps, it is understood that the biometric recognition method according to the invention is implemented by computer, in particular by means of at least one computer unit.
  • the classification of said candidate biometric data uses information external to said biometric data as such, such as information extracted from an identity document of the candidate individual.
  • the candidate individual that is to say the individual whose candidate biometric data has been acquired, conventionally presents an identity document during enrollment or pre-enrolment, the taking into account of which information allows classification among groups, for example whether the groups are related to gender.
  • the development of the correspondence model is carried out by training on the basis of said biometric learning data, the correspondence model comprising in particular a neural network and the training being carried out in particular by deep learning on the basis of said biometric data.
  • learning which makes it possible to quickly obtain a robust correspondence model, quick to execute once coded and requiring little storage memory space.
  • the biometric recognition method according to the invention comprises steps of: - calculation, for each group, of a distribution of imposter similarity scores on the basis of the biometric training data, called initial histogram of the group's impostors;
  • the at least one transition probability density function generated from the group is described in the form of a transition matrix, in particular square, this discretization of the probability density function by intervals allows matrix use simple and requires little memory size, and the preference for the square matrix embodies the optimization of this simplification.
  • the similarity scores and the recognition scores each belong to a continuous range of values stretching between a minimum value and a maximum value, each continuous range of values being divided into a number of score intervals, each transition matrix comprising a number of rows and a number of columns, the number of rows corresponding to said number of recognition score intervals and the number of columns corresponding to the number of similarity intervals, which allows reading of the matrix with input data in the form of a similarity score defining a column and output data in the form of a recognition score, without requiring constraints on the division by intervals of values, which in particular do not have need to be of the same length and in the case where the numbers of intervals of similarity and recognition scores are the same then the matrix is square, of dimension n 2 , even though the ranges and their divisions could be distinct, even if this is not preferential.
  • the step of generating at least one transition probability density function of the group as many transition probability density functions as the number of columns of the transition matrix of said group are generated, which allows to associate a probability density function with each column of the transition matrix, that is to say for each interval of similarity scores and to discretize the probability density function by intervals.
  • the transition matrix of said group is square and the generation step comprises a sub-step of initializing the transition matrix of said group by the identity matrix, which in particular makes it possible not to create diversity, in depending on the type of group depending on whether it is the target group or not, during the step of determining the recognition score of the method since for the target group the transition matrix being unity, the similarity scores of the target group will not be modified during the random selection from the identity matrix, the recognition score being worth the similarity score.
  • this initialization also avoids any risk of non-convergence during the generation phase.
  • the biometric recognition method according to the invention comprises a step of determining a target group, in particular among said at least two groups or by constructing a fictitious target group, which makes it possible to designate a target in a manner to make some or all of the other groups converge towards this target group.
  • said target group corresponds to the one for which the accumulation of the initial histogram of impostors is the highest, which will make it possible to degrade the performance of the other groups to reach that of the target group.
  • the generation step comprises sub-steps of:
  • a learning optimization method in particular a gradient descent method or a simulated annealing method or a Levenberg-Marquardt method, so as to determine the at least one transition probability density function of said group.
  • This mode of generating the transition probability density function of a group is compatible with both the matrix representation in the form of a transition matrix and with any continuous parametric function producing probability density functions.
  • Using the matrix approach that is to say, discretized over intervals, allows us not to limit the family of functions that can be generated. In addition, these characteristics make it possible to quickly determine the probability density functions of the groups.
  • the step of generating the transition matrix by group is carried out analytically, and includes sub-steps of:
  • the step of determining a recognition score of said candidate biometric data is carried out by randomly drawing a number with the probability density function contained in the column corresponding to the score interval comprising the score similarity of said candidate biometric data, the number drawn from said column belonging to a recognition score interval corresponding to a line of said column and the recognition score of said candidate biometric data being defined in the corresponding recognition score interval to said line.
  • a step of determining the recognition score allows a simple implementation, which essentially only requires knowledge, that is to say local memorization , transition matrices of said groups, a classifier and the correspondence model.
  • this interval of recognition scores corresponding to said line we will take the same relative position as in the initial interval of scores comprising the similarity score of said candidate biometric data, in order to precisely determine the score thus constructed.
  • the groups define population categories according to demographic and/or social factors, which makes it possible to make biometric recognition processes equitable regardless of gender, or even profession.
  • the learning and/or reference and/or candidate biometric data are extracted from facial images or fingerprint images or vein images or iris images or voice recordings. , which makes it possible to apply the process to different types of biometric data.
  • the invention also relates to a biometric recognition device capable of implementing the biometric recognition method according to the invention, having the same advantages as the invention.
  • Figure 1 is a schematic view of part of the process according to the invention.
  • Figure 2 schematically shows another part of the process according to the invention;
  • Figure 3 illustrates distributions of similarity scores of impostors and legitimate users of a group based on the biometric learning data of said group according to the invention
  • Figure 4 shows the steps of determining the transition probability density function and determining a recognition score of said candidate biometric data according to one embodiment of the method according to the invention
  • Figure 5 illustrates the alignment step according to another embodiment of the method according to the invention.
  • Figure 6 illustrates the step of iterative calculation of a matrix of possible movements between two indexes of the transition matrix.
  • FIG.l shows a partial schematic view of the biometric recognition process in the form of a flowchart.
  • the exposed part of the process in Figure 1 aims to illustrate more particularly the steps which are carried out at the time of access verification by biometric recognition, for example to enter a regulated place.
  • the DBR reference and DBc candidate biometric data are extracted from facial images.
  • a candidate biometric data DBc for biometric recognition is acquired, this is a photograph of the face of the candidate individual, that is to say a facial image, this candidate biometric data DBc can be in particular acquired by optical means such as a camera or photographic apparatus. Preferably the acquisition of this data is carried out on site but it can also be carried out beforehand using an application on a mobile phone for example.
  • the candidate biometric data DBc can then be encoded, for example in vector form.
  • the candidate biometric data DBc is classified during a classification step E CLA among several groups, here for example Gi and G2, so as to determine the group to which the candidate biometric data DBc belongs, this is here from the first Gi group.
  • the groups are preferentially exclusive of each other, but they may also not be and in this use case for a given candidate data the probability of belonging to each group is estimated, a recognition score is determined for each group and weighted with said probabilities of belonging to each group, so as to produce a consolidated recognition score.
  • the groups are determined in particular according to biases which were observed during the validation of the correspondence model and they preferentially define population categories according to demographic and/or social factors. It can for example be the type if a bias has been detected, during validation tests for example, that is to say a gap between the distributions of similarity scores, or between the false rejection rates FRR and/or false acceptance rate FAR, women and men.
  • the Gi group corresponds to the female gender group and G2 to the male gender group.
  • the means of carrying out this classification step can be of different forms.
  • the classifier executes a method of processing the candidate biometric data in the form of a facial image, for example by means of a neural network, and/or the classifier executes a document analysis method, if an identity document is also provided elsewhere and indicates, or makes it possible to deduce, membership in one of said groups Gi, G2.
  • the candidate biometric data DBc has thus been classified among the Gi group of female gender.
  • the acquired DBc candidate biometric data is transmitted to an MCOR correspondence model previously developed on the basis of biometric training data.
  • the MCOR correspondence model is classically executed by comparing the candidate biometric data DBc to one or more reference biometric data DBR, for example of individuals authorized to have “1: n” access or of a particular person in “1:1”.
  • This DBR biometric reference database used in operation is typically the property of the operator of the “1:n” recognition device or of the particular person in “1:1”.
  • the biometric learning database used during the development of the MCOR correspondence model is preferentially different from the reference biometric database DBR which is stored and used in operation during recognition in 1: n, especially that their use does not take place at the same time and does not meet the same need.
  • Certain biometric data may nevertheless exist in both databases. Indeed, the larger the learning database used to develop the MCOR correspondence model (including integrating synthetic facial images), the better the quality of the correspondence model will be, whereas classically the database reference of authorized individuals which is used in operation during recognition only includes the enrolled biometric data of the individuals authorized to access and evolves over time according to the new enrolled individuals authorized to access.
  • the step of calculating the SSc similarity score by the MCOR correspondence model is repeated on the different DBR reference biometric data of the reference base constituted by the data biometrics of individuals authorized to access, obtained for example by enrollment.
  • Preferably all the reference data are compared to the candidate data DBc given that the calculation times are very short and therefore do not require any particular preselection.
  • the rest of the process is applied to each similarity score obtained until the recognition score is determined and it is the best recognition score obtained among the biometric data compared which is kept, and which is compared to the threshold of decision.
  • Transmission of DBR reference biometric data to the correspondence model MCOR is represented in the form of dotted lines because the DBR reference biometric data is previously acquired upstream.
  • a similarity score SSc is then calculated for said candidate biometric data DBc using the MCOR correspondence model previously developed.
  • Such MCOR matching patterns are known.
  • the transition probability density function PDFTi c specific to said group Gi for said candidate biometric data DBc is that of the candidate data.
  • the next step consists of determining E DSR a recognition score SRc of said candidate biometric data, said recognition score SRc resulting from the random drawing with said transition probability density function PDFTi c determined for said candidate biometric data DBc .
  • the decision threshold T is preferably unique, independent of the group to which said candidate biometric data belongs, but decision thresholds by group could also be considered.
  • FIG.2 Figure 2 schematically shows another part of the method according to the invention, and more particularly the steps leading to the generation of at least one transition probability density function, these steps are therefore carried out upstream steps previously illustrated in Figure 1.
  • a step of acquiring biometric learning data DBAi, DBAj, DBAk is carried out, this is the biometric learning data which will be used in particular for the development of the MCOR correspondence model.
  • the classification step E CLA is carried out so as to determine, among at least the two groups Gi, G2, the group Gi corresponding here to the female gender group and G2 to the male gender group, the group Gi, G2 to which each biometric learning data DBAi, DBAj, DBAk belongs.
  • the classifier used here executes a facial image processing method, for example by means of a neural network.
  • the classifier used for the candidate data it is possible to generalize to groups not exclusive to each other, although this is more complex during training because it requires learning with weights by group, which extends training time.
  • the MCOR matching model is the essential module coded into the matching executable program.
  • the step of developing the MCOR correspondence model is carried out by training on the basis of said biometric learning data DBAi, DBAj, DBAk, the correspondence model comprising in particular a neural network and the training being carried out in particular by deep learning on the basis of said biometric learning data DBAi, DBAj, DBAk.
  • the transition probability density functions PDFTi, PDFT2 are then generated based on all of the biometric learning data DBAi, DBAj, DBAk of each group Gi, G2.
  • These transition probability density functions PDFTi, PDFT2 each comprise several probability density functions per score interval and constitute fields of probability density functions.
  • FIG. 3 illustrates for group 1 the distributions of the similarity scores of the impostors I_Gi and the legitimate users U_Gi on the basis of the biometric learning data DBAi, DBAj, DBAk of said group Gi according to the invention.
  • the abscissa represents the SS similarity scores and the ordinate represents the probability density R, the integral of which is 1.
  • R the probability density
  • the distribution function FX(x) describes the probability that the continuous random variable takes a value less than or equal to x. It thus defines the area under the probability density to the left of x such that: [Math. 2]
  • the generation step E GEN generates a transition matrix per group Gi, G2, and for each group Gi, G2 the field of transition probability density functions PDFTi, PDFT2 is described in the form of a square transition matrix.
  • the SS similarity scores belong to a continuous range of values stretching between a minimum value, for example 0, and a maximum value, for example 20000, said continuous range of values being divided by pieces into a number of score intervals, these intervals cover the entire range and are linked continuously, without overlap.
  • the choice of number of intervals results from a compromise between precision and calculation time.
  • These intervals are not necessarily the same length.
  • Each square transition matrix is of dimension n 2 , n corresponding to said number of similarity score intervals as well as to the number of recognition score intervals since it will be read with a similarity score as input and will output a score of recognition.
  • the transition matrices of the different groups are of the same dimensions so as to limit the diversity of processing.
  • the step of generating the transition matrix PDFTi, PDFT2 per group comprises a sub-step of initializing said transition matrix PDFTi, PDFT2 of said group Gi, G2 by the identity matrix, this step is by nature prior to any other step affecting the transition matrix PDFTi, PDFT2 of each group.
  • the generation step E GEN of the transition matrix PDFTi, PDFT2 per group comprises a sub-step of determining a target group Gi, G2 knowing that this sub-step could also be prior to the generation step E GEN.
  • the target group the one for which Do under the probability density characteristic of the distribution of the similarity scores of the impostors, that is to say the accumulation of the initial histogram of the impostors I_GI, I_G2, is the highest , that is to say the group which presents the worst performances, suppose here that this target group is the second group G2.
  • the target group is here chosen from said at least two groups Gi, G2, but it can also be a fictitious target group constructed on the basis of these groups, being one or the other depending on the score so as to trace a fictitious group, which would be representative of the worst performances (highest total of impostors), which makes it possible to have a target towards which it is always possible to correct, and therefore to converge since it is always the worst .
  • the outline of such a fictitious group would therefore be, for example,
  • the generation step E GEN is carried out by learning and comprises, after in particular determination of the target group among said at least two groups Gi, G2 and initialization of the transition matrix PDFTi, PDFT2 of each group, sub-steps of:
  • the step of determining the recognition score SRc is carried out by randomly drawing a number according to the probability density function contained in the column corresponding to the score interval comprising the similarity score SSc of said candidate biometric data, the number drawn from said column belonging to a recognition score interval corresponding to a row of said column and the recognition score SRc of said candidate biometric data being defined in the score interval corresponding to said line.
  • the recognition score SRc therefore belongs to the interval of recognition scores SR corresponding to the fourth line of the PDFTi matrix: 6000-8000 and more precisely it SRc is obtained by applying the same distance offset a relative to the lower edge of this fourth interval, which gives a recognition score SRc of 7500.
  • This choice of applying the same offset at input and output is not necessary but makes it possible to guarantee continuity.
  • the corrector therefore takes as input to the transition matrix PDFTi the similarity score SSc of the candidate biometric data DBc and gives as output the recognition score SRc of the candidate biometric data DBc.
  • the step of generating the transition matrix by group PDFTi and PDFT2 is carried out analytically, illustrated in Figures 5 and 6, and includes sub-steps of:
  • the alignment step starts from the initial histogram of the impostors I_Gi of group 1 (non-target) in dotted lines and the initial histogram of the impostors I G2 of the target group G2 in solid lines, the histograms are displayed here in logarithmic scale and the initial histogram of the I_Gi impostors of group 1 (non-target) is if necessary extended (finer solid line) to cover the same distribution range R, the arrows represent the shifts in differences in scores of similarity to apply to align the two histograms with each other. These same offsets are also applied to the histograms of legitimate U_Gi users because the histograms are inherently linked to each other.
  • the applied alignment results in a modification of all the scores, including the scores of legitimate users and impostors, and therefore a modification of their respective histogram.
  • Figure 6 illustrates the step of iterative calculation of a matrix of possible movements M between two indexes j,k of the transition matrix PDFTi of group 1 (non-target), forming a pair of indexes, each index designating intervals similarity and recognition scores of the transition matrix, each index therefore corresponds to a row (recognition score) and a column (similarity score).
  • said matrix of possible movements M determines from the modified source histogram of legitimate users the maximum quantity of legitimate users movable between said intervals corresponding to said indexes of the pair without the quantity d
  • the imposter changes in the aligned source histogram of the impostors, that is to say by compensating the quantity of impostors moved, so as to determine the transition matrix of said group.
  • the values of the transition matrix PDFTi are expressed in the form of Rjj Rjk Rkj Rkk, and I here refers to a proportion of imposters being in the respective interval k,j of the learning base and m to a proportion of legitimate users being in the respective interval k, j of the learning base.
  • fixing the aligned source histogram of impostors from group 1 means which requires bringing a portion of ô from index k to index j. Possible moves are calculated accordingly, and then an iterative process moves legitimate user portions to achieve the targeted FRR false rejection rate.
  • the black solid arrows illustrate the fact that the impostors are calculated from the impostors and the black dashed arrows illustrate the fact that the legitimate users are calculated from the legitimate users, but that in both cases we use the same matrix PDFTi transition of values Rjj Rjk Rkj Rkk.
  • the correction step will be applied as before, as well as the E DEC decision step.
  • the advantage of this variant consists of its minimization by localities, unlike the global minimization carried out by the cost function of the embodiment presented previously. Indeed, on certain intervals, the values of the histogram of the imposters are very high (very low FAR rate) but according to the optimization criteria defined, convergence remains sought as long as they are not equal to those of the target group, while this is not useful and unnecessarily lengthens the time of the E_GEN generation step.
  • - a module for calculating an SS similarity score including in particular the MCOR correspondence model; - a module for generating at least one function PDFTI, PDFT2 of transition probability density per group Gi, G2 based on biometric learning data of said group;
  • a decision module comprising the decision model validating or refusing recognition as a function of the SRC recognition score of said candidate biometric data by comparison of said SRC recognition score to a decision threshold T independent of the group to which said candidate biometric data belongs.
  • This device is preferably divided between different units, for example a first unit is used for the upstream stages, this first unit comprises a first computer unit, in particular a calculator and:
  • a decision module comprising the decision model validating or refusing recognition as a function of the recognition score SRc of said candidate biometric data by comparison of said recognition score SRc to a decision threshold T independent of the group to which said candidate biometric data belongs; knowing that, as previously, the different modules, the memory and the classifiers are preferably hosted in the second computing unit, but can also be distributed across several computers to parallelize the calculations, and the memory can be hosted in a remote environment.
  • the interest of the invention comes in particular from the random drawing which is controlled by said probability density function, itself calculated to degrade the performance of non-target groups and obtain lower performances, this addition of controlled “noise” allowing a reduction in bias without significantly degrading biometric recognition performance.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Collating Specific Patterns (AREA)
  • Image Analysis (AREA)

Abstract

Il comprend des étapes de : - classification (E_CLA) des données biométriques d'apprentissage parmi au moins deux groupes; - génération d'une fonction de densité de probabilité de transition; - classification (E_CLA) d'une donnée biométrique candidate (DBC) parmi lesdits groupes (G1); - calcul d'un score de similarité (SSc) de la donnée biométrique candidate (DBc); - détermination (E_DPDF) de la fonction de densité de probabilité de transition (PDFT1,c) propre audit groupe de ladite donnée biométrique candidate (DBc) en fonction du score de similarité (SSc) calculé pour ladite donnée biométrique candidate (DBC); - détermination (E_DSR) d'un score de reconnaissance (SRc) de ladite donnée biométrique candidate (DBc), ledit score de reconnaissance (SRc) résultant du tirage aléatoire avec ladite fonction de densité de probabilité de transition (PDFT1,c); - décision (E_DEC) validant ou refusant la reconnaissance en fonction du score de reconnaissance (SRc).

Description

Description Titre de l’invention : Procédé de reconnaissance biométrique
La présente invention concerne un procédé et un dispositif de reconnaissance biométrique. De tels procédés de reconnaissance sont par exemple utilisés à l'entrée de lieux à accès réglementé. Un système de reconnaissance avec un ou plusieurs dispositifs de capture biométrique associés chacun à un portillon est par exemple disposé à l'entrée d’un lieu à accès réglementé pour commander l'ouverture des portillons en cas de reconnaissance validée.
Les procédés et dispositifs de reconnaissance biométriques reposent sur la correspondance entre la donnée biométrique d'un individu candidat à l'identification et la donnée biométrique d’un individu autorisé d’accès qui a été mémorisée au préalable. Une unité informatique de traitement héberge la base de données contenant les données biométriques d'identification des individus autorisés d’accès, ces données ayant été notamment acquises par enrôlement, et l’unité informatique de traitement exécute un programme de correspondance (ou « matching » en langue anglaise) qui compare les données biométriques de l’individu candidat aux données biométriques des individus autorisés d’accès mémorisées au moyen d’un modèle de correspondance. L'identification est validée lorsque les données biométriques de l’individu candidat correspondent à des données biométriques d'un des individus autorisés d’accès de la base de données.
Les systèmes de reconnaissance biométriques, et notamment leurs modèles de correspondance, sont évalués par des tests sur des bases de données biométriques de validation, comportant notamment plusieurs échantillons de données biométriques pour une même personne, par exemple plusieurs images de la même personne avec des expressions de visage différentes, et les taux d’erreur sont mesurés au moyen de :
- taux de faux rejets FRR (de l’anglais « false rejection rate »), qui est la proportion des tentatives de reconnaissance des utilisateurs légitimes rejetées par erreur, ces rejets par le programme de correspondance s’expliquant soit en raison de non-correspondance à tort, soit en raison d’un échec à l’acquisition quand cela est applicable ;
- taux de fausses acceptations FAR (de l’anglais « false acceptance rate »), qui est la proportion des transactions des imposteurs acceptées par erreur.
Les deux taux d’erreurs, FAR et FRR, sont liés et dépendent d’un seuil de décision qui est ajusté en fonction de la caractéristique ciblée du système de reconnaissance biométrique haute ou basse sécurité. En effet, plus le seuil de décision est bas, plus le taux de fausses acceptions est élevé. Dans ce cas, le système de reconnaissance biométrique acceptera des imposteurs. A l’inverse, plus le seuil de décision est élevé, plus le taux de fausses acceptions est bas. Le système de reconnaissance biométrique sera alors robuste aux imposteurs mais rejettera des utilisateurs légitimes. Au passage d’un individu candidat, est classiquement exécuté le programme de correspondance, connu en lui-même, il compare les données biométriques de l’individu candidat aux données biométriques mémorisées des individus autorisés d’accès, au moyen de scores de similarité, ce qui permet ensuite au procédé de reconnaissance de valider ou refuser la reconnaissance de l’individu candidat parmi un des individus autorisés. Ce programme de correspondance, lors de son exécution, calcule le score de similarité par paire, entre ladite donnée biométrique candidate et une, classiquement chacune, des données biométriques mémorisées des individus autorisés d’accès.
De manière générale, les données biométriques peuvent être de natures diverses, elles peuvent être extraites de photographies, d’images, de vidéo, d’images 3D, d’enregistrements audio, et caractériser les traits du visage, les empreintes digitales, les motifs des iris des yeux ou encore la voix, et sont généralement acquises par des moyens optiques ou audio reliés à une unité informatique de traitement. Les données biométriques d’apprentissage sont hébergées dans une base de données d’apprentissage qui appartient par exemple au fabricant du dispositif de reconnaissance ou à l’exploitant du dispositif de reconnaissance. La base de données d’apprentissage et la base de données de validation du modèle de correspondance peuvent être en partie, voire totalement identiques. Chaque donnée biométrique correspond à un individu unique de la base de données. Préférentiellement, plusieurs données biométriques d’apprentissage sont stockées par individu, par exemple, en cas de reconnaissance faciale, plusieurs photographies du visage de l’individu, selon différents angles ou expressions du visage notamment. De plus, pour les besoins de la base d’apprentissage certains individus peuvent être créés de toute pièce, leurs données biométriques sont alors de synthèse. Les données biométriques d’apprentissage peuvent être stockées sous la forme qu’elles ont avant extraction, par exemple photographie, image, vidéo, images 3D, flux sonore, ou être codées informatiquement après l’extraction, par exemple à partir d’une image les caractéristiques biométriques faciales sont codées sous la forme d'un vecteur biométrique tel que décrit dans le document FR3083895 , l’extraction par image des caractéristiques biométriques sous la forme d'un vecteur biométrique étant réalisée au moyen d’un réseau de neurones. L’entraînement de ce réseau de neurones est effectué en amont sur une base de données biométriques d’apprentissage dont les données sont acquises par des moyens dédiés connus.
Néanmoins, un inconvénient des procédés de reconnaissance biométrique classiques réside principalement dans leur caractère non équitable. En effet, on constate à l’issue de l’exécution du programme de correspondance (ou « matching ») des biais, notamment en fonction des caractéristiques démographiques des populations considérées et de la proportion relative de chaque groupe démographique dans la base d’apprentissage des réseaux de neurones utilisée, rendant les résultats non équitables entre les populations. Cet inconvénient est notamment rencontré pour la reconnaissance faciale, mais d’autres biométries peuvent être concernées. Ces biais se manifestent notamment par un taux de faux rejets FRR et un taux de fausses acceptations FAR qui ne sont pas les mêmes en fonction des populations considérées.
On connaît la méthode qui consiste pour un score de similarité donné à déterminer la valeur de décalage de score qui permettrait d’aligner les taux de fausses acceptations FAR entre un groupe cible et un autre, cette valeur de décalage par groupe étant ensuite appliquée à tous les scores du groupe, cependant cette solution d’alignement par translation est globale et ne permet notamment pas d’aligner les histogrammes d’utilisateurs légitimes.
On connaît également la méthode qui consiste à rendre plus équitable l’apprentissage, cependant cette solution est complexe et requiert de compléter de manière idoine la base de données d’apprentissage tout en ne permettant de ne corriger que la partie des biais qui provient du déséquilibre de la base d’apprentissage mais pas la partie des biais liées à des difficultés spécifiques (telles que, pour les femmes, le maquillage ou l’occlusion résultant des cheveux par exemple).
Un des buts de l'invention est de remédier à au moins une partie des inconvénients précités en fournissant un procédé de reconnaissance biométrique plus équitable.
A cet effet, on prévoit, selon l'invention, un procédé de reconnaissance biométrique comprenant des étapes de :
- acquisition de données biométriques d’apprentissage;
- classification de chacune desdites données biométriques d’apprentissage parmi au moins deux groupes de manière à déterminer le groupe auquel appartient ladite donnée biométrique d’apprentissage, lesdits groupes étant notamment exclusifs les uns des autres ;
- élaboration d’un modèle de correspondance sur la base desdites données biométriques d’apprentissage acquises ; ledit procédé de reconnaissance étant caractérisé en ce qu’il comprend également des étapes de:
- génération d’au moins une fonction de densité de probabilité de transition d’au moins un des groupes, notamment pour chaque groupe, l’au moins une fonction de densité de probabilité de transition étant générée en fonction des données biométriques d’apprentissage dudit groupe ;
- acquisition d’une donnée biométrique de référence;
- acquisition d’une donnée biométrique candidate à la reconnaissance biométrique;
- classification de ladite donnée biométrique candidate parmi lesdits groupes de manière à déterminer le groupe auquel appartient ladite donnée biométrique candidate;
- calcul d’un score de similarité pour ladite donnée biométrique candidate par rapport à ladite donnée biométrique de référence avec ledit modèle de correspondance;
- détermination de la fonction de densité de probabilité de transition propre audit groupe de ladite donnée biométrique candidate en fonction du score de similarité calculé pour ladite donnée biométrique candidate ;
- détermination d’un score de reconnaissance de ladite donnée biométrique candidate, ledit score de reconnaissance résultant du tirage aléatoire avec ladite fonction de densité de probabilité de transition déterminée pour ladite donnée biométrique candidate;
- décision validant ou refusant la reconnaissance en fonction du score de reconnaissance de ladite donnée biométrique candidate par comparaison dudit score de reconnaissance à un seuil de décision, ledit seuil de décision étant notamment indépendant du groupe auquel appartient ladite donnée biométrique candidate.
Avantageusement, le procédé de reconnaissance biométrique est ainsi rendu plus équitable sans nécessiter de compléter la base des données biométriques d’apprentissage, c’est-à-dire sans augmenter le temps de génération du modèle de correspondance, puisqu’on corrige ici a posteriori les résultats dudit modèle. En effet, le tirage aléatoire se traduit par un ajout de bruit qui permet de dégrader les performances des groupes les meilleurs de manière à réduire les biais en mettant les différents groupes au « niveau » du moins performant, ce qui améliore ainsi l’équité entre les différents groupes. L’ajout de bruit est maîtrisé car le tirage aléatoire est contrôlé par ladite fonction de densité de probabilité. L’utilisation du modèle de correspondance pour le calcul du score de similarité de la donnée biométrique candidate n’est pas complexifiée et s’exécute classiquement sur une base de données biométriques de référence, par exemple des individus autorisés d’accès. En outre, la génération de fonction de densité de probabilité de transition est réalisée pour au moins les groupes différents du groupe cible mais préférentiellement pour chacun des groupes de manière à ne pas créer de diversité à cette étape entre le groupe cible et les autres, l’absence de diversité à ce stade permet ensuite de déterminer de manière unifiée, indistinctement pour le groupe cible et un autre, le score de reconnaissance. De plus, l’au moins une fonction de densité de probabilité de transition correspond notamment à un champ de fonctions de densité de probabilités, ce qui permet ensuite un traitement discrétisé, notamment matriciel. De par ses étapes, on comprend que le procédé de reconnaissance biométrique selon l’invention est mis en œuvre par ordinateur, notamment au moyen d’au moins une unité informatique.
Avantageusement, la classification de ladite donnée biométrique candidate utilise des informations extérieures à ladite donnée biométrique en tant que telle, telles que des informations extraites d’un document d’identité de l’individu candidat. En effet, l’individu candidat, c’est-à-dire l’individu dont la donnée biométrique candidate a été acquise, présente classiquement un document d’identité lors de l’enrôlement ou d’un préenrôlement, dont la prise en compte d’informations permet la classification parmi des groupes, par exemple si les groupes sont liés au genre.
Avantageusement, l’élaboration du modèle de correspondance est réalisée par entrainement sur la base desdites données biométriques d’apprentissage, le modèle de correspondance comportant notamment un réseau de neurones et l’entraînement étant notamment effectué par apprentissage profond sur la base desdites données biométriques d’apprentissage, ce qui permet d’obtenir rapidement un modèle de correspondance robuste, rapide d’exécution une fois codé et nécessitant peu d’espace mémoire de stockage. Avantageusement, le procédé de reconnaissance biométrique selon l’invention comprend des étapes de: - calcul, pour chaque groupe, d’une distribution des scores de similarité d’imposteurs sur la base des données biométriques d’apprentissage, appelée histogramme initial des imposteurs du groupe;
- calcul, pour chaque groupe, d’une distribution des scores de similarité d’utilisateurs légitimes sur la base des données biométriques d’apprentissage, appelée histogramme initial des utilisateurs légitimes du groupe ; ce qui permet de définir des performances équitables entre les groupes. Avantageusement, pour chaque groupe l’au moins une fonction de densité de probabilité de transition générée du groupe est décrite sous la forme d’une matrice de transition, notamment carrée, cette discrétisation de la fonction de densité de probabilité par intervalles permet une utilisation matricielle simple et nécessite peu de taille mémoire, et la préférence pour la matrice carrée incarne l’optimisation de cette simplification.
De manière avantageuse, les scores de similarité et les scores de reconnaissance appartiennent chacun à une plage continue de valeurs s’étirant entre une valeur minimale et une valeur maximale, chaque plage continue de valeurs étant découpée en un nombre d’intervalles de scores, chaque matrice de transition comportant un nombre de lignes et un nombre de colonnes, le nombre de lignes correspondant audit nombre d’intervalles de scores de reconnaissance et le nombre de colonnes correspondant au nombre d’intervalles de similarité, ce qui permet une lecture de la matrice avec une donnée d’entrée sous la forme d’un score de similarité définissant une colonne et une donnée de sortie sous forme d’un score de reconnaissance, sans nécessiter de contraintes sur le découpage par intervalles de valeurs, qui n’ont notamment pas besoin d’être de même longueur et dans le cas où les nombres d’intervalles de scores de similarité et de reconnaissance sont les mêmes alors la matrice est carrée, de dimension n2, et ce quand bien même les plages et leurs découpages pourraient être distincts, même si cela n’est pas préférentiel.
Avantageusement, lors de l’étape de génération d’au moins une fonction de densité de probabilité de transition du groupe sont générées autant de fonctions de densité de probabilité de transition que le nombre de colonnes de la matrice de transition dudit groupe, ce qui permet d’associer une fonction de densité de probabilité à chaque colonne de la matrice de transition, c’est-à-dire pour chaque intervalle de scores de similarité et de discrétiser la fonction de densité de probabilité par intervalles.
De manière avantageuse, la matrice de transition dudit groupe est carrée et l’étape de génération comprend une sous-étape d’initialisation de la matrice de transition dudit groupe par la matrice identité, ce qui permet notamment de ne pas créer de diversité, en fonction du type de groupe en fonction qu’il s’agisse du groupe cible ou non, lors de l’étape de détermination du score de reconnaissance du procédé puisque pour le groupe cible la matrice de transition étant l’unité, les scores de similarité du groupe cible ne seront pas modifiés lors du tirage aléatoire parmi la matrice identité, le score de reconnaissance valant le score de similarité. De plus, cette initialisation évite également tout risque de non convergence lors de la phase de génération. De manière avantageuse, le procédé de reconnaissance biométrique selon l’invention comprend une étape de détermination d’un groupe cible, notamment parmi lesdits au moins deux groupes ou par construction d’un groupe cible fictif, ce qui permet de désigner une cible de manière à faire converger certains ou tous les autres groupes vers ce groupe cible.
Avantageusement, ledit groupe cible correspond à celui pour lequel le cumul de l’histo- gramme initial des imposteurs est le plus élevé, ce qui permettra de dégrader les performances des autres groupes pour atteindre celle du groupe cible.
Avantageusement, l’étape de génération comprend des sous-étapes de :
- définition d’une fonction de coût pour ledit groupe, notamment ladite fonction coût dudit groupe dépend de :
- variances par colonne et ;
- d’une divergence Jensen-Shannon entre l’histogramme initial des imposteurs dudit groupe et l’histogramme initial des imposteurs du groupe cible et ;
- d’une divergence Jensen-Shannon entre l’histogramme initial des utilisateurs légitimes dudit groupe et l’histogramme initial des utilisateurs légitimes du groupe cible ;
- calcul du minimum de ladite fonction coût dudit groupe par mise en œuvre d'une méthode d’optimisation par apprentissage, notamment une méthode de descente de gradient ou une méthode de recuit simulé ou une méthode de Levenberg-Marquardt, de manière à déterminer l’au moins une fonction de densité de probabilité de transition dudit groupe. Ce mode de génération de fonction de densité de probabilité de transition d’un groupe est compatible aussi bien avec la représentation matricielle sous forme de matrice de transition qu’avec n’importe quelle fonction paramétrique continue productrice de fonctions de densité de probabilité. Utiliser l’approche matricielle, c’est-à-dire, discrétisée sur des intervalles, permet de ne pas limiter la famille de fonctions que l’on peut générer. De plus, ces caractéristiques permettent de déterminer rapidement les fonctions de densité de probabilité des groupes.
Alternativement, l’étape de génération de la matrice de transition par groupe est réalisée analytiquement, et comprend des sous-étapes de :
- alignement de l’histogramme initial des imposteurs dudit groupe sur l’histogramme initial des imposteurs dudit groupe cible résultant en un histogramme source aligné des imposteurs dudit groupe et un histogramme source modifié des utilisateurs légitimes dudit groupe;
- calcul itératif d’une matrice des mouvements possibles entre deux index, formant un couple d’index, de la matrice de transition, chaque index désignant des intervalles de scores de similarité et de reconnaissance de la matrice de transition,, pour tous les couples d’index, ladite matrice des mouvements possibles déterminant à partir de l’histogramme source modifié des utilisateurs légitimes du groupe la quantité maximale d’utilisateurs légitimes déplaçable entre lesdits intervalles correspondant audits index du couple sans que la quantité d’imposteur change dans 1’ histogramme source aligné des imposteurs du groupe, c’est-à-dire en compensant la quantité d’imposteurs déplacée, de manière à déterminer la matrice de transition dudit groupe. Ces caractéristiques permettent de mettre en œuvre l’étape de génération d’une autre façon et permettent une minimisation locale et non uniforme globale, ce qui est intéressant dans le cas des intervalles dans lesquels les histogrammes cumulés sont très faibles.
De manière avantageuse, l’étape de détermination d’un score de reconnaissance de ladite donnée biométrique candidate est réalisée par tirage aléatoire d’un nombre avec la fonction de densité de probabilité contenue dans la colonne correspondant à l’intervalle de scores comprenant le score de similarité de ladite donnée biométrique candidate, le nombre tiré parmi ladite colonne appartenant à un intervalle de score de reconnaissance correspondant à une ligne de ladite colonne et le score de reconnaissance de ladite donnée biométrique candidate étant défini dans l’intervalle de scores de reconnaissance correspondant à ladite ligne. Dans les deux modes décrits pour l’étape de génération, en représentation matricielle, une telle étape de détermination du score de reconnaissance permet une mise en œuvre simple, qui ne nécessite essentiellement que la connaissance, c’est-à-dire la mémorisation locale, des matrices de transition desdits groupes, d’un classificateur et du modèle de correspondance.
De manière avantageuse, dans cet intervalle de scores de reconnaissance correspondant à ladite ligne on reprendra la même position relative que dans l’intervalle initial de scores comprenant le score de similarité de ladite donnée biométrique candidate, afin de déterminer précisément le score ainsi construit.
Avantageusement, les groupes définissent des catégories de populations en fonction de facteurs démographiques et/ou sociaux, ce qui permet de rendre équitables les procédés de reconnaissance biométrique quel que soit le genre, ou encore le métier.
De manière avantageuse, les données biométriques d’apprentissage et/ou de référence et/ou candidates sont extraites d’images faciales ou d’images d’empreintes ou d’images de veines ou d’images d’iris ou d’enregistrements vocaux, ce qui permet d’appliquer le procédé aux différents natures de données biométriques.
En outre, l’invention a aussi pour objet un dispositif de reconnaissance biométrique apte à mettre en œuvre le procédé de reconnaissance biométrique selon l’invention, présentant les mêmes avantages que l’invention.
D'autres caractéristiques et avantages de l'invention ressortiront à la lecture de la description qui suit de modes de mise en œuvre particuliers non limitatifs de l'invention. La figure 1 est une vue schématique d’une partie du procédé conforme à l'invention; La figure 2 montre schématiquement une autre partie du procédé conforme à l'invention;
La figure 3 illustre des distributions de scores de similarité d’ imposteurs et d’ utilisateurs légitimes d’un groupe sur la base des données biométriques d’apprentissage dudit groupe selon l'invention;
La figure 4 montre les étapes de détermination de la fonction de densité de probabilité de transition et de détermination d’un score de reconnaissance ladite donnée biométrique candidate selon un mode de réalisation du procédé conforme à l'invention ; La figure 5 illustre l’étape d’alignement selon un autre mode de réalisation du procédé conforme à l'invention ; et
La figure 6 illustre l’étape de calcul itératif d’une matrice des mouvements possibles entre deux index de la matrice de transition.
[Fig.l] La figure 1 expose une vue schématique partielle du procédé de reconnaissance biométrique sous forme d’organigramme. La partie exposée du procédé en figure 1 a pour but d’illustrer plus particulièrement les étapes qui sont effectuées au moment de la vérification d’accès par reconnaissance biométrique, par exemple pour entrer dans un lieu réglementé.
Pour clarifier la description, et de façon non limitative, le cas illustré ici concerne un procédé de reconnaissance faciale. Les données biométriques de référence DBR et candidate DBc sont extraites d’images faciales.
Une donnée biométrique candidate DBc à la reconnaissance biométrique est acquise, il s’agit ici d’une photographie du visage de l’individu candidat, c’est-à-dire d’une image faciale, cette donnée biométrique candidate DBc peut être notamment acquise par un moyen optique tel qu’une caméra ou un appareil photographique. Préférentiellement l’acquisition de cette donnée est effectuée sur place mais elle peut aussi être réalisée préalablement au moyen d’une application sur un téléphone portable par exemple. La donnée biométrique candidate DBc peut ensuite être codée, par exemple sous forme de vecteur.
La donnée biométrique candidate DBc, potentiellement codée, est classifiée lors d’une étape de classification E CLA parmi plusieurs groupes, ici par exemple Gi et G2, de manière à déterminer le groupe auquel appartient la donnée biométrique candidate DBc, il s’agit ici du premier groupe Gi. Les groupes sont préférentiellement exclusifs les uns des autres, mais ils peuvent aussi ne pas l’être et dans ce cas d’usage pour une donnée candidate donnée est estimée la probabilité d’appartenir à chaque groupe, un score de reconnaissance est déterminé pour chaque groupe et pondéré avec lesdites probabilités d’appartenir à chaque groupe, de manière à produite un score de reconnaissance consolidé.
Les groupes sont notamment déterminés en fonction de biais qui ont été observés lors de la validation du modèle de correspondance et ils définissent préférentiellement des catégories de populations en fonction de facteurs démographiques et/ou sociaux. Il peut par exemple s’agir du genre s’il a été détecté un biais, lors de tests de validation par exemple, c’est-à-dire un écart entre les distributions des scores de similarité, ou entre les taux de faux rejets FRR et/ou taux de fausses acceptations FAR, des femmes et des hommes. Par exemple, ici, le groupe Gi correspond au groupe de genre féminin et G2 au groupe de genre masculin.
Le moyen de réaliser cette étape de classification, à savoir le classificateur, peut-être de différentes formes. Par exemple, le classificateur exécute un procédé de traitement de la donnée biométrique candidate sous forme d’image faciale, par exemple au moyen de réseau de neurones, et/ou le classificateur exécute un procédé d’analyse de document, si un document d’identité est également fourni par ailleurs et indique, ou permet de déduire, l’appartenance à un desdits groupes Gi ,G2. Sur la figure 1 la donnée biométrique candidate DBc a ainsi été classifiée parmi le groupe Gi de genre féminin.
Pour des raisons de clarté est illustrée ici le cas de la comparaison de deux données biométriques, l’une de référence DBR d’un individu donné et l’autre d ‘un individu candidat DBc, appelée communément vérification «1 : 1» (1 contre 1), mais l’itération des mêmes étapes de comparaison avec plusieurs données biométriques d’individus autorisés DBR, communément appelée identification «1 : n» (1 contre n), est classique pour l’homme du métier.
Parallèlement à l’étape de classification, ou de manière consécutive, la donnée biométrique candidate DBc acquise est transmise à un modèle de correspondance MCOR préalablement élaboré sur la base de données biométriques d’apprentissage. En opération, le modèle de correspondance MCOR s’exécute classiquement en comparant la donnée biométrique candidate DBc à une ou des données biométriques de référence DBR, par exemple des individus autorisés d’accès « 1 : n » ou d’une personne en particulier en «1 : 1 ». Cette base de données biométriques de référence DBR utilisée en opération est classiquement la propriété de l’exploitant du dispositif de reconnaissance en « 1 :n » ou de la personne en particulier en « 1 : 1 ». La base de données biométriques d’apprentissage utilisée lors de l’élaboration du modèle de correspondance MCOR est préférentiellement différente de la base de données biométriques de référence DBR qui est mémorisée et sert en opération lors de la reconnaissance en 1 : n, d’autant que leur utilisation n’a pas lieu au même moment et ne répond pas au même besoin. Certaines données biométriques peuvent néanmoins exister dans les deux bases. En effet, plus la base de données d’apprentissage servant à l’élaboration du modèle de correspondance MCOR est grande ( y compris intégrant des images faciales de synthèse), meilleure sera la qualité du modèle de correspondance, alors que classiquement la base de données de référence d’individus autorisés qui sert en opération lors de la reconnaissance ne comporte que les données biométriques enrôlées des individus autorisés d’accès et évolue dans le temps en fonction des nouveaux individus enrôlés autorisés d’accès.
Ainsi, dans le cas de l’identification « 1 : n » , l’étape de calcul du score de similarité SSc par le modèle de correspondance MCOR est répétée sur les différentes données biométriques de référence DBR de la base de référence constitués par les données biométriques des individus autorisés d’accès, obtenues par exemple par enrôlement. Préférentiellement toutes les données de références sont comparées à la donnée candidate DBc étant donné que les temps de calcul sont très courts et ne nécessitent donc pas de présélection particulière. Puis, préférentiellement, la suite du procédé est appliquée à chaque score de similarité obtenu jusqu’à déterminer le score de reconnaissance et c’est le meilleur score de reconnaissance obtenu parmi les données biométriques comparées qui est conservé, et qui est comparé au seuil de décision.
La transmission de donnée biométrique de référence DBR au modèle de correspondance MCOR est représentée sous forme de traits pointillés car la donnée biométrique de référence DBR est acquise préalablement en amont.
Un score de similarité SSc est alors calculé pour ladite donnée biométrique candidate DBc au moyen du modèle de correspondance MCOR préalablement élaboré. De tels modèles de correspondance MCOR sont connus.
En fonction du groupe Gi dans lequel a été classifié ladite donnée biométrique candidate DBc et du score de similarité SSc précédemment calculé est déterminée, lors d’une étape de détermination E DPDF, la fonction de densité de probabilité de transition PDFTi c propre audit groupe Gi pour ladite donnée biométrique candidate DBc. Tel que présenté ici, le groupe qui sert à la détermination E DPDF de la fonction de densité de probabilité de transition est celui de la donnée candidate. Mais il peut exister en parallèle une étape de classification de la donnée biométrique de référence et si le groupe issu de l’étape de classification E CLA de la donnée candidate diffère du groupe issu de l’étape de classification de la donnée biométrique de référence DBR, ce qui est commun en « 1 : n » puisque la donnée candidate est alors testée contre tout ou partie de la base biométrique de référence, plusieurs variantes sont applicables, par exemple, n’utiliser que le groupe d’un des deux (de la donnée de référence ou de la donnée candidate), ou choisir aléatoirement un des deux groupes (de la donnée de référence ou de la donnée candidate), ou réaliser deux fois l’étape de détermination E DPDF de la fonction de densité de probabilité de transition pour chacun des deux groupes (de la donnée de référence ou de la donnée candidate) et faire la moyenne des scores de reconnaissance obtenus lors de l’étape de détermination E DSR d’un score de reconnaissance de manière à obtenir un score de reconnaissance consolidé.
L’étape suivante consiste en la détermination E DSR d’un score de reconnaissance SRc de ladite donnée biométrique candidate, ledit score de reconnaissance SRc résultant du tirage aléatoire avec ladite fonction de densité de probabilité de transition PDFTi c déterminée pour ladite donnée biométrique candidate DBc.
Enfin, est représentée l’étape de décision E DEC validant ou refusant la reconnaissance, en fonction du score de reconnaissance SRc de ladite donnée biométrique candidate par comparaison dudit score de reconnaissance SRc à un seuil de décision T indépendant du groupe Gc auquel appartient ladite donnée biométrique candidate DBc , ainsi on a E DEC SR^ = avec T le seuil de décision à partir du-
Figure imgf000012_0001
quel les deux données biométriques comparées, sont considérées comme identiques. Le seuil de décision T est préférentiellement unique, indépendant du groupe auquel appartient ladite donnée biométrique candidate, mais des seuils de décision par groupe pourraient aussi être envisagés.
[Fig.2] La figure 2 montre schématiquement une autre partie du procédé conforme à l'invention, et plus particulièrement les étapes menant à la génération d’au moins une fonction de densité de probabilité de transition, ces étapes sont donc réalisées en amont des étapes préalablement illustrées en figure 1. Une étape d’acquisition de données biométriques d’apprentissage DBAi , DBAj , DBAk est réalisée, il s’agit ici des données biométriques d’apprentissage qui serviront notamment à l’élaboration du modèle de correspondance MCOR.
Pour chaque donnée biométrique d’apprentissage DBAi , DBAj , DBAk il est procédé à l’étape de classification E CLA de manière à déterminer, parmi au moins les deux groupes Gi, G2, le groupe Gi correspondant ici au groupe de genre féminin et G2 au groupe de genre masculin, le groupe Gi, G2 auquel appartient chaque donnée biométrique d’apprentissage DBAi , DBAj , DBAk. Il s’agit des mêmes groupes qu’évoqués dans la description de la figure 1, néanmoins le moyen de réaliser cette étape de classification, à savoir le classificateur n’est pas nécessairement le même que précédemment. Préférentiellement, le classificateur utilisé ici exécute un procédé de traitement des images faciales, par exemple au moyen de réseau de neurones. En outre, comme lors de la description du classificateur utilisé pour la données candidate il est possible de généraliser à des groupes non exclusifs les uns des autres, même si cela est plus complexe lors de l’apprentissage car cela exige un apprentissage avec des pondérations par groupe, ce qui allonge le temps d’entraînement.
Le modèle de correspondance MCOR est le module essentiel codé dans le programme exécutable de correspondance. L’étape d’élaboration du modèle de correspondance MCOR est réalisée par entrainement sur la base desdites données biométriques d’apprentissage DBAi , DBAj , DBAk , le modèle de correspondance comportant notamment un réseau de neurones et l’entraînement étant notamment effectué par apprentissage profond sur la base desdites données biométriques d’apprentissage DBAi , DBAj , DBAk.
Postérieurement à l’étape d’élaboration du modèle de correspondance MCOR, a lieu l’étape de génération E GEN d’au moins une fonction de densité de probabilité de transition PDFTi, PDFT2 d’au moins un des groupes Gi, G2, mais préférentiellement pour chaque groupe de façon à limiter la diversité des étapes du processus en fonction de la nature cible ou non du groupe, tel que représenté ici, de manière à réduire la diversité des branches du procédé. Les fonctions de densité de probabilité de transition PDFTi, PDFT2 sont alors générées en fonction de l’intégralité des données biométriques d’apprentissage DBAi , DBAj , DBAk de chaque groupe Gi, G2. Ces fonctions de densité de probabilité de transition PDFTi, PDFT2 comportent chacune plusieurs fonctions de densité de probabilité par intervalle de scores et constituent des champs de fonctions de densité de probabilité.
[Fig. 3] La figure 3 illustre pour le groupe 1 des distributions des scores de similarité des imposteurs I_Gi et des utilisateurs légitimes U_Gi sur la base des données biométriques d’apprentissage DBAi , DBAj , DBAk dudit groupe Gi selon l'invention. L’abscisse représente les scores SS de similarité et l’ordonnée représente la densité de probabilité R, dont l’intégrale vaut 1. En ligne pointillée est positionné un exemple de score seuil qui détermine les deux taux d’erreurs intermédiaires FAR et FRR. Il s’agit ici de taux d’erreur intermédiaire, si on devait les nommer, car sont représentés ici les distributions en fonction des scores de similarité et non en fonction des scores de reconnaissance SR. A ce stade intermédiaire, si une décision devait être prise sur la base de ce seuil, à droite de ce seuil seraient les cas acceptés et à gauche les cas rejetés, d’où les termes classiquement utilisés d’utilisateurs légitimes et d’imposteurs.
Préalablement à l’étape de génération E GEN ou préférentiellement, dans l’étape E GEN, il est procédé aux étapes de :
- calcul, pour chaque groupe Gi, G2, d’une distribution des scores de similarité des imposteurs sur la base des données biométriques d’apprentissage DBAi , DBAj , DBAk, appelée histogramme I_Gi, I G2 initial des imposteurs du groupe;
- calcul, pour chaque groupe Gi, G2, d’une distribution des scores de similarité des utilisateurs légitimes sur la base des données biométriques d’apprentissage DBAi , DBAj , DBAk , appelée histogramme U_Gi, U G2 initial des utilisateurs légitimes du groupe. En effet, les variables aléatoires se définissent classiquement par une distribution de probabilité ainsi que par des paramètres de distribution, tels que la moyenne et la variance. La densité de probabilité fx(x) d’une variable aléatoire continue caractérise la probabilité qu’un évènement de X se situe dans un intervalle infiniment petit [x , x+dx] telle que :
[Math. 1]
AG) = Pfx < X < x + dx]
La fonction de répartition FX(x) décrit la probabilité que la variable aléatoire continue prenne une valeur inférieure ou égale à x. Elle définit ainsi l’aire sous la densité de probabilité à gauche de x telle que : [Math. 2]
Fx(x) = P[X < x] = J (z)|dz fx(x) étant toujours égale à 1 telle que :
Figure imgf000014_0001
Ainsi, préférentiellement, l’étape de génération E GEN génère une matrice de transition par groupe Gi, G2, et pour chaque groupe Gi, G2 le champ de fonctions de densité de probabilité de transition PDFTi, PDFT2 est décrit sous la forme d’une matrice carrée de transition.
En effet, en référence à la figure 3 les scores de similarité SS appartiennent à une plage continue de valeurs s’étirant entre une valeur minimale, par exemple 0, et une valeur maximale, par exemple 20000, ladite plage continue de valeurs étant découpée par morceaux en un nombre d’intervalles de scores, ces intervalles couvrent la totalité de la plage et s’enchaînent de manière continue, sans recouvrement. Le choix du nombre d’intervalles résulte d’un compromis entre la précision et le temps de calcul. Ces intervalles ne sont pas nécessairement de la même longueur. Chaque matrice carrée de transition est de dimension n2, n correspondant audit nombre d’intervalles de scores de similarité ainsi qu’au nombre d’intervalles de scores de reconnaissance puisqu’elle se lira avec un score de similarité en entrée et sortira un score de reconnaissance. Préférentiellement les matrices de transition des différents groupes sont de même dimensions de manière à limiter la diversité de traitement.
Ainsi, lors de l’étape de génération E GEN d’au moins une fonction PDFTi, PDFT2 de densité de probabilité de transition du groupe Gi, G2 en fonction des données biométriques d’apprentissage DBAi , DBAj , DBAk dudit groupe Gi, G2 sont générées autant de fonctions de densité de probabilité de transition que la dimension n de la matrice carrée de transition dudit groupe Gi, G2.
Préférentiellement, l’étape de génération de la matrice de transition PDFTi, PDFT2 par groupe comporte une sous-étape d’initialisation de ladite matrice de transition PDFTi, PDFT2 dudit groupe Gi, G2 par la matrice identité, cette étape est par nature préalable à toute autre étape affectant la matrice de transition PDFTi, PDFT2 de chaque groupe. Préférentiellement, l’étape de génération E GEN de la matrice de transition PDFTi, PDFT2 par groupe comporte une sous-étape de détermination d’un groupe cible Gi, G2 sachant que cette sous étape pourrait également être préalable à l’étape de génération E GEN.
On choisit ici comme groupe cible celui pour lequel Faire sous la densité de probabilité caractéristique de la distribution des scores de similarité des imposteurs, c’est-à-dire le cumul de l’histogramme initial des imposteurs I_GI, I_G2, est le plus élevé, c’est-à-dire le groupe qui présente les plus mauvaises performances, supposons ici que ce groupe cible soit le deuxième groupe G2 .
Le groupe cible est ici choisi parmi lesdits au moins deux groupes Gi, G2, mais il peut aussi être un groupe cible fictif construit sur la base de ces groupes, en étant l’un ou l’autre en fonction du score de manière à tracer un groupe fictif, qui serait notamment représentatif des pires performances (cumul des imposteurs le plus élevé), ce qui permet de disposer d’une cible vers laquelle il est toujours possible de corriger, et donc de converger puisqu’elle est toujours la plus mauvaise. Le tracé d’un tel groupe fictif serait donc par exemple,
- pour les FAR (histogrammes calculés en cumulant l’histogramme des scores imposteurs de la plus grande à la plus petite valeur) une ligne composée de points des FAR I_Gi ou des FAR I G2 en fonction de celui est le plus élevé pour chaque Score de Similarité (SS), ce groupe fictif serait en quelque sorte représenté par l’enveloppe supérieure des FAR de la figure 5, ce qui permet de créer un groupe fictif qui a toujours les pires performances,
- pour les FRR de même à partir des scores des utilisateurs légitimes (histogrammes calculés en cumulant l’histogramme des scores légitimes de la plus petite à la plus grande valeur) et donc vers lesquels il sera toujours possible de converger, ce groupe fictif (défini par ses FAR et ses FRR) étant alors défini comme groupe cible . Une autre variante pourrait consister aussi en la détermination d’un groupe cible, fictif ou non, qui ne serait pas le plus mauvais (cumulé, ou partout) mais un des plus mauvais de manière à trouver un compromis entre la performance et le caractère équitable du procédé de reconnaissance. Dans un mode de réalisation particulier, l’étape de génération E GEN est réalisée par apprentissage et comprend, après notamment détermination du groupe cible parmi les- dits au moins deux groupes Gi, G2 et initialisation de la matrice de transition PDFTi, PDFT2 de chaque groupe, des sous-étapes de :
- définition d’une fonction de coût pour ledit groupe, notamment ladite fonction coût dudit groupe dépend de :
- des variances cr£ par colonne et ;
- d’une divergence Jensen-Shannon JSI,GI,GT entre l’histogramme initial des imposteurs dudit groupe Gi et l’histogramme initial des imposteurs du groupe cible GT (=G2), sachant que la divergence Jensen-Shannon entre l’histogramme initial des imposteurs du groupe cible et l’histogramme initial des imposteurs du groupe cible est par définition nulle (ici JSI,G2,GT=0 car GT=G2) , ce qui permet de ne pas nécessiter de diversité de traitement entre le groupe cible et les autres ; et ;
- d’une divergence Jensen-Shannon JSU,GI,GT entre l’histogramme initial des utilisateurs légitimes dudit groupe Gi et l’histogramme initial des utilisateurs légitimes du groupe cible G (=G2); Le choix de préférence de la divergence Jensen-Shannon par rapport à la K-L divergence provient de son caractère symétrique ; la fonction coût s’écrit donc ici :
[Math. 4]
Figure imgf000016_0001
- calcul du minimum de ladite fonction coût dudit groupe par mise en œuvre d'une méthode d’optimisation par apprentissage, notamment une méthode de descente de gradient. Il sera donc procédé, par groupe, à la minimisation, de manière connue, de n2 paramètres de manière à obtenir la matrice de transition PDFTi, PDFT2 optimisée comportant n fonctions de densité de probabilités définies chacune par n paramètres, puisqu’elles sont définies sur n intervalles, ce qui permet de définir les n2 valeurs de la matrice de transition PDFTi, PDFT2. D’autres méthodes que la descente de gradient peuvent être utilisées, telles qu’une méthode de recuit simulé ou une méthode de Leven- b erg-Mar quardt, de manière à déterminer la fonction de densité de probabilité de transition dudit groupe. D’autres méthodes d’optimisation telle que CMAES (de l’anglais
« Covariance Matrix Adaptation Evolution Strategy ») pourraient également être appliquées.
Des contraintes inhérentes à la nature des matrices de transition PDFTi, PDFT2 s’appliquent à l’optimisation par apprentissage, ainsi les valeurs dans les matrices de transition sont positives et la somme des valeurs chaque colonne de chaque matrice de transition PDFTi, PDFT2 vaut 1. Après optimisation, les matrices de transition PDFTi, PDFT2 de chaque groupe Gi, G2 sont mémorisées dans des espaces mémoires du calculateur du système de reconnaissance qui exécutera le programme de reconnaissance lors de la vérification de l’individu candidat. Est également mémorisée, notamment momentanément de manière à couvrir le temps de l’opération de contrôle en application « 1 : 1 », dans des espaces mémoires de ce calculateur du système de reconnaissance la donnée biométrique de référence DBR. Ce programme de reconnaissance comporte dans des sous-modules:
- le modèle de correspondance MCOR codé sous-forme de programme exécutable de correspondance, ainsi que
- le classificateur de la donnée biométrique candidate codé sous forme de programme de classification exécutable,
- un correcteur codé sous forme de programme exécutable de correction détaillé ci- après,
- un modèle de décision mettant en œuvre l’étape de décision E DEC préalablement décrite et codé sous forme de programme exécutable de correction et peut contenir un modèle d’acquisition de données biométrique si le système de reconnaissance comporte un unique calculateur, mais préférentiellement, ce modèle est déporté dans le calculateur du sous-système d’acquisition de données biométriques candidates.
[Fig. 4] Comme illustré en figure 4 , le correcteur exécute de manière combinée les étapes de :
- détermination E DPDF de la fonction de densité de probabilité de transition PDFTi propre audit groupe Gi de ladite donnée biométrique candidate DBc en fonction du score de similarité SSc calculé pour ladite donnée biométrique candidate DBc : il s’agit ici du choix de densité de probabilité de transition, c’est-à-dire ici du choix de la matrice de densité de probabilité de transition, PDFTi parmi les fonction de densité de probabilité de transition PDFTi et PDFT2 des différents groupes Gi, G2 en fonction Gi du groupe de donnée biométrique candidate DBc , et parmi cette matrice de transition PDFTi dudit groupe de la donnée biométrique candidate du choix de la fonction de densité de probabilité PDFTi, c qui correspond au score de similarité SSc calculé pour ladite donnée biométrique candidate DBc, c’est-à-dire à la fonction de densité de probabilité de transition PDFTi, c exprimée dans la colonne correspondant à l’intervalle de score de similarité SS auquel appartient le score de similarité SSc calculé pour ladite donnée biométrique candidate DBc ;
- détermination E DSR d’un score de reconnaissance SRc de ladite donnée biométrique candidate, ledit score de reconnaissance SRc se déduisant du tirage aléatoire avec ladite fonction de densité de probabilité de transition PDFTi, c déterminée pour ladite donnée biométrique candidate.
Ainsi, en référence à l’exemple de la figure 4, il apparaît clairement que ces deux étapes agissent en synergie en vue de déterminer le score de reconnaissance SRc . Avec des intervalles de scores de similarité SS en abscisse et de reconnaissance SR en ordonnées de 2000, on constate qu’avec un score de similarité SSc de la donnée biométrique candidate DBc de 9500 , ce score de similarité SSc appartient à la cinquième colonne de la matrice de densité de probabilité de transition PDFTi correspondant au premier groupe Gi auquel appartient la donnée biométrique candidate DBc. En outre, le score de similarité SSc de la donnée biométrique candidate DBc est situé à une distance a du bord inférieur de ce cinquième intervalle, valant ici 1500. L’étape de détermination du score de reconnaissance SRc est réalisée par tirage aléatoire d’un nombre selon la fonction de densité de probabilité contenue dans la colonne correspondant à l’intervalle de scores comprenant le score de similarité SSc de ladite donnée biométrique candidate, le nombre tiré parmi ladite colonne appartenant à un intervalle de score de reconnaissance correspondant à une ligne de ladite colonne et le score de reconnaissance SRc de ladite donnée biométrique candidate étant défini dans l’intervalle de score correspondant à ladite ligne. En reprenant l’exemple de la figure 4, cela se traduit par le tirage dans cette cinquième colonne, représentant PDFTi, c , avec ladite fonction de densité de probabilité de transition PDFTi, c qui donne une valeur tirée, que l’on peut assimiler à un score intermédiaire, et que nous prendrons ici égale à 13000 ; cette valeur tirée appartient donc à la ligne 4. Le score de reconnaissance SRc appartient donc à l’intervalle de scores de reconnaissance SR correspondant à la quatrième ligne de la matrice PDFTi : 6000-8000 et plus précisément il SRc est obtenu en appliquant le même décalage de distance a par rapport au bord inférieur de ce quatrième intervalle, ce qui donne un score de reconnaissance SRc de 7500. Ce choix d’appliquer le même décalage en entrée et en sortie n’est pas nécessaire mais permet de garantir une continuité.
Le correcteur prend donc en entrée de la matrice de transition PDFTi le score de similarité SSc de la donnée biométrique candidate DBc et donne en sortie le score de reconnaissance SRc de la donnée biométrique candidate DBc .
[Fig. 5] Selon un autre mode de réalisation, l’étape de génération de la matrice de transition par groupe PDFTi et PDFT2 est réalisée analytiquement, illustrée en figures 5 et 6, et comprend des sous-étapes de :
- alignement de l’histogramme initial des imposteurs I_Gi dudit groupe sur l’histo- gramme initial des imposteurs I G2 dudit groupe cible résultant en un histogramme source aligné des imposteurs et un histogramme source modifié des utilisateurs légitimes;
- calcul itératif d’une matrice des mouvement possibles entre deux index ( binôme ligne et colonne ) de la matrice de transition pour tous les couples d’index, ladite matrice des mouvements possibles déterminant à partir de l’histogramme source modifié des utilisateurs légitimes la quantité maximale d’utilisateurs légitimes déplaçable d’un index du couple vers l’autre index du couple sans que la quantité d’imposteur change dans F histogramme source aligné des imposteurs, c’est-à-dire en compensant la quantité d’imposteurs déplacée, de manière à déterminer la matrice de transition dudit groupe.
Des contraintes inhérentes à la nature des matrices de transition PDFTi, PDFT2 s’appliquent à l’étape de génération réalisée analytiquement, ainsi les valeurs dans les matrices de transition sont positives et la somme des valeurs chaque colonne de chaque matrice de transition PDFTi, PDFT2 vaut 1.
Comme illustré en figure 5 l’étape d’alignement part de l’histogramme initial des imposteurs I_Gi du groupe 1 (non cible) en traits pointillés et de l’histogramme initial des imposteurs I G2 du groupe cible G2 en trait plein, les histogrammes sont ici affichés en échelle logarithmique et l’histogramme initial des imposteurs I_Gi du groupe 1 (non cible) est si besoin prolongé (trait plein plus fin) pour couvrir la même gamme de répartition R , les flèches représentent les décalages en écarts de scores de similarité à appliquer pour aligner les deux histogrammes entre eux. Ces mêmes décalages sont également appliqués aux histogrammes des utilisateurs légitimes U_Gi car les histogrammes sont par nature liés entre eux. Le décalage a ainsi pour but d’aligner dynamiquement les taux de fausses acceptations FAR des groupes non cibles sur celui du groupe cible (par exemple : 1% (R)=+2500 (SS)) et d’obtenir un histogramme source aligné des imposteurs et un histogramme source modifié des utilisateurs légitimes. En effet, il résulte de l’alignement appliqué une modification de tous les scores, incluant les scores des utilisateurs légitimes et des imposteurs, et donc une modification de leur histogramme respectif.
La figure 6 illustre l’étape de calcul itératif d’une matrice des mouvements possibles M entre deux index j,k de la matrice de transition PDFTi du groupe 1 (non cible) , formant un couples d’index, chaque index désignant des intervalles de scores de similarité et de reconnaissance de la matrice de transition, chaque index correspond donc à une ligne (score de reconnaissance) et à une colonne (score de similarité). Pour tous les couples d’index j,k , ladite matrice des mouvements possibles M détermine à partir de l’histogramme source modifié des utilisateurs légitimes la quantité maximale d’utilisateurs légitimes déplaçable entre lesdits intervalles correspondant audits index du couple sans que la quantité d’imposteur change dans l’histogramme source aligné des imposteurs, c’est-à-dire en compensant la quantité d’imposteurs déplacée, de manière à déterminer la matrice de transition dudit groupe.
Dans la figure 6 les valeurs de la matrice de transition PDFTi sont exprimées sous la forme de Rjj Rjk Rkj Rkk, et I fait ici référence à une proportion d’imposteurs étant dans l’intervalle respectif k,j de la base d’apprentissage et m à une proportion d’utilisateurs légitimes étant dans l’intervalle respectif k, j de la base d’apprentissage. Il s’agit de calculer itérativement la matrice de transition PDFTi par mouvements unitaires qui laissent l’histogramme source aligné des imposteurs du groupe 1 (non cible) inchangé, dans sa traduction matricielle, tout en visant le taux maximum de faux rejets FRR pour les utilisateurs légitimes. Pour ce faire, la matrice de transition PDFTi du groupe 1 (non cible) est initialisée à la matrice identité, comme dans le mode de réalisation précédent, et une matrice des mouvements M est calculée itérativement par couples d’index y, ô de la matrice de transition PDFTi , cette matrice des mouvements M détermine la portion maximum m’k de la répartition d’utilisateurs légitimes post alignement qui peut être transfé- rée vers une autre case de la matrice de transition PDFTi sans que la portion d’imposteurs change : I'k=Ik et / ;=//, c’est-à-dire en compensant la portion d’imposteurs déplacée . En considérant y le pourcentage d’utilisateurs légitimes déplacés de l’index j vers l’index k de la matrice de transition PDFTi , fixer l’histogramme source aligné des imposteurs du groupe 1 (non cible) signifie
Figure imgf000020_0001
ce qui impose de ramener une portion de ô de l’index k à l’index j. Les mouvements possibles sont calculés en conséquence, puis un processus itératif déplace les portions d’utilisateurs légitimes pour atteindre le taux de faux rejets FRR visé. Les flèches noires en trait plein illustrent le fait que les imposteurs sont calculés à partir des imposteurs et les flèches noires en pointillé illustrent le fait que les utilisateurs légitimes sont calculés à partir des utilisateurs légitimes, mais que dans les deux cas on utilise la même matrice de transition PDFTi de valeurs Rjj Rjk Rkj Rkk. A chacune de ces itérations p, la matrice des mouvements possibles courante Mp étant ainsi calculée, on peut modifier PDFTX j et PDFTX k de la valeur maximale MPj,k , avec p l’itération ;i,j les coordonnées dans la matrice, de manière à rapprocher m’k de ca cible, sans changer l’k . PDF^ ayant été modifié à l’itération p, on recalcule entièrement Mp+i à l’itération suivante.
Préférentiellement on commence par les index correspondant à un coin de la matrice de transition PDFTi, et plus précisément à une extrémité de la diagonale identité de la matrice de transition PDFTi telle qu’initialisée. Une fois la matrice obtenue, l’étape de correction sera appliquée comme précédemment, de même que l’étape de décision E DEC. L’intérêt de cette variante consiste en sa minimisation par localités, contrairement à la minimisation globale opérée par la fonction de coût du mode de réalisation présenté précédemment. En effet, sur certains intervalles, les valeurs de l’histogramme des imposteurs sont très élevées (taux de FAR très faible) or d’après les critères d’optimisation définis une convergence reste recherchée tant qu’elles ne sont pas égales à celles du groupe cible, alors que cela n’est pas utile et allonge inutilement le temps de l’étape de génération E_GEN.
Dans les modes de réalisation cités seuls deux groupes ont été utilisés, un groupe cible et l’autre, mais le procédé s’applique de la même façon à un nombre de groupes supérieur. De même, la description a porté essentiellement sur le cas de la vérification «1 : 1» mais l’homme du métier l’appliquera sans difficulté à une identification «1 : n», en bouclant autant de fois que nécessaire avec le modèle de correspondance MCOR.
Le dispositif de reconnaissance biométrique apte à mettre en œuvre le procédé de reconnaissance biométrique selon l’invention comprend :
- au moins un système d’acquisition de données biométriques DBR , DBc;
- au moins un classificateur de donnée biométrique candidate DBc parmi au moins deux groupes Gi, G2, lesdits groupes étant exclusifs les uns des autres ;
- un module de calcul d’un score de similarité SS, comprenant notamment le modèle de correspondance MCOR ; - un module de génération d’au moins une fonction PDFTI, PDFT2 de densité de probabilité de transition par groupe Gi, G2 en fonction de données biométriques d’apprentissage dudit groupe ;
- un module de détermination de la fonction de densité de probabilité de transition du groupe déterminé d’une donnée biométrique candidate correspondant au score de similarité calculé pour ladite donnée biométrique candidate DBC;
- un module de détermination d’un score de reconnaissance SRc de ladite donnée biométrique candidate par application de ladite fonction PDFTI, c de densité de probabilité de transition déterminée à une valeur aléatoire;
- un module de décision comportant le modèle de décision validant ou refusant la reconnaissance en fonction du score de reconnaissance SRC de ladite donnée biométrique candidate par comparaison dudit score de reconnaissance SRC à un seuil de décision T indépendant du groupe auquel appartient ladite donnée biométrique candidate.
Ce dispositif est préférentiellement divisé entre différentes unités, par exemple une première unité sert aux étapes amont, cette première unité comporte une première unité informatique, notamment un calculateur et :
- au moins un système d’acquisition de données biométriques d’apprentissage DBAi , DBAj , DBAk, par exemple par des moyens optiques ou audio reliés à cette première unité informatique de traitement ;
- une mémoire de stockage desdites données biométriques d’apprentissage DBAi , DBAj , DBAk dans une base de données biométriques d’apprentissage, sous leur forme telle qu’acquise ou codée ;
- un classificateur de chacune desdites données biométriques DBAi , DBAj , DBAk parmi au moins deux groupes Gi, G2, lesdits groupes étant préférentiellement exclusifs les uns des autres ;
- un module de calcul d’un score de similarité SS, comprenant notamment le modèle de correspondance MCOR ;
- un module de génération d’au moins une fonction PDFTi, PDFT2 de densité de probabilité de transition par groupe Gi, G2 en fonction de données biométriques d’apprentissage dudit groupe ; sachant que les différents modules, la mémoire et le classificateurs sont préférentiellement hébergés dans la première unité informatique, mais peuvent aussi être répartis sur plusieurs calculateur pour paralléliser les calculs, et la mémoire peut être hébergée dans un environnement déporté ; et une seconde unité sur le lieu du contrôle d’accès , cette seconde unité comporte une seconde unité informatique, notamment un calculateur:
- au moins un système d’acquisition de données biométriques candidates DBc et potentiellement de données biométriques d’individus autorisées DBR en cas d’enrôlement avec cette même seconde unité ;
- un classificateur de donnée biométrique candidate DBc parmi lesdits au moins deux groupes Gi, G2; - un module de calcul d’un score de similarité SS, comprenant notamment le modèle de correspondance MCOR et la base de données biométriques de référence des individus autorisées DBR ;
- une mémoire de stockage comportant les matrices de transition PDFTi, PDFT2 de chaque groupe Gi, G2 ;
- un module de détermination de la fonction PDFTi, c de densité de probabilité de transition du groupe déterminé d’une donnée biométrique candidate correspondant au score de similarité SSc calculé pour ladite donnée biométrique candidate DBc;
- un module de détermination d’un score de reconnaissance SRc de ladite donnée biométrique candidate par application de ladite fonction PDFTi, c de densité de probabilité de transition déterminée à une valeur aléatoire;
- un module de décision comportant le modèle de décision validant ou refusant la reconnaissance en fonction du score de reconnaissance SRc de ladite donnée biométrique candidate par comparaison dudit score de reconnaissance SRc à un seuil de décision T indépendant du groupe auquel appartient ladite donnée biométrique candidate ; sachant que, comme précédemment, les différents modules, la mémoire et le classificateurs sont préférentiellement hébergés dans la seconde unité informatique, mais peuvent aussi être répartis sur plusieurs calculateurs pour paralléliser les calculs, et la mémoire peut être hébergée dans un environnement déporté.
L’intérêt de l’invention provient notamment du tirage aléatoire qui est contrôlé par ladite fonction de densité de probabilité, elle-même calculée pour dégrader les performances des groupes non cibles et obtenir des performances plus faibles, cet ajout de « bruit » maîtrisé permettant une réduction des biais sans dégrader notablement les performances de reconnaissance biométrique.

Claims

Revendications
[Revendication 1] Procédé de reconnaissance biométrique comprenant des étapes de :
- acquisition de données biométriques d’apprentissage (DBAi , DBAj , DBAk) chaque donnée biométrique correspondant à un individu unique ;
- classification (E CLA) de chacune desdites données biométriques d’apprentissage (DBAi , DBAj , DBAk) parmi au moins deux groupes de manière à déterminer le groupe (GI,G2) auquel appartient ladite donnée biométrique d’apprentissage (DBAi , DBAj , DBAk), lesdits groupes (GI,G2) étant notamment exclusifs les uns des autres ;
- élaboration d’un modèle de correspondance (MCOR) sur la base desdites données biométriques d’apprentissage (DBAi , DBAj , DBAk) acquises ; ledit procédé de reconnaissance étant caractérisé en ce qu’il comprend également des étapes de:
- génération (E GEN) d’au moins une fonction de densité de probabilité de transition (PDFTi, PDFT2 ) d’au moins un des groupes (GI,G2), notamment pour chaque groupe, l’au moins une fonction de densité de probabilité de transition (PDFTi, PDFT2 ) étant générée en fonction des données biométriques d’apprentissage (DBAi , DBAj , DBAk) dudit groupe (Gi, G2);
- acquisition d’une donnée biométrique de référence (DBR);
- acquisition d’une donnée biométrique candidate (DBc) à la reconnaissance biométrique;
- classification (E CLA) de ladite donnée biométrique candidate (DBc) parmi lesdits groupes (Gi, G2 ) de manière à déterminer le groupe (Gi) auquel appartient ladite donnée biométrique candidate (DBc);
- calcul d’un score de similarité (SSc) pour ladite donnée biométrique candidate (DBc) par ledit modèle de correspondance (MCOR);
- détermination (E DPDF) de la fonction de densité de probabilité de transition (PDFTi, c) propre audit groupe de ladite donnée biométrique candidate (DBc) en fonction du score de similarité (SSc) calculé pour ladite donnée biométrique candidate (DBc) ;
- détermination (E DSR) d’un score de reconnaissance (SRc) de ladite donnée biométrique candidate (DBc), ledit score de reconnaissance (SRc) résultant du tirage aléatoire avec ladite fonction de densité de probabilité de transition (PDFTi, c) déterminée pour ladite donnée biométrique candidate (DBc); - décision (E DEC) validant ou refusant la reconnaissance en fonction du score de reconnaissance (SRc) de ladite donnée biométrique candidate (DBc) par comparaison dudit score de reconnaissance (SRc) à un seuil de décision (T ) indépendant du groupe (Gl) auquel appartient ladite donnée biométrique candidate (DBc).
[Revendication 2] Procédé de reconnaissance biométrique selon l’une quelconque des revendications précédentes caractérisé en ce que l’élaboration du modèle de correspondance (MCOR) est réalisée par entrainement sur la base desdites données biométriques d’apprentissage (DBAi , DBAj , DBAk), le modèle de correspondance (MCOR) comportant notamment un réseau de neurones et l’entraînement étant notamment effectué par apprentissage profond sur la base desdites données biométriques d’apprentissage (DBAi , DBAj , DBAk).
[Revendication 3] Procédé de reconnaissance biométrique selon l’une quelconque des revendications précédentes caractérisé en ce qu’il comprend des étapes de:
- calcul, pour chaque groupe (Gi, G2), d’une distribution des scores de similarité d’imposteurs sur la base des données biométriques d’apprentissage (DBAi , DBAj , DBAk), appelée histogramme initial des imposteurs du groupe;
- calcul, pour chaque groupe (Gi, G2), d’une distribution des scores de similarité d’utilisateurs légitimes sur la base des données biométriques d’apprentissage (DBAi , DBAj , DBAk), appelée histogramme initial des utilisateurs légitimes du groupe.
[Revendication 4] Procédé de reconnaissance biométrique selon l’une quelconque des revendications précédentes caractérisé en ce que pour chaque groupe l’au moins une fonction de densité de probabilité de transition générée du groupe (PDFTi, PDFT2 ) est décrite sous la forme d’une matrice de transition, notamment carrée.
[Revendication 5] Procédé de reconnaissance biométrique selon la revendication précédente caractérisé en ce que les scores de similarité (SS) et les scores de reconnaissance (SR) appartiennent chacun à une plage continue de valeurs s’étirant entre une valeur minimale et une valeur maximale, chaque plage continue de valeurs étant découpée en un nombre d’intervalles de scores, chaque matrice de transition comportant un nombre de lignes et un nombre de colonnes, 1 le nombre de lignes correspondant audit nombre d’intervalles de scores de reconnaissance et le nombre de colonnes correspondant au nombre d’intervalles de similarité.
[Revendication 6] Procédé de reconnaissance biométrique selon la revendication précédente caractérisé en ce que lors de l’étape de génération (E GEN) d’au moins une fonction (PDFTi, PDFT2 ) de densité de probabilité de transition du groupe (Gi, G2 ) en fonction des données biométriques d’apprentissage (DBAi , DBAj , DBAk) dudit groupe (Gi, G2 ) sont générées autant de fonctions de densité de probabilité de transition que le nombre de colonnes de la matrice de transition dudit groupe (Gi, G2.)
[Revendication 7] Procédé de reconnaissance biométrique selon l’une quelconque des revendications 4 à 6 caractérisé en ce que la matrice de transition dudit groupe est carrée et que l’étape de génération (E GEN) comprend une sous-étape d’initialisation de la matrice de transition dudit groupe par la matrice identité.
[Revendication 8] Procédé de reconnaissance biométrique selon l’une quelconque des revendications précédentes caractérisé en ce qu’il comprend:
- une étape de détermination d’un groupe cible (G2) , notamment parmi lesdits au moins deux groupes (Gi, G2), ou par construction d’un groupe cible fictif
[Revendication 9] Procédé de reconnaissance biométrique selon la revendication précédente caractérisé en ce que ledit groupe cible correspond à celui pour lequel le cumul de l’histogramme initial des imposteurs (I_G2, ) est le plus élevé.
[Revendication 10] Procédé de reconnaissance biométrique selon l’une quelconque des revendications précédentes caractérisé en ce que l’étape de génération (E GEN) comprend des sous-étapes de :
- définition d’une fonction de coût (F coût) pour ledit groupe, (Gi, G2) notamment ladite fonction coût dudit groupe dépend de :
- variances par colonne et ;
- d’une divergence Jensen- Shannon (JS) entre l’histogramme initial des imposteurs dudit groupe (I_GI) et l’histogramme initial des imposteurs du groupe cible (I_G2) et ;
- d’une divergence Jensen-Shannon (JS) entre l’histogramme initial des utilisateurs légitimes dudit groupe (U_GI, ) et l’histogramme initial des utilisateurs légitimes du groupe cible (U_G2, ) ;
- calcul du minimum de ladite fonction coût (F coût) dudit groupe par mise en œuvre d'une méthode d’optimisation par apprentissage, notamment une méthode de descente de gradient ou une méthode de recuit simulé ou une méthode de Levenberg-Marquardt, de manière à déterminer la fonction (PDFTi, PDFT2 ) de densité de probabilité de transition dudit groupe.
[Revendication 11] Procédé de reconnaissance biométrique selon l’une quelconque des revendications 7 à 8 dans leur dépendance à la revendication 4 caractérisé en ce que l’étape de génération (E GEN) de la matrice de transition par groupe (Gi, G2) est réalisée analytiquement, et comprend des sous-étapes de :
- alignement de l’histogramme initial des imposteurs dudit groupe (I_GI) sur l’histogramme initial des imposteurs dudit groupe cible (I_G2 ) résultant en un histogramme source aligné des imposteurs et un histogramme source modifié des utilisateurs légitimes;
- calcul itératif d’une matrice (M) des mouvements possibles entre deux index (j,k) , formant un couples d’index, de la matrice de transition, chaque index désignant des intervalles de scores de similarité et de reconnaissance de la matrice de transition, pour tous les couples d’index, ladite matrice des mouvements possibles (M) déterminant à partir de l’histogramme source modifié des utilisateurs légitimes la quantité maximale d’utilisateurs légitimes déplaçable entre lesdits intervalles correspondant audits index du couple sans que la quantité d’imposteur change dans 1’ histogramme source aligné des imposteurs, c’est-à-dire en compensant la quantité d’imposteurs déplacée, de manière à déterminer la matrice de transition dudit groupe.
[Revendication 12] Procédé de reconnaissance biométrique selon l’une quelconque des revendications 5 à 11 caractérisé en ce que l’étape de détermination d’un score de reconnaissance (SRc) de ladite donnée biométrique candidate (DBc) est réalisée par tirage aléatoire d’un nombre avec la fonction (PDFTi,c) de densité de probabilité contenue dans la colonne correspondant à l’intervalle de scores comprenant le score de similarité de ladite donnée biométrique candidate (DBc), le nombre tiré parmi ladite colonne appartenant à un intervalle de score de reconnaissance correspondant à une ligne de ladite colonne et le score de reconnaissance (SRc) de ladite donnée biométrique candidate étant défini dans l’intervalle de scores de reconnaissance correspondant à ladite ligne.
[Revendication 13] Procédé de reconnaissance biométrique selon l’une quelconque des revendications précédentes caractérisé en ce que les groupes (Gi, G2) définissent des catégories de populations en fonction de facteurs démographiques et/ou sociaux.
[Revendication 14] Procédé de reconnaissance biométrique selon l’une quelconque des revendications précédentes caractérisé en ce que les données biométriques d’apprentissage (DBA, , DBAj , DBAk) et/ou candidates (DBc) et/ou de référence (DBR) sont extraites d’images faciales ou d’images d’empreintes ou d’images de veines ou d’images d’iris ou d’enregistrements vocaux.
[Revendication 15] Dispositif de reconnaissance biométrique, ledit dispositif étant apte à mettre en œuvre le procédé de reconnaissance biométrique selon l’une quelconque des revendications 1 à 14.
PCT/EP2023/064883 2022-06-30 2023-06-02 Procédé de reconnaissance biometrique WO2024002618A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR2206646A FR3137479A1 (fr) 2022-06-30 2022-06-30 Procédé de reconnaissance biométrique
FRFR2206646 2022-06-30

Publications (1)

Publication Number Publication Date
WO2024002618A1 true WO2024002618A1 (fr) 2024-01-04

Family

ID=83899638

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2023/064883 WO2024002618A1 (fr) 2022-06-30 2023-06-02 Procédé de reconnaissance biometrique

Country Status (2)

Country Link
FR (1) FR3137479A1 (fr)
WO (1) WO2024002618A1 (fr)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3083895A1 (fr) 2018-07-13 2020-01-17 Idemia Identity & Security France Procede de reconnaissance biometrique

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3083895A1 (fr) 2018-07-13 2020-01-17 Idemia Identity & Security France Procede de reconnaissance biometrique

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
PHILLIPS P. JONATHON ET AL: "Face recognition accuracy of forensic examiners, superrecognizers, and face recognition algorithms", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES, vol. 115, no. 24, 29 May 2018 (2018-05-29), pages 6171 - 6176, XP093076180, ISSN: 0027-8424, DOI: 10.1073/pnas.1721355115 *
RAY JIANG ET AL: "Wasserstein Fair Classification", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 28 July 2019 (2019-07-28), XP081450601 *
RUICHENG XIAN ET AL: "Fair and Optimal Classification via Post-Processing Predictors", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 29 January 2023 (2023-01-29), XP091424528 *
TIAGO SALVADOR ET AL: "FairCal: Fairness Calibration for Face Verification", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 30 March 2022 (2022-03-30), XP091169330 *

Also Published As

Publication number Publication date
FR3137479A1 (fr) 2024-01-05

Similar Documents

Publication Publication Date Title
EP2318980B1 (fr) Procédé de détermination d&#39;une pseudo-identité à partir de caracteristiques de minuties et dispositif associé
WO2006103240A1 (fr) Procédé d&#39;identification de visages à partir d&#39;images de visage, dispositif et programme d&#39;ordinateur correspondants
US8219571B2 (en) Object verification apparatus and method
EP3206192A1 (fr) Procédé de sécurisation et de verification d&#39;un document
EP1385149A1 (fr) Normalisation de score de vérification dans un dispositif de reconnaissance vocale de locuteur
EP3018615B1 (fr) Procede de comparaison de donnees ameliore
EP3742699B1 (fr) Procédé d&#39;authentification forte d&#39;un individu
FR3069357A1 (fr) Systeme d&#39;apprentissage machine pour diverses applications informatiques
EP3731117A1 (fr) Procedes d&#39;enrolement de donnees d&#39;un document d&#39;identite d&#39;un individu et d&#39;authentification d&#39;un document d&#39;identite
Zhang et al. On attribution of deepfakes
Wright et al. Understanding visual lip-based biometric authentication for mobile devices
EP3731116B1 (fr) Procédé d&#39;authentification d&#39;un document d&#39;identité d&#39;un individu et d&#39;authentification dudit individu
FR3079333A1 (fr) Procede d&#39;enrolement de donnees pour controler une identite, et procede de controle d&#39;identite
WO2024002618A1 (fr) Procédé de reconnaissance biometrique
EP3929809A1 (fr) Procédé de détection d&#39;au moins un trait biométrique visible sur une image d entrée au moyen d&#39;un réseau de neurones à convolution
Lisin et al. Improving the Neural Network Algorithm for Assessing the Quality of Facial Images
FR3106678A1 (fr) Traitement biométrique comprenant une pénalisation d’un score de correspondance
US20240160967A1 (en) Apparatus and method for creating non-fungible tokens (nfts) for future user experiences
FR3105479A1 (fr) Procédé et système pour une identification et une authentification biométrique avec template audiovisuel
FR2922340A1 (fr) Procede d&#39;authentification biometrique, systeme d&#39;authentification, programme et terminal correspondants
EP3185178B1 (fr) Procede et dispositif d`identification biometrique
FR3138955A1 (fr) Procédé et dispositif d’authentification biométrique comportementale
EP4099614A1 (fr) Procédés d&#39;enrolement de données pour vérifier l&#39;authenticité d&#39;une donnée de sécurité ou de verification de l&#39;authenticité d&#39;une donnée de securité
FR3135544A1 (fr) Procédé d’authentification d’un document d’identité d’un individu et éventuellement d’authentification dudit individu et d’authentification d’un individu présentant un document d’identité comme étant le sien
CN114399802A (zh) 人脸比对方法及装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23731990

Country of ref document: EP

Kind code of ref document: A1