WO2024002618A1

WO2024002618A1 - Procédé de reconnaissance biometrique

Info

Publication number: WO2024002618A1
Application number: PCT/EP2023/064883
Authority: WO
Inventors: Stéphane GENTRIC
Original assignee: Idemia Identity & Security France
Priority date: 2022-06-30
Filing date: 2023-06-02
Publication date: 2024-01-04
Also published as: FR3137479A1

Abstract

Il comprend des étapes de : - classification (E_CLA) des données biométriques d'apprentissage parmi au moins deux groupes; - génération d'une fonction de densité de probabilité de transition; - classification (E_CLA) d'une donnée biométrique candidate (DBC) parmi lesdits groupes (G₁); - calcul d'un score de similarité (SSc) de la donnée biométrique candidate (DBc); - détermination (E_DPDF) de la fonction de densité de probabilité de transition (PDFT1,c) propre audit groupe de ladite donnée biométrique candidate (DBc) en fonction du score de similarité (SSc) calculé pour ladite donnée biométrique candidate (DBC); - détermination (E_DSR) d'un score de reconnaissance (SRc) de ladite donnée biométrique candidate (DBc), ledit score de reconnaissance (SRc) résultant du tirage aléatoire avec ladite fonction de densité de probabilité de transition (PDFT1,c); - décision (E_DEC) validant ou refusant la reconnaissance en fonction du score de reconnaissance (SRc).

Description

Description Titre de l’invention : Procédé de reconnaissance biométrique

La présente invention concerne un procédé et un dispositif de reconnaissance biométrique. De tels procédés de reconnaissance sont par exemple utilisés à l'entrée de lieux à accès réglementé. Un système de reconnaissance avec un ou plusieurs dispositifs de capture biométrique associés chacun à un portillon est par exemple disposé à l'entrée d’un lieu à accès réglementé pour commander l'ouverture des portillons en cas de reconnaissance validée.

Les procédés et dispositifs de reconnaissance biométriques reposent sur la correspondance entre la donnée biométrique d'un individu candidat à l'identification et la donnée biométrique d’un individu autorisé d’accès qui a été mémorisée au préalable. Une unité informatique de traitement héberge la base de données contenant les données biométriques d'identification des individus autorisés d’accès, ces données ayant été notamment acquises par enrôlement, et l’unité informatique de traitement exécute un programme de correspondance (ou « matching » en langue anglaise) qui compare les données biométriques de l’individu candidat aux données biométriques des individus autorisés d’accès mémorisées au moyen d’un modèle de correspondance. L'identification est validée lorsque les données biométriques de l’individu candidat correspondent à des données biométriques d'un des individus autorisés d’accès de la base de données.

Les systèmes de reconnaissance biométriques, et notamment leurs modèles de correspondance, sont évalués par des tests sur des bases de données biométriques de validation, comportant notamment plusieurs échantillons de données biométriques pour une même personne, par exemple plusieurs images de la même personne avec des expressions de visage différentes, et les taux d’erreur sont mesurés au moyen de :

- taux de faux rejets FRR (de l’anglais « false rejection rate »), qui est la proportion des tentatives de reconnaissance des utilisateurs légitimes rejetées par erreur, ces rejets par le programme de correspondance s’expliquant soit en raison de non-correspondance à tort, soit en raison d’un échec à l’acquisition quand cela est applicable ;

- taux de fausses acceptations FAR (de l’anglais « false acceptance rate »), qui est la proportion des transactions des imposteurs acceptées par erreur.

Les deux taux d’erreurs, FAR et FRR, sont liés et dépendent d’un seuil de décision qui est ajusté en fonction de la caractéristique ciblée du système de reconnaissance biométrique haute ou basse sécurité. En effet, plus le seuil de décision est bas, plus le taux de fausses acceptions est élevé. Dans ce cas, le système de reconnaissance biométrique acceptera des imposteurs. A l’inverse, plus le seuil de décision est élevé, plus le taux de fausses acceptions est bas. Le système de reconnaissance biométrique sera alors robuste aux imposteurs mais rejettera des utilisateurs légitimes. Au passage d’un individu candidat, est classiquement exécuté le programme de correspondance, connu en lui-même, il compare les données biométriques de l’individu candidat aux données biométriques mémorisées des individus autorisés d’accès, au moyen de scores de similarité, ce qui permet ensuite au procédé de reconnaissance de valider ou refuser la reconnaissance de l’individu candidat parmi un des individus autorisés. Ce programme de correspondance, lors de son exécution, calcule le score de similarité par paire, entre ladite donnée biométrique candidate et une, classiquement chacune, des données biométriques mémorisées des individus autorisés d’accès.

De manière générale, les données biométriques peuvent être de natures diverses, elles peuvent être extraites de photographies, d’images, de vidéo, d’images 3D, d’enregistrements audio, et caractériser les traits du visage, les empreintes digitales, les motifs des iris des yeux ou encore la voix, et sont généralement acquises par des moyens optiques ou audio reliés à une unité informatique de traitement. Les données biométriques d’apprentissage sont hébergées dans une base de données d’apprentissage qui appartient par exemple au fabricant du dispositif de reconnaissance ou à l’exploitant du dispositif de reconnaissance. La base de données d’apprentissage et la base de données de validation du modèle de correspondance peuvent être en partie, voire totalement identiques. Chaque donnée biométrique correspond à un individu unique de la base de données. Préférentiellement, plusieurs données biométriques d’apprentissage sont stockées par individu, par exemple, en cas de reconnaissance faciale, plusieurs photographies du visage de l’individu, selon différents angles ou expressions du visage notamment. De plus, pour les besoins de la base d’apprentissage certains individus peuvent être créés de toute pièce, leurs données biométriques sont alors de synthèse. Les données biométriques d’apprentissage peuvent être stockées sous la forme qu’elles ont avant extraction, par exemple photographie, image, vidéo, images 3D, flux sonore, ou être codées informatiquement après l’extraction, par exemple à partir d’une image les caractéristiques biométriques faciales sont codées sous la forme d'un vecteur biométrique tel que décrit dans le document FR3083895 , l’extraction par image des caractéristiques biométriques sous la forme d'un vecteur biométrique étant réalisée au moyen d’un réseau de neurones. L’entraînement de ce réseau de neurones est effectué en amont sur une base de données biométriques d’apprentissage dont les données sont acquises par des moyens dédiés connus.

Néanmoins, un inconvénient des procédés de reconnaissance biométrique classiques réside principalement dans leur caractère non équitable. En effet, on constate à l’issue de l’exécution du programme de correspondance (ou « matching ») des biais, notamment en fonction des caractéristiques démographiques des populations considérées et de la proportion relative de chaque groupe démographique dans la base d’apprentissage des réseaux de neurones utilisée, rendant les résultats non équitables entre les populations. Cet inconvénient est notamment rencontré pour la reconnaissance faciale, mais d’autres biométries peuvent être concernées. Ces biais se manifestent notamment par un taux de faux rejets FRR et un taux de fausses acceptations FAR qui ne sont pas les mêmes en fonction des populations considérées.

On connaît la méthode qui consiste pour un score de similarité donné à déterminer la valeur de décalage de score qui permettrait d’aligner les taux de fausses acceptations FAR entre un groupe cible et un autre, cette valeur de décalage par groupe étant ensuite appliquée à tous les scores du groupe, cependant cette solution d’alignement par translation est globale et ne permet notamment pas d’aligner les histogrammes d’utilisateurs légitimes.

On connaît également la méthode qui consiste à rendre plus équitable l’apprentissage, cependant cette solution est complexe et requiert de compléter de manière idoine la base de données d’apprentissage tout en ne permettant de ne corriger que la partie des biais qui provient du déséquilibre de la base d’apprentissage mais pas la partie des biais liées à des difficultés spécifiques (telles que, pour les femmes, le maquillage ou l’occlusion résultant des cheveux par exemple).

Un des buts de l'invention est de remédier à au moins une partie des inconvénients précités en fournissant un procédé de reconnaissance biométrique plus équitable.

A cet effet, on prévoit, selon l'invention, un procédé de reconnaissance biométrique comprenant des étapes de :

- acquisition de données biométriques d’apprentissage;

- classification de chacune desdites données biométriques d’apprentissage parmi au moins deux groupes de manière à déterminer le groupe auquel appartient ladite donnée biométrique d’apprentissage, lesdits groupes étant notamment exclusifs les uns des autres ;

- élaboration d’un modèle de correspondance sur la base desdites données biométriques d’apprentissage acquises ; ledit procédé de reconnaissance étant caractérisé en ce qu’il comprend également des étapes de:

- génération d’au moins une fonction de densité de probabilité de transition d’au moins un des groupes, notamment pour chaque groupe, l’au moins une fonction de densité de probabilité de transition étant générée en fonction des données biométriques d’apprentissage dudit groupe ;

- acquisition d’une donnée biométrique de référence;

- acquisition d’une donnée biométrique candidate à la reconnaissance biométrique;

- classification de ladite donnée biométrique candidate parmi lesdits groupes de manière à déterminer le groupe auquel appartient ladite donnée biométrique candidate;

- calcul d’un score de similarité pour ladite donnée biométrique candidate par rapport à ladite donnée biométrique de référence avec ledit modèle de correspondance;

- détermination de la fonction de densité de probabilité de transition propre audit groupe de ladite donnée biométrique candidate en fonction du score de similarité calculé pour ladite donnée biométrique candidate ;

- détermination d’un score de reconnaissance de ladite donnée biométrique candidate, ledit score de reconnaissance résultant du tirage aléatoire avec ladite fonction de densité de probabilité de transition déterminée pour ladite donnée biométrique candidate;

- décision validant ou refusant la reconnaissance en fonction du score de reconnaissance de ladite donnée biométrique candidate par comparaison dudit score de reconnaissance à un seuil de décision, ledit seuil de décision étant notamment indépendant du groupe auquel appartient ladite donnée biométrique candidate.

Avantageusement, le procédé de reconnaissance biométrique est ainsi rendu plus équitable sans nécessiter de compléter la base des données biométriques d’apprentissage, c’est-à-dire sans augmenter le temps de génération du modèle de correspondance, puisqu’on corrige ici a posteriori les résultats dudit modèle. En effet, le tirage aléatoire se traduit par un ajout de bruit qui permet de dégrader les performances des groupes les meilleurs de manière à réduire les biais en mettant les différents groupes au « niveau » du moins performant, ce qui améliore ainsi l’équité entre les différents groupes. L’ajout de bruit est maîtrisé car le tirage aléatoire est contrôlé par ladite fonction de densité de probabilité. L’utilisation du modèle de correspondance pour le calcul du score de similarité de la donnée biométrique candidate n’est pas complexifiée et s’exécute classiquement sur une base de données biométriques de référence, par exemple des individus autorisés d’accès. En outre, la génération de fonction de densité de probabilité de transition est réalisée pour au moins les groupes différents du groupe cible mais préférentiellement pour chacun des groupes de manière à ne pas créer de diversité à cette étape entre le groupe cible et les autres, l’absence de diversité à ce stade permet ensuite de déterminer de manière unifiée, indistinctement pour le groupe cible et un autre, le score de reconnaissance. De plus, l’au moins une fonction de densité de probabilité de transition correspond notamment à un champ de fonctions de densité de probabilités, ce qui permet ensuite un traitement discrétisé, notamment matriciel. De par ses étapes, on comprend que le procédé de reconnaissance biométrique selon l’invention est mis en œuvre par ordinateur, notamment au moyen d’au moins une unité informatique.

Avantageusement, la classification de ladite donnée biométrique candidate utilise des informations extérieures à ladite donnée biométrique en tant que telle, telles que des informations extraites d’un document d’identité de l’individu candidat. En effet, l’individu candidat, c’est-à-dire l’individu dont la donnée biométrique candidate a été acquise, présente classiquement un document d’identité lors de l’enrôlement ou d’un préenrôlement, dont la prise en compte d’informations permet la classification parmi des groupes, par exemple si les groupes sont liés au genre.

Avantageusement, l’élaboration du modèle de correspondance est réalisée par entrainement sur la base desdites données biométriques d’apprentissage, le modèle de correspondance comportant notamment un réseau de neurones et l’entraînement étant notamment effectué par apprentissage profond sur la base desdites données biométriques d’apprentissage, ce qui permet d’obtenir rapidement un modèle de correspondance robuste, rapide d’exécution une fois codé et nécessitant peu d’espace mémoire de stockage. Avantageusement, le procédé de reconnaissance biométrique selon l’invention comprend des étapes de: - calcul, pour chaque groupe, d’une distribution des scores de similarité d’imposteurs sur la base des données biométriques d’apprentissage, appelée histogramme initial des imposteurs du groupe;

- calcul, pour chaque groupe, d’une distribution des scores de similarité d’utilisateurs légitimes sur la base des données biométriques d’apprentissage, appelée histogramme initial des utilisateurs légitimes du groupe ; ce qui permet de définir des performances équitables entre les groupes. Avantageusement, pour chaque groupe l’au moins une fonction de densité de probabilité de transition générée du groupe est décrite sous la forme d’une matrice de transition, notamment carrée, cette discrétisation de la fonction de densité de probabilité par intervalles permet une utilisation matricielle simple et nécessite peu de taille mémoire, et la préférence pour la matrice carrée incarne l’optimisation de cette simplification.

De manière avantageuse, les scores de similarité et les scores de reconnaissance appartiennent chacun à une plage continue de valeurs s’étirant entre une valeur minimale et une valeur maximale, chaque plage continue de valeurs étant découpée en un nombre d’intervalles de scores, chaque matrice de transition comportant un nombre de lignes et un nombre de colonnes, le nombre de lignes correspondant audit nombre d’intervalles de scores de reconnaissance et le nombre de colonnes correspondant au nombre d’intervalles de similarité, ce qui permet une lecture de la matrice avec une donnée d’entrée sous la forme d’un score de similarité définissant une colonne et une donnée de sortie sous forme d’un score de reconnaissance, sans nécessiter de contraintes sur le découpage par intervalles de valeurs, qui n’ont notamment pas besoin d’être de même longueur et dans le cas où les nombres d’intervalles de scores de similarité et de reconnaissance sont les mêmes alors la matrice est carrée, de dimension n², et ce quand bien même les plages et leurs découpages pourraient être distincts, même si cela n’est pas préférentiel.

Avantageusement, lors de l’étape de génération d’au moins une fonction de densité de probabilité de transition du groupe sont générées autant de fonctions de densité de probabilité de transition que le nombre de colonnes de la matrice de transition dudit groupe, ce qui permet d’associer une fonction de densité de probabilité à chaque colonne de la matrice de transition, c’est-à-dire pour chaque intervalle de scores de similarité et de discrétiser la fonction de densité de probabilité par intervalles.

De manière avantageuse, la matrice de transition dudit groupe est carrée et l’étape de génération comprend une sous-étape d’initialisation de la matrice de transition dudit groupe par la matrice identité, ce qui permet notamment de ne pas créer de diversité, en fonction du type de groupe en fonction qu’il s’agisse du groupe cible ou non, lors de l’étape de détermination du score de reconnaissance du procédé puisque pour le groupe cible la matrice de transition étant l’unité, les scores de similarité du groupe cible ne seront pas modifiés lors du tirage aléatoire parmi la matrice identité, le score de reconnaissance valant le score de similarité. De plus, cette initialisation évite également tout risque de non convergence lors de la phase de génération. De manière avantageuse, le procédé de reconnaissance biométrique selon l’invention comprend une étape de détermination d’un groupe cible, notamment parmi lesdits au moins deux groupes ou par construction d’un groupe cible fictif, ce qui permet de désigner une cible de manière à faire converger certains ou tous les autres groupes vers ce groupe cible.

Avantageusement, ledit groupe cible correspond à celui pour lequel le cumul de l’histo- gramme initial des imposteurs est le plus élevé, ce qui permettra de dégrader les performances des autres groupes pour atteindre celle du groupe cible.

Avantageusement, l’étape de génération comprend des sous-étapes de :

- définition d’une fonction de coût pour ledit groupe, notamment ladite fonction coût dudit groupe dépend de :

- variances par colonne et ;

- d’une divergence Jensen-Shannon entre l’histogramme initial des imposteurs dudit groupe et l’histogramme initial des imposteurs du groupe cible et ;

- d’une divergence Jensen-Shannon entre l’histogramme initial des utilisateurs légitimes dudit groupe et l’histogramme initial des utilisateurs légitimes du groupe cible ;

- calcul du minimum de ladite fonction coût dudit groupe par mise en œuvre d'une méthode d’optimisation par apprentissage, notamment une méthode de descente de gradient ou une méthode de recuit simulé ou une méthode de Levenberg-Marquardt, de manière à déterminer l’au moins une fonction de densité de probabilité de transition dudit groupe. Ce mode de génération de fonction de densité de probabilité de transition d’un groupe est compatible aussi bien avec la représentation matricielle sous forme de matrice de transition qu’avec n’importe quelle fonction paramétrique continue productrice de fonctions de densité de probabilité. Utiliser l’approche matricielle, c’est-à-dire, discrétisée sur des intervalles, permet de ne pas limiter la famille de fonctions que l’on peut générer. De plus, ces caractéristiques permettent de déterminer rapidement les fonctions de densité de probabilité des groupes.

Alternativement, l’étape de génération de la matrice de transition par groupe est réalisée analytiquement, et comprend des sous-étapes de :

- alignement de l’histogramme initial des imposteurs dudit groupe sur l’histogramme initial des imposteurs dudit groupe cible résultant en un histogramme source aligné des imposteurs dudit groupe et un histogramme source modifié des utilisateurs légitimes dudit groupe;

- calcul itératif d’une matrice des mouvements possibles entre deux index, formant un couple d’index, de la matrice de transition, chaque index désignant des intervalles de scores de similarité et de reconnaissance de la matrice de transition,, pour tous les couples d’index, ladite matrice des mouvements possibles déterminant à partir de l’histogramme source modifié des utilisateurs légitimes du groupe la quantité maximale d’utilisateurs légitimes déplaçable entre lesdits intervalles correspondant audits index du couple sans que la quantité d’imposteur change dans 1’ histogramme source aligné des imposteurs du groupe, c’est-à-dire en compensant la quantité d’imposteurs déplacée, de manière à déterminer la matrice de transition dudit groupe. Ces caractéristiques permettent de mettre en œuvre l’étape de génération d’une autre façon et permettent une minimisation locale et non uniforme globale, ce qui est intéressant dans le cas des intervalles dans lesquels les histogrammes cumulés sont très faibles.

De manière avantageuse, l’étape de détermination d’un score de reconnaissance de ladite donnée biométrique candidate est réalisée par tirage aléatoire d’un nombre avec la fonction de densité de probabilité contenue dans la colonne correspondant à l’intervalle de scores comprenant le score de similarité de ladite donnée biométrique candidate, le nombre tiré parmi ladite colonne appartenant à un intervalle de score de reconnaissance correspondant à une ligne de ladite colonne et le score de reconnaissance de ladite donnée biométrique candidate étant défini dans l’intervalle de scores de reconnaissance correspondant à ladite ligne. Dans les deux modes décrits pour l’étape de génération, en représentation matricielle, une telle étape de détermination du score de reconnaissance permet une mise en œuvre simple, qui ne nécessite essentiellement que la connaissance, c’est-à-dire la mémorisation locale, des matrices de transition desdits groupes, d’un classificateur et du modèle de correspondance.

De manière avantageuse, dans cet intervalle de scores de reconnaissance correspondant à ladite ligne on reprendra la même position relative que dans l’intervalle initial de scores comprenant le score de similarité de ladite donnée biométrique candidate, afin de déterminer précisément le score ainsi construit.

Avantageusement, les groupes définissent des catégories de populations en fonction de facteurs démographiques et/ou sociaux, ce qui permet de rendre équitables les procédés de reconnaissance biométrique quel que soit le genre, ou encore le métier.

De manière avantageuse, les données biométriques d’apprentissage et/ou de référence et/ou candidates sont extraites d’images faciales ou d’images d’empreintes ou d’images de veines ou d’images d’iris ou d’enregistrements vocaux, ce qui permet d’appliquer le procédé aux différents natures de données biométriques.

En outre, l’invention a aussi pour objet un dispositif de reconnaissance biométrique apte à mettre en œuvre le procédé de reconnaissance biométrique selon l’invention, présentant les mêmes avantages que l’invention.

D'autres caractéristiques et avantages de l'invention ressortiront à la lecture de la description qui suit de modes de mise en œuvre particuliers non limitatifs de l'invention. La figure 1 est une vue schématique d’une partie du procédé conforme à l'invention; La figure 2 montre schématiquement une autre partie du procédé conforme à l'invention;

La figure 3 illustre des distributions de scores de similarité d’ imposteurs et d’ utilisateurs légitimes d’un groupe sur la base des données biométriques d’apprentissage dudit groupe selon l'invention;

La figure 4 montre les étapes de détermination de la fonction de densité de probabilité de transition et de détermination d’un score de reconnaissance ladite donnée biométrique candidate selon un mode de réalisation du procédé conforme à l'invention ; La figure 5 illustre l’étape d’alignement selon un autre mode de réalisation du procédé conforme à l'invention ; et

La figure 6 illustre l’étape de calcul itératif d’une matrice des mouvements possibles entre deux index de la matrice de transition.

[Fig.l] La figure 1 expose une vue schématique partielle du procédé de reconnaissance biométrique sous forme d’organigramme. La partie exposée du procédé en figure 1 a pour but d’illustrer plus particulièrement les étapes qui sont effectuées au moment de la vérification d’accès par reconnaissance biométrique, par exemple pour entrer dans un lieu réglementé.

Pour clarifier la description, et de façon non limitative, le cas illustré ici concerne un procédé de reconnaissance faciale. Les données biométriques de référence DBR et candidate DBc sont extraites d’images faciales.

Une donnée biométrique candidate DBc à la reconnaissance biométrique est acquise, il s’agit ici d’une photographie du visage de l’individu candidat, c’est-à-dire d’une image faciale, cette donnée biométrique candidate DBc peut être notamment acquise par un moyen optique tel qu’une caméra ou un appareil photographique. Préférentiellement l’acquisition de cette donnée est effectuée sur place mais elle peut aussi être réalisée préalablement au moyen d’une application sur un téléphone portable par exemple. La donnée biométrique candidate DBc peut ensuite être codée, par exemple sous forme de vecteur.

La donnée biométrique candidate DBc, potentiellement codée, est classifiée lors d’une étape de classification E CLA parmi plusieurs groupes, ici par exemple Gi et G2, de manière à déterminer le groupe auquel appartient la donnée biométrique candidate DBc, il s’agit ici du premier groupe Gi. Les groupes sont préférentiellement exclusifs les uns des autres, mais ils peuvent aussi ne pas l’être et dans ce cas d’usage pour une donnée candidate donnée est estimée la probabilité d’appartenir à chaque groupe, un score de reconnaissance est déterminé pour chaque groupe et pondéré avec lesdites probabilités d’appartenir à chaque groupe, de manière à produite un score de reconnaissance consolidé.

Les groupes sont notamment déterminés en fonction de biais qui ont été observés lors de la validation du modèle de correspondance et ils définissent préférentiellement des catégories de populations en fonction de facteurs démographiques et/ou sociaux. Il peut par exemple s’agir du genre s’il a été détecté un biais, lors de tests de validation par exemple, c’est-à-dire un écart entre les distributions des scores de similarité, ou entre les taux de faux rejets FRR et/ou taux de fausses acceptations FAR, des femmes et des hommes. Par exemple, ici, le groupe Gi correspond au groupe de genre féminin et G2 au groupe de genre masculin.

Le moyen de réaliser cette étape de classification, à savoir le classificateur, peut-être de différentes formes. Par exemple, le classificateur exécute un procédé de traitement de la donnée biométrique candidate sous forme d’image faciale, par exemple au moyen de réseau de neurones, et/ou le classificateur exécute un procédé d’analyse de document, si un document d’identité est également fourni par ailleurs et indique, ou permet de déduire, l’appartenance à un desdits groupes Gi ,G2. Sur la figure 1 la donnée biométrique candidate DBc a ainsi été classifiée parmi le groupe Gi de genre féminin.

Pour des raisons de clarté est illustrée ici le cas de la comparaison de deux données biométriques, l’une de référence DBR d’un individu donné et l’autre d ‘un individu candidat DBc, appelée communément vérification «1 : 1» (1 contre 1), mais l’itération des mêmes étapes de comparaison avec plusieurs données biométriques d’individus autorisés DBR, communément appelée identification «1 : n» (1 contre n), est classique pour l’homme du métier.

Parallèlement à l’étape de classification, ou de manière consécutive, la donnée biométrique candidate DBc acquise est transmise à un modèle de correspondance MCOR préalablement élaboré sur la base de données biométriques d’apprentissage. En opération, le modèle de correspondance MCOR s’exécute classiquement en comparant la donnée biométrique candidate DBc à une ou des données biométriques de référence DBR, par exemple des individus autorisés d’accès « 1 : n » ou d’une personne en particulier en «1 : 1 ». Cette base de données biométriques de référence DBR utilisée en opération est classiquement la propriété de l’exploitant du dispositif de reconnaissance en « 1 :n » ou de la personne en particulier en « 1 : 1 ». La base de données biométriques d’apprentissage utilisée lors de l’élaboration du modèle de correspondance MCOR est préférentiellement différente de la base de données biométriques de référence DBR qui est mémorisée et sert en opération lors de la reconnaissance en 1 : n, d’autant que leur utilisation n’a pas lieu au même moment et ne répond pas au même besoin. Certaines données biométriques peuvent néanmoins exister dans les deux bases. En effet, plus la base de données d’apprentissage servant à l’élaboration du modèle de correspondance MCOR est grande ( y compris intégrant des images faciales de synthèse), meilleure sera la qualité du modèle de correspondance, alors que classiquement la base de données de référence d’individus autorisés qui sert en opération lors de la reconnaissance ne comporte que les données biométriques enrôlées des individus autorisés d’accès et évolue dans le temps en fonction des nouveaux individus enrôlés autorisés d’accès.

Ainsi, dans le cas de l’identification « 1 : n » , l’étape de calcul du score de similarité SSc par le modèle de correspondance MCOR est répétée sur les différentes données biométriques de référence DBR de la base de référence constitués par les données biométriques des individus autorisés d’accès, obtenues par exemple par enrôlement. Préférentiellement toutes les données de références sont comparées à la donnée candidate DBc étant donné que les temps de calcul sont très courts et ne nécessitent donc pas de présélection particulière. Puis, préférentiellement, la suite du procédé est appliquée à chaque score de similarité obtenu jusqu’à déterminer le score de reconnaissance et c’est le meilleur score de reconnaissance obtenu parmi les données biométriques comparées qui est conservé, et qui est comparé au seuil de décision.

La transmission de donnée biométrique de référence DBR au modèle de correspondance MCOR est représentée sous forme de traits pointillés car la donnée biométrique de référence DBR est acquise préalablement en amont.

Un score de similarité SSc est alors calculé pour ladite donnée biométrique candidate DBc au moyen du modèle de correspondance MCOR préalablement élaboré. De tels modèles de correspondance MCOR sont connus.

En fonction du groupe Gi dans lequel a été classifié ladite donnée biométrique candidate DBc et du score de similarité SSc précédemment calculé est déterminée, lors d’une étape de détermination E DPDF, la fonction de densité de probabilité de transition PDFTi c propre audit groupe Gi pour ladite donnée biométrique candidate DBc. Tel que présenté ici, le groupe qui sert à la détermination E DPDF de la fonction de densité de probabilité de transition est celui de la donnée candidate. Mais il peut exister en parallèle une étape de classification de la donnée biométrique de référence et si le groupe issu de l’étape de classification E CLA de la donnée candidate diffère du groupe issu de l’étape de classification de la donnée biométrique de référence DBR, ce qui est commun en « 1 : n » puisque la donnée candidate est alors testée contre tout ou partie de la base biométrique de référence, plusieurs variantes sont applicables, par exemple, n’utiliser que le groupe d’un des deux (de la donnée de référence ou de la donnée candidate), ou choisir aléatoirement un des deux groupes (de la donnée de référence ou de la donnée candidate), ou réaliser deux fois l’étape de détermination E DPDF de la fonction de densité de probabilité de transition pour chacun des deux groupes (de la donnée de référence ou de la donnée candidate) et faire la moyenne des scores de reconnaissance obtenus lors de l’étape de détermination E DSR d’un score de reconnaissance de manière à obtenir un score de reconnaissance consolidé.

L’étape suivante consiste en la détermination E DSR d’un score de reconnaissance SRc de ladite donnée biométrique candidate, ledit score de reconnaissance SRc résultant du tirage aléatoire avec ladite fonction de densité de probabilité de transition PDFTi c déterminée pour ladite donnée biométrique candidate DBc.

Enfin, est représentée l’étape de décision E DEC validant ou refusant la reconnaissance, en fonction du score de reconnaissance SRc de ladite donnée biométrique candidate par comparaison dudit score de reconnaissance SRc à un seuil de décision T indépendant du groupe Gc auquel appartient ladite donnée biométrique candidate DBc , ainsi on a E DEC SR^ = avec T le seuil de décision à partir du-

quel les deux données biométriques comparées, sont considérées comme identiques. Le seuil de décision T est préférentiellement unique, indépendant du groupe auquel appartient ladite donnée biométrique candidate, mais des seuils de décision par groupe pourraient aussi être envisagés.

[Fig.2] La figure 2 montre schématiquement une autre partie du procédé conforme à l'invention, et plus particulièrement les étapes menant à la génération d’au moins une fonction de densité de probabilité de transition, ces étapes sont donc réalisées en amont des étapes préalablement illustrées en figure 1. Une étape d’acquisition de données biométriques d’apprentissage DBAi , DBAj , DBAk est réalisée, il s’agit ici des données biométriques d’apprentissage qui serviront notamment à l’élaboration du modèle de correspondance MCOR.

Pour chaque donnée biométrique d’apprentissage DBAi , DBAj , DBAk il est procédé à l’étape de classification E CLA de manière à déterminer, parmi au moins les deux groupes Gi, G2, le groupe Gi correspondant ici au groupe de genre féminin et G2 au groupe de genre masculin, le groupe Gi, G2 auquel appartient chaque donnée biométrique d’apprentissage DBAi , DBAj , DBAk. Il s’agit des mêmes groupes qu’évoqués dans la description de la figure 1, néanmoins le moyen de réaliser cette étape de classification, à savoir le classificateur n’est pas nécessairement le même que précédemment. Préférentiellement, le classificateur utilisé ici exécute un procédé de traitement des images faciales, par exemple au moyen de réseau de neurones. En outre, comme lors de la description du classificateur utilisé pour la données candidate il est possible de généraliser à des groupes non exclusifs les uns des autres, même si cela est plus complexe lors de l’apprentissage car cela exige un apprentissage avec des pondérations par groupe, ce qui allonge le temps d’entraînement.

Le modèle de correspondance MCOR est le module essentiel codé dans le programme exécutable de correspondance. L’étape d’élaboration du modèle de correspondance MCOR est réalisée par entrainement sur la base desdites données biométriques d’apprentissage DBAi , DBAj , DBAk , le modèle de correspondance comportant notamment un réseau de neurones et l’entraînement étant notamment effectué par apprentissage profond sur la base desdites données biométriques d’apprentissage DBAi , DBAj , DBAk.

Postérieurement à l’étape d’élaboration du modèle de correspondance MCOR, a lieu l’étape de génération E GEN d’au moins une fonction de densité de probabilité de transition PDFTi, PDFT2 d’au moins un des groupes Gi, G2, mais préférentiellement pour chaque groupe de façon à limiter la diversité des étapes du processus en fonction de la nature cible ou non du groupe, tel que représenté ici, de manière à réduire la diversité des branches du procédé. Les fonctions de densité de probabilité de transition PDFTi, PDFT2 sont alors générées en fonction de l’intégralité des données biométriques d’apprentissage DBAi , DBAj , DBAk de chaque groupe Gi, G2. Ces fonctions de densité de probabilité de transition PDFTi, PDFT2 comportent chacune plusieurs fonctions de densité de probabilité par intervalle de scores et constituent des champs de fonctions de densité de probabilité.

[Fig. 3] La figure 3 illustre pour le groupe 1 des distributions des scores de similarité des imposteurs I_Gi et des utilisateurs légitimes U_Gi sur la base des données biométriques d’apprentissage DBAi , DBAj , DBAk dudit groupe Gi selon l'invention. L’abscisse représente les scores SS de similarité et l’ordonnée représente la densité de probabilité R, dont l’intégrale vaut 1. En ligne pointillée est positionné un exemple de score seuil qui détermine les deux taux d’erreurs intermédiaires FAR et FRR. Il s’agit ici de taux d’erreur intermédiaire, si on devait les nommer, car sont représentés ici les distributions en fonction des scores de similarité et non en fonction des scores de reconnaissance SR. A ce stade intermédiaire, si une décision devait être prise sur la base de ce seuil, à droite de ce seuil seraient les cas acceptés et à gauche les cas rejetés, d’où les termes classiquement utilisés d’utilisateurs légitimes et d’imposteurs.

Préalablement à l’étape de génération E GEN ou préférentiellement, dans l’étape E GEN, il est procédé aux étapes de :

- calcul, pour chaque groupe Gi, G2, d’une distribution des scores de similarité des imposteurs sur la base des données biométriques d’apprentissage DBAi , DBAj , DBAk, appelée histogramme I_Gi, I G2 initial des imposteurs du groupe;

- calcul, pour chaque groupe Gi, G2, d’une distribution des scores de similarité des utilisateurs légitimes sur la base des données biométriques d’apprentissage DBAi , DBAj , DBAk , appelée histogramme U_Gi, U G2 initial des utilisateurs légitimes du groupe. En effet, les variables aléatoires se définissent classiquement par une distribution de probabilité ainsi que par des paramètres de distribution, tels que la moyenne et la variance. La densité de probabilité fx(x) d’une variable aléatoire continue caractérise la probabilité qu’un évènement de X se situe dans un intervalle infiniment petit [x , x+dx] telle que :

[Math. 1]

AG) = Pfx < X < x + dx]

La fonction de répartition FX(x) décrit la probabilité que la variable aléatoire continue prenne une valeur inférieure ou égale à x. Elle définit ainsi l’aire sous la densité de probabilité à gauche de x telle que : [Math. 2]

F_x(x) = P[X < x] = J (z)|dz fx(x) étant toujours égale à 1 telle que :

Ainsi, préférentiellement, l’étape de génération E GEN génère une matrice de transition par groupe Gi, G2, et pour chaque groupe Gi, G2 le champ de fonctions de densité de probabilité de transition PDFTi, PDFT2 est décrit sous la forme d’une matrice carrée de transition.

En effet, en référence à la figure 3 les scores de similarité SS appartiennent à une plage continue de valeurs s’étirant entre une valeur minimale, par exemple 0, et une valeur maximale, par exemple 20000, ladite plage continue de valeurs étant découpée par morceaux en un nombre d’intervalles de scores, ces intervalles couvrent la totalité de la plage et s’enchaînent de manière continue, sans recouvrement. Le choix du nombre d’intervalles résulte d’un compromis entre la précision et le temps de calcul. Ces intervalles ne sont pas nécessairement de la même longueur. Chaque matrice carrée de transition est de dimension n², n correspondant audit nombre d’intervalles de scores de similarité ainsi qu’au nombre d’intervalles de scores de reconnaissance puisqu’elle se lira avec un score de similarité en entrée et sortira un score de reconnaissance. Préférentiellement les matrices de transition des différents groupes sont de même dimensions de manière à limiter la diversité de traitement.

Ainsi, lors de l’étape de génération E GEN d’au moins une fonction PDFTi, PDFT2 de densité de probabilité de transition du groupe Gi, G2 en fonction des données biométriques d’apprentissage DBAi , DBAj , DBAk dudit groupe Gi, G2 sont générées autant de fonctions de densité de probabilité de transition que la dimension n de la matrice carrée de transition dudit groupe Gi, G2.

Préférentiellement, l’étape de génération de la matrice de transition PDFTi, PDFT2 par groupe comporte une sous-étape d’initialisation de ladite matrice de transition PDFTi, PDFT2 dudit groupe Gi, G2 par la matrice identité, cette étape est par nature préalable à toute autre étape affectant la matrice de transition PDFTi, PDFT2 de chaque groupe. Préférentiellement, l’étape de génération E GEN de la matrice de transition PDFTi, PDFT2 par groupe comporte une sous-étape de détermination d’un groupe cible Gi, G2 sachant que cette sous étape pourrait également être préalable à l’étape de génération E GEN.

On choisit ici comme groupe cible celui pour lequel Faire sous la densité de probabilité caractéristique de la distribution des scores de similarité des imposteurs, c’est-à-dire le cumul de l’histogramme initial des imposteurs I_GI, I_G2, est le plus élevé, c’est-à-dire le groupe qui présente les plus mauvaises performances, supposons ici que ce groupe cible soit le deuxième groupe G2 .

Le groupe cible est ici choisi parmi lesdits au moins deux groupes Gi, G2, mais il peut aussi être un groupe cible fictif construit sur la base de ces groupes, en étant l’un ou l’autre en fonction du score de manière à tracer un groupe fictif, qui serait notamment représentatif des pires performances (cumul des imposteurs le plus élevé), ce qui permet de disposer d’une cible vers laquelle il est toujours possible de corriger, et donc de converger puisqu’elle est toujours la plus mauvaise. Le tracé d’un tel groupe fictif serait donc par exemple,

- pour les FAR (histogrammes calculés en cumulant l’histogramme des scores imposteurs de la plus grande à la plus petite valeur) une ligne composée de points des FAR I_Gi ou des FAR I G2 en fonction de celui est le plus élevé pour chaque Score de Similarité (SS), ce groupe fictif serait en quelque sorte représenté par l’enveloppe supérieure des FAR de la figure 5, ce qui permet de créer un groupe fictif qui a toujours les pires performances,

- pour les FRR de même à partir des scores des utilisateurs légitimes (histogrammes calculés en cumulant l’histogramme des scores légitimes de la plus petite à la plus grande valeur) et donc vers lesquels il sera toujours possible de converger, ce groupe fictif (défini par ses FAR et ses FRR) étant alors défini comme groupe cible . Une autre variante pourrait consister aussi en la détermination d’un groupe cible, fictif ou non, qui ne serait pas le plus mauvais (cumulé, ou partout) mais un des plus mauvais de manière à trouver un compromis entre la performance et le caractère équitable du procédé de reconnaissance. Dans un mode de réalisation particulier, l’étape de génération E GEN est réalisée par apprentissage et comprend, après notamment détermination du groupe cible parmi les- dits au moins deux groupes Gi, G2 et initialisation de la matrice de transition PDFTi, PDFT2 de chaque groupe, des sous-étapes de :

- des variances cr_£ par colonne et ;

- d’une divergence Jensen-Shannon JSI,GI,GT entre l’histogramme initial des imposteurs dudit groupe Gi et l’histogramme initial des imposteurs du groupe cible GT (=G2), sachant que la divergence Jensen-Shannon entre l’histogramme initial des imposteurs du groupe cible et l’histogramme initial des imposteurs du groupe cible est par définition nulle (ici JSI,G2,GT=0 car GT=G2) , ce qui permet de ne pas nécessiter de diversité de traitement entre le groupe cible et les autres ; et ;

- d’une divergence Jensen-Shannon JSU,GI,GT entre l’histogramme initial des utilisateurs légitimes dudit groupe Gi et l’histogramme initial des utilisateurs légitimes du groupe cible G (=G2); Le choix de préférence de la divergence Jensen-Shannon par rapport à la K-L divergence provient de son caractère symétrique ; la fonction coût s’écrit donc ici :

[Math. 4]

- calcul du minimum de ladite fonction coût dudit groupe par mise en œuvre d'une méthode d’optimisation par apprentissage, notamment une méthode de descente de gradient. Il sera donc procédé, par groupe, à la minimisation, de manière connue, de n² paramètres de manière à obtenir la matrice de transition PDFTi, PDFT2 optimisée comportant n fonctions de densité de probabilités définies chacune par n paramètres, puisqu’elles sont définies sur n intervalles, ce qui permet de définir les n² valeurs de la matrice de transition PDFTi, PDFT2. D’autres méthodes que la descente de gradient peuvent être utilisées, telles qu’une méthode de recuit simulé ou une méthode de Leven- b erg-Mar quardt, de manière à déterminer la fonction de densité de probabilité de transition dudit groupe. D’autres méthodes d’optimisation telle que CMAES (de l’anglais

« Covariance Matrix Adaptation Evolution Strategy ») pourraient également être appliquées.

Des contraintes inhérentes à la nature des matrices de transition PDFTi, PDFT2 s’appliquent à l’optimisation par apprentissage, ainsi les valeurs dans les matrices de transition sont positives et la somme des valeurs chaque colonne de chaque matrice de transition PDFTi, PDFT2 vaut 1. Après optimisation, les matrices de transition PDFTi, PDFT2 de chaque groupe Gi, G2 sont mémorisées dans des espaces mémoires du calculateur du système de reconnaissance qui exécutera le programme de reconnaissance lors de la vérification de l’individu candidat. Est également mémorisée, notamment momentanément de manière à couvrir le temps de l’opération de contrôle en application « 1 : 1 », dans des espaces mémoires de ce calculateur du système de reconnaissance la donnée biométrique de référence DBR. Ce programme de reconnaissance comporte dans des sous-modules:

- le modèle de correspondance MCOR codé sous-forme de programme exécutable de correspondance, ainsi que

- le classificateur de la donnée biométrique candidate codé sous forme de programme de classification exécutable,

- un correcteur codé sous forme de programme exécutable de correction détaillé ci- après,

- un modèle de décision mettant en œuvre l’étape de décision E DEC préalablement décrite et codé sous forme de programme exécutable de correction et peut contenir un modèle d’acquisition de données biométrique si le système de reconnaissance comporte un unique calculateur, mais préférentiellement, ce modèle est déporté dans le calculateur du sous-système d’acquisition de données biométriques candidates.

[Fig. 4] Comme illustré en figure 4 , le correcteur exécute de manière combinée les étapes de :

- détermination E DPDF de la fonction de densité de probabilité de transition PDFTi propre audit groupe Gi de ladite donnée biométrique candidate DBc en fonction du score de similarité SSc calculé pour ladite donnée biométrique candidate DBc : il s’agit ici du choix de densité de probabilité de transition, c’est-à-dire ici du choix de la matrice de densité de probabilité de transition, PDFTi parmi les fonction de densité de probabilité de transition PDFTi et PDFT2 des différents groupes Gi, G2 en fonction Gi du groupe de donnée biométrique candidate DBc , et parmi cette matrice de transition PDFTi dudit groupe de la donnée biométrique candidate du choix de la fonction de densité de probabilité PDFTi, c qui correspond au score de similarité SSc calculé pour ladite donnée biométrique candidate DBc, c’est-à-dire à la fonction de densité de probabilité de transition PDFTi, c exprimée dans la colonne correspondant à l’intervalle de score de similarité SS auquel appartient le score de similarité SSc calculé pour ladite donnée biométrique candidate DBc ;

- détermination E DSR d’un score de reconnaissance SRc de ladite donnée biométrique candidate, ledit score de reconnaissance SRc se déduisant du tirage aléatoire avec ladite fonction de densité de probabilité de transition PDFTi, c déterminée pour ladite donnée biométrique candidate.

Ainsi, en référence à l’exemple de la figure 4, il apparaît clairement que ces deux étapes agissent en synergie en vue de déterminer le score de reconnaissance SRc . Avec des intervalles de scores de similarité SS en abscisse et de reconnaissance SR en ordonnées de 2000, on constate qu’avec un score de similarité SSc de la donnée biométrique candidate DBc de 9500 , ce score de similarité SSc appartient à la cinquième colonne de la matrice de densité de probabilité de transition PDFTi correspondant au premier groupe Gi auquel appartient la donnée biométrique candidate DBc. En outre, le score de similarité SSc de la donnée biométrique candidate DBc est situé à une distance a du bord inférieur de ce cinquième intervalle, valant ici 1500. L’étape de détermination du score de reconnaissance SRc est réalisée par tirage aléatoire d’un nombre selon la fonction de densité de probabilité contenue dans la colonne correspondant à l’intervalle de scores comprenant le score de similarité SSc de ladite donnée biométrique candidate, le nombre tiré parmi ladite colonne appartenant à un intervalle de score de reconnaissance correspondant à une ligne de ladite colonne et le score de reconnaissance SRc de ladite donnée biométrique candidate étant défini dans l’intervalle de score correspondant à ladite ligne. En reprenant l’exemple de la figure 4, cela se traduit par le tirage dans cette cinquième colonne, représentant PDFTi, c , avec ladite fonction de densité de probabilité de transition PDFTi, c qui donne une valeur tirée, que l’on peut assimiler à un score intermédiaire, et que nous prendrons ici égale à 13000 ; cette valeur tirée appartient donc à la ligne 4. Le score de reconnaissance SRc appartient donc à l’intervalle de scores de reconnaissance SR correspondant à la quatrième ligne de la matrice PDFTi : 6000-8000 et plus précisément il SRc est obtenu en appliquant le même décalage de distance a par rapport au bord inférieur de ce quatrième intervalle, ce qui donne un score de reconnaissance SRc de 7500. Ce choix d’appliquer le même décalage en entrée et en sortie n’est pas nécessaire mais permet de garantir une continuité.

Le correcteur prend donc en entrée de la matrice de transition PDFTi le score de similarité SSc de la donnée biométrique candidate DBc et donne en sortie le score de reconnaissance SRc de la donnée biométrique candidate DBc .

[Fig. 5] Selon un autre mode de réalisation, l’étape de génération de la matrice de transition par groupe PDFTi et PDFT2 est réalisée analytiquement, illustrée en figures 5 et 6, et comprend des sous-étapes de :

- alignement de l’histogramme initial des imposteurs I_Gi dudit groupe sur l’histo- gramme initial des imposteurs I G2 dudit groupe cible résultant en un histogramme source aligné des imposteurs et un histogramme source modifié des utilisateurs légitimes;

- calcul itératif d’une matrice des mouvement possibles entre deux index ( binôme ligne et colonne ) de la matrice de transition pour tous les couples d’index, ladite matrice des mouvements possibles déterminant à partir de l’histogramme source modifié des utilisateurs légitimes la quantité maximale d’utilisateurs légitimes déplaçable d’un index du couple vers l’autre index du couple sans que la quantité d’imposteur change dans F histogramme source aligné des imposteurs, c’est-à-dire en compensant la quantité d’imposteurs déplacée, de manière à déterminer la matrice de transition dudit groupe.

Des contraintes inhérentes à la nature des matrices de transition PDFTi, PDFT2 s’appliquent à l’étape de génération réalisée analytiquement, ainsi les valeurs dans les matrices de transition sont positives et la somme des valeurs chaque colonne de chaque matrice de transition PDFTi, PDFT2 vaut 1.

Comme illustré en figure 5 l’étape d’alignement part de l’histogramme initial des imposteurs I_Gi du groupe 1 (non cible) en traits pointillés et de l’histogramme initial des imposteurs I G2 du groupe cible G2 en trait plein, les histogrammes sont ici affichés en échelle logarithmique et l’histogramme initial des imposteurs I_Gi du groupe 1 (non cible) est si besoin prolongé (trait plein plus fin) pour couvrir la même gamme de répartition R , les flèches représentent les décalages en écarts de scores de similarité à appliquer pour aligner les deux histogrammes entre eux. Ces mêmes décalages sont également appliqués aux histogrammes des utilisateurs légitimes U_Gi car les histogrammes sont par nature liés entre eux. Le décalage a ainsi pour but d’aligner dynamiquement les taux de fausses acceptations FAR des groupes non cibles sur celui du groupe cible (par exemple : 1% (R)=+2500 (SS)) et d’obtenir un histogramme source aligné des imposteurs et un histogramme source modifié des utilisateurs légitimes. En effet, il résulte de l’alignement appliqué une modification de tous les scores, incluant les scores des utilisateurs légitimes et des imposteurs, et donc une modification de leur histogramme respectif.

La figure 6 illustre l’étape de calcul itératif d’une matrice des mouvements possibles M entre deux index j,k de la matrice de transition PDFTi du groupe 1 (non cible) , formant un couples d’index, chaque index désignant des intervalles de scores de similarité et de reconnaissance de la matrice de transition, chaque index correspond donc à une ligne (score de reconnaissance) et à une colonne (score de similarité). Pour tous les couples d’index j,k , ladite matrice des mouvements possibles M détermine à partir de l’histogramme source modifié des utilisateurs légitimes la quantité maximale d’utilisateurs légitimes déplaçable entre lesdits intervalles correspondant audits index du couple sans que la quantité d’imposteur change dans l’histogramme source aligné des imposteurs, c’est-à-dire en compensant la quantité d’imposteurs déplacée, de manière à déterminer la matrice de transition dudit groupe.

Dans la figure 6 les valeurs de la matrice de transition PDFTi sont exprimées sous la forme de Rjj Rjk Rkj Rkk, et I fait ici référence à une proportion d’imposteurs étant dans l’intervalle respectif k,j de la base d’apprentissage et m à une proportion d’utilisateurs légitimes étant dans l’intervalle respectif k, j de la base d’apprentissage. Il s’agit de calculer itérativement la matrice de transition PDFTi par mouvements unitaires qui laissent l’histogramme source aligné des imposteurs du groupe 1 (non cible) inchangé, dans sa traduction matricielle, tout en visant le taux maximum de faux rejets FRR pour les utilisateurs légitimes. Pour ce faire, la matrice de transition PDFTi du groupe 1 (non cible) est initialisée à la matrice identité, comme dans le mode de réalisation précédent, et une matrice des mouvements M est calculée itérativement par couples d’index y, ô de la matrice de transition PDFTi , cette matrice des mouvements M détermine la portion maximum m’k de la répartition d’utilisateurs légitimes post alignement qui peut être transfé- rée vers une autre case de la matrice de transition PDFTi sans que la portion d’imposteurs change : I'k=Ik ^et / ;=//, c’est-à-dire en compensant la portion d’imposteurs déplacée . En considérant y le pourcentage d’utilisateurs légitimes déplacés de l’index j vers l’index k de la matrice de transition PDFTi , fixer l’histogramme source aligné des imposteurs du groupe 1 (non cible) signifie

ce qui impose de ramener une portion de ô de l’index k à l’index j. Les mouvements possibles sont calculés en conséquence, puis un processus itératif déplace les portions d’utilisateurs légitimes pour atteindre le taux de faux rejets FRR visé. Les flèches noires en trait plein illustrent le fait que les imposteurs sont calculés à partir des imposteurs et les flèches noires en pointillé illustrent le fait que les utilisateurs légitimes sont calculés à partir des utilisateurs légitimes, mais que dans les deux cas on utilise la même matrice de transition PDFTi de valeurs Rjj Rjk Rkj Rkk. A chacune de ces itérations p, la matrice des mouvements possibles courante M_p étant ainsi calculée, on peut modifier PDFT_X j et PDFT_{X k} de la valeur maximale M_Pj,k , avec p l’itération ;i,j les coordonnées dans la matrice, de manière à rapprocher m’k de ca cible, sans changer l’k . PDF^ ayant été modifié à l’itération p, on recalcule entièrement M_p+i à l’itération suivante.

Préférentiellement on commence par les index correspondant à un coin de la matrice de transition PDFTi, et plus précisément à une extrémité de la diagonale identité de la matrice de transition PDFTi telle qu’initialisée. Une fois la matrice obtenue, l’étape de correction sera appliquée comme précédemment, de même que l’étape de décision E DEC. L’intérêt de cette variante consiste en sa minimisation par localités, contrairement à la minimisation globale opérée par la fonction de coût du mode de réalisation présenté précédemment. En effet, sur certains intervalles, les valeurs de l’histogramme des imposteurs sont très élevées (taux de FAR très faible) or d’après les critères d’optimisation définis une convergence reste recherchée tant qu’elles ne sont pas égales à celles du groupe cible, alors que cela n’est pas utile et allonge inutilement le temps de l’étape de génération E_GEN.

Dans les modes de réalisation cités seuls deux groupes ont été utilisés, un groupe cible et l’autre, mais le procédé s’applique de la même façon à un nombre de groupes supérieur. De même, la description a porté essentiellement sur le cas de la vérification «1 : 1» mais l’homme du métier l’appliquera sans difficulté à une identification «1 : n», en bouclant autant de fois que nécessaire avec le modèle de correspondance MCOR.

Le dispositif de reconnaissance biométrique apte à mettre en œuvre le procédé de reconnaissance biométrique selon l’invention comprend :

- au moins un système d’acquisition de données biométriques DBR , DBc;

- au moins un classificateur de donnée biométrique candidate DBc parmi au moins deux groupes Gi, G2, lesdits groupes étant exclusifs les uns des autres ;

- un module de calcul d’un score de similarité SS, comprenant notamment le modèle de correspondance MCOR ; - un module de génération d’au moins une fonction PDFTI, PDFT2 de densité de probabilité de transition par groupe Gi, G2 en fonction de données biométriques d’apprentissage dudit groupe ;

- un module de détermination de la fonction de densité de probabilité de transition du groupe déterminé d’une donnée biométrique candidate correspondant au score de similarité calculé pour ladite donnée biométrique candidate DBC;

- un module de détermination d’un score de reconnaissance SRc de ladite donnée biométrique candidate par application de ladite fonction PDFTI, c de densité de probabilité de transition déterminée à une valeur aléatoire;

- un module de décision comportant le modèle de décision validant ou refusant la reconnaissance en fonction du score de reconnaissance SRC de ladite donnée biométrique candidate par comparaison dudit score de reconnaissance SRC à un seuil de décision T indépendant du groupe auquel appartient ladite donnée biométrique candidate.

Ce dispositif est préférentiellement divisé entre différentes unités, par exemple une première unité sert aux étapes amont, cette première unité comporte une première unité informatique, notamment un calculateur et :

- au moins un système d’acquisition de données biométriques d’apprentissage DBAi , DBAj , DBAk, par exemple par des moyens optiques ou audio reliés à cette première unité informatique de traitement ;

- une mémoire de stockage desdites données biométriques d’apprentissage DBAi , DBAj , DBAk dans une base de données biométriques d’apprentissage, sous leur forme telle qu’acquise ou codée ;

- un classificateur de chacune desdites données biométriques DBAi , DBAj , DBAk parmi au moins deux groupes Gi, G2, lesdits groupes étant préférentiellement exclusifs les uns des autres ;

- un module de calcul d’un score de similarité SS, comprenant notamment le modèle de correspondance MCOR ;

- un module de génération d’au moins une fonction PDFTi, PDFT2 de densité de probabilité de transition par groupe Gi, G2 en fonction de données biométriques d’apprentissage dudit groupe ; sachant que les différents modules, la mémoire et le classificateurs sont préférentiellement hébergés dans la première unité informatique, mais peuvent aussi être répartis sur plusieurs calculateur pour paralléliser les calculs, et la mémoire peut être hébergée dans un environnement déporté ; et une seconde unité sur le lieu du contrôle d’accès , cette seconde unité comporte une seconde unité informatique, notamment un calculateur:

- au moins un système d’acquisition de données biométriques candidates DBc et potentiellement de données biométriques d’individus autorisées DBR en cas d’enrôlement avec cette même seconde unité ;

- un classificateur de donnée biométrique candidate DBc parmi lesdits au moins deux groupes Gi, G2; - un module de calcul d’un score de similarité SS, comprenant notamment le modèle de correspondance MCOR et la base de données biométriques de référence des individus autorisées DBR ;

- une mémoire de stockage comportant les matrices de transition PDFTi, PDFT2 de chaque groupe Gi, G2 ;

- un module de détermination de la fonction PDFTi, c de densité de probabilité de transition du groupe déterminé d’une donnée biométrique candidate correspondant au score de similarité SSc calculé pour ladite donnée biométrique candidate DBc;

- un module de décision comportant le modèle de décision validant ou refusant la reconnaissance en fonction du score de reconnaissance SRc de ladite donnée biométrique candidate par comparaison dudit score de reconnaissance SRc à un seuil de décision T indépendant du groupe auquel appartient ladite donnée biométrique candidate ; sachant que, comme précédemment, les différents modules, la mémoire et le classificateurs sont préférentiellement hébergés dans la seconde unité informatique, mais peuvent aussi être répartis sur plusieurs calculateurs pour paralléliser les calculs, et la mémoire peut être hébergée dans un environnement déporté.

L’intérêt de l’invention provient notamment du tirage aléatoire qui est contrôlé par ladite fonction de densité de probabilité, elle-même calculée pour dégrader les performances des groupes non cibles et obtenir des performances plus faibles, cet ajout de « bruit » maîtrisé permettant une réduction des biais sans dégrader notablement les performances de reconnaissance biométrique.

Claims

Revendications

[Revendication 1] Procédé de reconnaissance biométrique comprenant des étapes de :

- acquisition de données biométriques d’apprentissage (DBAi , DBAj , DBAk) chaque donnée biométrique correspondant à un individu unique ;

- classification (E CLA) de chacune desdites données biométriques d’apprentissage (DBAi , DBAj , DBAk) parmi au moins deux groupes de manière à déterminer le groupe (GI,G2) auquel appartient ladite donnée biométrique d’apprentissage (DBAi , DBAj , DBAk), lesdits groupes (GI,G₂) étant notamment exclusifs les uns des autres ;

- élaboration d’un modèle de correspondance (MCOR) sur la base desdites données biométriques d’apprentissage (DBAi , DBAj , DBAk) acquises ; ledit procédé de reconnaissance étant caractérisé en ce qu’il comprend également des étapes de:

- génération (E GEN) d’au moins une fonction de densité de probabilité de transition (PDFTi, PDFT2 ) d’au moins un des groupes (GI,G₂), notamment pour chaque groupe, l’au moins une fonction de densité de probabilité de transition (PDFTi, PDFT2 ) étant générée en fonction des données biométriques d’apprentissage (DBAi , DBAj , DBAk) dudit groupe (Gi, G2);

- acquisition d’une donnée biométrique de référence (DBR);

- acquisition d’une donnée biométrique candidate (DBc) à la reconnaissance biométrique;

- classification (E CLA) de ladite donnée biométrique candidate (DBc) parmi lesdits groupes (Gi, G2 ) de manière à déterminer le groupe (Gi) auquel appartient ladite donnée biométrique candidate (DBc);

- calcul d’un score de similarité (SSc) pour ladite donnée biométrique candidate (DBc) par ledit modèle de correspondance (MCOR);

- détermination (E DPDF) de la fonction de densité de probabilité de transition (PDFTi, c) propre audit groupe de ladite donnée biométrique candidate (DBc) en fonction du score de similarité (SSc) calculé pour ladite donnée biométrique candidate (DBc) ;

- détermination (E DSR) d’un score de reconnaissance (SRc) de ladite donnée biométrique candidate (DBc), ledit score de reconnaissance (SRc) résultant du tirage aléatoire avec ladite fonction de densité de probabilité de transition (PDFTi, c) déterminée pour ladite donnée biométrique candidate (DBc); - décision (E DEC) validant ou refusant la reconnaissance en fonction du score de reconnaissance (SRc) de ladite donnée biométrique candidate (DBc) par comparaison dudit score de reconnaissance (SRc) à un seuil de décision (T ) indépendant du groupe (Gl) auquel appartient ladite donnée biométrique candidate (DBc).

[Revendication 2] Procédé de reconnaissance biométrique selon l’une quelconque des revendications précédentes caractérisé en ce que l’élaboration du modèle de correspondance (MCOR) est réalisée par entrainement sur la base desdites données biométriques d’apprentissage (DBAi , DBAj , DBAk), le modèle de correspondance (MCOR) comportant notamment un réseau de neurones et l’entraînement étant notamment effectué par apprentissage profond sur la base desdites données biométriques d’apprentissage (DBAi , DBAj , DBAk).

[Revendication 3] Procédé de reconnaissance biométrique selon l’une quelconque des revendications précédentes caractérisé en ce qu’il comprend des étapes de:

- calcul, pour chaque groupe (Gi, G2), d’une distribution des scores de similarité d’imposteurs sur la base des données biométriques d’apprentissage (DBAi , DBAj , DBAk), appelée histogramme initial des imposteurs du groupe;

- calcul, pour chaque groupe (Gi, G2), d’une distribution des scores de similarité d’utilisateurs légitimes sur la base des données biométriques d’apprentissage (DBAi , DBAj , DBAk), appelée histogramme initial des utilisateurs légitimes du groupe.

[Revendication 4] Procédé de reconnaissance biométrique selon l’une quelconque des revendications précédentes caractérisé en ce que pour chaque groupe l’au moins une fonction de densité de probabilité de transition générée du groupe (PDFTi, PDFT2 ) est décrite sous la forme d’une matrice de transition, notamment carrée.

[Revendication 5] Procédé de reconnaissance biométrique selon la revendication précédente caractérisé en ce que les scores de similarité (SS) et les scores de reconnaissance (SR) appartiennent chacun à une plage continue de valeurs s’étirant entre une valeur minimale et une valeur maximale, chaque plage continue de valeurs étant découpée en un nombre d’intervalles de scores, chaque matrice de transition comportant un nombre de lignes et un nombre de colonnes, 1 le nombre de lignes correspondant audit nombre d’intervalles de scores de reconnaissance et le nombre de colonnes correspondant au nombre d’intervalles de similarité.

[Revendication 6] Procédé de reconnaissance biométrique selon la revendication précédente caractérisé en ce que lors de l’étape de génération (E GEN) d’au moins une fonction (PDFTi, PDFT2 ) de densité de probabilité de transition du groupe (Gi, G2 ) en fonction des données biométriques d’apprentissage (DBAi , DBAj , DBAk) dudit groupe (Gi, G2 ) sont générées autant de fonctions de densité de probabilité de transition que le nombre de colonnes de la matrice de transition dudit groupe (Gi, G2.)

[Revendication 7] Procédé de reconnaissance biométrique selon l’une quelconque des revendications 4 à 6 caractérisé en ce que la matrice de transition dudit groupe est carrée et que l’étape de génération (E GEN) comprend une sous-étape d’initialisation de la matrice de transition dudit groupe par la matrice identité.

[Revendication 8] Procédé de reconnaissance biométrique selon l’une quelconque des revendications précédentes caractérisé en ce qu’il comprend:

- une étape de détermination d’un groupe cible (G2) , notamment parmi lesdits au moins deux groupes (Gi, G2), ou par construction d’un groupe cible fictif

[Revendication 9] Procédé de reconnaissance biométrique selon la revendication précédente caractérisé en ce que ledit groupe cible correspond à celui pour lequel le cumul de l’histogramme initial des imposteurs (I_G2, ) est le plus élevé.

[Revendication 10] Procédé de reconnaissance biométrique selon l’une quelconque des revendications précédentes caractérisé en ce que l’étape de génération (E GEN) comprend des sous-étapes de :

- définition d’une fonction de coût (F coût) pour ledit groupe, (Gi, G2) notamment ladite fonction coût dudit groupe dépend de :

- variances par colonne et ;

- d’une divergence Jensen- Shannon (JS) entre l’histogramme initial des imposteurs dudit groupe (I_GI) et l’histogramme initial des imposteurs du groupe cible (I_G2) et ;

- d’une divergence Jensen-Shannon (JS) entre l’histogramme initial des utilisateurs légitimes dudit groupe (U_GI, ) et l’histogramme initial des utilisateurs légitimes du groupe cible (U_G2, ) ;

- calcul du minimum de ladite fonction coût (F coût) dudit groupe par mise en œuvre d'une méthode d’optimisation par apprentissage, notamment une méthode de descente de gradient ou une méthode de recuit simulé ou une méthode de Levenberg-Marquardt, de manière à déterminer la fonction (PDFTi, PDFT2 ) de densité de probabilité de transition dudit groupe.

[Revendication 11] Procédé de reconnaissance biométrique selon l’une quelconque des revendications 7 à 8 dans leur dépendance à la revendication 4 caractérisé en ce que l’étape de génération (E GEN) de la matrice de transition par groupe (Gi, G2) est réalisée analytiquement, et comprend des sous-étapes de :

- alignement de l’histogramme initial des imposteurs dudit groupe (I_GI) sur l’histogramme initial des imposteurs dudit groupe cible (I_G2 ) résultant en un histogramme source aligné des imposteurs et un histogramme source modifié des utilisateurs légitimes;

- calcul itératif d’une matrice (M) des mouvements possibles entre deux index (j,k) , formant un couples d’index, de la matrice de transition, chaque index désignant des intervalles de scores de similarité et de reconnaissance de la matrice de transition, pour tous les couples d’index, ladite matrice des mouvements possibles (M) déterminant à partir de l’histogramme source modifié des utilisateurs légitimes la quantité maximale d’utilisateurs légitimes déplaçable entre lesdits intervalles correspondant audits index du couple sans que la quantité d’imposteur change dans 1’ histogramme source aligné des imposteurs, c’est-à-dire en compensant la quantité d’imposteurs déplacée, de manière à déterminer la matrice de transition dudit groupe.

[Revendication 12] Procédé de reconnaissance biométrique selon l’une quelconque des revendications 5 à 11 caractérisé en ce que l’étape de détermination d’un score de reconnaissance (SRc) de ladite donnée biométrique candidate (DBc) est réalisée par tirage aléatoire d’un nombre avec la fonction (PDFTi,c) de densité de probabilité contenue dans la colonne correspondant à l’intervalle de scores comprenant le score de similarité de ladite donnée biométrique candidate (DBc), le nombre tiré parmi ladite colonne appartenant à un intervalle de score de reconnaissance correspondant à une ligne de ladite colonne et le score de reconnaissance (SRc) de ladite donnée biométrique candidate étant défini dans l’intervalle de scores de reconnaissance correspondant à ladite ligne.

[Revendication 13] Procédé de reconnaissance biométrique selon l’une quelconque des revendications précédentes caractérisé en ce que les groupes (Gi, G2) définissent des catégories de populations en fonction de facteurs démographiques et/ou sociaux.

[Revendication 14] Procédé de reconnaissance biométrique selon l’une quelconque des revendications précédentes caractérisé en ce que les données biométriques d’apprentissage (DBA, , DBAj , DBAk) et/ou candidates (DBc) et/ou de référence (DBR) sont extraites d’images faciales ou d’images d’empreintes ou d’images de veines ou d’images d’iris ou d’enregistrements vocaux.

[Revendication 15] Dispositif de reconnaissance biométrique, ledit dispositif étant apte à mettre en œuvre le procédé de reconnaissance biométrique selon l’une quelconque des revendications 1 à 14.