WO2011055224A1

WO2011055224A1 - Dispositif et procede de detection et suivi des contours interieur et exterieur des levres

Info

Publication number: WO2011055224A1
Application number: PCT/IB2010/002826
Authority: WO
Inventors: Sébastien STILLITTANO; Alice Caplier; Pierre-Yves Coulon
Original assignee: Vesalis; Institut Polytechnique De Grenoble
Priority date: 2009-11-06
Filing date: 2010-11-05
Publication date: 2011-05-12

Abstract

Dispositif de détection du contour intérieur des lèvres d'une bouche humaine à partir d'une image numérique, comportant : un module d'extraction de contour extérieur permettant d'extraire le contour extérieur des lèvres à partir d'une image d'un visage ou d'une bouche; un module d'extraction de contour intérieur permettant d'extraire le contour intérieur des lèvres à partir d'une image d'un visage ou d'une bouche; un module de test de condition de bouche ouverte, susceptible d'effectuer un test afin de déterminer des conditions selon lesquelles la bouche est ouverte; chacun des modules d'extraction de contour extérieur et intérieur comprenant : un module de détection de points clés, susceptible de détecter au moins deux points clés du contour interne des lèvres; un module de génération de courbes paramétriques, susceptible de déterminer des courbes paramétriques permettant de définir le contour entre lesdits points clés; un module d'optimisation, susceptible d'optimiser des modèles paramétriques en fonction de critères donnés.

Description

DISPOSITIF ET PROCEDE DE DETECTION ET SUIVI DES CONTOURS INTERIEUR ET EXTERIEUR DES LEVRES

DOMAINE TECHNIQUE DE L'INVENTION

[0001] L'invention concerne la segmentation des lèvres pour des images statiques et des séquences vidéo, et en particulier la détection du contour intérieur d'une bouche humaine.

ETAT DE LA TECHNIQUE ANTERIEURE

[0002] L'extraction des contours des lèvres reste une tâche ardue et différentes approches ont été proposées dans la littérature lors des vingt dernières années sans résoudre complètement le problème. La difficulté de la segmentation s'explique par plusieurs raisons :

[0003] La bouche est une composante faciale hautement déformable. Suivant l'ouverture de la bouche (fermée, ouverte), les contours des lèvres varient beaucoup. La méthode de segmentation doit prendre en compte l'ensemble des déformations possibles.

[0004] L'apparence autour de la bouche peut être modifiée par la présence de moustaches ou d'une barbe.

[0005] La bouche peut être partiellement ou complètement occultée par des moustaches ou par un objet.

[0006] Les variations d'illumination peuvent affecter la détection en modifiant l'apparence autour et sur les lèvres. Une partie de la lèvre inférieure peut être surexposée ou plus brillante si la lumière vient de dessus. La peau située juste en dessous de la bouche peut être également plus ou moins sombre suivant la direction de la lumière.

[0007] La segmentation du contour labial interne est une tâche difficile à cause de la non linéarité du problème. L'aspect du contour interne et l'apparence de l'intérieur de la bouche peuvent varier brutalement suivant que la bouche est ouverte ou fermée, et suivant la visibilité des dents, des gencives, de la langue ou de la cavité orale.

EXPOSE DE L'INVENTION

[0008] Pour éviter de se retrouver dans un tel contexte, et notamment pour améliorer la segmentation du contour des lèvres d'une bouche à partir d'une image numérique, l'invention prévoit différents moyens techniques.

[0009]Tout d'abord, un premier objet de l'invention consiste à prévoir un procédé de détection du contour intérieur des lèvres susceptible de prendre en compte les cas où la bouche est ouverte et ceux où la bouche est fermée.

[0010] Un autre objet de l'invention consiste à prévoir un dispositif de détection du contour intérieur des lèvres susceptible de prendre en compte ces deux mêmes cas.

[0011] Pour ce faire, l'invention prévoit tout d'abord un procédé de détection du contour intérieur des lèvres d'une bouche humaine à partir d'une image numérique, comportant les étapes consistant à :

- obtenir une première image des lèvres pour lesquelles la détection du contour est prévue ;

- extraire le contour extérieur des lèvres à l'aide d'un modèle paramétrique de contour extérieur ;

- détecter au moins deux points clés du contour interne des lèvres;

- déterminer des courbes paramétriques permettant de définir le contour entre lesdits points clés ;

- optimiser le modèle paramétrique interne en fonction des critères inhérents à une bouche ouverte ;

- effectuer un test afin de déterminer si la bouche est ouverte.

[0012] Les modèles paramétriques sont des modèles déformables qui évoluent vers les contours de l'objet d'intérêt à l'aide d'un calcul de minimisation d'énergie et en utilisant des connaissances à priori sur la forme globale de l'objet à extraire. Les principaux avantages des modèles paramétriques sont les contraintes géométriques qui imposent un assortiment de formes admissibles pour le résultat de la segmentation. Ceci permet d'éviter des déformations trop libres et le contour obtenu après convergence est cohérent avec le modèle prédéfini.

[0013] Selon un mode de réalisation avantageux, le modèle paramétrique de contour extérieur comporte au moins quatre courbes cubiques, soit deux de chaque côté de la bouche, définissant les contours supérieurs (γ1 , γ2) et inférieurs (γ3, γ4) à partir des commissures des lèvres.

[0014] En outre, les contraintes sur les dérivées des courbes cubiques permettent de réduire le nombre de paramètres à estimer lors de la phase d'optimisation du modèle.

[0015] Ce modèle a l'avantage de fournir une description précise du contour extérieur des lèvres, sans être trop complexe (connaissant pour chaque cubique les deux points d'extrémité et une valeur de dérivée, il ne reste plus qu'un seul paramètre à déterminer). De plus, ce modèle est assez flexible pour représenter des formes très variées de bouche. Entre autre, aucune symétrie du modèle n'est imposée.

[0016] Les deux points clés du contour interne des lèvres sont de préférence les points médiants des contours intérieurs supérieurs (P8) et inférieur (P10).

[0017] Selon un autre mode de réalisation avantageux, l'optimisation du modèle paramétrique interne est obtenue par détermination de gradients (G1 , G2, G3, G4) susceptibles d'accentuer les contours des lèvres.

[0018] Selon une variante avantageuse, le test de détection de bouche ouverte comprend une étape de comparaison des positions relatives des snakes inférieurs et supérieurs pour vérifier si le snake supérieur s'arrête au dessus du snake inférieur, et si la région définie entre les 2 snakes est plus grande qu'un seuil prédéfini. Dans un exemple de réalisation, le seuil est de 10 pixels. [0019] Un jumping snake sert avant tout à trouver des points clefs pour initialiser les différents modèles paramétriques des lèvres. Quatre différents jumping snakes sont de préférence pris en compte :

• un snake extérieur supérieur pour le contour extérieur supérieur des lèvres,

• un snake extérieur inférieur pour le contour extérieur inférieur des lèvres,

• un snake intérieur supérieur pour le contour intérieur supérieur des lèvres,

• un snake intérieur inférieur pour le contour intérieur inférieur des lèvres.

[0020] Selon une autre variante de réalisation, si la bouche est fermée, on détecte un point clé interne défini en fonction d'une bouche fermée :

- on détermine au moins une courbe paramétrique permettant de définir le contour interne;

- on optimise le modèle paramétrique interne en fonction des critères inhérents à une bouche fermée.

[0021] Selon encore un autre mode de réalisation, le procédé de détection du contour intérieur des lèvres d'une bouche humaine à partir d'une image numérique, comporte des étapes de suivi dynamique consistant à :

- obtenir une première image des lèvres pour lesquelles le suivi est prévu à un temps donné (t);

- détecter les points clés du contour externe des lèvres;

- détecter les points clés du contour interne des lèvres ;

- déterminer des courbes paramétriques permettant de définir le contour entre lesdits points clés;

- obtenir une autre image des lèvres à un intervalle de temps t+1 ;

- comparer les positions des points clés externes suivis de l'image à t+1 aux positions correspondantes de ces points clés pour l'image précédente (t);

- effectuer un test de réinitialisation ;

- si les résultats du test de réinitialisation sont positifs, effectuer une étape de réinitialisation. [0022] Dans une variante, si les résultats du test de réinitialisation sont négatifs, on poursuit le suivi avec l'obtention d'une autre image à l'intervalle de temps suivant et répéter les étapes de comparaison jusqu'à ce que la période de suivi soit terminée.

[0023] L'invention prévoit également un dispositif de détection du contour intérieur des lèvres d'une bouche humaine à partir d'une image numérique, comportant :

- un module d'extraction de contour extérieur permettant d'extraire le contour extérieur des lèvres à partir d'une image d'un visage ou d'une bouche ;

- un module d'extraction de contour intérieur permettant d'extraire le contour intérieur des lèvres à partir d'une image d'un visage ou d'une bouche ;

- un module de test de condition de bouche ouverte, susceptible d'effectuer un test afin de déterminer des conditions selon lesquelles la bouche est ouverte ;

- chacun des modules d'extraction de contour extérieur et intérieur comprenant :

- un module de détection de points clés, susceptible de détecter au moins deux points clés du contour interne des lèvres ;

- un module de génération de courbes paramétriques, susceptible de déterminer des courbes paramétriques permettant de définir le contour entre lesdits points clés ;

- un module d'optimisation, susceptible d'optimiser des modèles paramétriques en fonction de critères donnés.

[0024] Dans une variante avantageuse, le dispositif comprend par ailleurs un module d'obtention d'images, permettant d'obtenir au moins une première image des lèvres pour lesquelles la détection du contour est prévue.

DESCRIPTION DES FIGURES

[0025] Tous les détails de réalisation sont donnés dans la description qui suit, complétée par les figures 1 à 22, présentées uniquement à des fins d'exemples non limitatifs, dans lesquelles des références identiques indiquent des éléments similaires, et dans lesquelles : - les Figures 1A, 1B, 1C, 1 D et 1 E présentent des images de différents cas de bouches ouvertes afin d'illustrer les difficultés de non linéarité inhérents aux nombreux cas possibles ;

- les Figures 2A, 2B et 2C présentent les éléments clés des modèles paramétriques utilisés ;

- les Figures 3A et 3B illustrent le principe du jumping snake ;

- la Figure 4A montre schématiquement la forme réelle des lèvres et les gradients utilisés pour chaque élément du contour ;

- la Figure 4B montre schématiquement la forme en losange des lèvres et les filtres appliqués sur les différentes zones ;

- la Figure 5 est un organigramme fonctionnel montrant les étapes clés du procédé de segmentation avec les étapes éventuelles de suivi ;

- la Figure 6 illustre une boîte englobante ;

- la Figure 7A est une image d'une bouche à traiter ;

- la Figure 7B montre des tests de pixels candidats aux commissures ;

- la Figure 7C montre la détection des points clés Pi et P5 ;

- la Figure 8 est un organigramme fonctionnel présentant les principales étapes du procédé de détection du contour selon l'invention ;

- la Figure 9 montre la détection des points clés P₈ et P ₀ ;

- la Figure 10A est une image avec masque des dents ;

- la Figure 10B montre le snake correspondant ;

- la Figure 10C montre l'ajustement des points du snake en présence des dents ;

- les Figures 11A et 11 B montrent les ajustements des snakes intérieurs supérieurs en présence des gencives ;

- les Figures 12A, 12B et 12C illustrent la détection des commissures internes ;

- les Figures 13A, 13B et 13C montrent la vérification de l'hypothèse bouche ouverte ;

- les Figures 14A, 14B et 14C montrent la segmentation du contour intérieur avec la bouche fermée ;

- les Figures 15A, 15B, et 15C présentent la déformation du modèle extérieur de l'image précédente (t-1 ) à l'image courante (t), avec le résultat de l'image précédente en 15A, la déformation de γ1 en 15B, et le modèle extérieur déformé en 15C ;

- les Figures 16A et 16B montrent l'ajustement des commissures externes, avec le test des candidats en 16A et les commissures ajustées en 16B ;

- les Figures 17A, 17B et 17C montrent l'ajustement des points clés externes, avec le modèle extérieur déformé en 17A, le snake supérieur initial en 17B et la convergence du snake avec recalage des points P₂ et P₄ en 17C ;

- la Figure 18 illustre une réinitialisation du suivi au cours d'une séquence, avec des images sans réinitialisation (images du haut) et avec réinitialisation (images du bas) ;

- les Figures 19A et 19B illustrent l'optimisation du modèle extérieur, avec variation des pentes au niveau des commissures extérieures en 19A et les cubiques extérieures finales en 19B ;

- les Figures 20A et 20B illustrent l'optimisation du modèle intérieur bouche ouverte avec variation des pentes au niveau des commissures extérieures en 20A et les cubiques intérieures finales en 20B ;

- la Figure 21 est une représentation schématique du dispositif de détection de contour des lèvres selon l'invention avec les principaux modules intervenant lors de la mise en œuvre ;

- la Figure 22 est une représentation schématique du dispositif de détection de contour des lèvres selon l'invention lors de sa mise en œuvre illustrant l'obtention des multiples données paramétriques à partir des données d'images numériques de bouche à traiter.

DESCRIPTION DETAILLEE DE L'INVENTION

[0026] Tel que montré à la Figure 1 , lorsque la bouche est ouverte, le contour intérieur des lèvres peut prendre différents aspects et être défini comme étant la frontière entre la lèvre supérieure et la lèvre inférieure (Figure 1A), la lèvre et les dents (Figure 1 B), la lèvre et les gencives (Figure 1C), la lèvre et la langue (Figure 1D) et la lèvre et la cavité orale (Figure 1E). Toutes ces configurations font que le contour intérieur peut avoir des propriétés différentes et la méthode de segmentation doit pouvoir trouver le bon contour dans chaque cas de figure. Les outils de segmentation

[0027] Pour un procédé de segmentation et de suivi des contours extérieur et intérieur des lèvres qui soit à la fois précis et rapide, les modèles déformables et une approche basée contour sont considérés. Le procédé englobe une approche mixte, qui utilise à la fois les modèles paramétriques et les contours actifs.

Les modèles paramétriques

[0028] Les modèles paramétriques sont des modèles déformables qui évoluent vers les contours de l'objet d'intérêt à l'aide d'un calcul de minimisation d'énergie et en utilisant des connaissances à priori sur la forme globale de l'objet à extraire. L'énergie est composée d'un terme interne et d'un terme externe. L'utilisation des modèles paramétriques requiert la définition du modèle (choix des courbes paramétrées) en fonction de la forme de l'objet d'intérêt. Le choix du modèle est un compromis entre la liberté de déformation souhaitée et la complexité algorithmique. Les algorithmes basés sur les modèles paramétriques pour l'analyse labiale nécessitent la définition de trois étapes: le choix du modèle pour la description des contours, l'initialisation et l'optimisation du modèle prenant en compte des informations appropriées et calculées à partir de l'image.

Les modèles paramétriques des lèvres

[0029] Le procédé de détection utilise de préférence un modèle paramétrique pour le contour extérieur des lèvres, montré à la Figure 2A, et deux modèles paramétriques pour le contour intérieur (bouche ouverte montré à la Figurer 2B et bouche fermée montré à la Figure 2C)

Modèle paramétrique pour le contour extérieur

[0030] Le modèle paramétrique utilisé pour le contour extérieur (Figure 2A) est composé d'une ligne brisée et de 4 cubiques reliées par 6 points clefs Pi à Pe- Pi et P₅ sont les coins extérieurs de la bouche, appelés également commissures des lèvres. P2, P3 et P4 définissent l'arc de Cupidon, qui est la forme en « V » visible au milieu du contour supérieur de la bouche. P₆ est le point bas du contour extérieur se trouvant sur la verticale passant par P₃.

[0031] En plus des 2 segments [P2P3] et [P3P4], 4 courbes cubiques complètent le modèle extérieur :

• γι entre Pi et P2 pour le contour extérieur supérieur gauche,

• 72 entre P₄ et P₅ pour le contour extérieur supérieur droit,

• Y3 entre Pe et P5 pour le contour extérieur inférieur droit,

• y₄ entre P-i et Pe pour le contour extérieur inférieur gauche.

[0032]Ainsi, le contour extérieur supérieur est défini par les courbes γι, γ₂, et par la ligne brisée [P2P3P4], alors que le contour extérieur inférieur est défini par les courbes γ₃ et γ₄.

[0033] En prenant en considération la forme particulière du contour extérieur, on obtient les contraintes suivantes :

• une dérivée nulle pour la cubique γι au point P2,

• une dérivée nulle pour la cubique γ∑ au point P4,

• une dérivée nulle pour les cubiques }¾ et γ4 au point Pe-

[0034] En outre, ces contraintes sur les dérivées des courbes cubiques permettent de réduire le nombre de paramètres à estimer lors de la phase d'optimisation du modèle.

[0035] Ce modèle a l'avantage de fournir une description précise du contour extérieur des lèvres, sans être trop complexe (connaissant pour chaque cubique les deux points d'extrémité et une valeur de dérivée, il ne reste plus qu'un seul paramètre à déterminer). De plus, ce modèle est assez flexible pour représenter des formes très variées de bouche. Entre autre, aucune symétrie du modèle n'est imposée.

Modèles paramétriques pour le contour intérieur

Cas bouche ouverte [0036] Lorsque la bouche est ouverte, le contour intérieur (Figure 2B) est défini par 4 cubiques reliées par 4 points clefs. Pg et P10 sont les points milieu du contour intérieur supérieur et inférieur situés sur la verticale passant par P3. P3 étant le point milieu de l'arc de Cupidon, la verticale passant par P3 représente effectivement le milieu de la bouche. P₇ et Pg sont les commissures internes de la bouche. Le choix de différencier les commissures est du au fait qu'en cas de mouvements labiaux de type protrusion, les commissures internes et externes diffèrent. Cela permet également une segmentation plus fine lorsque la bouche est légèrement ouverte.

[0037] Le modèle du contour intérieur pour une bouche ouverte est complété par 4 cubiques :

• Y5 entre Pr et Pe pour le contour intérieur supérieur gauche,

• γβ entre Pa et Pg pour le contour intérieur supérieur droit,

• γγ entre P10 et Pg pour le contour intérieur inférieur droit,

• Y8 entre P7 et Pw pour le contour intérieur inférieur gauche.

[0038] Le contour interne supérieur est défini par les 2 cubiques >¾ et }¾. Le contour interne inférieur est défini par les 2 cubiques jv et γ₈. Par ailleurs, on pose les hypothèses supplémentaires suivantes :

• une dérivée nulle pour les cubiques )¾ et γβ au point Pe,

• une dérivée nulle pour les cubiques γ₇ et }¾ au point Pw.

[0039] Ce modèle permet une représentation précise et flexible du contour intérieur des lèvres quand la bouche est ouverte. Chaque cubique étant défini par 2 points et une valeur de dérivée, il reste un seul paramètre par cubique à estimer.

Cas bouche fermée

[0040] Lorsque la bouche est fermée, le modèle du contour intérieur (Figure 2C) est composé de 2 cubiques reliées par 1 seul point clef Pu. Pu est le point milieu du contour intérieur. Pour une bouche fermée, on considère que les commissures internes sont les mêmes que les commissures externes

et PSFPS)- Le choix effectué permet une transition simple du modèle bouche ouverte/bouche fermée en cas de segmentation d'une séquence vidéo.

[0041] Le modèle du contour intérieur pour une bouche fermée est complété par 2 cubiques :

• Y9 entre Pi et Pu pour le contour intérieur gauche,

• γ₁₀ entre Pu et P₅ pour le contour intérieur droit.

[0042] Comme base supplémentaires, on considère une dérivée nulle pour les cubiques yg et y au point Pu.

Les contours actifs

[0043] Les contours actifs, introduits par Kass et al. dans le document : M. Kass, A. Witkin and D. Terzopoulos, Snakes: Active Contour Models, International Journal of Computer Vision, vol. 1 (4), pp. 321-331 , 1987., sont communément appelés « snake » à cause de leur manière d'onduler comme un serpent durant leur déformation. Les snakes sont composés d'une série de points mobiles placés sur une courbe 2D. Selon l'application, la courbe peut être fermée ou non, avec des extrémités fixes ou non. Les contours actifs évoluent de manière itérative d'une position initiale jusqu'à leur position finale, en étant attirés par le minimum local le plus proche de la fonctionnelle d'énergie. La méthode de minimisation est commandée par des contraintes et elle est contrôlée par les données saillantes de l'image. Les contours actifs sont largement utilisés pour des applications de détection de contours, du fait de leur capacité à intégrer les deux étapes d'extraction et de chaînage en une seule opération. Les snakes peuvent être utilisés aussi bien pour des contours ouverts que pour des contours fermés ou des contours avec des extrémités fixes. Les contours actifs sont rapides et simples à implémenter en 2D.

LE JUMPING SNAKE

[0044] Le contour actif utilisé pour la segmentation labiale est le jumping snake, à savoir un contour actif qui converge en une succession de phases de saut et de croissance. Il est défini par un assortiment de points qui forment une ligne brisée. Les Figures 3A et 3B illustrent le principe de l'algorithme pour le contour extérieur supérieur des lèvres. Il est tout d'abord initialisé par un germe S⁰. Ensuite, lors de la phase de croissance, des points sont ajoutés de part et d'autre du snake. Chaque point est trouvé en maximisant des flux moyens de gradients à travers les segments formés par le point candidat courant et le point précédent. Lorsque le snake atteint un nombre prédéterminé de points (2N+1), la croissance s'arrête. Finalement, le germe saute sur une nouvelle position S¹ plus proche du contour recherché. Le processus de croissances et de sauts est répété jusqu'à ce que l'amplitude du saut du germe soit inférieure à un pixel. A l'itération finale, le snake est positionné sur le contour extérieur supérieur des lèvres.

[0045] Contrairement aux contours actifs classiques, l'initialisation (la position du germe) peut être relativement loin du contour recherché et le choix des paramètres du jumping snake est facile et intuitif. Les paramètres principaux sont la distance horizontale Δ entre chaque point du snake et N qui donne le nombre de point du snake (2N+1). Le choix de Δ et N est un compromis entre vitesse et précision. D'autres paramètres permettent de forcer le jumping snake à se diriger vers le haut ou vers le bas.

[0046] Un jumping snake sert avant tout à trouver des points clefs pour initialiser les différents modèles paramétriques des lèvres. Quatre différents jumping snakes sont pris en compte :

• un snake intérieur inférieur pour le contour intérieur inférieur des lèvres. Les espaces couleurs et gradients utilisés

[0047] Des gradients sont avantageusement construits pour accentuer le contour des lèvres. Ces gradients sont utilisés d'une part pour la convergence de différents jumping snakes et d'autre part, pour l'optimisation des modèles paramétriques.

LES ESPACES COULEURS

[0048] Pour le calcul des gradients, différents espaces couleurs peuvent être utilisés, tels que : RGB, YCbCr, CIELuv. Deux autres composantes appelées pseudo-teintes, respectivement Hi et H₂ sont utilisées. Les pseudo-teintes permettent d'augmenter le contraste entre les lèvres et la peau et elles sont calculées de la manière suivante :

Où R et G sont les composantes rouge et verte de l'espace RGB.

LES GRADIENTS

[0049] Par la suite, cinq gradients permettent d'accentuer les contours des lèvres. Ces gradients sont définis par les équations suivantes :

G, = V [//, -Z] (Eq. l)

G₁ = V [-H_l -{R - G + B (Eq.2)

G₃ = V [R -u - H₂ -L] (Eq.3)

G₄ = V [uxL] (Eq. 4)

G₅ = V [Cr + /?] (Eq. 5)

Où V est l'opérateur gradient et x est l'opérateur de multiplication élément par élément. H-i et H2 sont les pseudo-teintes. L est la luminance et u est une composante couleur issue de l'espace couleur CIELuv. R, G et B sont les composantes couleurs de l'espace RGB. Cr est une composante couleur issue de l'espace YCbCr.

Les gradients G1 et G₂ pour le contour extérieur des lèvres

Le gradient G1 pour le contour extérieur supérieur [0050] Pour accentuer le contour extérieur supérieur, nous utilisons le gradient hybride, noté Gi, calculé avec l'équation 1. Le gradient Gi est utilisé pour le contour extérieur supérieur car la pseudo-teinte H₁ augmente le contraste entre la lèvre supérieure et la peau située au dessus de la bouche. Le signe + de l'équation 1 vient du fait que les valeurs de Hi sont plus faibles pour la peau que pour la lèvre supérieure (située en dessous). De plus, généralement, la lumière vient d'en haut. Ainsi, la frontière supérieure de la bouche est une zone de forte luminance, alors que le haut de la lèvre supérieure est plus sombre (d'où le signe - devant la luminance dans l'équation 1 ).

Le gradient G₂ pour le contour extérieur inférieur

[0051]Le gradient G_∑ utilise également la pseudo-teinte H1, mais aussi les composantes de l'espace RGB (cf. Eq. 2).

[0052] De la même façon, Hi est utilisée pour sa capacité à faire ressortir les lèvres par rapport à la peau. Le signe + de l'équation 2 devant Hi vient du fait que les valeurs de Hi sont plus fortes pour la lèvre inférieure que pour la peau qui se trouve en dessous. La somme R-G+B est une combinaison qui permet d'accentuer les lèvres, d'où le même signe - devant cette somme.

Les gradients G₃ et G₄ pour le contour intérieur des lèvres :

[0053] Pour le contour intérieur, la construction de gradient est complexe. En effet, le contour extérieur est toujours une frontière entre des lèvres et de la peau. Le contour extérieur supérieur sépare la peau, située entre le nez et la bouche, et la lèvre supérieure. Le contour extérieur inférieur sépare la peau, située sous la bouche, et la lèvre inférieure.

[0054] En revanche, pour le contour intérieur, la frontière se situe entre des lèvres et une des 4 possibilités suivantes: dents, gencives, langue ou cavité orale. De plus, il faut que le contour soit prononcé pour tous les cas possibles, car durant une conversation, la variation d'apparence de l'intérieur de la bouche est non linéaire et nous pouvons avoir des transitions brutales entre ces configurations. Après expérimentation sur plusieurs centaines d'images, il a été constaté qu'il est pratiquement impossible de trouver une composante d'un espace couleur permettant d'obtenir un gradient efficace pour toutes ces configurations. Ainsi, des gradients intérieurs sont la combinaison de plusieurs composantes différentes appropriées dans un des cas possibles.

Le gradient G₃ pour le contour intérieur supérieur

[0055] Le gradient G3 (cf. Eq. 3 et Figure 4A) est basé sur le fait que :

• la composante R peut être plus faible pour les pixels de la lèvre supérieure que pour l'intérieur de la bouche (d'où le signe + de l'équation 3),

• les valeurs de la pseudo-teinte H₂ sont plus fortes pour les pixels de la lèvre supérieure que pour l'intérieur de la bouche (d'où le signe -),

• la composante u est plus grande pour les pixels de la lèvre supérieure que pour des pixels « dent » situés en dessous. En effet u est proche de 0 pour les dents (d'où le signe - devant la composante u),

• la luminance L a, généralement, des valeurs plus grandes pour les pixels de la lèvre supérieure que pour l'intérieur de la bouche (d'où le signe -). En général, l'intérieur de la bouche est sombre, excepté en cas de présence de dents (mais cela est comblé par l'apport de la composante

Le gradient G₄pour le contour intérieur inférieur

[0056] Le gradient G₄ (cf. Eq. 4 et Figure 4A) est basé sur le fait que :

• la composante u est plus grande pour des pixels « lèvre » que pour des pixels « dent » (en effet u est proche de 0 pour les dents).

• la luminance L a, généralement, des valeurs plus grandes pour des pixels « lèvre » que pour l'intérieur de la bouche.

Le gradient G₅ :

[0057] Le gradient G5 est utilisé pour un cas particulier qui est la présence des gencives et il permet d'accentuer la frontière entre la lèvre et les gencives. G5 a été construit en considérant que les valeurs des composantes couleurs Cr, issue de l'espace YCbCr, et R sont plus faibles pour la lèvre supérieure que pour les gencives situées en dessous (d'où les signes +).

FILTRES UTILISES POUR LE CALCUL DES GRADIENTS

[0058] Dans des modes de réalisation connus, seule la composante horizontale des gradients est utilisée dans le contexte de la segmentation des lèvres, dans la mesure où c'est la composante prédominante, compte tenu de la forme particulière de la bouche (les contours sont essentiellement horizontaux).

[0059] Selon le procédé, en plus des composantes horizontales, des filtres 2D permettent de calculer une composante diagonale, du fait que les contours intérieur et extérieur des lèvres peuvent être assimilés à 2 losanges, tel que montré à la Figure 4B).

Les 3 filtres utilisés sont les filtres F1, F∑ et F3 suivants :

-2 -1 0 -1 -2 -1

-1 0 1 F, = 0 0 0

0 1 2 1 2 1

(Eq.6)

0 -1 -2

1 0 -1

2 1 0

[0060] Ces filtres (et leurs opposés) permettent d'intensifier la composante diagonale des gradients G-i, G2, G3 et G₄ suivant le côté de la bouche que l'on traite.

Segmentation et suivi du contour des lèvres

[0061] La figure 5 présente, de façon successive, les principales étapes du procédé selon l'invention, en mode statique et en mode dynamique. On y voit un exemple de processus global de segmentation et de suivi des contours des lèvres. Le mode statique peut être appliqué à une image statique ou à la première image d'une séquence vidéo. L'algorithme statique est composé de 3 phases (100, 110, et 120). Tout d'abord, le visage est détecté (étape 100), ensuite une boîte encadrant la bouche est déterminée pour générer une région d'intérêt et réduire le coût de calcul (étape 110). Finalement, les contours intérieur et extérieur des lèvres sont extraits de l'image (étape 120). Le mode suivi concerne le suivi des contours labiaux dans des séquences vidéo et l'algorithme dynamique appliqué aux images suivantes. L'algorithme dynamique est composé de 4 phases (200, 210, 220 et 230). Premièrement, plusieurs points clefs (étape 200) sont suivis. Ensuite, suivant le résultat du suivi de points clefs, il peut être nécessaire de faire une réinitialisation du suivi des contours des lèvres dans la séquence (étape 210). Finalement, soit on utilise de nouveau l'algorithme statique (étapes 100, 110, 120) en cas de réinitialisation, soit la boîte englobante de la bouche (étape 220) et les contours labiaux (étape 230) sont suivis.

Segmentation statique

[0062] L'approche statique est constituée de 3 phases et est appliquée soit pour des images statiques, soit pour la première image d'une séquence.

INITIALISATION DE L'ALGORITHME STATIQUE (Figure 5 : étapes 100 et 110)

[0063] La première étape d'une segmentation est la recherche d'une zone d'intérêt pour réduire la zone de recherche des contours. De plus, cela permet de diminuer les coûts de calcul liés au traitement d'image (calcul des espaces couleurs, des gradients...). Dans le contexte de la détection des contours des lèvres, il faut tout d'abord localiser le visage et ensuite se focaliser sur la bouche.

[0064] Dans le mode de réalisation illustré, la détection du visage (Etape 100) est de préférence réalisée à l'aide de l'algorithme C3F. Cette approche basée sur des réseaux de neurones convolutionnels permet également de donner la position des centres des yeux, du centre du nez et du centre de la bouche. A partir de ces points, il est facile de trouver une boîte encadrant la bouche (Etape 1 10) car celle-ci n'a pas besoin d'être très précise, mais elle doit contenir entièrement la bouche. En effet, la boîte sert pour la suite du procédé, à limiter la recherche des contours et à définir la position des 2 germes pour le jumping snake extérieur supérieur et le jumping snake extérieur inférieur. Or, ces germes ne sont soumis qu'à peu de contraintes pour leur positionnement; ils doivent être situés plus proche de la bouche que du nez ou du menton.

DETECTION DES CONTOURS EXTERIEUR ET INTERIEUR (Figure 5: étape 120)

[0065]Pour la segmentation du contour extérieur et la segmentation du contour intérieur, les jumping snakes et les modèles paramétriques sont combinés. Dans les deux cas, les jumping snakes sont utilisés dans l'étape d'initialisation (détection de la position des points clefs externes et internes), alors que les modèles paramétriques ont été construits pour modéliser le contour labial (l'optimisation des modèles permet d'extraire les contours des lèvres).

Détection du contour extérieur

[0066] La méthode d'extraction du contour extérieur est une amélioration d'un algorithme développé par Eveno et présentée dans le document N. Eveno, A. Caplier, P.Y. Coulon, Automatic and Accurate Lip Tracking, in IEEE Trans. on Circuits and Systems for Video Technology, vol. 14, no 5, pp. 706-715, 2004. En effet, d'une part, l'obtention du contour extérieur est réalisée de manière automatique, alors que dans l'approche Eveno un germe doit être placé manuellement au dessus de la bouche. D'autre part, un deuxième snake est ajouté, pour une détection plus robuste du point Pe-

[0067] Le modèle paramétrique extérieur est composé de 6 points clefs

à e- Les points P∑, P3, P* et P& peuvent être localisés directement en faisant converger 2 jumping snakes. Les commissures extérieures des lèvres (Pi et P5) sont plus difficiles à détecter localement; elles seront déterminées en même temps que le calcul des courbes du modèle. [0068] Un jumping snake extérieur supérieur est utilisé pour les points extérieurs hauts P2, P3 et P4, alors qu'un jumping snake extérieur inférieur sert à trouver P&. Tel que mentionné précédemment, l'algorithme jumping snake est initialisé par un seul point (le germe). La boîte englobante de la bouche trouvée précédemment (Etape 110) permet d'initialiser ces 2 snakes. Les 2 germes sont choisis comme étant les points milieux des côtés haut et bas de la boîte englobante.

• Pour le snake supérieur : les paramètres sont réglés de façon à ce que le snake se propage en dessous du germe supérieur et le gradient G1 (cf. Eq. 1) est utilisé pour sa convergence.

• Pour le snake inférieur : les paramètres sont réglés de façon à ce que le snake se propage en dessus du germe inférieur et le gradient G_∑ (cf. Eq. 2) est utilisé pour sa convergence.

[0069] Une fois que les 2 snakes ont convergé, des points sont obtenus sur les contours extérieurs supérieur et inférieur, tel que montré à la Figure 6. Le snake supérieur donne la position des 3 points de l'arc Cupidon. P∑ et P₄ sont les points les plus hauts du snake respectivement à gauche et à droite de la verticale passant par les 2 germes. P3 est le point du snake le plus bas situé entre P2 et P₄. Alors que le point P₆ est le point du snake inférieur le plus proche de la verticale passant par P₃.

[0070] Nous avons à ce stade la position de 4 points du modèle extérieur et les 2 segments [P2P3] et [P3P4]. Il reste à trouver les commissures (Pf et P₅) et à calculer les 4 cubiques γι, γ₂, γ3 et γ₄.

[0071] La détection des commissures est particulièrement délicate dans la mesure où elles ne sont pas vues comme 2 points mais plutôt comme une zone sombre située à chacune des extrémités de la bouche.

[0072] Lorsque cette commissure est vue de plus loin, il suffit de prolonger les frontières hautes et basses des lèvres pour trouver la commissure à l'intersection de ces 2 contours. En conséquence, le positionnement des commissures peut être directement lié aux allures des courbes représentant les contours des lèvres. Selon une approche avantageuse, il est possible de déterminer Pj et P₅, et calculer les 4 cubiques du modèle extérieur, en une seule et même opération.

[0073] Il suffit de quatre équations pour déterminer complètement la courbe polynomiale de degré trois. Dans la description du modèle paramétrique extérieur, il a été mentionné que les quatre cubiques yi, γ_∑, yz et )¾ relient les 6 points clefs externes P,=_{Î à} 6 et que pour le procédé prévu, les dérivées des cubiques s'annulent en P∑, P4 et P₆. En conséquence, pour chaque cubique, il est obtenu un des deux points d'extrémité (les positions de P₂, P4 et P₆ ont été trouvées à l'aide du jumping snake supérieur) et une contrainte d'annulation de dérivée, ce qui donne deux équations. En théorie, il suffit donc de connaître encore deux points appartenant à chaque cubique pour trouver la courbe.

[0074] Les deux jumping snakes extérieurs supérieur et inférieur fournissent des points supplémentaires. Les points des snakes sont fiables au milieu de la bouche, là où les contours sont les plus marqués et où les gradients sont donc plus forts. Alors qu'en se rapprochant des extrémités de la bouche, les points des snakes peuvent ne plus être exactement sur les contours si ceux-ci ne sont pas assez marqués. Ainsi, il n'est possible d'utiliser que les points proches des points clefs P_∑, P4 et P₆ et donc loin des commissures.

[0075] En utilisant deux points supplémentaires, les courbes cubiques peuvent être directement calculées avec maintenant quatre équations ou en utilisant la méthode des moindres carrés en utilisant trois points supplémentaires. Ces deux méthodes fournissent des résultats approximatifs pour les cubiques et la détection des commissures (aux intersections des cubiques), car on utilise des points trop éloignés des commissures. Aussi, en faisant varier, même légèrement, la position d'un des points, ces méthodes fournissent des résultats très différents.

[0076] Pour améliorer la détection, il est utile d'obtenir un point plus proche des commissures pour chacune des quatre cubiques. Pour cela, on suppose que les deux commissures Pi et P₅) sont connues. En utilisant la position des points clefs P_∑, P4 et Pe, les contraintes sur les dérivées, les points supplémentaires fournis par les snakes et la position des commissures, les cubiques sont calculées rapidement; la méthode des moindres carrés devenant une simple régression linéaire.

[0077] Le processus d'optimisation du modèle extérieur et de la détection des commissures est donc le suivant (voir Figures 7A, 7B et 7C):

- Plusieurs pixels candidats sont testés pour trouver les points j et P5

- Pour chacun des pixels candidats Pi (resp. P5), le couple de cubiques (γι et Y4) à gauche de la bouche (resp. le couple de cubique (γ∑ et )¾) à droite de la bouche) est calculé en utilisant les informations citées précédemment.

- Un critère de maximisation du flux moyen de gradient permet de déterminer le meilleur couple pour chaque côté de la bouche et de trouver P₁ et P₅.

[0078] La détermination des positions des commissures et l'optimisation du modèle peuvent donc être réalisées en une seule et même opération.

[0079] Pour limiter les ressources de calcul, il est souhaitable de pouvoir tester uniquement quelques pixels candidats; une recherche dans toute la boîte englobante de la bouche serait fastidieuse. En posant que les commissures se trouvent dans des zones sombres proches des lèvres, on peut ne tester que les pixels les plus sombres de la boîte englobante.

[0080] On établi ce que nous appelons ici la ligne des minima de luminance, notée Lmin, qui est un chaînage des pixels les plus sombres passant par la bouche. A partir d'un point initial, des points sont ajoutés à gauche et à droite en ne testant que les trois pixels les plus proches et en choisissant le pixel ayant la luminance la plus faible. Pour que L_min passe par la bouche et les deux commissures, le point initial est choisi comme étant le pixel le plus sombre du segment [P3P6].

[0081] En se limitant à cette ligne et en utilisant les bornes de la boîte, il est possible de ne tester plus que quelques dizaines de pixels (suivant la précision du résultat de la boîte englobante de la bouche). [0082]Après obtention des pixels candidats, les couples de cubiques {(γι, et (Υ2 et }¾)) sont calculés. Le critère contour permet de déterminer les meilleurs.

Le flux Φ à travers la cubique y, est :

où dn est le vecteur orthogonal au contour et ds est l'abscisse curviligne.

• Pour les cubiques γι et γ∑, le gradient Gj est utilisé

• Pour les cubiques >¾et γ , le gradient G∑ est utilisé

[0083] Pour chaque pixel candidat P₁ (resp. P₅), la somme Φ1+Φ4 (resp. Φ2+Φ3) est calculée et la somme la plus grande détermine les deuxcubiques du modèle et la position de la commissure. La figure 7 décrit le processus d'optimisation du modèle extérieur.

Détection du contour intérieur

[0084] La segmentation du contour intérieur, présentée à la Figure 8, est basée sur une approche similaire à la segmentation du contour extérieur : des points clefs internes sont détectés suite à la convergence d'un jumping snake pour positionner le modèle paramétrique intérieur et l'optimisation du modèle est réalisée à l'aide d'un critère contour. Il faut cependant déterminer quel modèle intérieur (parmi celui « bouche ouverte » ou celui « bouche fermée) est approprié pour l'image traitée.

Détection de l'état de la bouche

[0085]Avant de commencer l'extraction du contour intérieur, il est supposé que la bouche est ouverte et la segmentation est effectuée en utilisant le modèle paramétrique intérieur pour le cas d'une bouche ouverte (Figure 8 : étapes 500, 510, 520, 530 et 540). A la fin du processus, cette hypothèse est vérifiée (étape 550) et deux cas se distinguent : - La bouche est bien ouverte (Figure 8 : étape 600) : la segmentation du contour intérieur est alors terminée ;

- La bouche est fermée (Figure 8 : étape 700) : la segmentation est alors recommencée en utilisant le modèle paramétrique intérieur pour le cas d'une bouche fermée.

Segmentation du contour intérieur : cas bouche ouverte

Initialisation et détection de points clefs

[0086] La méthode d'extraction du contour intérieur dans le cas de la bouche ouverte suit des étapes similaires à celles relatives au le contour extérieur. Deux jumping snakes donnent la position des deux points clefs internes Pa et Pio, le modèle paramétrique intérieur est initialisé et ajusté à l'aide d'un critère contour. La finalisation de l'extraction est déterminée par la vérification de l'hypothèse « bouche ouverte ». Si la bouche est en fait fermée, le cas bouche fermée est traité.

[0087] La position du point clef Pe est trouvée en faisant converger un snake intérieur supérieur et celle de Pw en faisant converger un snake intérieur inférieur. En effet, Pe et Pw (montrés à la Figure 9) sont respectivement les points milieux des contours internes supérieur et inférieur. Les deux germes doivent respecter les contraintes suivantes :

• Le germe intérieur haut est au dessus du contour intérieur supérieur et plus proche de celui-ci que du contour extérieur supérieur;

• Le germe intérieur bas est au dessous du contour intérieur inférieur et plus proche de celui-ci que du contour extérieur inférieur.

[0088]Ainsi les zones d'initialisation des germes sont relativement grandes et il n'est pas indispensable d'avoir une grande précision de placement, tant que ces contraintes sont satisfaites.

[0089] Connaissant la position du point P3, qui se trouve au milieu de l'arc de Cupidon (et donc au milieu de la bouche lorsque le visage est vu de face), les abscisses des germes intérieurs sont affectées à la valeur de l'abscisse de Pe- En ce qui concerne les ordonnées, les gradients G3 et G4 accentuent respectivement les contours intérieurs haut et bas.

[0090] Deux points intermédiaires, notés P'a et ΡΊο (car ceux-ci peuvent être vus comme une estimation des positions de Pe et P_i0), sont positionnés sur le segment [ΡβΡβ]- L'ordonnée de P'a (resp. P'w) est choisie au niveau du maximum du gradient G3 (resp. G4) entre les points P3 et Pe. Afin d'éviter une mauvaise affectation à cause du bruit, une accumulation des gradients est réalisée sur 10 colonnes autour de P3 et les valeurs cumulées maximales sont de préférence retenues. De plus, seule la composante horizontale des gradients est utilisée, car au milieu de la bouche, les contours sont principalement horizontaux.

[0091] Normalement, ces points sont déjà de bonnes estimations de Pa et P10, et ils se trouvent sur les contours intérieurs. Toutefois, les gradients G3 et G4 ont été construits pour accentuer le contour intérieur dans tous les cas possibles (frontière Lèvre/Dent, Lèvre/Gencive, Lèvre/Langue et Lèvre/Cavité orale). Par conséquent, d'autres contours à l'intérieur de la bouche peuvent être également accentués, comme par exemple, la frontière Dent/Cavité orale. Il se peut que le point P'₈ ou P'w ne soit pas tout à fait sur le contour des lèvres. Les points P'a et P'w ne sont donc pas suffisamment fiables pour être choisis directement comme points clefs internes.

[0092] Les deux germes intérieurs sont positionnés de la manière suivante :

• Le germe intérieur haut est placé au ¾ du segment [ V'e],

• Le germe intérieur bas est placé au ¾ du segment [ΡβΡΊο]-

[0093] De cette façon, les germes respectent les conditions d'initialisation et se trouvent bien sur les lèvres.

[0094] Maintenant que les deux germes sont définis, il est possible de faire converger les snakes intérieurs supérieur et inférieur.

• Pour le snake supérieur : les paramètres sont réglés de façon à ce que le snake se propage en dessous du germe haut et le gradient G3 est utilisé pour sa convergence. • Pour le snake inférieur : les paramètres sont réglés de façon à ce que le snake se propage en dessus du germe bas et le gradient G₄ est utilisé pour sa convergence.

[0095] La convergence des snakes donne des points sur les contours intérieurs supérieur et inférieur. Pg est le point du snake supérieur le plus proche de la verticale passant par P₃ et Pw est le point du snake inférieur le plus proche de cette même verticale. Les abscisses des points Pe et P₁₀ sont modifiées pour être égales à l'abscisse de P₃, pour que ces deux points se retrouvent sur la même verticale. Il est à noter que les positions des commissures internes Ργ et Pg seront trouvées en même temps que l'optimisation du modèle paramétrique intérieur, comme cela a été fait pour les commissures Pi et P5.

Ajustement des snakes

[0096] Dans certains cas, il est possible que les snakes ne se stabilisent pas sur les bons contours intérieurs, mais sur d'autres contours parasites, soit parce qu'un autre contour intérieur a été également accentué par les gradients G3 et G4, soit parce que le contour n'est pas assez marqué.

Ces mauvaises convergences arrivent essentiellement dans deux cas : à cause de l'accentuation de la frontière Dent/Cavité orale ou en présence des gencives (Figures 11A et 11 B).

[0097] Lorsque les dents sont visibles (Figures 10A, 10B et 10C), il arrive que le snake intérieur supérieur ou inférieur se bloque sur le contour situé entre les dents et la cavité orale pour deux raisons :

• ce contour est accentué par le gradient G_3oi/4 et il se trouve trop proche du germe,

• les dents ne sont pas assez brillantes (exemple avec des dents apparaissant plus jaunes que blanches) pour que la composante u joue son rôle dans la combinaison des gradients et le snake n'est pas arrêté par le contour intérieur.

[0098] Pour ajuster les points des snakes, le masque des pixels dents à l'intérieur de la bouche est établi, tel que montré en 10A. [0099] Les valeurs des composantes y et a des espaces Luv et Lab sont proches de 0 pour les pixels dents et plus élevées pour le reste des pixels de la bouche. En calculant les valeurs moyennes μ et les écart-types σ des composantes u et a des pixels de la bouche (sont pris en compte uniquement les pixels se trouvant dans la région définie par le contour extérieur des lèvres), un pixel (x, y) est défini comme un pixel « dent » si :

α(χ,γ)≤μ_α - σ_α ou u(x,y)≤ μ„ - σ„ (Eq.8)

Où a(x, y) et u(x, y) sont les valeurs des composantes u et a du pixel (x, y). (μ₃, o_a) et (μ_υ, σ_υ) sont les valeurs moyennes et les écart types calculés pour les pixels de la bouche (Figure 10B).

[00100] A partir de ce masque, les points des snakes sont ajustés de la manière suivante (Figure 10C) :

• Si des pixels dents se trouvent au dessus du snake supérieur, les points du snake sont remontés jusqu'à qu'il n'y ait plus de pixels dents au dessus.

• Si des pixels dents se trouvent au dessous du snake inférieur, les points du snake sont abaissés jusqu'à qu'il n'y ait plus de pixels dents au dessous.

[00101] Des erreurs de convergence peuvent aussi arriver en présence des gencives. En effet, lorsque la couleur et la texture des gencives sont proches de celles des lèvres, le snake intérieur supérieur s'arrête sur la frontière séparant les gencives et les dents. Pour ajuster le snake dans ce cas, un second jumping snake est utilisé pour le contour haut. Le germe de ce second snake est choisi comme étant le point clef Pe trouvé grâce à la convergence du premier snake (point qui se trouve donc en dessous du vrai contour). Ainsi, les paramètres du second snake sont réglés de façon à ce que le snake se propage en dessus du germe. Le gradient utilisé pour l'énergie externe du snake est le gradient G5 (cf. Eq. 5).

[00102] A la fin de la convergence, si le germe final du second snake (Figure 11 B) est au dessous du point clef P3 du contour extérieur supérieur, l'ajustement est validé, sinon le résultat du premier snake (Figure 11 A) est conservé. En effet, dans le cas où il n'y a pas de gencives visibles, le second snake s'arrête au dessus de la bouche.

Ajustement du modèle paramétrique intérieur « bouche ouverte » (Figure 8 : étape 540)

[00103] Avec les différents ajustements des snakes, les deux points clefs Pa et Pio situés sur les contours intérieurs et plusieurs points utiles pour l'optimisation du modèle « bouche ouverte » sont obtenus. Il reste donc à trouver les commissures internes Ργ et Pg, et à ajuster le modèle.

[00104] Comme pour la détection des commissures Pi et P5 du contour extérieur, ces 2 étapes sont avantageusement réalisées en une seule et même opération.

[00105] Dans un premier temps, il est posé que les commissures internes sont les mêmes que les commissures externes (P₇ = et Pg = P5). Cette supposition est souvent vérifiée, notamment lorsque la bouche est grand ouverte. A partir de là, des estimations des 4 courbes cubiques du modèle (notées : γ'₅, γ'β, y et γ'₈) sont établies (Figure 12A). Elles sont ici désignées par le terme « estimations » car elles sont obtenues en utilisant les commissures externes et non avec les bonnes commissures internes P7 et Pg.

Les points extrêmes de ces 4 cubiques sont connus, à savoir :

P, et P_e pour γ'₅

Pa et P₅ pour γ'₆

[00106] De plus, il est posé comme contraintes une dérivée nulle en Pa et

Ainsi pour chaque cubique, trois équations sont disponibles. En utilisant, les points des snakes proches de Pa et Pw, une cubique est rapidement calculée pour chacun des 4 cas en utilisant la méthode des moindres carrés. [00107] La stratégie choisie pour trouver la commissure P₇ (la même stratégie est adoptée pour détecter Pg) est à présent détaillée. A partir des estimations s et γ'₈, plusieurs couples de cubiques sont calculés en faisant varier les pentes des estimations entre Pi and P% (γ₅) en haut, et entre Pi and Pw (γβ) en bas (Figure 12B). Les pentes sont celles situées au niveau des points Pi et P₅. Dix valeurs de pente autour de la valeur estimée sont testées pour chaque cubique. Le couple de cubiques qui maximise le flux moyen de gradient G₃ (pour γ₅) ou G₄ (pour γ₈) est gardé. La commissure P₇ est finalement choisie comme étant l'intersection de ces deux cubiques. P₉ est trouvé de la même manière avec les cubiques }¾ et γγ (Figure 12C).

Vérification de l'hypothèse « bouche ouverte » (Figure 8 : étape 550)

[00108] Ayant obtenu le contour intérieur, il reste à vérifier a posteriori la validité de l'hypothèse « bouche ouverte » prise au début de la segmentation du contour intérieur. Si l'hypothèse est vérifiée, la recherche du contour intérieur des lèvres est terminée, sinon il faut passer au cas « bouche fermée » décrit dans la partie suivante.

[00109] La décision est prise à l'aide d'un critère géométrique sur la forme du contour intérieur trouvé. Après la convergence des snakes intérieurs, trois cas de figures sont obtenus :

- Si la bouche est en fait fermée, le contour intérieur est une ligne sombre séparant les lèvres supérieure et inférieure. Si cette ligne sombre n'est pas assez marquée, les snakes ne sont pas stoppés par le contour intérieur et le snake supérieur s'arrêtera en dessous du snake inférieur (Fig. 13A). Il est alors déduit que la bouche est fermée.

- Si la bouche est fermée et que la ligne sombre est plus marquée, les 2 snakes s'arrêtent sur cette ligne et la distance entre les snakes est très faible (Fig. 13B). Si la surface de la région définie entre les 2 snakes est inférieure à un certain seuil, il est déduit que la bouche était fermée. Le seuil a été choisi expérimentalement et fixé à 10 pixels. D'autres valeurs peuvent aussi être utilisées. - Si la bouche est ouverte, le snake supérieur s'arrête au dessus du snake inférieur, et la région définie entre les 2 snakes est plus grande que le seuil de 10 pixels (Fig. 13C ).

Segmentation du contour intérieur : cas d'une bouche fermée

Détection du point clef Pu (Figure 8 : étape 700)

[00110] Lorsque la bouche est fermée, le contour intérieur est constitué de pixels lèvres et il peut être vu comme une ligne sombre reliant les deux commissures Pi et P5 de la bouche. Pour initialiser la recherche du contour, la ligne des minima de luminance L_m/_n est utilisée. Comme déjà mentionné, la ligne relie les pixels les plus sombres de l'intérieur de la bouche et elle est initialisée sur le pixel du segment [ΡβΡβ] ayant la luminance la plus faible. En conséquence, comme le montre la Figure 14A, L_min est, en général, déjà une bonne représentation du contour intérieur. De plus, lors de l'extraction du contour extérieur, les commissures Pi et P₅ ont été choisies sur cette ligne.

[00111] Ainsi, le point clef Pu le plus adapté est le point initial de L_min (le pixel le plus sombre du segment [ΡβΡβ])-

Ajustement du modèle paramétrique intérieur « bouche fermée » (Figure 8 : étapes 710 et 720)

[00112] Dans le cas d'une bouche fermée, les commissures internes sont supposées être les mêmes que les commissures externes (P₇ = Pi, et Pg = P₅). Aussi, en échantillonnant L_min, nous obtenons plusieurs points sur le contour intérieur. Pour chacune des deux cubiques yg et yw, il y a donc les deux points extrêmes et une condition d'annulation de leur dérivée en Pg. En utilisant les points issus de l'échantillonnage de

proches de Pg, les cubiques sont calculées, par exemple en utilisant la méthode des moindres carrés (Figure 14C). Dans le cas où la ligne des minima de luminance ne serait pas exactement sur le contour intérieur, la segmentation n'est pas toujours assez précise. Une dernière étape avantageuse d'optimisation consiste à faire varier les pentes des cubiques au niveau des commissures (Figure 14B). On teste un certain nombre de pentes autour des valeurs initiales, par exemple une dizaine de pentes, pour chaque cubique et les courbes maximisant le flux moyen du gradient intensité (le contour intérieur étant une ligne sombre) sont choisies comme cubiques finales du modèle.

Segmentation dynamique

[00113] L'approche pour le suivi utilise des informations temporelles afin de prendre en compte l'enchaînement des images de la séquence. Un module de suivi permet d'améliorer les performances de la segmentation en termes de vitesse et de robustesse. En effet, par rapport à un algorithme statique qui traiterait une nouvelle image de la séquence sans connaissances à priori, le procédé de suivi utilise des informations temporelles définies à partir des images précédentes. Le traitement d'une nouvelle image tient compte ainsi des informations sur l'emplacement de la bouche ou sur la forme de la bouche (épaisseur des lèvres, allure des courbes des modèles dans les anciennes images...). Ces données permettent une segmentation plus rapide, mais aussi plus robuste, car les résultats précédents peuvent servir aux cas mal résolus en statique, à condition que la détection dans l'image précédente soit exacte. Le procédé de segmentation dynamique est constitué de 4 phases (Figure 5 : étapes 200, 210, 220 et 230); la dernière étape étant soit une réinitialisation (utilisation de l'algorithme statique), soit le suivi des contours labiaux.

Suivi des points clefs des modèles paramétriques (Figure 5 : étape 200)

[00114] Les modèles paramétriques utilisés pour modéliser les contours extérieur et intérieur des lèvres sont positionnés à partir des différents points clefs externes et internes P,=_Î à n- Ces points sont trouvés sur la première image, de préférence en utilisant une approche telle que celle définie pour le mode statique, en faisant converger différents jumping snakes. Pour les images suivantes de la séquence, la position des points clefs est déterminée en effectuant un suivi de ces points image par image. La détection des points est, de ce fait, plus rapide et plus robuste que pour la méthode statique. Le suivi des points doit être le plus précis possible dans la mesure où ils vont permettre d'initialiser la position des modèles paramétriques dans l'image courante. Le résultat de la segmentation des lèvres est donc étroitement lié à la position des points clefs.

[00115] Les points Pi, P₂, P3, ΡΛ, P5, Pe, Pa et P10 sont suivis à l'aide d'une technique qui est une variante de l'algorithme de Lucas-Kanade, présenté dans le document de B.D. Lucas, T. Kanade, An Itérative Image Registration Technique with an Application to Stereo Vision, in Proc. IJCAI'81 , pp. 674-679, Vancouver, 1981. Les positions des commissures internes P₇ et P9 sont de préférence calculées directement pour toute nouvelle image de la séquence, car ce sont deux points difficiles à suivre. En effet, le voisinage des commissures internes peut changer significativement d'une image à l'autre car : a) les commissures internes se déplacent rapidement quand la bouche s'ouvre ou se ferme,

b) l'intérieur de la bouche change brutalement d'apparence lorsque les dents, la langue, les gencives ou la cavité orale, apparaissent ou disparaissent.

[00116] De ce fait, l'algorithme de suivi de Lucas-Kanade ne peut pas être performant pour suivre P₇ et P₉.

[00117] Enfin, comme préalablement mentionné, le cas « bouche fermée » est un cas conduisant à une segmentation du contour intérieur. Lorsque la bouche est détectée fermée, le point clef interne Pu est déterminé de la même manière que pour l'algorithme statique.

Ajustement du suivi des points clefs externes et internes

[00118] D'une image à la suivante, l'algorithme de Lucas-Kanade fournit une bonne estimation de la position des points. Cependant l'erreur s'accumule d'image en image et le suivi devient peu fiable après plusieurs images.

[00119] La dégradation du suivi concerne, en particulier, les commissures externes et les points Pe, Pw et P₆ : • Pour Pi et Ρ₅, l'accumulation d'erreur s'explique par le fait que les commissures ne peuvent être vues comme de véritables points, mais plutôt comme une région où les contours extérieurs des lèvres se rejoignent.

• Pour Pa et P10, l'erreur de suivi arrive souvent lorsque la bouche s'ouvre.

• Pour le point bas P₆, la difficulté vient du fait que ce point se situe sur un contour qui est généralement horizontal. Dans ce cas, l'estimation du mouvement horizontal est peu fiable. On remarque que l'erreur du suivi concerne principalement la position horizontale de Pe.

[00120] En conclusion, l'algorithme de Lucas-Kanade permet de nous fournir une bonne estimation de la position des points clefs Pi, P∑, P3, P4, P5, P₆, Pa et P10 d'une image à la suivante, mais les points ont besoin d'être réajustés à chaque image pour éviter l'accumulation des erreurs de suivi au cours de la séquence. Pour la suite de ce document, les notations suivantes sont adoptées :

• Pi'(t) est l'estimation du point P, obtenue par la méthode de Lucas- Kanade dans l'image courante à l'instant t.

• Pi(t) est la position recalée du point P, dans l'image courante à l'instant t. Du fait des propriétés spécifiques des régions entourant ces points clefs, différentes méthodes d'ajustement sont possibles en fonction du point à recaler.

Ajustement des commissures externes Pi et P₅

[00121] Les positions des commissures externes obtenues par la méthode de suivi (Pi'(t) et Ps'(t)) peuvent ne plus être sur la ligne des minima de luminance L_m/n, comme cela a été préalablement indiqué. La première étape à réaliser est de replacer chacune des deux estimations sur le plus proche pixel appartenant à Z._{m n}. Ensuite, il est possible de calculer un modèle déformé du contour extérieur, à partir de la segmentation réalisée sur l'image précédente (à l'instant t-1) et des estimations des points clefs externes (Pi'(t), Pî{t), P/ffJ, Ps (t) et P₆'(t)). [00122] Le résultat de la segmentation du contour extérieur des lèvres est disponible dans l'image précédente avec les quatre cubiques notées yi(t-1), y∑(t-1), 3(t-1) et 4(t-1) (Figure 15A . Les cubiques y_{i=1 à} t-1) sont déformées pour coïncider avec les estimations des points clefs externes (Pi'(t), P

Ps'(t) et Pe'(t)) et pour obtenir des estimations des cubiques, notées

dans l'image courante à l'instant t. Chaque point de la cubique à l'instant t-1 est déplacé à l'instant t, en utilisant une moyenne pondérée des déplacements des deux points extrêmes de la cubique.

[00123] Ce modèle déformé fournit un bon aperçu du contour extérieur à l'instant f(Figure 15B). La méthode utilisée pour ajuster les estimations des commissures externes (Pi'(t) et Ps'(t)) consiste à calculer le modèle extérieur déformé pour plusieurs pixels candidats Pi(t) et Ps(t) et à déterminer le meilleur candidat avec la technique de maximisation des flux moyens de gradient, à travers les cubiques déformées obtenues. Nous supposons toujours que les commissures extérieures se trouvent sur L_m/„ (Figure 16A). Pour chacune des commissures, un certain nombre de points sont testés, par exemple sept points appartenant à L_m/n : la position estimée (qui a été initialement replacée sur L_m/_n), trois points sur la gauche et trois points sur la droite. Pour chaque candidat, le modèle déformé est établi. Les positions recalées Pi(t) et P_s(t) sont de préférence déterminées respectivement par les deux meilleurs couples de cubiques (yi'(t), y ft)) et ( 2'(t), ft)) (Figure 16B). Les meilleurs couples de cubiques peuvent être désignés avec une maximisation des flux moyens de gradient, de la même manière que pour la segmentation statique. Le gradient G1 est utilisé pour les flux à travers yi'(t) et à travers γ₂γί , et le gradient G∑ est utilisé pour les flux à travers y3'(t) et à travers

15C).

Ajustement des points clefs externes P2, P3, * et P₆

[00124] L'algorithme de Lucas-Kanade donne les estimations P2YO, PJft), PSft) et Pe'it) qui sont soit précises (les points sont sur les contours extérieurs des lèvres), soit proches des contours. Pour recaler ces trois points clefs, nous utilisons les snakes dans leur version standard. Les contours actifs standards sont des courbes qui évoluent, d'une manière itérative, d'une position initiale jusqu'à se coller sur le contour recherché. La convergence du snake se fait en minimisant une fonctionnelle d'énergie composée d'un terme d'énergie externe, lié à l'image (pour attirer la courbe vers les contours), et d'un terme d'énergie interne, qui impose des contraintes de forme de la courbe pendant la déformation).

[00125] L'étape d'initialisation est capitale et les courbes initiales doivent être proches des contours recherchés pour obtenir un bon résultat de segmentation. Or, le modèle déformé, présenté préalablement, est proche des contours extérieurs des lèvres, spécialement avec les commissures externes qui sont désormais recalées (Figure 17A). Deux snakes classiques sont utilisé à partir du modèle déformé :

• un snake supérieur est initialisé avec les deux cubiques yi '(t) et y t) du modèle déformé (Figure 17B),

• un snake inférieur est initialisé avec les deux cubiques 3 (f) et '(t).

[00126] Les courbes cubiques sont échantillonnées pour donner les points initiaux composant les deux snakes. Pour la convergence des snakes, aucune énergie interne n'est utilisée. Les courbes initiales étant très proches des contours, la convergence des snakes est réalisée en quelques itérations et les courbes n'ont finalement pas besoin d'être régies par des contraintes de forme. Les énergies externes sont basées sur le gradient Gi pour le snake supérieur et G2 pour le snake inférieur.

A la fin de la convergence (Figure 17C), les points recalés P∑(t), Peft), P t) et Pe(t) sont les quatre points des snakes finaux supérieur et inférieur les plus proches des estimations P₂'(t), P₃'(t)_> Ptf) et P₆'(t).

Ajustement des points clefs internes Pa et P10

[00127] Les deux points clefs internes Pe et Pw sont des points difficiles à suivre précisément car ils sont sur les frontières de l'intérieur de la bouche. De ce fait, l'environnement de ces deux points change fréquemment d'une image à l'autre, car la bouche alterne continuellement entre l'état ouvert et fermé, et l'apparence de l'intérieur de la bouche varie non-linéairement pendant une conversation (apparition et disparition continues des dents, langue, gencives ou cavité orale). Pour leur ajustement, deux étapes consécutives sont prévues : a) ajustement par rapport au masque des dents,

b) ajustement en fonction de l'épaisseur des lèvres.

[00128] Plusieurs techniques de segmentation des dents peuvent être utilisées. Celle en relation avec Γ équation (8) est préconisée. Une fois le contour extérieur connu, l'équation 8 permet de déterminer, pour chaque pixel de la bouche, si le pixel est un pixel « dent ». A ce niveau de la segmentation, le résultat final du contour extérieur de la bouche n'est pas encore défini, mais, une nouvelle fois, le modèle extérieur déformé présenté précédemment peut être utilisé.

A partir du masque des dents, l'estimation Ps'(t) est déplacée vers le haut, s'il y a des pixels « dent » au dessus et dans la même colonne que Pe'(t)- Et l'estimation Pw'(t) est déplacée vers le bas, s'il y a des pixels « dent » au dessous et dans la même colonne que Pio'(t)- Les points étant sur le contour intérieur, il ne doit y avoir que des pixels « lèvre » au dessus (resp. en dessous) de P_B (resp. P₁₀).

[00129] A partir des résultats de la segmentation des contours des lèvres obtenus sur les images précédentes de la séquence, l'épaisseur moyenne des lèvres supérieure et inférieure est connue. En posant comme base que ces épaisseurs ne varient pas trop brutalement d'une image à l'autre (l'épaisseur des lèvres diminue lorsque la bouche s'étire), il est possible d'ajuster les estimations Pe'(t) et Pio'(t) en fonction de leur valeur obtenue avec les images précédentes. L'épaisseur de la lèvre la plus haute, notée Thaut, correspond à la distance entre les points P3 et Ps, et l'épaisseur de la lèvre la plus basse, notée bas, correspond à la distance entre les points Pw et Pe-

[00130] On calcule l'épaisseur moyenne de la lèvre supérieure, notée Thaut(tp), et l'épaisseur moyenne de la lèvre inférieure, notée Tb_as(t_P), à partir des cinq images précédentes. Si les valeurs des épaisseurs des lèvres de l'image courante T_haut(t) et T_bas(t) obtenues à l'aide des points P3H) et Ρβ(ή, et des estimations Pa'(t) et Pw'(t), ne respectent pas les conditions de l'équation 9, les ordonnées des points clefs internes sont ajustées de la manière suivante :

7-^( < o.75 «r_ta(g or i.25xr (/_p) < r_fc=i,(

TL( < 0.75xr_to(i ) or 1.25xr_to¾) < T^(t) ^{(bq' }}

• l'ordonnée de Pg'(t) est égale à l'ordonnée de P3(t) plus la valeur de l'épaisseur moyenne T_haut(t_p),

• l'ordonnée de Pio'(t) est égale à l'ordonnée de moins la valeur de l'épaisseur moyenne T_bas(t_p).

[00131] Cette méthode de recalage est utile notamment lorsque la bouche s'ouvre trop vite et que l'algorithme de Lucas-Kanade n'a pas réussi à suivre les points clefs internes.

Test pour la réinitialisation du suivi (Figure 5 : étape 210)

[00132] Lors du suivi des contours des lèvres dans une séquence d'images, il peut arriver que la segmentation échoue pour plusieurs raisons parmi lesquelles :

• un point des modèles paramétriques extérieur ou intérieur a été mal suivi,

• un contour n'est pas assez marqué pour que sa détection soit précise,

• le mouvement de la bouche a été trop rapide d'une image à l'autre,

• la bouche a été partiellement occultée.

Si un des cas précédents survient, le suivi des contours en est affecté, tel que montré à la Figure 18. Afin d'éviter que les résultats divergent, il est nécessaire de réinitialiser l'extraction des contours de la séquence. La difficulté consiste alors à déterminer quand le suivi a besoin d'être réinitialisé.

[00133] A ce stade de l'algorithme de suivi des contours de la bouche, les positions de 8 points clefs sont connues. Pu(t) est calculé lorsque la bouche est fermée et les commissures internes (P?(t) et Pg(t)) sont détectées en même temps que le calcul des cubiques internes. En particulier les six points clefs externes P,=i à e(t) sont connus dans l'image courante; on utilise leur position pour en déduire si le suivi des contours en cours est acceptable ou s'il a besoin d'être réinitialisé. Cette étape correspond à l'étape 210 du schéma global du procédé. Les positions des six points clefs externes P,=i à e(t) de l'image courante sont comparées avec leur position dans l'image précédente PM à e(t- 1). Si la distance entre un des points courants et sa position précédente dépasse un certain seuil, il est déduit que la segmentation doit être réinitialisée.

[00134] Le seuil peut varier selon les cas. De préférence, il prend en compte la taille de la bouche et la cadence d'acquisition des images. Par exemple, pour des images acquises à 50 images/seconde où les bouches ont en moyenne une taille de 50x20 pixels, le seuil est établi à 10 pixels. Si la condition n'est pas enfreinte, l'algorithme de suivi continue et il passe aux étapes 220 et 230, qui sont le suivi de la boîte autour de la bouche et l'extraction des contours des lèvres. En cas de réinitialisation, l'approche statique est appliquée (les étapes 100, 1 10 et 120) sur l'image courante de la séquence qui a posée problème, et cette image est vue comme la première image d'une nouvelle séquence.

Suivi de la boîte englobante de la bouche (Figure 5 : étape 220)

[00135] Dans le cas où il n'est pas requis de réinitialiser le suivi des contours, l'algorithme de suivi continue. L'étape 220 correspond au suivi de la boîte autour de la bouche, à l'aide d'un filtre de Kalman. Le filtre de Kalman (R.E. Kalman, A New Approach to Linear Filtering and Prédiction Problems, Transaction of the ASME - Journal of Basic Engineering, vol. 82, pp. 35-45, 1960) permet de régulariser la trajectoire d'un modèle. Le filtre de Kalman est un estimateur récursif, c'est-à-dire que l'état courant est défini à partir de l'état précédent et des mesures courantes. L'état précédent est utilisé pour prédire l'état courant et l'observation est utilisée pour affiner la prédiction.

Prédiction

[00136] Pour la prédiction de la boîte autour de la bouche, l'algorithme de block matching est utilisé. Le bloc de référence est extrait de l'image précédente à partir des coordonnées de la boîte englobante. Il est comparé à plusieurs blocs de même taille dans l'image courante. La recherche est réalisée dans une fenêtre qui correspond à la position du bloc de référence agrandi de ±5 pixels horizontalement et verticalement. Pour comparer la similarité des deux blocs, on utilise l'Erreur Quadratique Moyenne, qui est la différence interpixel au carré. La position prédite de la boîte est affectée au bloc donnant l'erreur la plus faible.

Mise à jour

[00137] Pour la mise à jour de l'état prédit, le filtre de Kalman utilise une observation. Les positions des points clefs externes P,=_Î à e(t) sont utilisées pour calculer une mesure de la boîte courante. Cette boîte observée entoure tous les points clefs d'au moins 5 pixels. Le filtre de Kalman permet d'obtenir un suivi régularisé de la boîte autour de la bouche pour les images de la séquence. La boîte permet de déterminer la région d'intérêt pour l'extraction des contours. Par exemple, pour le suivi des contours extérieurs, plusieurs cubiques sont calculées et les meilleures sont déterminées pour obtenir le contour final. Si une des cubiques dépasse les limites de la boîte, celle-ci ne sera pas prise en compte.

Extraction des contours des lèvres (Etape 230)

[00138] L'algorithme de suivi utilise les mêmes modèles paramétriques composés de plusieurs courbes cubiques pour représenter les contours des lèvres. Les deux modèles extérieur et intérieur sont initialisés à l'aide des points clefs suivis par la méthode de Lucas-Kanade.

Extraction du contour extérieur

[00139] Les positions des six points clefs externes P,=_Î à e(t) du modèle paramétrique extérieur sont connues. Pour rappel, le modèle est composé de quatre courbes cubiques γ,= i à t) et d'une ligne brisée [P₂(fJ P3(t) P t)]. La ligne brisée est obtenue directement en reliant les trois points

2 à 4(t), il reste donc à déterminer les quatre courbes cubiques. [00140] Une cubique est décrite entièrement si les 4 paramètres qui la régissent sont connus. Pour chacune des cubiques du contour extérieur, la position des deux points extrêmes est connue et le modèle impose une dérivée nulle aux points P₂(t), Peft) et P t). En conséquence, il y a trois équations par cubique et il ne reste plus qu'un seul paramètre à déterminer.

[00141] Avec l'algorithme de suivi, il n'y a pas de points supplémentaires sur les contours extérieurs, comme ceux fournis par les deux jumping snakes extérieurs pour la méthode statique. Il n'est donc pas possible d'utiliser d'autres points pour trouver une dernière équation, mais il est possible de se servir des paramètres des courbes cubiques, obtenus lors de la segmentation de l'image précédente, Yi= i _à 4(t-1).

[00142] En posant que la bouche se déforme suffisamment lentement et que la cadence d'acquisition est suffisamment élevée, il est considéré que les paramètres des cubiques varient également lentement d'une image à l'autre. En particulier, les valeurs des pentes des cubiques, au niveau des commissures extérieures Pt et P5, sont proches d'une image à la suivante.

[00143] L'optimisation du modèle extérieur et le calcul des cubiques sont réalisés de la manière suivante, tel qu'illustré aux Figures 19A et 19B :

a) Les cubiques sont initialisées avec la position de leurs deux points clefs extrêmes, la contrainte de dérivée nulle au niveau du centre de la bouche et la pente de la cubique de l'image précédente au niveau des commissures extérieures (notée Pi(t-1)).

b) Des cubiques candidates sont testées en faisant varier la valeur des pentes autour de la valeur initiale Pi(t-1). Une dizaine de pentes testées autour de p,(t- 1) suffisent à donner de bons résultats, dans la mesure où les déformations inter-images de la frontière extérieure de la bouche sont petites.

c) Les meilleures cubiques sont celles qui maximisent le flux moyen du gradient G_t (pour Yf (t) et y₂ (t)) ou G₂ (pour y₃ (t) et y₄ (t)). Les valeurs des pentes de ces cubiques finales pi(t) sont utilisées pour initialiser la recherche dans l'image suivante. Finalement, les quatre meilleures cubiques γ,= j _{à 4}(t) et la ligne brisée définissent les contours extérieurs des lèvres.

[00144] Les différentes cubiques testées doivent se trouver à l'intérieur de la boîte englobante de la bouche pour être prises en compte. Ceci permet de rendre l'algorithme plus robuste vis-à-vis des erreurs de segmentation, lorsque les contours sont peu marqués. Dans le cas d'un contour peu marqué, une cubique candidate ,(t), ne se trouvant pas sur la frontière des lèvres, pourrait être choisie. Or, dans l'image suivante, la recherche s'effectuera à partir de la valeur de la pente de Yi(t-1), et ainsi de suite, d'image en image. Si la cubique s'éloigne trop de la bouche, aucun des candidats ne se retrouve effectivement sur le contour recherché et la segmentation devient irrécupérable. Le fait de limiter les cubiques à l'intérieur du cadre de la bouche permet de remédier à ce genre d'erreur.

Extraction du contour intérieur

[00145] Dans le cas du contour intérieur, l'algorithme de Lucas-Kanade a seulement fourni la position des deux points clefs internes Pe(t) et Pw(t). Pour mémoire, le contour intérieur est modélisé par deux modèles paramétriques : un modèle composé de quatre cubiques γ,·= ₅ à e(t) si la bouche est ouverte et un modèle composé de deux cubiques γ,= 9 ό io(t) si la bouche est fermée.

Pour l'extraction du contour intérieur, il faut donc déterminer l'état de la bouche pour choisir le modèle correspondant et déterminer la position des commissures intérieures.

Détection de l'état de la bouche

[00146] De la même manière que pour l'approche statique, dans un premier temps, on donne comme base que la bouche est ouverte et en fonction du résultat de la segmentation du contour intérieur, soit cette hypothèse est validée, soit le cas de la bouche fermée est considéré pour la suite. Optimisation du modèle intérieur « bouche ouverte »

[00147] Pour ce modèle, il faut déterminer la position des commissures intérieures P₇(t) et P₉(t). De la même façon que pour la méthode statique, les commissures sont trouvées en même temps que les courbes cubiques. Aussi, comme vu précédemment avec l'optimisation du modèle extérieur, les pentes des cubiques trouvées dans l'image précédente sont utilisées.

[00148] L'optimisation du modèle intérieur « bouche ouverte » et le calcul des cubiques sont réalisés de la manière suivante, tel que montré aux Figures 20A et 20B :

a) On pose tout d'abord que les commissures intérieures sont égales aux commissures extérieures (P₇ft) = Pi(t), et P₉(t) = Ps(t)). Les cubiques sont initialisées avec la position de leurs deux points clefs extrêmes (on utilise donc les commissures extérieures), la contrainte de dérivée nulle au niveau du centre de la bouche et la pente précédente au niveau des commissures extérieures (P,(t-1).

b) Des cubiques candidates sont testées en faisant varier la valeur des pentes autour de la valeur initiale pi(t-1). Pour le cas intérieur, une vingtaine de pentes sont testées autour de Pi(t-1) (deux fois plus que pour le cas extérieur), les déformations inter-images de la frontière intérieure de la bouche sont plus importantes que pour la frontière extérieure.

c) Les meilleures cubiques sont celles qui maximisent le flux moyen du gradient G₃ (pour ₅(t) et γ₆ (t)) ou G₄ (pour γ₇ (t) et γ₈ (t)). Les valeurs des pentes de ces cubiques finales p,(t) seront utilisées pour initialiser la recherche dans l'image suivante. Finalement, les commissures intérieures sont positionnées aux intersections des couples de cubiques

et (Yi=e(t), γ,=₇(Υ ), et les quatre meilleures cubiques définissent les contours extérieurs des lèvres.

[00149] Il faut enfin vérifier que la bouche était bien ouverte. Le critère de vérification est plus simple que pour la méthode statique, dans la mesure où les points clefs recalés Pe(t) et Pio(t) fournissent un renseignement fiable sur l'état d'ouverture de la bouche. Si la bouche est fermée, les deux points sont très proches, sinon ils sont d'autant plus éloignés l'un de l'autre, que la bouche est ouverte. Si la surface, définie par les contours intérieurs supérieur et inférieur, est plus faible qu'un certain seuil (fixé par exemple à 10 pixels comme précédemment), il est déduit que la bouche était en réalité fermée et il est alors requis de passer à l'optimisation du modèle intérieur « bouche fermé ». Sinon la segmentation du contour pour l'image courante est terminée.

Optimisation du modèle intérieur « bouche fermée »

[00150] Si la bouche est détectée fermée dans l'image courante, exactement la même technique que pour une image statique est appliquée. Pour rappel, le point clef Pu(t) est obtenu à l'aide de la ligne des minima de luminance et il se trouve sur la même colonne que Peft). Les commissures internes sont égales aux commissures externes (Pz(fJ = Pi(t), et Pg(t) = Ps(t)). Deux cubiques initiales g(t) et yw(t), sont calculées à l'aide de la méthode des moindres carrés et on fait varier la valeur des pentes au niveau des commissures extérieures pour obtenir plusieurs courbes candidates. Les deux meilleures courbes correspondent aux deux maxima des flux moyens du gradient de la luminance. Le modèle paramétrique intérieur est ainsi ajusté et les contours intérieurs sont extraits dans l'image courante.

[00151] Pour l'image suivante, le cas « bouche ouverte » est obligatoirement traité dans un premier temps. La valeur de la pente au niveau de la commissure extérieure gauche de yg(t-1) sera utilisée pour, à la fois, initialiser la recherche des cubiques γ₅ (t) et y₈(t). De même, La valeur de la pente au niveau de la commissure extérieure droite de yio(t-1) sera utilisée pour, à la fois, initialiser la recherche des cubiques ye(t) et y₇(t).

Dispositif de détection du contour [00152] La figure 21 présente un exemple d'un mode de réalisation d'un dispositif 1 de détection du contour intérieur des lèvres d'une bouche humaine à partir d'une image numérique selon l'invention. On retrouve d'une part un module d'extraction de contour extérieur 10, prévu pour extraire, à partir d'une image numérique, un contour extérieur de la bouche. Le module d'extraction de contour extérieur 10 comporte un module de détection de points clés 11 , pourvu de moyens de calculs tel qu'un microprocesseur 12 et d'une mémoire de travail 13, un module de génération de courbes paramétriques 14, pourvu de moyens de calculs tel qu'un microprocesseur 15 et d'une mémoire de travail 16, et d'un module d'optimisation 17, pourvu de moyens de calculs tel qu'un microprocesseur 18 et d'une mémoire de travail 19. Selon diverses variantes de réalisation, les moyens de calculs 12, 15 et 18, tout comme les mémoires de travail 13, 16 et 19 peuvent être centralisés pour tous les modules ou tout le dispositif de détection, ou encore être agencés de façon externe, avec connexion aux différents modules.

[00153] Le module de détection de points clés 11 est avantageusement agencé de façon à pouvoir utiliser une boîte englobante de la bouche tel que décrit précédemment, en relation avec les figures 6 et 7.

[00154] Le module de génération de courbes paramétriques 14 est agencé de façon à utiliser une approche de minimisation d'énergie. Les modèles paramétriques décrits précédemment comportent des courbes cubiques permettant de relier des points clés des contours concernés.

[00155] Le module d'optimisation 17 est agencé de façon à déterminer les meilleurs couples de courbes cubiques, tel que préalablement décrit.

[00156] De façon similaire au module d'extraction de contour extérieur 10, le module d'extraction de contour intérieur 20 comporte un module de détection de points clés 21, pourvu de moyens de calculs tel qu'un microprocesseur 22 et d'une mémoire de travail 23, un module de génération de courbes paramétriques 24, pourvu de moyens de calculs tel qu'un microprocesseur 25 et d'une mémoire de travail 26, et d'un module d'optimisation 27, pourvu de moyens de calculs tel qu'un microprocesseur 28 et d'une mémoire de travail 29. Selon diverses variantes de réalisation, les moyens de calculs 22, 25 et 28, tout comme les mémoires de travail 23, 26 et 29 peuvent être centralisés pour tous les modules ou tout le dispositif de détection, ou encore être agencés de façon externe, avec connexion aux différents modules.

[00157] Le module de détection de points clés 21 , le module de génération de courbes paramétriques 24 et le module d'optimisation 27 sont avantageusement agencés de façon similaire aux modules correspondants 11 , 14 et 17. Dans une variante, les éléments correspondants du module d'extraction de contour intérieur 10 et du module d'extraction de contour intérieur 20 sont combinés en un seul module prévu pour effectuer toutes les opérations correspondantes.

[00158] Un module de test de condition bouche ouverte 30 permet de vérifier si l'hypothèse de départ, à savoir que la bouche est ouverte, est vérifiée ou non. Le module détecte les formes et/ou positions et autres particularités géométriques des snakes pertinents, pour effectuer le test tel que décrit précédemment dans le présent document.

[00159] La figure 22 illustre de façon schématique les principales fonctions du dispositif 1 de détection du contour intérieur des lèvres d'une bouche humaine à partir d'une image numérique selon l'invention. Les données 50 d'images numériques sont fournies au dispositif 1 de détection du contour, qui génère les points 51 du contour de la bouche, les courbes paramétriques 52 du contour de la bouche, et les gradients 53 requis. Ces divers paramètres sont avantageusement stockés dans des mémoires, afin de pouvoir être utilisés au moment opportun. Les données 50 d'images numériques peuvent comprendre des images de visages à partir desquelles la zone de la bouche sera extraite, ou des images déjà ciblées en fonction de représenter uniquement la zone de la bouche.

Claims

REVENDICATIONS

1. Procédé de détection du contour intérieur des lèvres d'une bouche humaine à partir d'une image numérique, comportant les étapes consistant à :

- obtenir une première image des lèvres pour lesquelles la détection du contour est prévue (500) ;

- extraire le contour extérieur des lèvres à l'aide d'un modèle paramétrique de contour extérieur (510) ;

- détecter au moins deux points clés du contour interne des lèvres (520) ;

- déterminer des courbes paramétriques permettant de définir le contour entre lesdits points clés (530) ;

- optimiser le modèle paramétrique interne en fonction des critères inhérents à une bouche ouverte (540);

- effectuer un test afin de déterminer si la bouche est ouverte (550).

2. Procédé de détection du contour intérieur des lèvres d'une bouche humaine à partir d'une image numérique selon la revendication 1 dans lequel le modèle paramétrique de contour extérieur comporte au moins quatre courbes cubiques, soit deux de chaque côté de la bouche, définissant les contours supérieurs (γ1 , γ2) et inférieurs (γ3, γ4) à partir des commissures des lèvres.

3. Procédé de détection du contour intérieur des lèvres d'une bouche humaine à partir d'une image numérique selon l'une des revendications 1 ou 2, dans lequel les deux points clés du contour interne des lèvres sont les points médiants des contours intérieurs supérieurs (P8) et inférieur (P10).

4. Procédé de détection du contour intérieur des lèvres d'une bouche humaine à partir d'une image numérique selon les revendication précédentes, dans lequel l'optimisation du modèle paramétrique interne est obtenue par détermination de gradients (G1 , G2, G3, G4) susceptibles d'accentuer les contours des lèvres.

5. Procédé de détection du contour intérieur des lèvres d'une bouche humaine à partir d'une image numérique selon les revendication précédentes, dans lequel le test de détection de bouche ouverte comprend une étape de comparaison des positions relatives des snakes inférieurs et supérieurs pour vérifier si le snake supérieur s'arrête au dessus du snake inférieur, et si la région définie entre les deux snakes est plus grande qu'un seuil prédéfini.

6. Procédé de détection du contour intérieur des lèvres d'une bouche humaine à partir d'une image numérique selon les revendication précédentes, dans lequel :

- si la bouche est fermée, détecter un point clé interne défini en fonction d'une bouche fermée (700) ;

- déterminer au moins une courbe paramétrique permettant de définir le contour interne (710);

- optimiser le modèle paramétrique interne en fonction des critères inhérents à une bouche fermée (720).

7. Procédé de détection du contour intérieur des lèvres d'une bouche humaine à partir d'une image numérique selon l'une des revendications précédentes, comportant des étapes de suivi dynamique consistant à :

- obtenir une première image des lèvres pour lesquelles le suivi est prévu à un temps donné (t) ;

- détecter les points clés du contour externe des lèvres ;

- détecter les points clés du contour interne des lèvres ;

- obtenir une autre image des lèvres à un intervalle de temps t+1 ;

- comparer les positions des points clés externes suivis de l'image à t+1 aux positions correspondantes de ces points clés pour l'image précédente (t) ;

- effectuer un test de réinitialisation ;

- si les résultats du test de réinitialisation sont positifs, effectuer une étape de réinitialisation.

8. Procédé de détection du contour intérieur des lèvres d'une bouche humaine à partir d'une image numérique selon la revendication 7, dans lequel si les résultats du test de réinitialisation sont négatifs, poursuivre le suivi avec l'obtention d'une autre image à l'intervalle de temps suivant et répéter les étapes de comparaison jusqu'à ce que la période de suivi soit terminée.

9. Dispositif de détection du contour intérieur des lèvres d'une bouche humaine à partir d'une image numérique, comportant :

- un module d'extraction de contour extérieur (10) permettant d'extraire le contour extérieur des lèvres à partir d'une image d'un visage ou d'une bouche ;

- un module d'extraction de contour intérieur (20) permettant d'extraire le contour intérieur des lèvres à partir d'une image d'un visage ou d'une bouche ;

- un module de test (30) de condition de bouche ouverte, susceptible d'effectuer un test afin de déterminer des conditions selon lesquelles la bouche est ouverte ;

- un module de détection de points clés (11 , 21), susceptible de détecter au moins deux points clés du contour interne des lèvres ;

- un module de génération de courbes paramétriques (14, 24), susceptible de déterminer des courbes paramétriques permettant de définir le contour entre lesdits points clés ;

10. Dispositif de détection du contour intérieur des lèvres d'une bouche humaine à partir d'une image numérique selon la revendication 9, comprenant par ailleurs un module d'obtention d'images, permettant d'obtenir au moins une première image des lèvres pour lesquelles la détection du contour est prévue.