FR2989198A1

FR2989198A1 - Procede et dispositif de detection d'un objet dans une image

Info

Publication number: FR2989198A1
Application number: FR1253206A
Authority: FR
Inventors: Michel Sanches
Original assignee: STMicroelectronics Grenoble 2 SAS
Current assignee: STMicroelectronics Grenoble 2 SAS
Priority date: 2012-04-06
Filing date: 2012-04-06
Publication date: 2013-10-11
Also published as: US20130266177A1

Abstract

L'invention concerne un procédé de détection d'un objet dans une image (I ) au moyen d'un dispositif de traitement d'image, comprenant plusieurs étapes (400, 401, 402) de recherche de l'objet dans l'image (I ) à des échelles de recherche distinctes. A au moins une (400, 401) des étapes de recherche, des parties (407a, 407b) de l'image (I ) sont exclues de la recherche, les dimensions desdites parties diminuant lorsque l'échelle de recherche augmente.

Description

B11660 - 12-GR2-0056FR01 1 PROCÉDÉ ET DISPOSITIF DE DÉTECTION D'UN OBJET DANS UNE IMAGE Domaine de l'invention La présente invention concerne un procédé et un dispositif de détection automatique d'un ou plusieurs objets dans une image. Elle vise plus particulièrement un procédé et un dispositif de détection multi-échelle, c'est-à-dire permettant de détecter des objets dont on ne connaît pas à l'avance la taille dans l'image. Exposé de l'art antérieur Dans de nombreuses applications, on souhaite pouvoir détecter, dans une image prise par un capteur d'une caméra ou d'un appareil photographique, un objet dont on ne sait pas à l'avance à quelle distance il se trouvait du capteur au moment de la prise de vue, et dont on ne connaît par conséquent pas l'ordre de grandeur de la taille, en pixels, dans l'image. On retrouve par exemple cette problématique dans des systèmes de détection de véhicules sur des images prises par une caméra de vidéosurveillance routière, ou dans des systèmes de détection de visages. Les procédés de détection multi-échelle connus 20 prévoient de rechercher la présence éventuelle de l'objet dans l'image en parcourant l'image de manière exhaustive, à toutes les positions et à toutes les échelles de recherche possibles.

B11660 - 12-GR2-0056FR01 2 Des exemples de procédés de détection d'objet multi-échelle sont notamment décrits dans l'article "Robust Real-time Object Detection" de Paul Viola et Michael Jones. La figure 1 illustre schématiquement des étapes d'un exemple d'un procédé de détection multi-échelle d'un objet (non représenté) dans une image Io. Ce procédé comprend trois étapes successives 100, 101 et 102 de recherche de l'objet dans l'image Io, à trois échelles de recherche distinctes. A l'étape 100, une fenêtre glissante de détection r0 est définie. A titre d'exemple, l'image Io a une résolution de 384x288 pixels, correspondant par exemple à la résolution du capteur avec lequel l'image Io a été prise, et la fenêtre r0 est une fenêtre carrée de 24x24 pixels. La totalité de l'image Io est balayée en déplaçant la fenêtre glissante r0 d'un certain pas dans le sens horizontal et d'un certain pas dans le sens vertical, par exemple d'un pas de 1 pixel dans le sens horizontal et d'un pas de 1 pixel dans le sens vertical. A chaque déplacement de la fenêtre r0, un algorithme de détection est mis en oeuvre pour déterminer si l'objet recherché se trouve ou non contenu dans la fenêtre r0 à des dimensions de l'ordre de celles de la fenêtre r0. Ainsi, l'étape 100 permet, dans cet exemple, de détecter l'objet recherché si les dimensions de celui-ci dans l'image Io sont de l'ordre de 24x24 pixels. A l'étape 101, une deuxième recherche à une échelle de recherche supérieure à celle de l'étape 100 est mise en oeuvre. Une image I1 de plus petites dimensions que l'image Io est d'abord calculée, correspondant à une simulation d'une image que l'on aurait pu acquérir avec un capteur de plus faible résolution. A titre d'exemple, les dimensions de l'image I1 sont inférieures d'un facteur 1,5 aux dimensions de l'image Io, c'est-à-dire que, dans l'exemple susmentionné d'une image d'origine Io de 384x288 pixels, l'image I1 a une résolution de 256x192 pixels. L'image I1 peut être obtenue par l'enchaînement d'une étape de filtrage passe-bas ou moyennage de l'image Io, et d'une étape de sous-échantillonnage. La totalité de l'image B11660 - 12-GR2-0056FR01 3 est ensuite balayée en utilisant la même fenêtre glissante de détection r0 que celle utilisée à l'étape 100. A chaque déplacement de la fenêtre r0, un algorithme de détection est mis en oeuvre pour déterminer si l'objet recherché est ou non contenu dans la fenêtre r0 à des dimensions de l'ordre de celles de la fenêtre r0. L'étape 101 permet donc, dans cet exemple, de détecter l'objet recherché si les dimensions de celui-ci dans l'image I1 sont de l'ordre de 24x24 pixels, c'est-à-dire si ses dimensions dans l'image Io sont de l'ordre de (1,5*24)x(1,5*24) = 36x36 pixels. A l'étape 102, une troisième recherche à une échelle de recherche supérieure à celle de l'étape 101 est mise en oeuvre. Une image 12 de plus petites dimensions que l'image est calculée à partir de l'image I1 ou à partir de l'image Io. A 15 titre d'exemple, les dimensions de l'image 12 peuvent être inférieures d'un facteur 1,5 aux dimensions de l'image c'est-à-dire que dans l'exemple susmentionné, l'image 12 a une résolution de 170x128 pixels. La totalité de l'image 12 est parcourue en utilisant la même fenêtre glissante r0 que celle 20 utilisée aux étapes 100 et 101. A chaque déplacement de la fenêtre r0, un algorithme de détection est mis en oeuvre pour déterminer si l'objet recherché est ou non contenu dans la fenêtre r0 à des dimensions de l'ordre de celles de la fenêtre r0. L'étape 102 permet donc, dans cet exemple, de détecter 25 l'objet recherché si les dimensions de celui-ci dans l'image 12 sont de l'ordre de 24x24 pixels, c'est-à-dire si ses dimensions dans l'image Io sont de l'ordre de (1,5*1,5*24)x(1,5*1,5*24) = 54x54 pixels. La figure 2 illustre schématiquement des étapes d'un 30 autre exemple d'un procédé de détection multi-échelle d'un objet (non représenté) dans une image Io. Ce procédé comprend trois étapes successives 200, 201 et 202 de recherche de l'objet dans l'image Io, à trois échelles de recherche distinctes. L'étape 200 est identique à l'étape 100 du procédé de 35 la figure 1, c'est-à-dire que la totalité de l'image Io est B11660 - 12-GR2-0056FR01 4 balayée à l'aide d'une fenêtre glissante de détection r0, par exemple une fenêtre de 24x24 pixels pour une image Io de 384x288 pixels. A chaque déplacement de la fenêtre r0, un algorithme de détection est mis en oeuvre pour déterminer si l'objet recherché se trouve ou non contenu dans la fenêtre r0 à des dimensions de l'ordre de celles de la fenêtre r0. A l'étape 201, une deuxième recherche à une échelle de recherche supérieure à celle de l'étape 200 est mise en oeuvre. Une nouvelle fenêtre glissante de détection rl, de dimensions supérieures à celles de la fenêtre r0, est définie. A titre d'exemple, les dimensions de la fenêtre r1 sont supérieures d'un facteur 1,5 à celles de la fenêtre r0. La totalité de l'image Io est parcourue à l'aide de la fenêtre rl. A chaque déplacement de la fenêtre rl, un algorithme de détection est mis en oeuvre pour déterminer si l'objet recherché se trouve ou non contenu dans la fenêtre r1 à des dimensions de l'ordre de celles de la fenêtre r1 ((24*1,5)x(24*1,5) = 36x36 pixels dans cet exemple). A l'étape 202, une troisième recherche à une échelle de recherche supérieure à celle de l'étape 201 est mise en oeuvre. Une nouvelle fenêtre glissante de détection r2, de dimensions supérieures à celles de la fenêtre rl, est définie. A titre d'exemple, les dimensions de la fenêtre r2 sont 1,5 fois supérieures aux dimensions de la fenêtre rl. La totalité de l'image Io est parcourue à l'aide de la fenêtre r2. A chaque déplacement de la fenêtre r2, un algorithme de détection est mis en oeuvre pour déterminer si l'objet recherché se trouve ou non contenu dans la fenêtre r2 à des dimensions de l'ordre de celles de la fenêtre r2 ((1,5*1,5*24)x(1,5*1,5*24) = 54x54 pixels dans cet exemple).

Dans les exemples des figures 1 et 2, par souci de simplification, seules 3 étapes successives de recherche de l'objet dans l'image Io à des échelles de recherche distinctes ont été représentées et décrites. En pratique, le nombre d'étapes de recherche à des échelles distinctes peut être plus élevé, par exemple supérieur à 10, ce nombre et le facteur B11660 - 12-GR2-0056FR01 multiplicatif de l'échelle de recherche entre deux étapes de recherche successives pouvant être adaptés en fonction des performances de détection visées. Un inconvénient des procédés de détection multi- 5 échelle du type décrit en relation avec les figures 1 et 2 est qu'ils mettent en oeuvre un nombre important d'opérations de calcul, ce qui limite le nombre maximal d'images qui peut être traité par unité de temps. Résumé Ainsi, un objet d'un mode de réalisation de la présente invention est de prévoir un procédé de détection multiéchelle d'un objet dans une image, palliant au moins en partie certains des inconvénients des procédés connus. Un objet d'un mode de réalisation de la présente 15 invention est de prévoir un procédé de détection multi-échelle d'un objet dans une image, mettant en oeuvre moins d'opérations de calcul que les procédés connus. Un autre objet d'un mode de réalisation de la présente invention est de prévoir un dispositif de détection multi20 échelle d'un objet dans une image. Ainsi, un mode de réalisation de la présente invention prévoit un procédé de détection d'un objet dans une image au moyen d'un dispositif de traitement d'image, comprenant plusieurs étapes de recherche de l'objet dans l'image à des 25 échelles de recherche distinctes, dans lequel à au moins une des étapes de recherche, des parties de l'image sont exclues de la recherche, les dimensions desdites parties diminuant lorsque l'échelle de recherche augmente. Selon un mode de réalisation, à chacune des étapes de 30 recherche, une fenêtre glissante de détection est utilisée pour parcourir ladite image ou une image redimensionnée représentative de ladite image, un algorithme de détection étant mis en oeuvre à chaque déplacement de la fenêtre pour déterminer si l'objet recherché se trouve ou non contenu dans la fenêtre à des 35 dimensions de l'ordre de celles de la fenêtre.

B11660 - 12-GR2-0056FR01 6 Selon un mode de réalisation, entre deux étapes successives de recherche à des échelles de recherche distinctes, le changement d'échelle de recherche s'effectue en modifiant les dimensions de l'image parcourue par ladite fenêtre.

Selon un mode de réalisation, entre deux étapes successives de recherche à des échelles de recherche distinctes, le changement d'échelle de recherche s'effectue en modifiant les dimensions de la fenêtre glissante. Selon un mode de réalisation, lorsque l'échelle de 10 recherche est supérieure à un seuil, aucune partie de l'image n'est exclue de la recherche. Selon un mode de réalisation, lorsque l'échelle de recherche est inférieure audit seuil, les dimensions des parties dépendent de l'échelle de recherche selon une fonction affine. 15 Selon un mode de réalisation, l'objet à détecter est un visage. Selon un mode de réalisation, l'objet à détecter est un véhicule. Un mode de réalisation de la présente invention 20 prévoit également un dispositif de détection d'un objet dans une image, comportant une unité de traitement et une mémoire apte à stocker ladite image, l'unité de traitement étant reliée à la mémoire et étant configurée pour mettre en oeuvre plusieurs étapes de recherche de l'objet dans l'image à des échelles de 25 recherche distinctes, et pour, à au moins une des étapes de recherche, exclure de la recherche des parties de l'image, les dimensions desdites parties diminuant lorsque l'échelle de recherche augmente. Brève description des dessins 30 Ces objets, caractéristiques et avantages, ainsi que d'autres seront exposés en détail dans la description suivante de modes de réalisation particuliers faite à titre non limitatif en relation avec les figures jointes parmi lesquelles : B11660 - 12-GR2-0056FR01 7 la figure 1, précédemment décrite, illustre schématiquement des étapes d'un exemple d'un procédé de détection multi-échelle d'un objet dans une image ; la figure 2, précédemment décrite, illustre schéma-5 tiquement des étapes d'un autre exemple d'un procédé de détection multi-échelle d'un objet dans une image ; la figure 3 illustre schématiquement un système de détection automatique de visages ; la figure 4 illustre schématiquement des étapes d'un 10 mode de réalisation d'un procédé de détection multi-échelle d'un objet dans une image ; la figure 5 illustre schématiquement des étapes d'une variante de réalisation du procédé de détection multi-échelle de la figure 4 ; et 15 la figure 6 illustre schématiquement un exemple d'un mode de réalisation d'un dispositif de détection multi-échelle d'un objet dans une image. Description détaillée Par souci de clarté, de mêmes éléments ont été 20 désignés par de mêmes références aux différentes figures et, de plus, les diverses figures ne sont pas tracées à l'échelle. En outre, seuls les éléments utiles à la compréhension de l'invention ont été décrits. En particulier, les algorithmes susceptibles d'être utilisés pour détecter si l'objet recherché 25 est ou non contenu dans une fenêtre glissante de détection à des dimensions de l'ordre de celles de la fenêtre, n'ont pas été décrits, les modes de réalisation décrits étant compatibles avec tous les algorithmes de détection connus. La figure 3 représente, à titre illustratif et de 30 façon schématique, un exemple d'un système de détection automatique de visages comprenant une caméra 301 maintenue au-dessus du sol, par exemple à environ 1,5 m de hauteur, par un pied de support 303. Le système est configuré pour détecter automatiquement la présence éventuelle d'un visage 305 dans le 35 champ de la caméra 301, à une distance de la caméra pouvant B11660 - 12-GR2-0056FR01 8 aller par exemple de quelques dizaines de centimètres à plusieurs mètres. Lorsque le visage 305 est éloigné de la caméra, il occupe seulement une petite partie de l'image prise par la caméra. En revanche, lorsque le visage 305 est proche de la caméra, il occupe une grande partie voire la totalité de l'image prise par la caméra. Au-dessus d'une distance d de la caméra dépendant notamment de l'agencement et de la configuration du système, il existe des parties du champ de la caméra dans lesquelles il est en pratique impossible qu'un visage soit présent. A titre d'exemple, sur la figure 3, il est en pratique impossible ou très peu probable qu'un visage soit présent dans les régions hachurées 307a et 307b du champ de la caméra, correspondant respectivement à la partie inférieure du champ de la caméra, située par exemple à moins de quelques dizaines de centimètres au-dessus du sol, et à la partie supérieure du champ de la caméra, située par exemple à plus de 2,5 mètres au-dessus du sol.

De façon générale, dans la plupart des systèmes de détection automatique d'objets, il existe, au-delà d'une certaine distance de la caméra, des parties du champ de la caméra dans lesquelles il est en pratique impossible ou très peu probable que l'objet à détecter soit présent.

Dans les procédés de détection multi-échelle connus, comme on ne sait pas à l'avance à quelle distance de la caméra se trouvait l'objet à détecter au moment de la prise de vue, on prévoit de rechercher l'objet en parcourant l'image de manière exhaustive, à toutes les positions, comme cela a été décrit en relation avec les figures 1 et 2. Selon un aspect d'un mode de réalisation, on prévoit un procédé de détection multi-échelle d'un objet dans une image, comprenant plusieurs étapes de recherche de l'objet dans l'image à des échelles de recherche distinctes, dans lequel lors des étapes de recherche aux échelles les plus petites, des zones de B11660 - 12-GR2-0056FR01 9 l'image sont exclues de la recherche, les dimensions de ces zones à l'échelle de l'image d'origine diminuant lorsque l'échelle de recherche augmente. Lorsque l'échelle de recherche dépasse un seuil, les zones exclues de la recherche peuvent éventuellement disparaître totalement. On notera que dans la présente description, on entend par échelle de recherche le rapport entre l'ordre de grandeur de la taille, en pixels dans l'image d'origine, de l'objet recherché, et les dimensions de l'image d'origine. Il existe une relation de correspondance entre l'échelle de recherche utilisée à une étape de recherche donnée, et l'ordre de grandeur de la distance présumée entre le capteur et l'objet recherché au moment de la prise de vue. On utilise une échelle de recherche d'autant plus grande que l'on recherche un objet proche de la caméra, et une échelle d'autant plus petite que l'on recherche un objet éloigné de la caméra. Dans les exemples des figures 1 et 2, à chaque étape de recherche, on peut définir une échelle de recherche horizontale comme étant le rapport de la dimension horizontale de la fenêtre glissante de détection sur la dimension horizontale de l'image balayée par cette fenêtre, et une échelle de recherche verticale comme étant le rapport de la dimension verticale de la fenêtre glissante sur la dimension verticale de l'image balayée par cette fenêtre. A titre d'illustration, les échelles de recherche horizontales aux étapes 100, 101, 102, 200, 201 et 202 des procédés des figures 1 et 2 sont respectivement de 24/384, 24/256, 24/170, 24/384, 36/384, et 54/384, et les échelles de recherche verticales à ces mêmes étapes sont respectivement de 24/288, 24/192, 24/128, 24/288, 36/288, et 54/288.

La figure 4 illustre schématiquement des étapes d'un mode de réalisation d'un procédé de recherche multi-échelle d'un objet (non représenté) dans une image I. Dans l'exemple représenté, le procédé comprend trois étapes 400, 401 et 402 de recherche de l'objet dans l'image Io, à trois échelles de recherche distinctes.

B11660 - 12-GR2-0056FR01 10 A l'étape 400, on cherche à détecter la présence éventuelle de l'objet à une distance relativement importante de la caméra (petite échelle de recherche). A cette distance, il existe des régions du champ de la caméra dans lesquelles il est en pratique impossible ou très peu probable que l'objet recherché se situe. On prévoit d'exclure de la recherche les zones de l'image correspondant à ces régions. Dans l'exemple représenté, une bande horizontale inférieure 407a et une bande horizontale supérieure 407b de l'image Io sont exclues de la recherche à l'étape 400, correspondant respectivement à une partie inférieure et à une partie supérieure du champ de la caméra (configuration du type illustré par la figure 3). A titre d'exemple, l'image Io a une résolution de 384x288 pixels, et les bandes 407a et 407b ont chacune des dimensions de 384x100 pixels. Une fenêtre glissante de détection r0, par exemple une fenêtre carrée de 24x24 pixels, est utilisée pour balayer la totalité de l'image Io à l'exclusion des bandes 407a et 407b. A chaque déplacement de la fenêtre r0, un algorithme est mis en oeuvre pour déterminer si l'objet recherché se trouve ou non contenu dans la fenêtre r0 à des dimensions de l'ordre de celles de la fenêtre r0. A l'étape 401, on cherche à détecter la présence éventuelle de l'objet à une distance de la caméra inférieure à la distance de recherche à l'étape 400 (échelle de recherche supérieure à celle de l'étape 400). A cette distance, il existe encore des régions du champ de la caméra dans lesquelles il est en pratique impossible ou très peu probable que l'objet recherché se situe. On prévoit d'exclure de la recherche les zones de l'image correspondant à ces régions, étant entendu que ces zones sont, à l'échelle de l'image Io, plus petites que les zones 407a et 407b exclues à l'étape 400 (voir l'illustration en figure 3). A titre d'exemple, dans le cas susmentionné où l'image d'origine Io a une résolution de 384x288 pixels et où les zones 407a et 407b sont deux bandes horizontales de 384x100 pixels, on peut prévoir, à l'étape 401, d'exclure de la B11660 - 12-GR2-0056FR01 11 recherche deux bandes horizontales de 384x75 pixels (à l'échelle de l'image Io). Une image I1 de plus petites dimensions que l'image Io est d'abord calculée, correspondant à une simulation d'une image que l'on aurait pu acquérir avec un capteur de plus faible résolution. A titre d'exemple, les dimensions de l'image sont inférieures d'un facteur 1,5 aux dimensions de l'image Io. A l'échelle de l'image I1, les zones exclues de la recherche sont donc, dans cet exemple, deux bandes horizontales 407a' et 407b' de (384/1,5)x(75/1,5) = 192x50 pixels, s'étendant respec- tivement depuis le bord inférieur et depuis le bord supérieur de l'image I1. L'image I1, à l'exclusion des zones 407a' et 407b', est ensuite balayée en utilisant la même fenêtre de détection r0 qu'à l'étape 400. A chaque déplacement de la fenêtre r0, un algorithme est mis en oeuvre pour déterminer si l'objet recherché se trouve ou non contenu dans la fenêtre r0 à des dimensions de l'ordre de celles de la fenêtre r0. L'étape 401 permet donc, dans cet exemple, de détecter l'objet recherché si les dimensions de celui-ci dans l'image I1 sont de l'ordre de 24x24 pixels, c'est-à-dire si ses dimensions dans l'image Io sont de l'ordre de (1,5*24)x(1,5*24) = 36x36 pixels. A l'étape 402, on cherche à détecter la présence éventuelle de l'objet à une distance relativement proche de la caméra (échelle de recherche supérieure à celle de l'étape 401). A cette distance, l'objet peut se trouver n'importe où dans l'image prise par la caméra. On prévoit donc de faire porter la recherche sur la totalité de l'image, sans exclure aucune zone de la recherche. L'étape 402 est par exemple identique à l'étape 102 du procédé de la figure 1. La figure 5 illustre schématiquement des étapes d'une variante de réalisation du procédé de recherche multi-échelle de la figure 4, correspondant au cas où, entre deux étapes de recherche à des échelles de recherche distinctes, l'échelle de recherche est modifiée non pas en réduisant les dimensions de l'image balayée (comme dans les exemples des figures 1 et 4), B11660 - 12-GR2-0056FR01 12 mais en augmentant les dimensions de la fenêtre glissante de détection (comme dans l'exemple de la figure 2). Dans l'exemple représenté, on prévoit trois étapes 500, 501 et 502 de recherche de l'objet dans l'image Io, à trois 5 échelles de recherche distinctes. A l'étape 500, on cherche à détecter la présence éventuelle de l'objet à une distance relativement importante de la caméra (petite échelle de recherche). Des zones d'exclusion de la recherche sont définies dans l'image Io, par exemple deux 10 bandes horizontales 507a et 507b de 384x100 pixels pour une image Io de 384x288 pixels, s'étendant respectivement depuis le bord inférieur et depuis le bord supérieur de l'image Io. Une fenêtre glissante de détection r0, par exemple une fenêtre carrée de 24x24 pixels, est utilisée pour balayer la totalité de 15 l'image Io à l'exclusion des bandes 507a et 507b. A chaque déplacement de la fenêtre r0, un algorithme est mis en oeuvre pour déterminer si l'objet recherché se trouve ou non contenu dans la fenêtre r0 à des dimensions de l'ordre de celles de la fenêtre r0. 20 A l'étape 501, on cherche à détecter la présence éventuelle de l'objet à une distance de la caméra inférieure à la distance de recherche de l'étape 500 (échelle de recherche supérieure à celle de l'étape 500). Des zones d'exclusions de plus petites dimensions qu'à l'étape 500 sont définies dans 25 l'image Io, par exemple deux bandes horizontales 507a' et 507b' de 384x75 pixels s'étendant respectivement depuis le bord inférieur et depuis le bord supérieur de l'image Io. Une nouvelle fenêtre glissante de détection rl, de dimensions supérieures à celles de la fenêtre r0, est définie. A titre 30 d'exemple, les dimensions de la fenêtre r1 sont supérieures d'un facteur 1,5 à celles de la fenêtre r0. La totalité de l'image Io, à l'exclusion des bandes 507a' et 507b', est parcourue à l'aide de la fenêtre rl. A chaque déplacement de la fenêtre rl, un algorithme de détection est mis en oeuvre pour déterminer si 35 l'objet recherché se trouve ou non contenu dans la fenêtre r1 à B11660 - 12-GR2-0056FR01 13 des dimensions de l'ordre de celles de la fenêtre r1 ((24*1,5)x(24*1,5) = 36x36 pixels dans cet exemple). A l'étape 502, on cherche à détecter la présence éventuelle de l'objet à une distance relativement proche de la caméra (échelle de recherche supérieure à celle de l'étape 501). On prévoit de faire porter la recherche sur la totalité de l'image, sans exclure aucune zone de la recherche. L'étape 502 est par exemple identique à l'étape 202 du procédé de la figure 2.

Dans de nombreux cas (voir par exemple l'illustration en figure 3), les zones que l'on peut exclure de la recherche sont délimitées, sur une vue en coupe dans un plan vertical ou horizontal orthogonal à celui du capteur, par l'aire comprise entre une droite (respectivement 309a et 309b pour les zones 307a et 307b de la figure 3) et un bord extérieur du champ de la caméra (respectivement le bord inférieur 311a et le bord supérieur 311b pour les zones 307a et 307b de la figure 3). Dans un mode de réalisation préféré, on prévoit de définir, en fonction de la configuration du système de détection, un seuil haut d'échelle de recherche au-dessus duquel aucune zone de l'image d'origine n'est exclue de la recherche, ainsi qu'une fonction simple, par exemple une fonction affine (ou équation de droite), permettant, aux échelles de recherche inférieures à ce seuil, de calculer automatiquement, en fonction de l'échelle de recherche, les dimensions des zones de l'image Io que l'on peut exclure de la recherche. Alternativement, on peut prévoir de prédéfinir, pour chacune des échelles de recherche que l'on envisage d'utiliser pour détecter un objet sur une image d'origine Io donnée, les dimensions des zones de l'image Io qui peuvent être exclues de la recherche. Un avantage des modes de réalisation proposés est qu'ils permettent, par rapport aux procédés de recherche multiéchelle du type décrit en relation avec les figures 1 et 2, de 35 réduire de façon significative le nombre d'opérations de calcul B11660 - 12-GR2-0056FR01 14 qui doit être mis en oeuvre pour effectuer une recherche. On notera que le gain est d'autant plus important que, dans les procédés de recherche connus, ce sont les étapes de recherche aux échelles les plus petites qui comprennent habituellement le plus d'opérations de calcul. Or, dans les modes de réalisation proposés, c'est justement aux étapes de recherche aux échelles les plus petites que sont exclues de la recherche les plus grandes parties de l'image. La figure 6 illustre schématiquement un exemple d'un mode de réalisation d'un dispositif 600 de détection multiéchelle d'un objet dans une image. Le dispositif 600 comporte un capteur d'image 601 (IMAGE SENSOR), par exemple un capteur d'un dispositif d'acquisition d'images tel qu'une caméra, et une mémoire 602 (MEM) qui stocke des images prises par le capteur 601. Le dispositif 600 comprend en outre une unité de traitement et de calcul 603 (UC), par exemple un microprocesseur. L'unité de traitement 603 est configurée pour traiter des images prises par le capteur 601 et stockée dans la mémoire 602 selon un procédé du type décrit en relation avec les figures 4 et 5, pour rechercher la présence éventuelle d'un ou plusieurs objets à détecter dans ces images. Le dispositif 600 peut de plus comporter un dispositif d'affichage 604 (DISP), par exemple un écran d'affichage, pour indiquer à un utilisateur si un ou plusieurs des objets recherchés ont été détectés, et éventuellement afficher les images prises par le capteur 601. Des modes de réalisation particuliers de la présente invention ont été décrits. Diverses variantes et modifications apparaîtront à l'homme de l'art. En particulier, l'invention ne se restreint pas aux exemples numériques mentionnés ci-dessus à titre illustratif, notamment en ce qui concerne les dimensions des images, des fenêtres de détection, des zones d'exclusion de la recherche, des facteurs multiplicatifs de l'échelle de recherche entre deux étapes de recherche successives à des échelles distinctes, etc.

B11660 - 12-GR2-0056FR01 15 De plus, l'invention ne se restreint pas à l'exemple particulier décrit ci-dessus dans lequel les zones exclues de la recherche à certaines étapes de recherche sont des bandes horizontales en bas et en haut de l'image. Selon la configuration du système, et en particulier en fonction de l'orientation de la caméra et de la nature de la scène observée et des objets à détecter, d'autres formes de zones d'exclusion pourront être prévues, par exemple des bandes verticales, une forme complémentaire d'un diaphragme, etc.

De plus, on a décrit ci-dessus, en relation avec la figure 6, un exemple d'un mode de réalisation d'un dispositif de détection d'objet multi-échelle adapté à mettre en oeuvre un procédé du type décrit en relation avec les figures 4 et 5. L'homme de l'art saura prévoir d'autres dispositifs de traitement adaptés à mettre en oeuvre le fonctionnement recherché.

Claims

REVENDICATIONS1. Procédé de détection d'un objet dans une image (Io) au moyen d'un dispositif de traitement d'image, comprenant plusieurs étapes (400, 401, 402 ; 500, 501, 502) de recherche de l'objet dans l'image (Io) à des échelles de recherche distinctes, dans lequel à au moins une (400, 401 ; 500, 501) des étapes de recherche, des parties (407a, 407b ; 507a, 507b) de l'image (Io) sont exclues de la recherche, les dimensions desdites parties diminuant lorsque l'échelle de recherche augmente.
2. Procédé selon la revendication 1, dans lequel à chacune des étapes (400, 401, 402 ; 500, 501, 502) de recherche, une fenêtre glissante de détection (r0, r1, r2) est utilisée pour parcourir ladite image (10) ou une image redimensionnée (Il, 12) représentative de ladite image (Io), un algorithme de 15 détection étant mis en oeuvre à chaque déplacement de la fenêtre pour déterminer si l'objet recherché se trouve ou non contenu dans la fenêtre à des dimensions de l'ordre de celles de la fenêtre.
3. Procédé selon la revendication 2, dans lequel, 20 entre deux étapes (400, 401, 402) successives de recherche à des échelles de recherche distinctes, le changement d'échelle de recherche s'effectue en modifiant les dimensions de l'image (Io, 12) parcourue par ladite fenêtre (ro).
4. Procédé selon la revendication 2, dans lequel, 25 entre deux étapes (500, 501, 502) successives de recherche à des échelles de recherche distinctes, le changement d'échelle de recherche s'effectue en modifiant les dimensions de la fenêtre glissante (r0, rl, r2).
5. Procédé selon l'une quelconque des revendications 1 30 à 4, dans lequel, lorsque l'échelle de recherche est supérieure à un seuil, aucune partie de l'image (Io) n'est exclue de la recherche.
6. Procédé selon la revendication 5, dans lequel, lorsque l'échelle de recherche est inférieure audit seuil, lesB11660 - 12-GR2-0056FR01 17 dimensions des parties (407a, 407b, 407a', 407b' ; 507a, 507b, 507a', 507b') dépendent de l'échelle de recherche selon une fonction affine.
7. Procédé selon l'une quelconque des revendications 1 5 à 6, dans lequel l'objet à détecter est un visage.
8. Procédé selon l'une quelconque des revendications 1 à 6, dans lequel l'objet à détecter est un véhicule.
9. Dispositif (600) de détection d'un objet dans une image (I0), comportant une unité de traitement (603) et une 10 mémoire (602) apte à stocker ladite image (I0), l'unité de traitement (603) étant reliée à la mémoire (602) et étant configurée pour mettre en oeuvre plusieurs étapes (400, 401, 402 ; 500, 501, 502) de recherche de l'objet dans l'image (I0) à des échelles de recherche distinctes, et pour, à au moins une 15 (400, 401 ; 500, 501) des étapes de recherche, exclure de la recherche des parties (407a, 407b ; 507a, 507b) de l'image (I0), les dimensions desdites parties diminuant lorsque l'échelle de recherche augmente.