FR2989198A1 - Procede et dispositif de detection d'un objet dans une image - Google Patents

Procede et dispositif de detection d'un objet dans une image Download PDF

Info

Publication number
FR2989198A1
FR2989198A1 FR1253206A FR1253206A FR2989198A1 FR 2989198 A1 FR2989198 A1 FR 2989198A1 FR 1253206 A FR1253206 A FR 1253206A FR 1253206 A FR1253206 A FR 1253206A FR 2989198 A1 FR2989198 A1 FR 2989198A1
Authority
FR
France
Prior art keywords
image
search
window
dimensions
scale
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
FR1253206A
Other languages
English (en)
Inventor
Michel Sanches
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
STMicroelectronics Grenoble 2 SAS
Original Assignee
STMicroelectronics Grenoble 2 SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by STMicroelectronics Grenoble 2 SAS filed Critical STMicroelectronics Grenoble 2 SAS
Priority to FR1253206A priority Critical patent/FR2989198A1/fr
Priority to US13/619,819 priority patent/US20130266177A1/en
Publication of FR2989198A1 publication Critical patent/FR2989198A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • G06V10/7515Shifting the patterns to accommodate for positional errors

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

L'invention concerne un procédé de détection d'un objet dans une image (I ) au moyen d'un dispositif de traitement d'image, comprenant plusieurs étapes (400, 401, 402) de recherche de l'objet dans l'image (I ) à des échelles de recherche distinctes. A au moins une (400, 401) des étapes de recherche, des parties (407a, 407b) de l'image (I ) sont exclues de la recherche, les dimensions desdites parties diminuant lorsque l'échelle de recherche augmente.

Description

B11660 - 12-GR2-0056FR01 1 PROCÉDÉ ET DISPOSITIF DE DÉTECTION D'UN OBJET DANS UNE IMAGE Domaine de l'invention La présente invention concerne un procédé et un dispositif de détection automatique d'un ou plusieurs objets dans une image. Elle vise plus particulièrement un procédé et un dispositif de détection multi-échelle, c'est-à-dire permettant de détecter des objets dont on ne connaît pas à l'avance la taille dans l'image. Exposé de l'art antérieur Dans de nombreuses applications, on souhaite pouvoir détecter, dans une image prise par un capteur d'une caméra ou d'un appareil photographique, un objet dont on ne sait pas à l'avance à quelle distance il se trouvait du capteur au moment de la prise de vue, et dont on ne connaît par conséquent pas l'ordre de grandeur de la taille, en pixels, dans l'image. On retrouve par exemple cette problématique dans des systèmes de détection de véhicules sur des images prises par une caméra de vidéosurveillance routière, ou dans des systèmes de détection de visages. Les procédés de détection multi-échelle connus 20 prévoient de rechercher la présence éventuelle de l'objet dans l'image en parcourant l'image de manière exhaustive, à toutes les positions et à toutes les échelles de recherche possibles.
B11660 - 12-GR2-0056FR01 2 Des exemples de procédés de détection d'objet multi-échelle sont notamment décrits dans l'article "Robust Real-time Object Detection" de Paul Viola et Michael Jones. La figure 1 illustre schématiquement des étapes d'un exemple d'un procédé de détection multi-échelle d'un objet (non représenté) dans une image Io. Ce procédé comprend trois étapes successives 100, 101 et 102 de recherche de l'objet dans l'image Io, à trois échelles de recherche distinctes. A l'étape 100, une fenêtre glissante de détection r0 est définie. A titre d'exemple, l'image Io a une résolution de 384x288 pixels, correspondant par exemple à la résolution du capteur avec lequel l'image Io a été prise, et la fenêtre r0 est une fenêtre carrée de 24x24 pixels. La totalité de l'image Io est balayée en déplaçant la fenêtre glissante r0 d'un certain pas dans le sens horizontal et d'un certain pas dans le sens vertical, par exemple d'un pas de 1 pixel dans le sens horizontal et d'un pas de 1 pixel dans le sens vertical. A chaque déplacement de la fenêtre r0, un algorithme de détection est mis en oeuvre pour déterminer si l'objet recherché se trouve ou non contenu dans la fenêtre r0 à des dimensions de l'ordre de celles de la fenêtre r0. Ainsi, l'étape 100 permet, dans cet exemple, de détecter l'objet recherché si les dimensions de celui-ci dans l'image Io sont de l'ordre de 24x24 pixels. A l'étape 101, une deuxième recherche à une échelle de recherche supérieure à celle de l'étape 100 est mise en oeuvre. Une image I1 de plus petites dimensions que l'image Io est d'abord calculée, correspondant à une simulation d'une image que l'on aurait pu acquérir avec un capteur de plus faible résolution. A titre d'exemple, les dimensions de l'image I1 sont inférieures d'un facteur 1,5 aux dimensions de l'image Io, c'est-à-dire que, dans l'exemple susmentionné d'une image d'origine Io de 384x288 pixels, l'image I1 a une résolution de 256x192 pixels. L'image I1 peut être obtenue par l'enchaînement d'une étape de filtrage passe-bas ou moyennage de l'image Io, et d'une étape de sous-échantillonnage. La totalité de l'image B11660 - 12-GR2-0056FR01 3 est ensuite balayée en utilisant la même fenêtre glissante de détection r0 que celle utilisée à l'étape 100. A chaque déplacement de la fenêtre r0, un algorithme de détection est mis en oeuvre pour déterminer si l'objet recherché est ou non contenu dans la fenêtre r0 à des dimensions de l'ordre de celles de la fenêtre r0. L'étape 101 permet donc, dans cet exemple, de détecter l'objet recherché si les dimensions de celui-ci dans l'image I1 sont de l'ordre de 24x24 pixels, c'est-à-dire si ses dimensions dans l'image Io sont de l'ordre de (1,5*24)x(1,5*24) = 36x36 pixels. A l'étape 102, une troisième recherche à une échelle de recherche supérieure à celle de l'étape 101 est mise en oeuvre. Une image 12 de plus petites dimensions que l'image est calculée à partir de l'image I1 ou à partir de l'image Io. A 15 titre d'exemple, les dimensions de l'image 12 peuvent être inférieures d'un facteur 1,5 aux dimensions de l'image c'est-à-dire que dans l'exemple susmentionné, l'image 12 a une résolution de 170x128 pixels. La totalité de l'image 12 est parcourue en utilisant la même fenêtre glissante r0 que celle 20 utilisée aux étapes 100 et 101. A chaque déplacement de la fenêtre r0, un algorithme de détection est mis en oeuvre pour déterminer si l'objet recherché est ou non contenu dans la fenêtre r0 à des dimensions de l'ordre de celles de la fenêtre r0. L'étape 102 permet donc, dans cet exemple, de détecter 25 l'objet recherché si les dimensions de celui-ci dans l'image 12 sont de l'ordre de 24x24 pixels, c'est-à-dire si ses dimensions dans l'image Io sont de l'ordre de (1,5*1,5*24)x(1,5*1,5*24) = 54x54 pixels. La figure 2 illustre schématiquement des étapes d'un 30 autre exemple d'un procédé de détection multi-échelle d'un objet (non représenté) dans une image Io. Ce procédé comprend trois étapes successives 200, 201 et 202 de recherche de l'objet dans l'image Io, à trois échelles de recherche distinctes. L'étape 200 est identique à l'étape 100 du procédé de 35 la figure 1, c'est-à-dire que la totalité de l'image Io est B11660 - 12-GR2-0056FR01 4 balayée à l'aide d'une fenêtre glissante de détection r0, par exemple une fenêtre de 24x24 pixels pour une image Io de 384x288 pixels. A chaque déplacement de la fenêtre r0, un algorithme de détection est mis en oeuvre pour déterminer si l'objet recherché se trouve ou non contenu dans la fenêtre r0 à des dimensions de l'ordre de celles de la fenêtre r0. A l'étape 201, une deuxième recherche à une échelle de recherche supérieure à celle de l'étape 200 est mise en oeuvre. Une nouvelle fenêtre glissante de détection rl, de dimensions supérieures à celles de la fenêtre r0, est définie. A titre d'exemple, les dimensions de la fenêtre r1 sont supérieures d'un facteur 1,5 à celles de la fenêtre r0. La totalité de l'image Io est parcourue à l'aide de la fenêtre rl. A chaque déplacement de la fenêtre rl, un algorithme de détection est mis en oeuvre pour déterminer si l'objet recherché se trouve ou non contenu dans la fenêtre r1 à des dimensions de l'ordre de celles de la fenêtre r1 ((24*1,5)x(24*1,5) = 36x36 pixels dans cet exemple). A l'étape 202, une troisième recherche à une échelle de recherche supérieure à celle de l'étape 201 est mise en oeuvre. Une nouvelle fenêtre glissante de détection r2, de dimensions supérieures à celles de la fenêtre rl, est définie. A titre d'exemple, les dimensions de la fenêtre r2 sont 1,5 fois supérieures aux dimensions de la fenêtre rl. La totalité de l'image Io est parcourue à l'aide de la fenêtre r2. A chaque déplacement de la fenêtre r2, un algorithme de détection est mis en oeuvre pour déterminer si l'objet recherché se trouve ou non contenu dans la fenêtre r2 à des dimensions de l'ordre de celles de la fenêtre r2 ((1,5*1,5*24)x(1,5*1,5*24) = 54x54 pixels dans cet exemple).
Dans les exemples des figures 1 et 2, par souci de simplification, seules 3 étapes successives de recherche de l'objet dans l'image Io à des échelles de recherche distinctes ont été représentées et décrites. En pratique, le nombre d'étapes de recherche à des échelles distinctes peut être plus élevé, par exemple supérieur à 10, ce nombre et le facteur B11660 - 12-GR2-0056FR01 multiplicatif de l'échelle de recherche entre deux étapes de recherche successives pouvant être adaptés en fonction des performances de détection visées. Un inconvénient des procédés de détection multi- 5 échelle du type décrit en relation avec les figures 1 et 2 est qu'ils mettent en oeuvre un nombre important d'opérations de calcul, ce qui limite le nombre maximal d'images qui peut être traité par unité de temps. Résumé Ainsi, un objet d'un mode de réalisation de la présente invention est de prévoir un procédé de détection multiéchelle d'un objet dans une image, palliant au moins en partie certains des inconvénients des procédés connus. Un objet d'un mode de réalisation de la présente 15 invention est de prévoir un procédé de détection multi-échelle d'un objet dans une image, mettant en oeuvre moins d'opérations de calcul que les procédés connus. Un autre objet d'un mode de réalisation de la présente invention est de prévoir un dispositif de détection multi20 échelle d'un objet dans une image. Ainsi, un mode de réalisation de la présente invention prévoit un procédé de détection d'un objet dans une image au moyen d'un dispositif de traitement d'image, comprenant plusieurs étapes de recherche de l'objet dans l'image à des 25 échelles de recherche distinctes, dans lequel à au moins une des étapes de recherche, des parties de l'image sont exclues de la recherche, les dimensions desdites parties diminuant lorsque l'échelle de recherche augmente. Selon un mode de réalisation, à chacune des étapes de 30 recherche, une fenêtre glissante de détection est utilisée pour parcourir ladite image ou une image redimensionnée représentative de ladite image, un algorithme de détection étant mis en oeuvre à chaque déplacement de la fenêtre pour déterminer si l'objet recherché se trouve ou non contenu dans la fenêtre à des 35 dimensions de l'ordre de celles de la fenêtre.
B11660 - 12-GR2-0056FR01 6 Selon un mode de réalisation, entre deux étapes successives de recherche à des échelles de recherche distinctes, le changement d'échelle de recherche s'effectue en modifiant les dimensions de l'image parcourue par ladite fenêtre.
Selon un mode de réalisation, entre deux étapes successives de recherche à des échelles de recherche distinctes, le changement d'échelle de recherche s'effectue en modifiant les dimensions de la fenêtre glissante. Selon un mode de réalisation, lorsque l'échelle de 10 recherche est supérieure à un seuil, aucune partie de l'image n'est exclue de la recherche. Selon un mode de réalisation, lorsque l'échelle de recherche est inférieure audit seuil, les dimensions des parties dépendent de l'échelle de recherche selon une fonction affine. 15 Selon un mode de réalisation, l'objet à détecter est un visage. Selon un mode de réalisation, l'objet à détecter est un véhicule. Un mode de réalisation de la présente invention 20 prévoit également un dispositif de détection d'un objet dans une image, comportant une unité de traitement et une mémoire apte à stocker ladite image, l'unité de traitement étant reliée à la mémoire et étant configurée pour mettre en oeuvre plusieurs étapes de recherche de l'objet dans l'image à des échelles de 25 recherche distinctes, et pour, à au moins une des étapes de recherche, exclure de la recherche des parties de l'image, les dimensions desdites parties diminuant lorsque l'échelle de recherche augmente. Brève description des dessins 30 Ces objets, caractéristiques et avantages, ainsi que d'autres seront exposés en détail dans la description suivante de modes de réalisation particuliers faite à titre non limitatif en relation avec les figures jointes parmi lesquelles : B11660 - 12-GR2-0056FR01 7 la figure 1, précédemment décrite, illustre schématiquement des étapes d'un exemple d'un procédé de détection multi-échelle d'un objet dans une image ; la figure 2, précédemment décrite, illustre schéma-5 tiquement des étapes d'un autre exemple d'un procédé de détection multi-échelle d'un objet dans une image ; la figure 3 illustre schématiquement un système de détection automatique de visages ; la figure 4 illustre schématiquement des étapes d'un 10 mode de réalisation d'un procédé de détection multi-échelle d'un objet dans une image ; la figure 5 illustre schématiquement des étapes d'une variante de réalisation du procédé de détection multi-échelle de la figure 4 ; et 15 la figure 6 illustre schématiquement un exemple d'un mode de réalisation d'un dispositif de détection multi-échelle d'un objet dans une image. Description détaillée Par souci de clarté, de mêmes éléments ont été 20 désignés par de mêmes références aux différentes figures et, de plus, les diverses figures ne sont pas tracées à l'échelle. En outre, seuls les éléments utiles à la compréhension de l'invention ont été décrits. En particulier, les algorithmes susceptibles d'être utilisés pour détecter si l'objet recherché 25 est ou non contenu dans une fenêtre glissante de détection à des dimensions de l'ordre de celles de la fenêtre, n'ont pas été décrits, les modes de réalisation décrits étant compatibles avec tous les algorithmes de détection connus. La figure 3 représente, à titre illustratif et de 30 façon schématique, un exemple d'un système de détection automatique de visages comprenant une caméra 301 maintenue au-dessus du sol, par exemple à environ 1,5 m de hauteur, par un pied de support 303. Le système est configuré pour détecter automatiquement la présence éventuelle d'un visage 305 dans le 35 champ de la caméra 301, à une distance de la caméra pouvant B11660 - 12-GR2-0056FR01 8 aller par exemple de quelques dizaines de centimètres à plusieurs mètres. Lorsque le visage 305 est éloigné de la caméra, il occupe seulement une petite partie de l'image prise par la caméra. En revanche, lorsque le visage 305 est proche de la caméra, il occupe une grande partie voire la totalité de l'image prise par la caméra. Au-dessus d'une distance d de la caméra dépendant notamment de l'agencement et de la configuration du système, il existe des parties du champ de la caméra dans lesquelles il est en pratique impossible qu'un visage soit présent. A titre d'exemple, sur la figure 3, il est en pratique impossible ou très peu probable qu'un visage soit présent dans les régions hachurées 307a et 307b du champ de la caméra, correspondant respectivement à la partie inférieure du champ de la caméra, située par exemple à moins de quelques dizaines de centimètres au-dessus du sol, et à la partie supérieure du champ de la caméra, située par exemple à plus de 2,5 mètres au-dessus du sol.
De façon générale, dans la plupart des systèmes de détection automatique d'objets, il existe, au-delà d'une certaine distance de la caméra, des parties du champ de la caméra dans lesquelles il est en pratique impossible ou très peu probable que l'objet à détecter soit présent.
Dans les procédés de détection multi-échelle connus, comme on ne sait pas à l'avance à quelle distance de la caméra se trouvait l'objet à détecter au moment de la prise de vue, on prévoit de rechercher l'objet en parcourant l'image de manière exhaustive, à toutes les positions, comme cela a été décrit en relation avec les figures 1 et 2. Selon un aspect d'un mode de réalisation, on prévoit un procédé de détection multi-échelle d'un objet dans une image, comprenant plusieurs étapes de recherche de l'objet dans l'image à des échelles de recherche distinctes, dans lequel lors des étapes de recherche aux échelles les plus petites, des zones de B11660 - 12-GR2-0056FR01 9 l'image sont exclues de la recherche, les dimensions de ces zones à l'échelle de l'image d'origine diminuant lorsque l'échelle de recherche augmente. Lorsque l'échelle de recherche dépasse un seuil, les zones exclues de la recherche peuvent éventuellement disparaître totalement. On notera que dans la présente description, on entend par échelle de recherche le rapport entre l'ordre de grandeur de la taille, en pixels dans l'image d'origine, de l'objet recherché, et les dimensions de l'image d'origine. Il existe une relation de correspondance entre l'échelle de recherche utilisée à une étape de recherche donnée, et l'ordre de grandeur de la distance présumée entre le capteur et l'objet recherché au moment de la prise de vue. On utilise une échelle de recherche d'autant plus grande que l'on recherche un objet proche de la caméra, et une échelle d'autant plus petite que l'on recherche un objet éloigné de la caméra. Dans les exemples des figures 1 et 2, à chaque étape de recherche, on peut définir une échelle de recherche horizontale comme étant le rapport de la dimension horizontale de la fenêtre glissante de détection sur la dimension horizontale de l'image balayée par cette fenêtre, et une échelle de recherche verticale comme étant le rapport de la dimension verticale de la fenêtre glissante sur la dimension verticale de l'image balayée par cette fenêtre. A titre d'illustration, les échelles de recherche horizontales aux étapes 100, 101, 102, 200, 201 et 202 des procédés des figures 1 et 2 sont respectivement de 24/384, 24/256, 24/170, 24/384, 36/384, et 54/384, et les échelles de recherche verticales à ces mêmes étapes sont respectivement de 24/288, 24/192, 24/128, 24/288, 36/288, et 54/288.
La figure 4 illustre schématiquement des étapes d'un mode de réalisation d'un procédé de recherche multi-échelle d'un objet (non représenté) dans une image I. Dans l'exemple représenté, le procédé comprend trois étapes 400, 401 et 402 de recherche de l'objet dans l'image Io, à trois échelles de recherche distinctes.
B11660 - 12-GR2-0056FR01 10 A l'étape 400, on cherche à détecter la présence éventuelle de l'objet à une distance relativement importante de la caméra (petite échelle de recherche). A cette distance, il existe des régions du champ de la caméra dans lesquelles il est en pratique impossible ou très peu probable que l'objet recherché se situe. On prévoit d'exclure de la recherche les zones de l'image correspondant à ces régions. Dans l'exemple représenté, une bande horizontale inférieure 407a et une bande horizontale supérieure 407b de l'image Io sont exclues de la recherche à l'étape 400, correspondant respectivement à une partie inférieure et à une partie supérieure du champ de la caméra (configuration du type illustré par la figure 3). A titre d'exemple, l'image Io a une résolution de 384x288 pixels, et les bandes 407a et 407b ont chacune des dimensions de 384x100 pixels. Une fenêtre glissante de détection r0, par exemple une fenêtre carrée de 24x24 pixels, est utilisée pour balayer la totalité de l'image Io à l'exclusion des bandes 407a et 407b. A chaque déplacement de la fenêtre r0, un algorithme est mis en oeuvre pour déterminer si l'objet recherché se trouve ou non contenu dans la fenêtre r0 à des dimensions de l'ordre de celles de la fenêtre r0. A l'étape 401, on cherche à détecter la présence éventuelle de l'objet à une distance de la caméra inférieure à la distance de recherche à l'étape 400 (échelle de recherche supérieure à celle de l'étape 400). A cette distance, il existe encore des régions du champ de la caméra dans lesquelles il est en pratique impossible ou très peu probable que l'objet recherché se situe. On prévoit d'exclure de la recherche les zones de l'image correspondant à ces régions, étant entendu que ces zones sont, à l'échelle de l'image Io, plus petites que les zones 407a et 407b exclues à l'étape 400 (voir l'illustration en figure 3). A titre d'exemple, dans le cas susmentionné où l'image d'origine Io a une résolution de 384x288 pixels et où les zones 407a et 407b sont deux bandes horizontales de 384x100 pixels, on peut prévoir, à l'étape 401, d'exclure de la B11660 - 12-GR2-0056FR01 11 recherche deux bandes horizontales de 384x75 pixels (à l'échelle de l'image Io). Une image I1 de plus petites dimensions que l'image Io est d'abord calculée, correspondant à une simulation d'une image que l'on aurait pu acquérir avec un capteur de plus faible résolution. A titre d'exemple, les dimensions de l'image sont inférieures d'un facteur 1,5 aux dimensions de l'image Io. A l'échelle de l'image I1, les zones exclues de la recherche sont donc, dans cet exemple, deux bandes horizontales 407a' et 407b' de (384/1,5)x(75/1,5) = 192x50 pixels, s'étendant respec- tivement depuis le bord inférieur et depuis le bord supérieur de l'image I1. L'image I1, à l'exclusion des zones 407a' et 407b', est ensuite balayée en utilisant la même fenêtre de détection r0 qu'à l'étape 400. A chaque déplacement de la fenêtre r0, un algorithme est mis en oeuvre pour déterminer si l'objet recherché se trouve ou non contenu dans la fenêtre r0 à des dimensions de l'ordre de celles de la fenêtre r0. L'étape 401 permet donc, dans cet exemple, de détecter l'objet recherché si les dimensions de celui-ci dans l'image I1 sont de l'ordre de 24x24 pixels, c'est-à-dire si ses dimensions dans l'image Io sont de l'ordre de (1,5*24)x(1,5*24) = 36x36 pixels. A l'étape 402, on cherche à détecter la présence éventuelle de l'objet à une distance relativement proche de la caméra (échelle de recherche supérieure à celle de l'étape 401). A cette distance, l'objet peut se trouver n'importe où dans l'image prise par la caméra. On prévoit donc de faire porter la recherche sur la totalité de l'image, sans exclure aucune zone de la recherche. L'étape 402 est par exemple identique à l'étape 102 du procédé de la figure 1. La figure 5 illustre schématiquement des étapes d'une variante de réalisation du procédé de recherche multi-échelle de la figure 4, correspondant au cas où, entre deux étapes de recherche à des échelles de recherche distinctes, l'échelle de recherche est modifiée non pas en réduisant les dimensions de l'image balayée (comme dans les exemples des figures 1 et 4), B11660 - 12-GR2-0056FR01 12 mais en augmentant les dimensions de la fenêtre glissante de détection (comme dans l'exemple de la figure 2). Dans l'exemple représenté, on prévoit trois étapes 500, 501 et 502 de recherche de l'objet dans l'image Io, à trois 5 échelles de recherche distinctes. A l'étape 500, on cherche à détecter la présence éventuelle de l'objet à une distance relativement importante de la caméra (petite échelle de recherche). Des zones d'exclusion de la recherche sont définies dans l'image Io, par exemple deux 10 bandes horizontales 507a et 507b de 384x100 pixels pour une image Io de 384x288 pixels, s'étendant respectivement depuis le bord inférieur et depuis le bord supérieur de l'image Io. Une fenêtre glissante de détection r0, par exemple une fenêtre carrée de 24x24 pixels, est utilisée pour balayer la totalité de 15 l'image Io à l'exclusion des bandes 507a et 507b. A chaque déplacement de la fenêtre r0, un algorithme est mis en oeuvre pour déterminer si l'objet recherché se trouve ou non contenu dans la fenêtre r0 à des dimensions de l'ordre de celles de la fenêtre r0. 20 A l'étape 501, on cherche à détecter la présence éventuelle de l'objet à une distance de la caméra inférieure à la distance de recherche de l'étape 500 (échelle de recherche supérieure à celle de l'étape 500). Des zones d'exclusions de plus petites dimensions qu'à l'étape 500 sont définies dans 25 l'image Io, par exemple deux bandes horizontales 507a' et 507b' de 384x75 pixels s'étendant respectivement depuis le bord inférieur et depuis le bord supérieur de l'image Io. Une nouvelle fenêtre glissante de détection rl, de dimensions supérieures à celles de la fenêtre r0, est définie. A titre 30 d'exemple, les dimensions de la fenêtre r1 sont supérieures d'un facteur 1,5 à celles de la fenêtre r0. La totalité de l'image Io, à l'exclusion des bandes 507a' et 507b', est parcourue à l'aide de la fenêtre rl. A chaque déplacement de la fenêtre rl, un algorithme de détection est mis en oeuvre pour déterminer si 35 l'objet recherché se trouve ou non contenu dans la fenêtre r1 à B11660 - 12-GR2-0056FR01 13 des dimensions de l'ordre de celles de la fenêtre r1 ((24*1,5)x(24*1,5) = 36x36 pixels dans cet exemple). A l'étape 502, on cherche à détecter la présence éventuelle de l'objet à une distance relativement proche de la caméra (échelle de recherche supérieure à celle de l'étape 501). On prévoit de faire porter la recherche sur la totalité de l'image, sans exclure aucune zone de la recherche. L'étape 502 est par exemple identique à l'étape 202 du procédé de la figure 2.
Dans de nombreux cas (voir par exemple l'illustration en figure 3), les zones que l'on peut exclure de la recherche sont délimitées, sur une vue en coupe dans un plan vertical ou horizontal orthogonal à celui du capteur, par l'aire comprise entre une droite (respectivement 309a et 309b pour les zones 307a et 307b de la figure 3) et un bord extérieur du champ de la caméra (respectivement le bord inférieur 311a et le bord supérieur 311b pour les zones 307a et 307b de la figure 3). Dans un mode de réalisation préféré, on prévoit de définir, en fonction de la configuration du système de détection, un seuil haut d'échelle de recherche au-dessus duquel aucune zone de l'image d'origine n'est exclue de la recherche, ainsi qu'une fonction simple, par exemple une fonction affine (ou équation de droite), permettant, aux échelles de recherche inférieures à ce seuil, de calculer automatiquement, en fonction de l'échelle de recherche, les dimensions des zones de l'image Io que l'on peut exclure de la recherche. Alternativement, on peut prévoir de prédéfinir, pour chacune des échelles de recherche que l'on envisage d'utiliser pour détecter un objet sur une image d'origine Io donnée, les dimensions des zones de l'image Io qui peuvent être exclues de la recherche. Un avantage des modes de réalisation proposés est qu'ils permettent, par rapport aux procédés de recherche multiéchelle du type décrit en relation avec les figures 1 et 2, de 35 réduire de façon significative le nombre d'opérations de calcul B11660 - 12-GR2-0056FR01 14 qui doit être mis en oeuvre pour effectuer une recherche. On notera que le gain est d'autant plus important que, dans les procédés de recherche connus, ce sont les étapes de recherche aux échelles les plus petites qui comprennent habituellement le plus d'opérations de calcul. Or, dans les modes de réalisation proposés, c'est justement aux étapes de recherche aux échelles les plus petites que sont exclues de la recherche les plus grandes parties de l'image. La figure 6 illustre schématiquement un exemple d'un mode de réalisation d'un dispositif 600 de détection multiéchelle d'un objet dans une image. Le dispositif 600 comporte un capteur d'image 601 (IMAGE SENSOR), par exemple un capteur d'un dispositif d'acquisition d'images tel qu'une caméra, et une mémoire 602 (MEM) qui stocke des images prises par le capteur 601. Le dispositif 600 comprend en outre une unité de traitement et de calcul 603 (UC), par exemple un microprocesseur. L'unité de traitement 603 est configurée pour traiter des images prises par le capteur 601 et stockée dans la mémoire 602 selon un procédé du type décrit en relation avec les figures 4 et 5, pour rechercher la présence éventuelle d'un ou plusieurs objets à détecter dans ces images. Le dispositif 600 peut de plus comporter un dispositif d'affichage 604 (DISP), par exemple un écran d'affichage, pour indiquer à un utilisateur si un ou plusieurs des objets recherchés ont été détectés, et éventuellement afficher les images prises par le capteur 601. Des modes de réalisation particuliers de la présente invention ont été décrits. Diverses variantes et modifications apparaîtront à l'homme de l'art. En particulier, l'invention ne se restreint pas aux exemples numériques mentionnés ci-dessus à titre illustratif, notamment en ce qui concerne les dimensions des images, des fenêtres de détection, des zones d'exclusion de la recherche, des facteurs multiplicatifs de l'échelle de recherche entre deux étapes de recherche successives à des échelles distinctes, etc.
B11660 - 12-GR2-0056FR01 15 De plus, l'invention ne se restreint pas à l'exemple particulier décrit ci-dessus dans lequel les zones exclues de la recherche à certaines étapes de recherche sont des bandes horizontales en bas et en haut de l'image. Selon la configuration du système, et en particulier en fonction de l'orientation de la caméra et de la nature de la scène observée et des objets à détecter, d'autres formes de zones d'exclusion pourront être prévues, par exemple des bandes verticales, une forme complémentaire d'un diaphragme, etc.
De plus, on a décrit ci-dessus, en relation avec la figure 6, un exemple d'un mode de réalisation d'un dispositif de détection d'objet multi-échelle adapté à mettre en oeuvre un procédé du type décrit en relation avec les figures 4 et 5. L'homme de l'art saura prévoir d'autres dispositifs de traitement adaptés à mettre en oeuvre le fonctionnement recherché.

Claims (9)

  1. REVENDICATIONS1. Procédé de détection d'un objet dans une image (Io) au moyen d'un dispositif de traitement d'image, comprenant plusieurs étapes (400, 401, 402 ; 500, 501, 502) de recherche de l'objet dans l'image (Io) à des échelles de recherche distinctes, dans lequel à au moins une (400, 401 ; 500, 501) des étapes de recherche, des parties (407a, 407b ; 507a, 507b) de l'image (Io) sont exclues de la recherche, les dimensions desdites parties diminuant lorsque l'échelle de recherche augmente.
  2. 2. Procédé selon la revendication 1, dans lequel à chacune des étapes (400, 401, 402 ; 500, 501, 502) de recherche, une fenêtre glissante de détection (r0, r1, r2) est utilisée pour parcourir ladite image (10) ou une image redimensionnée (Il, 12) représentative de ladite image (Io), un algorithme de 15 détection étant mis en oeuvre à chaque déplacement de la fenêtre pour déterminer si l'objet recherché se trouve ou non contenu dans la fenêtre à des dimensions de l'ordre de celles de la fenêtre.
  3. 3. Procédé selon la revendication 2, dans lequel, 20 entre deux étapes (400, 401, 402) successives de recherche à des échelles de recherche distinctes, le changement d'échelle de recherche s'effectue en modifiant les dimensions de l'image (Io, 12) parcourue par ladite fenêtre (ro).
  4. 4. Procédé selon la revendication 2, dans lequel, 25 entre deux étapes (500, 501, 502) successives de recherche à des échelles de recherche distinctes, le changement d'échelle de recherche s'effectue en modifiant les dimensions de la fenêtre glissante (r0, rl, r2).
  5. 5. Procédé selon l'une quelconque des revendications 1 30 à 4, dans lequel, lorsque l'échelle de recherche est supérieure à un seuil, aucune partie de l'image (Io) n'est exclue de la recherche.
  6. 6. Procédé selon la revendication 5, dans lequel, lorsque l'échelle de recherche est inférieure audit seuil, lesB11660 - 12-GR2-0056FR01 17 dimensions des parties (407a, 407b, 407a', 407b' ; 507a, 507b, 507a', 507b') dépendent de l'échelle de recherche selon une fonction affine.
  7. 7. Procédé selon l'une quelconque des revendications 1 5 à 6, dans lequel l'objet à détecter est un visage.
  8. 8. Procédé selon l'une quelconque des revendications 1 à 6, dans lequel l'objet à détecter est un véhicule.
  9. 9. Dispositif (600) de détection d'un objet dans une image (I0), comportant une unité de traitement (603) et une 10 mémoire (602) apte à stocker ladite image (I0), l'unité de traitement (603) étant reliée à la mémoire (602) et étant configurée pour mettre en oeuvre plusieurs étapes (400, 401, 402 ; 500, 501, 502) de recherche de l'objet dans l'image (I0) à des échelles de recherche distinctes, et pour, à au moins une 15 (400, 401 ; 500, 501) des étapes de recherche, exclure de la recherche des parties (407a, 407b ; 507a, 507b) de l'image (I0), les dimensions desdites parties diminuant lorsque l'échelle de recherche augmente.
FR1253206A 2012-04-06 2012-04-06 Procede et dispositif de detection d'un objet dans une image Withdrawn FR2989198A1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
FR1253206A FR2989198A1 (fr) 2012-04-06 2012-04-06 Procede et dispositif de detection d'un objet dans une image
US13/619,819 US20130266177A1 (en) 2012-04-06 2012-09-14 Method and Device for Detecting an Object in an Image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR1253206A FR2989198A1 (fr) 2012-04-06 2012-04-06 Procede et dispositif de detection d'un objet dans une image

Publications (1)

Publication Number Publication Date
FR2989198A1 true FR2989198A1 (fr) 2013-10-11

Family

ID=46229783

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1253206A Withdrawn FR2989198A1 (fr) 2012-04-06 2012-04-06 Procede et dispositif de detection d'un objet dans une image

Country Status (2)

Country Link
US (1) US20130266177A1 (fr)
FR (1) FR2989198A1 (fr)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3005297B1 (fr) * 2013-06-04 2023-09-06 HRL Laboratories, LLC Système de détection d'un objet présentant un intérêt dans une scène
US10002430B1 (en) 2013-06-04 2018-06-19 Hrl Laboratories, Llc Training system for infield training of a vision-based object detector
US10477159B1 (en) * 2014-04-03 2019-11-12 Waymo Llc Augmented reality display for identifying vehicles to preserve user privacy
US9646389B2 (en) 2014-08-26 2017-05-09 Qualcomm Incorporated Systems and methods for image scanning
JP6095817B1 (ja) * 2016-03-02 2017-03-15 三菱電機マイコン機器ソフトウエア株式会社 物体検出装置
KR102619326B1 (ko) * 2016-12-01 2024-01-02 주식회사 에이치엘클레무브 이미지 피라미드를 이용한 차량 인식 장치 및 방법
WO2018121841A1 (fr) * 2016-12-27 2018-07-05 Telecom Italia S.P.A. Procédé et système d'identification de cibles dans des scènes filmées par une caméra
CN108363962B (zh) * 2018-01-25 2021-01-26 南京邮电大学 一种基于多层次特征深度学习的人脸检测方法及系统
CN109376637B (zh) * 2018-10-15 2021-03-02 齐鲁工业大学 基于视频监控图像处理的人数统计系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5657362A (en) * 1995-02-24 1997-08-12 Arch Development Corporation Automated method and system for computerized detection of masses and parenchymal distortions in medical images
US6292575B1 (en) * 1998-07-20 2001-09-18 Lau Technologies Real-time facial recognition and verification system
US6711293B1 (en) * 1999-03-08 2004-03-23 The University Of British Columbia Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image
EP1091560A1 (fr) * 1999-10-05 2001-04-11 Hewlett-Packard Company Méthode et appareil pour balayer des documents de trop grandes dimensions
GB2367966B (en) * 2000-10-09 2003-01-15 Motorola Inc Method and apparatus for determining regions of interest in images and for image transmission
GB2395778A (en) * 2002-11-29 2004-06-02 Sony Uk Ltd Face detection
US7343028B2 (en) * 2003-05-19 2008-03-11 Fujifilm Corporation Method and apparatus for red-eye detection
GB2409028A (en) * 2003-12-11 2005-06-15 Sony Uk Ltd Face detection
US7382897B2 (en) * 2004-04-27 2008-06-03 Microsoft Corporation Multi-image feature matching using multi-scale oriented patches
ES2384928B1 (es) * 2010-06-25 2013-05-20 Telefónica, S.A. Método y sistema para la identificación rápida y robusta de productos específicos en imágenes.

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
"Computer vision, a modern approach, 2nd edition", 26 October 2011, PRENTICE HALL, ISBN: 978-0-13-608592-8, article FORSYTH ET AL: "Detecting objets in Images", pages: 519 - 530, XP055042891 *
DOLLAR P ET AL: "Pedestrian detection: A benchmark", COMPUTER VISION AND PATTERN RECOGNITION, 2009. CVPR 2009. IEEE CONFERENCE ON, IEEE, PISCATAWAY, NJ, USA, 20 June 2009 (2009-06-20), pages 304 - 311, XP031607158, ISBN: 978-1-4244-3992-8 *
ENZWEILER M ET AL: "Monocular Pedestrian Detection: Survey and Experiments", IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, IEEE SERVICE CENTER, LOS ALAMITOS, CA, US, vol. 30, no. 12, 1 December 2009 (2009-12-01), pages 2179 - 2195, XP011292847, ISSN: 0162-8828 *
ENZWEILER M ET AL: "Monocular pedestrian recognition using motion parallax", INTELLIGENT VEHICLES SYMPOSIUM, 2008 IEEE, IEEE, PISCATAWAY, NJ, USA, 4 June 2008 (2008-06-04), pages 792 - 797, XP031318814, ISBN: 978-1-4244-2568-6 *
GAVRILA D M ET AL: "Multi-cue Pedestrian Detection and Tracking from a Moving Vehicle", INTERNATIONAL JOURNAL OF COMPUTER VISION, KLUWER ACADEMIC PUBLISHERS, BO, vol. 73, no. 1, 17 July 2006 (2006-07-17), pages 41 - 59, XP019468627, ISSN: 1573-1405 *
PATRICK SUDOWE ET AL: "Efficient Use of Geometric Constraints for Sliding-Window Object Detection in Video", 20 September 2011, COMPUTER VISION SYSTEMS, SPRINGER BERLIN HEIDELBERG, BERLIN, HEIDELBERG, PAGE(S) 11 - 20, ISBN: 978-3-642-23967-0, XP019165824 *

Also Published As

Publication number Publication date
US20130266177A1 (en) 2013-10-10

Similar Documents

Publication Publication Date Title
FR2989198A1 (fr) Procede et dispositif de detection d'un objet dans une image
FR3081248A1 (fr) Systeme et procede de determination d’un emplacement pour le placement d'un paquet
EP2880623B1 (fr) Procede et dispositif pour la reconstruction d'images a super-resolution
US9305239B2 (en) Detecting and processing small text in digital media
EP3234913A1 (fr) Procede de detection de defaut sur une surface de pneumatique
EP3314888B1 (fr) Correction de pixels parasites dans un capteur d'image infrarouge
KR102134985B1 (ko) 에어 포켓 검출 방법 및 시스템
FR3014229A1 (fr) Reconnaissance de formes par correction d'image
EP1656650B1 (fr) Procede et systeme pour detecter un corps dans une zone situee a proximite d une interface
EP2988249B1 (fr) Procédé de détermination, dans une image, d'au moins une zone susceptible de représenter au moins un doigt d'un individu
EP3216213B1 (fr) Procédé de détection de pixels défectueux
FR3062223A1 (fr) Detection d'obstacles dans l'environnement d'un vehicule automobile par traitement d'images
FR3011960A1 (fr) Procede d'identification a partir d'un modele spatial et spectral d'objet
EP1340103B8 (fr) Procede pour detecter des corps nouveaux dans une scene eclairee
JP7234630B2 (ja) 付着物検出装置
FR2950451A1 (fr) Algorithme de detection des points de contour dans une image
EP3170205A1 (fr) Dispositif de détection de mouvement
EP2877979B1 (fr) Methode monocamera de determination d'une direction d'un solide
JP2014053859A (ja) 移動体観測装置
EP3072110B1 (fr) Procédé d'estimation du mouvement d'un objet
WO2010020624A1 (fr) Procédé de télémesure métrique
WO2012042169A1 (fr) Procédé d'imagerie d'une conduite longitudinale
EP2904543B1 (fr) Procédé de comptage de personnes pour appareil stéréoscopique et appareil stéréoscopique de comptage de personnes correspondant
Horita et al. Omni-directional polarization image sensor based on an omni-directional camera and a polarization filter
WO2017187059A1 (fr) Methode de reglage d'un appareil de prise de vue stereoscopique

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20141231