FR2875628A1 - Procede et dispositif de calcul d'un descripteur d'image numerique et procede et dispositif de verification d'images numeriques associes - Google Patents

Procede et dispositif de calcul d'un descripteur d'image numerique et procede et dispositif de verification d'images numeriques associes Download PDF

Info

Publication number
FR2875628A1
FR2875628A1 FR0410089A FR0410089A FR2875628A1 FR 2875628 A1 FR2875628 A1 FR 2875628A1 FR 0410089 A FR0410089 A FR 0410089A FR 0410089 A FR0410089 A FR 0410089A FR 2875628 A1 FR2875628 A1 FR 2875628A1
Authority
FR
France
Prior art keywords
image
images
distance
descriptor
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR0410089A
Other languages
English (en)
Other versions
FR2875628B1 (fr
Inventor
Floch Herve Le
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Research Center France SAS
Original Assignee
Canon Research Center France SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Research Center France SAS filed Critical Canon Research Center France SAS
Priority to FR0410089A priority Critical patent/FR2875628B1/fr
Publication of FR2875628A1 publication Critical patent/FR2875628A1/fr
Application granted granted Critical
Publication of FR2875628B1 publication Critical patent/FR2875628B1/fr
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/757Matching configurations of points or features

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

L'invention concerne un procédé et un dispositif de calcul de descripteur d'image numérique. Ce descripteur est obtenu par un découpage de l'image en au moins un nombre prédéterminé de blocs, après normalisation de l'image, puis, en chaque bloc, extraction d'au moins un point d'intérêt et mémorisation des coordonnées de chaque point ainsi trouvé.L'invention concerne également un procédé et un dispositif de vérification d'images numériques pour déterminer si une première image numérique correspond sensiblement à une seconde image numérique, basé sur l'utilisation du descripteur d'image numérique selon l'invention, et un calcul de distance associée. L'invention permet de limiter la probabilité de fausse alarme sur la décision de correspondance entre deux images numériques.

Description

2875628 1
La présente invention concerne un procédé et un dispositif de calcul de descripteur d'image numérique.
Elle concerne également un procédé et un dispositif de vérification d'images numériques, basés sur le procédé de calcul de descripteur conforme à l'invention. La vérification d'images numériques consiste à déterminer si une image numérique requête est similaire à une ou plusieurs images issues d'une base d'images enregistrées préalablement.
L'invention s'applique dans tout dispositif de recherche d'images similaires à une image requête dans une base de données d'images de grande taille. En particulier, l'invention s'applique dans un dispositif de recherche d'images piratées sur Internet ou encore dans la médiamétrie.
La performance de tels dispositifs se mesure en terme de compromis entre le taux de fausses alarmes, le taux de non détection et le temps de traitement.
Le taux de fausses alarmes est égal au pourcentage des images 20 requête qui sont détectées comme correspondant à une image de la base de données alors que ce n'est pas la même image.
Le taux de non détection correspond au pourcentage d'images requête qui ne sont pas détectées alors qu'elles sont les mêmes que des images de la base de données.
Le temps de traitement correspond au temps nécessaire pour vérifier la correspondance entre une image requête et un ensemble d'images d'une base de données.
Pour traiter des bases de données d'images de grande taille, il est indispensable d'avoir des techniques efficaces de mise en correspondance d'images, qui peuvent avoir subi certaines transformations géométriques comme un changement d'échelle et/ou une rotation et/ou des transformations colorimétriques. Pour ce faire on utilise de manière classique des descripteurs du contenu des images numériques, représentatifs et compacts et qui permettent de calculer rapidement la distance entre deux images.
L'invention se place plus particulièrement dans ce contexte de recherche de descripteurs compacts et robustes à des distorsions géométriques et/ou à des distorsions colorimétriques, et qui permettent de quantifier la correspondance entre deux images testées.
On connaît dans l'état de l'art diverses méthodes de calcul de descripteurs d'images à partir du contenu divisés généralement en deux catégories, les descripteurs dits globaux et les descripteurs dit locaux.
Les descripteurs globaux sont basés sur des caractéristiques moyennes du signal d'image. De manière générale les descripteurs globaux sont en général assez efficaces en terme de rapidité calculatoire, mais peu robustes à certaines manipulations, comme le recadrage.
Les descripteurs locaux sont basés sur des caractéristiques locales de l'image, comme des points où la luminance varie fortement. Une méthode de description d'image numérique robuste aux transformations géométriques, est décrite dans l'article Indexing based on scale invariant interest points , de K. Mikolajczyk and C. Schmid, paru dans International Conference on Computer Vision , pp 525-531, en Juillet 2001. Dans cet article les auteurs proposent d'utiliser pour décrire une image numérique un ensemble de points d'intérêt, caractérisés par un fort contraste local, détectés à une échelle caractéristique. Les composantes du descripteur associées à chaque point à une échelle caractéristique sont normalisées en fonction de cette échelle caractéristique. Ces points d'intérêt correspondent à des points où l'intensité varie fortement, donc de larges zones relativement plates de l'image ne sont pas représentées par cette méthode de description. Ainsi, ces descripteurs ne sont pas efficaces pour certains recadrages de l'image. De plus, ces descripteurs ne permettent pas de quantifier de manière fiable la probabilité de fausse alarme dans la décision de similarité entre deux images. En effet, la décision de ressemblance est prise par comparaison d'une certaine distance entre deux images, définie par une métrique adaptée, à un seuil. Ce seuil est déterminé empiriquement en 2875628 3 fonction de tests sur la base d'images traitée. Ce seuil est donc dépendant des images de test et peu fiable par rapport à de nouvelles images.
L'état de l'art ne comprend pas de descripteur qui soit compacte et robuste à des distorsions géométriques et/ou à des distorsions colorimétriques, permettant d'obtenir une bonne probabilité de détection pour une probabilité de fausse alarme ajustable et fiable.
La présente invention a pour but de remédier aux inconvénients de la technique antérieure, en fournissant un procédé et un dispositif de calcul de descripteur d'image compact et robuste à des manipulations de l'image, qui permet d'obtenir un critère de décision de correspondance entre deux images avec une probabilité de fausse alarme prédéterminée.
A cet effet, l'invention propose un procédé de calcul de descripteur d'image numérique comportant les étapes suivantes: -obtention d'un découpage de l'image en au moins un nombre prédéterminé de blocs et pour chaque bloc: - extraction d'au moins un point d'intérêt - mémorisation des coordonnées dudit au moins un point d'intérêt.
Ainsi, on obtient un descripteur particulièrement compact et dont le calcul est particulièrement rapide. Du fait du découpage en blocs, et de l'obtention de points d'intérêt pour chaque bloc du découpage, l'image est décrite de manière régulière, ce qui permet de caractériser à la fois les zones à fortes variations de luminance et les zones lisses.
Dans sa mise en oeuvre préférée, l'obtention du découpage de l'image numérique en blocs comprend une normalisation de la taille de l'image à une taille prédéterminée, suivie d'un découpage de l'image normalisée en au moins un nombre prédéterminé de blocs.
Ainsi, les éventuels changements d'échelle que peuvent subir les images sont pris en compte automatiquement du fait de la normalisation. De plus, les coordonnées des points d'intérêt obtenus après normalisation ont des valeurs appartenant à un intervalle de valeurs déterminé par ta taille de l'image 2875628 4 normalisée, ce qui permet de connaître précisément le nombre de bits nécessaire pour mémoriser le descripteur.
Selon une caractéristique avantageuse, le calcul de descripteur est appliqué sur la composante luminance de l'image numérique.
Dans le mode de mise en oeuvre préféré, les points d'intérêt sont des extrema d'un opérateur de filtrage, et en particulier un opérateur Laplacien de Gaussien.
Ainsi, le procédé est rapide et robuste aux éventuelles modifications colorimétriques de l'image.
Afin d'avoir un nombre de points suffisant pour décrire une image, tout en conservant un descripteur compact, il est particulièrement avantageux de retenir deux points d'intérêt pour chaque bloc, l'un, dit de premier type, correspondant à une valeur minimale de l'image filtrée et le second, dit de second type, correspondant à une valeur maximale de l'image filtrée.
Le descripteur ainsi obtenu nécessite un temps de calcul limité et présente l'avantage de sa compacité. Il est robuste à un changement d'échelle des images et à des modifications colorimétriques.
De plus, l'utilisation des coordonnées des points d'intérêt, par rapport à une image de taille normalisée, permettra de définir une distance entre deux images permettant de quantifier la correspondance entre deux images par rapport à une probabilité de fausse alarme donnée.
En effet, c'est également un objet de la présente invention de proposer un procédé de vérification d'images numériques pour déterminer si une première image numérique correspond sensiblement à une seconde image numérique. Ce procédé comporte les étapes de: - obtention, pour lesdites première et seconde image, de descripteurs, dits descripteurs semi-locaux, calculés selon le procédé de calcul de descripteur selon l'invention.
- calcul d'une distance, dite distance semi-locale, entre la première 30 image et la seconde image, par sommation sur l'ensemble des blocs obtenus par découpage, des distances entre points d'intérêt respectifs appartenant auxdits blocs spatialement correspondants 2875628 5 - décision sur une correspondance entre ladite première image et ladite seconde image en fonction de la distance semi-locale calculée.
Ainsi, la distance totale entre deux images est obtenue par sommation sur des blocs de distances entre points d'intérêt, ces distances étant statistiquement indépendantes. Cette manière de calculer la distance permet d'obtenir un résultat théorique sur la densité de probabilité de la distance et donc sur sa caractérisation en termes de probabilité de fausse alarme. Un critère de décision probabiliste sur la correspondance entre les deux images peut en être déduit.
Plus particulièrement selon un mode de mise en oeuvre préféré, la distance entre points d'intérêt par bloc est égale à la distance maximale entre coordonnées de points d'intérêt.
Selon un aspect particulièrement avantageux, la distance semi-locale calculée est égale au minimum parmi les distances semi-locales obtenues après application d'une transformation géométrique appartenant à un ensemble prédéterminé de transformations géométriques sur l'une des images considérées.
Ainsi, la distance finalement calculée prend en compte un certain nombre de transformations prédéterminées, comme par exemple les rotations d'angle droit ou les symétries d'axes vertical et horizontal.
Selon une caractéristique particulièrement avantageuse, l'étape de décision comporte une étape des sous-étapes de calcul d'un seuil en fonction d'une valeur prédéterminée de probabilité de fausse alarme et de comparaison de la distance semi-locale calculée audit seuil.
C'est également un objet de la présente invention de fournir un procédé de vérification d'images numériques pour déterminer si une première image numérique correspond sensiblement à une seconde image numérique, la seconde image faisant partie d'un ensemble de secondes images numériques. Le procédé comporte alors une étape de sélection dans l'ensemble de secondes images numérique, d'au moins une seconde image numérique formant un ensemble de sélection, chacune des secondes images de l'ensemble de sélection étant proche de ladite première image numérique au sens de la distance semi-locale calculée.
Selon un mode de mise en oeuvre alternatif, le calcul de distance semilocale est effectué simultanément pour au moins une partie de l'ensemble de secondes images, et comprend une étape de mémorisation, pour chaque point dans un bloc, de la liste des indices des secondes images de ladite partie ayant un point d'intérêt correspondant audit point, et le type dudit point d'intérêt.
Grâce à cette étape de mémorisation, le calcul de distance entre une première image et une pluralité de secondes images est bien plus rapide, car le nombre de calculs de distance ultérieurs est largement diminué.
Selon une caractéristique particulièrement avantageuse lorsque la seconde image fait partie d'un ensemble de secondes images, le calcul d'un seuil est fonction en outre nombre total de secondes images dudit ensemble de secondes images. Par la suite, la distance semi-locale calculée entre ladite première image et une seconde image de l'ensemble de sélection est comparée au seuil ainsi calculé préalablement, et une alarme est émise le cas où ladite distance semi-locale calculée est inférieure audit seuil.
Le seuil utilisé pour la décision permet de déterminer la probabilité de fausse alarme associée à cette décision, de manière théorique et non de manière empirique, et donc d'augmenter la fiabilité associée à la décision. Ce seuil est calculé une seule fois pour un nombre total de secondes images donné, ce qui permet d'alléger la charge calculatoire du procédé.
Selon une variante de l'invention, l'étape de sélection comporte en outre une étape d'obtention d'un descripteur supplémentaire, pour la première image et pour chacune des images dudit ensemble de secondes images, ledit descripteur supplémentaire étant indépendant dudit descripteur semi-local. De préférence, ce descripteur basé sur des caractéristiques globales de l'image.
L'étape de sélection comporte en outre une étape de calcul de distance, entre la première image et au moins une seconde image, dite distance supplémentaire, relative audit descripteur supplémentaire.
L'avantage de cette variante est d'augmenter encore la perîorrnance du procédé de vérification, en associant au descripteur contenant les positions des points d'intérêt, un descripteur permettant de caractériser le contenu de l'image sur des régions.
Selon un mode de mise en oeuvre de cette variante, l'étape de sélection comporte une sous-étape d'obtention d'un premier ensemble de sélection, en fonction de la distance semi-locale, comprenant un premier nombre prédéterminé de secondes images. De manière analogue, l'étape de sélection comporte une sous-étape d'obtention d'un second ensemble de sélection, en fonction de la distance supplémentaire, comprenant un second nombre prédéterminé de secondes images. Les ensembles de sélection comprennent des indices des secondes images et des indicateurs des transformations géométriques associées.
Ainsi, deux ensembles de sélection obtenus indépendamment sont utilisés pour améliorer la décision finale du procédé de vérification.
Avantageusement, l'étape de sélection comporte en outre une étape de vérification de compatibilité entre lesdits premier et second ensemble de sélection, à la fois pour la compatibilité des indices de secondes images contenus dans lesdits premier et second ensemble de sélection et pour la compatibilité des indicateurs de transformation géométrique associés.
Il est clair que la probabilité pour que deux descripteurs statistiquement indépendants et leurs distances associées déterminent la même seconde image correspondant à la première image et la même transformation géométrique associée est extrêmement faible. Cette vérification de compatibilité permet de diminuer encore plus la probabilité de fausse alarme.
Corrélativement, l'invention concerne un dispositif de calcul d'un descripteur d'image numérique. Ce dispositif comporte: - des moyens d'obtention d'un découpage de l'image en au moins un nombre prédéterminé de blocs - des moyens extraction d'au moins un point d'intérêt par bloc des moyens mémorisation des coordonnées dudit au moins un point d'intérêt.
2875628 8 Le dispositif de calcul d'un descripteur d'image numérique selon l'invention comporte des moyens de mise en oeuvre des caractéristiques précédemment exposées. Ce dispositif présente des avantages analogues à ceux du procédé de calcul d'un descripteur d'image numérique conforme à l'invention.
L'invention concerne également un dispositif de vérification d'images numériques pour déterminer si une première image numérique correspond sensiblement à une seconde image numérique, le dispositif comportant des moyens adaptés à mettre en oeuvre les caractéristiques du procédé de vérification d'image numérique précédemment exposé et qui présente des avantages analogues audit procédé.
L'invention concerne aussi un ordinateur qui comprend des moyens adaptés à mettre en oeuvre le procédé de calcul de descripteur et le procédé de vérification d'images conforme à l'invention.
Un programme d'ordinateur lisible par un microprocesseur, comprend des portions de code logiciel adaptées à mettre en oeuvre le procédé de calcul de descripteur et le procédé de vérification conforme à l'invention, lorsqu'il est chargé et exécuté par le microprocesseur.
Un moyen de stockage d'informations, éventuellement totalement ou partiellement amovible, lisible par un système informatique, comprend des instructions pour un programme informatique adapté à mettre en oeuvre le procédé de calcul de descripteur et le procédé de vérification d'images conforme à l'invention lorsque ce programme est chargé et exécuté par le système informatique.
Les ordinateur, moyen de stockage d'information et programme d'ordinateur présentent des caractéristiques et avantages analogues au procédé qu'ils mettent en oeuvre.
D'autres particularités et avantages de l'invention apparaîtront encore dans la description ci-après, illustrée par les dessins ci-joints, dans lesquels la figure 1 montre une vue globale d'un dispositif de vérification d'images numériques dans lequel l'invention peut s'appliquer; 2875628 9 la figure 2 est un organigramme fonctionnel montrant de manière globale un procédé de vérification d'images numériques implémentant l'invention - la figure 3 est un bloc-diagramme illustrant les étapes des processus de sélection et de décision selon un premier mode de réalisation de l'invention - les figures 4a et 4b illustrent le procédé de calcul de descripteur selon le mode de réalisation préféré de l'invention; la figure 5 représente schématiquement la distance associée au descripteur obtenu selon l'invention; - les figures 6a et 6b illustrent une optimisation du calcul de distance entre une image publiée et un ensemble d'images d'une base d'images propriétaires en utilisant le descripteur calculé selon le procédé de l'invention la figure 7 représente un tableau explicitant l'ensemble des transformations géométriques considérées pour le calcul de la distance selon l'invention - la figure 8 est le bloc-diagramme illustrant les étapes des processus de sélection et de décision selon un second mode de réalisation de l'invention - la figure 9 est le bloc-diagramme qui illustre le descripteur supplémentaire utilisé dans le second mode de réalisation de l'invention; - la figure 10 est un bloc-diagramme représentant schématiquement un dispositif adapté à mettre en oeuvre l'invention.
Les figures 1 et 2 illustrent un dispositif global de vérification d'images, ayant pour but de déterminer la similarité entre des images enregistrées préalablement et des images publiées sur le réseau Internet, dans lequel l'invention trouve une application privilégiée. Evidemment, l'invention trouve une application dans tout système où il est nécessaire de comparer des images afin de décider automatiquement de leur similarité en fonction d'une probabilité de fausse alarme fixée.
On va décrire tout d'abord un dispositif de vérification d'images numériques dans lequel l'invention s'applique, en référence à la figure 1.
Le dispositif de vérification d'images 1 reçoit en entrée des images IC à protéger fournies par des clients 2 et des images IP qui sont publiées par exemple sur des sites web. Le dispositif 1 doit comparer les images IP avec les images 1C. Dans la suite de (ad description, les images IC sont appelées images propriétaires et les images IP sont appelées images publiées . Les images IC et IP sont transportées jusqu'au dispositif au travers d'un réseau de communication 4 comme le réseau Internet. Alternativement, les images 1C et IP pourraient être chargées dans le dispositif 1 à partir par exemple d'une disquette ou d'un CD-ROM.
Le dispositif de vérification d'images 1 réalise plusieurs processus de traitement, comprenant un processus d'enregistrement d'images propriétaires 10, un processus de collecte d'images publiées 11 et un processus de vérification d'images 12.
L'invention apporte une solution pour la réalisation du processus de vérification d'images 12 qui délivre une alarme AL lorsqu'une image publiée IP présente un niveau de similarité élevé avec une image propriétaire IC enregistrée dans le dispositif 1, donc lorsque la probabilité pour que les deux images soit la même image à une transformation telle qu'un changement d'échelle ou une modification colorimétrique près est forte.
La figure 2 décrit de manière plus détaillée le processus de collecte d'images publiées 11 selon un mode de réalisation et le processus de vérification d'images 12.
Dans le mode de réalisation décrit ici, les images publiées IP sont récupérées sur des sites web 3 du réseau Internet.
Le processus de collecte d'images publiées 11 fait appel à un robot logiciel 110. Une base 111 fournit au logiciel 110 des adresses de sites web 3 à surveiller. Les images récupérées par le robot logiciel 110 sur ces sites sont stockées dans une base d'images publiées 112.
Le processus de vérification 12 a pour but de déterminer si une image publiée IP correspond à l'une des images propriétaires IC de la base 100 préalablement enregistrées.
Le processus de vérification d'images est composé d'un processus de sélection P120 et d'un processus de décision P121.
Le processus de sélection P120 permet d'obtenir un nombre limité K d'images de la base 100, ICI à ICK, qui sont similaires à une image publiée IP.
Le processus P121 a pour fonction de décider si une image publiée est suffisamment proche d'une image propriétaire pour justifier la génération d'une alarme AL. Selon l'invention, le processus P121 permet de décider si deux images sont similaires avec une probabilité de fausse alarme prédéterminée.
Dans la suite nous allons décrire deux modes de réalisation des processus de sélection et de décision selon l'invention.
Selon un premier mode de réalisation décrit de manière globale en référence à la figure 3, le processus de sélection est basé sur l'utilisation d'un nouveau descripteur basé sur le contenu des images numériques, décrit plus en détail en référence aux figures 4a et 4b, et sur un calcul de distance associé à ce nouveau descripteur, décrit en référence à la figure 5.
En entrée de l'algorithme décrit en référence à la figure 3 on dispose d'une part d'une image publiée IP, et d'autre part de la base de données d'images propriétaires 100. On suppose dans ce mode de réalisation que les descripteurs selon l'invention sont calculés préalablement et stockés conjointement à la base d'images propriétaires.
Le processus de sélection comprend d'une part une étape Ex1 de calcul d'un descripteur D selon le procédé de l'invention pour l'image IP, et d'autre part, pour chaque image ICi considérée dans la base d'images propriétaires, l'extraction Ex'l d'un descripteur Di calculé selon l'invention.
Ensuite, la distance entre le descripteur D de l'image IP et chaque descripteur Di de la base est effectuée à l'étape Ex3. Cette distance est adaptée au nouveau descripteur propose.
Ensuite, à l'étape suivante Ex5 sont extraits les indices des K images de la base propriétaire les plus proches de l'image publiée au sens de la distance calculée, qui forment ainsi un ensemble de sélection, qui sera ultérieurement utilisé dans le processus de décision. La valeur de K est prédéterminée. Dans le cas du premier mode de réalisation, la valeur de K importe assez peu. Une valeur de K de 4 est généralement suffisante. Dans le cas du second mode de réalisation, K peut par exemple être égal à 10 si le nombre d'images dans la base propriétaire est de 30000. Cependant, K pourrait être égal au nombre d'images dans la base d'images propriétaire. L'étape Ex5 termine le processus de sélection.
Le processus de décision selon l'invention nécessite une étape préliminaire Ex8 de calcul d'un seuil S, qui dépend d'une part, du nombre d'images de la base d'images propriétaires NP comparées à l'image IP d'une part, et d'une probabilité de fausse alarme PFA donnée par l'utilisateur d'autre part. Le calcul du seuil S est une étape initiale du processus de décision, qui n'est effectuée qu'une seule fois, éventuellement préalablement au traitement de l'image publiée IP. En effet, le seuil S ne dépend pas des images IP ou ICi, mais uniquement des paramètres NP et PFA. Le détail du calcul du seuil S sera donné en référence à la figure 5. Le seuil ainsi calculé fournit une mesure de la ressemblance entre deux images en fonction d'une probabilité de fausse alarme prédéterminée.
Ensuite à l'étape Ex9, chaque distance parmi les K distances les plus faibles sélectionnées à l'étape Ex5 est comparée au seuil S. Si une distance donnée dik est inférieure au seuil S cela signifie que l'image publiée IP et l'image de la base d'indice ik, ICik, sont les mêmes images avec une probabilité d'erreur inférieure à PFA. Dans ce cas, une alarme AL est émise à l'intention de l'utilisateur. Dans le cas où la distance calculée est supérieure au seuil S, alors on estime que la probabilité de se tromper en décidant que les deux images sont en fait la même image donne une probabilité de fausse alarme supérieure à celle fixée par l'utilisateur, donc il n'est pas nécessaire de générer une alarme.
2875628 13 Nous allons décrire maintenant en référence aux figures 4a et 4b le procédé de calcul de descripteur semi-local selon le mode de réalisation préféré de l'invention.
La figure 4a décrit l'ensemble des étapes principales du calcul de descripteur selon l'invention.
En entrée de l'algorithme on dispose d'une image numérique L Chaque image est constituée d'une suite d'échantillons numériques, groupés en un tableau bidimensionnel, chaque échantillon représentant un pixel de l'image. Par exemple, pour une image à 256 niveaux de gris chaque pixel est codé sur un octet, alors que pour une image couleurs chaque pixel peut être codé sur 3 octets, chaque octet représentant une composante de chrominance, par exemple rouge, vert et bleu. Dans le mode de mise en oeuvre préféré, on utilisera l'espace de représentation YUV, où Y désigne la composante luminance et U, V les composantes chrominance de l'image. La composante luminance Y de l'images est extraite à l'étape Ex11. Dans le cas où l'image I n'est pas en représentation Y,U,V on applique d'abord une transformation d'espace couleur pour se ramener à cette représentation.
Ensuite la composante luminance de l'image I, représentée initialement par un tableau bidimensionnel de taille MxN, où M représente le nombre de lignes et N le nombre de colonnes, est normalisée à l'étape Ex12, c'est-àdire re-échantillonnée à une taille n x n prédéterminée. Par exemple, n=256 pixels dans le mode de réalisation préféré. Le ré-échantillonnage est effectué par une méthode d'interpolation classique, comme l'interpolation bilinéaire.
La luminance normalisée est ensuite découpée (étape Ex13) en un nombre X prédéterminé de blocs de taille égale. Dans le mode de réalisation préféré, l'image est découpée en 100 blocs de taille 25x25. On peut noter que dans un mode de mise en oeuvre alternatif on pourrait appliquer le découpage en blocs sur l'ensemble des composantes couleur de l'image, et choisir un nombre prédéterminé de blocs différent selon la composante couleur traitée.
Dans chaque bloc deux points d'intérêt sont extraits à l'étape Ex14, qui sera décrite en détail ci-dessous en référence à la figure 4b.
La figure 4b est un bloc-diagramme de l'algorithme de détection de points d'intérêt par bloc selon le mode de réalisation préféré de l'invention.
La première étape de l'algorithme (Ex141) consiste à appliquer un filtrage au signal de luminance normalisé. Le filtre utilisé dans le mode de mise en oeuvre préféré est un filtre Laplacien de Gaussien, dont les coefficients sont donnés ci-dessous: (0 1 1 2 2 2 1 1 0\ 1 2 4 5 5 5 4 2 1 1 4 5 3 0 3 5 4 1 2 5 3 -12 -24 -12 3 5 2 2 5 0 -24 -40 -24 0 5 2 (Egx l) 2 5 3 -12 -24 -12 3 5 2 1 4 5 3 0 3 5 4 1 1 2 4 5 5 5 4 2 1 0 1 1 2 2 2 11 0) A l'étape suivante Ex142, on sélectionne un bloc du découpage, qui 10 est le bloc courant traité. On prend le premier bloc du découpage, dans l'ordre de balayage classique des images.
On détecte ensuite à l'étape Ex143 les pixels correspondant aux réponses maximale et minimale de l'opérateur de filtrage. Ces points seront sélectionnés comme points d'intérêt du bloc courant. Les points de réponse minimale sont aussi appelés points de premier type et les points de réponse maximale sont appelés points de second type.
On vérifie ensuite s'il s'agit du dernier bloc du découpage à l'étape Ex144. Si ce n'est pas le cas, le bloc suivant est sélectionné à l'étape Ex145. Lorsque le dernier bloc à été traité, on retourne à l'étape Ex15 de la figure 4a, à laquelle les coordonnées des points ainsi obtenus sont stockées en mémoire. Dans le mode de mise en oeuvre préféré les coordonnées des points du ième bloc seront notés: (x;", y,) pour le point de premier type, Pm;n et (xi,' , yM) pour le point de réponse de second type, Pmax, i représentant l'indice du bloc traité. L'ensemble des coordonnées des points d'intérêt pour l'ensemble 25 des blocs du découpage forme le descripteur D selon l'invention. On dénommera par la suite le descripteur ainsi obtenu descripteur semi-local. En effet, comme dans les méthodes dites locales dans l'état de l'art, ce descripteur est basé sur des points d'intérêt de l'image. Ces points d'intérêt sont néanmoins répartis régulièrement de manière systématique sur tous les blocs de l'image, alors que dans les méthodes purement locales de l'état de l'art, les points d'intérêt n'ont pas de distribution spatiale prédéfinie dans l'image, ils sont placés uniquement sur les points de fort contraste.
La figure 5 illustre des points d'intérêt obtenus selon l'invention et leurs coordonnées respectives, pour deux images à comparer notées respectivement 11 et 12. Comme montré sur cette figure, tous les blocs du découpage sont des carrés de taille L x L prédéterminée. Les points d'intérêt sont notés Pm;; (resp. P,, ) où k est l'indice de l'image (1 ou 2 dans l'exemple) et i l'indice du bloc.
Selon le mode de réalisation préféré de l'invention, la distance entre les deux images, que l'on dénommera distance semi-locale, est calculée selon la formule: d (I1, 12) = E max(x;; x2, i=1
X
Y1,i; v2; )+Emax(xM x2,YM _Yz _l
Y )
(Eqx 2) Ainsi, la distance totale est basée sur la somme des distances par bloc des points de chaque type, la distance entre deux points de même type étant définie comme le maximum de la différence entre abscisses et ordonnées de ces points.
Dans la pratique, il est également souhaitable de prendre en compte certaines distorsions géométriques, qui modifient l'orientation de l'image sans en modifier le contenu, comme les rotations multiples de 90 degrés, les symétries d'axe horizontal et vertical. Ces distorsions forment un groupe de 8 transformations géométriques T, qui sont décrites dans le tableau de la figure 7. Afin de prendre en compte ces transformations, il suffit de simuler le résultat d'une telle transformation sur les coordonnées des points d'intérêt d'une des images (par exemple l'image 12) et de calculer une nouvelle distance, Ces transformations géométriques modifient à la fois l'ordre des blocs et la position 2875628 16 des coordonnées dans le bloc. Finalement, la distance retenue est la distance minimum parmi les distances calculées pour chacune des transformations T simulées.
Par exemple, si l'on prend une symétrie d'axe horizontal (notée T5 dans le tableau de la figure 7), les coordonnées (x,y) sont transformées en (x, 256-y). L'indice du bloc auquel appartient ce point est également modifié selon la transformation. Comme montré sur _la figure 5, où les images sont découpés en 3 x 3 blocs, les points d'intérêt du bloc d'indice 1 deviennent points d'intérêt du bloc d'indice 7 lorsque cette transformation est appliquée.
La formule de calcul de la distance serai-locale (Eqx2) devient alors: T (Y2,T(i) ) d (I1, I2) = min/ maxx; i T(xiT(0) ;=t x +ma4x;i T(xT(i,), YIM,i T(Y2,T(;)) i=1 (Eqx 3) Ce mode de calcul de la distance permet de prendre en compte certaines distorsions courantes, tout en étant très rapide à mettre en oeuvre.
La distance définie ci-dessus selon l'invention par les équations (Eqx2) et (Eqx3) est ensuite utilisée dans le processus de décision P121 pour calculer le seuil S (étape Ex9) qui est utilisé dans le critère de décision sur la correspondance entre deux images.
Nous allons maintenant expliciter le mode de calcul du seuil S, en fonction d'une probabilité de fausse alarme PFA. Considérons deux images 11 et 12, telles que représentées sur la figure 5. La position en abscisse ou en ordonnée d'un point caractéristique sur l'un des blocs suit une loi uniforme de densité de probabilité 1/L. De ce fait, la distance en valeur absolue (en abscisse ou en ordonnée) entre deux points caractéristiques, de même type d'un même bloc de deux images différentes, 11 et 12, suit une loi triangulaire de densité de valeur 2/L en 0 et de valeur 0 en L. Finalement la densité de probabilité du terme du type z = maxux,,; x2, 2,, fZ (z) 4z 2 3 + L2 (Egx4) (Yt,i Y2,;) est: 2875628 17 La distance définie par les équation (Eqx2) et (Eqx3) étant une somme de termes du type z sur chaque bloc, et en admettant que les blocs sont indépendants les uns des autres, la somme des termes de type z, après normalisation par la moyenne et l'écart-type, suit une loi normale, c'est-à-dire une loi Gaussienne de moyenne nulle et de variance égale à 1.
Soit m la moyenne et a l'écart type de la loi de z, la distance d normalisée, c'est-à-dire: d = ,1 d Xm suit donc une loi normale. Par V 6 exemple, dans le cas de la formule (Eqx 2), pour le mode de réalisation préféré, la valeur de X est de 100, qui correspond au nombre de points d'intérêt de 10 même type.
Après cette étude théorique, revenons à l'application de l'invention dans le cadre des processus de sélection/décision pour déterminer la similarité entre une image publiée IP et un ensemble d'images d'une base propriétaire, ICi.
Une telle distance d est calculée entre l'image IP et chacune des images ICi, et à l'issue du processus de sélection seulement les K images les plus proches sont retenues. Pour une telle image retenue ICk, la distance calculée satisfait la relation: d'k=inf{d,,...,dNP k}, d'k étant la kième distance minimale et NP-k étant le nombre d'images de la base moins les k images déjà sélectionnées et traitées.
On peut en déduire que: x \ NP-k+1 P(d'k <x) =1 1 1 SC' dt (Eqx5) - hrc Dans le mode de réalisation préféré K=1 et la formule appliquée est donc: x \ Np P(i'k < x) =1 1 1 f e-Z dt (Eqx5a)
J
Cette formule nous fournit la probabilité de fausse alarme, c'est-à-dire la probabilité qu'une image IP qui n'appartient pas à la base de données d'images propriétaires ait une distance normalisée inférieure à la valeur x avec 2875628 18 une des K images les plus proches de la base ICk. Notons que lorsqu'on ne considère que deux images, NP prend la valeur 1, et l'équation (Eqx5a) revient alors à considérer la probabilité de fausse alarme selon une loi de probabilité Gaussienne centrée, donc une loi normale.
Par conséquent, connaissant le nombre NP d'images de la base et en utilisant (Eqx5a), on peut déduire le seuil S en dessous duquel la mesure de distance normalisée aura une probabilité de fausse alarme inférieure à PFA. En effet, on peut obtenir dans des tables la valeur S telle que: P(dk <_ S) =PFA' Ce seuil S ainsi obtenu définit complètement le critère de décision 10 sur la correspondance entre deux images, mis en oeuvre à l'étape Ex9 de la figure 3.
Dans ce qui précède, nous avons décrit un premier mode de mise en oeuvre séquentiel du calcul de distance selon l'invention. En effet, l'image publiée IP est comparée successivement à chaque image ICi de la base propriétaire, afin de calculer la distance di entre les deux images. Nous allons maintenant décrire, en référence à la figure 6, une variante de mise en oeuvre du calcul de la distance entre une image IP et un ensemble d'images de la base de données d'images propriétaires. Cette méthode alternative permet un gain en temps de calcul. Elle nécessite le stockage de certaines informations dans des listes, ces informations étant obtenues par une analyse préalable des descripteurs des images de la base de données propriétaires. Cette méthode est particulièrement adaptée si le nombre d'images NP est grand (par exemple, pour toute valeur de NP supérieure à 10000).
La figure 6a décrit le parcours de la base de données propriétaire préalable au calcul optimisé en temps de la distance selon l'invention, pour associer à chaque position d'une image (rappelons ici que les images sont normalisées à une taille fixe pour le calcul de descripteur, et donc comportent un nombre prédéterminé de positions) une liste d'indices d'images de la base possédant un point d'intérêt de type k selon une transformation géométrique Tj.
La première étape de l'algorithme de la figure 6a, Ex600, consiste à initialiser un compteur Compteur(x,y,j,k) à 0. La variable j référence les 2875628 19 transformations géométriques considérées et varie de 0 à 7. L'ensemble de ces transformations notées T={TO...T7}, est détaillé dans le tableau de la figure 7.
Les variables x et y varient de 0 à 255 et référencent les positions des pixels dans une image normalisée. Enfin, la variable k référence le type de point intérêt, k=1 pour un point de valeur minimale et k=2 pour un point de valeur maximale de l'opérateur de filtrage.
Pour une image ICi d'indice i de la base de données, on extrait à l'étape Ex601 le descripteur Di qui contient la liste des points d'intérêt de l'image préalablement calculé par le procédé de calcul selon l'invention.
Ensuite les transformations géométriques considérées sont appliquées successivement aux points d'intérêt de l'image (étape Ex602). La sélection de chacune de ces transformations se fait à travers l'incrément de l'indice j (étape Ex607), l'indice j étant remis à 0 pour chaque image traitée. Après application d'une transformation Tj donnée, on obtient à l'étape Ex603 une nouvelle liste de coordonnées de points d'intérêt pour l'image courante.
Chaque point de coordonnées (x,y) de cette nouvelle liste est successivement sélectionné (étape Ex604). A l'étape Ex605 l'indice i de l'image courante est mémorisé dans la liste liée à la position (x,y). La valeur de l'indice k est mise à 1 si le point courant de coordonnées (x,y) est un point de premier type, et à 2 si ce point est un point de second type. L'indice de la transformation géométrique courante est également mémorisé. La variable Compteur(x,y,j,k) est également incrémentée de un.
A l'étape suivante on Ex606 on sélectionne le point suivant de la liste, jusqu'à ce que tous les points soient traités.
Ensuite à l'étape Ex607 on passe à la transformation géométrique suivante, jusqu'à ce que les 8 transformations soient traitées.
Finalement, à l'étape Ex608 on passe à l'image suivante, donc on incrémente l'indice i, et ce jusqu'à ce que les NP images de la base d'images propriétaire soient traitées.
Lorsque toutes les images on été parcourues, l'algorithme prend fin.
Nous disposons alors d'une liste Liste(x,y,j,k) pour chaque point de coordonnées (x,y) d'une image normalisée.
Nous allons décrire maintenant, en référence à la figure 6b, l'algorithme de calcul rapide de distance selon l'invention entre une image publiée IP et l'ensemble d'images propriétaires ICi, qui utilise le résultat de l'algorithme décrit à la figure 6a.
La première étape de l'algorithme est l'étape Ex610 de sélection d'un bloc courant d'indice b dans l'image. En effet, comme décrit précédemment (étape Ex13, figure 4a), chaque image est découpée systématiquement en blocs, qui peuvent être indexés selon un ordre prédéterminé, du haut à gauche vers le bas à droite en général.
A l'étape suivante Ex612 les points d'intérêt du bloc d'indice b de l'image IP sont sélectionnés. Ces points sont notés Pbk, où k désigne le type de point et b l'indice du bloc.
Ensuite tous les points Pc de coordonnées (x,y) du bloc b sont parcourus, dans l'ordre de balayage vidéo classique (Ex614).
Pour un point Pc de coordonnées (x,y) on calcule à l'étape Ex616 la distance selon la formule donnée Eqx2 entre ce point et chacun des deux points d'intérêt Pbk sélectionné à l'étape Ex614, c'est-à-dire le maximum des valeurs absolues des différences entre coordonnées. On obtient ainsi deux valeurs selon l'indice k.
On considère alors les indices des images propriétaires ICi qui possèdent un point d'intérêt de coordonnées (x,y). Ces indices sont extraits à l'étape Ex618 de la liste Liste(x,y,j,k) déterminée à l'étape Ex605 de la figure 6a.
Pour un tel indice i, on met à jour la distance entre l'image ICi et l'image IP. On considère que préalablement on a associé à chaque image propriétaire IC un tableau de distances D(lCi,IP,j), initialisé à zéro, chaque entrée du tableau correspondant à une transformation géométrique Tj. L'étape de mise à jour Ex620 consiste à ajouter la distance d(k,b), selon le type k correspondant à l'indice i dans Liste(x,y,j,k) audit tableau bidimensionnel: D(ICi, IP, j) = D(ICi, IP, j) + d(k,b) 2875628 21 Ensuite l'étape Ex622 sélectionne l'indice suivant dans la liste correspondant au point de coordonnées (x,y), jusqu'à ce que toute la liste Liste(x,y,j,k) soit parcourue.
Ensuite le point suivant dans l'ordre de balayage vidéo du bloc courant est sélectionné (Ex624), et les étapes Ex614 à Ex624 sont répétées jusqu'au traitement de tous les points du bloc.
Lorsque tous les points du blocs ont été traités, l'étape Ex626 sélectionne le bloc suivant, et toutes les étapes sont répétées jusqu'au dernier bloc de l'image.
La méthode décrite ci-dessus permet de calculer plusieurs distances en parallèle, et de minimiser le nombre d'opérations calculatoires, en particulier lorsque le nombre d'images de la base propriétaire NP est très grand.
Nous allons décrire dans la suite une variante de mise en oeuvre de l'invention, qui a l'avantage de diminuer encore la probabilité de fausse alarme et donc de rendre le critère de décision sur la correspondance entre deux images encore plus fiable.
Dans cette variante, un deuxième descripteur, appelé descripteur supplémentaire, est utilisé en parallèle au descripteur D selon l'invention décrit en référence aux figures 4a et 4b dans le processus de sélection. Ce descripteur supplémentaire, noté Ds, doit être statistiquement indépendant du descripteur D afin d'améliorer le résultat.
Dans l'exemple de mise en oeuvre préféré, le descripteur supplémentaire Ds est un descripteur de type global, basé sur les moments statistiques de la composante luminance du signal image, décrit dans la demande de brevet EPO4.290940.8, au nom de la demanderesse. Dans ce brevet est décrit un procédé de calcul de descripteur d'image numérique représentée par un ensemble de coefficients. Le procédé comporte une étape de découpage hiérarchique en blocs de l'image numérique limité à un nombre prédéterminé de niveaux de profondeur, le nombre de blocs par niveau de profondeur étant dépendant dudit niveau de profondeur. Ensuite, pour chaque niveau de profondeur, on calcule au moins une valeur caractéristique à partir 2875628 22 des coefficients représentatifs de chaque bloc. Le descripteur final comporte les valeurs caractéristiques de chaque bloc de chaque niveau de profondeur.
Nous allons décrire en référence à la figure 8 l'ensemble des étapes des processus de sélection et de décision selon cette variante de mise en oeuvre de l'invention, par analogie avec la figure 3.
Comme précédemment, en entrée de l'algorithme on dispose d'une part d'une image publiée IP, et d'autre part de la base de données d'images propriétaires 100, avec leurs descripteurs associés.
Le processus de sélection comprend d'une part une étape Exl de calcul d'un descripteur serai-local D selon le procédé de l'invention pour l'image IP, analogue à l'étape Exl de la figure 3.
De plus, le processus de sélection comprend également une étape Ex2 de calcul d'un descripteur supplémentaire Ds. Comme expliqué ci-dessus, dans le mode de mise en oeuvre préféré le descripteur Ds est calculé selon une mise en oeuvre particulière du procédé de calcul de descripteur global rapidement décrit ci-dessus.
Cette mise en oeuvre est maintenant brièvement décrite ici, en référence à la figure 9.
Le descripteur Ds est formé de moments caractéristiques du signal calculés sur plusieurs niveaux de profondeur. Préalablement au découpage en plusieurs niveaux, la luminance est extraite de manière analogue à l'étape Exil et elle est normalisée spatialement de manière analogue à l'étape Ex12. On considère simultanément pour calculer les descripteurs l'image entière (Niveau 0), l'image partitionnée en 4 blocs (Niveau 1) et l'image partitionnée en 16 blocs (Niveau 2). Pour chaque bloc b du découpage, on calcule deux valeurs correspondant aux moments d'ordre 2 (appelée aussi variance) et d'ordre 3 normalisés, notés Vn v pour le moment d'ordre 2 et Cb v pour le moment d'ordre 3, où b représente l'indice du bloc courant et v le niveau de profondeur.
Pour un niveau de profondeur v donnée (sauf pour le niveau 0), un 30 moment normalisé est calculé comme indiqué ci-dessous: Vb,v C = Cb,v Vb,v I 2 b,v VIIEv bv,v b b Pour le niveau de profondeur 0, le moment normalisé est: Vb,O C Cb,O V6,O - - lI E 2 b,O 2 VVbI b Cb't b Les sommes aux dénominateurs sont effectuées sur les 4 blocs du niveau supérieur pour le niveau de profondeur O. De retour à la figure 8, on obtient donc le descripteur Ds de l'image IP à l'issue de l'étape Ex2.
Les descripteurs correspondants Di et Dsi relatifs à l'image propriétaire ICi sont extraits de la base à l'étape Exl".
Ensuite les distances relatives à chaque descripteur sont calculées.
La distance semi-locale di définie pour le descripteur semi-local D est calculée à l'étape Ex3, comme expliqué ci-dessus en référence à la figure 5.
Pour le descripteur supplémentaire, la distance dite supplémentaire dsi adaptée à ce descripteur est calculée à l'étape Ex4. Dans le mode de mise en oeuvre préféré il s'agit( de la distance définie ci-dessous: D,(11,12) = E (Vbf" Vb " )2 + E Cb,v2 (Eqx7) v,b v,b Comme dans le cas de la distance semi-locale di, il est également intéressant de prendre en compte l'ensemble des transformations géométriques explicitées dans le tableau de la figure 7. Une méthode analogue est mise en oeuvre: l'application de chaque transformation géométrique considérée est simulée sur un des descripteurs utilisés dans le calcul de la distance, par exemple Dsi. Cette simulation est aisée dans ce cas, car il suffit de changer l'ordre des composantes dudit descripteur selon la modification de l'ordre des blocs induite par la transformation géométrique appliquée. Le résultat est calculé et la distance supplémentaire minimale parmi toutes les transformations est finalement retenue, ainsi que l'indice de la transformation géométrique qui minimise cette distance.
(Eqx6) (Eqx6a) Ensuite, à l'étape suivante Ex'5 sont extraits les indices des K images de la base propriétaire les plus proches de l'image publiées au sens de la distance calculée selon le descripteur D basé sur la position des points d'intérêt. Dans ce mode de mise en oeuvre on peut choisir par exemple K=1.
L'indice de l'image ICi minimisant cette distance, i, ainsi que la valeur de la distance elle-même di et l'indice de la transformation géométrique associée, j, sont alors mémorisés dans une première liste, notée L1. On obtient ainsi un premier ensemble de sélection au sens du descripteur semi-local selon l'invention.
Une étape de sélection analogue est appliquée pour les descripteurs supplémentaires à l'étape Ex6. Les Ks images les plus proches au sens de la distance Ds, associée au descripteur basé sur les moments caractéristiques multi-niveaux, calculée selon la distance définie par (Eqx7) sont mémorisées. Comme précédemment, les indices des Ks images retenues, ainsi que les indices des transformations géométriques associées sont mémorisés dans une liste L2. On forme ainsi un second ensemble de sélection au sens du descripteur supplémentaire, choisi comme étant un descripteur global dans ce mode de réalisation de l'invention.
Une fois toutes les images traitées, on effectue un test de compatibilité à l'étape Ex7. Ce test consiste à vérifier si la ou les images de la liste L1 font partie de la liste L2, c'est-à-dire des Ks images les plus proches au sens du descripteur supplémentaire Ds. Si c'est le cas, un test de compatibilité géométrique est effectué : on vérifie que l'indice de la transformation minimisant la distance semi-locale di selon le descripteur semi-local D est le même que l'indice de la transformation minimisant la distance selon le descripteur Ds. Si ce test est négatif, alors on estime que l'image ICi testée a été sélectionnée par erreur, et l'étape Ex7 est suivie par un rejet, sans émission d'alarme. Si au contraire le test de comptabilité est positif, la distance semi-locale di selon le descripteur semi-local D basé sur les positions des points d'intérêt est transmise au processus de décision P121.
2875628 25 Le processus de décision est appliqué sur la distance di selon le descripteur D, et il est entièrement analogue au processus décrit en référence à la figure 3, donc il ne sera pas décrit à nouveau ici.
Ce traitement basé sur la compatibilité de deux descripteurs indépendants permet de limiter encore la probabilité de fausse alarme. En effet, si l'image publiée IP n'est pas issue de la base d'images propriétaires, la probabilité pour que l'image de la base la plus proche au sens du descripteur D soit aussi l'image la plus proche au sens du descripteur supplémentaire est extrêmement faible. De plus, la probabilité que la distorsion géométrique soit la même est égale à 1/8. Finalement, l'utilisation des deux descripteurs selon le mode de mise en oeuvre décrit ci-dessus diminue la probabilité de fausse alarme d'un facteur de Ks/8NP, ce qui est considérable quand le nombre NP d'images propriétaires est grand.
Selon le mode de réalisation choisi et représenté à la figure 10, un dispositif mettant en oeuvre le procédé de calcul de descripteurs et de vérification d'images numériques selon l'invention est par exemple un micro-ordinateur Dx10 connecté à différents périphériques, par exemple une caméra numérique Dx107 (ou un scanner ou tout moyen d'acquisition ou de stockage d'image) reliée à une carte graphique et fournissant des informations à traiter selon l'invention.
Le dispositif Dx10 comporte une interface de communication Dx112 reliée à un réseau 4 apte à transmettre des données numériques à traiter ou inversement à transmettre des données traitées par le dispositif. Le dispositif Dx10 comporte également un moyen de stockage Dx108 tel que par exemple un disque dur. II comporte aussi un lecteur Dxl 09 de disque Dx110. Ce disque Dx110 peut être une disquette, un CD-ROM ou un DVD-ROM, par exemple. Le disque Dx110 comme le disque Dx108 peuvent contenir des données traitées selon l'invention ainsi que le ou les programmes mettant en oeuvre l'invention qui, une fois lu par le dispositif Dx10, sera stocké dans le disque dur Dx108.
Selon une variante, le programme permettant au dispositif de mettre en oeuvre l'invention, pourra être stocké en mémoire morte Dx102 (appelée ROM sur)e dessin). En seconde variante, le programme pourra être reçu pour être stocké 2875628 26 de façon identique à celle décrite précédemment par l'intermédiaire du réseau de communication 4.
Ce même dispositif possède un écran Dx104 permettant de visualiser les données à traiter ou de servir d'interface avec l'utilisateur qui peut ainsi paramétrer certains modes de traitement, à l'aide du clavier Dx114 ou de tout autre moyen (souris par exemple).
L'unité centrale Dx100 (appelée CPU sur le dessin) exécute les instructions relatives à la mise en oeuvre de l'invention, instructions stockées dans la mémoire morte Dx102 ou dans les autres éléments de stockage. Lors de la mise sous tension, les programmes de traitement stockés dans une mémoire non volatile, par exemple la ROM Dx102, sont transférés dans la mémoire vive RAM Dx103 qui contiendra alors le code exécutable de l'invention ainsi que des registres pour mémoriser les variables nécessaires à la mise en oeuvre de l'invention, par exemple les descripteurs des images propriétaires Di et Dsi si le second mode de mise en oeuvre est choisi, les distances di et dsi, les listes d'indices d'images proches d'une image publiée, LI et L2, et les listes des images ayant un point d'intérêt à une position (x,y) donnée, Liste(x,y,j,k).
De manière plus générale, un moyen de stockage d'information, lisible par un ordinateur ou par un microprocesseur, intégré ou non au dispositif, éventuellement amovible, mémorise un programme mettant en oeuvre le procédé selon l'invention.
Le bus de communication Dx101 permet la communication entre les différents éléments inclus dans le micro-ordinateur Dx10 ou reliés à lui. La représentation du bus Dx101 n'est pas limitative et notamment l'unité centrale Dx100 est susceptible de communiquer des instructions à tout élément du micro-ordinateur Dx10 directement ou par l'intermédiaire d'un autre élément du micro-ordinateur Dxl0.
Bien entendu, la présente invention n'est nullement limitée aux modes de réalisation décrits et représentés, mais englobe, bien au contraire, toute variante à la portée de l'homme du métier. Notamment l'invention peut s'appliquer à la description et à la vérification de vidéos numériques, en appliquant les procédés décrits ci-dessus à des images clés représentatives d'une vidéo numérique.

Claims (1)

  1. 28 REVENDICATIONS
    1. Procédé de calcul de descripteur d'image numérique caractérisé en ce qu'il comporte les étapes de: -obtention (Ex12, Ex13) d'un découpage de l'image en au moins un nombre prédéterminé de blocs et pour chaque bloc: extraction (Ex14) d'au moins un point d'intérêt - mémorisation (Ex15) des coordonnées dudit au moins un point d'intérêt.
    2. Procédé selon la revendication 1 caractérisé en ce que l'étape d'obtention comprend les sous-étapes de: - normalisation (Ex12) de la taille de l'image à une taille prédéterminée - découpage (Ex13) de l'image normalisée en ledit au moins un nombre prédéterminé de blocs.
    3. Procédé selon l'une des revendications 1 ou 2 caractérisé en ce que l'étape d'obtention comporte en outre une sous-étape (Ex11) préalable d'extraction d'une composante dite de luminance de l'image numérique.
    4. Procédé selon l'une des revendications 1 à 3 caractérisé en ce qu'un point d'intérêt est un extremum d'un opérateur de filtrage.
    5. Procédé selon la revendication 4, caractérisé en ce que l'opérateur de filtrage est un opérateur Laplacien de Gaussien.
    6. Procédé selon la revendication 4 ou 5, caractérisé en ce que deux points d'intérêt sont obtenus pour chaque bloc, l'un, dit de premier type, correspondant à une valeur minimale de l'image filtrée et le second, dit de second type, correspondant à une valeur maximale de l'image filtrée.
    7. Procédé de vérification d'images numériques pour déterminer si une première image numérique correspond sensiblement à une seconde image numérique, caractérisé en ce qu'il comporte des étapes de: 2875628 29 obtention, pour lesdites première et seconde image, de descripteurs (D), dits descripteurs semi-locaux, calculés selon le procédé de calcul de descripteur conforme à l'une des revendications 1 à 6.
    - calcul d'une distance, dite distance semi-locale (d), entre la première image et la seconde image, par sommation sur l'ensemble des blocs obtenus par découpage, de distances entre points d'intérêt respectifs appartenant auxdits blocs spatialement correspondants - décision sur une correspondance entre ladite première image et ladite seconde image en fonction de la distance serai-locale calculée. 10 8. Procédé selon la revendication 7, caractérisé en ce que la distance entre points d'intérêt par bloc est égale à la distance maximale entre coordonnées de points d'intérêt.
    9. Procédé selon l'une des revendications 7 ou 8 caractérisé en ce que la distance semi-locale (d) calculée est égale au minimum parmi les distances semi-locales (d) obtenues après application d'une transformation géométrique appartenant à un ensemble prédéterminé de transformations géométriques sur l'une des images considérées.
    10. Procédé selon l'une des revendications 7 à 9 caractérisé en ce 20 que l'étape de décision comporte les sous-étapes de: -calcul d'un seuil (S) en fonction d'une valeur prédéterminée de probabilité de fausse alarme comparaison de la distance semi-locale calculée audit seuil (S).
    11. Procédé selon la revendication 10 caractérisé en ce que la 25 seconde image numérique fait partie d'un ensemble de secondes images numériques, le procédé comportant une étape de: - sélection dans l'ensemble de secondes images, d'au moins une seconde image formant un ensemble de sélection, chacune des secondes images de l'ensemble de sélection étant proche de ladite première image au sens de la distance semi-locale calculée.
    12. Procédé selon la revendication 11 caractérisé en ce que le calcul de distance semi-locale (d) est effectué simultanément pour au moins une 2875628 30 partie de l'ensemble de secondes images, et comprend une étape de mémorisation, pour chaque point dans un bloc du découpage, d'une liste contenant des indices des secondes images de ladite partie ayant un point d'intérêt spatialement correspondant audit point, et le type dudit point d'intérêt.
    13. Procédé selon la revendication 11 ou 12 caractérisé en ce que le calcul d'un seuil (S) est fonction en outre du nombre total d'images dudit ensemble de secondes images (NP).
    14. Procédé selon la revendication 13 caractérisé en ce que l'étape de décision de correspondance comporte les sous-étapes de: - comparaison de la distance semi-locale (d) calculée entre la première image et une seconde image de l'ensemble de sélection audit seuil (S) - émission d'une alarme dans le cas où ladite distance semi-locale calculée (d) est inférieure audit seuil (S).
    15. Procédé selon l'une des revendications 11 à 14 caractérisé en ce que l'étape de sélection comporte en outre une étape d'obtention d'un descripteur supplémentaire (Ds), pour la première image et pour chacune des images dudit ensemble de secondes images, ledit descripteur supplémentaire (Ds) étant indépendant dudit descripteur semi-local (D).
    16. Procédé selon la revendication 15 caractérisé en ce que ledit descripteur supplémentaire est un descripteur basé sur des caractéristiques globales de l'image numérique.
    17. Procédé selon l'une des revendications 15 ou 16 caractérisé en ce que l'étape de sélection comporte en outre une étape de calcul de distance, entre la première image et au moins une seconde image, dite distance supplémentaire (ds), relative audit descripteur supplémentaire (Ds).
    18. Procédé selon la revendication 17 caractérisé en ce que la distance supplémentaire (ds) calculée entre la première image et une seconde image est égale au minimum parmi les distances supplémentaires obtenues après application d'une transformation géométrique appartenant à un ensemble prédéterminé de transformations géométriques sur l'une des images considérées.
    19. Procédé selon les revendications 15 à 18 caractérisé en ce que l'étape de sélection comporte une sous-étape d'obtention d'un premier ensemble de sélection (L1), en fonction de la distance semi-locale (d), comprenant un premier nombre prédéterminé (K) de secondes images.
    20. Procédé selon la revendication 19 caractérisé en ce que l'étape de sélection comporte une sous-étape d'obtention d'un second ensemble de sélection (L2), en fonction de la distance supplémentaire (ds), comprenant un second nombre prédéterminé (Ks) de secondes images.
    21. Procédé selon les revendications 19 et 20 caractérisé en ce que ledit premier ensemble de sélection et ledit second ensemble de sélection comprennent des indices des secondes images et des indicateurs des transformations géométriques associées.
    22. Procédé selon la revendication 21 caractérisé en ce que l'étape de sélection comporte en outre une étape de vérification de compatibilité entre lesdits premier et second ensemble de sélection.
    23. Procédé selon la revendication 22 caractérisé en ce que l'étape de vérification de compatibilité comprend une sous-étape de vérification de compatibilité des indices de secondes images contenus dans lesdits premier et second ensemble de sélection.
    24. Procédé selon la revendication 22 ou 23 caractérisé en ce que l'étape de vérification de compatibilité comprend une sous-étape de vérification de compatibilité des indicateurs de transformation géométrique contenus dans lesdits premier et second ensemble de sélection.
    25. Dispositf de calcul de descripteur d'image numérique caractérisé en ce qu'il comporte: -des moyens d'obtention d'un découpage de l'image en au moins un nombre prédéterminé de blocs - des moyens extraction d'au moins un point d'intérêt par bloc - des moyens mémorisation des coordonnées dudit au moins un point d'intérêt 2875628 32 26. Dispositif selon la revendication 25 caractérisé en ce que les moyens d'obtention d'un découpage comportent en particulier des moyens normalisation de la taille de l'image à une taille prédéterminée.
    27. Dispositif selon l'une des revendications 25 ou 26 caractérisé en 5 ce qu'il comporte des moyens aptes à extraire une composante dite de luminance de l'image numérique.
    28. Dispositif selon l'une des revendications 25 à 27 caractérisé en ce qu'il apte à obtenir un extremum d'un opérateur de filtrage.
    29. Dispositif selon la revendication 28, caractérisé en ce qu'il comporte des moyens aptes à obtenir deux points d'intérêt pour chaque bloc, l'un, dit de premier type, correspondant à une valeur minimale de l'image filtrée et le second, dit de second type, correspondant à une valeur maximale de l'image filtrée.
    30. Dispositif de vérification d'images numériques pour déterminer si 15 une première image numérique correspond sensiblement à une seconde image numérique, caractérisé en ce qu'il comporte: - des moyens d'obtention, pour lesdites première et seconde image, de descripteurs (D), dits descripteurs semi-locaux, obtenus par un dispositif conforme à l'une des revendications 24 à 29.
    - des moyens de calcul d'une distance, dite distance semi-locale (d), entre la première image et la seconde image, par sommation sur l'ensemble des blocs obtenus par découpage, de distances entre points d'intérêt respectifs appartenant auxdits blocs spatialement correspondants - des moyens de décision sur une correspondance entre ladite 25 première et ladite seconde image en fonction de la distance semi-locale calculée.
    31. Dispositif selon la revendication 30, caractérisé en ce que la distance entre points d'intérêt par bloc est égale à la distance maximale entre coordonnées de points d'intérêt.
    32. Dispositif selon l'une des revendications 30 ou 31 caractérisé en ce que la distance semi-locale (d) calculée est égale au minimum parmi les distances semi-locales (d) obtenues après application d'une transformation 2875628 33 géométrique appartenant à un ensemble prédéterminé de transformations géométriques sur l'une des images considérées.
    33. Dispositif selon l'une des revendications 30 à 32 caractérisé en ce que les moyens de décision sont aptes à calculer un seuil en fonction d'une valeur prédéterminée de probabilité de fausse alarme et à effectuer une comparaison de la distance semi-locale calculée audit seuil (S).
    34. Dispositif de vérification d'images selon la revendication 33, caractérisé en ce que la seconde image numérique fait partie d'un ensemble de secondes images numériques et en ce qu'il comporte: - des moyens de sélection dans l'ensemble de secondes images numériques, d'au moins une seconde image numérique formant un ensemble de sélection, chacune des images de l'ensemble de sélection étant proche de la première image numérique au sens de la distance semi-locale calculée.
    35. Dispositif selon la revendication 34 caractérisé en ce qu'il comporte des moyens d'effectuer le calcul de distance semi-locale simultanément pour au moins une partie de l'ensemble de secondes images, et qu'il comprend également des moyens de mémorisation, pour chaque point dans un bloc obtenu par découpage, d'une liste contenant des indices des secondes images de ladite partie ayant un point d'intérêt spatialement correspondant audit point, et le type dudit point d'intérêt.
    36. Dispositif selon la revendication 35 caractérisé en ce qu'il comporte également: - des moyens d'émission d'une alarme dans le cas où ladite distance semi- locale calculée est inférieure audit seuil.
    37. Dispositif selon l'une des revendications 30 à 36 caractérisé en ce que les moyens de sélection comportent en outre des moyens d'obtention d'un descripteur supplémentaire (Ds), pour la première image et ledit ensemble de secondes images, ledit descripteur supplémentaire (Ds) étant indépendant dudit descripteur semi-local (D).
    38. Dispositif selon la revendication 37 caractérisé en ce que les moyens de sélection comportent en outre des moyens de calcul de distance, 2875628 34 entre la première image et au moins une seconde image, dite distance supplémentaire (ds), relative audit descripteur supplémentaire (Ds).
    39. Dispositif selon la revendication 38 caractérisé en ce que la distance supplémentaire (ds) calculée entre la première image et une seconde image est égale au minimum parmi les distances supplémentaires obtenues après application d'une transformation géométrique appartenant à un ensemble prédéterminé de transformations géométriques sur l'une des images considérées.
    40. Dispositif selon les revendications 37 à 39 caractérisé en ce que les moyens de sélection comportent en outre des moyens d'obtention d'un premier ensemble de sélection (L1), en fonction de la distance semilocale (d), comprenant un premier nombre prédéterminé (K) de secondes images.
    41. Dispositif selon la revendication 40 caractérisé en ce que les moyens de sélection comportent en outre des moyens d'obtention d'un second ensemble de sélection (L2), en fonction de la distance supplémentaire (ds) , comprenant un second nombre prédéterminé (Ks) de secondes images.
    42. Dispositif selon la revendication 41 caractérisé en ce que les moyens de sélection comportent en outre des moyens de vérification de compatibilité entre lesdits premier et second ensemble de sélection.
    43. Ordinateur caractérisé en ce qu'il comporte un dispositif
    conforme à l'une des revendications 25 à 29.
    44. Ordinateur caractérisé en ce qu'il comporte un dispositif conforme à l'une des revendications 30 à 42.
    45. Ordinateur, caractérisé en ce qu'il comprend des moyens 25 adaptés à mettre en oeuvre le procédé de calcul de descripteur conforme à l'une des revendications 1 à 6.
    46. Ordinateur, caractérisé en ce qu'il comprend des moyens adaptés à mettre en oeuvre le procédé de vérification d'images numériques conforme à l'une des revendications 7 à 24.
    47. Moyen de stockage d'information, éventuellement partiellement ou totalement amovible, lisible par un système informatique, comprenant des instructions pour un programme adaptées à mettre en oeuvre le procédé de 2875628 35 calcul de descripteur conforme à l'une des revendications 1 à 6, lorsque le programme est chargé et exécuté par le système informatique.
    48. Moyen de stockage d'information, éventuellement partiellement ou totalement amovible, lisible par un système informatique, comprenant des instructions pour un programme adaptées à mettre en oeuvre le procédé de vérification d'images numériques conforme à l'une des revendications 7 à 24, lorsque le programme est chargé et exécuté par le système informatique.
    49. Programme d'ordinateur, lisible par un micro-processeur, caractérisé en ce qu'il comprend des portions de code de logiciel adaptées à mettre en oeuvre le procédé de calcul de descripteur conforme à l'une des revendications 1 à 6, lorsque ledit programme d'ordinateur est chargé et exécuté par le micro-processeur.
    50. Programme d'ordinateur, lisible par un micro-processeur, caractérisé en ce qu'il comprend des portions de code de logiciel adaptées à mettre en oeuvre le procédé de vérification d'images numériques conforme à l'une des revendications 7 à 24, lorsque ledit programme d'ordinateur est chargé et exécuté par le micro-processeur.
FR0410089A 2004-09-23 2004-09-23 Procede et dispositif de calcul d'un descripteur d'image numerique et procede et dispositif de verification d'images numeriques associes Expired - Fee Related FR2875628B1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR0410089A FR2875628B1 (fr) 2004-09-23 2004-09-23 Procede et dispositif de calcul d'un descripteur d'image numerique et procede et dispositif de verification d'images numeriques associes

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0410089A FR2875628B1 (fr) 2004-09-23 2004-09-23 Procede et dispositif de calcul d'un descripteur d'image numerique et procede et dispositif de verification d'images numeriques associes

Publications (2)

Publication Number Publication Date
FR2875628A1 true FR2875628A1 (fr) 2006-03-24
FR2875628B1 FR2875628B1 (fr) 2007-03-16

Family

ID=34949025

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0410089A Expired - Fee Related FR2875628B1 (fr) 2004-09-23 2004-09-23 Procede et dispositif de calcul d'un descripteur d'image numerique et procede et dispositif de verification d'images numeriques associes

Country Status (1)

Country Link
FR (1) FR2875628B1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3126529A1 (fr) * 2021-09-01 2023-03-03 Kerquest Procédé de mise en relation d’une image candidate avec une image de référence.

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002140331A (ja) * 2000-10-30 2002-05-17 Nippon Hoso Kyokai <Nhk> 検索用要素画像抽出装置、検索参照画像入力装置及びプログラムを記録した記録媒体
US20030231806A1 (en) * 1999-07-30 2003-12-18 Vlad Troyanker Perceptual similarity image retrieval
JP2004094379A (ja) * 2002-08-29 2004-03-25 Ntt Comware Corp 類似画像検索装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030231806A1 (en) * 1999-07-30 2003-12-18 Vlad Troyanker Perceptual similarity image retrieval
JP2002140331A (ja) * 2000-10-30 2002-05-17 Nippon Hoso Kyokai <Nhk> 検索用要素画像抽出装置、検索参照画像入力装置及びプログラムを記録した記録媒体
JP2004094379A (ja) * 2002-08-29 2004-03-25 Ntt Comware Corp 類似画像検索装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
PATENT ABSTRACTS OF JAPAN vol. 2002, no. 09 4 September 2002 (2002-09-04) *
PATENT ABSTRACTS OF JAPAN vol. 2003, no. 12 5 December 2003 (2003-12-05) *
R. GONZALEZ, R. WOODS: "Digital Image Processing", 2002, PRENTICE-HALL, NEW JERSEY, ISBN: 0-201-18075-8, XP002327085 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3126529A1 (fr) * 2021-09-01 2023-03-03 Kerquest Procédé de mise en relation d’une image candidate avec une image de référence.
WO2023031305A1 (fr) * 2021-09-01 2023-03-09 Kerquest Procédé de mise en relation d'une image candidate avec une image de référence

Also Published As

Publication number Publication date
FR2875628B1 (fr) 2007-03-16

Similar Documents

Publication Publication Date Title
Korus et al. Multi-scale analysis strategies in PRNU-based tampering localization
FR2968426A1 (fr) Calcul de comparaison asymetrique a grande echelle pour integrations binaires
CN111445459B (zh) 一种基于深度孪生网络的图像缺陷检测方法及系统
EP3707676A1 (fr) Procédé d&#39;estimation de pose d&#39;une caméra dans le référentiel d&#39;une scène tridimensionnelle, dispositif, système de réalite augmentée et programme d&#39;ordinateur associé
EP1088279A1 (fr) Procede de recherche d&#39;images, fonde sur une indexation invariante des images
EP3832535A1 (fr) Procédé de détection d&#39;au moins un élément d&#39;intérêt visible dans une image d&#39;entrée au moyen d&#39;un réseau de neurones à convolution
FR2917525A1 (fr) Traitement de donnees biometriques par transformation
FR3053500B1 (fr) Procede de detection de fraude d&#39;un systeme de reconnaissance d&#39;iris
FR2905188A1 (fr) Procede et dispositif de conversion de densites d&#39;image
Steinebach et al. Efficient cropping-resistant robust image hashing
Zhang et al. Multi-scale segmentation strategies in PRNU-based image tampering localization
CN111723692A (zh) 基于卷积神经网络语义分类的标签特征的近重复视频检测方法
Xue et al. JPEG image tampering localization based on normalized gray level co-occurrence matrix
WO2010142897A2 (fr) Procédé et dispositif de calibration d&#39;un capteur d&#39;images utilisant un système temps réel de suivi d&#39;objets dans une séquence d&#39;images
EP2652674B1 (fr) Procede de comparaison d&#39;images d&#39;iris par selection intelligente de zones texturees
FR2875628A1 (fr) Procede et dispositif de calcul d&#39;un descripteur d&#39;image numerique et procede et dispositif de verification d&#39;images numeriques associes
CN113674230B (zh) 一种室内逆光人脸关键点的检测方法及装置
EP3933626B1 (fr) Evaluation du biais d&#39;une fonction d&#39;identification biométrique
EP3929809A1 (fr) Procédé de détection d&#39;au moins un trait biométrique visible sur une image d entrée au moyen d&#39;un réseau de neurones à convolution
CN114359815A (zh) 一种快速审核视频内容的处理方法
EP2082336B1 (fr) Procede de recherche et de reconnaissance rapides d&#39;une image numerique representative d&#39;au moins un motif graphique dans une banque d&#39;images numeriques
CN117593517B (zh) 基于互补感知跨视图融合网络的伪装目标检测方法
FR2875627A1 (fr) Procede de determination d&#39;un descripteur d&#39;image, procede de comparaison d&#39;images, procede de recherche d&#39;image et dispositifs associes
FR2944937A1 (fr) Procede et dispositif de restauration d&#39;une sequence video
FR2971601A1 (fr) Procedes, dispositif et programmes d&#39;ordinateur pour la reconnaissance de formes, en temps reel, a l&#39;aide d&#39;un appareil comprenant des ressources limitees

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20140530