FR2860377A1

FR2860377A1 - Procede et dispositif de verification d'entites multimedia, notamment pour la verification des images numeriques

Info

Publication number: FR2860377A1
Application number: FR0311269A
Authority: FR
Inventors: Stephane Baron; Eric Nguyen; Floch Herve Le
Original assignee: Canon Research Center France SAS
Current assignee: Canon Research Center France SAS
Priority date: 2003-09-25
Filing date: 2003-09-25
Publication date: 2005-04-01

Abstract

Le procédé de vérification d'entités multimédia selon l'invention pour déterminer si une première entité multimédia correspond à une seconde entité multimédia, est caractérisé en ce qu'il comporte une étape de sélection dans une pluralité de secondes entités multimédia, par une recherche basée sur le contenu, d'un ensemble de secondes entités multimédia proches de la première entité multimédia, et une étape de décision sur une correspondance entre la première entité multimédia et au moins une seconde entité multimédia de l'ensemble de secondes entités multimédia, à partir d'une comparaison entre la première entité multimédia et les secondes entités multimédia de l'ensemble. Les procédé et dispositif selon l'invention autorisent l'obtention d'un bon niveau de performance malgré la contrainte d'un temps de traitement limité. L'invention trouve une application privilégiée dans le domaine des images numériques.

Description

La présente invention concerne un procédé et un dispositif de vérification

d'entités multimédia. Plus particulièrement, la présente invention

concerne un procédé et un dispositif de vérification d'entités multimédia adaptés pour la vérification des images numériques.

Le réseau Internet représente un immense réservoir d'informations en tous genres. L'image y prend une part de plus en plus grande, et il devient très difficile de contrôler l'usage qui est fait d'une image publiée sur un site web.

Des dispositifs de vérification d'images ont vu le jour pour essayer de contrôler l'usage de certaines images sur le réseau Internet.

La fonction d'un dispositif de vérification d'images sur le réseau Internet est de déterminer si une image enregistrée auprès d'un opérateur d'enregistrement, ou auprès de l'opérateur gérant le dispositif de vérification d'images, est publiée sur un ou plusieurs sites web. De tels dispositifs trouvent par exemple des applications dans la recherche d'images piratées (détection d'usages illégaux d'images), ou encore dans la médiamétrie (mesure de l'utilisation des images).

La performance d'un dispositif de vérification d'images se mesure en terme de compromis entre le taux de fausses alarmes, le taux de non détection et le temps de traitement.

Le taux de fausses alarmes est égal au pourcentage des images publiées qui sont détectées comme correspondant à une image enregistrée alors que ce n'est pas la même image.

Le taux de non détection correspond au pourcentage des images publiées non détectées par le dispositif de vérification d'images alors que ces images publiées sont les mêmes que des images enregistrées.

Le temps de traitement correspond au temps nécessaire pour traiter une image à vérifier (image provenant par exemple du web).

Les dispositifs de vérification d'images demandent une optimisation quant à leur complexité, car des contraintes existent sur le temps de traitement et les ressources matérielles disponibles.

En effet, le dispositif de vérification d'images doit être capable de traiter en continu un volume d'images à vérifier dans une durée acceptable par l'utilisateur, ce qui impose une limite supérieure au temps de traitement.

Le taux de fausses alarmes et le taux de non détection sont fonctions l'un de l'autre, de façon décroissante. Du point de vue de l'utilisateur, il est important de pouvoir fixer le taux de fausses alarmes à une valeur faible afin que les alarmes fournies par le dispositif de vérification d'images et reçues par les utilisateurs soient quasiment toutes valides.

Les dispositifs de vérification d'images connus font généralement appel à une seule technique de comparaison, à savoir, une technique basée sur une caractérisation d'image ou une technique basée sur un marquage/tatouage.

Ainsi, il est connu, par le document US-6026411, un dispositif de vérification d'images faisant appel à une technique de caractérisation d'image.

II est également connu, par le document US-5862260, un dispositif de vérification d'images dans lequel est employée une technique de marquage/tatouage invisible d'image.

Une vérification d'images dans laquelle est employée seulement une technique de marquage/tatouage invisible d'image ne peut garantir un taux de non détection, car les techniques de tatouage ont une robustesse limitée face aux modifications que l'image publiée a pu subir. Ainsi, la marque insérée dans l'image peut être effacée par certaines manipulations, même non intentionnelles. Par conséquent, le taux de détection peut devenir égal à zéro pour certaines manipulations d'images.

Par ailleurs, le nombre des informations qu'il est possible d'insérer dans les images est intrinsèquement limité par la contrainte de visibilité de la marque, et ce nombre décroît avec le niveau de robustesse souhaité. Dans l'état actuel de la technique, pour un niveau de robustesse compatible avec l'attente des utilisateurs d'un dispositif de vérification d'images, le nombre des informations pouvant être d'insérées est insuffisant pour le codage d'un identifiant unique par image. Ainsi, le dispositif de vérification d'images décrit dans le document US-5862260 ne permet par exemple qu'une simple identification du propriétaire de l'image et non pas celle de l'image elle-même compte tenu que le nombre des images possibles est considérablement supérieur au nombre de propriétaires.

Un dispositif de vérification d'images faisant appel à une technique de caractérisation d'image, comme celui décrit dans le document US-6026411, s'appuie sur des informations supplémentaires des images enregistrées. Un tel dispositif peut garantir en principe un taux de non détection arbitrairement faible en renvoyant à l'utilisateur l'ensemble des images les plus similaires à l'image à vérifier. Un inconvénient d'un tel dispositif, étant donné la dépendance entre les niveaux respectifs des taux de non détection et de fausses alarmes, est qu'il conduit à un taux de fausses alarmes incompatible avec l'attente des utilisateurs d'un dispositif de vérification d'images.

Les dispositifs de vérification d'images de la technique antérieure décrits ci-dessus sont par conséquent peu adaptés à garantir un niveau de performance déterminé.

Pour accroître le niveau de performances, une solution serait d'utiliser des techniques de vérification additionnelles, plus complexes, faisant appel notamment à des informations sur les images enregistrées. Une étape de recalage géométrique de l'image à vérifier permettrait en particulier d'accroître les performances (notamment le taux de fausses alarmes) des dispositifs de vérification d'images par tatouage ou par caractérisation d'image. Cependant, de telles techniques sont intrinsèquement très coûteuses en temps de traitement. De plus, elles doivent être appliquées à toutes les images de la base d'images enregistrées et cela pour chaque image à vérifier. L'application de ces techniques de vérification additionnelles complexes pose donc un problème technique à l'homme du métier compte tenu du volume d'informations à traiter et de la contrainte sur le temps de traitement.

La présente invention concerne un procédé de vérification d'entités multimédia dans lequel un bon niveau de performance est garanti sous la contrainte d'un temps de traitement limité.

Le procédé de vérification d'entités multimédia selon l'invention pour déterminer si une première entité multimédia correspond sensiblement à une seconde entité multimédia, est caractérisé en ce qu'il comporte les étapes de: - sélection dans une pluralité de secondes entités multimédia, par une recherche basée sur le contenu, d'un ensemble de secondes entités multimédia proches de la première entité multimédia, et - décision sur une correspondance entre la première entité multimédia et au moins une seconde entité multimédia de l'ensemble de secondes entités multimédia, à partir d'une comparaison entre la première entité multimédia et les secondes entités multimédia de l'ensemble.

Le principe du procédé de vérification d'entités multimédia selon l'invention repose sur un découpage en deux étapes, à savoir, une étape de sélection et une étape de décision. Ce découpage en deux étapes, associé à l'utilisation de techniques adaptées à chacune des étapes, autorise l'emploi de techniques de décision complexes assurant un taux de fausses alarmes suffisamment faible avec un contrôle sur le temps de détection et le taux de non détection.

La recherche basée sur le contenu de l'étape de sélection présente l'avantage d'utiliser des caractéristiques intrinsèques des entités multimédia, caractéristiques intrinsèques qu'un éventuel pirate est peu enclin à modifier ou effacer.

A l'étape de décision, compte tenu que les secondes entités multimédia sélectionnées sont en nombre réduit, de préférence fixe, il est possible d'employer des techniques dont la complexité en interdit l'utilisation dans l'étape de sélection, afin de ne pas accroître de manière drastique le temps de détection.

Du fait de ce découpage en une étape de sélection et une étape de décision, il est possible d'extraire une partie des traitements dont le temps d'exécution est directement dépendant du nombre des secondes entités multimédia.

Avantageusement, dans l'étape de sélection, l'ensemble sélectionné de secondes entités multimédia comprend les K secondes entités multimédia les plus proches de la première entité multimédia, K ayant une valeur constante prédéterminée.

La valeur de K intervient fortement dans le calcul du taux de nondétection et peut être déterminée de manière théorique ou empirique selon les techniques utilisées.

Dans un procédé de vérification selon la technique antérieure, à savoir, sans découpage en deux étapes, l'égalité (1) suivante est obtenue: (1) T = fl (Nr) ; avec le temps de détection T qui est une fonction croissante f1() du nombre Nr des secondes entités multimédia.

Avec le découpage en deux étapes, sélection et décision, selon la présente invention, l'égalité (2) est obtenue: (2) T = Ts+Td, avec Ts= f2(Nr) et Td=f3(K)=constante Avec le temps de sélection Ts qui est une fonction croissante f2() du nombre Nr des secondes entités multimédia; et le temps de décision Td qui est une constante dans la mesure où K a une valeur constante.

D'où l'égalité (3) : (3) T=f2(Nr) + constante.

Du fait de la valeur constante du temps de décision, Td = constante, il est possible d'utiliser des techniques de comparaison plus complexes et sophistiquées dans l'étape de décision.

Selon d'autres caractéristiques, le procédé selon l'invention comporte des sous-étapes de: - calcul d'au moins un premier descripteur pour la première entité multimédia, et - obtention d'au moins un second descripteur pour chaque seconde entité multimédia; et la recherche basée sur le contenu utilise les premier et seconds descripteurs décrivant les première et secondes entités multimédia pour sélectionner l'ensemble de secondes entités multimédia.

De préférence, les descripteurs comportent au moins un descripteur de type global et/ou au moins un descripteur de type local.

Selon le niveau de précision souhaité dans l'étape de sélection, plusieurs options quant aux choix des descripteurs sont possibles.

Si l'on veut favoriser une vitesse de traitement élevée, alors des descripteurs rapides sont les plus adaptés. Si par contre, la robustesse à de multiples transformations géométriques est privilégiée (en particulier la robustesse à des opérations de recadrage quelconque des images numériques), des descripteurs locaux seront de préférence utilisés. Le cas le plus performant du point de vue du taux de non-détection est la mise en parallèle de plusieurs types de descripteurs.

Selon encore une autre caractéristique, l'étape de décision comporte des sous-étapes de: - recalage de la première entité multimédia relativement à une seconde entité multimédia en cours de traitement de l'ensemble de secondes entités multimédia, - mesure d'un niveau de correspondance, après recalage, entre la première entité multimédia et la seconde entité multimédia en cours de traitement de l'ensemble de secondes entités multimédia, et - comparaison entre le niveau de correspondance et un premier seuil prédéterminé afin de décider de la correspondance entre la première entité multimédia et la seconde entité multimédia en cours de traitement de l'ensemble de secondes entités multimédia.

La sous-étape de recalage peut comporter un changement d'échelle de la premièré entité multimédia et/ou un recadrage de la première entité multimédia et/ou une utilisation de points d'intérêt dans les entités multimédia.

La caractéristique ci-dessus est avantageuse notamment lorsque la première entité multimédia, par exemple récupérée sur le réseau lnternet, est une version modifiée d'une seconde entité multimédia sélectionnée. Dans le cas d'une image numérique, une telle modification comprend par exemple une modification des couleurs et/ou des modifications géométriques (recadrage, changement d'échelles, etc.).

Selon un mode de réalisation préféré, l'étape de décision comporte des sous-étapes de: - extraction d'un premier message de tatouage inséré dans la première entité multimédia, - calcul d'une distance binaire entre la premier message de tatouage et un second message de tatouage d'une seconde entité multimédia en cours de traitement de l'ensemble de secondes entités multimédia, et - comparaison entre la distance binaire et un second seuil prédéterminé afin de décider de la correspondance entre la première entité multimédia et la seconde entité multimédia en cours de traitement de l'ensemble de secondes entités multimédia.

Dans ce mode de réalisation préféré, l'étape de décision peut également comporter une sous-étape de recalage de la première entité multimédia relativement à la seconde entité multimédia en cours de traitement de l'ensemble de secondes entités multimédia, la sous-étape de recalage étant effectuée avant la sous-étape d'extraction afin permettre une extraction du premier message de tatouage à partir de la première entité multimédia recalé.

Le procédé selon l'invention, du fait du découpage en deux étapes, de sélection et de décision, autorise l'utilisation d'algorithme complexe de détection de marque de tatouage ou de recalage géométrique.

Selon un mode de réalisation avantageux, lors de l'étape de comparaison, une alarme est fournie lorsque la probabilité d'erreur est inférieure à un seuil d'alarme prédéterminé. Le niveau du seuil d'alarme détermine la probabilité de fausse alarme. Certaines secondes entités multimédia sélectionnées à l'étape de décision et ayant une probabilité d'erreur supérieure au seuil d'alarme peuvent donner lieu à un simple avertissement.

Le procédé selon l'invention trouve une application particulière dans la vérification des images numériques. Dans cette application, les images numériques peuvent être représentées, au niveau de l'opérateur gérant le dispositif de vérification d'images, et selon le traitement effectué, par des metadonnées et/ou un résumé de basse résolution et/ou un ensemble de points d'intérêt et/ou des dimensions des images.

Concernant la vérification des images numériques, un mode de réalisation préféré du procédé selon l'invention comprend l'utilisation de descripteurs globaux dans l'étape de sélection et l'utilisation d'un tatouage ( watermark en anglais) dans l'étape de décision. Un descripteur global utilisable dans ce mode de réalisation préféré est par exemple le descripteur global décrit dans FR-0304595.

Toujours dans le domaine des images numériques, un autre mode de réalisation préféré du procédé selon l'invention comprend l'utilisation de descripteurs locaux dans l'étape de sélection et l'utilisation d'un recalage géométrique dans l'étape de décision.

Pour de plus amples informations concernant les descripteurs locaux et les techniques associées à leur utilisation, le lecteur est renvoyé notamment aux références suivantes: - l'article Local grayvalue invariants for image retrieval de C. 5 Schmid et R. Mohr, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.19, N 5, pages 530 à 534, 1997; l'article Utilisation de la couleur pour l'appariement et l'indexation d'images de P. Gros et al., Rapport de Recherche INRIA, N 3269, Septembre 1997; - l'article MLESAC: A new robust estimator with application to estimating image geometry de P. Torr et A. Zisserman, CVIU, Vol. 78, pages 138 à 156, 2000.

La présente invention a également pour objectif de fournir un dispositif de vérification d'entités multimédia dans lequel les inconvénients 15 mentionnés ci-dessus de la technique antérieure sont résolus.

Le dispositif de vérification d'entités multimédia selon l'invention pour déterminer si une première entité multimédia correspond à une seconde entité multimédia, est caractérisé en ce qu'il comporte: - des moyens de sélection dans une pluralité de secondes entités multimédia, par une recherche basée sur le contenu, d'un ensemble de secondes entités multimédia proches de la première entité multimédia, et - des moyens de décision sur une correspondance entre la première entité multimédia et au moins une seconde entité multimédia de l'ensemble de secondes entités multimédia, à partir d'une comparaison entre la première entité multimédia et les secondes entités multimédia de l'ensemble.

Selon une autre caractéristique, les moyens de sélection comportent: - des moyens de calcul d'au moins un premier descripteur pour la première entité multimédia, et - des moyens de calcul d'au moins un second descripteur pour chaque seconde entité multimédia; et la recherche basée sur le contenu utilise les premier et seconds descripteurs décrivant les première et secondes entités multimédia pour sélectionner l'ensemble de secondes entités multimédia.

De préférence, les moyens de sélection et moyens de calcul sont adaptés au traitement de descripteurs comportant au moins un descripteur de type global et/ou au moins un descripteur de type local.

Selon encore une autre caractéristique, les moyens de décision comportent: - des moyens de recalage de la première entité multimédia relativement à une seconde entité multimédia en cours de traitement de l'ensemble de secondes entités multimédia, - des moyens de mesure d'un niveau de correspondance, après recalage, entre la première entité multimédia et la seconde entité multimédia en cours de traitement de l'ensemble de secondes entités multimédia, et - des moyens de comparaison entre le niveau de correspondance et un premier seuil prédéterminé afin de décider de la correspondance entre la première entité multimédia et la seconde entité multimédia en cours de traitement de l'ensemble de secondes entités multimédia.

Les moyens de recalage peuvent être adaptés à effectuer un recalage par changement d'échelle de la première entité multimédia et/ou par recadrage de la première entité multimédia et/ou par une utilisation de points d'intérêt dans les entités multimédia.

Selon encore une autre caractéristique, les moyens de décision - des moyens d'extraction d'un premier message de tatouage inséré dans la première entité multimédia, - des moyens de calcul d'une distance binaire entre le premier message de tatouage et un second message de tatouage d'une seconde entité multimédia en cours de traitement de l'ensemble de secondes entités multimédia, et - des moyens de comparaison entre la distance binaire et un second seuil prédéterminé afin de décider de la correspondance entre la première entité multimédia et la seconde entité multimédia en cours de traitement de l'ensemble de secondes entités multimédia.

Les moyens de décision peuvent comporter également des moyens de recalage de la première entité multimédia relativement à la seconde entité multimédia en cours de traitement de l'ensemble de secondes entités multimédia, le recalage étant effectué sur la première entité multimédia préalablement à une extraction du premier message de tatouage inséré dans celle-ci.

comportent: Selon une forme de réalisation préférée, le dispositif selon l'invention comporte des moyens adaptés à vérifier des entités multimédia constituées par des images numériques qui peuvent être représentées, au niveau de l'opérateur gérant le dispositif de vérification, et selon le traitement effectué, par des meta-données et/ou un résumé de basse résolution et/ou un ensemble de points d'intérêt et/ou des dimensions des images.

De préférence, les moyens de sélection, et de décision sont intégrés dans un système de traitement d'information comprenant: - une unité centrale, une mémoire morte, - une mémoire vive, et - une unité de stockage d'information.

Un dispositif selon l'invention particulièrement adapté à une 5 vérification d'images numériques comporte de préférence une caméra numérique connectée au système de traitement d'information.

Pour d'autres applications, par exemple dans les domaines du son et de la vidéo, le dispositif selon l'invention peut également être équipé d'un microphone connecté au système de traitement d'information.

De plus, de manière avantageuse, le dispositif selon l'invention comporte également: - une interface de communication pour autoriser une connexion au réseau Internet, et - un robot logiciel pour charger dans le dispositif des images 15 publiées sur des sites web.

Le dispositif de vérification d'entités multimédia tel que défini plus haut est particulièrement adapté à une mise en oeuvre du procédé selon l'invention.

Les avantages et caractéristiques particulières propres au dispositif de vérification d'entités multimédia selon l'invention étant similaires à ceux exposés ci-dessus concernant le procédé conforme à l'invention, ils ne seront pas rappelés ici.

L'invention concerne également un appareil de traitement d'une image numérique comprenant un dispositif de vérification d'images numériques selon l'invention, ainsi qu'un programme d'ordinateur et un moyen de stockage d'information pour une mise en oeuvre du procédé selon l'invention.

Les procédé et dispositif de vérification d'entités multimédia selon l'invention trouveront aussi des applications dans la vérification des textes, en tant qu'entités multimédia, sachant que l'homme du métier muni de ses connaissances générales est capable de définir des descripteurs adaptés à différents contenus multimédia, ainsi que des techniques de tatouage ou de recalage.

D'autres caractéristiques et avantages de la présente invention apparaîtront à la lecture de la description suivante de plusieurs modes et formes de réalisation préférés des procédé et dispositif de vérification d'entités multimédia selon l'invention, en liaison aux dessins annexés, dans lesquels: la Fig.1 montre une vue globale d'un dispositif de vérification d'images numériques selon l'invention dans laquelle apparaissent des processus de traitement implantés dans le dispositif; la Fig.2 est un organigramme fonctionnel montrant un processus d'enregistrement d'images numériques mis en oeuvre dans le dispositif de vérification d'images numériques de la Fig.1; la Fig.3 est un organigramme fonctionnel montrant de manière globale un procédé de vérification d'images numériques selon l'invention; la Fig.4 est un organigramme fonctionnel montrant un processus de sélection d'images numériques mis en oeuvre dans le dispositif de vérification d'images numériques de la Fig.1; la Fig.5 est un organigramme fonctionnel montrant un premier mode de réalisation d'un processus de décision mis en oeuvre dans le dispositif de vérification d'images numériques de la Fig.1; la Fig.6 est un organigramme fonctionnel montrant un second mode de réalisation d'un processus de décision mis en oeuvre dans le dispositif de vérification d'images numériques de la Fig.1; et la Fig.7 est un bloc- diagramme montrant une forme de réalisation préférée du dispositif de vérification d'images numériques de la Fig.1 construite autour d'un micro- ordinateur.

En référence à la Fig.1, le dispositif de vérification d'images 1 selon l'invention reçoit en entrée des images IC à protéger qui sont fournies par des clients 2 et des images lP qui sont publiées par exemple sur des sites web 3. Le dispositif 1 a à charge de comparer les images IP avec les images IC. Dans la suite de la description, les images IC sont appelées images propriétaire et les images IP sont appelées images publiées .

Dans cette forme de réalisation préférée, les images IC et IP sont transportées jusqu'au dispositif 1 à travers un réseau de communication 4, par exemple, le réseau Internet. Dans d'autres formes de réalisation, les images IC et IP peuvent être chargées dans le dispositif 1 à partir, par exemple, d'une disquette ou d'un CD-ROM.

Le dispositif de vérification d'images 1 selon l'invention délivre en sortie une information d'alarme ou d'avertissement AL lorsqu'une image publiée IP présente un niveau de similarité élevé avec une image propriétaire IC enregistrée dans le dispositif 1. La détection d'un niveau de similarité élevé pour une image publiée IP indique une probabilité élevée pour que les images IP et IC soient les mêmes.

Les principaux processus de traitement réalisés dans le dispositif de vérification d'images 1 sont montrés à la Fig.1. Ces processus de traitement comprennent essentiellement un processus d'enregistrement d'images propriétaire 10, un processus de collecte d'images publiées 11 et un processus de vérification d'images 12.

Le processus d'enregistrement d'images propriétaire 10 est maintenant plus particulièrement décrit en référence à la Fig.2.

Le processus d'enregistrement d'images propriétaire 10 commence par une étape E100 relative au chargement d'une image propriétaire IC dans le dispositif 1. L'image propriétaire IC est par exemple issue d'un appareil photographique numérique ou d'un scanner.

Après le chargement de l'image propriétaire IC, il est généré, étape E101, un identificateur non-équivoque ID pour l'image propriétaire IC. La génération de l'identificateur ID est par exemple réalisée par incrémentation d'un compteur interne du dispositif 1, par horodatage, par signature d'image, ou tout autre technique connue permettant la génération d'un identificateur non- équivoque.

L'étape E101 réalise également un enregistrement de metadonnées MD associées à l'image propriétaire IC. Les meta-données MD comprennent par exemple le nom du propriétaire de l'image IC, les dimensions et le format de l'image (jpeg, gif, etc.), mais aussi des données utilisateur de tout type qui peuvent être associées à l'image, comme par exemple des champs décrivant le contenu de l'image. Les meta-données MD sont stockées dans une base de données de texte 100m de type classique, via un dispositif de gestion de base de données (SGBD) tel que postgresgl, mysgl, oracle, etc. (marques déposées).

Selon le procédé de l'invention, les étapes E103 à E106 décrites cidessous sont facultatives et peuvent être absentes dans certains modes de réalisation.

Dans cette forme de réalisation préférée du système 1, un processus de décision, décrit ci-dessous en référence aux Figs.3, 5 et 6, est basé sur une détection d'une marque de tatouage ( watermarking en anglais) dans les images, et les étapes E103 à E106 sont présentes afin d'effectuer le tatouage correspondant dans les images. Un tel processus de décision est intégré dans le processus de vérification d'images 12 et est décrit de manière plus détaillée par la suite.

A l'étape E103, afin de tatouer une image propriétaire IC, le processus 10 génère les informations de tatouage suivantes: une clé secrète CS, une séquence pseudo-aléatoire SPA, un message ME et le type ALGO de l'algorithme de tatouage utilisé. Les caractéristiques de ces informations de tatouage, telles que les tailles de la clé CS, du message ME, etc., sont dépendantes de la technique de tatouage utilisée. De manière connue, la séquence pseudo-aléatoire SPA est de préférence générée à partir de la clé secrète CS.

A l'étape E104, les informations de tatouage CS et ME sont stockées dans la base 100m. Ces informations CS et ME sont utilisées ultérieurement dansle processus de vérification d'images 12.

L'insertion d'une marque de tatouage MA dans l'image propriétaire IC est effectuée à l'étape E105. La marque de tatouage MA est générée en fonction de la séquence pseudo-aléatoire SPA, et peut également dépendre du message ME.

L'étape E106 envoie en retour aux clients 2 des images tatouées incluant des marques de tatouage MA et correspondant aux images propriétaire IC. Les images propriétaire IC publiées par les clients 2 sont celles comportant les marques de tatouage MA.

Une étape E107 est prévue afin d'extraire par calcul des descripteurs visuels DE caractérisant l'image propriétaire IC tatouée ou non. Conformément à l'invention, une pluralité de N descripteurs visuels DE peuvent être calculés et ceux-ci peuvent être de différents types. Des descripteurs dits globaux et/ou des descripteurs dits locaux sont de préférence utilisés dans cette forme de réalisation. Cependant, il est clair pour l'homme du métier que d'autres techniques de description d'image peuvent être employées.

Une étape d'indexation E108 est ensuite prévue et consiste en un stockage des descripteurs visuels DE dans une base de descripteurs d'images propriétaire 100d. Des indexations de différents types peuvent être réalisées, par exemple, celles basées sur un stockage séquentiel, un stockage structuré en classes ou un stockage sous une forme arborescente.

Selon une variante de réalisation, l'image propriétaire IC initiale, c'est-à-dire, celle reçue à l'étape E100, est également stockée dans le dispositif 1, sous la forme d'un résumé tel qu'une imagette.

Comme montré à la Fig.2, pour des raisons de commodité de la description, les bases 100m et 100d sont ici considérées comme des composantes d'une base de données plus générale désignée base d'images propriétaire 100. La base d'images propriétaire 100 comprend toutes les données et informations traitées par le dispositif 1 qui sont relatives aux images propriétaire IC.

En référence à la Fig.3, il est maintenant décrit de manière générale le processus de collecte d'images publiées 11 et le processus de vérification d'images 12.

Dans cette forme de réalisation préférée, les images publiées IP sont récupérées sur des sites web 3 du réseau Internet.

Le processus de collecte d'images publiées 11 fait appel de préférence à un robot logiciel 110, de type crawler ou spider en anglais. Une base 111 fournit au robot logiciel 110 les adresses des sites web 3 à surveiller. Le robot logiciel 110 parcourt les sites web 3 indiqués par la base 111, et pour chaque site, récupère les images publiées IP présentes sur ce site. Différentes techniques peuvent être utilisées par le robot logiciel 110. Par exemple, le robot logiciel 110 peut suivre des hyperliens présents sur les différentes pages web du site afin de récupérer un maximum d'images. Des produits logiciels connus de l'homme du métier, tels que Memoweb ou Teleport Pro (marques déposées), peuvent être employés pour le robot logiciel 110.

Les images publiées IP collectées par le robot logiciel 110 peuvent par exemple être stockées dans une base d'images publiées 112.

Le processus de vérification d'images 12 a pour fonction de déterminer si une image publiée IP collectée sur un site web 3 correspond à l'une des images propriétaire IC enregistrées.

Conformément à l'invention, le processus de vérification d'images 12 comprend essentiellement un processus de sélection P120 et un processus de décision P121 montrés à la Fig.3.

Le processus de sélection P120 a pour fonction de sélectionner un nombre limité d'images propriétaire IC pour chaque image publiée IP collectée par le robot logiciel 110. K images propriétaire ICI à ICK sont sélectionnées par le processus de sélection P120. Le processus de décision P121 compare ensuite chaque image publiée IP aux images propriétaire sélectionnées ICk (k=1 à K). Il est ainsi possible de limiter le nombre des étapes de décision et de réduire de manière importante la charge de calcul pour le processus de vérification d'images 12.

Le processus de décision P121 a pour fonction de décider si une image publiée IP est suffisamment proche d'une image propriétaire IC pour justifier la génération d'une alarme ou d'un avertissement AL à l'intention du client 2 concerné. A cette fin, le processus de décision P121 effectue des calculs de comparaison sur l'image publiée IP et les images propriétaire ICk (k=1 à K) sélectionnées dans le processus de sélection P120, afin de déterminer, avec une mesure de probabilité d'erreur, si l'image publiée IP correspond à l'une des images propriétaire sélectionnées ICk (k=1 à K).

Un mode de réalisation préféré E120 du processus de sélection est maintenant décrit de manière plus détaillée en référence également à la Fig.4.

Le processus de sélection E120 emploie des techniques de recherche basée sur le contenu afin de sélectionner les K images propriétaire ICI à ICK les plus proches d'une image publiée IPt en cours de traitement. La proximité de deux images IP et IC doit ici être comprise au sens de la similarité visuelle entre celles-ci.

Parmi les techniques de recherche basée sur le contenu basées sur la similarité visuelle, il est possible d'utiliser par exemple des techniques connues faisant appel à des descripteurs globaux et à des mesures de distance, ou à des descripteurs locaux et à une technique de recherche associée.

Comme montré à la Fig.4, une étape E1200 est prévue au début du processus de sélection E120 afin d'extraire un ou plusieurs descripteurs DEt qui caractérisent l'image publiée IPt.

La technique d'extraction des descripteurs DEt est analogue à celle employée dans le processus d'enregistrement d'images propriétaire 10. Eventuellement, un ou plusieurs descripteurs parmi N descripteurs utilisables dans le dispositif de vérification d'images selon l'invention sont sélectionnés. Les descripteurs DEt extraits sont ensuite utilisés à une étape E1201.

A l'étape E1201, il est effectué une recherche dans la base de descripteurs indexée 100d. Des descripteurs DEc les plus proches des descripteurs DEt sont extraits de la base 100d. Les descripteurs DEc extraits sont ceux correspondant aux images propriétaire sélectionnées ICk (k=1 à K).

Les images propriétaire sélectionnées ICk (k=1 à K) sont identifiées par leurs identificateurs non-équivoques respectifs IDk (k=1 à K) et sont triées par ordre décroissant sur la base d'une mesure de similarité avec l'image publiée IPt.

Lorsque des descripteurs de différents types sont employés conjointement, les images les plus proches correspondant aux différents types de descripteurs sont regroupées et les éventuelles images en doublon sont éliminées.

Une étape E1202 initialise une base de résultats 1203 en y stockant les résultats obtenus à l'étape E1201. Ainsi, par exemple, pour chaque image propriétaire ICk (k=1 à K), il est écrit une ligne, dans la base de résultats 1203, comprenant l'identificateur IDt de l'image publiée IPt, l'identificateur IDk de l'image propriétaire ICk, et un score de recherche, c'est-à-dire, une mesure de similarité MSk.

Dans le cas de descripteurs globaux DEG, la mesure de similarité MSk peut par exemple être l'inverse d'une distance entre les descripteurs globaux DEGt de l'image publiée IPt et les descripteurs globaux DEGc de l'image propriétaire ICk.

Dans le cas de descripteurs locaux DEL, la mesure de similarité MSk peut par exemple être le nombre de descripteurs locaux appariés (DELt, 20 DELc) entre les images IPt et ICk.

Dans le cas où plusieurs techniques de description sont combinées, il est possible de faire appel à une combinaison de plusieurs mesures de similarité.

Lorsque le processus de sélection E120 a achevé son traitement pour l'image publiée IPt, l'état de l'image publiée IPt est modifié dans la base d'images publiées 112, étape E1203. Cette modification de l'état de l'image publiée IPt indique au processus de décision que la sélection est terminée.

Le processus de décision est maintenant décrit de manière générale en référence à un mode de réalisation préféré E121 montré à la Fig.5.

Le processus de décision E121 démarre par une étape de calcul E1210.

A l'étape E1210, afin d'effectuer le traitement correspondant à l'image publiée IPt, le processus de décision E121 récupère, dans la base d'images publiées 112, l'image publiée IPt en cours de traitement et, dans la base de meta-données 100m et la base de résultats 1203, les informations relatives aux images propriétaire sélectionnées ICk (k=1 à K) .

Ensuite, le processus de décision effectue des calculs complémentaires sur l'image publiée IPt et les images propriétaire sélectionnées ICk (k=1 à K), en complément à ceux déjà effectués à l'étape de sélection E120. Les calculs complémentaires comprennent par exemple une tentative de recalage géométrique de l'image publiée IPt, ou encore l'extraction d'une marque de tatouage MA.

Une étape E1211 fait suite à l'étape E1210 et calcule une valeur PEk (k=1 à K) caractérisant la pertinence de la mise en correspondance, pour chacune des images propriétaire sélectionnées ICk (k=1 à K). Cette valeur PEk (k=1 à K) peut par exemple, dans le cas des images tatouées, être le pourcentage de bits erronés entre le message extrait MEk et le message attendu relativement à l'image ICk.

A une étape conditionnelle E1212, l'erreur de mise en correspondance PEk (k=1 à K) est ensuite comparée à un seuil FA qui peut dans le cas du tatouage d'images être calculé en fonction d'un taux de fausse alarme donné pour le processus de décision E121.

Lorsque la valeur PEk (k=1 à K) est inférieure au seuil FA, le processus de décision E121 génère, à une étape E1213, une alarme AL à l'intention du client 2 concernée. L'alarme AL est par exemple envoyée immédiatement par courriel au client 2.

Lorsque la valeur PEk (k=1 à K) est supérieure au seuil FA, c'est un simple avertissement AV qui est généré par le processus de décision E121 à une étape E1214.

Une étape E1215 permet une mise à jour de la base de résultats 1203 en y enregistrant les résultats obtenus dans les étapes précédentes E1210 à E1212.

Une étape E1216 autorise une mise à jour de l'état de l'image publiée IPt dans la base d'images publiées 112. L'image publiée IPt prend alors un état inactive ou un état trouvée . L'état inactive est enregistré dans la base 112 si aucune correspondance n'a été mise en évidence par l'étape E1210 entre l'image publiée IPt et une image propriétaire IPk (k=1 à K). L'état trouvée est enregistré dans la base 112 lorsqu'une correspondance a été trouvée à l'étape E1210 entre l'image publiée IPt et une image propriétaire ICk (k=1 à K).

En référence à la Fig.6, il est maintenant décrit un mode de réalisation préféré E221 du processus de décision dans lequel des techniques de recalage géométrique et/ou d'extraction de tatouage numérique sont utilisées.

Le processus de décision E221 est adapté au cas où les étapes E103 à E106, relatives au tatouage des images propriétaire IC, sont effectivement intégrées dans le processus d'enregistrement d'images propriétaire 10 décrit en référence à la Fig.2. En effet, dans un tel cas, il doit être déterminé si l'image publiée IPt comporte un des tatouages insérés dans les images propriétaire sélectionnées ICk (k=1 à K).

Comme montré à la Fig.6, étape E2210, des données d'image DIMk, relatives à une image propriétaire sélectionnée ICk (k=1 à K), sont récupérées par le processus de décision E221 dans la base d'images enregistrées 100.

De préférence, les données d'image DlMk ne restituent pas toute l'information contenue dans l'image propriétaire ICk originale, c'est-àdire, dans l'image fournie par le client 2 et tatouée par le processus d'enregistrement d'images 10. Les données d'image DIMk sont par exemple constituées par une version basse résolution de l'image propriétaire ICk originale, à savoir, une imagette, ou par un ensemble de points d'intérêt de l'image sous la forme d'un ensemble de coordonnées de points, ou plus simplement encore, par les dimensions de l'image propriétaire originale.

Dans ce mode de réalisation préféré, les données d'image DlMk comprennent, par exemple, une imagette correspondant à l'image propriétaire ICk originale ainsi que les dimensions de l'image propriétaire ICk originale.

Les données d'image DIMk sont transmises à une étape E2211 qui reçoit également l'image publiée IPt en provenance de la base d'images publiées 112. L'étape E2211 effectue un recalage géométrique de l'image publiée IPt à l'aide des données d'image DlMk et délivre une image publiée IPt' recalée. Ainsi, par exemple, si l'image publiée IPt a subi un changement d'échelle, l'image publiée IPt peut être redimensionnée à sa taille originale à partir des données d'image DIMk. Si, de plus, l'image IPt a été recadrée, alors le recalage géométrique consiste à re-synchroniser l'image publiée IPt avec l'image propriétaire ICk.

On notera cependant que le recalage effectué à l'étape E2211 n'est pas toujours nécessaire et dépend de l'algorithme de tatouage utilisé. Comme montré à la Fig.6, une étape E2212 est prévue afin de récupérer l'information ALGO, relative au type de l'algorithme, dans la base d'images propriétaire 100. L'information ALGO est fournie à l'étape E2211, de sorte que celle-ci peut décider s'il convient ou pas de réaliser un recalage géométrique.

Outre l'étape E2212, des étapes E2213 et E2214 sont également prévues afin de récupérer d'autres meta-données MDk dans la base d'images propriétaire 100. Les étapes E2213 et E2214 autorisent une lecture de la clé secrète CS utilisée dans l'algorithme de tatouage et du message MEk inséré dans l'image propriétaire ICk.

La clé secrète CS et l'information ALGO sont fournies à une étape E2215 qui reçoit également l'image publiée IPt'. L'étape E2215 assure l'extraction d'un message MEt contenu dans l'image publiée IPt' à l'aide des informations CS et ALGO.

A une étape E2216, les messages MEk et MEt sont comparés et une distance binaire dk est calculée entre ceux-ci.

Une étape E2217 compare la distance binaire dk à une distance minimale dkmin. La distance dkmin est égale à la plus petite des distances binaires dk calculées sur les images propriétaire ICk déjà traitées parmi l'ensemble des K images propriétaire ICI à ICK. La distance dkmin est donc la distance binaire calculée pour une image propriétaire ICkmin qui à ce stade du processus de décision E221 est la plus proche de l'image publiée IPt.

Dans le cas où dk > dkmin, l'image propriétaire ICk en cours de traitement est plus éloignée de l'image publiée IPt que l'image propriétaire ICkmin. Le processus de décision E221 a alors achevé le traitement de cette image propriétaire ICk et l'image suivante ICk+1 est ensuite traitée par une nouvelle exécution des étapes E2210 à E2217.

Dans le cas où dk < dkmin, le processus de décision passe à une étape suivante E2218 dans laquelle la valeur de dk est affectée à dkmin (dkmin = dk) et l'image propriétaire ICkmin la plus proche de l'image publiée IPt est alors déterminée comme étant l'image propriétaire ICk courante (ICkmin = ICk).

Une fois achevé le traitement des K images propriétaire ICI à ICK par les étapes E2210 à E2218, l'image propriétaire ICkmin identifiée à l'étape E2218 est l'image la plus proche de l'image publiée IPt parmi les K images propriétaire ICI à ICK. La distance dkmin associée à l'image propriétaire ICkmin est comparée, à une étape E2219, à une distance de seuil ds.

A l'étape E2219, si la distance dkmin est supérieure à la distance de seuil ds, le processus de décision E221 se termine sans qu'aucune des images propriétaire ICk (k=1 à K) n'ait été considérée comme suffisamment proche de IPt pour donner lieu à une alarme AL. Dans le cas inverse, si la distance dkmin est inférieure à la distance de seuil ds, il est réalisé une étape E2220 dans laquelle une alarme AL est générée et envoyée au client 2 concerné. L'image IPt est dans ce dernier cas considérée comme étant une image tatouée incorporant le message MEkmin de l'image propriétaire ICkmin.

Comme montré à la Fig.6, une étape E2221 peut être prévue afin de récupérer dans les meta-données MDk enregistrées dans la base d'images propriétaire 100 une adresse de courriel du client 2 à qui l'alarme AL doit être envoyée. De préférence, l'alarme AL indique au client 2 l'adresse du site web 3 où a été trouvée l'image du client 2.

Selon une variante, le processus de décision E221 ne procède à aucune extraction de tatouage. Comme indiqué précédemment, c'est le cas en particulier lorsque l'image propriétaire IC enregistrée n'a pas été tatouée, c'est-à-dire, lorsque les étapes facultatives E103 à E106 de la Fig.2 ne sont pas réalisées. Dans cette variante, la décision repose sur un recadrage géométrique, qui est ici effectué dans tous les cas, et sur une mesure de la qualité de la mise en correspondance effectuée.

L'utilisation de points d'intérêt dans l'image permet notamment d'effectuer une mise en correspondance robuste ( feature-based registration en anglais) telle que décrite par exemple dans l'article intitulé MLESAC: A new robust estimator with application to estimating image geometry de P. Torr et A. Zisserman, CVIU, vol.78, pages 138 à 156, année 2000. Pour chaque image propriétaire ICk (k=1 à K), il est alors déterminé une mesure d'erreur de correspondance. De manière analogue au fonctionnement décrit en référence aux étapes E2217 à E2220, lorsqu'une valeur minimum des erreurs de correspondance pour les K images propriétaire ICI à ICK les plus proches est inférieure à un seuil prédéterminé, alors l'image publiée IPt est considérée comme étant l'image propriétaire ICk correspondante de la base d'images propriétaire 100 et une alarme AL est générée.

Comme montré à la Fig.7, un dispositif de vérification d'entités multimédia adapté à une mise en oeuvre du procédé selon l'invention est de préférence construit autour d'un micro-ordinateur 70 auquel sont associés différents périphériques.

De manière classique, le micro-ordinateur 70 comporte une unité centrale (CPU) 700, une mémoire non volatile telle qu'une ROM 701, une mémoire vive RAM 702, des moyens d'interface homme-machine tels qu'un écran 703 et un clavier 704, des moyens de stockage d'information tels qu'un disque dur 705 et un lecteur 706, et différentes interfaces de périphérique 707. Le terme interface doit ici être interprété de manière étendue et est utilisé pour désigner différentes cartes et circuits d'adaptation tels qu'une carte graphique, une carte audio, une interface de communication et autres. Un bus de communication interne (non représenté) est compris également dans le micro-ordinateur 70 et constitue un moyen de communication, non exclusif, qui permet à l'unité centrale 700 de communiquer avec les différents éléments fonctionnels du dispositif selon l'invention.

Le micro-ordinateur 70 est de préférence relié à une caméra numérique 708, à travers une carte graphique (non représenté) faisant partie des interfaces 707. Selon une variante, il peut également être prévu un scanner (non représenté) ou tout autre moyen d'acquisition ou de stockage d'image fournissant des informations à traiter selon le procédé de l'invention.

Le dispositif selon l'invention est connecté à un réseau de communication 709, tel que le réseau Internet, qui est apte à transmettre des données numériques à traiter ou inversement à transmettre des données traitées par le dispositif.

Le lecteur 706 est prévu pour recevoir un disque 710. Le disque 710 peut par exemple être une disquette, un CD-ROM, ou un DVD-ROM. Le disque 710 peut contenir des données traitées selon l'invention, de même que le disque dur 705, ainsi qu'un programme mettant en oeuvre le procédé de vérification d'entités multimédia selon l'invention qui, une fois lu par le micro-ordinateur 70, est stocké dans le disque dur 705.

De manière plus générale, les moyens de stockage d'information peuvent comprendre un moyen lisible par un ordinateur ou par un microprocesseur, intégré ou non au dispositif selon l'invention, éventuellement amovible, qui mémorise le programme mettant en oeuvre le procédé selon l'invention.

Selon une variante, le programme de mise en oeuvre du procédé selon l'invention peut être stocké dans la mémoire morte 701.

Selon encore une autre variante, le programme peut être reçu par l'intermédiaire du réseau de communication 709 pour être stocké de manière analogue à celle décrite précédemment.

Comme montré également à la Fig.7, le dispositif selon l'invention peut également être équipé d'un microphone 711 lorsque les entités multimédia à traiter comprennent des signaux audio.

Claims

REVENDICATIONS

1. Procédé de vérification d'entités multimédia pour déterminer si une première entité multimédia correspond sensiblement à une seconde entité multimédia, caractérisé en ce qu'il comporte les étapes de: - sélection dans une pluralité de secondes entités multimédia, par une recherche basée sur le contenu, d'un ensemble de secondes entités multimédia proches de ladite première entité multimédia, et - décision sur une correspondance entre ladite première entité multimédia et au moins une dite seconde entité multimédia dudit ensemble de secondes entités multimédia, à partir d'une comparaison entre ladite première entité multimédia et lesdites secondes entités multimédia dudit ensemble.

2. Procédé selon la revendication 1, caractérisé en ce que dans ladite étape de sélection, ledit ensemble sélectionné de secondes entités multimédia comprend les K secondes entités multimédia les plus proches de ladite première entité multimédia, K ayant une valeur constante prédéterminée.

3. Procédé selon la revendication 1 ou 2, caractérisé en ce que l'étape de sélection comporte des sous-étapes de: - calcul d'au moins un premier descripteur pour ladite première entité multimédia, et - obtention d'au moins un second descripteur pour chaque dite seconde entité multimédia; et en ce que ladite recherche basée sur le contenu utilise lesdits premier et seconds descripteurs décrivant lesdites première et secondes entités multimédia pour sélectionner ledit ensemble de secondes entités multimédia.

4. Procédé selon la revendication 3, caractérisé en ce que lesdits descripteurs comportent au moins un descripteur de type global.

5. Procédé selon la revendication 3 ou 4, caractérisé en ce que lesdits descripteurs comportent au moins un descripteur de type local.

6. Procédé selon l'une quelconque des revendications 1 à 5, caractérisé en ce que ladite étape de décision comporte des sous-étapes de: - recalage de ladite première entité multimédia relativement à une dite seconde entité multimédia en cours de traitement dudit ensemble de secondes entités multimédia, - mesure d'un niveau de correspondance, après recalage, entre ladite première entité multimédia et ladite seconde entité multimédia en cours de traitement dudit ensemble de secondes entités multimédia, et comparaison entre ledit niveau de correspondance et un premier seuil prédéterminé afin de décider de la correspondance entre ladite première entité multimédia et ladite seconde entité multimédia en cours de traitement dudit ensemble de secondes entités multimédia.

7. Procédé selon la revendication 6, caractérisé en ce que ladite sousétape de recalage comporte un changement d'échelle de ladite première entité multimédia et/ou un recadrage de ladite première entité multimédia et/ou une utilisation de points d'intérêt dans lesdites entités multimédia.

8. Procédé selon l'une quelconque des revendications 1 à 7, caractérisé en ce que ladite étape de décision comporte des sous-étapes de: - extraction d'un premier message de tatouage inséré dans ladite première entité multimédia, - calcul d'une distance binaire entre ledit premier message de tatouage et un second message de tatouage d'une seconde entité multimédia en cours de traitement dudit ensemble de secondes entités multimédia, et comparaison entre ladite distance binaire et un second seuil prédéterminé afin de décider de la correspondance entre ladite première entité multimédia et ladite seconde entité multimédia en cours de traitement dudit ensemble de secondes entités multimédia.

9. Procédé selon la revendication 8, caractérisé en ce que ladite étape de décision comporte également une sous-étape de recalage de ladite première entité multimédia relativement à ladite seconde entité multimédia en cours de traitement dudit ensemble de secondes entités multimédia, ladite sous-étape de recalage étant effectuée avant ladite sous-étape d'extraction afin permettre une extraction dudit premier message de tatouage à partir de ladite première entité multimédia recalé.

10. Procédé selon l'une quelconque des revendications 1 à 9, caractérisé en ce que lesdites entités multimédia sont des images numériques qui peuvent être représentées, au niveau de l'opérateur gérant le dispositif de vérification, et selon le traitement effectué, par des meta-données et/ou un résumé de basse résolution et/ou un ensemble de points d'intérêt et/ou des dimensions desdites images.

11. Dispositif de vérification d'entités multimédia pour déterminer si une première entité multimédia correspond à une seconde entité multimédia, caractérisé en ce qu'il comporte: - des moyens de sélection dans une pluralité de secondes entités multimédia, par une recherche basée sur le contenu, d'un ensemble de secondes entités multimédia proches de ladite première entité multimédia, et - des moyens de décision sur une correspondance entre ladite première entité multimédia et au moins une dite seconde entité multimédia dudit ensemble de secondes entités multimédia, à partir d'une comparaison entre ladite première entité multimédia et lesdites secondes entités multimédia dudit ensemble.

12. Dispositif selon la revendication 11, caractérisé en ce que lesdits moyens de sélection comportent: - des moyens de calcul d'au moins un premier descripteur pour ladite première entité multimédia, et - des moyens de calcul d'au moins un second descripteur pour chaque dite seconde entité multimédia; et en ce que ladite recherche basée sur le contenu utilise lesdits premier et seconds descripteurs décrivant lesdites première et secondes entités multimédia pour sélectionner ledit ensemble de secondes entités multimédia.

13. Dispositif selon la revendication 12, caractérisé en ce que lesdits moyens de sélection et moyens de calcul sont adaptés au traitement de descripteurs comportant au moins un descripteur de type global.

14. Dispositif selon la revendication 12 ou 13, caractérisé en ce que lesdits moyens de sélection et moyens de calcul sont adaptés au traitement de descripteurs comportant au moins un descripteur de type local.

15. Dispositif selon l'une quelconque des revendications 11 à 14, caractérisé en ce que lesdits moyens de décision comportent: - des moyens de recalage de ladite première entité multimédia relativement à une dite seconde entité multimédia en cours de traitement dudit ensemble de secondes entités multimédia, - des moyens de mesure d'un niveau de correspondance, après recalage, entre ladite première entité multimédia et ladite seconde entité multimédia en cours de traitement dudit ensemble de secondes entités multimédia, et des moyens de comparaison entre ledit niveau de correspondance et un premier seuil prédéterminé afin de décider de la correspondance entre ladite première entité multimédia et ladite seconde entité multimédia en cours de traitement dudit ensemble de secondes entités multimédia.

16. Dispositif selon la revendication 15, caractérisé en ce que lesdits moyens de recalage sont adaptés à effectuer un recalage par changement d'échelle de ladite première entité multimédia et/ou par recadrage de ladite première entité multimédia et/ou par une utilisation de points d'intérêt dans lesdites entités multimédia.

17. Dispositif selon l'une quelconque des revendications 11 à 16, caractérisé en ce que lesdits moyens de décision comportent: - des moyens d'extraction d'un premier message de tatouage inséré dans ladite première entité multimédia, - des moyens de calcul d'une distance binaire entre ledit premier message de tatouage et un second message de tatouage d'une seconde entité multimédia en cours de traitement dudit ensemble de secondes entités multimédia, et - des moyens de comparaison entre ladite distance binaire et un second seuil prédéterminé afin de décider de la correspondance entre ladite première entité multimédia et ladite seconde entité multimédia en cours de traitement dudit ensemble de secondes entités multimédia.

18. Dispositif selon la revendication 17, caractérisé en ce que lesdits moyens de décision comportent également des moyens de recalage de ladite première entité multimédia relativement à ladite seconde entité multimédia en cours de traitement dudit ensemble de secondes entités multimédia, ledit recalage étant effectué sur ladite première entité multimédia préalablement à une extraction dudit premier message de tatouage inséré dans celle-ci.

19. Dispositif selon l'une quelconque des revendications 11 à 18, caractérisé en ce qu'il comporte des moyens adaptés à vérifier des entités multimédia constituées par des images numériques qui peuvent être représentées, au niveau de l'opérateur gérant le dispositif de vérification, et selon le traitement effectué, par des meta-données et/ou un résumé de basse résolution et/ou un ensemble de points d'intérêt et/ou des dimensions desdites images.

20. Dispositif selon l'une quelconque des revendications 11 à 19, caractérisé en ce que lesdits moyens de sélection, et de décision sont intégrés dans un système de traitement d'information comprenant: - une unité centrale, - une mémoire morte, - une mémoire vive, et - une unité de stockage d'information.

21. Dispositif selon la revendication 20, caractérisé en ce qu'il 10 comporte également une caméra numérique connecté audit système de traitement d'information.

22. Dispositif selon la revendication 20 ou 21, caractérisé en ce qu'il comporte également un microphone connecté audit système de traitement d'information.

23. Dispositif selon l'une quelconque des revendications 11 à 22, caractérisé en ce qu'il comporte également: - une interface de communication pour autoriser une connexion au réseau Internet, et - un robot logiciel pour charger dans ledit dispositif des images publiées sur des sites web.

24. Dispositif selon l'une quelconque des revendications 11 à 23, 25 caractérisé en ce qu'il comporte des moyens adaptés à mettre en oeuvre le procédé selon l'une quelconque des revendications 1 à 10.

25. Appareil de traitement d'une image numérique, caractérisé en ce qu'il comporte des moyens adaptés à mettre en oeuvre le procédé selon l'une quelconque des revendications 1 à 10.

26. Appareil de traitement d'une image numérique, caractérisé en ce qu'il comporte le dispositif selon l'une quelconque des revendications 11 à 24.

27. Moyen de stockage d'information, caractérisé en ce qu'il 10 mémorise un programme mettant en oeuvre le procédé selon l'une quelconque des revendications 1 à 10.

28. Moyen de stockage d'information selon la revendication 27, caractérisé en ce qu'il est lisible par un dispositif selon l'une quelconque des

revendications 11 à 24.

29. Moyen de stockage d'information selon la revendication 27 ou 28, caractérisé en ce qu'il est une disquette ou un CD-ROM.

30. Programme d'ordinateur sur un moyen de stockage, comportant une ou plusieurs séquences d'instructions exécutables par ordinateur mettant en oeuvre le procédé selon l'une quelconque des revendications 1 à 10.