FR2842689A1 - Insertion d'un message dans une sequence d'images numeriques - Google Patents

Insertion d'un message dans une sequence d'images numeriques Download PDF

Info

Publication number
FR2842689A1
FR2842689A1 FR0209276A FR0209276A FR2842689A1 FR 2842689 A1 FR2842689 A1 FR 2842689A1 FR 0209276 A FR0209276 A FR 0209276A FR 0209276 A FR0209276 A FR 0209276A FR 2842689 A1 FR2842689 A1 FR 2842689A1
Authority
FR
France
Prior art keywords
sequence
image
symbol
message
intersection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR0209276A
Other languages
English (en)
Other versions
FR2842689B1 (fr
Inventor
Floch Herve Le
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to FR0209276A priority Critical patent/FR2842689B1/fr
Publication of FR2842689A1 publication Critical patent/FR2842689A1/fr
Application granted granted Critical
Publication of FR2842689B1 publication Critical patent/FR2842689B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/0085Time domain based watermarking, e.g. watermarks spread over several images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/005Robust watermarking, e.g. average attack or collusion attack resistant
    • G06T1/0064Geometric transfor invariant watermarking, e.g. affine transform invariant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0052Embedding of the watermark in the frequency domain

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

L'invention concerne un procédé d'insertion d'un message dans une séquence d'images numériques, caractérisé en ce qu'il comporte, pour chaque image (In) dans laquelle un symbole du message est à insérer, les étapes de :- détermination (E2) d'un premier objet vidéo dans l'image dans laquelle un symbole du message est à insérer,- détermination (E2) d'un second objet vidéo correspondant au premier objet vidéo, dans une seconde image de la séquence,- détermination (E3) d'une intersection entre les premier et second objets vidéo, dans l'image dans laquelle un symbole du message est à insérer,- insertion (E7) du symbole dans l'intersection.

Description

La présente invention concerne un procédé d'insertion d'une information
supplémentaire telle qu'une marque secrète dans un signal numérique. Elle concerne également un procédé d'extraction d'une marque
secrète insérée dans un signal numérique.
Corrélativement, la présente invention concerne un dispositif d'insertion d'une information supplémentaire et un dispositif d'extraction de l'information supplémentaire, adaptés respectivement à mettre en oeuvre les
procédés d'insertion et d'extraction conformes à l'invention.
Le signal numérique considéré dans la suite sera plus
particulièrement une séquence d'images numériques.
Les procédés d'insertion et extraction conformes à l'invention s'inscrivent dans le domaine technique du marquage (watermarking en anglais) des données numériques qui peut s'interpréter comme l'insertion d'un sceau dans les données numériques, permettant par exemple d'authentifier le contenu d'un fichier de données numériques. Ce marquage est également
appelé tatouage numérique.
Le marquage comporte de manière générale la modification de coefficients représentatifs de l'image numérique. Cette modification est
imperceptible à l'oeil, mais peut être décodée par un décodeur approprié.
L'invention concerne plus particulièrement l'insertion de données supplémentaires dans des objets vidéo. Un objet vidéo est une entité de l'image correspondant à une unité sémantique, par exemple le visage d'une personne. Un objet peut être constitué d'une ou plusieurs régions contenues
dans l'image.
Le document intitulé " A new video-object watermarking scheme robust to object manipulation " de P. Bas et B. Macq, ICIP-2001, pages 526 à 528, décrit un algorithme pour insérer et extraire un message dans des objets
vidéo d'une séquence d'images numériques.
Le message à insérer est une séquence pseudo-aléatoire canonique générée dans un repère canonique. Cette séquence est ensuite déformée par
changement d'échelle et rotation en fonction de la forme de l'objet.
La forme de l'objet est caractérisée au moyen d'une analyse en composante principale de la forme de l'objet. Deux paramètres de changement
d'échelle et de rotation sont ainsi extraits, pour déformer la séquence pseudoaléatoire.
Après cette déformation et une pondération psychovisuelle, la
séquence pseudo-aléatoire est additionnée à la texture de l'objet vidéo.
Pour l'extraction ultérieure, la même analyse en composante principale est effectuée pour calculer deux paramètres de changement d'échelle et de rotation. Une séquence pseudo-aléatoire canonique est
déformée selon ces deux paramètres.
2 0 Une mesure de corrélation entre la séquence canonique déformée et l'objet vidéo est effectuée. Si le résultat est supérieur à un seuil, alors la séquence pseudo-aléatoire canonique est identifiée comme étant la séquence
qui avait été insérée dans l'objet vidéo.
Cette méthode ne permet de retrouver le message inséré que si les 2 5 manipulations effectuées sur l'objet vidéo se limitent aux changements d'échelle et aux rotations. En outre, si la forme de l'objet vidéo est inconnue ou si une partie de l'objet vidéo a disparu, les paramètres de changement d'échelle et de rotation ne peuvent plus être calculés et l'extraction du message
devient impossible.
3 0 Le document intitulé " A DWT-based object watermarking system for MPEG-4 video stream " de A. Piva, R. Caldelli et A. de Rosa, ICIP-2000, pages à 8, décrit un algorithme pour insérer des informations supplémentaires dans
des objets vidéo.
Le message est inséré dans le domaine ondelettes, de sorte qu'il ne
peut plus être retrouvé si l'objet vidéo a subi une manipulation géométrique.
De plus, pour retrouver le message, il est nécessaire de connaître la
forme exacte de l'objet vidéo dans lequel il avait été inséré.
Le document US 6 282 299 décrit un algorithme pour insérer des informations supplémentaires dans des objets vidéo. L'insertion est réalisée dans le domaine DCT (d'après l'anglais Discrete Cosine Transform) . Ce domaine est sensible aux modifications géométriques, si bien que la méthode
proposée n'est pas robuste aux distorsions géométriques.
Le document intitulé " Video-object-based watermarking: A rotation and flipping résilient scheme " de C.S. Lu et H. M. Liao, ICIP-2001, pages 483 à 486, décrit un algorithme pour insérer des informations supplémentaires dans
des objets vidéo.
L'objet est tout d'abord modifié par rotation pour que les vecteurs propres directionnels calculés à partir de la forme initiale de l'objet vidéo
correspondent aux axes horizontaux et verticaux.
Une fenêtre rectangulaire englobant ce nouvel objet est alors calculée et une décomposition par DCT de la texture de l'objet vidéo est
effectuée. Le message est alors inséré dans les coefficients DCT.
Pour l'extraction du message, les mêmes opérations sont effectuées: calcul des vecteurs propres directionnels, rotation de l'objet vidéo,
calcul de la fenêtre, transformation DCT puis extraction du message.
Cette méthode n'est robuste qu'à deux types de distorsions
géométriques: rotation et retournement.
La présente invention vise à remédier aux inconvénients de la technique antérieure, en fournissant un procédé et un dispositif d'insertion d'un message qui soient robuste à un grand nombre de distorsions géométriques, tout en ne nécessitant lors de l'extraction qu'une connaissance partielle de la
forme des objets vidéo dans lesquels le message a été inséré.
A cette fin, l'invention propose un procédé d'insertion d'un message dans une séquence d'images numériques, caractérisé en ce qu'il comporte, pour chaque image dans laquelle un symbole du message est à insérer, les étapes de: - détermination d'un premier objet vidéo dans l'image dans laquelle un symbole du message est à insérer, - détermination d'un second objet vidéo correspondant au premier objet vidéo, dans une seconde image de la séquence, - détermination d'une intersection entre les premier et second objets vidéo, dans l'image dans laquelle un symbole du message est à insérer,
- insertion du symbole dans l'intersection.
L'invention permet une insertion robuste aux distorsions géométriques tout en ne nécessitant pas une connaissance parfaite et
complète de l'objet vidéo lors de l'extraction.
1 5 Selon une caractéristique préférée, l'insertion du symbole dans l'intersection comporte les étapes de: - détermination d'une séquence de modulation à partir du second objet vidéo, - modulation du symbole à insérer par la séquence de modulation 2 o déterminée,
- insertion du symbole modulé dans l'intersection.
Selon une caractéristique préférée, la séquence de modulation est
générée à partir de la texture du second objet vidéo.
Selon une caractéristique préférée, la détermination d'une séquence de modulation comporte: - la division entière de la valeur d'une composante prédéterminée de chaque pixel de l'image de référence, par une première valeur prédéterminée, - la comparaison du reste de la division entière avec une seconde valeur prédéterminée, pour chaque division entière, - la détermination de la valeur de chaque coefficient de la séquence
de modulation, en fonction du résultat respectif de chaque comparaison.
Selon une caractéristique préférée, la composante prédéterminée
est la luminance. Cette caractéristique est simple à mettre en oeuvre.
Selon une caractéristique préférée, la seconde image est l'image suivant l'image courante dans la séquence. Là aussi, cette caractéristique est simple à mettre en oeuvre et donne de bons résultats. Selon une caractéristique préférée, l'insertion est effectuée dans une
image sur deux.
L'invention concerne aussi un procédé d'extraction d'un message à partir d'une séquence d'images dans laquelle le message a été inséré par le procédé d'insertion précédemment présenté, caractérisé en ce qu'il comporte les étapes de: - sélection d'une région d'intérêt dans une image de la séquence, - suivi temporel de la région d'intérêt sur au moins une partie de la séquence, - extraction des symboles du message sur la région d'intérêt en
fonction du résultat du suivi temporel.
Selon une caractéristique préférée, l'extraction d'un symbole comporte: détermination d'un troisième objet vidéo dans l'image dans laquelle un symbole du message a été inséré, - détermination d'un quatrième objet vidéo correspondant au troisième objet vidéo, dans une autre image de la séquence, - détermination d'une intersection entre les troisième et quatrième objets vidéo, dans l'image dans laquelle un symbole du message a été inséré,
- extraction du symbole depuis l'intersection.
Selon une caractéristique préférée, l'extraction d'un symbole comporte: détermination d'une séquence de démodulation à partir du quatrième objet, 3 0 - estimation du signal de marquage du symbole inséré, - démodulation du signal de marquage estimé par la séquence de démodulation. Selon une caractéristique préférée, l'estimation du signal de marquage du symbole inséré comporte les étapes de: - prédiction temporelle de l'intersection courante à partir de deux autres images de la séquence, et - soustraction de l'intersection prédite de l'intersection courante. Selon une caractéristique préférée, la prédiction de l'intersection courante est effectuée par un calcul de moyenne des deux images encadrant
l'image dans laquelle un symbole a été inséré.
Selon une caractéristique préférée, les troisième et quatrième objets vidéo correspondent au moins partiellement aux premier et second objets vidéo, respectivement. Il n'est pas nécessaire que la correspondance soit parfaite entre les objets vidéo utilisés lors de l'insertion et ceux utilisés lors de l'extraction. Corrélativement, l'invention concerne un dispositif d'insertion d'un message dans une séquence d'images numériques, caractérisé en ce qu'il comporte: - des moyens de détermination d'un premier objet vidéo dans chaque image dans laquelle un symbole du message est à insérer, - des moyens de détermination d'un second objet vidéo 2 0 correspondant au premier objet vidéo, dans une seconde image de la séquence, - des moyens de détermination d'une intersection entre les premier et second objets vidéo, dans l'image dans laquelle un symbole du message est à insérer,
- des moyens d'insertion du symbole dans l'intersection.
Le dispositif d'insertion comporte des moyens de mises en oeuvre
des caractéristiques précédentes.
Corrélativement, l'invention concerne un dispositif d'extraction d'un message à partir d'une séquence d'images dans laquelle le message a été inséré par le dispositif d'insertion précédemment présenté, caractérisé en ce qu'il comporte: - des moyens de sélection d'une région d'intérêt dans une image de la séquence, - des moyens de suivi temporel de la région d'intérêt sur au moins une partie de la séquence, - des moyens d'extraction des symboles du message sur la région
d'intérêt en fonction du résultat du suivi temporel.
Le dispositif d'extraction comporte des moyens de mises en oeuvre
des caractéristiques précédentes.
Le dispositif d'insertion, le procédé et le dispositif d'extraction
présentent des avantages analogues à ceux précédemment présentés.
L'invention concerne aussi un appareil numérique incluant le dispositif selon l'invention ou des moyens de mise en oeuvre du procédé selon l'invention. Cet appareil numérique est par exemple un appareil photographique numérique, un caméscope numérique, un scanner, une imprimante, un photocopieur, un télécopieur. Les avantages du dispositif et de l'appareil
numérique sont identiques à ceux précédemment exposés.
Un moyen de stockage d'information, lisible par un ordinateur ou par un microprocesseur, intégré ou non au dispositif, éventuellement amovible,
mémorise un programme mettant en oeuvre le procédé selon l'invention.
Un programme d'ordinateur lisible par un microprocesseur et comportant une ou plusieurs séquence d'instructions est apte à mettre en
oeuvre les procédés selon l'invention.
Les caractéristiques et avantages de la présente invention apparaîtront plus clairement à la lecture d'un mode préféré de réalisation illustré par les dessins ci-joints, dans lesquels: - la figure 1 est un mode de réalisation d'un dispositif mettant en oeuvre l'invention, - la figure 2 représente un dispositif selon l'invention, - la figure 3 est un mode de réalisation de procédé d'insertion de message dans une séquence d'images, selon l'invention, - la figure 4 représente schématiquement deux images d'une séquence d'images, - la figure 5 représente schématiquement une séquence d'images dans laquelle un message est inséré, selon l'invention, - la figure 6 représente un calcul de séquence de modulation inclus dans le procédé de la figure 3, - la figure 7 représente un mode de réalisation de procédé d'extraction de message d'une séquence d'images, selon l'invention, - la figure 8 représente un mode de réalisation de procédé d'extraction d'un symbole de message depuis une image d'une séquence
d'images, selon l'invention.
Selon le mode de réalisation choisi et représenté à la figure 1, un dispositif mettant en oeuvre l'invention est par exemple un microordinateur 10 connecté à différents périphériques, par exemple une caméra numérique 107 (ou un scanner ou tout moyen d'acquisition ou de stockage d'image) reliée à
une carte graphique et fournissant des informations à traiter selon l'invention.
Le dispositif 10 comporte une interface de communication 112 reliée à un réseau 113 apte à transmettre des données numériques à traiter ou inversement à transmettre des données traitées par le dispositif. Le dispositif comporte également un moyen de stockage 108 tel que par exemple un disque dur. Il comporte aussi un lecteur 109 de disque 110. Ce disque 110 peut être une disquette, un CD-ROM ou un DVD-ROM, par exemple. Le disque 110 comme le disque 108 peuvent contenir des données traitées selon l'invention ainsi que le ou les programmes mettant en oeuvre l'invention qui, une fois lu par le dispositif 10, sera stocké dans le disque dur 108. Selon une variante, le programme permettant au dispositif de mettre en oeuvre l'invention, pourra être stocké en mémoire morte 102 (appelée ROM sur le dessin). En seconde variante, le programme pourra être reçu pour être stocké de façon identique à celle décrite précédemment par l'intermédiaire du réseau de communication 113. Le dispositif 10 est relié à un microphone 111. Les données à traiter
selon l'invention seront dans ce cas du signal audio.
Ce même dispositif possède un écran 104 permettant de visualiser les données à traiter ou de servir d'interface avec l'utilisateur qui peut ainsi paramétrer certains modes de traitement, à l'aide du clavier 114 ou de tout
autre moyen (souris par exemple).
L'unité centrale 100 (appelée CPU sur le dessin) exécute les instructions relatives à la mise en oeuvre de l'invention, instructions stockées dans la mémoire morte 102 ou dans les autres éléments de stockage. Lors de la mise sous tension, les programmes de traitement stockés dans une mémoire non volatile, par exemple la ROM 102, sont transférés dans la mémoire vive RAM 103 qui contiendra alors le code exécutable de l'invention ainsi que des registres pour mémoriser les variables nécessaires à la mise en oeuvre de l'invention. De manière plus générale, un moyen de stockage d'information, lisible par un ordinateur ou par un microprocesseur, intégré ou non au dispositif, éventuellement amovible, mémorise un programme mettant en
oeuvre le procédé selon l'invention.
Le bus de communication 101 permet la communication entre les 2o différents éléments inclus dans le micro-ordinateur 10 ou reliés à lui. La représentation du bus 101 n'est pas limitative et notamment l'unité centrale 100
est susceptible de communiquer des instructions à tout élément du microordinateur 10 directement ou par l'intermédiaire d'un autre élément du microordinateur 10.
En référence à la figure 2, un mode de réalisation de dispositif selon l'invention est destiné à insérer un message dans une séquence d'images. Le dispositif d'insertion est intégré dans un appareil, qui est par exemple un appareil photographique numérique, un caméscope numérique, un scanner, une imprimante, un photocopieur, un télécopieur, un système de gestion de
base de données ou encore un ordinateur.
Le dispositif selon l'invention comporte: - des moyens de détermination d'un premier objet vidéo dans chaque image dans laquelle un symbole du message est à insérer, - des moyens de détermination d'un second objet vidéo correspondant au premier objet vidéo, dans une seconde image de la séquence, - des moyens de détermination d'une intersection entre les premier et second objets vidéo, dans l'image dans laquelle un symbole du message est à insérer,
- des moyens d'insertion du symbole dans l'intersection.
Une source d'image 1 fournit une séquence d'images numériques au
dispositif d'insertion 2, dont le fonctionnement sera détaillé dans la suite.
Le dispositif d'insertion fournit une séquence d'images dans laquelle un message a été inséré à des moyens de transmission et/ou de mémorisation
3. Ces moyens sont classiques et ne seront pas décrits ici.
Les moyens 3 sont reliés à un dispositif d'extraction 4 selon l'invention. Le dispositif d'extraction comporte: - des moyens de sélection d'une région d'intérêt dans une image de la séquence, - des moyens de suivi temporel de la région d'intérêt sur au moins une partie de la séquence, des moyens d'extraction des symboles du message sur la région
d'intérêt en fonction du résultat du suivi temporel.
Le fonctionnement du dispositif d'extraction sera détaillé dans la
suite.
La figure 3 représente un mode de réalisation de procédé d'insertion d'un message dans une séquence d'images, selon l'invention. Ce procédé est mis en oeuvre dans le dispositif d'insertion et comporte des étapes
3o El à E8.
Le procédé est réalisé sous la forme d'un algorithme qui peut être mémorisé en totalité ou en partie dans tout moyen de stockage d'information capable de coopérer avec le microprocesseur. Ce moyen de stockage est lisible par un ordinateur ou par un microprocesseur. Ce moyen de stockage est intégré ou non au dispositif, et peut être amovible. Par exemple, il peut comporter une bande magnétique, une disquette ou un CD-ROM (disque compact à mémoire figée). Le procédé est décrit relativement à deux images. Il est réitéré pour
toutes les images de la séquence.
L'étape El est la sélection de deux images In et l,+1 dans la séquence. L'une d'elles est l'image dans laquelle une insertion de symbole sera réalisée et l'autre sert pour générer une séquence de modulation utilisée pour
l'insertion. Lorsque l'image,n+1 n'existe pas, elle est remplacée par l'image In1.
Seul un objet vidéo sera pris en compte dans chacune de ces images. Les valeurs de luminance ou de couleur en dehors de ces objets vidéo
ne sont pas utilisées selon l'invention.
Dans ce mode de réalisation, l'insertion est effectuée sur un objet vidéo présent dans une image d'indice pair et un objet vidéo de l'image suivante, d'indice impair, sert à générer la séquence de modulation. Bien entendu, l'insertion des symboles du message peut être effectuée sur les
images d'indice impair, et les images d'indice pair sont alors inchangées.
L'insertion peut également être effectuée sur une image sur trois ou
sur quatre, au lieu de une image sur deux.
L'étape suivante E2 est la considération d'un objet vidéo VOn dans l'image In et d'un objet vidéo VOn,+1 dans l'image 1,,,. Cette étape est
schématisée à la figure 4. Ces objets vidéos ont été calculés préalablement.
Un objet vidéo est une entité de l'image correspondant à une unité sémantique, par exemple le visage d'une personne. Un objet peut être
constitué d'une ou plusieurs régions contenues dans l'image.
Une région de l'image est déterminée par une segmentation de l'image. La segmentation est un processus de bas niveau ayant pour but de réaliser une partition de l'image en un certain nombre de sous éléments appelés régions. La partition est telle que les régions sont disjointes et que leur réunion constitue l'image. Chaque région peut être représentée par une
information représentative de sa forme, sa couleur ou de sa texture.
L'homogénéité de la région dépend bien sur d'un critère particulier d'homogénéité: proximité des valeurs moyennes, conservation du contraste, de la couleur, par exemple. Les objets vidéos peuvent aussi être déterminés
manuellement ou de manière semi-automatique.
Les objets-vidéos VOn et VOn,1 correspondent à la même entité sémantique, considérée à deux instants différents. Du fait du mouvement possible dans la scène représentée par la séquence vidéo, les deux objets occupent des positions qui peuvent être différentes l'une de l'autre dans leur
image respective.
L'étape suivante E3 est la détermination, dans l'image I, de l'intersection entre les objets vidéo VOn et VOn+1. On considère ici la forme des objets VOn et VO,+1 et la forme de l'objet VOn+1 est projetée sur l'image In pour
déterminer l'intersection IN, (figure 4).
La forme des objets vidéo est ainsi utilisée pour déterminer la zone
de l'image sur laquelle l'insertion est réalisée.
Par ailleurs, l'image d'indice impair In+1, et plus particulièrement une zone de celle-ci liée à l'objet vidéo VOn+1, est utilisée à l'étape E4 pour générer une séquence de modulation wn+l dont les coefficients peuvent prendre deux
valeurs: -1 et +1. Cette étape est détaillée dans la suite.
Un bit bm du message binaire à insérer est sélectionné à l'étape E5.
La sélection d'un bit bm est par exemple effectuée en fonction de l'indice n de l'image courante In dans laquelle il est inséré. La figure 5 est un exemple de sélection de bit à insérer. La séquence vidéo comporte huit images la à 17 qui elle-même comporte chacune un objet vidéo correspondant à une même entité sémantique et le message comporte trois bits bo, b1 et b2. Un bit bm est inséré dans l'objet vidéo de l'image In à condition que l'entier m soit égal au reste de la division entière de n/2 par le nombre de bits du message à insérer. Si la valeur
3 o du bit à insérer est 0, elle est changée en -1.
Les étapes E4 et E5 sont suivies de l'étape E6 à laquelle le bit à insérer bm est modulé par la séquence de modulation générée à l'étape E4. Le résultat est une deuxième séquence de modulation: Wn+l = bm.wn+1. Un coefficient Wn+l(p,q) de cette séquence de modulation est déterminé par la
formule: W,+i(p,q) = bm.wn+i(p,q).
L'étape suivante E7 est l'insertion de la séquence de modulation Wn+1 dans l'intersection IN, déterminée dans l'image In, après avoir appliqué un coefficient de pondération psychovisuel utn à la séquence de modulation. Le résultat est une image l'n dont une zone INn a ses pixels déterminés par la formule: l'r(p,q) = 1,(p,q) + ocn(p,q). bm. wn+i(p,q). Les autres pixels de l'image
l'n sont inchangés par rapport à ceux de l'image In.
L'étape suivante E8 est la mémorisation de l'image l', dans laquelle
le bit a été inséré et de l'image d'indice impair Inl.
Lorsque toutes les images de la séquence ont été traitées, alors la nouvelle séquence VD' dans laquelle le message a été inséré est complètement formée. Cette séquence comporte des images d'indices impairs qui sont identiques aux images d'indices impairs de la séquence initiale VD et
des images d'indices pairs dans lesquelles des bits ont été insérés.
La figure 6 représente un mode de réalisation de l'étape E4 de calcul de la séquence de modulation wn+l à partir de l'image d'indice impair
courante In+1. Ce calcul comporte des étapes E40 à E46.
L'étape E40 est la détermination de la projection de l'intersection INn sur l'image In+1. Cette étape a pour résultat une zone INn+1 de l'image In+l
(figure 4).
L'étape suivante E41 est la sélection d'un pixel de la zone IN,+1. La zone est traitée pixel par pixel. Pour chaque pixel, on considère au moins une composante de celui-ci. Selon le mode de représentation des pixels, cette composante est relative à la luminance ou à la chrominance ou à une couleur rouge, verte ou bleue. Dans la suite, on considère la composante l'(p,q) de luminance du pixel courant. Ainsi, c'est la texture de l'intersection IN,+1 qui est
3 0 utilisée pour calculer la séquence de modulation.
L'étape suivante E42 est la division entière de la valeur de la composante 11(p,q) de luminance du pixel courant par une valeur Q, par
exemple égale à 16.
La valeur Q est déterminée expérimentalement en fonction d'un compromis entre invisibilité du message inséré et robustesse à la compression. En effet, si la valeur de Q est trop élevée, les séquences de modulation générées peuvent présenter des caractéristiques fréquentielles passe-bas
importantes. Leur insertion pourrait donc être visible.
Inversement, si la valeur de Q est trop petite, l'invisibilité de la séquence de modulation est meilleure, mais la robustesse à la compression est faible. Une modification légère de l'image servant à générer la séquence de démodulation empêchera de générer une séquence de démodulation proche
de la séquence de modulation.
Cette division a un reste R(p,q) qui est analysé à l'étape suivante E43. A cette étape, le reste R(p,q) est comparé à la valeur Q/2. Lorsque le reste R(p,q) est inférieur à Q/2, l'étape E43 est suivie de l'étape E44 à laquelle
un coefficient wn+i(p,q) de la séquence de modulation est mis à la valeur -1.
Lorsque le reste R(p,q) est supérieur à Q/2, l'étape E43 est suivie de l'étape E45 à laquelle un coefficient wn+1(p,q) de la séquence de modulation est
mis à la valeur +1.
Les étapes E44 et E45 sont suivies de l'étape E46 à laquelle le pixel suivant est considéré, tant que tous les pixels de la zone INn+1 n'ont pas été
traités. L'étape E46 est alors suivie de l'étape E41 précédemment décrite.
Lorsque tous les pixels ont été traités, la séquence de modulation a été complètement définie et l'étape E46 est suivie de l'étape E6 précédemment décrite. La figure 7 représente un mode de réalisation de procédé d'extraction de message préalablement inséré dans une séquence d'images VD', selon l'invention. Cette séquence d'images peut être soit directement la séquence d'images obtenue après insertion d'un message (résultat du procédé de la figure 3) ou bien une version modifiée de cette séquence. Ces modifications peuvent, par exemple, être un découpage, une rotation ou un changement d'échelle d'un ou de plusieurs objets vidéo. La séquence d'images VD' comporte des images l'o à l'N. De plus, plusieurs objetsvidéos dans lesquels un message a été inséré peuvent avoir été placés et manipulés géométriquement dans la séquence vidéo. Ce placement d'objet s'appelle une
composition, comme précisé dans la norme de compression vidéo MPEG-4.
Ce procédé est mis en oeuvre dans le dispositif d'extraction et
comporte des étapes E10 à E12.
Le procédé est réalisé sous la forme d'un algorithme qui peut être mémorisé en totalité ou en partie dans tout moyen de stockage d'information capable de coopérer avec le microprocesseur. Ce moyen de stockage est lisible par un ordinateur ou par un microprocesseur. Ce moyen de stockage est intégré ou non au dispositif, et peut être amovible. Par exemple, il peut comporter une bande magnétique, une disquette ou un CD-ROM (disque
compact à mémoire figée).
L'étape E10 est la sélection d'une région d'intérêt dans la première image de la séquence. La région d'intérêt est par exemple un bloc rectangulaire. La région d'intérêt englobe l'objet vidéo dans lequel les symboles du message ont été insérés au fil des images ou la région d'intérêt est une partie de cet objet vidéo. L'étape suivante El 1 est le suivi temporel de la région d'intérêt sur la séquence vidéo. Le suivi temporel est par exemple réalisé par une mise en correspondance de blocs (en anglais: block-matching). Cette étape a pour résultat un masque temporel, c'est-à-dire un objet vidéo VO'l dans chaque image l'i de la séquence, ces objets ayant une correspondance
sémantique entre eux du fait de leur construction.
Il est à noter qu'il n'est pas nécessaire de connaître exactement la forme de l'objet vidéo dans lequel les symboles ont été insérés. Une
connaissance partielle de l'objet est suffisante pour retrouver les symboles.
Ainsi, les objets VO'1 qui sont ici considérés ne sont pas forcement strictement
identiques aux objets VO, qui ont été utilisés lors de l'insertion.
L'étape suivante E12 est l'extraction du message sur le masque
temporel précédemment déterminé. Cette étape est détaillée dans la suite.
La figure 8 représente l'étape E12 d'extraction d'un symbole du message depuis une image de la séquence VD', sous la forme d'un algorithme
comportant des étapes E120 à E124.
L'algorithme est décrit en référence à trois images l'h-1, V' et l'j+j de la séquence VD'. Lorsque l'image l'V1 n'existe pas, elle est remplacée par l'image l'j+1. Inversement, lorsque l'image l'F+ n'existe pas, elle est remplacée par
l'image l'iô1. L'algorithme est répété pour toutes les images de la séquence.
Chacune de ces images comporte un objet vidéo d'intérêt qui a été
précédemment déterminé par le suivi temporel à l'étape El1.
La forme des objets permet de déterminer la zone sur laquelle sera extrait le symbole. La texture des objets permet de déterminer une séquence
de démodulation utilisée pour l'extraction.
L'étape E120 est la détermination de l'intersection entre l'objet vidéo VO'; de l'image l'ô et la projection de l'objet vidéo VO'i+1 de l'image l'i+j sur
l'image l'.
L'étape suivante E121 est une prédiction temporelle de l'intersection IN1 de l'image l'ô. Une intersection prédite IN; est calculée à partir des images l'ô, et l'i+i. Plus précisément, un pixel i(p,q) de l'intersection prédite IN; est calculé selon la formule suivante: 11(p,q) = (I'i1(p,q) + I'i.+(p,q))/2 L'étape suivante E122 est la soustraction de l'intersection prédite Ni de l'intersection courante INi. Le résultat est un signal de marquage estimé W. L'étape E123 est un calcul de séquence de démodulation W' sur
l'intersection INi à partir de la texture de l'objet vidéo VO'i+1 de l'image I'j+1.
Cette étape est analogue à l'étape E4 précédemment décrite.
Les étapes E122 et E123 sont suivies de l'étape E124 qui est la démodulation du signal de marquage estimé pour déduire le bit qui avait été
inséré dans l'objet vidéo VO'; de l'image l'.
La démodulation comporte une corrélation entre la séquence de démodulation calculée à l'étape E123 et le signal de marquage estimé à l'étape E122. La valeur de corrélation est soit considéré seule, soit additionnée aux valeurs de corrélation précédemment obtenues pour le même bit, sur d'autres images de la séquence. Le signe de la valeur de corrélation ou de la somme des valeurs de
corrélation fournit la valeur du bit inséré.
Lorsque tous les symboles du message ont été extraits, le message extrait est alors décodé. Par exemple, si l'on sait qu'il est composé de caractères ASCII, on regroupe les bits extraits par groupes de huit bits, et on
associe un caractère ASCII à chaque groupe.
Bien entendu, la présente invention n'est nullement limitée aux modes de réalisation décrits et représentés, mais englobe, bien au contraire,
toute variante à la portée de l'homme du métier.

Claims (30)

REVENDICATIONS
1. Procédé d'insertion d'un message dans une séquence d'images numériques, caractérisé en ce qu'il comporte, pour chaque image (In) dans laquelle un symbole du message est à insérer, les étapes de: - détermination (E2) d'un premier objet vidéo dans l'image dans laquelle un symbole du message est à insérer, - détermination (E2) d'un second objet vidéo correspondant au premier objet vidéo, dans une seconde image de la séquence, détermination (E3) d'une intersection entre les premier et second objets vidéo, dans l'image dans laquelle un symbole du message est à insérer,
- insertion (E7) du symbole dans l'intersection.
2. Procédé d'insertion selon la revendication 1, caractérisé en ce que l'insertion du symbole dans l'intersection comporte les étapes de: détermination (E4) d'une séquence de modulation à partir du second objet vidéo, - modulation (E6) du symbole à insérer par la séquence de modulation déterminée,
- insertion (E7) du symbole modulé dans l'intersection.
3. Procédé selon la revendication 2, caractérisé en ce que la séquence de modulation est générée (E4) à partir de la texture du second objet
vidéo (VOn+,).
4. Procédé selon la revendication 2 ou 3, caractérisé en ce que la détermination d'une séquence de modulation comporte: - la division entière (E42) de la valeur d'une composante prédéterminée de chaque pixel de l'image de référence, par une première valeur prédéterminée (Q), - la comparaison (E43) du reste de la division entière avec une seconde valeur prédéterminée, pour chaque division entière, - la détermination (E44, E45) de la valeur de chaque coefficient de la séquence de modulation, en fonction du résultat respectif de chaque comparaison.
5. Procédé selon la revendication 4, caractérisé en ce que la
composante prédéterminée est la luminance.
6. Procédé selon l'une quelconque des revendications 1 à 5,
caractérisé en ce que la seconde image (ln+1) est l'image suivant l'image
courante (In) dans la séquence.
7. Procédé selon l'une quelconque des revendications 1 à 6,
caractérisé en ce que l'insertion (E7) est effectuée dans une image sur deux.
8. Procédé d'extraction d'un message à partir d'une séquence d'images dans laquelle le message a été inséré par le procédé d'insertion selon
l'une quelconque des revendications 1 à 7, caractérisé en ce qu'il comporte les
étapes de: - sélection (E10) d'une région d'intérêt dans une image de la séquence, - suivi temporel (E1) de la région d'intérêt sur au moins une partie de la séquence, - extraction (E12) des symboles du message sur la région d'intérêt
en fonction du résultat du suivi temporel.
9. Procédé d'extraction selon la revendication 8, caractérisé en que l'extraction d'un symbole comporte: - détermination (E120) d'un troisième objet vidéo dans l'image dans laquelle un symbole du message a été inséré, - détermination (E120) d'un quatrième objet vidéo correspondant au troisième objet vidéo, dans une autre image de la séquence, détermination (E120) d'une intersection entre les troisième et quatrième objets vidéo, dans l'image dans laquelle un symbole du message a été inséré,
- extraction (E124) du symbole depuis l'intersection.
10. Procédé d'extraction selon la revendication 9, caractérisé en que l'extraction d'un symbole comporte: - détermination (E123) d'une séquence de démodulation à partir du quatrième objet, - estimation (E122) du signal de marquage du symbole inséré, - démodulation du signal de marquage estimé par la séquence de démodulation.
11. Procédé d'extraction selon la revendication 10, caractérisé en que l'estimation du signal de marquage du symbole inséré comporte les étapes de: - prédiction temporelle (E121) de l'intersection courante à partir de 2o deux autres images de la séquence, et - soustraction (E122) de l'intersection prédite de l'intersection courante.
12. Procédé d'extraction selon la revendication 11, caractérisé en que la prédiction (E121) de l'intersection courante est effectuée par un calcul de moyenne des deux images encadrant l'image dans laquelle un symbole a
été inséré.
13. Procédé d'extraction selon l'une quelconque des revendications
9 à 12, caractérisé en que les troisième et quatrième objets vidéo correspondent au moins partiellement aux premier et second objets vidéo, respectivement.
14. Dispositif d'insertion d'un message dans une séquence d'images numériques, caractérisé en ce qu'il comporte: - des moyens de détermination d'un premier objet vidéo (VOn) dans chaque image (In) dans laquelle un symbole du message est à insérer, - des moyens de détermination d'un second objet vidéo (VOn+1) correspondant au premier objet vidéo, dans une seconde image (In+1) de la séquence, - des moyens de détermination d'une intersection (INn) entre les premier et second objets vidéo, dans l'image dans laquelle un symbole du message est à insérer,
- des moyens d'insertion du symbole (bm) dans l'intersection.
15. Dispositif d'insertion selon la revendication 14, caractérisé en ce que les moyens d'insertion du symbole dans l'intersection comportent: des moyens de détermination d'une séquence de modulation (Wn+1) à partir du second objet vidéo, - des moyens de modulation du symbole à insérer par la séquence de modulation déterminée,
- des moyens d'insertion du symbole modulé dans l'intersection.
16. Dispositif selon la revendication 15, caractérisé en ce qu'il est adapté à générer la séquence de modulation à partir de la texture du second
objet vidéo (VOn+1).
17. Dispositif selon la revendication 15 ou 16, caractérisé en ce que les moyens de détermination d'une séquence de modulation comportent: - des moyens de division entière de la valeur d'une composante prédéterminée de chaque pixel de l'image de référence, par une première 3o0 valeur prédéterminée (Q), - des moyens de comparaison du reste de la division entière avec une seconde valeur prédéterminée, pour chaque division entière, - des moyens de détermination de la valeur de chaque coefficient de la séquence de modulation, en fonction du résultat respectif de chaque comparaison.
18. Dispositif selon la revendication 17, caractérisé en ce qu'il est
adapté à considérer la luminance comme composante prédéterminée.
19. Dispositif selon l'une quelconque des revendications 14 à 18,
caractérisé en ce qu'il est adapté à considérer l'image (In+1) suivant l'image
courante (In) dans la séquence comme seconde image.
20. Dispositif selon l'une quelconque des revendications 14 à 19,
caractérisé en ce qu'il est adapté à effectuer l'insertion dans une image sur deux.
21. Dispositif d'extraction d'un message à partir d'une séquence d'images dans laquelle le message a été inséré par le dispositif d'insertion
selon l'une quelconque des revendications 14 à 20, caractérisé en ce qu'il
comporte: - des moyens de sélection d'une région d'intérêt dans une image (l'a) de la séquence, - des moyens de suivi temporel de la région d'intérêt sur au moins une partie de la séquence, - des moyens d'extraction des symboles du message sur la région
d'intérêt en fonction du résultat du suivi temporel.
22. Dispositif d'extraction selon la revendication 21, caractérisé en que les moyens d'extraction d'un symbole comportent: - des moyens de détermination d'un troisième objet vidéo dans 3 o l'image (V'i) dans laquelle un symbole du message a été inséré, - des moyens de détermination d'un quatrième objet vidéo correspondant au troisième objet vidéo, dans une autre image (V'i+i) de la séquence, - des moyens de détermination d'une intersection (IN'i) entre les troisième et quatrième objets vidéo, dans l'image dans laquelle un symbole du message a été inséré,
- des moyens d'extraction du symbole depuis l'intersection.
23. Dispositif d'extraction selon la revendication 22, caractérisé en que les moyens d'extraction d'un symbole comportent: - des moyens de détermination d'une séquence de démodulation à partir du quatrième objet, - des moyens d'estimation du signal de marquage du symbole inséré, - des moyens de démodulation du signal de marquage estimé par la
séquence de démodulation.
24. Dispositif d'extraction selon la revendication 23, caractérisé en que les moyens d'estimation du signal de marquage du symbole inséré comportent: - des moyens de prédiction temporelle de l'intersection courante à partir de deux autres images de la séquence, et - des moyens de soustraction de l'intersection prédite de
l'intersection courante.
25. Dispositif d'extraction selon la revendication 24, caractérisé en que les moyens de prédiction de l'intersection courante sont adaptés à effectuer un calcul de moyenne des deux images ' 1'j+) encadrant l'image
dans laquelle un symbole a été inséré.
26. Dispositif d'extraction selon l'une quelconque des revendications
22 à 25, caractérisé en qu'il est adapté à considérer des troisième et quatrième objets vidéo qui correspondent au moins partiellement aux premier et second
objets vidéo, respectivement.
27. Dispositif d'insertion selon l'une quelconque des revendications
14 à 20, caractérisé en ce que les moyens de détermination et insertion sont incorporés dans: - un microprocesseur (100), - une mémoire morte (102) comportant un programme pour traiter les données, et - une mémoire vive (103) comportant des registres adaptés à
enregistrer des variables modifiées au cours de l'exécution dudit programme.
28. Dispositif d'extraction selon l'une quelconque des revendications
21 à 26, caractérisé en ce que les moyens de détermination et extraction sont incorporés dans: - un microprocesseur (100), - une mémoire morte (102) comportant un programme pour traiter les données, et - une mémoire vive (103) comportant des registres adaptés à
enregistrer des variables modifiées au cours de l'exécution dudit programme.
29. Appareil de traitement (10) d'une séquence d'images numériques, caractérisé en ce qu'il comporte des moyens adaptés à mettre en
oeuvre le procédé selon l'une quelconque des revendications 1 à 14.
30. Appareil de traitement (10) d'une séquence d'images numériques, caractérisé en ce qu'il comporte le dispositif selon l'une
quelconque des revendications 15 à 28.
FR0209276A 2002-07-22 2002-07-22 Insertion d'un message dans une sequence d'images numeriques Expired - Fee Related FR2842689B1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR0209276A FR2842689B1 (fr) 2002-07-22 2002-07-22 Insertion d'un message dans une sequence d'images numeriques

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0209276A FR2842689B1 (fr) 2002-07-22 2002-07-22 Insertion d'un message dans une sequence d'images numeriques

Publications (2)

Publication Number Publication Date
FR2842689A1 true FR2842689A1 (fr) 2004-01-23
FR2842689B1 FR2842689B1 (fr) 2004-10-01

Family

ID=29797628

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0209276A Expired - Fee Related FR2842689B1 (fr) 2002-07-22 2002-07-22 Insertion d'un message dans une sequence d'images numeriques

Country Status (1)

Country Link
FR (1) FR2842689B1 (fr)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SWANSON M D ET AL: "Object-based transparent video watermarking", MULTIMEDIA SIGNAL PROCESSING, 1997., IEEE FIRST WORKSHOP ON PRINCETON, NJ, USA 23-25 JUNE 1997, NEW YORK, NY, USA,IEEE, US, 23 June 1997 (1997-06-23), pages 369 - 374, XP010233851, ISBN: 0-7803-3780-8 *

Also Published As

Publication number Publication date
FR2842689B1 (fr) 2004-10-01

Similar Documents

Publication Publication Date Title
Korus Digital image integrity–a survey of protection and verification techniques
KR101125351B1 (ko) 디지털 이미지 처리 방법 및 시스템
EP2149098B1 (fr) Déduction de signatures vidéo qui sont insensibles à une modification d'image et à une conversion de fréquence de trame
Swanson et al. Multimedia data-embedding and watermarking technologies
EP0997042B1 (fr) Procede de marquage d'un signal numerique video compresse
EP1473944A2 (fr) Procédé de tatouage d'une séquence vidéo à sélection adaptative de la zone d'insertion du tatouage, procédé de détection, dispositifs, support de données et programmes d'ordinateur correspondants.
JP2009508393A (ja) ビデオ透かし挿入
JP2009508391A (ja) ビデオ透かし検出
US9639910B2 (en) System for embedding data
FR2785426A1 (fr) Procede et dispositif d'insertion et de detection d'une marque dans des donnees numeriques
Yao et al. Content-adaptive reversible visible watermarking in encrypted images
JP2009508395A (ja) ビデオ透かし挿入のための係数修正
FR2787604A1 (fr) Procede d'insertion d'une marque secrete et d'authentification d'un signal numerique
CN107886518B (zh) 图片检测方法、装置、电子设备及可读取存储介质
Mehrish et al. Robust PRNU estimation from probabilistic raw measurements
EP1330110B1 (fr) Procédé et système de décodage de tatouage
Pandey et al. A passive forensic method for video: Exposing dynamic object removal and frame duplication in the digital video using sensor noise features
Maiorana et al. Multi‐bit watermarking of high dynamic range images based on perceptual models
Vashistha et al. Watermarking video content using visual cryptography and scene averaged image
FR2842689A1 (fr) Insertion d'un message dans une sequence d'images numeriques
WO2004073311A1 (fr) Procede et dispositif pour la protection et la visualisation de flux video
Le Moan et al. Towards exploiting change blindness for image processing
FR2831374A1 (fr) Insertion d'un message dans une sequence d'images numeriques
WO2010062290A1 (fr) Motifs de filigrane multi-phases
FR2831376A1 (fr) Insertion d'un message dans une sequence d'images numeriques

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20140331