FR2823630A1 - Association d'informations de segmentation a un signal numerique - Google Patents

Association d'informations de segmentation a un signal numerique Download PDF

Info

Publication number
FR2823630A1
FR2823630A1 FR0105042A FR0105042A FR2823630A1 FR 2823630 A1 FR2823630 A1 FR 2823630A1 FR 0105042 A FR0105042 A FR 0105042A FR 0105042 A FR0105042 A FR 0105042A FR 2823630 A1 FR2823630 A1 FR 2823630A1
Authority
FR
France
Prior art keywords
signal
cell
key
segmentation
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR0105042A
Other languages
English (en)
Other versions
FR2823630B1 (fr
Inventor
Floch Herve Le
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to FR0105042A priority Critical patent/FR2823630B1/fr
Publication of FR2823630A1 publication Critical patent/FR2823630A1/fr
Application granted granted Critical
Publication of FR2823630B1 publication Critical patent/FR2823630B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/0028Adaptive watermarking, e.g. Human Visual System [HVS]-based watermarking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/467Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2389Multiplex stream processing, e.g. multiplex stream encrypting
    • H04N21/23892Multiplex stream processing, e.g. multiplex stream encrypting involving embedding information at multiplex stream level, e.g. embedding a watermark at packet level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/835Generation of protective data, e.g. certificates
    • H04N21/8358Generation of protective data, e.g. certificates involving watermark
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0052Embedding of the watermark in the frequency domain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0061Embedding of the watermark in each block of the image, e.g. segmented watermarking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32128Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title attached to the image data, e.g. file header, transmitted message header, information on the same page or in the same computer file as the image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3242Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of processing required or performed, e.g. for reproduction or before recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3269Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of machine readable codes or marks, e.g. bar codes or glyphs
    • H04N2201/327Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of machine readable codes or marks, e.g. bar codes or glyphs which are undetectable to the naked eye, e.g. embedded codes

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

L'invention propose un procédé d'insertion dans un signal numérique (IM) de données représentatives d'une segmentation du signal, caractérisé en ce qu'il comporte les étapes de :- segmentation (E2) du signal,- formation (E1) de cellules (Ck ) dans le signal,- association (E3) d'un label (L) à chacune des cellules en fonction de la segmentation,- insertion (E7) dans chacune des cellules de données représentatives du label associé à la cellule.

Description

électronique.
1 2823630
La présente invention concerne de manière générale la
segmentation d'un signal numérique.
Le signal numérique considéré dans la suite sera plus particulièrement un signal d'image numériqué, que se soit une image fixe ou
une vidéo.
La segmentation d'une image numérique permet de réaliser une
partition de l'image en régions homogènes, connexes et ne se recouvrant pas.
La partition est telle que les régions sont disjointes et que leur réunion constitue l' image. Les régions correspondent ou ne correspondent pas à des objets de l'image, le terme d'objet référant à une information de nature sémantique. Bien souvent cependant, un objet correspond à une région ou un ensemble de régions. Chaque région peut étre représentée par une information représentative de sa forme, sa couleur ou de sa texture. L'homogénaité de la région dépend bien sur d'un critère particulier d'homogénéité: proximité des
valeurs moyennes, conservation du contraste, de la couleur, par exemple.
Par objet, on entend une entité de l'image correspondant à une unité sémantique, par exemple le visage d'une personne. Un objet peut être constitué d'une ou plusieurs régions contenues dans l'image. Par la suite nous utiliserons indifféremment le terme d'objet ou de région. Un objet a une taille et
une forme qui sont a priori quelconques.
Classiquement, le résultat de la segmentation d'une image est une carte de segmentation. Une carte de segmentation peut être considérée
comme une image à niveaux de gris ou comme un ensemble d'objets distincts.
2 2823630
Dans le premier cas, un niveau de gris représente le label d'un objet.
La carte de segmentation peut être compressoe et ajoutée comme fichier
annexe à l'image d'origine.
Dans le second cas, comme dans la norme de compression de vidéo numérique MPEG-4 (d'après l'anglais Motion Picture Expert Group), chaque objet est représenté indépendamment. Une fenêtre englobante lui est attribuce et sa forme binaire ainsi que sa texture sont codées, avec ou sans perte. L'objet est positionné dans l'image à partir des coordonnées de sa
fenêtre englobante.
Dans ces deux cas, la carte de segmentation est représentée par un
fichier annexe à l'image ou à la vidéo d'origine.
D'autre part, I'insertion d'informations supplémentaires envisagée dans le cadre de l'invention s'inscrit dans le domaine technique du marquage (watermarking en anglais) des données numériques. Le marquage comporte de manière générale la modification de coefficients représentatifs de l'image numérique. Cette modification est imperceptible à l'_il, mais peut être décodée
par un décodeur approprié.
Un système d'insertion et d'extraction d'informations
supplémentaires est décrit dans le document US 5 915 027.
La présente invention vise à fournir un procédé et un dispositif qui permettent d'insérer dans un signal numérique les informations de
segmentation de ce signal numérique.
A cette fin, I'invention concerne un procédé d'insertion dans un signal numérique de donnces représentative d'une segmentation du signal, caractérisé en ce qu'il comporte les étapes de: - segmentation du signal, - formation de cellules dans le signal, - association d'un label à chacune des cellules en fonction de la segmentation,
3 2823630
- insertion dans chacune des cellules de donnces représentatives du
label associé à la cellule.
Corrélativement, I'invention concerne un dispositif d'insertion dans un signal numérique de données représentative d'une segmentation du signal, caractérisé en ce qu'il comporte: - des moyens de segmentation du signal, - des moyens de formation de cellules dans le signal, - des moyens d'association d'un label à chacune des cellules en fonction de la segmentation, - des moyens d'insertion dans chacune des cellules de données
représentatives du label associé à la cellule.
Grâce à l'invention, les informations de segmentation sont insérées dans le signal, ce qui évite le besoin d'avoir un fichier annexe au signal pour les contenir. Selon une caractéristique préférce, I'insertion comporte pour chaque cellule les étapes de: - calcul d'une clé de codage en fonction du label associé à la cellule, - génération d'une séquence pseudo-aléatoire en fonction de la clé de codage,
- insertion de la séquence pseudo-aléatoire dans la cellule.
Pour une cellule donnée, les donnces représentatives sont ainsi une
séquence pseudo-aléatoire qui dépend du label de la cellule considérée.
Selon des caractéristiques préférces qui peuvent être combinces, la clé de codage dépend en outre de: - la position de la cellule dans le signal, d'une clé secrète prédéterminée, - du nombre d'objets déterminés dans le signal lors de l'étape de
segmentation.
4 2823630
Ces caractéristiques permettent de minimiser le risque d'erreur lors de l'extraction ultérieure des données représentatives du résultat de la segmentation. Selon une caractéristique préférée, le procédé d'insertion comporte
en outre l'insertion d'un nombre prédéterminé de messages dans le signal.
Ces messages peuvent être associés de manière sémantique aux
objets définis par la segmentation.
Dans le cas o des messages sont insérés dans le signal, selon une caractéristique préférée, la clé de codage dépend en outre du nombre de
messages à insérer dans le signal.
Ainsi, lors de l'extraction, ce nombre est extrait préalablement à
l 'extraction d es messages.
L'invention concerne aussi un dispositif d'insertion qui comporte des
moyens de mise en _uvre des caractéristiques précédentes.
L'invention concerne aussi un procédé d'extraction de données représentatives de la segmentation d'un signal numérique, insérées dans ledit signal par le procédé d'insertion précédemment présenté, caractérisé en ce qu'il comporte les étapes de: - formation de cellules dans le signai, - considération d'un ensemble de labels à tester, - calcul d'une corrélation entre chaque cellule et de données représentatives de chaque label testé, - détermination de la mesure de corrélation la plus grande pour
chaque cellule.
Le procédé d'extraction selon l' invention permet de retrouver les données représentatives du résultat de la segmentation, puisque pour une cellule donnée, la mesure de corrélation la plus grande correspond au label
inséré dans la cellule considérée.
Selon une caractéristique préférce, I'extraction comporte pour chaque cellule les étapes de:
2823630
- calcul d'une clé de codage en fonction de chaque label testé, génération d'une séquence pseudo-aléatoire en fonction de chaque
clé de codage.
La séquence pseudo-aléatoire est construite comme pour l'insertion.
Elle est ensuite corrélée avec ia cellule pour déterminer si elle correspond ou
non au label qui a effectivement été inséré dans la cellule considérée.
Selon une caractéristique préférée, comme pour l'insertion, la clé de codage dépend en outre: - de la position de la cellule dans le signal, d'une clé secrète prédéterminée,
- du nombre d'objets du signal.
La clé de codage est formée comme lors de l' insertion.
Selon une caractéristique préférce, le procédé d'extraction comporte
en outre l'extraction d'un nombre prédéterminé de messages dans le signal.
Bien entendu, cela correspond au cas o des messages ont été
préalablement insérés dans le signal.
Dans ce cas, selon une caractéristique préférée, la clé de codage
dépend en outre du nombre de messages à extraire du signal.
Là encore, la clé de codage est formoe comme lors de l'insertion.
Selon une caractéristique préférée, le procédé d'extraction comporte la détermi nation d u nom bre d'objets précéd em me nt d éterm i nés lo rs d e la
segmentation du signal.
Le nombre exact d'objet peut être remplacé par une valeur maximale, mais l'extraction est plus précise si le nombre exact d'objets est déterminé. Selon une caractéristique préférée, le procédé comporte la
détermination du nombre de messages à extraire du signal.
6 2823630
Lorsque des messages ont été insérés dans le signal, il est nécessaire de conna^'tre le nombre exact de messages pour pouvoir les
extraire. Si ce nombre n'est pas connu, il est déterminé lors de i'extraction.
L'invention concerne aussi un dispositif d'extraction qui comporte des moyens de mise en _uvre des caractéristiques précédentes. L'invention concerne aussi un appareil numérique incluant le dispositif selon l'invention, ou des moyens de mise en _uvre du procédé selon l'invention. Cet appareil numérique est par exemple un appareil photographique numérique, un caméscope numérique ou un scanner. Les avantages des dispositifs d'insertion et d'extraction et de l'appareil numérique sont identiques
à ceux précédemment exposés.
L'invention peut être mise en _uvre par un programme d'ordinateur.
Un moyen de stockage d'information, lisible par un ordinateur ou par un microprocesseur, intégré ou non au dispositif, éventuellement amovible,
mémorise le programme mettant en _uvre le procédé selon l'invention.
Les caractéristiques et avantages de la présente invention appara^'tront plus clairement à la lecture d'un mode préféré de réalisation illustré par les dessins cijoints, dans lesquels: - la figure 1 représente un mode de réalisation de dispositif d'insertion selon l'invention, - la figure 2 représente un mode de réalisation de dispositif d'extraction selon 1'invention, - la figure 3 représente un mode de réalisation de dispositif selon l'invention, - la figure 4 représente un premier mode de réalisation de procédé d'insertion selon l'invention, - la figure 5 représente un exemple de formation de cellules et d'attribution de labels selon l'invention,
7 2823630
- la figure 6 représente un deuxième mode de réalisation de procédé d'insertion selon l'invention, - la figure 7 représente un troisième mode de réalisation de procédé d'insertion selon l'invention, - la figure 8 représente un exemple d'association de label et de valeur binaire de message avec les cellules selon l'invention, - la figure 9 représente un mode de réalisation de segmentation utilisé pour l'insertion des figures 4, 6 et 7, - la figure 10 représente un premier mode de réalisation de procédé d'extraction selon l'invention, - la figure 11 représente un deuxième mode de réalisation de procédé d'extraction selon l'invention, la figure 12 représente un troisième mode de réalisation de procédé d'extraction selon l'invention, - la figure 13 représente un mode de réalisation de procédé de
détermination du nombre d'objets d'un signal, selon l'invention.
Selon le mode de réalisation choisi et représenté à la figure 1, un dispositif d'insertion dans un signal numérique de données représentatives d'une segmentation du signal comporte une mémoire 1 adapté à mémoriser un
signal qui est ici une image numérique IM.
La mémoire 1 est reliée d'une part à un circuit 2 de segmentation de
l'image et d'autre part à un circuit 3 de formation de cellules Ck dans l'image.
Les circuits 2 et 3 sont reliés à un circuit 4 d'association d'un label L
à chacune des cellules en fonction du résultat de la segmentation.
Les circuits 3 et 4 sont reliés à un circuit 5 d'insertion dans chacune
des cellules de données représentatives du label L associé à la cellule.
En outre, il est possible d'insérer des messages dans l'image. Dans ce cas, une mémoire 6 mémorise des messages à insérer. La mémoire 6 est reliée au circuit d'insertion 5. Les messages sont par exemple liés
sémantiquement aux objets vidéos résultant de la segmentation.
8 2823630
Le fonctionnement du dispositif selon l'invention sera détaillé dans la suite. En référence à la figure 2, un dispositif d'extraction de données représentatives de la segmentation d'une image, insérées dans l'image par le dispositif de la figure 1, comporte une mémoire 10 pour mémoriser une image
IM'. L'image IM' a été préalablement traitée par le dispositif d'insertion.
La mémoire 10 est reliée à un circuit 11 de formation de cellules C k
dans l'image IM'.
Une mémoire 12 mémorise un ensemble de labels à tester. La mémoire 12 et le circuit 11 sont reliés à un circuit 13 de corrélation qui calcule la corrélation entre chaque cellu le et des don nées représentatives de chaque
label testé.
Le circuit 13 est relié à un circuit 14 qui détermine la plus grande mesure de corrélation pour chaque cellule. Cette mesure correspond au label
de la cellule.
Dans le cas o des messages ont été insérés dans l'image, le circuit 13 teste en outre des valeurs binaires et le circuit 14 détermine en outre les messages. Le fonctionnement du dispositif selon l'invention sera détaillé dans la suite. Comme représenté à la figure 3, un dispositif mettant en ceuvre l'invention est par exemple un micro-ordinateur 10 connecté à différents périphériques, par exemple une caméra numérique 107 (ou un scanner, ou tout moyen d'acquisition ou de stockage d'image) relice à une carte graphique et
fournissant des informations à traiter selon l'invention.
Le dispositif 10 comporte une interface de communication 112 reliée à un réscau 113 apte à transmettre des données numériques à traiter ou inversement à transmettre des données traitées par le dispositif. Le dispositif comporte également un moyen de stockage 108 tel que par exemple un disque dur. Ii comporte aussi un lecteur 109 de disque 110. Ce disque 110 peut
9 2823630
être une disquette, un CD-ROM, ou un DVD-ROM, par exemple. Le disque 110 comme le disque 108 peuvent contenir des donnces traitées selon l'invention ainsi que le ou les programmes mettant en _uvre l'invention qui, une fois lu par le dispositif 10, sera stocké dans le disque dur 108. Selon une variante, le programme permettant au dispositif de mettre en _uvre l'invention, pourra être stocké en mémoire morte 102 (appelée ROM sur le dessin). En seconde variante, le programme pourra être reçu pour être stocké de façon identique à celle décrite précédemment par l'intermédiaire du réscau de communication 113. Le dispositif 10 est relié à un microphone 111. Les données à traiter
selon l'invention seront dans ce cas du signal audio.
Ce même dispositif possède un écran 104 permettant de visualiser les donnces à traiter ou de servir d'interface avec l'utilisateur qui peut ainsi paramétrer certains modes de traitement, à l'aide du clavier 114 ou de tout
autre moyen (souris par exemple).
L'unité centrale 100 (appelée CPU sur le dessin) exécute les instructions relatives à la mise en _uvre de l'invention, instructions stockées dans la mémoire morte 102 ou dans les autres éléments de stockage. Lors de la mise sous tension, les programmes de traitement stockés dans une mémoire non volatile, par exemple la ROM 102, sont transférés dans la mémoire vive RAM 103 qui contiendra alors le code exécutable de l'invention ainsi que des registres pour mémoriser les variables nocessaires à la mise en _uvre de l'invention. De manière plus générale, un moyen de stockage d'information, lisible par un ordinateur ou par un microprocesseur, intégré ou non au dispositif, éventuellement amovible, mémorise un programme mettant en
_uvre le procédé selon l'invention.
Le bus de communication 101 permet la communication entre les différents éléments inclus dans le micro-ordinateur 10 ou reliés à lui. La représentation du bus 101 n'est pas limitative et notamment l'unité centrale 100 est susceptible de communiquer des instructions à tout élément du micro
1 0 2823630
ordinateur 10 directement ou par l'intermédiaire d'un autre élément du micro-
ordinateur 10.
Le fonctionnement des dispositifs selon l'invention va maintenant être décrit au moyen d'algorithmes. L'algorithme de la figure 4 est un premier mode de réalisation de l'invention qui représente le fonctionnement général du dispositif d'insertion
selon l'invention et comporte des étapes E1 à E8.
Cet algorithme peut être mémorisé en totalité ou en partie dans tout moyen de stockage d'information capable de coopérer avec le microprocesseur. Ce moyen de stockage est lisible par un ordinateur ou par un microprocesseur. Ce moyen de stockage est intégré ou non au dispositif, et peut être amovible. Par exemple, il peut comporter une bande magnétique, une
disquette ou un CD-ROM (disque compact à mémoire figée).
Le procédé vise à insérer dans une image numérique des
informations relatives à la segmentation de cette image.
L'étape E1 est une formation de cellules dans une image numérique.
Les cellules sont des groupes de coefficients de l'image. Les cellules sont adjacentes, par exemple de forme rectangulaire, et recouvrent entièrement l'image. Il est à noter que l'on travaille ici dans le domaine spatial, c'est-à-dire sur les pixels de l'image. Cependant, I'image peut avoir subi préalablement une transformation, par exemple de type DCT par blocs (d'après l'anglais Discrete
Cosine Transform), ou encore de type transformation en ondelettes discrètes.
Dans ce cas, on travaille sur des coefficients transformés.
La figure 5 est un exemple de formation de cellules Ck dans l'image.
L'étape E2 est u ne segmentation de l' image initiale. Cette étape est détaillée dans la suite. En variante, on suppose que la segmentation a été effectuée au préalable, et que les résultats de cette opération ont été mémorisés. L'étape E2 est alors la lecture en mémoire des résultats de la segmentation. La segmentation peut être liée aux caractéristiques physiques
1 1 2823630
de l'image, ou indépendante du contenu de l'image (focalisation sur une zone
de l'image). La segmentation a pour résultat des objets-vidéos.
Les étapes E1 et E2 sont suivies de l'étape E3 qui est l'attribution d'un label à chacune des cellules précédemment définies. Cette attribution est effectuée en fonction de la segmentation de l'image. Comme illustré à la figure 5, I'image comporte trois objets-vidéos:
Le fond V01 de l'image, une première ellipse V02 et une seconde ellipse V03.
Chaque cellule est successivement considérée et un label lui est
attribué en fonction de la présence ou non d'un objet vidéo sur cette cellule.
Lorsqu'une cellule est situce complètement à l'intérieur d'un objet
vidéo, le label correspondant à cet objet lui est attribué.
Si une cellule est située sur plusieurs objets vidéo, le label de l'objet vidéo occupant la plus grande surface est attribué à la cellule. En variante, il est
possible d'attribuer un label spécial à une telle cellule.
A la figure 5, le label " 0 " est attribué aux cellules appartenant au fond V01, le label " 1 " aux cellules de l'objet-vidéo V02 et le label " 2 " aux
cellules de l'objet-vidéo V03.
Le résultat de l'étape E3 est une carte de labels. Il est à noter que
toutes les cellules de l'image reçoivent un label.
La suite du procédé a pour but d'insérer dans chaque cellule des
données représentatives du label attribué à la cellule considérée.
L'étape suivante E4 est la sélection d'une cellule de l'image. Les cellules sont considérées une par une, dans un ordre quelconque, prédéterminé. L'étape suivante E5 est le calcul d'une clé de codage K. La clé de codage K dépend du label L de la cellule courante. Elle peut en outre dépendre: - d'une clé secrète Ks' - du nombre N1 d'objet vidéos définis dans l'image,
- de la position (x, y) de la cellule courante dans l'image.
Par exemple, la clé K est déterminée par la formule:
1 2 2823630
K=Ks+M'. N. +J.x+y+M2. L Dans laquelle: - M2 est un entier strictement positif, - M est un entier positif supérieur à NmaX. M2, o NmaX, est le nombre maximum d'objets vidéos qui peuvent être présents dans une carte de segmentation. Le nombre maximum d'objets vidéos NmaX est par exemple un paramètre de l'algorithme de segmentation, ou un paramètre déterminé empiriquement. En pratique, le nombre d'objets vidéos des cartes de segmentation ne dépasse que très rarement 10. On peut choisir NmaX, égal à , et ainsi cette valeur sera toujours supérieure au nombre d'objets vidéos
réellement présents dans la carte de segmentation.
- J est la largeur de l'image exprimée en nombre de pixels, - x et y représente la position de la cellule dans l'image, par exemple la position de son angle haut gauche exprimée en nombre de pixels par rapport
au coin haut gauche de l'image.
Cette formule de détermination de la clé K permet d'assurer que, pour une même clé secrète, à chaque couple (N, L) correspond une clé unique. En d'autres termes, deux couples différents génèrent des clés différentes, ce qui présente l'avantage de pouvoir retrouver sans ambiguté les paramètres N. et L lors de l'extraction des donnces insérces, comme exposé
dans la suite.
Du fait que la clef dépend du nombre N. d'objet-vidéos, la séquence pseudo-aléatoire totale générée sur l'image (unlon des séquences pseudo
aléatoires générées sur chaque cellule) dépend également du nombre N..
Cette propriété est utile lors de l'extraction de la carte de segmentation car elle permet alors de retrouver automatiquement la valeur du nombre N et ainsi de
minimiser des erreurs dues aux fausses détections sur le label.
L'étape suivante E6 est la génération d'une séquence pseudo aléatoire binaire (par exemple formée de +1 et de -1) en fonction de la clé K précédemment déterminée. Cette clé initialise la génération d'une séquence
1 3 2823630
pseudo-aléatoire de la taille de la cellule. La génération de séquence binaire
pseudo-aléatoire est classique et ne sera pas décrite ici.
L'étape suivante E7 est l'insertion de la séquence binaire pseudo
aléatoire dans la cellule courante.
L' insertion est class ique. Pa r exem ple, soit X = {Xj, 1 < i < N}
I'ensemble des coefficients représentatifs de la cellule courante.
Soit w = {w;, 1< j < N} le signal pseuJo-aléatoire à insérer, qui est
par exemple de distribution binaire {-1, 1}.
La formule d'insertion est: X'j=Xj+aj.wj,avec1<j<N, dans laquelle oj est un coefficient pondérateur, appelé également amplitude de modulation. Les coefficients pondérateurs oj sont déterminés de sorte que la modification des signaux Xj en les signaux X'j ne soit pas visible
dans l'image.
L'étape suivante E8 est un test pour déterminer si toutes les cellules ont été traitées. Si la réponse est négative, alors cette étape est suivie de
l'étape E4 précédemment décrite pour considérer une autre cellule.
Lorsque la réponse est positive à l'étape E8 alors l'insertion est
terminée.
Il est à noter que le calcul de la clef ne garantit pas la bijection entre label et séquence pseudo-aléatoire. En effet, du fait de la taille rébuite des cellules, deux clefs différentes peuvent conduire à la génération d'une même séquence pseudo-aléatoire. Par exemple, si la taille des cellules est 4x4, 246 séquences binaires peuvent être générées. La probabilité que deux clefs
différentes conduisent à la même séquence pseuJo-aléstoire est donc de 1/26.
C'est pourquoi, en variante, lors de la génération de la séquence (étape E6), un test peut être effectué pour déterminer si la séquence générce correspondant au label courant L n'est pas égale à une séquence correspondant à un autre label. Dans ce cas, une nouvelle valeur de clef est calculée. Par exemple, avec la formule:
4 2823630
K=Ks+M,. N. +J.x+y+M2. L+N, Si la séquence pseuJo-aléatoire générée est à nouveau déjà utilisée, la loi sera: K=Ks+M,.N,+J.x+y+M2.L+2.N Ce calcul de clef est répété jusqu'à ce que la séquence pseuJo aléatoire ne corresponde pas à la séquence d'un label différent de celui relatif à
la cellule courante.
L'algorithme de la figure 6 est un deuxième mode de réalisation de
l'invention qui comporte des étapes E11 à E20.
Par rapport au premier mode de réalisation, le calcul de la clé et la
détermination de la séquence binaire sont modifiés.
Les étapes E10 à E14 sont respectivement identiques aux étapes
E1 à E4 précédemment décrites.
L'étape E14 est suivie de l'étape E15 qui est le calcul d'une clé K1.
Par exemple, la clé K1 est déterminée par la formule: K1 =Ks+M. N. +J.x+y Dans laquelle Ks, M,, N., J. x et y sont définis comme dans le
premier mode de réalisation.
L'étape suivante E16 est identique à l'étape E6 (figure 4) et est la génération d'une séquence pseudo-aléatoire binaire W1 de la taille de la cellule considérée. L'étape suivante E17 est la génération de N séquences pseudo aléatoires binaires W., W2,..., WN, différentes les unes des autres. Les N séquences sont générées à partir de la séquence W1 précédemment
détermince.
Pour former ces N séquences pseudo-aléatoires binaires, on considère un polynôme primitif de degré m, o m est un entier pair. La valeur
1 5 2823630
de cet entier est ici liée à la taille d'une cellule élémentaire. Dans ce mode de réalisation, I'entier pair m est tel que le coté d'une cellule élémentaire carrée,
exprimé en nombre de pixels, est 2m2.
Le polynôme primitif permet de générer 2m séquences binaires S., S2,..., S2m qui sont de longueur 2m _ 1 et quasi-orthogonales entre elles. Chacune des séquences Sj est complétée par une valeur binaire aléatoire pour
que sa taille soit égale à celle d'une cellule, et donc à celle de la séquence W1.
En sélectionnant les N. premières séquences (S, S2,..., SN,) parmi les 2m _ 1 séquences et en multipliant bit à bit la séquence W1 avec chacune de ces N séquences binaires, on obtient les N séquences pseudo-aléatoires binaires W., W2,..., WN] Ainsi, les séquences W1, W2,.., WN sont quasiorthogonales entre elles. La quasi-orthogonalité implique que la distance binaire entre toutes les
séquences Wj est proche de (2m-1)/2 avec 2m-1 la longueur de la séquence Sj.
De ce fait, les séquences binaires Wj sont aussi éloignses que possible du
point de vue de la distance binaire.
L'étape suivante E18 est la sélection de l'une des séquences précédemment générées, en fonction du label L de la cellule courante. Par
exemple, la séquence choisie est WL OU L est le label de la cellule.
Les étapes E19 et E20 sont respectivement identiques aux étapes
E7 et E8 précédemment décrites (figure 4).
Il est à noter que d'autres méthodes que les polynômes primitifs peuvent être utilisoes pour générer des séquences orthogonales ou quasi
orthogonales. On peut par exemple utiliser les matrices de Hadamard.
L'algorithme de la figure 7 est un troisième mode de réalisation de
l'invention qui comporte des étapes E21 à E31.
Par rapport au premier mode de réalisation, des messages sont en outre insérés dans l'image, et le calcul de la clé peut tenir compte du nombre N2 de messages insérés. Deux types d'informations sont attribués à chaque cellule: le label de la cellule et la valeur d'un bit d'un message.
1 6 2823630
Les étapes E21 et E22 sont analogues aux étapes E1 et E2
précédemment décrites (figure 4).
L'étape suivante E23 est la lecture du label et de la valeur d'un bit
d'un message associés à la cellule courante.
Le résultat de l'étape E23 est une carte de labels et de valeurs binaires. Il est à noter que toutes les cellules de l'image reçoivent un label et
une valeur binaire.
La figure 8 représente un exemple d'association de label et de
valeur binaire de message avec les cellules.
Comme à la figure 5, un label est attribué à chaque cellule, en
fonction de l'appartenance de la cellule à un objet vidéo.
En outre, deux messages sont par exemple à insérer. Le premier message comporte les bits: bo, b,, b,2 et b,3. Le second message comporte
les bits: b20, b2, b22 et b23.
Chacun de ces bits est attribué à une cellule selon un ordre pré établi. Pa r exemple, les cel lu les so nt cons id érées d e gauche à d roite da n s chaque ligne, les lignes étant considérées de haut en bas. Les bits du premier message sont d'abord attribués selon un ordre croissant. Les bits du second message sont ensuite attribués, toujours dans un ordre croissant. Les bits de I'ensemble des messages sont ainsi insérés. Lorsque tous les bits des messages ont été attribués, et s'il reste encore des cellules, le processus d ' attri bution des b its d es messages a ux cel lu les vid es est ré pété ju squ 'à ce qu e
chaque cellule possède un bit.
En référence à nouveau à la figure 7, I'étape E23 est suivie de
I'étape E24, à laquelle une cellule de l'image est sélectionnée.
L'étape suivante E25 est le calcul d'une clé K2. Par exemple, la clé K2 est déterminée selon la formule: K2=Ks+M'. N'+M3. N2+J.x+y O M3 est un entier supérieur à NmaX. M', NmaX' étant le nombre maximal d'objetsvidéos qui peuvent être présents dans une carte de segmentation.
1 7 2823630
et o Ks, M', N', J. x, y sont tels que définis précédemment (figure 4) La clé K2 dépend donc aussi du nombre N2 de messages insérés
dans l'image.
En adoptant cette loi de génération de clef, quelle que soit la cellule considérée, la clef générce par un couple (N,I,N2) sera différente de celle générée par le couple (N,2,N22) dès que N' N2 et/ou N2 N2 Ainsi, lors de l'extraction des données insérées dans l'image, on
pourra retrouver de façon certaine chaque couple (N, N2).
Du fait que la clef dépend du nombre d'objet-vidéos et du nombre de messages, la séquence pseudo-aléatoire totale générée sur l'image (union des séquences pseuJo-aléatoires générées sur chaque cellule) dépend également
de N. et N2.
Ainsi, lors de l'extraction ultérieure de la carte de segmentation, il sera possible de déterminer automatiquement la valeur N. et ainsi de
minimiser des erreurs dues aux fausses détections sur le label.
En outre, cela permet aussi de déterminer le nombre N2 de messages insérés. Comme on le verra, il n'est en effet pas possible de
déterminer le contenu des messages sans conna^tre cette valeur.
L'étape E25 est suivie de l'étape E26 à laquelle une séquence
* pseudo-aléatoire est générce. Cette étape est analogue à l'étape E6 (figure 4).
A l'étape suivante E27, 2xN 1 séquences pseudo-aléatoires (WO, W"..., W2N, _!) sont générées à partir de la séquence pseudo-aléstoire
déterminée à l'étape E26.
De préférence, la distance binaire entre chacune de ces séquences est maximale. Il est donc possible d'utiliser une technique semblable à celle décrite en référence à la figure 6: I'orthogonalisation de la séquence W par
utilisation de polynômes primitifs ou par utilisation de matrice de Hadamard.
1 8 2823630
L'étape E28 détermine le couple (label, valeur binaire) de la cellule courante. Cette détermination est faite en fonction de l'attribution prédéfinie des bits de messages aux cellules d'une part, et du label affecté à la cellule
courante, d'autre part.
Les étapes E27 et E28 sont suivies de l'étape E29 à laquelle une séquence Wj est associée à la cellule courante, en fonction de son couple (label, valeur binaire). Par exemple, I'association entre (label, valeur binaire) et séquence est la suivante: (O. -1) Wo
1 0 (O. 1) => W
(1, -1) W2
(1,1) W3
(N1-1,-1) W2N,_2
(N1-1, 1)= W2N,_!
Les étapes suivantes E30 et E31 sont respectivement analogues
aux étapes E7 et E8 précédemment décrite (figure 4).
Dans ce mode de réalisation, I'insertion est classique. Par exemple, soit X = {Xj, 1< i < N} I'ensemble des coefficients représentatifs de la cellule
courante.
Soit w = {w;, 1< j < N} le signal pseudo-aléstoire à insérer, qui est
par exemple de distribution binaire {-1, 1}.
La formule d'insertion est: X'j = Xj + b.aj.wj, avec 1< j < N. dans laquelle b est un bit d'information, et aj est un coefficient pondérateur, appelé également amplitude de modulation. Les coefficients pondérateurs aj sont déterminés de sorte que la modification des signaux Xj en
les signaux X'j ne soit pas visible dans l'image.
1 9 2823630
On va maintenant décrire, en référence à la figure 9, un mode de réalisation de segmentation d'un signal numérique tel qu'une image IM, à l'aide
d'un organigramme comportant les étapes E90 à E92.
L'étape E90 est une simplification du signal. Une version simplifiée du signal, plus généralement d'une image, sera par exemple obtenue en appliquant à cette dernière un opérateur morphologique d'ouverture/fermeture,
suivi d'une reconstruction morphologique. Une description complète de ce
procédé peut être trouvée dans l'article de Philippe Salembier intitulé "Morphological multiscale segmentation for image coding " paru dans le magazine << Signal Processing " numéro 38 de 1994. Ce type de traitement élimine les objets plus petits qu'une certaine taille, et restaure les contours des objets qui n'ont pas été supprimés. A l'issue de cette étape on dispose donc d'une version simplifiée du signal, qui va être plus facile à traiter par les étapes suivantes. L'étape suivante E91 est le marquage, ou extraction des marqueurs, du signal simplifié. Cette étape identifie la présence des régions homogènes du signal simplifié, en utilisant un critère qui peut être par exemple un critère d'homogénéité de l'intensité de la région (régions plates). Concrètement, on utilise ici par exemple un algorithme de croissance de régions: le signal est balayé dans sa totalité (par exemple de haut en bas et de droite a gauche) . On recherche un " germe c'est-à-dire un point, ici un coefficient, représentatif d'une nouvelle région (le premier coefficient du signal en sera automatiquement un). La caractéristique de cette région (valeur moyenne) est calculée sur la base de ce point. Puis tous les voisins de ce point sont alors examinés, et pour chacun des voisins s'offrent deux possibilités: - si le point rencontré possède une intensité proche de la valeur moyenne de la région considérée, il est affecté à la région courante, et les statistiques de cette région sont remises à jour en fonction de ce nouvel élément, - si le point rencontré possède une intensité différente (au sens d'un critère de proximité) de la valeur moyenne de la région, il n'est pas affecté à la
2823630
région (il pourra par la suite être considéré comme un nouveau " germe "
représentatif d'une nouvelle région).
Tous les voisins affectés à la région courante sont alors eux-mêmes soumis à examen, c'est à dire que tous leurs voisins sont examinés (phase de croissance). Le traitement de la région continue ainsi jusqu'à ce que tous les points voisins des points appartenant à la région aient été examinés. A l'issue de ce traitement, la région est considérée bonne ou mauvaise. Si elle est mauvaise (typiquement, trop petite), c'est l'étape de décision qui traitera les points de la région en question. Si elle est bonne, le traitement est terminé pour elle. Un label ou identifiant unique est alors affecté à tous les points de la région. Le traitement global se poursuit alors par la recherche d'un nouveau germe. Pour qu'une région soit considérce bonne ou mauvaise, on utilise un
paramètre de taille minimale de région.
L'étape suivante E92 est la décision. Elle consiste à rattacher à une région tous les points qui n'ont pas de label à l'issue de l'étape de marquage
E91 (typiquement, les points qui ont été raffachés à des régions trop petites).
Cette étape peut étre effectuce simplement en considérant chacun des points qui ne possède pas de label, et en l'affectant à la région voisine dont il est le
plus proche (au sens d'un critère de proximité).
Un objet vidéo est soit une région de l'image, soit une réunion de
plusieurs région, correspondant à une entité sémantique.
Un premier mode de réalisation d'extraction d'informations supplémentaires est décrite en référence à la figure 10 sous la forme d'un
algorithme comportant des étapes E100 à E111.
Ce premier mode de réalisation est l'extraction de la carte de segmentation insérce selon le premier mode de réalisation d'insertion décrit en
référence à la figure 4.
Dans un premier temps, nous supposerons le nombre d'objet-vidéos
N. connu. Un mode de détermination de la valeur de N' est décrit dans la suite.
21 2823630
Il est avantageux de connaitre la valeur exacte de N pour extraire la carte de segmentation car cela permet de minimiser les risques de fausse attribution
d'un label à une cellule.
L'étape E100 est la formation de cellules C'k dans l'image IM' dans laquelle des informations supplémentaires ont été insérées. Cette étape est analogue à l'étape E1 précédemment décrite. En outre, une mesure de corrélation appelée CorTO est initialisée à 0. Cette mesure sera modifiée lors de l'extraction de la carte de segmentation pour aboutir à une valeur finale qui est
une mesure de confiance sur la segmentation extraite.
Il est à noter que l'image IM' peut avoir été préalablement filtrée par un filtre prédicteur pour améliorer l'extraction des données insérées,
notamment dans le cas o les données sont insérées dans le domaine spatial.
L'étape suivante E101 est une sélection de cellule. Les cellules sont
considérées successivement, dans un ordre quelconque et prédéterminé.
L'étape suivante E102 est une initialisation à laquelle deux variables LBk et CORk sont initialisées toutes les deux à la valeur zéro. La variable LBk représente le label testé dans la cellule courante C'k. La variable CORk représente une mesure de corrélation entre la cellule courante et une séquence
pseudo-aléatoire construite à partir du label courant LBk.
L'étape suivante E103 est le calcul d'une clé. Ce calcul est identique au calcul de clé effectué lors de l'insertion (figure 4) et est effectué pour le label
courant LBk.
L'étape suivante E104 est la génération d'une séquence pseudo aléatoire en fonction de la clé précédemment calculée, et donc en fonction du label courant LBk. Cette étape est analogue à l'étape E6 précédemment décrite
(figure 4).
L'étape suivante E105 est un calcul de corrélation XCk entre la
séquence pseudo-aléatoire précédemment générée et la cellule courante C'k.
Ce calcul est classique. Cette mesure de corrélation caractérise la ressem blance entre la séq u ence insérée da ns la cell u le et ia séquence
générce selon le label testé.
22 2823630
A l'étape suivante E106 la mesure de corrélation XCk est comparce à la valeur CORk courante qui est égale à la valeur maximale des mesures de
corrélation précédentes.
Si la mesure de corrélation XCk est supérieure à la valeur CORk courante, alors cela signifie que la séquence générce est celle qui possède la plus forte probabilité d'avoir été insérée dans la cellu le. Le label cou rant LBk est alors considéré comme étant le label qui a été inséré dans la cellule. En outre, la variable CORk est mise à la valeur de la mesure de corrélation XCk calculée
à l'étape E105.
Si la mesure de corrélation XCk est inférieure à la valeur CORk courante, alors cela signifie que la valeur du label courant n'est pas la plus vraisemblable parmi les valeurs de label déjà testées. Dans ce cas, le label
recherché n'est pas le label courant et la variable CORk est inchangée.
L'étape E106 est suivie de l'étape E107 qui est un test pour vérifier si tous les labels ont été testés. Tant qu'il reste au moins un label à tester, I'étape E107 est suivie de l'étape E108 à laquelle un label suivant est
considéré. L'étape E108 est suivie de l'étape E103 précédemment décrite.
Lorsque tous les labels ont été testés pour la cellule courante, alors l'étape E107 est suivie de l'étape E109 à laquelle la mesure de corrélation
CORk est additionnée à la mesure de corrélation globale CorTO.
L'étape E109 est suivie de l'étape E110 qui est un test pour déterminer si toutes les cellules de l'image ont été traitées. Si la réponse est négative, alors cette étape est suivie de l'étape E111 à laquelle une cellule suivante est considérée. L'étape E111 est suivie de l'étape E101
précédemment décrite.
Lorsque la réponse est positive à l'étape E110, alors la carte de segmentation a été détermince, avec une confiance définie par la corrélation
globale CorTO.
11 est à noter que dans cet exemple, la valeur N. du nombre d'objets vidéos est supposée connue. Cependant, la génération de clé peut être
23 2823630
i ndépendante d u nomb re d'objets vidéos à l 'insertion et lors de l ' extraction de la
carte de segmentation, le nombre d'objets vidéos peut étre inconnu.
Dans ce cas, lors de l'extraction, le nombre de labels testés (étape E107) est fixé arbitrairement, à une valeur suffisamment grande pour garantir que tous les labels possibles sont testés. En effet, si trois objetsvidéos sont présents dans l'image et si seulement deux labels sont testés, les cellules correspondant au troisième objet-vidéo seront incorrectement attribuées aux deux premiers objet-vidéos. Il est donc essentiel de ne pas sous-estimer le
nombre d'objets-vidéos.
Si l'on surestime le nombre d'objet-vidéos, un trop grand nombre de mesures de corrélation (étape E105) seront effectuées. Comme l'insertion est basée sur un algorithme probabiliste, il est possible que des cellules dans lesquelles une séquence est insérée soient plus corrélées avec une autre séquence. Cela se produit par exemple si la cellule initiale (avant insertion) est naturellement corrélée avec l'autre séquence. Dans ce cas, une fausse détection est constatée. Même si ce cas apparaA't rarement, il est intéressant de limiter ce risque de fausse détection. C'est pourquoi on verra dans la suite un
mode de réalisation de détection du nombre d'objet-vidéos.
Un second mode de réalisation d'extraction d'informations supplémentaires est décrit en référence à la figure 11 sous la forme d'un algorithme comportant des étapes E200 à E213. Ce mode de réalisation
correspond au second mode d'insertion décrit en référence à la figure 6.
Dans un premier temps, le nombre d'objet-vidéos N est supposé
connu.
Les étapes E200 et E201 sont respectivement analogues aux étapes
E 100 et E 101 précédemment décrites (figure 10).
L'étape E201 est suivie d'une part par l'étape E202 analogue à l'étape E102 précédemment décrite et d'autre part par l'étape E203 de calcul
de clé. Dans cette étape, la clé est calculée comme à l'étape E15 de la figure 6.
24 2823630
L'étape E203 est suivie des étapes E204, E205 et E206 qui sont respectivement analogues aux étapes E16, E17 et E18 décrites en référence à
la figure 6.
L'étape E206 est suivie des étapes E207 à E213 qui sont respectivement analogues aux étapes E105 à E111 décrite en référence à la
figure 10, mis à part le fait que l'étape E210 est suivie de l'étape E206.
Un troisième mode de réalisation d'extraction d'informations supplémentaires est décrit en référence à la figure 12 sous la forme d'un algorithme comportant des étapes E300 à E316. Ce mode de réalisation correspond au troisième mode d'insertion décrit en référence à la figure 7. Les informations supplémentaires comportent ici une carte de segmentation de
l'image et des messages.
Dans un premier temps, le nombre d'objet-vidéos N. et le nombre N2
de messages sont supposés connus.
Il est avantageux de conna^'tre la valeur exacte du nombre N. d'objetvidéos pour extraire la carte de segmentation, car cela permet de
minimiser les risques de fausse attribution d'un label à une cellule.
En revanche, il est indispensable de conna^tre la valeur exacte du
nombre N2 de messages pour pouvoir les extraire.
Les étapes E300 à E302 sont analogues aux étapes E100 à E102
précédemment décrites (figure 10).
L'étape suivante E303 est le calcul d'une clé. Cette étape est
analogue à l'étape E25 de la figure 7.
L'étape E303 est suivie des étapes E304 et E305 qui sont
respectivement analogues aux étapes E26 et E27 de la figure 7.
L'étape E302 est suivie de l'étape E306 à laquelle une valeur de bit
testé est déterminée. Cette valeur est par exemple -1.
L'étape E306 et l'étape E305 sont suivies de l'étape E307 qui est la sélection d'une séquence en fonction de la valeur du bit testé et du label testé LBk.
2823630
Les étapes suivantes E308 et E309 sont respectivement analogues
aux étapes E105 et E106 précédemment décrites (figure 10).
L'étape suivante E310 est un test pour déterminer si toutes les valeurs de bit ont été testées. Si la réponse est négative, alors cette étape est suivie de l'étape E311 pour considérer le bit de valeur +1. L'étape E311 est
suivie de l'étape E307 précédemment décrite.
Lorsque la réponse est positive à l'étape E310, alors cette étape est suivie de l'étape E312 qui est un test pour vérifier si toutes les valeurs de labels ont été testées. Si la réponse est négative, alors cette étape est suivie de I'étape E313 pour considérer un label suivant. L'étape E313 est suivie de
l'étape E306 précédemment décrite.
Lorsque la réponse est positive à l'étape E312, alors cette étape est suivie des étapes E314 à E316 qui sont respectivement analogues aux étapes
E109 à E111 précédemment décrite.
Lorsque tous les couples (label, valeur binaire) ont été testés, la carte de segmentation et la valeur binaire associée à chaque cellule sont
déterminés, avec une confiance mesurée par la corrélation globale CorTO.
Pour déterminer la vaieur d'un bit d'un message, on détermine tout d'abord les cellules correspondant à ce bit, en fonction de la loi d'association définie à la figure 8. Les valeurs binaires associées à ces cellules sont analysées. Parmi l'ensemble de ces valeurs binaires, la valeur majoritaire est considérce comme la valeur du bit du message considéré. Ces opérations sont
répétées pour tous les bits de tous les messages.
Les messages sont ainsi extraits de l'image.
Da n s les tro is modes de réal isatio n d 'extraction d ' info rm ation s supplémentaires, on a considéré que le nombre N. d'objets-vidéos et le nombre
N2 de messages étaient connus.
On décrit maintenant, en référence à la figure 13, un mode de réalisation de détermination du nombre N' d'objets-vidéos, sous la forme d'un
algorithme comportant des étapes E400 à E406.
26 2823630
L'étape E400 est une initialisation à laqueile une variable CORmax est
initialisée à zéro.
L'étape suivante E401 est une hypothèse sur la valeur du nombre N.. Par exemple, N. = 1. Dans la suite, les valeurs de N. entre 1 et une valeur maximale seront successivement testées. La valeur maximale de N est par exemple fixée de manière empirique, ou dépend de l'algorithme de segmentation, dans le cas o le nombre maximal d'objets vidéos que peut
former l'algorithme de segmentation est connu.
L'étape suivante E402 est l'extraction de la carte de segmentation, selon l'un des modes de réalisation décrits en référence aux figures 10, 11 et 12. Le résultat est une carte de segmentation et une mesure de
corrélation globale CorTO.
L'étape suivante E403 est un test pour déterminer si la mesure de corrélation globale CorTO est supérieure à la variable CORmax Si la réponse est négative et si toutes les hypothèses sur la valeur de N n'ont pas été testées, alors cette étape est suivie de l'étape E404 à laquelle une nouvelle hypothèse sur la valeur de N est considérée. L'étape
E404 est suivie de l'étape E402 précédemment décrite.
Si la réponse est positive à l'étape E403 ou si toutes les hypothèses sur N. ont été testées, cela signifie que le résultat obtenu est le plus vraisemblable. L'étape E403 est alors suivie de l'étape E405 à laquelle la carte de segmentation courante est mémorisée et la valeur de la variable CORmax est
mise à la valeur de la corrélation globale CorTO.
Si toutes les hypothèses sur la valeur du nombre N. n'ont pas été testées, alors l'étape E405 est suivie de l'étape E406 à laquelLe une nouvelle hypothèse sur la valeur de N' est considérée. L'étape E406 est suivie de
l'étape E402 précédemment décrite.
27 2823630
Lorsque toutes les hypothèses sur la valeur du nombre N. ont été testées, la carte de segmentation finale est la dernière qui a été mémorisée lors
du passage par l'étape E405.
Pour déterminer aussi le nombre de message N2, les hypothèses sur le nombre N' sont remplacces par des hypothèses sur le couple (N, N2). Bien entendu, la présente invention n'est nullement limitée aux modes de réalisation décrits et représentés, mais englobe, bien au contraire,
toute variante à la portée de l'homme du métier.
28 2823630

Claims (36)

REVENDICATIONS
1. Procédé d'insertion dans un signal numérique (IM) de données représentatives d'une segmentation du signal, caractérisé en ce qu'il comporte les étapes de: - segmentation (E2) du signal, - formation (E1) de cellules (Ck) dans le signal, - association (E3) d'un label (L) à chacune des cellules en fonction de la segmentation, - insertion (E7) dans chacune des cellules de données
représentatives du label associé à la cellule.
2. Procédé selon la revendication 1, caractérisé en ce que l'insertion comporte pour chaque cellule les étapes de: - calcul (E5) d'une clé de codage (K) en fonction du label associé à la cellule, - génération (E6) d'une séquence pseudo-aléatoire en fonction de la clé de codage,
- insertion (E7) de la séquence pseudo-aléatoire dans la cellule.
3. Procédé selon la revendication 2, caractérisé en ce que la clé de
codage (K) dépend en outre de la position (x, y) de la cellule dans le signal.
4. Procédé selon la revendication 2 ou 3, caractérisé en ce que la clé
de codage (K) dépend en outre d'une clé secrète prédétermince(Ks).
5. Procédé selon l'une quelconque des revendications 2 à 4,
caractérisé en ce que la clé de codage (K) dépend en outre du nombre d'objets
(N') déterminés dans le signal lors de l'étape de segmentation.
29 2823630
6. Procédé selon l'une quelconque des revendications 1 à 5,
caractérisé en ce qu'il comporte en outre l'insertion d'un nombre prédéterminé
(N2) de messages dans le signal.
7. Procédé selon la revendication 6, caractérisé en ce que la clé de codage (K) dépend en outre du nombre (N2) de messages à insérer dans le signal.
8. Procédé d'extraction de donnces représentatives de la segmentation d'un signal, insérées dans ledit signal par le procédé selon l'une
quelconque des revendications 1 à 7, caractérisé en ce qu'il comporte les
étapes de: - formation (E100) de cellules dans le signal, - considération (E102, E108) d'un ensemble de labels à tester (LBk), - calcul (E105) d'une corrélation entre chaque cellule et de données représentatives de chaque label testé, - détermination (E106) de la mesure de corrélation la plus grande
pour chaque cellule.
9. Procédé selon la revendication 8, caractérisé en ce que i'extraction comporte pour chaque cellule les étapes de: - caloul (E103) d'une clé de codage en fonction de chaque label testé, - génération (E104) d'une séquence pseudo-aléatoire en fonction de
chaque clé de codage.
10. Procédé selon la revendication 9, caractérisé en ce que la clé de
codage dépend en outre de la position de la cellule dans le signal.
11. Procédé selon la revendication 9 ou 10, caractérisé en ce que la
clé de codage dépend en outre d'une clé secrète prédétermince.
2823630
12. Procédé selon l'une quelconque des revendications 9 à 11,
caractérisé en ce que la clé de codage dépend en outre du nombre (N')
d'objets du signal.
13. Procédé selon l'une quelconque des revendications 9 à 12,
caractérisé en ce qu'il comporte en outre l'extraction d'un nombre prédéterminé
(N2) de messages dans le signal.
14. Procédé selon la revendication 13, caractérisé en ce que la clé
de codage dépend en outre du nombre (N2) de messages à extraire du signal.
15. Procédé selon l'une quelconque des revendications 9 à 14,
caractérisé en ce qu'il comporte la détermination du nombre d'objets
précédemment déterminés lors de la segmentation du signal.
16. Procédé selon la revendication 14, caractérisé en ce qu'il
comporte la détermination du nombre de messages à extraire du signal.
17. Dispositif d'insertion dans un signal numérique (IM) de données représentatives d'une segmentation du signal, caractérisé en ce qu'il comporte: - des moyens (2) de segmentation du signal, - des moyens (3) de formation de cellules (Ck) dans le signal, - des moyens (4) d'association d'un label (L) à chacune des cellules en fonction de la segmentation, des moyens (5) d'insertion dans chacune des cellules de données
représentatives du label associé à la cellule.
18. Dispositif selon la revendication 17, caractérisé en ce que les moyens (4) d'insertion comportent: - des moyens de calcul d'une clé de codage pour chaque cellule, en fonction du label associé à la cellule,
31 2823630
- des moyens de génération d'une séquence pseuJo-aléatoire en fonction de la clé de codage, - des moyens d'insertion de la séquence pseudoaléatoire dans la cellule. ,
19. Dispositif selon la revendication 18, caractérisé en ce que les moyens de calcul de la clé de codage (K) sont adaptés à la calculer en fonction
en outre de la position (x, y) de la cellule dans le signal.
20. Dispositif selon la revendication 18 ou 19, caractérisé en ce que les moyens de calcul de la clé de codage (K) sont adaptés à la calculer en
fonction en outre d'une clé secrète prédéterminée (Ks).
21. Dispositif selon l'une quelconque des revendications 18 à 20,
caractérisé en ce que les moyens de calcul de la clé de codage (K) sont adaptés à la calculer en fonction en outre du nombre (N) d'objets déterminés
dans le signal par les moyens de segmentation.
22. Dispositif selon l'une quelconque des revendications 17 à 21,
caractérisé en ce qu'il comporte en outre des moyens d'insertion d'un nombre
prédéterminé (N2) de messages dans le signal.
23. Dispositif selon la revendication 22, caractérisé en ce que les moyens de calcul de la clé de codage (K) sont adaptés à la calculer en fonction
en outre du nombre (N2) de messages à insérer dans le signal.
24. Dispositif d'extraction de données représentatives de la segmentation d'un signal, insérées dans ledit signal par le dispositif selon l'une
quelconque des revendications 1 7 à 23, caractérisé en ce qu'il comporte:
- des moyens (11) de formation de cellules dans le signal, - des moyens (12) de considération d'un ensemble de labels à tester,
32 2823630
- des moyens (13) de calcul d'une corrélation entre chaque cellule et de données représentatives de chaque label testé, - des moyens (14) de détermination de la mesure de corrélation la
plus grande pour chaque cellule.
25. Dispositif selon la revendication 24, caractérisé en ce qu'il comporte: - des moyens de calcul d'une clé de codage pour chaque cellule, en fonction de chaque label testé, - des moyens de génération d'une séquence pseudo-aléntoire en
fonction de chaque clé de codage.
26. Dispositif selon la revendication 25, caractérisé en ce que les moyens de calcul de la clé de codage sont adaptés à la calculer en fonction en
outre de la position de la cellule dans le signal.
27. Dispositif selon la revendication 25 ou 26, caractérisé en ce que les moyens de calcul de la clé de codage sont adaptés à la calculer en fonction
en outre d'une clé secrète prédéterminée.
28. Dispositif selon l'une quelconque des revendications 25 à 27,
caractérisé en ce que les moyens de calcul de la clé de codage sont adaptés à
la calculer en fonction en outre du nombre d'objets du signal.
29. Dispositif selon l'une quelconque des revendications 24 à 28,
caractérisé en ce qu'il comporte en outre des moyens (13, 14) d'extraction d'un
nombre prédéterminé de messages dans le signal..
30. Dispositif selon la revendication 29, caractérisé en ce que les moyens de calcul de la clé de codage sont adaptés à la calculer en fonction en
outre du nombre de messages à extraire du signal.
33 2823630
31. Dispositif selon l'une quelconque des revendications 24 à 30,
caractérisé en ce qu'il comporte des moyens de détermination du nombre
d'objets précédemment déterminés lors de la segmentation du signal.
32. Dispositif selon la revendication 29, caractérisé en ce qu'il comporte des moyens de détermination du nombre de messages à extraire du signal.
33. Dispositif d'insertion selon l'une quelconque des revendications
17 à 23, caractérisé en ce que les moyens de segmentation, formation, association et insertion sont incorporés dans: - un microprocesseur (100), - une mémoire morte (102) comportant un programme pour traiter les données, et - une mémoire vive (103) comportant des registres adaptés à
en registrer des variables modifiées au cou rs de l'exécution d ud it prog ramme.
34. Dispositif d'extraction selon l'une quelconque des revendications
24 à 32, caractérisé en ce que les moyens de formation, considération, calcul et détermination sont incorporés dans: - un microprocesseur (100), - une mémoire morte (102) comportant un programme pour traiter les données, et - une mémoire vive (103) comportant des registres adaptés à
en registrer des variables modifiées au cou rs de l'exécution d ud it prog ramme.
35. Appareil de traitement (10) d'un signal numérique, caractérisé en ce qu'il comporte des moyens adaptés à mettre en _uvre le procédé selon
l'une quelconque des revendications 1 à 16.
36. Appareil de traitement (10) d'un signal numérique, caractérisé en
ce qu'il comporte le dispositif Solon l'une quelconque des revendications 17 à
34.
FR0105042A 2001-04-12 2001-04-12 Association d'informations de segmentation a un signal numerique Expired - Fee Related FR2823630B1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR0105042A FR2823630B1 (fr) 2001-04-12 2001-04-12 Association d'informations de segmentation a un signal numerique

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0105042A FR2823630B1 (fr) 2001-04-12 2001-04-12 Association d'informations de segmentation a un signal numerique

Publications (2)

Publication Number Publication Date
FR2823630A1 true FR2823630A1 (fr) 2002-10-18
FR2823630B1 FR2823630B1 (fr) 2003-07-18

Family

ID=8862283

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0105042A Expired - Fee Related FR2823630B1 (fr) 2001-04-12 2001-04-12 Association d'informations de segmentation a un signal numerique

Country Status (1)

Country Link
FR (1) FR2823630B1 (fr)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0852441A1 (fr) * 1996-06-20 1998-07-08 Ibm Japan Ltd. Procede permettant de cacher des donnees et procede permettant d'extraire des donnees
EP1043687A1 (fr) * 1999-04-09 2000-10-11 Canon Kabushiki Kaisha Méthode pour déterminer une partition de façon à insérer un filigranne et méthodes associées d'insertion et de décodage

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0852441A1 (fr) * 1996-06-20 1998-07-08 Ibm Japan Ltd. Procede permettant de cacher des donnees et procede permettant d'extraire des donnees
EP1043687A1 (fr) * 1999-04-09 2000-10-11 Canon Kabushiki Kaisha Méthode pour déterminer une partition de façon à insérer un filigranne et méthodes associées d'insertion et de décodage

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHOONG-HOON LEE ET AL: "Adaptive digital image watermarking using variable size of blocks in frequency domain", TENCON 99. PROCEEDINGS OF THE IEEE REGION 10 CONFERENCE CHEJU ISLAND, SOUTH KOREA 15-17 SEPT. 1999, PISCATAWAY, NJ, USA,IEEE, US, 15 September 1999 (1999-09-15), pages 702 - 705, XP010368265, ISBN: 0-7803-5739-6 *
PIVA A ET AL: "A DWT-based object watermarking system for MPEG-4 video streams", PROCEEDINGS 2000 INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (CAT. NO.00CH37101), PROCEEDINGS OF 7TH IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, VANCOUVER, BC, CANADA, 10-13 SEPT. 2000, 2000, Piscataway, NJ, USA, IEEE, USA, pages 5 - 8 vol.3, XP002187810, ISBN: 0-7803-6297-7 *
SWANSON M D ET AL: "Object-based transparent video watermarking", MULTIMEDIA SIGNAL PROCESSING, 1997., IEEE FIRST WORKSHOP ON PRINCETON, NJ, USA 23-25 JUNE 1997, NEW YORK, NY, USA,IEEE, US, 23 June 1997 (1997-06-23), pages 369 - 374, XP010233851, ISBN: 0-7803-3780-8 *
WEN-NUNG LIE ET AL: "Digital watermarking for object-based compressed video", ISCAS 2001. THE 2001 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS (CAT. NO.01CH37196), ISCAS 2001. THE 2001 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS, SYDNEY, NSW, AUSTRALIA, 6-9 MAY 2001, 2001, Piscataway, NJ, USA, IEEE, USA, pages 49 - 52 vol. 2, XP002187811, ISBN: 0-7803-6685-9 *

Also Published As

Publication number Publication date
FR2823630B1 (fr) 2003-07-18

Similar Documents

Publication Publication Date Title
EP3070678B1 (fr) Procédé de génération d&#39;une séquence vidéo cyclique
FR2817440A1 (fr) Insertion de messages dans des donnees numeriques
FR2907239A1 (fr) Procede de recherche et de reconnaissance rapides d&#39;une image numerique representative d&#39;au moins un motif graphique dans une banque d&#39;images numeriques
EP1473944A2 (fr) Procédé de tatouage d&#39;une séquence vidéo à sélection adaptative de la zone d&#39;insertion du tatouage, procédé de détection, dispositifs, support de données et programmes d&#39;ordinateur correspondants.
FR2812502A1 (fr) Insertion et extraction de message dans des donnees numeriques
FR2803676A1 (fr) Determination d&#39;une segmentation d&#39;un signal numerique pour inserer des signaux de marquage et insertion associee
EP1340103B8 (fr) Procede pour detecter des corps nouveaux dans une scene eclairee
EP1416737B1 (fr) Procédé de tatouage d&#39;un signal vidéo, système et support de données pour la mise en oeuvre de ce procédé, procédé et système d&#39;extraction de ce tatouage
FR2823630A1 (fr) Association d&#39;informations de segmentation a un signal numerique
FR2834852A1 (fr) Procede et dispositif de segmentation temporelle d&#39;une sequence video
FR2790124A1 (fr) Procede de marquage d&#39;un document multimedia, tel qu&#39;une image, par generation d&#39;une empreinte externe
EP2364489A1 (fr) Procédé et dispositif pour l&#39;enfouissement d&#39;une séquence binaire dans un flux video compressé
EP2082336B1 (fr) Procede de recherche et de reconnaissance rapides d&#39;une image numerique representative d&#39;au moins un motif graphique dans une banque d&#39;images numeriques
FR2792153A1 (fr) Procede de determination d&#39;une partition pour inserer un signal de marquage et procede de decodage associe
FR3147653A1 (fr) Procédé de tatouage numérique d’une image et procédé de détection associé
FR2789783A1 (fr) Procede d&#39;insertion et d&#39;extraction d&#39;une signature numerique
FR2820928A1 (fr) Estimation de la capacite d&#39;un signal numerique pour l&#39;insertion d&#39;un message
WO2023247208A1 (fr) Procede de segmentation d&#39;une pluralite de donnees, procede de codage, procede de decodage, dispositifs, systemes et programme d&#39;ordinateur correspondants
FR2875627A1 (fr) Procede de determination d&#39;un descripteur d&#39;image, procede de comparaison d&#39;images, procede de recherche d&#39;image et dispositifs associes
EP1326205A1 (fr) Détection optimisée d&#39;un marquage au sein d&#39;un signal d&#39;information
FR2795585A1 (fr) Procede de determination d&#39;une partition pour inserer un signal de marquage et procede d&#39;insertion associe
FR2860378A1 (fr) Procede et dispositif de verification d&#39;entites multimedia, notamment pour la verification des images numeriques
WO2005096614A2 (fr) Procede et dispositif de detection du tatouage d’un signal numerique
FR2860377A1 (fr) Procede et dispositif de verification d&#39;entites multimedia, notamment pour la verification des images numeriques
FR2789784A1 (fr) Procede d&#39;insertion et d&#39;extraction d&#39;une signature numerique

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20131231