WO2007071883A2

WO2007071883A2 - Procede et systeme de traitement de donnes numeriques

Info

Publication number: WO2007071883A2
Application number: PCT/FR2006/051389
Authority: WO
Inventors: Bruno Liege
Original assignee: Dxo Labs
Priority date: 2005-12-19
Filing date: 2006-12-19
Publication date: 2007-06-28
Also published as: FR2895103A1; JP6085405B2; KR20080087840A; EP1963971A2; CN101379468A; FR2895103B1; US8429625B2; JP2009524854A; US20090228677A1; WO2007071883A3; KR101391465B1

Abstract

L' invention se rapporte à un procédé et à un système de traitement de données formatées génériques (12) , comprenant des premières données (14) décrivant une séquence d'opérations génériques ne comportant pas de boucle, en vue de fournir des données formatées spécifiques (18) , pour une plate-forme déterminée (20) comportant Q processeur (s) et au moins une mémoire, la plate-forme étant destinée à traiter, en fonction directement ou indirectement des données formatées spécifiques (18), un objet (22) constitué d'informations élémentaires de même nature, chaque information élémentaire étant représentée par au moins une valeur numérique.

Description

PROCEDE ET SYSTEME DE TRAITEMENT DE DONNEES NUMERIQUES

La présente invention concerne un procédé et un système de traitement de données formatées génériques en vue de fournir des données formatées spécifiques à une plateforme de traitement. Les données formatées spécifiques peuvent être fournies directement ou indirectement en utilisant un compilateur pour générer un code binaire adapté à la plateforme à partir des données formatées spécifiques.

Actuellement, les algorithmes de traitement d'objets sont généralement écrits dans un langage connu, tel que le C, l'assembleur ou le VHDL, et sont ensuite compilés ou traduits en binaire avant d'être utilisés par une plateforme destiné à effectuer le traitement.

Les compilateurs utilisés sont des compilateurs spécifiques à un type de langage.

Dans l'exemple d'un compilateur C, qui est un des plus courants, le code en C est traduit pour être compréhensible, par exemple, pour un ordinateur personnel de type PC ou de type MAC. Cette compilation dépend de la plateforme pour laquelle l'algorithme est compilé. Les processeurs de ces deux plateformes ayant des caractéristiques similaires, il est possible d'écrire des algorithmes de traitement compatibles avec les deux plateformes .

D'autre part, dans un algorithme codé en C, le programmeur doit définir, dès le départ, différentes parties du code dépendantes de la plateforme telles que la décomposition de l'objet en sous-objets, les boucles, l'ordre de traitement des informations élémentaires et sous-objets, l'organisation des données en mémoire, notamment pour permettre les accès à des données de différentes positions et le changement d'échelle, les échanges de données entre mémoires, la gestion des bords.

Ces parties du code dépendantes de la plateforme étant déterminées a priori par un programmeur, en fonction de la plateforme et de l'algorithme, elles doivent être optimisées « à la main » pour chaque combinaison algorithme + plateforme. De plus, puisqu'elles sont définies explicitement, et mélangées avec le code décrivant l'algorithme lui-même, le compilateur peut très difficilement faire abstraction de ces parties du code dépendantes de la plateforme pour les adapter lui-même à une autre plateforme.

Par exemple, dans le cas d'un processeur de traitement du signal disposant d'une petite mémoire locale et devant recopier les données depuis et vers la mémoire principale à partir de cette mémoire locale, cette copie doit être ajoutée à la main et remet profondément en cause la structure des boucles et des données en mémoire. Par exemple encore, un processeur vectoriel, notamment de type SIMD (Single Instruction Multiple Data) doit traiter des données groupées par vecteurs de tailles différentes selon la plateforme et, les vecteurs n'étant pas exprimables de manière indépendante de la plateforme lorsqu'on utilise un langage tel que le langage C, il faut donc coder en assembleur de manière dépendante de la plateforme.

D'autre part, lorsque l'on modifie un algorithme, notamment en terme d'accès à des données à diverses positions, cela remet en cause, au moins partiellement, les différentes parties du code dépendantes de la plateforme.

Il est donc très difficile d'optimiser la taille du code, la taille de la mémoire et le nombre d'instructions nécessaires, sans passer un temps considérable pour optimiser chaque combinaison algorithme + plateforme. En effet, chaque plateforme a ses propres caractéristiques, tant en terme de matériel (par exemple le nombre et le type de processeurs, ou la taille et le type de mémoire), qu'en terme de langage utilisé (C pour un processeur scalaire et assembleur pour un processeur vectoriel) .

Afin de résoudre ce problème, il est connu d'utiliser des librairies de bas niveau capables d'effectuer divers traitements sur des blocs physiques, tels que des convolutions, des multiplications, ou encore l'application de tables de correspondance. Ceci permet de n'optimiser qu'une fois ces librairies pour chaque plateforme. Cette méthode présente toutefois de nombreux inconvénients :

- la taille des librairies, et donc du code, est importante,

- compte tenu du temps d'appel à des librairies, il faut utiliser des blocs physiques de taille relativement importante, ce qui se traduit par une utilisation mémoire importante, - les boucles internes sur les informations élémentaires se trouvant à l'intérieur des librairies, il n'est pas possible d'optimiser des séquences d'opérations, et les performances sont ainsi limitées,

- les blocs physiques sont stockés en mémoire, ce qui se traduit par une utilisation intensive de la mémoire et beaucoup de temps passé à écrire et lire des données intermédiaires depuis la mémoire, et

- ces librairies sont optimisées pour un nombre limité de plateformes, souvent par un fabricant de processeurs et ne sont donc pas disponibles pour tous les types de plateformes .

L'invention a donc pour objet de proposer un procédé de traitement de données tel qu'il permet d'optimiser automatiquement pour plusieurs plateformes, avec une grande vitesse d'exécution, une faible utilisation mémoire et une faible taille de code, tout algorithme de traitement d'objet composé d' un grand nombre d' informations élémentaires différentes, codé dans un langage adapté à ce type d'algorithmes. L'invention permet notamment d'accélérer la mise sur le marché de matériel et de logiciels de traitement de données, notamment des images, en obtenant automatiquement et rapidement une implémentation optimisée pour diverses plateformes d'un algorithme quelconque, et en permettant une modification de l'algorithme le plus tard possible. Dans le cas d'un appareil de capture d'image, par exemple, cette modification tardive permet de s'adapter rapidement à un nouveau capteur, dont les caractéristiques, notamment de bruit, qui croit avec la miniaturisation, évoluent très vite.

L'invention concerne un procédé de traitement de données formatées génériques, comprenant des premières données décrivant une séquence d'opérations génériques ne comportant pas de boucles, en vue de fournir, directement ou indirectement, des données formatées spécifiques, pour une plateforme déterminée comportant Q processeur (s) et au moins une mémoire, la plateforme étant destinée à traiter, en fonction des données formatées spécifiques, un objet constitué d'informations élémentaires de même nature, chaque information élémentaire étant représentée par au moins une valeur numérique.

Le procédé comprend les étapes suivantes :

- l'étape de traduire la séquence d'opérations génériques en opérations spécifiques, en fonction de la plateforme, - l'étape de déterminer l'ensemble des boucles nécessaires au traitement en fonction de la topologie de l'objet, et de manière indépendante des premières données, - l'étape de calculer les données formatées spécifiques comprenant la séquence d'opérations spécifiques et les boucles ainsi déterminées, et permettant, directement ou indirectement, de traiter l'objet, conformément aux données formatées génériques, la séquence étant optimisée pour la plateforme en terme de taille de code et/ou de taille mémoire, et/ou temps de calcul. Les données formatées spécifiques comprennent la séquence d'opérations spécifiques ainsi déterminée.

II est connu d'utiliser un compilateur pour traduire des séquence d' opérations qui comportent des boucles et des tableaux: la traduction mettant en oeuvre un graphe décrivant le lien entre les opérations à l'intérieur d'une même itération de boucle et d'une itération de boucle à l'autre, en particulier les dépendances sur les indices d'accès à un des éléments de tableaux, la traduction comportant des optimisations qui modifient les boucles préexistantes - la traduction comportant l'étape de modifier l'organisation de tableaux et/ou de modifier les opérations utilisant les tableaux afin de s'adapter aux caractéristiques de la plateforme

Les caractéristiques de la séquence d' opérations génériques utilisée (nature des première et secondes données) permettent de s'affranchir de la dépendance des boucles avec les opérations et avec le graphe des opérations . la séquence d'opérations génériques utilisée ne met pas en œuvre de tableaux ni d'indice d'accès à un élément de tableau, et en particulier le procédé ou système selon l'invention ne comporte l'étape de modifier l'organisation de tableaux et/ou de modifier les opérations utilisant les tableaux. L'invention permet ainsi d'obtenir directement, sans besoin d'optimisation spécifique des boucles pour chaque séquence d'opérations, ni utilisation de graphe, un code optimal qui utilise les Q processeurs à 100%. Ceci est une caractéristique particulièrement difficile à obtenir. L'invention permet d'atteindre 100% grâce à : l'organisation des boucles indépendante des premières données l'organisation des données en mémoire qui n'est pas sous forme de tableaux mais par exemple sous forme de files tel que décrit ci-après l'utilisation de chaînage comportant des unités de calculs et une file, tel que décrit ci-après

- par exemple le document « Compiler transformations for high performance Computing » « ACM Computing Surveys, New York, NY US, vol 26, no. 4, décembre 1994 » indique que le taux d'utilisation des processeurs donné par la formule U=F/ST est sensiblement plus bas que 100%(p351), le taux de 100% étant considéré comme idéal ; le procédé et système selon l ' invention permet d'atteindre 100% pour tout type d'algorithme de traitement d'objets composés d'informations de même nature;

L'invention permet également de réduire fortement l'utilisation de la mémoire en permettant de traiter les informations élémentaires selon un mode de parcours adapté afin de traiter les données un sous-objet à la fois, ce quelle que soit la taille du sous-objet, ce qui évite de stocker dans le cas d'une image un grand nombre de lignes avant de commencer les traitements sur un bloc.

On va maintenant décrire un exemple de traduction de la séquence d' opérations génériques en une séquence d' opérations spécifiques. Dans cet exemple : les objets sont des images en deux dimensions horizontales et verticales monochromatique, les informations élémentaires étant représentées par une seule valeur numérique la séquence d' opérations générique est la suivante : o appliquer un filtre Fl vertical 3*1 suivi d'un filtre F2 horizontal 1*3 la séquence d'opération spécifique est traduite en la séquence d'opérations spécifique suivante : o stocker dans Rl un sous-objet obtenu depuis une file d' entrée o calculer Fl. Cl * Rl et stocker le résultat dans R2 o effectuer UP(Rl) et stocker le résultat dans Rl o calculer Fl. C2 * Rl et stocker le résultat dans R2 o effectuer UP(Rl) et stocker le résultat dans Rl o calculer Fl. C3 * Rl et stocker le résultat dans R2 o calculer F2.C1 * R2 et stocker le résultat dans R3 o effectuer LEFT (R2) et stocker le résultat dans R2 o calculer F2.C2 * R2 et stocker le résultat dans R3 o effectuer LEFT (R2) et stocker le résultat dans R2 o calculer F2.C3 * R2 et stocker le résultat dans R3 - Rl, R2, R3 sont des registres permettant de stocker chacun les N informations élémentaires d'un sous-objet ou les N résultats d'une même opération spécifique effectuée pendant le traitement d'un même sous-objet

Fl. Cl, Fl. C2, Fl. C3 étant des paramètres correspondant aux coefficients du filtre Fl

F2.C1, F2.C2, F2.C3 étant des paramètres correspondant aux coefficients du filtre F2

- LEFT(Rl) peut être implémenté en utilisant un chaînage selon la dimension horizontale comprenant une file FiIeH tel que décrit plus bas ; par exemple : o Si les sous objets sont composés de 4 pixels disposés horizontalement et un registre contient 4 données de gauche à droite Rl.1, Rl.2, Rl.3 et Rl.4 : LEFT(Rl) signifie écrire Rl .4 dans FiIeH, écrire Rl .3 dans Rl.4, écrire Rl.2 dans Rl.3, écrire Rl.1 dans Rl.3, pour le premier sous-objet d'une ligne Rl.1 est inchangé sinon Rl .1 reçoit une donnée lue dans FiIeH - UP (R2) peut être implémenté en utilisant un chaînage selon la dimension verticale comprenant une file FiIeV tel que décrit plus bas o Si les sous objets sont composés de 4 pixels disposés horizontalement et un registre contient 4 données de gauche à droite Rl.1, Rl.2, Rl.3 et Rl.4 : UP(Rl) signifie écrire Rl .4 dans FiIeV, écrire Rl .3 dans Rl.4, écrire Rl.2 dans Rl.3, écrire Rl.1 dans Rl.3, pour les objets de la première ligne de l'image Rl.1 est inchangé sinon Rl .1 reçoit une donnée lue dans FiIeV

Dans l'exemple, la traduction de la séquence d'opérations génériques en une séquence d'opérations spécifiques est indépendante du mode de parcours tel que défini ci-après . On peut alors déterminer un mode de parcours (24) des informations élémentaires dans la plateforme en fonction de l'architecture de cette plateforme (22) et en fonction de la topologie de l'objet et de manière indépendante des premières données, la détermination de ce mode de parcours comprenant le choix et/ou calcul : d'un groupement d'informations élémentaires en sous- objets, comprenant chacun un nombre N d'informations élémentaires , déterminé en fonction de la plateforme, le traitement dans la plateforme consistant à démarrer périodiquement un sous-traitement, qui consiste à appliquer la séquence d'opérations spécifiques sur l'un des sous-objets, de la forme et du recouvrement des sous-objets, déterminés en fonction de la plateforme, de l'ordre de traitement des sous-objets, déterminé en fonction de la plateforme.

De préférence, déterminer l'ensemble des boucles signifie déterminer sur quoi porte chaque boucle l'imbrication de l'ensemble des boucles, le nombre d'itération étant déterminé en fonction de l'objet. Par exemple dans le cas d'une image à deux dimensions horizontale et verticale, dans le cas où Q = 4 et dans le cas où les 4 processeurs traitent 4 pixels contigus d'une même ligne, on peut déterminer les boucles suivantes :

- pour chaque ligne de haut en bas

- pour chaque groupe de 4 pixels de gauche à droite effectuer la séquence d'opérations spécifique sur le groupe de 4 pixels en effectuant simultanément la même opération spécifique sur les 4 processeurs

Dans cet exemple, le nombre d' itération dépend de la taille de l'image. Par contre on a déterminé l'ensemble des boucles nécessaires au traitement en fonction de l'architecture de la plateforme et en fonction de la topologie de l'objet, et de manière indépendante des premières données. Par exemple les boucles sont utilisables pour une quelconque des séquences d'opérations génériques suivantes :

- appliquer un filtre Fl vertical 3*1 suivi d'un filtre F2 horizontal 1*3 - ajouter la constante 3 aux informations élémentaires ou toute autre séquence d' opérations génériques

Selon l'invention, une boucle peut être notamment sans que la liste soit limitative : une boucle exécutée un certain nombre de fois, une boucle s'exécutant tant qu'une condition est vérifiée, une boucle s'exécutant jusqu'à ce qu'un condition soit vérifiée, de manière générale une exécution itérative liée à une ou plusieurs conditions de sortie de la boucle.

On va maintenant définir la notion de file selon 1' invention.

Une file permet de transmettre et/ou stocker des informations élémentaires ou des résultats d' opérations spécifiques .

Une file peut comporter ou utiliser une mémoire.

Une file peut être implémentée à l'aide de un ou plusieurs processus de type FIFO (« First in first out » en anglais) . Une file comporte au moins une entrée et au moins une sortie.

- Une file peut être connectée fonctionnellement par tout moyen à une unité de calcul en entrée et une unité de calcul en sortie. - Une file peut être également connectée fonctionnellement par tout moyen à PR unités de calcul en entrée et PR unités de calcul en sortie, dans ce cas la file se comporte comme PR files reliant chacune une unité de calcul d'entrée avec une unité de calcul en sortie. De préférence, une file permet de gérer de manière indépendante plusieurs flux de données, chaque flux étant associé à une opération spécifique déterminée.

Dans une réalisation, il est possible de lire et écrire simultanément dans une file. De préférence une file utilise au moins une unité de mémoire permettant de stocker, pour chaque flux, un nombre NF identique de données .

De préférence NF est déterminé en fonction de la disposition relative des sous-objets et du mode de parcours, de sorte que NF-I sous-objets soient traités entre le traitement d'un sous- objet produisant une donnée et le traitement du sous-objet utilisant la donnée.

De préférence, un chaînage comprenant des unités de calcul et une file comprend un mécanisme permettant de gérer l'amorçage : la file est initialisée régulièrement, par exemple en début de chaque ligne si la file fait partie d'un chaînage horizontal et l'objet est une image ; tant que la file ne comprend pas NF données, le processeur qui suit la file dans le chaînage, prend en entrée la donnée qu'il envoie en sortie ; ensuite, le processeur qui suit la file dans le chaînage prend en entrée la donnée la plus ancienne dans la file et la retire de la file. De préférence la file permet de sortir les données dans le même ordre qu'elles ont été entrées dans la file. De préférence, le chaînage circulaire est unidirectionnel. De préférence, le chaînage circulaire est tel qu'il y a un seul lien en entrée et un seul lien en sortie par unité de calcul.

L' utilisation d' au moins une file permet ainsi de transmettre les résultats d'opérations spécifiques nécessaires au calcul d'au moins un autre sous-objet.

Dans la présente description, des données formatées génériques sont des données numériques permettant de décrire un traitement à apporter sur un objet par une plateforme de traitement de données, indépendamment de la plateforme elle- même. Dans le cadre de l'invention, les objets traités correspondent à un ensemble d' informations élémentaires de même nature ; ces objets sont, par exemple, des images, des sons numérisés, de la vidéo ou encore des données de simulation.

Dans une réalisation, les données formatées génériques comprennent des secondes données se rapportant à la position relative, selon au moins une dimension de l'objet, notamment spatiale et/ou temporelle, des blocs et/ou des paramètres les uns par rapport aux autres, et/ou se rapportant à l'échelle relative, selon au moins une dimension de l'objet notamment spatiale et/ou temporelle, des blocs logiques et/ou des paramètres les uns par rapport aux autres .

Dans une réalisation, les objets et sous-objets, ainsi que les blocs logiques, ont plusieurs dimensions.

Les dimensions des sous-objets et des blocs logiques correspondent à toutes ou une partie des dimensions de l'objet. Les dimensions peuvent être de diverses natures, notamment : -spatiale, par exemple une distance, un angle ou un parcours dans un maillage, -temporelle,

-fréquentielle, par exemple une couleur, une fréquence, une bande de fréquence -une phase, -une décomposition selon une base d'espace vectoriel, par exemple une décomposition en ondelettes, ou une décomposition en poids forts, poids faibles

-de manière générale, les dimensions de tout espace de topologie quelconque.

La liste suivante, non limitative, donne des exemples d'objets avec leurs dimensions :

-une image fixe avec 2 dimensions, correspondant chacune à des distances, notamment mesurée en pixels,

-une image fixe brute avec 2 dimensions, correspondant chacune à des distances, les pixels étant chacun doté d'une couleur, par exemple rouge, vert, ou encore bleu,

-une image fixe en couleur, avec 2 dimensions, correspondant chacune à des distances, et une dimension correspondant à une fréquence représentant le canal couleur, par exemple rouge/vert/bleu,

-une image animée avec 3 dimensions, correspondant, pour 2 d'entre elles, à des distances, notamment mesurées en pixels et, pour une d'entre elles, au temps,

-une image en relief avec 3 dimensions, correspondant à des distances,

-une image en relief avec 3 dimensions, correspondant , pour 2 d'entre elles, à des distances, et, pour la troisième, à un angle de vue,

-une image médicale avec des dimensions de distance et éventuellement des dimensions de canal,

-un hologramme avec des dimensions d'angle de vue,

-de manière plus générale, une image avec des dimensions de distance et/ou d'angle et/ou temporelle, et/ou fréquentielle,

-un son avec une dimension correspondant au temps,

-un son avec 2 dimensions correspondant au temps et à un canal, -un signal modulé avec une ou plusieurs dimensions correspondant au temps et éventuellement une fréquence et éventuellement une position dans l'espace ou un angle,

-la modulation et démodulation de signal, la mesure, l'analyse de données, l'indexation ou la recherche dans une base de données, la vision par ordinateur, le traitement graphique, la simulation représentés par des informations élémentaires disposées selon une ou plusieurs dimensions,

-de manière plus générale, un objet avec une ou plusieurs dimensions.

Dans le cadre de l'invention, les informations élémentaires d'un objet peuvent avoir une position et/ou une échelle, absolue notamment spatiale et/ou temporelle et/ou fréquentielle mais également selon au moins une dimension de l'objet ainsi que dans tout autre espace, notamment un espace constitué d' ondelettes :

- une information élémentaire d'un objet « son » peut correspondre à une intensité ; dans ce cas, l'information élémentaire a une position absolue correspondant à un instant donné et, dans le cas d'un son multicanaux, pour un canal donné.

- une information élémentaire d'un objet « image » peut correspondre à un pixel ; dans ce cas, l'information élémentaire a une position absolue correspondant à une position dans l'image et, dans le cas d'une image vidéo, à un instant donné.

- une information élémentaire d'un objet « donnée de simulation » peut correspondre à un état ; dans ce cas, l'information élémentaire a une position absolue correspondant à un nœud de maillage et à un instant donné. - une information élémentaire d'un objet « signal modulé » peut correspondre à une intensité et/ou une phase; dans ce cas, l'information élémentaire a une position absolue correspondant à un instant donné et, éventuellement, à une fréquence donnée et/ou à une position donnée si plusieurs antennes ou émetteurs sont utilisés. Une information élémentaire est un élément d' information à traiter, représenté par une ou plusieurs valeurs numériques . Ces informations peuvent être codées selon divers types de codage tels que le codage sur 8 bits, le codage sur 10 bits ou encore le codage sur 16 bits signé. Dans le cas où l'objet est une image, par exemple, les informations élémentaires seront les pixels de cette image.

Les objets peuvent être des images brutes (de type « raw ») avant opération de dématriçage (« demosaicing » en anglais) , auquel cas :

- dans une variante, une information élémentaire est un pixel représenté par une valeur numérique correspondant, selon la position absolue du pixel, par exemple à du rouge, à du vert ou à du bleu - dans une autre variante, une information élémentaire est un groupe de pixels (par exemple un groupe de 2*2 pixels vert, rouge, bleu, vert correspondant à un « Bayer ») représenté par une valeur numérique par pixel . Les objets peuvent aussi être des images visibles, auquel cas une information élémentaire est un pixel représenté, par exemple, par trois valeurs numériques, chacune représentant une couleur, par exemple rouge, vert et bleu.

Les objets peuvent également être des séquences d'images, notamment brutes ou visibles, auquel cas une information élémentaire est un pixel d'une image de la séquence d'images. Les objets correspondent donc, par exemple, à des vidéos.

Dans le cas où l'objet est une image, l'image peut être issue d'un appareil de capture d'image et/ou destinée à un appareil de restitution d'images :

- Un appareil de capture d'images est, par exemple, un appareil photo jetable, un appareil photo numérique, un appareil reflex (numérique ou non) , un scanner, un fax, un endoscope, une caméra, un caméscope, une caméra de surveillance, un jouet, une caméra ou un appareil photo intégré ou relié à un téléphone, à un assistant personnel ou à un ordinateur, une caméra thermique, un appareil d'échographie, un appareil d'imagerie IRM (résonance magnétique) , un appareil de radiographie à rayons X.

- Un appareil de restitution d'images est, par exemple, un écran, un projecteur, un téléviseur, des lunettes de réalité virtuelle, ou une imprimante.

- Un appareil de capture et de restitution d'images est, par exemple, un scanner/fax/imprimante, un mini lab d'impression photos, un appareil de vidéo conférence. La plateforme de traitement peut prendre diverses formes selon l'application. A titre d'exemple, dans le cas où l'objet est une image, on citera notamment le cas où la plateforme de traitement est intégrée à l'un des appareils suivants :

- Un appareil de capture d' images qui produit des images traitées, par exemple un appareil photo numérique qui intègre une plateforme de traitement.

- Un appareil de restitution d' images qui affiche ou imprime des images traitées, par exemple un projecteur vidéo ou une imprimante incluant une plateforme de traitement. - Un appareil mixte qui corrige les défauts de ses éléments, par exemple un scanner/imprimante/télécopie incluant une plateforme de traitement.

Un appareil de capture d'images professionnel qui produit des images traitées, par exemple un endoscope incluant une plateforme de traitement.

La plateforme de traitement peut être déportée en tout ou partie sur un serveur.

Le traitement qui sera appliqué à l'objet dans la plateforme correspond à un algorithme, décrit par une ou plusieurs séquences d'opérations génériques, pouvant intervenir dans divers domaines tels que, par exemple, le traitement d'image, la compression et la décompression de données, le traitement du son, la modulation et démodulation de signal, la mesure, l'analyse de données, l'indexation ou la recherche dans une base de données, la vision par ordinateur, le traitement graphique, la simulation ou encore tout domaine mettant en œuvre un grand nombre de données . Les opérations génériques sont des opérations qui s'appliquent à des blocs logiques, c'est-à-dire à des entités abstraites, sans notion de taille, ni de forme, ni d' instant .

Les opérations génériques peuvent produire des blocs logiques. De préférence, au moins un bloc logique correspond à l'objet à traiter.

Dans une réalisation, le procédé comprend, en outre, l'étape de déterminer un mode de parcours des informations élémentaires dans la plateforme en fonction de l'architecture de cette plateforme et en fonction de la topologie de l'objet et de manière indépendante des premières données, la détermination de ce mode de parcours comprenant le choix et/ou calcul :

- d'un groupement d'informations élémentaires en sous-objets, comprenant chacun un nombre N d'informations élémentaires, et déterminé en fonction de la plateforme, et le traitement dans la plateforme consistant à démarrer périodiquement un sous- traitement qui consiste à appliquer la séquence d'opérations spécifiques à un sous-objet,

- de la forme et du recouvrement des sous-objets, déterminés en fonction de la plateforme, de l'ordre de traitement des sous-objets, déterminé en fonction de la plateforme,

Les étapes, décrites plus haut, qui consistent à déterminer l'ensemble des boucles nécessaires au traitement et/ou à calculer les séquences d'opérations spécifiques, tiennent compte de ce mode de parcours.

Par exemple dans le cas d'une image à deux dimensions horizontale et verticale, dans le cas où l'architecture de la plateforme est la suivante : Q = 4 et dans les 4 processeurs peuvent traiter 4 pixels contigus d'une même ligne, on peut déterminer le mode de parcours suivant: grouper les informations élémentaires en sous objets de 4 pixels contigus d'une même ligne, les sous-objets ne présentant pas de recouvrement, traiter les sous objets dans l'ordre suivant : une ligne après l'autre de haut en bas et à l'intérieur d'une ligne de gauche à droite déterminer les boucles correspondantes o pour chaque ligne de haut en bas o pour chaque groupe de 4 pixels de gauche à droite o effectuer la séquence d'opérations spécifique sur le groupe de 4 pixels en effectuant simultanément la même opération spécifique sur les 4 processeurs

Dans cet exemple, on a déterminé le mode de parcours en fonction de l'architecture de la plateforme et en fonction de la topologie de l'objet, et de manière indépendante des premières données. Par exemple le mode de parcours est compatible de l'une quelconque des séquences d' opérations génériques suivantes :

- appliquer un filtre Fl vertical 3*1 suivi d'un filtre F2 horizontal 1*3 - ajouter la constante 3 aux informations élémentaires ou toute autre séquence d' opérations génériques .

De préférence, le traitement de chaque sous-objet est réparti sur les Q processeurs, qui effectuent chacun au moins une opération spécifique IS8 de la séquence d'opérations spécifique. Ainsi, tous les processeurs sont utilisés pour chaque sous-objet et un même processeur est utilisé pour l'ensemble des sous-objets. IL n'est donc pas nécessaire d'affecter les sous-objets aux processeurs. De préférence, lorsqu'une opération spécifique est effectuée par un processeur pour le traitement d'un sous-objet, la même opération spécifique est également effectuée par le même processeur pour le traitement de tous les autres sous-objets. Le traitement est ainsi régulier : les opérations spécifiques sont affectées aux processeurs et réalisées périodiquement ensuite pour chaque sous-traitement de sous-objet.

De préférence, l'ensemble des boucles nécessaires au traitement dépendent de la topologie de l'objet et de la plateforme, mais sont indépendantes de la séquence d'opérations spécifiques .

De préférence, les boucles sont imbriquées les unes dans les autres autour de la séquence d'opérations spécifique complète. De cette façon, les boucles encapsulent l'ensemble de la séquence d'opérations spécifique et on ne découpe pas la séquence d'opérations spécifique en sous-séquence entourées chacune de boucles. De la même manière, il est possible de traiter l'objet en traitant un sous-objet à la fois sans qu'il soit nécessaire de stocker l'objet complet ou de stocker l'ensemble des résultats d'une opération spécifique, mais uniquement en stockant, de manière temporaire, les résultats qui sont nécessaires au traitement d'un autre sous-objet. De sorte que l'utilisation de la mémoire est réduite.

De préférence, les sous-objets sont composés d'informations élémentaires contiguës. Il est ainsi possible de mettre en œuvre des chaînages de processeurs comprenant au moins une file.

Dans une réalisation, pour traiter un sous-objet de N informations élémentaires, chacune des opérations spécifiques de la séquence est effectuée N fois au total et N/Q fois par chacun des Q processeurs. Dans le cas où la séquence d'opérations spécifique comprend des branchements conditionnels, chaque processeur effectue la partie de la séquence tenant compte de ces branchements conditionnels. Dans une réalisation, les sous objets n'ont pas de recouvrement selon au moins une dimension. De sorte que, au moins un résultat d'opération spécifique produit lors du traitement d'un sous-objet est utilisé lors du traitement d'un autre sous-objet. De préférence, les sous objets n'ont de recouvrement selon aucune dimension. De sorte que l'on peut utiliser chacun des processeurs à 100% sans répéter de calcul.

De préférence, la séquence d'opérations spécifiques est telle qu'au moins une opération spécifique k de la séquence produit au moins une fois au cours de ses N applications, un résultat utilisé pour le traitement d'un autre sous-objet.

De préférence, dans le cas où il y a plusieurs chaînages circulaires selon une même dimension du sous-objet (notamment lorsque les processeurs sont disposés selon une grille) , la file est partagée entre tous les chaînages circulaires selon la même dimension. De préférence, il y a exactement une file par dimension du sous-objet, et chaque file est partagée entre tous les chaînages circulaires selon la même dimension. De sorte que la communication entre les processeurs est particulièrement simple. De sorte que l'organisation de la mémoire est particulièrement simple.

Selon l'invention, démarrer périodiquement un sous- traitement ne signifie pas nécessairement à intervalle exactement régulier, la synchronisation des données nécessaire aux calculs et l'accès à la mémoire pouvant faire varier la période .

Dans une réalisation N n'est pas multiple de Q. Dans une variante de cette réalisation, Q est égal au nombre d'opérations spécifiques de la séquence obtenue en traduisant la séquence d'opérations générique.

Dans une réalisation N est un multiple de Q. Ceci permet de rendre régulier le traitement. De préférence N = Q. Ceci permet de réduire la quantité de mémoire nécessaire au stockage de résultats temporaires.

Dans une réalisation Q=I et N=4. Ceci permet de réutiliser une même valeur de paramètre pour plusieurs application d'une même opération spécifique.

Dans une réalisation Q>1 et N=Q. Ceci permet d'utiliser les Q unités de calcul d'un processeur vectoriel à 100%. Dans une réalisation Q>1 et N est un multiple de Q. Ceci permet d'utiliser les Q unités de calcul d'un processeur vectoriel à 100%, en réduisant le nombre de résultat d'opérations spécifiques effectuées lors du traitement d'un sous-objet et utilisées pour le traitement d'un autre sous- objet .

L'emplacement mémoire dans lequel sont stockées les données dépend, par exemple, du moment auquel elles seront réutilisées. Ainsi, les données pourront être stockées dans des registres, dans une mémoire rapide, ou encore dans une mémoire lente .

Dans une réalisation, la détermination du mode de parcours comprend l'étape de déterminer, quelle (s) opération (s) spécifique (s) de la séquence d'opérations spécifiques est (sont) effectuée (s) par chaque processeur, chacune des opérations étant appliquée au moins N fois sur chaque sous-objet, chaque opération spécifique faisant intervenir, directement et/ou indirectement, au moins une fois chacune des informations élémentaires d'un sous-objet au cours de ses N applications et produisant exactement N résultats. En outre, le procédé comprend l'étape d'ajouter aux données formatées spécifiques les informations ainsi déterminées.

Dans une réalisation, chaque processeur effectue toutes les opérations de la séquence d' opérations spécifiques . Les sous-traitements étant démarrés périodiquement, de préférence les opérations spécifiques effectuées par un processeur donné sont les mêmes pour chaque période.

Dans une réalisation, la détermination du mode de parcours comprend l'étape de déterminer, à chaque instant relatif de la période, quelle (s) opération (s) spécifique (s) de la séquence d'opérations spécifiques est (sont) effectuée (s) par chaque processeur, chacune des opérations étant appliquée au moins N fois sur chaque sous-objet, chaque opération spécifique faisant intervenir, directement et/ou indirectement, au moins une fois chacune des informations élémentaires d'un sous-objet au cours de ses N applications et produisant exactement N résultats. En outre, le procédé comprend l'étape d'ajouter aux données formatées spécifiques les informations ainsi déterminées. Dans une réalisation, tous les processeurs effectuent la même opération spécifique en même temps . Dans une autre réalisation, tous les processeurs effectuent la même opération spécifique successivement, ce qui permet d'effectuer des filtres récursifs. Dans une autre réalisation encore, la séquence d'opérations spécifiques est telle qu'un moins deux opérations spécifiques distinctes de la séquence produisent chacune au moins une dois au cours de leurs N applications, un résultat utilisé pour le traitement d'un autre sous-objet.

Le procédé comprend en outre l'étape de calculer les données formatées spécifiques en fonction des opérations spécifiques et du mode de parcours déterminé.

La notion d'échelle relative et de position relative de deux blocs logiques permet notamment, sans que la liste soit limitative, de:

- combiner plusieurs blocs logiques, et/ou

- changer d'échelle, - et/ou réaliser des filtres sur des voisinages,

- et/ou changer de représentation.

Dans le cadre de l'invention, les blocs logiques sont de plusieurs types selon l'opération générique, par exemple dans le cas où l'objet est une image, - au moins un bloc logique est de type « brut », et/ou

- au moins un bloc logique est de type rouge, et/ou

- au moins un bloc logique est de type vert, et/ou

- au moins un bloc logique est de type bleu, et/ou

- au moins un bloc logique est représentable par des données sur 8 bits, et/ou - au moins un bloc logique est représentable par des données sur 16 bits.

- au moins un bloc logique est représentable par des données sur n bits, par exemple 10 ou 12.

Dans une réalisation, au moins un bloc logique contient des données multi échelles, par exemple des données à échelle 1, H, H et 1/8. Ceci permet de réaliser des opérations génériques à plusieurs échelles, et de combiner ensuite les résultats Un algorithme peut, par exemple, sans que la liste soit limitative, correspondre dans le cas où l'objet est une image à :

- Un calcul, notamment de statistiques, pour une balance des blancs, et/ou - un calcul, notamment de statistiques, pour une exposition automatique, et/ou

- un calcul, notamment de statistiques, pour une mise au point automatique, et/ou

- un calcul, notamment de statistiques, pour une amélioration de contraste automatique, et/ou

- une conversion image brute en image visible (« image pipe » ou « Image Signal Processing (ISP) » en anglais) , et/ou

- une correction de défauts d'optique, et/ou - une amélioration de profondeur de champ, et/ou

- un traitement tel que décrit dans la demande de brevet PCT/FR2006/050022 « Procédé de réalisation d'un appareil de capture et/ou de restitution d' image, et appareil obtenu par ce procédé » et dans la demande de brevet PCT/FR2006/050197 pour « Procédé pour commander une action, notamment une modification de netteté, à partir d'une image numérique en couleurs, et/ou

- une correction de défauts de capteur, et/ou

- une correction de défauts d' imageur, et/ou - un traitement, notamment d'amélioration de netteté, et/ou

- un traitement, notamment d'amélioration de rendu couleur, et/ou - un traitement, notamment d'amélioration de rendu du contraste, et/ou

- un traitement, notamment d'amélioration de rendu des détails, et/ou

- une réduction de bruit, et/ou - une mesure, et/ou

- une compression, et/ou

- une décompression, et/ou

- une interpolation ou grossissement (zoom) , et/ou

- un scan, et/ou - un effet spécial.

L'objet à traiter est généralement, lors du traitement, décomposé en sous-objets, c'est-à-dire en groupes d'informations élémentaires ayant une taille et une forme déterminées, tant dans l'espace que dans le temps ou les autres dimensions de l'objet.

Les sous-objets sont des ensembles d'informations élémentaires ayant une forme et une taille qui, selon les cas, dépendent des caractéristiques de la plateforme, notamment de la taille et du type de mémoire ainsi que, dans le cas d'un processeur vectoriel, de la taille d'un vecteur, mais aussi des caractéristiques de l'objet à traiter.

Différents types de décomposition en sous-objets possibles, sans recouvrement sont illustrées par les figures la à Id. Sur ces figures, on voit qu'une même image peut être découpée en lignes (lignes 90, 91, 92 et 93 sur la figure la) , en colonnes (colonnes 94, 95, 96 et 97 sur la figure Ib) , en sous-objets d'une tout autre forme (formes 70, 71, 72 et 73 sur la figure Ic) , ou encore en rectangles (formes 60, 61, 62, 63, 64, 65, 66 et 67 sur la figure Id) . Dans le cas où les sous-objets sont sans recouvrement, il faut accéder à des informations élémentaires d' un moins un autre sous-objet pour traiter les informations élémentaires d'un sous-objet sans perdre de bord, par exemple lors du calcul de filtres .

La décomposition en sous-objet peut également dépendre des secondes données, notamment du déplacement relatif cumulé afin par exemple de déterminer le recouvrement nécessaire selon une dimension. Par ailleurs, dans une variante, lorsque certaines des opérations génériques ont des déplacements non nuls, , pour qu'aucune information élémentaire ne soit perdue lors de l'exécution de l'algorithme, on décompose l'image en sous-objets ayant un recouvrement non nul selon au moins une dimension. Cette configuration est illustrée sur les figures le et If : la figure le représente un sous-objet composé de 6x6 informations élémentaires dans le cas où la séquence d'opérations perd un pixel sur chaque bord, et la figure If représente un objet comprenant 100 informations élémentaires. Sur cette figure, on voit que les sous-objets sont quatre rectangles 80, 82, 83 et 84 contenant chacun 36 informations élémentaires. Le rectangle 80 est constitué des 36 informations élémentaires situées en haut à gauche dans l'image, et le rectangle 82 est constitué des 36 informations élémentaires en haut à droite de l'image. Ainsi, les 8 informations élémentaires 86 sont communes aux deux sous-objets 80 et 82.

De même, les 8 informations élémentaires 85 sont communes aux deux sous-objets 80 et 83 ; les 8 informations élémentaires 88 sont communes aux deux sous-objets 82 et 84, et les 8 informations élémentaires 89 sont communes aux deux sous- objets 83 et 84 Enfin, les 4 informations élémentaires 87 sont communes aux quatre sous-objets 80, 82, 83 et 84.

Dans le cas où l'objet est une image, dans une réalisation l'image est décomposée en sous-objets rectangulaires juxtaposés, les sous-objets étant destinés à être traités, par exemple, de gauche à droite puis de haut en bas.

Selon la plateforme, les sous-objets sont choisis et stockés selon l'une des façons suivantes, sans que la liste soit limitative :

- dans le cas d'un processeur de traitement du signal disposant d'une petite mémoire rapide et d'une grosse mémoire lente, la taille des sous-objets est choisie pour pouvoir effectuer le traitement d'un sous-objet sans accès à la mémoire lente ; on pourra, par exemple, prendre des sous-objets correspondant à des carrés de 32x32 pixels, le résultat du calcul sur le sous-objet précédent étant transféré en mémoire lente pendant le calcul relatif au sous-objet courant, et pendant le transfert de la mémoire lente vers la mémoire rapide des données nécessaires au calcul relatifs au sous-objet suivant,

- dans le cas d'un processeur scalaire disposant d'une petite mémoire cache et une grosse mémoire lente, la taille des sous-objets est choisie pour pouvoir effectuer le traitement d'un sous-objet en utilisant la mémoire cache le plus possible; on pourra, par exemple, prendre des sous-objets correspondant à des carrés de 32x32 pixels ou des sous-objets de 1 pixel ou des sous-objets de 4 pixels (2*2) ou de Nl*2 pixels, notamment dans le cas d'une image brute (« raw ») , - dans le cas d'un processeur vectoriel, la taille des sous-objets est choisie comme égale à, ou multiple de, la taille d'un vecteur que la plateforme sait traiter et stocker, on pourra, par exemple, prendre des sous-objets correspondant à 64 pixels horizontaux. Dans le cas où l'objet est d'un autre type qu'une image, la décomposition en sous-objet peut être adaptée de manière similaire à la plateforme.

Dans les langages tels le C, cette décomposition en sous- objets et le codage des boucles correspondant doit être explicite en fonction de la plateforme et réalisé manuellement pour chaque plateforme. Il existe des compilateurs vectoriels qui essaient d'extraire, à partir des boucles codées, explicitement les sous-objets, mais leur efficacité est limitée car ils doivent extraire le concept de l'algorithme avant de le coder automatiquement, ce qui est très difficile. L'invention permet ainsi d'automatiser et de rendre plus efficace l'adaptation à une plateforme quelconque.

Le tableau suivant résume les principales différences entre l'invention et les langages connus :

Une fois cette décomposition en sous-objets effectuée, dans une réalisation, on peut attribuer des opérations spécifiques aux processeurs. A chaque instant, une opération spécifique peut être effectuée par aucun, un ou plusieurs processeurs. Ce choix dépend, notamment de l'architecture de la plateforme, à savoir le type de processeur et l'agencement des différents processeurs . De cette architecture dépend également le transit des données, à savoir les informations élémentaires et/ou résultats d'opérations spécifiques d'un processeur à l'autre. Dans ce cas, si on appelle T le temps entre deux démarrages successifs de deux sous-traitements, à un instant t+k*T, où t est un instant quelconque et k un entier quelconque, la plateforme effectue sur au moins un sous-objet j les mêmes opérations que celles effectuées à l'instant t sur au moins un sous-objet i, ces opérations spécifiques s' appliquant à des informations élémentaires et/ou des résultats d'opérations spécifiques ayant la même position relative dans leur (s) sous- objet (s) respectif (s) . Ceci signifie que tous les sous- traitements sont identiques, ce qui permet d'avoir un code de taille relativement faible puisqu'il suffit d'écrire explicitement un des sous-traitements, et de l'appliquer plusieurs fois. T est le temps qui s'écoule entre deux démarrages successifs de deux sous-traitements, mais cette valeur n'est pas forcément égale au temps nécessaire à l'exécution complète d'un sous-traitement. En effet, on peut démarrer un sous-traitement avant que le précédent soit terminé, ce qui peut, par exemple, permettre de gagner du temps.

Ce cas de figure est illustré par la figure 2 sur laquelle on voit que le sous-traitement STl n'est pas terminé au moment où le sous-traitement ST2 commence. De même, le sous- traitement ST2 est toujours en train de s'exécuter lorsque le sous-traitement ST3 démarre.

Dans une réalisation, l'attribution des opérations spécifiques aux processeurs et/ou le choix du moment auquel est réalisée chaque opération spécifique est déterminé (e) par le compilateur de la plateforme à partir des données formatées spécifiques .

Afin de pouvoir optimiser au maximum l'algorithme, il peut être utile de rendre le traitement à effectuer le plus régulier possible. Pour cela, dans une réalisation de l'invention, le procédé comprend l'étape, dans le cas où le nombre d'opérations spécifiques à appliquer sur chaque sous- objet n'est pas un multiple du nombre de processeurs Q et/ou le nombre d'informations élémentaires de l'objet à traiter n'est pas un multiple de N, de rajouter des opérations spécifiques sans effet et/ou des informations élémentaires nulles, de manière que le nombre d'opérations spécifiques soit un multiple de Q et que le nombre d' informations élémentaires soit un multiple de N. Au sens de l'invention, par informations élémentaires nulles on peut entendre des informations élémentaires de contenu quelconque non utilisé, et/ou des informations élémentaires obtenues par réplication d' autres informations élémentaires et/ou des informations élémentaires obtenues par calcul .

Dans une réalisation, la séquence d'opérations génériques s'applique à au moins un ensemble d'informations élémentaires, dénommé bloc logique, et les données formatées génériques comprennent en outre des secondes données, pour les opérations génériques impliquant au moins deux blocs logiques, se rapportant à la position relative et/ou une échelle relative, notamment spatiale ou temporelle, des blocs logiques les uns par rapport aux autres, et dans lequel les informations élémentaires et/ou résultats d'opérations spécifiques sur lesquels doit s'appliquer chaque opération spécifique dépendent des secondes données et dans lequel, dans le cas où au moins une position relative des blocs logiques les uns par rapports aux autres est non nulle, au moins une opérations spécifiques fait intervenir, directement ou indirectement, au moins une information élémentaire d'un autre sous-objet. Dans ce cas, on peut calculer la position et l'échelle relative entre deux blocs logiques quelconques en utilisant les secondes données . On peut en déduire la taille de chaque bloc physique correspondant, ainsi que son échelle et la position absolue de chaque élément du bloc physique.

Dans une réalisation de l'invention, les opérations génériques comprennent au moins une opération générique de position qui permet d' obtenir un bloc logique constitué de la position absolue selon une dimension de l'objet, ainsi qu'une opération générique d' indirection, qui permet d'obtenir, à partir d'un premier bloc, un second bloc par déplacement et/ou changement d'échelle en fonction d'un troisième bloc ou d'un paramètre. Dans une autre réalisation, les opérations génériques comprennent au moins une opération générique élémentaire comprise dans le groupe comprenant : l'addition de blocs logiques et/ou de paramètres, la soustraction de blocs logiques et/ou de paramètres, le calcul de la valeur absolue de la différence entre des blocs logiques, la multiplication de blocs logiques et/ou de paramètres, le maximum parmi au moins deux blocs logiques et/ou paramètres, le minimum parmi au moins deux blocs logiques et/ou paramètres le groupement et dégroupement de blocs logiques, le calcul d'un bloc logique par application d'un paramètre, correspondant à une table de correspondance, à un bloc logique, le choix conditionnel d'un bloc logique parmi au moins deux blocs logiques et/ou paramètres, ce choix se faisant de la façon suivante : si a>b on choisit c, sinon on choisit d, avec a, b, c, et d qui sont des blocs logiques et/ou des paramètres, l'histogramme d'un bloc logique, le changement d'échelle d'un bloc logique en fonction d'un paramètre et/ou d'un bloc logique, le déplacement relatif d'un bloc logique en fonction d'un paramètre et/ou d'un bloc logique, et une opération produisant un bloc contenant au moins une coordonnée.

Les opérations génériques mettant en œuvre un bloc logique et un paramètre, telle que l'addition, peuvent être traduites en traitement dans la plateforme, et correspondent, par exemple lorsque l'opération générique est une addition, à additionner chaque élément ou information élémentaire du bloc physique traité, correspondant au bloc logique, avec la valeur du paramètre correspondant à la position absolue de l'élément ou de l'information élémentaire traité.

Ces opérations en tant que telles sont des opérations relativement courantes en traitement d' image mais également dans le traitement d'autres types d'objets. Lorsqu'elles sont appliquées à des blocs logiques en combinaison avec les secondes données, ces opérations permettent de résoudre le problème posé. Ces opérations servent de base pour former toutes les opérations pouvant être mises en oeuvre dans un algorithme de traitement de données .

Ainsi, dans une réalisation, les opérations génériques comprennent des opérations génériques complexes correspondant à des groupements d'opérations génériques élémentaires utilisés en tant que tels. Parmi ces groupements, on peut notamment citer : le calcul de la valeur médiane d'au moins trois blocs logiques et/ou paramètres, qui correspond à un groupe d'opérations génériques constitué de calculs de minimum et de maximum, la multiplication/accumulation de blocs logiques et/ou de paramètres, la convolution d'un bloc logique avec un paramètre, qui correspond à un groupe d' opérations génériques constitué de multiplications et d'additions avec plusieurs positions relatives, l'addition combinée avec un maximum et un minimum, le calcul d'un gradient, qui correspond à une valeur absolue de différences avec deux positions relatives, le produit scalaire d'un paramètre constitué d'un vecteur et de plusieurs blocs logiques pour produire un bloc logique, le calcul d'un changement d' échelle avec interpolation qui correspond à un groupe d'opérations génériques constitué de changements d' échelle et de multiplications et d' additions avec plusieurs positions relatives, la combinaison de blocs logiques, qui correspond à un groupe d' opérations génériques constitué de changements d'échelle avec plusieurs positions relatives. Certaines des opérations font appel à plusieurs blocs logiques. On a vu que, dans ce cas, on fournit des secondes données relatives aux positions des blocs logiques mis en jeu les uns par rapport aux autres .

Les positions relatives et les échelles relatives, notamment spatiales et/ou temporelles, peuvent correspondre à divers concepts selon la nature de l'objet. Elles s'appliquent entre 2 blocs quelconques, quel que soit leur type (dans le cas d'une image comme décrit plus haut un bloc logique peut être notamment brut, rouge, vert, 8 bits...) . Dans le cas où l'objet est une image fixe à pixels carrés, la position absolue ou relative peut correspondre dans une réalisation à 2 valeurs (verticale et horizontale) et l'échelle absolue ou relative à 2 valeurs (verticale et horizontale) ; les pixels de la ligne du haut d'un objet peuvent avoir comme positions absolues (0 ;0) (0 ;1) (0 ;2) ..., et les pixels de la n ième ligne peuvent avoir comme positions absolues

(n ;0) (n ;1) (n ;2); dans ce cas, les positions relatives peuvent être codées de la façon suivante : (-1 ; 0) indique en haut, (0 ;1) indique à droite, (0 ; 0) indique au même endroit (position relative nulle) et (2 ; -2) indique 2 pixels au dessous et 2 à gauche ; une échelle relative de (0,5 ;0,5) correspond alors à une résolution de moitié dans chaque direction. De manière plus générale, une combinaison de déplacement relatif et d'échelle relative peut être codée à l'aide de 2 fonctions f et g de la façon suivante : (f(x ;y) ;g(x ;y))) pour chaque pixel de position absolue x,y. Il est à noter qu'une règle d'arrondi est nécessaire afin de prendre, par exemple, le pixel le plus proche. Ainsi :

- une position relative au-dessus se code avec f (x ;y)= - 1 et g (x ;y)=0

- une échelle relative de 0,7 se code avec f (x ;y) = 0,7*(x-x0) et g(x ;y) =0, 7* (y-yO) ; xO et yO correspondant à la position absolue invariante ;

- une correction de distorsion se code avec f et g correspondant au champ de distorsion

- un changement de format YUV 4 : 2 : 2 à savoir YYUV à partir des informations de luminance et de chrominances Y, U et V séparées peut utiliser pour obtenir Yl Y2 xx xx Y3 Y4 xx xx ... à partir de Yl Y2 Y3 Y4 ... les fonctions suivantes f (x ; y) = (x- xO)*O,5 si x pair et (x+l-xO)*O,5 si x-xO impair et f (y) =y-yθ ; xO et yO correspondant à un paramètre relatif à une position absolue; La liste suivante, non limitative, donne d'autres exemples de réalisation avec divers types d'objets:

- dans le cas où l'objet est une image fixe à pixels hexagonaux disposés par ligne, deux lignes successives étant décalées d'un demi-pixel, la position absolue ou relative et l'échelle absolue ou relative peuvent correspondre chacune à 2 valeurs (verticale et horizontale) ; les pixels de la ligne du haut d'un objet peuvent avoir comme positions absolues (0 ;0)

(0 ;1) (0 ;2) ..., et les pixels de la n ième ligne peuvent avoir comme positions absolues (n ;0,5) (n ;1,5) (n ;2,5) si la ligne est impaire, et (n ;0) (n ;1) (n ;2) si la ligne est paire; la position relative peut correspondre à 2 valeurs (verticale et horizontale), par exemple (-0,5 ; 0,5) indique en haut à droite,

(0,1) indique à droite et (-0,5 ; 1,5) indique le pixel situé à droite du pixel en haut à droite ; une échelle relative de (0,5 ;0,5) correspond alors à une résolution de moitié dans chaque direction. De même, une combinaison de déplacement relatif et d'échelle relative peut être codée à l'aide de 2 fonctions f et g de la façon suivante : (f(x ;y) ;g(x ;y))) pour chaque pixel de position absolue x,y. Il est à noter qu'une règle d'arrondi est nécessaire afin de prendre, par exemple, le pixel le plus proche.

- dans le cas où l'objet est une image animée à pixels carrés, la position absolue ou relative peut correspondre à 3 valeurs (verticale, horizontale et temporelle) , par exemple (-

1 ; 0 ;0) indique un pixel situé en haut dans la même image,

(0 ; 0 ; -1) indique le pixel ayant la même position dans l'image précédente et (2 ; -2, -1) indique le pixel situé 2 pixels au dessous et 2 à gauche dans l'image précédente. De même, une combinaison de déplacement relatif et d'échelle relative peut être codée à l'aide de 3 fonctions f, g, h de la façon suivante : (f(x ;y ;t) ;g(x ;y ;t)) ; h(x ;y ;t)) pour chaque pixel de position absolue x,y à l'instant t. Il est à noter qu'une règle d'arrondi est nécessaire afin de prendre, par exemple, le pixel le plus proche. - dans le cas où l'objet est un son monocanal, la position absolue ou relative peut correspondre à 1 valeur

(temporelle), par exemple (-1) indique l'instant précédent, et (2) indique 2 instants après, une fonction f(t) permet alors de coder un déplacement et échelle relatifs . Une règle d' arrondi étant utilisée pour prendre l'instant le plus proche.

- dans le cas où l'objet est un son multi canal, la position absolue ou relative peut correspondre à 2 valeurs

(temporelle, canal), par exemple (-1, 0) indique l'instant précédent du même canal, et (2,1) indique 2 instants après du canal suivant, ordonnés par exemple spatialement de façon circulaire. De même, une combinaison de déplacement relatif et d'échelle relative peut être codée à l'aide de 2 fonctions f, g de la façon suivante : (f(t ;c) ;g(t ;c)) pour chaque échantillon sonore de position à l'instant t pour le canal c. Il est à noter qu'une règle d'arrondi est nécessaire afin de prendre, par exemple, l'instant et le canal le plus proche.

- dans le cas où l'objet est un maillage de simulation, la position absolue ou relative peut correspondre à n valeurs correspondant chacune à une dimension spatiale ou temporelle fonction de la topologie du maillage. De même, une combinaison de déplacement relatif et d'échelle relative peut être codé à l'aide de n fonctions. Il est à noter qu'une règle d'arrondi est nécessaire afin de prendre, par exemple, le nœud et l'instant le plus proche.

- dans le cas où l'objet est un signal modulé, la position absolue ou relative peut correspondre à n valeurs correspondant respectivement au temps, le cas échéant au canal fréquentiel (émission ou réception sur plusieurs fréquences) et le cas échéant (plusieurs émetteurs ou récepteurs disposés spatialement) à une dimension spatiale. De même, une combinaison de déplacement relatif et d'échelle relative peut être codée à l'aide de n fonctions, et une règle d'arrondi doit être choisie. - dans le cas où l'objet est un ensemble de mesures, la position absolue ou relative peut correspondre à n valeurs correspondant chacune à une dimension de l'objet qui, selon le cas peuvent être de nature temporelle, spatiale, fréquentielle, phase ou autre. De même, une combinaison de déplacement relatif et d'échelle relative peut être codée à l'aide de n fonctions et une règle d'arrondi doit être choisie.

- dans le cas général où l'objet est de dimension n, la position absolue ou relative peut correspondre à n valeurs correspondant chacune à une dimension de l'objet qui, selon le cas, peuvent être de nature temporelle, spatiale, fréquentielle, phase ou autre. De même, une combinaison de déplacement relatif et d'échelle relative peut être codée à l'aide de n fonctions et une règle d'arrondi doit être choisie.

Certaines opérations spécifiques produisent des résultats susceptibles d'être utilisées ultérieurement pour un autre sous-traitement . Il est donc utile de déterminer ces résultats et de les grouper et de les transmettre. Ainsi, dans une réalisation, le procédé comprend l'étape de déterminer, en fonction des secondes données, une partie des résultats d'opérations spécifiques nécessaires aux opérations spécifiques ultérieures pour un autre sous- traitement. Dans une autre réalisation, le procédé comprend en outre l'étape de grouper en mémoire les résultats d'opérations spécifiques nécessaires aux opérations spécifiques ultérieures pour un autre sous-traitement en fonction des secondes données et/ou du mode de parcours .

Dans une autre réalisation encore, les opérations spécifiques sont effectuées par des unités de calcul chaînées selon au moins un chaînage circulaire, et le procédé comprend en outre l'étape de déterminer en fonction des secondes données pour chaque opération spécifique, s'il faut ou pas transmettre les résultats de ladite opération spécifique selon un chaînage circulaire. Le procédé comprend en outre le cas échéant, l'étape de déterminer en fonction des secondes données et du mode de parcours quel chaînage circulaire utiliser pour transmettre les résultats de ladite opération spécifique.

Ces différentes réalisations peuvent être mises en oeuvre indépendamment les unes des autres, ou en combinaison.

De préférence, l'information de déplacement relatif et/ou échelle relative des secondes données est utilisé pour déterminer la (les) dimension (s) selon laquelle (lesquels) il y a un déplacement et/ou changement d'échelle pour une opération générique donnée. On peut ainsi déterminer le (s) chaînage (s) circulaire (s) à mettre en œuvre pour chaque opération spécifique de la séquence d'opération spécifique traduite à partir de la séquence d'opérations génériques. De préférence, ledit chaînage circulaire comporte en outre au moins une file.

Lorsque plusieurs opérations mettent en jeu un déplacement nul, il n'est pas utile d'inscrire les résultats de chacune des opérations spécifiques en mémoire, et de les relire pour l'opération suivante, ces opérations de stockage et de relecture perdent du temps et ne présentent aucun avantage particulier pour le traitement. Ainsi, dans une réalisation, les données formatées spécifiques comprennent des informations concernant le groupement des opérations spécifiques, ce groupement consistant en la formation de paquets de une ou plusieurs opérations spécifiques destinées à être exécutées sans conserver les résultats de chaque opération spécifique non utiles pour un autre sous-traitement. Dans une réalisation l'ensemble des opérations spécifiques de la séquence sont groupées .

Dans une réalisation, les données formatées spécifiques ne comportent qu'un seul jeu de boucles imbriquées. Par ailleurs, certaines opérations spécifiques peuvent s'appliquer sur des résultats d'opérations utilisés au préalable dans un autre sous-traitement. Par exemple, lorsque la séquence d'opérations spécifiques contient un filtre mettant en jeu trois lignes issues de calculs intermédiaires, dans le cas d'une image décomposée en sous-objets correspondant à des lignes : l'opération filtre appliquée au premier sous-objet, c'est-à-dire à la première ligne, utilise également, par exemple, les deuxième et troisième lignes de l'image. Ces deuxième et troisième lignes seront également utilisées par cette même opération filtre lorsqu'elle s'appliquera au deuxième sous- objet, et même au troisième sous-objet pour ce qui est de la troisième ligne. Dans ce cas, il peut être intéressant de garder en mémoire ces lignes de pixels pour ne pas avoir à les recalculer ultérieurement, ce qui est coûteux en calculs.

Dans le cas où plusieurs filtres sont utilisés sur des données différentes, il peut être utile de mémoriser d'autres données de manière similaire.

Ainsi, dans une réalisation, les données formatées spécifiques comprennent des opérations permettant de garder en mémoire de la plateforme au moins une partie des résultats d'opérations spécifiques nécessaires aux opérations spécifiques ultérieures pour un autre sous-traitement.

En outre, dans une réalisation, le procédé comprend l'étape de grouper en mémoire les résultats d'opérations spécifiques utilisées lors du sous-traitement d'un autre sous- objet en fonction de la position relative dudit autre sous-objet par rapport audit sous-objet. On va maintenant décrire un exemple de réalisation mettant en oeuvre des chaînages circulaires avec file comme décrit plus bas . Dans cet exemple le mode de parcours est tel que N vaut 5, l'objet est décomposé en 10*5 sous-objets, les 10 sous-objets disposés horizontalement sont traités l'un après l'autre, puis 10 les sous-objets situés en dessous sont traités, et ainsi de suite. La file utilisée selon la dimension horizontale contient des données de l'itération précédente alors que la file utilisée verticalement contient des données des 10 itérations précédentes ; le groupement en mémoire des résultats d'opérations spécifiques dépend donc du mode de parcours . Le groupement en mémoire des résultats d' opérations spécifiques utilisées lors du sous-traitement d'un autre sous- objet est donc fonction de la position relative dudit autre sous-objet par rapport au dit sous-objet.

Le procédé comprend également, dans certains cas, l'étape de grouper dans au moins une file les résultats d'opérations spécifiques effectuées lors du sous-traitement d'un sous-objet et utilisés lors du sous-traitement d'un autre sous- objet.

Dans une réalisation, dans laquelle les unités de calcul sont chaînées selon au moins un chaînage circulaire, le chaînage comporte en outre au moins une file.

Dans certains cas, les données formatées spécifiques comprennent des informations concernant le transfert des résultats d'opérations spécifiques et/ou d'informations élémentaires en mémoire d'un emplacement mémoire de la plateforme vers un autre. Le cinquième exemple de traduction décrit plus bas contient de tels transferts.

Dans une réalisation, au moins une opération spécifique peut, quant à elle, être telle qu'elle a un effet de bord, c'est-à-dire qu'il y a une perte de certaines informations se trouvant au bord des sous-objets sur lesquels sont appliquées ces opérations. Pour éviter ces effets de bords, on décompose l'image en sous-objets qui ont un recouvrement, c'est-à-dire qu'ils ont certaines informations élémentaires communes. Ainsi, les données formatées spécifiques comprennent des opérations spécifiques pour que des résultats d'opérations spécifiques soient calculés plusieurs fois dans la plateforme, de manière à ne perdre aucune information au moment de l'exécution des opérations spécifiques, notamment dans le cas où les sous-objets ont un recouvrement dans au moins une dimension. Le cinquième exemple de traduction décrit plus bas contient un tel recouvrement .

Dans une réalisation, les données formatées spécifiques contiennent des informations d'adressage pour permettre à la plateforme d'accéder à au moins une partie des résultats d' opérations spécifiques et/ou informations élémentaires en mémoire, ces informations d'adressage étant sous la forme « adresse de base + décalage » ou « (adresse de base + décalage) modulo (taille d'une mémoire tampon) », le décalage étant constant pour les résultats issus d'une même opération spécifique d'un sous-traitement à l'autre. Dans une réalisation, on modifie l'adresse de base pour chaque sous-traitement.

De préférence la mémoire tampon est intégrée dans l'une des mémoires de la plateforme de traitement. La mémoire tampon peut être notamment une file.

Dans une réalisation, le procédé comprend l'étape de calculer le décalage en fonction de l'ordre des opérations spécifiques, de manière à fournir à la plateforme des adresses d'emplacements mémoire vide ou contenant un résultat d'opération spécifique ou une information élémentaire qui n' est plus utilisée, afin de stocker des résultats d'opérations spécifiques . Ce calcul se fait en tenant compte de différents paramètres, notamment des opérations spécifiques, afin de ne pas effacer de la mémoire des informations qui sont utilisées ultérieurement dans un autre sous-traitement ou par une autre opération spécifique, tel que décrit précédemment. On obtient ainsi, avec un calcul d'adresse simple, et en réutilisant la mémoire, un buffer circulaire permettant de stocker les données intermédiaires nécessaires aux calculs ultérieurs. Notamment, dans le cas d'une image où les traitements sont effectués par ligne, on conserve les lignes utilisées en entrée des filtres verticaux.

Dans une réalisation, le procédé comprend en outre l'étape de déterminer le dit décalage en fonction des premières données, le décalage étant différent pour chaque opération spécifique de la séquence d'opérations spécifiques obtenue par traduction de la séquence d'opérations génériques des premières données. Par exemple, au moins une file est implémentée avec des informations d'adressage de la forme « adresse de base + décalage », ou « (adresse de base + décalage » modulo (la taille d'une mémoire tampon située dans la plateforme) : les secondes données servent à déterminer la file à utiliser.

Pour appliquer les opérations spécifiques sur des sous-objets, il est généralement intéressant d'utiliser des boucles afin de réduire la taille du code et de le rendre plus régulier. Ainsi, dans une réalisation, le traitement comporte le calcul d'au moins une boucle, le nombre d'itérations de la ou des boucles et, quand il y a plusieurs boucles, les imbrications des boucles, en fonction du mode de parcours. Les exemples de traduction ci-après montrent qu'il est possible de calculer automatiquement les boucles en fonction de la plateforme, contrairement aux langages connus où les boucles sont codées manuellement en fonction de la plateforme.

Ces boucles peuvent, par exemple, être utilisées pour parcourir les sous-objets, notamment dans le cas où l'objet à traiter est une image découpée en sous-objet de forme rectangulaire, et où on choisit de les parcourir soit horizontalement, soit verticalement.

De la même façon, les données formatées spécifiques comprennent dans certains cas des variables temporaires nécessaires au traitement. Certaines opérations spécifiques utilisent des paramètres, et, dans ce cas, on traite également les valeurs de ces paramètres . Ces paramètres peuvent par exemple être des coefficients multiplicateurs . Ces paramètres peuvent correspondre, par exemple, sans que la liste soit limitative à :

- des coefficients de filtres,

- des valeurs de saturation,

- des valeurs de décalages, et

- des tables de correspondances .

Dans une réalisation, les valeurs des paramètres utilisés par les opérations spécifiques dépendent de la position absolue des sous-objets et/ou de la position absolue dans les sous- objets des informations élémentaires mises en jeu, directement ou indirectement, dans ces opérations spécifiques. Par exemple, dans le cas où l'objet à traiter est une image, des défauts peuvent apparaître sur l'image, dus à l'optique ayant servi à faire la prise de vue. Ces défauts ne sont en général pas homogènes sur toute l'image, notamment sur les bords. Dans ce cas, pour compenser ce flou, on n'appliquera pas les mêmes coefficients de compensation sur tous les pixels de l'image.

Par exemple, l'utilisation d'un paramètre commun à toutes les informations élémentaires pour un filtre permet d' augmenter la netteté de manière uniforme.

Par exemple, l'utilisation d'un paramètre dépendant de la position absolue des informations élémentaires dans l'objet à traiter, pour un filtre, permet d'augmenter la netteté de manière plus importante au bord afin de compenser un défaut optique.

Par exemple, l'utilisation d'un paramètre dépendant de la position absolue des informations élémentaires dans l'objet à traiter, pour une correction de vignetage, permet d'obtenir une compensation plus forte au bord afin de compenser un défaut optique. Par exemple, l'utilisation d'un paramètre dépendant de la position absolue des informations élémentaires dans l'objet à traiter pour un dé matriçage (« demosaicing » en anglais) permet de traiter différemment les pixels rouges, les pixels verts et les pixels bleus d'une image brute issue d'un capteur.

Par exemple, l'utilisation de secondes données, notamment un déplacement, dépendant de la position absolue des informations élémentaires dans l'objet à traiter pour un calcul d'agrandissement (« zoom ») numérique ou une correction de distorsion permet d'obtenir les pixels nécessaires au calcul de l'interpolation en chaque point.

Dans une réalisation, la valeur d'un paramètre, selon la nature de ce paramètre, peut : - être constante et intrinsèque à l'algorithme ; dans ce cas la valeur de paramètre peut, notamment, être transmise au moyen de traitement ou à la plateforme, et/ou

- dépendre de la provenance ou la destination de l'objet, par exemple, dans le cas où l'objet à traiter est une image issue d'un appareil muni d'une optique donnée, la valeur du paramètre peut dépendre du type d' optique qui a un impact sur le niveau de flou dans l'image ; dans ce cas la valeur de paramètre peut, notamment, être transmise au moyen de traitement ou à la plateforme, et/ou

- dépendre de l'objet à traiter, par exemple, dans le cas où l'objet à traiter est une image issue d'un capteur, la valeur du paramètre peut dépendre du gain du capteur effectivement utilisé pour capturer ledit objet qui a un impact sur le niveau de bruit dans l'image ; dans ce cas, la valeur de paramètre peut, notamment, être transmise, choisie ou calculée par la plateforme, et/ou

- dépendre de la position absolue de l'information élémentaire dans l'objet ; dans ce cas la valeur de paramètre peut, notamment, être transmise, choisie ou calculée par la plateforme , et/ou - ne pas dépendre de la position absolue de l'information élémentaire dans l'objet.

La valeur de paramètre peut être déterminée simultanément ou à posteriori par rapport à la définition de l'algorithme.

On a vu que la valeur de certains paramètres peut varier d'un objet à l'autre, d'un sous-objet à l'autre ou d'une information élémentaire à l'autre. Dans ce cas, dans une réalisation, on calcule la valeur du paramètre à chaque changement .

Dans une autre réalisation, on calcule à priori les valeurs possibles du paramètre, et, à chaque changement, on détermine l'index ou l'adresse permettant d'accéder à la valeur du paramètre, par exemple dans une table. Dans une autre réalisation, plus particulièrement adaptée aux paramètres dont la valeur varie d'un sous-objet à l'autre en fonction de la position absolue du sous-objet et dont le nombre de valeurs est limité, par exemple les paramètres correspondant aux caractéristiques de flou de l'optique, on détermine un nombre limité de jeux de valeurs de paramètres, on stocke chaque jeu et pour chaque sous-objet on sélectionne le jeu à utiliser, par exemple en calculant une fonction de la position donnant l'adresse du jeu à utiliser.

Comme mentionné précédemment, les paramètres sont utilisés lors de l'application de certaines opérations spécifiques. Pour que cela soit possible, dans une réalisation, les données formatées spécifiques comprennent la (les) valeur (s) des paramètres et/ou un code de calcul de la (des) valeur (s) des paramètres .

Dans une autre réalisation, on choisit la (les) valeur (s) de paramètre (s) en fonction de la plateforme de traitement, de sorte que le traitement tienne compte des caractéristiques de cette plateforme. Ainsi, on peut disposer d'un algorithme identique pour plusieurs plateformes, et cet algorithme est adapté à chaque plateforme souhaitée, uniquement en faisant varier ces caractéristiques.

Dans une autre réalisation, ces valeurs de paramètres dépendent de l'objet à traiter.

Dans une réalisation de l'invention, les opérations spécifiques comprennent au moins une opération spécifique de calcul prise dans le groupe comprenant : l'addition, la soustraction, la multiplication, l'application d'une table de correspondance, le minimum, le maximum, la sélection

Dans une réalisation, au moins une opération spécifique de calcul réalise en outre un décalage, et/ou une saturation et/ou un arrondi. Selon l'invention l'opération spécifique de calcul de sélection permet de choisir une donnée parmi au moins deux données en fonction de la valeur d'une troisième donnée Dans une réalisation l'application d'une table de correspondance est réalisée par un calcul mettant en œuvre l'entrée de la table et un nombre limité de coefficients. Dans une réalisation, le nombre limité de coefficients est fixé à 8.

Dans une réalisation, les opérations spécifiques sont effectuées par des unités de calcul chaînées au moyen d'au moins un chaînage circulaire CCI ; ledit chaînage circulaire CCI comportant en outre au moins une file ; au moins une opération spécifique IS4 de la séquence d'opération spécifique transmettant le résultat d'une opération spécifique IS5 effectuée sur une unité de calcul UCl à l'unité de calcul UC2 ou file qui suit ladite unité de calcul UCl selon ledit chaînage. Dans une réalisation l'opération spécifique IS4 transmet, depuis la file, à l'unité de calcul UCO qui suit la file, le résultat d'une opération spécifique IS5 effectuée lors d'un sous-traitement précédent. De préférence la file permet de sortir les données dans le même ordre qu' elles ont été entrées dans la file. De préférence, un chaînage comprenant des unités de calcul et une file comprend un mécanisme permettant de gérer l'amorçage : la file est initialisée régulièrement, par exemple en début de chaque ligne si la file fait partie d'un chaînage horizontal et l'objet est une image ; à la première exécution de l'opération spécifique IS4, aucune donnée n'est transmise à UCO depuis la file ; ensuite, l'opération spécifique IS4 transmet, depuis la file, à l'unité de calcul UCO qui suit la file, le résultat d'une opération spécifique IS5 effectuée lors d'un sous-traitement précédent. Dans une réalisation, le sous-objet comporte DSO dimensions, les opérations spécifiques sont effectuées par des unités de calcul chaînées selon une dimension déterminée DD du sous-objet au moyen d'au moins un chaînage circulaire CCI ; ledit chaînage circulaire CCI comporte en outre au moins une file ; le procédé comprend en outre l'étape, pour au moins une opération spécifique, pour chaque application de ladite opération spécifique de transmettre le résultat de ladite application de l'opération spécifique effectuée sur une unité de calcul UCl à l'unité de calcul UC2 ou file qui suit ladite unité de calcul UCl selon ledit chaînage de transmettre depuis la file à l'unité de traitement UCO qui suit la file, de manière conditionnelle en fonction de la position du sous-objet dans l'objet, un résultat de l'application de l'opération spécifique transmis à la file lors du traitement d'un autre sous-objet.

Dans une autre réalisation, les opérations spécifiques comprennent au moins une opération spécifique géométrique prise dans le groupe comprenant : la transposition, la réplication, le sous-échantillonnage

Les opérations spécifiques géométriques permettent notamment: - d'ordonner des données, - de sélectionner des données afin de faire des calculs de changement d'échelle, de sous-échantillonnage ou de suréchantillonnage

- de sélectionner des données afin de supprimer des données inutiles, notamment sur les bords.

Selon les réalisation, les opérations spécifiques peuvent être effectuées par des unités de calcul chaînées selon au moins un chaînage circulaire ; ledit chaînage circulaire comportant en outre au moins une file.

Dans une autre réalisation encore, les opérations spécifiques sont effectuées par des unités de calcul chaînées selon au moins un chaînage circulaire ; ledit chaînage circulaire comportant en outre au moins une file ; la file ayant une taille et/ou une latence ; le procédé comprenant en outre l'étape de déterminer la taille et/ou la latence de la file en fonction de la séquence d' opérations générique et du mode de parcours . De préférence tel que décrit précédemment, la file comprend plusieurs flux de données, et permet de stocker pour chaque flux un nombre NF identique de données . NF est déterminé en fonction de la disposition relative des sous-objets et du mode de parcours, de sorte que NF-I sous-objets soient traités entre le traitement d'un sous-objet produisant une donnée et le traitement du sous-objet utilisant la donnée.

De préférence, les objets à traiter sont des images, et les informations élémentaires sont les pixels de cette image.

Ainsi, dans une réalisation, la plateforme de traitement fait partie d'un appareil de capture et/ou de restitution d'image, et les valeurs des paramètres sont liées aux caractéristiques de l'optique et/ou du capteur et/ou de l'imageur et/ou de l'électronique et/ou du logiciel de l'appareil de capture et/ou de restitution d'images. Les caractéristiques peuvent être, par exemple, des caractéristiques intrinsèques fixes pour tous les objets ou variables selon l'objet, par exemple des caractéristiques de bruit qui varient en fonction du gain d'un capteur. Les caractéristiques peuvent être identiques pour toutes les informations élémentaires ou variables selon la position absolue de l'information élémentaire, par exemple les caractéristiques de flou de l'optique.

Dans une autre réalisation, l'objet à traiter est un signal sonore numérisé, et, dans ce cas, les informations élémentaires sont les échantillons sonores de ce signal. Dans ce cas, les positions relatives présentes dans les secondes données seront généralement des positions temporelles. Il peut toutefois arriver que ces positions soient spatiales, notamment dans le cas où l'objet à traiter est un son présent sur plusieurs canaux .

Dans une autre réalisation de l'invention, notamment dans le cas de la simulation numérique, l'objet à traiter est un maillage numérique et les informations élémentaires sont les informations spatiales et temporelles caractérisant chaque point du maillage.

Les données formatées spécifiques décrites ici peuvent être fournies directement à une plateforme de traitement. Mais elles peuvent également être fournies, dans un langage informatique connu, tel que le C ou le VHDL, à un compilateur destiné à traduire ce langage informatique pour la plateforme. Ceci permet, par exemple, d'utiliser une plateforme existante dotée d'un compilateur, sans avoir à s'occuper de l'allocation des registres ou du séquencement temporel des instructions (« scheduling en anglais ») .

L' invention concerne également un système de traitement de données formatées génériques, comprenant des premières données décrivant une séquence d'opérations génériques ne comprenant pas de boucles, le système fournissant, directement ou indirectement, des données formatées spécifiques, pour une plateforme déterminée comportant Q processeur (s) et au moins une mémoire, la plateforme étant destinée à traiter, en fonction des données formatées spécifiques, un objet constitué d'informations élémentaires de même nature, chaque information élémentaire étant représentée par au moins une valeur numérique, le système comprenant :

- des moyens pour la séquence d' opérations génériques en une séquence d'opérations spécifiques, en fonction de la plateforme, - des moyens pour déterminer l'ensemble des boucles nécessaires au traitement en fonction de l'architecture de la plateforme et en fonction de la topologie de l'objet, et de manière indépendante des premières données, des moyens pour calculer les données formatées spécifiques comprenant la séquence d'opérations spécifiques et les boucles ainsi déterminées et permettant, directement ou indirectement, de traiter l'objet conformément aux données formatées génériques, de manière optimisée pour la plateforme en terme de taille de code et/ou taille mémoire et/ou temps de calcul .

Dans une réalisation, le système comprend : - des moyens pour déterminer un mode de parcours des informations élémentaires dans la plateforme en fonction de l'architecture de cette plateforme et en fonction de la topologie de l'objet et de manière indépendante des premières données, ces moyens pour déterminer ce mode de parcours comprenant des moyens pour choisir et/ou calculer :

- un groupement d'informations élémentaires en sous-objets, comprenant chacun un nombre N d' informations élémentaires, multiple de Q, déterminé en fonction de la plateforme, le traitement dans la plateforme consistant à démarrer périodiquement un sous-traitement, qui consiste à appliquer la séquence d'opérations spécifiques sur l'un des sous-objets, la forme et le recouvrement des sous-objets, déterminés en fonction de la plateforme, l'ordre de traitement des sous-objets, déterminé en fonction de la plateforme, - , et

- les moyens pour déterminer l'ensemble des boucles nécessaires au traitement et/ou pour calculer la séquence d' opérations spécifiques tenant compte du mode de parcours .

Dans une réalisation, le système comprend des moyens pour déterminer quelle (s) opérations spécifique (s) de la séquence d'opérations spécifiques est (sont) effectuées par chaque processeur, chacune des opérations spécifiques étant appliquée au moins N fois sur chaque sous-objet, chaque opération spécifique faisant intervenir, directement et/ou indirectement, au moins une fois chacune des informations élémentaires d'un sous-objet au cours de ses N applications et produisant exactement N résultats ; le procédé comprenant en outre l'étape d'ajouter aux données formatées spécifiques les informations ainsi déterminées.

Dans une réalisation, le système comprend des moyens pour déterminer, à chaque instant relatif de la période, quelle (s) opérations spécifique (s) de la séquence d'opérations spécifiques est (sont) effectuées par chaque processeur, chacune des opérations spécifiques étant appliquée au moins N fois sur chaque sous-objet, chaque opération spécifique faisant intervenir, directement et/ou indirectement, au moins une fois chacune des informations élémentaires d'un sous-objet au cours de ses N applications et produisant exactement N résultats ; le procédé comprenant en outre l'étape d'ajouter aux données formatées spécifiques les informations ainsi déterminées.

Dans une réalisation, le système comprend des moyens pour, dans le cas où le nombre d'opérations spécifiques à appliquer sur chaque sous-objet n'est pas un multiple du nombre de processeurs Q et/ou le nombre d' informations élémentaires de l'objet à traiter n'est pas un multiple de N, ajouter des opérations spécifiques sans effet et/ou des informations élémentaires nulles, de manière que le nombre d'opérations spécifiques soit un multiple de Q et que le nombre d'informations élémentaires soit un multiple de N.

Dans une réalisation, le système comprend: - des moyens pour que la séquence d'opérations génériques s'applique à au moins un ensemble d'informations élémentaires dénommé bloc logique, des moyens pour recevoir des données formatées génériques comprenant des secondes données, pour les opérations génériques impliquant au moins deux blocs logiques, se rapportant à la position relative et/ou à l'échelle relative, notamment spatiale ou temporelle, des blocs logiques les uns par rapport aux autres, des moyens pour que les informations élémentaires et/ou résultats d'opérations spécifiques sur lesquels doit s'appliquer chaque opération spécifique dépendent des secondes données et des moyens pour, dans le cas où au moins une position relative des blocs logiques les uns par rapport aux autres est non nulle, qu'au moins une opération spécifique fasse intervenir, directement et/ou indirectement, au moins une information élémentaire d'un autre sous-objet.

Dans une réalisation, le système comprend des moyens pour déterminer, en fonction des secondes données, une partie des résultats d'opérations spécifiques nécessaires aux opérations spécifiques ultérieures pour un autre sous- traitement .

Dans une réalisation, le système comprend une mémoire dans laquelle sont groupés les résultats d'opérations spécifiques nécessaires aux opérations spécifiques ultérieures pour un autre sous-traitement en fonction des secondes données et/ou du mode de parcours .

Dans une réalisation, le système comprend des unités de calcul chaînées selon au moins un chaînage circulaire, et des moyens pour déterminer, en fonction des secondes données pour chaque opération spécifique, s'il faut ou non transmettre les résultats de ladite opération spécifique selon un chaînage circulaire. Le système comprend également des moyens pour, le cas échéant, déterminer, en fonction des secondes données et du mode de parcours, le chaînage circulaire à utiliser pour transmettre les résultats de ladite opération spécifiques .

Dans une réalisation, le système comprend des moyens pour que les données formatées spécifiques comprennent des informations concernant le groupement des opérations spécifiques, ce groupement consistant en la formation de paquets de une ou plusieurs opérations spécifiques destinées à être exécutées sans conserver les résultats de chaque opération spécifiques pour un autre sous-traitement .

Dans une réalisation, le système comprend des moyens pour que les données formatées spécifiques comprennent des opérations permettant de garder en mémoire de la plateforme au moins une partie des résultats d'opérations spécifiques nécessaires aux opérations spécifiques ultérieures pour un autre sous-traitement .

Dans une réalisation, le système comprend une mémoire dans laquelle sont groupés les résultats d'opérations spécifiques utilisées lors du sous-traitement d'un autre sous- objet, en fonction de la position relative dudit autre sous- objet par rapport audit sous-objet. Dans une réalisation, le système comprend au moins une file dans laquelle sont groupés les résultats d' opérations spécifiques effectuées lors du sous-traitement d'un sous-objet et utilisés lors du sous-traitement d'un autre sous-objet.

Dans une réalisation, le système comprend des moyens pour que les données formatées spécifiques comprennent des opérations spécifiques pour que des résultats d' opérations spécifiques soient calculés plusieurs fois dans la plateforme, de manière à ne perdre aucune information au moment de l'exécution des opérations spécifiques, notamment dans le cas où les sous-objets ont un recouvrement dans au moins une dimension de l'objet.

Dans une réalisation, le système comprend des moyens pour que les données formatées spécifiques contiennent des informations d'adressage permettant à la plateforme d'accéder à au moins une partie des résultats d'opérations spécifiques et/ou informations élémentaires en mémoire, ces informations d'adressage étant sous la forme « adresse de base + décalage » ou « adresse de base + décalage modulo (la taille d'une mémoire tampon située dans la plateforme) , le décalage étant constant pour les résultats issus d'une même opération spécifique.

Dans une réalisation, le système comprend des moyens pour modifier l'adresse de base pour chaque sous-traitement.

Dans une réalisation, le système comprend des moyens pour calculer le décalage en fonction de l'ordre des opérations spécifiques, de manière à fournir à la plateforme des adresses d' emplacements mémoire vide ou contenant un résultat d' opération spécifique ou une information élémentaire qui n' est plus utilisée, afin de stocker des résultats d'opérations spécifiques . Dans une réalisation, le système comprend des moyens pour calculer au moins une boucle, le nombre d'itérations de la (ou des) boucle (s) et, quand il y a plusieurs boucles, les imbrications des boucles, en fonction du mode de parcours.

Dans une réalisation, le système comprend des moyens pour traiter en outre au moins un paramètre, de façon telle que la (les) valeur (s) du (des) paramètre (s) utilisé (s) par les opérations spécifiques dépende (nt) de la position dans les sous- objets des informations élémentaires mises en jeu, directement ou indirectement, dans ces opérations spécifiques.

Dans une réalisation, le système comprend des moyens pour traiter en outre au moins un paramètre, de façon telle que les données formatées spécifiques comprennent la (les) valeur (s) du (des) paramètres et/ou un code de calcul de la (des) valeur (s) du (des) paramètre (s) .

Dans une réalisation, le système comprend des moyens pour traiter, en outre, au moins un paramètre, et comprenant des moyens pour choisir la (les) valeur (s) de paramètre (s) en fonction de la plateforme de traitement, de sorte que le traitement tienne compte des caractéristiques de cette plateforme.

Dans une réalisation, le système comprend des moyens pour traiter en outre au moins un paramètre, de façon telle que la (les) valeur (s) du (des) paramètre (s) dépende (nt) de l'objet à traiter.

Dans une réalisation, le système comprend des moyens pour effectuer une opération spécifique comprise dans le groupe comprenant : l'addition, la soustraction, la multiplication, l'application d'une table de correspondance, le minimum, le maximum, la sélection. Dans une réalisation, le système comprend des unités de calculs chaînées au moyen d'au moins un chaînage circulaire CCI, ledit chaînage circulaire CCI comportant en outre au moins une file ; le système comportant des moyens pour transmettre le résultat d'une opération spécifique IS5 effectuée sur une unité de calcul UCIs, à une unité de calcul UC2 ou file qui suit ladite unité de calcul UCl selon ledit chaînage.

Dans une réalisation, le système comprend des moyens pour effectuer au moins une opération spécifique géométrique comprise dans le groupe comprenant : la transposition, la réplication et le sous-échantillonnage.

Dans une réalisation, le système comprend des unités de calcul chaînées selon au moins un chaînage circulaire, le chaînage circulaire comportant en outre au moins une file.

Dans une réalisation, le système comprend des unités de calcul chaînées selon au moins un chaînage circulaire, le chaînage circulaire comportant en outre au moins une file, et le système comportant des moyens pour déterminer une taille et/ou une latence de la file en fonction de la séquence d' opérations génériques et du mode de parcours .

Dans une réalisation, le système comprend des moyens pour que l'objet à traiter soit une image et pour que les informations élémentaires soient des pixels de cette image.

Dans une réalisation, le système comprend des moyens pour que la plateforme de traitement fasse partie d'un appareil de capture et/ou de restitution d'image, et pour que la (les) valeur (s) du (des) paramètre (s) soi (en) t liée (s) aux caractéristiques de l'optique et/ou du capteur et/ou de l'imageur et/ou de l'électronique et/ou du logiciel de l'appareil de capture et/ou de restitution d'images.

Dans une réalisation, le système comprend des moyens pour que l'objet à traiter soit un signal sonore numérisé et pour que les informations élémentaires soient des échantillons sonores de ce signal.

Dans une réalisation, le système comprend des moyens pour que l'objet à traiter soit un maillage numérique et pour que les des informations élémentaires des informations spatiales et temporelles caractérisant chaque point du maillage.

D'autres caractéristiques et avantages de l'invention apparaîtront avec la description non limitative de certains de ses modes de réalisation, cette description étant effectuée à l'aide des figures sur lesquelles :

Les figures la, Ib, Ic Id, I^e et If, déjà décrites, représentent des exemples de décomposition d'une image en sous-objets, conformément à l'invention

La figure 2, déjà décrite, représente un exemple de séquencement de plusieurs sous traitements, la figure 3 représente un dispositif utilisant un procédé conforme à l'invention, - la figure 4 représente un exemple d'une séquence d' opérations génériques appliquée à plusieurs blocs logiques et à un paramètre, la figure 5 représente la structure de données formatées spécifiques fournies par un procédé conforme à l'invention, les figures 6, 7 et 8 présentent différentes architectures de plateformes pouvant recevoir des données formatées spécifiques fournies par un procédé conforme à l' invention. les figures 9a, 9b et 9c montrent des exemples de chaînage des processeurs dans une plateforme pouvant recevoir des données formatées spécifiques fournies par un procédé conforme à l'invention.

Le dispositif représenté sur la figure 3 est utilisé pour traiter une image 22, cette image étant un ensemble de pixels représentés par au moins une valeur numérique. Dans ce dispositif, on fournit à un moyen de traitement de données numériques 10 des données formatées génériques 12. Ce moyen de traitement peut par exemple être un compilateur.

Les données formatées génériques, fournies par un procédé conforme à l'invention, comprennent des premières et secondes données 14 qui décrivent des séquences d'opérations génériques et qui donnent les positions relatives des blocs logiques impliqués dans ces opérations génériques . Ces premières et secondes données seront illustrées par la description de la figure 4.

Le moyen de traitement 10 reçoit également en entrée un mode parcours 24 choisi ou calculé en fonction des caractéristiques d'une plateforme de traitement 20, telle qu'un appareil de capture ou de restitution d' images . A partir de ces données formatées génériques 12 et de ces paramètres, le moyen de traitement 10 fournit à la plateforme de traitement 20 des données formatées spécifiques 18.

Les données formatées spécifiques contiennent différents types de données, telles que des données concernant l'organisation des pixels dans la mémoire de la plateforme, l'ordre dans lequel les pixels sont traités par la plateforme ou encore le groupement des opérations spécifiques effectuées par la plateforme. La plateforme 20 utilise alors ces données formatées spécifiques 18 pour traiter l'image 22 qu'elle reçoit en entrée. La figure 3 illustre ainsi plusieurs avantages de l'invention : - on peut rapidement modifier ou remplacer les données formatées génériques 12 et les traduire en des données formatées spécifiques 18 optimisées pour la plateforme. Ceci permet de réduire le temps de mise sur le marché de la plateforme.

- on peut rapidement traduire les données formatées génériques 12 en des données formatées spécifiques optimisées pour plusieurs plateforme. Ceci permet également de réduire le temps de mise sur le marché de plusieurs plateformes.

Le tableau 4 ci-dessous et la figure 4 montrent un exemple de données formatées génériques, sous la forme d'une séquence d'opérations génériques appliquées à un bloc logique Bl . Cette séquence comporte trois opérations génériques . Les colonnes du tableau représentent, dans l'ordre : le rang de l'opération dans la séquence, le nom de l'opération générique, - le bloc logique (sortie) sur lequel est inscrit le résultat de l'opération générique, c'est-à-dire l'emplacement où se trouverait ce résultat si on reconstituait l'objet à l'issue de chaque opération, la première entrée (entrée 1) de l'opération générique, qui peut être un bloc logique ou un paramètre, la position relative du bloc logique à utiliser par rapport au bloc logique mis en entrée 1, s'il y a lieu, la seconde entrée (entrée 2) de l'opération générique, qui peut également être un bloc logique ou un paramètre, et - la position relative du bloc logique à utiliser par rapport au bloc logique mis en entrée 2, s'il y a lieu.

Les informations se trouvant dans les colonnes « position relative » sont les informations présentes dans les secondes données fournies à un moyen de traitement grâce à un procédé selon l'invention. Dans ce tableau, ces informations se trouvent sous la forme « gauche » et « droite » pour être compréhensibles, mais en réalité, dans les données formatées génériques, elles peuvent également être codées par des valeurs numériques telles que (0 ;1) et/ou par des fonctions telle que f (x ; y) , comme décrit dans les exemples de réalisation plus haut.

Dans une réalisation, une opération générique permet d'obtenir un bloc logique constitué de la position absolue selon une dimension de l'objet, une autre opération générique dite d' indirection permet d' obtenir un bloc par déplacement et/ou changement d' échelle indiqué par un deuxième bloc à partir d'un troisième bloc. On peut alors effectuer les calculs des fonctions donnant la position relative et/ou l'échelle relative par exemple 0,5*(x-100) à l'aide d'opérations génériques sur les blocs puis utiliser l'opération générique d' indirection pour effectuer le déplacement relatif et/ou le changement d'échelle relatif correspondant . Le tableau 4 n'est qu'un exemple de codage, les premières données et secondes données peuvent être codées de diverses façons sous forme tabulée, mais également sous forme symbolique, sous forme graphique ou sous toute autre forme. De plus, des informations supplémentaires relatives aux types des données, aux décalages et saturations ne sont pas représentées à des fins de simplification de l'exemple.

TABLEAU IV

Le premier bloc logique utilisé dans cette séquence d'opérations est un bloc logique Bl (51). La première opération générique est une addition (52) entre le bloc logique Bl décalé à gauche (51g) , et le bloc logique Bl décalé à droite (5Id) . Le résultat de cette addition est inscrit dans le bloc B2 (53) : B2=Blgauche + Bldroite. La deuxième opération (54) est une transformation du bloc B2 (53) par rapport à une table. Cette opération a donc en entrée le bloc B2 (53) et un paramètre Paraml (55) qui représente la table de modification. Le résultat de cette opération est inscrite dans le bloc B3 (56) : B3 = LUT (Paraml, B2).

La troisième et dernière opération (57) de cette séquence est une multiplication de blocs logiques . Cette opération a pour entrées le bloc logique B3 (56) et le bloc logique Bl (51) : B4 = B3*Bl . Le bloc logique B4 (58) est ainsi le bloc obtenu à l'issue de la séquence d'opérations génériques.

Les données formatées génériques de l'exemple du tableau 4 sont indépendantes de la plateforme, de la décomposition de l'objet en sous-objets, du mode de parcours des informations élémentaires de l'objet, de l'ordre dans lequel les informations élémentaires seront traitées dans la plateforme, ainsi que de l'organisation en mémoire. En effet, les données formatées génériques du tableau 1 peuvent être traduites de diverses façons en données formatées spécifiques ou en code pour la plateforme, par exemple, sans que la liste soit limitative, selon les traductions suivantes .

Un premier exemple de traduction, bien que non optimal en terme de mémoire et de temps de calcul, permet d'illustrer une traduction simple sans passer par une décomposition en sous- objets :

Pour chaque pixel de l'objet d'entrée BPl (correspondant au bloc logique Bl) en excluant les deux colonnes de gauche et de droite, les pixels étant parcourus de gauche à droite puis de haut en bas :

Additionner le pixel situé à gauche du pixel courant et le pixel situé à droite, stocker le résultat dans un bloc physique BP2 (correspondant au bloc logique B2) .

Pour chaque pixel de BP2 parcouru de gauche à droite puis de haut en bas : appliquer la table au pixel courant, et stocker le résultat dans un bloc physique BP3 (correspondant au bloc logique B3)

Pour chaque pixel de BP3 parcouru de gauche à droite puis de haut en bas : Multiplier le pixel courant par le pixel correspondant de BPl et stocker le résultat dans le bloc physique de sortie BP4 (correspondant au bloc logique B4)

Un deuxième exemple de traduction montre que l'on peut diminuer la taille de la mémoire utilisée sans changer les données formatées génériques. En effet, dans le premier exemple on utilise 4 blocs physiques de taille voisine de l'image. On peut n'utiliser que 2 blocs physique en utilisant la même mémoire pour BP2 , BP3 et BP4. On obtient la traduction suivante :

Additionner le pixel situé à gauche du pixel courant et le pixel situé à droite, stocker le résultat dans un bloc physique BP2 (correspondant au bloc logique B2) . Pour chaque pixel de BP2 parcouru de gauche à droite puis de haut en bas : appliquer la table au pixel courant, et stocker le résultat dans un bloc physique BP2 (correspondant maintenant au bloc logique B3)

Pour chaque pixel de BP2 parcouru de gauche à droite puis de haut en bas :

Multiplier le pixel courant par le pixel correspondant de BPl et stocker le résultat dans le bloc physique de sortie BP2 (correspondant maintenant au bloc logique B4)

Un troisième exemple de traduction montre que l'on peut réduire le temps de calcul sans changer les données formatées génériques. En effet, dans le deuxième exemple, on utilise 2 blocs physiques de taille voisine de l'image, mais on écrit 3 fois entièrement le bloc physique BP2, on lit 2 fois entièrement le bloc physique BPl et on lit 2 fois entièrement le bloc physique BP2. On peut se limiter à seulement une lecture et une écriture avec un mode de parcours différent et des blocs différents. Ceci réduit le nombre d'opérations nécessaires, mais également les accès à la mémoire. On obtient la traduction suivante :

Pour chaque pixel de l'objet d'entrée BPl (correspondant au bloc logique Bl) en excluant les deux colonnes de gauche et de droite, les pixels étant parcourus de gauche à droite puis de haut en bas : Effectuer la séquence d'opération spécifique suivante : Additionner le pixel situé à gauche du pixel courant et le pixel situé à droite, appliquer la table au résultat et multiplier la sortie de la table par le pixel courant , stocker le résultat dans le bloc physique courant de sortie BP2 (correspondant au bloc logique B4) Dans un quatrième exemple, plus particulièrement adapté à un processeur scalaire avec cache, on écrit le résultat dans la même zone mémoire que l'entrée. Ceci permet de réduire encore la taille de la mémoire et de rendre local les accès mémoire, ce qui est très favorable dans le cas d'une mémoire cache ou une mémoire paginée. On obtient ainsi la traduction suivante :

Pour chaque pixel de l'objet d'entrée BPl

(correspondant au bloc logique Bl) en excluant les deux colonnes de gauche et de droite, les pixels étant parcourus de gauche à droite puis de haut en bas :

Effectuer la séquence d'opération spécifique suivante : Additionner le pixel situé à gauche du pixel courant et le pixel situé à droite, appliquer la table au résultat et multiplier la sortie de la table par le pixel courant , stocker le résultat dans le bloc physique courant de sortie BPl à la place du pixel situé à la gauche du pixel courant (le pixel de gauche n'est plus utilisé par la suite, contrairement au pixel courant qui va devenir le pixel de gauche pour la prochaine itération ; BPl correspond partiellement au bloc logique B4 et partiellement au bloc logique Bl)

Un cinquième exemple de traduction est particulièrement adapté à un processeur de traitement du signal disposant d'une petite mémoire rapide et d'une grosse mémoire lente, chaque sous-objet étant un rectangle, par exemple 32x32, ou toute autre valeur maximisant l'utilisation de la mémoire rapide, les rectangles étant jointifs. On obtient ainsi la traduction suivante :

Pour chaque sous-objet, les sous-objets étant parcourus de gauche à droite puis de haut en bas : Lancer un transfert par un mécanisme de DMA

(« direct memory access ») du bloc physique d'entrée suivant depuis la mémoire lente vers la mémoire rapide, correspondant au sous-objet suivant étendu sur une colonne supplémentaire à gauche et à droite, soit 32x34,

Lancer un transfert par un mécanisme de DMA (« direct memory access ») du bloc physique de sortie précédent depuis la mémoire rapide vers la mémoire lente

On prend en entrée le bloc physique correspondant au sous-objet courant étendu sur une colonne supplémentaire à gauche et à droite, soit 32x34 et obtenu à l'issue du DMA. de l'itération précédente

Pour chaque pixel du bloc physique d'entrée (correspondant au bloc logique Bl) en excluant les deux colonnes de gauche et de droite parcouru de gauche à droite puis de haut en bas :

Effectuer la séquence d'opération spécifique suivante : Additionner le pixel situé à gauche du pixel courant et le pixel situé à droite, appliquer la table au résultat et multiplier la sortie de la table par le pixel courant du bloc, stocker le résultat dans le bloc physique courant de sortie (correspondant au bloc logique B4)

Un sixième exemple de traduction est particulièrement adapté à un processeur vectoriel capable d'appliquer un même calcul aux différents pixels du vecteur, chaque sous-objet étant un rectangle, par exemple 64 pixels horizontaux, ou toute autre valeur égale à la taille d'un vecteur que la plateforme sait traiter et stocker. Cette traduction ne nécessite aucune mémoire car un seul vecteur est traité à la fois. On obtient ainsi la traduction suivante :

Pour chaque sous-objet Vl de l'objet d'entrée BPl

(correspondant au bloc logique Bl) en excluant les deux colonnes de gauche, les sous-objets étant parcourus de gauche à droite puis de haut en bas, effectuer la séquence d'opération spécifique suivante :

En début de chaque ligne, créer un vecteur VO contenant, à droite, les 2 pixels de gauche de la ligne Extraire de VO et Vl, le vecteur V2 correspondant aux deux pixels de droite de VO et aux pixels de gauche de Vl, en excluant les 2 pixels de droite de VO;

Additionner Vl et V2 pour obtenir V2, appliquer la table à chaque pixel de V2 pour obtenir V2, Extraire de VO et Vl, le vecteur V3 correspondant au pixel de droite de VO et aux pixels de gauche de Vl en excluant le pixel de droite de VO; copier Vl dans VO pour l'itération suivante ; multiplier V2 par V3 pour obtenir V2, stocker le résultat V2 dans le bloc physique courant de sortie.

Les exemples de traductions ci-dessus montrent qu'il est possible, à partir des mêmes données formatées génériques, de traduire de plusieurs façons avec des structures mémoire, des boucles et un degré de parallélisme adaptés à des plateformes très diverses. En particulier on peut : réduire la taille du code en n'utilisant qu'une seule boucle, et/ou réduire la taille mémoire, à 0 dans l'exemple, mais dans le cas plus général où il y a des filtres verticaux, il faut quand même quelques lignes de mémoire si on veut éviter de refaire des calculs pour les données en entrée des filtre verticaux, et/ou

- réduire le nombre d'opérations nécessaires, notamment en groupant les boucles, et/ou - s'adapter à toute taille de vecteur, et/ou s'adapter à toute architecture mémoire.

Les troisième, quatrième, cinquième et sixième exemples sont des exemples de traduction de la séquence d' opérations génériques en une séquence d' opérations spécifiques. Afin de simplifier, les exemples produisent une image plus petite que l'image d'entrée. On peut facilement, si nécessaire, obtenir une image de sortie de taille identique à l'image d'entrée en ajoutant du code en début et fin de chaque ligne pour dupliquer le pixel du bord.

La figure 5 représente la structure des données formatées spécifiques à la sortie d'un moyen de traitement utilisant un procédé conforme à l'invention. Les données formatées spécifiques sont calculées par un moyen de traitement à partir de données formatées génériques 32 fournies au moyen de traitement et d'un mode de parcours 34 déterminé par ce moyen de traitement. Les données formatées génériques comportent des premières données 36 contenant des données 38 décrivant au moins une opération générique ou séquence d'opérations à réaliser par le moyen de traitement. Les données formatées génériques comportent également des secondes données 40 se rapportant à la position et l'échelle relative de blocs logiques les uns par rapport aux autres, pour les opérations génériques impliquant au moins deux blocs logiques . A partir des ces données formatées génériques et du mode de parcours 34, le moyen de traitement fournit des données 42 relatives aux opérations spécifiques, et des données 44 relatives aux boucles. Ces données 42 et 44 font partie des données formatées spécifiques 30 .

Nous allons maintenant décrire plusieurs exemples de modes de parcours pouvant être déterminés par un procédé conforme à l'invention. Chacun de ces modes de parcours est destiné à être utilisé dans une plateforme dont l'architecture est représentée sur l'une des figures 6 à 8.

Dans un premier exemple, illustré par la figure 6, la plateforme de traitement comporte cinq processeurs chaînés en une dimension. Ceci signifie que le résultat des calculs sortant du processeur Proc A est utilisé en entrée du processeur ProcB, et ainsi de suite. Le résultat des calculs sortant du processeur ProcE est appliqué à l'entrée du processeur ProcA.

Chacun des processeurs est doté d'une mémoire de capacité limitée, notée MemA à MemE Cette unité de mémoire est destinée à stocker les valeurs de paramètres utiles aux opérations spécifiques effectuées par le processeur, ou des informations élémentaires ou résultats d' opérations qui sont destinés à être réutilisés rapidement par le processeur.

Dans ce premier exemple, le traitement consiste à appliquer aux informations élémentaires composant l'objet une séquence de huit opérations notées OPl à 0P8.

Afin de traiter l'objet, celui-ci doit être décomposé en sous-objet de N informations élémentaires. N, qui doit être un multiple de Q (Q = 5, nombres d'unités de calculs), est déterminé en amont de la plateforme par un procédé conforme à l'invention, en fonction notamment des capacités mémoire de la plateforme. Dans l'exemple N = 5. Par ailleurs, afin d'assurer un séquencement régulier des opérations spécifiques, un procédé conforme à l'invention crée des opérations spécifiques sans effet 0P9 et OPlO de telle sorte que le nombre d'opérations spécifiques à réaliser sur chaque sous-objet soit un multiple du nombre de processeurs disponibles.

En fonction du type des opérations spécifiques, on affecte chaque opération à effectuer à un processeur. Ici,

- le processeur A réalise OPl et 0P6,

- le processeur B réalise 0P2 et 0P7, - le processeur C réalise 0P3 et 0P8,

- le processeur D réalise 0P4 et 0P9, et

- le processeur E réalise 0P5 et OPlO.

Chaque processeur exécute un jeu d'instructions (InsA à InsE) correspondant aux opérations spécifiques qui lui ont été affectées. De cette affectation dépendent également les valeurs des paramètres stockés dans les mémoires à capacité limitée. Par exemple, si OPl est une multiplication par 2, la mémoire MemA contiendra le chiffre 2.

Une fois ces affectations réalisées, les opérations se déroulent selon un séquencement décrit par le tableau I ci- dessous :

Dans ce tableau, les instants d'avancement du processus sont notés Tl, T2, T13.

Tableau I

Sous-objet1

Sous-objet2

Chaque ligne représente une des 10 opérations spécifiques OPl à OPlO . Chaque colonne représente une des informations élémentaires IEl à IE5 composant chacun des sous- objets à traiter. Cette notation IEl à IE5 est formelle ; elle ne correspond pas forcément à une réalité spatiale ou temporelle. En effet, certaines opérations spécifiques ont pour effet de déplacer les informations élémentaires. Ainsi, l'information IEl traitée par l'opération spécifique 0P2 peut ne pas être le résultat de l'opération spécifique OPl appliquée à l'information IEl, mais le résultat de cette opération spécifique OPl appliquée à l'information IE2, par exemple si l'opération spécifique OPl consiste en un décalage vers la gauche . Chaque case de ce tableau contient le nom du processeur qui effectue l'opération spécifique, ainsi que le moment où cette opération spécifique est effectuée au cours du traitement. Bien entendu, ce tableau ne représente qu'une partie du traitement. On suppose ici que tous les résultats d'opérations spécifiques nécessaires ont été calculés au préalable dans le traitement.

Ainsi, on peut voir qu'à l'instant Tl, le processeur

ProcA effectue l'opération OPl sur la première information IEl du sous-objet 1. A cet instant, les autres processeurs sont en train d'effectuer d'autres opérations non représentées sur ce tableau.

A l'instant T5, on voit que chacun des processeurs effectue une opération sur une des informations du sous-objet 1. Lorsqu'un processeur a effectué une opération spécifique sur toutes les informations élémentaires d'un sous- objet, il passe à l'opération suivante parmi celles qui lui ont été affectées. Ainsi, le processeur ProcA effectue, à partir de T6, l'opération 0P6.

Lorsqu'un processeur a effectué toutes les opérations spécifiques qui lui ont été affectées, le sous-objet suivant est traité. Deux sous-objets différents (sous-objet 1 et sous-objet 2) sont donc traités en même temps dans la plateforme.

Sur ce tableau on constate bien que chaque opération spécifique est effectuée N fois (ici N = 5) .

Ce séquencement est obtenu par le chaînage circulaire en une dimension des processeurs. Les informations élémentaires peuvent donc transiter d'une unité de calcul à l'autre. Par exemple, l'information élémentaire IEl passe par tous les processeurs pour « subir » les opérations spécifiques OPl à 0P5, puis elle remonte au processeur ProcA pour recommencer un cycle et « subir » les opérations 0P6 à 0P7. (Attention, comme expliqué précédemment, l'information élémentaire IEl de départ ne sera pas forcément l'information IEl à toutes les étapes). On voit ainsi que l'invention permet de générer les données formatées spécifiques adaptées à une architecture systolique qui a l'avantage, notamment, de stocker les valeurs de paramètres localement et de pouvoir câbler les chemins de données . Il est à noter que le séquencement exact peut être réalisé au moins partiellement par un compilateur de la plateforme. Dans ce cas, les données formatées spécifiques ne contiennent pas les séquencement absolu dans le temps, mais plutôt des contraintes sur le séquencement.

Dans un deuxième exemple, illustré sur la figure 7, la plateforme contient cinq processeurs reliés à une mémoire commune. Une telle structure est classique : elle correspond à celle d'un processeur vectoriel (de type « Single Instruction Multiple Data » ou SIMD) . Dans l'exemple, chaque processeur est relié individuellement à une petite mémoire pouvant contenir des paramètres tels qu'une table de correspondance T. Dans cette structure, chaque processeur effectue toutes les opérations spécifiques. Ainsi, tous les processeurs reçoivent le même jeu d'instructions INS. On considère dans ce deuxième exemple le cas où l'une des opérations consiste en l'utilisation d'une table pour modifier une ou plusieurs informations élémentaires . Comme vu précédemment, chacun des processeurs a accès à sa propre table, toutes les tables étant identiques . Dans une variante, chaque mémoire est partagée par un groupe de processeurs. Dans une variante, l'ensemble des processeurs partagent la même mémoire et obtiennent simultanément le même paramètre ; dans ce cas, l'application d'une table de correspondance doit être effectuée par calcul en utilisant un ou plusieurs paramètres pour par exemple calculer un polynôme.

Il s'agit d'une réalisation parallèle : à chaque instant du processus, tous les processeurs réalisent la même opération sur des informations élémentaires différentes . Ce déroulement est illustré par le tableau II ci-dessous : Dans ce tableau, les instants d'avancement du processus sont notés Tl, T2, TlO.

Tableau II

On peut voir dans ce tableau qu'à un instant donné Ti, l'opération spécifique OPi est effectuée par chacun des processeurs ProcA à ProcE respectivement sur les informations élémentaires IEl à IE5. Au bout du lOième incrément, on constate bien que chaque opération spécifique de la séquence d'opérations spécifiques a été réalisée sur chacune des informations élémentaires d'un sous-objet.

Dans ce cas, il apparaît qu'il n'est pas nécessaire de compléter la séquence d'opérations spécifiques par des opérations sans effet, puisque les opérations spécifiques sont réalisées en parallèle par tous les processeurs. De cette façon, une fois l'opération 0P8 terminée, on peut recommencer le processus en appliquant l'opération OPl sur les informations élémentaires constituant le sous-objet suivant.

Il est à noter que le séquencement exact peut être réalisé, au moins partiellement, par un compilateur de la plateforme. Dans ce cas les données formatées spécifiques ne contiennent pas les séquencements absolus dans le temps, mais plutôt des contraintes sur le séquencement. Dans un troisième exemple, illustré par la figure 8, la plateforme comporte un processeur vectoriel composé de cinq processeurs reliés à une mémoire commune, similaire au processeur vectoriel notamment présent dans un ordinateur de type personnel (PC) . Ils sont également tous reliés à une petite mémoire pouvant contenir des paramètres, et notamment une table de correspondance. Dans cette structure, chaque processeur effectue toutes les opérations spécifiques. Ainsi, tous les processeurs reçoivent le même jeu d'instructions INS comportant des données décrivant toutes les opérations spécifiques à réaliser.

On considère dans cet exemple le cas où deux opérations spécifiques de suite consistent en l'utilisation d'une table pour modifier une ou plusieurs informations élémentaires. Ici, les tables ne sont présentes qu'à un seul endroit, et les processeurs doivent donc se les partager.

Au début du processus, on est dans une réalisation parallèle, puisque tous les processeurs réalisent en même temps une même opération sur les différentes informations élémentaires d'un sous-objet. Ce déroulement est illustré par le tableau III ci-dessous :

Dans ce tableau, les instants d'avancement du processus sont notés Tl, T2, ... T18.

Tableau III

On peut voir dans les trois premières lignes de ce tableau qu'à un instant donné Ti, l'opération spécifique OPi est effectuée par chacun des processeurs ProcA à Proc E respectivement sur les informations élémentaires IEl à IE5.

Lorsqu'on arrive à l'opération 0P4 qui utilise une table, on se retrouve face à un problème d'accès, puisque tous les processeurs ne peuvent pas accéder en même temps à cette table. Les processeurs sont donc obligés « d'attendre leur tour », c'est-à-dire d'attendre que le processeur précédent ait fini d'utiliser la table pour pouvoir s'en servir. Ainsi, l'opération 0P4 est effectuée par les processeurs ProcA à ProcE respectivement aux instants T4 à T8. Si l'on suppose que l'opération 0P5 fait également appel à une table, on aura de la même façon : l'opération 0P5 est effectuée par les processeurs ProcA à ProcE respectivement aux instants T9 à T13.

Une fois ces opérations effectuées, le processus peut reprendre normalement.

Dans ce dispositif, on obtient des résultats moins bons en temps de calcul que dans les autres exemples, puisque à certains instants, certains processeurs sont inactifs mais on réduit la taille mémoire.

Il est à noter que le séquencement exact peut être réalisé au moins partiellement par un compilateur de la plateforme. Dans ce cas les données formatées spécifiques ne contiennent pas les séquencements absolus dans le temps, mais plutôt des contraintes sur le séquencement .

La figure 9a montre un exemple de réalisation d'une plateforme, comportant plusieurs chaînages circulaires selon une dimension du sous-objet. Dans ce premier exemple, l'objet est une image à deux dimensions, le sous-objet comporte 4 informations élémentaires, et le la plateforme comporte 4 processeurs disposés selon une grille de 4*1 processeurs correspondant à un rectangle de 4 processeurs horizontalement et 1 processeur verticalement. Les processeurs sont appelés de gauche à droite : Pl, P2, P3, et P4. Le procédé met en œuvre également dans cet exemple 2 files : - une file horizontale FHa est connectée en entrée à une sortie de P4 et en sortie à une entrée du processeur Pl . Une sortie de Pl est connectée à une entrée de P2. Une sortie de P2 est connectée à une entrée de P3, et une sortie de P3 est connectée à une entrée de P4. - une file verticale FVa est connectée en entrée à une sortie de Pl, P2, P3 et P4 et en sortie à une entrée du processeur Pl, P2, P3 et P4.

La séquence d'opérations spécifiques peut mettre en œuvre un nombre arbitraire de filtres horizontaux FH tout en utilisant les 4 processeurs à 100%. Par exemple, dans le cas d'une opération spécifique 0S2 effectuant le calcul d'un filtre constitué d'une addition entre le résultat d'une opération spécifique OSl et le résultat de la même opération spécifique OSl située à gauche : le résultat de l'opération OSl du processeur P4 est mise dans la file FHa et sera utilisé par 0S2 sur Pl lors du calcul d'un prochain sous-objet ; le résultat de l'opération OSl du processeur P3 est transférée au processeur P4 pour être utilisée par 0S2 sur P4 en combinaison avec le résultat de OSl sur P4;le résultat de l'opération OSl du processeur P2 est transférée au processeur P3 pour être utilisée par 0S2 sur P3 en combinaison avec le résultat de OSl sur P3; le résultat de l'opération OSl du processeur Pl est transférée au processeur P2 pour être utilisée par 0S2 sur P2 en combinaison avec le résultat de OSl sur P2; le résultat de l'opération OSl effectuée par P4 lors d'un calcul d'un précédent sous-objet est sorti de la file FHa et transféré au processeur Pl pour être utilisée par 0S2 sur Pl en combinaison avec le résultat de OSl sur Pl; Une autre opération spécifique 0S3 de la séquence peut mettre en œuvre un autre filtre horizontal, la file permet de récupérer les données dans le bon ordre .

- Mutatis mutandis, la séquence d'opérations spécifiques peut mettre en œuvre un nombre arbitraire de filtres verticaux FV tout en utilisant les 4 processeurs à 100%,

- Enfin, la séquence d'opérations spécifiques peut mettre en œuvre un nombre arbitraire de filtres non séparables selon les 2 dimensions horizontale et verticale FVH tout en utilisant les 4 processeurs à 100% ; par exemple un filtre non séparable 3x3 appliqué sur 4 résultats d'une opération spécifique 0S4, peut solliciter deux fois FVa puis six fois FHa, pour obtenir les 8 jeux de 4 résultats de 0S4 précédemment calculés à combiner avec le jeu de résultat de 0S4 du sous-objet courant; par exemple ces filtres non séparables peuvent être utilisés en combinaison avec des filtres verticaux et/ou horizontaux, les 2 files permettent de récupérer les données dans le bon ordre.

Lorsque l'on met en œuvre 2 filtres, la séquence d'opérations spécifiques est donc telle qu'au moins deux opérations spécifiques distinctes de la séquence produisent chacune au moins une fois au cours de leurs N applications, un résultat utilisé pour le traitement d'un autre sous-objet. Le résultat utilisé pour le traitement d'un autre sous-objet transite par la(les) file(s). De la même façon, la figure 9b montre un second exemple, dans lequel l'objet est une image à deux dimensions, le sous- objet comporte 4 informations élémentaires, et la plateforme comporte 4 processeurs disposés selon une grille de 2*2 processeurs correspondant à un rectangle de 2 processeurs horizontalement et 2 processeurs verticalement. Les processeurs sont appelés de gauche à droite : P4 et P5 sur la ligne du haut et P6 et P7sur la ligne du bas. Le procédé met en œuvre également dans cet exemple 2 files : - une file horizontale FHb est connectée en entrée à la sortie de P3 et de P6 et en sortie à l'entrée de Pl et P4 une file verticale FVb est connectée en entrée à une sortie de P4 et P5 et en sortie à une entrée du processeur P6 et P7.De même que dans l'exemple de la figure 9a, la séquence d'opérations spécifiques peut mettre en œuvre un nombre arbitraire de filtres verticaux et/ou horizontaux et /ou non séparables tout en utilisant les 4 processeurs à 100%.

Dans une troisième exemple, illustré sur la figure 9c, la plateforme comporte un seul processeur P8, connecté à une file horizontale FHc et à une file verticale FVc. Ces deux files peuvent être utilisées par le processeur pour stocker des résultats d'opérations spécifiques destinées à être réutilisées ultérieurement . De même que dans l'exemple de la figure 9a, la séquence d'opérations spécifiques peut mettre en œuvre un nombre arbitraire de filtres verticaux et/ou horizontaux et /ou non séparables tout en utilisant le processeur à 100%.

Claims

REVENDIC-VTIONS

1. Procédé de traitement de données formatées génériques (12) , comprenant des premières données (14) décrivant une séquence d'opérations génériques ne comprenant pas de boucles, en vue de fournir directement ou indirectement des données formatées spécifiques (18) , pour une plateforme déterminée (20) comportant Q processeur (s) et au moins une mémoire, la plateforme étant destinée à traiter, en fonction des données formatées spécifiques (18) , un objet (22) constitué d'informations élémentaires de même nature, chaque information élémentaire étant représentée par au moins une valeur numérique ; le procédé comprenant les étapes suivantes : l'étape de traduire la séquence d'opérations génériques en une séquence d'opérations spécifiques, en fonction de la plateforme, - l'étape de déterminer l'ensemble des boucles nécessaires au traitement en fonction de l'architecture de la plateforme et en fonction de la topologie de l'objet, et de manière indépendante des premières données, et l'étape de calculer les données formatées spécifiques comprenant la séquence d'opérations spécifiques et les boucles ainsi déterminées et permettant directement ou indirectement de traiter l'objet conformément aux données formatées génériques, de manière optimisée pour la plateforme en terme de taille de code et/ou taille mémoire et/ou temps de calcul.

2. Procédé selon la revendication 1, le procédé comprenant en outre l'étape de déterminer un mode de parcours (24) des informations élémentaires dans la plateforme en fonction de l'architecture de cette plateforme (22) et en fonction de la topologie de l'objet et de manière indépendante des premières données, la détermination de ce mode de parcours comprenant le choix et/ou calcul : d'un groupement d'informations élémentaires en sous- objets, comprenant chacun un nombre N d'informations élémentaires , déterminé en fonction de la plateforme, le traitement dans la plateforme consistant à démarrer périodiquement un sous-traitement, qui consiste à appliquer la séquence d'opérations spécifiques sur l'un des sous-objets, de la forme et du recouvrement des sous-objets, déterminés en fonction de la plateforme, de l'ordre de traitement des sous-objets, déterminé en fonction de la plateforme, l'étape de déterminer l'ensemble des boucles nécessaires au traitement et/ou l'étape de calculer la séquence d'opérations spécifiques tenant compte du mode de parcours .

3. Procédé selon la revendication 2 dans lequel la détermination d'un mode de parcours comprend l'étape de déterminer quelle (s) opération (s) spécifique (s) de la séquence d'opérations spécifiques est (sont) effectuée (s) par chaque processeur, chacune des opérations spécifiques étant appliquée au moins N fois sur chaque sous-objet, chaque opération spécifique faisant intervenir, directement et/ou indirectement, au moins une fois chacune des informations élémentaires d'un sous-objet au cours de ses N applications et produisant exactement N résultats ; le procédé comprenant en outre l'étape d'ajouter aux données formatées spécifiques les informations ainsi déterminées.

4. Procédé selon la revendication 2 ou 3 dans lequel la détermination d'un mode de parcours comprend l'étape de déterminer à chaque instant relatif de la période, quelle (s) opération (s) spécifique (s) de la séquence d'opérations spécifiques est (sont) effectuée (s) par chaque processeur, chacune des opérations spécifiques étant appliquée au moins N fois sur chaque sous-objet, chaque opération spécifique faisant intervenir, directement et indirectement, au moins une fois chacune des informations élémentaires d'un sous-objet au cours de ses N applications et produisant exactement N résultats ; le procédé comprenant en outre l'étape d'ajouter aux données formatées spécifiques les informations ainsi déterminées.

5. Procédé selon l'une des revendications 2 à 4 comprenant l'étape, dans le cas où le nombre d'opérations spécifiques à appliquer sur chaque sous-objet n'est pas un multiple du nombre de processeurs Q et/ou le nombre d'informations élémentaires de l'objet à traiter n'est pas un multiple de N, d'ajouter des opérations spécifiques sans effet et/ou des informations élémentaires nulles, de manière que le nombre d'opérations spécifiques soit un multiple de Q et que le nombre d'informations élémentaires soit un multiple de N.

6. Procédé selon l'une des revendications précédentes dans lequel la séquence d'opérations génériques s'applique à au moins un ensemble d'informations élémentaires dénommé bloc logique, et les données formatées génériques comprennent en outre des secondes données, pour les opérations génériques impliquant au moins deux blocs logiques, se rapportant à la position relative et/ou une échelle relative, notamment spatiale et/ou temporelle, des blocs logiques les uns par rapport aux autres, et dans lequel les informations élémentaires et/ou résultats d'opérations spécifiques sur lesquels doit s'appliquer chaque opération spécifique dépendent des secondes données et dans lequel, dans le cas où au moins une position relative des blocs logiques les uns par rapport aux autres est non nulle, au moins une opération spécifique fait intervenir, directement ou indirectement, au moins une information élémentaire d'un autre sous-objet.

7. Procédé selon la revendication 6 comprenant l'étape de déterminer en fonction des secondes données une partie des résultats d'opérations spécifiques nécessaires aux opérations spécifiques ultérieures pour un autre sous-traitement.

8. Procédé selon l'une des revendications 2 à 5 et selon l'une des revendications 6 à 7 comprenant en outre l'étape de grouper en mémoire les résultats d' opérations spécifiques nécessaires aux opérations spécifiques ultérieures pour un autre sous-traitement en fonction des secondes données et/ou du mode de parcours .

9. Procédé selon l'une des revendications 2 à 5 et selon l'une des revendications 6 à 8 dans lequel les opérations spécifiques sont effectuées par des unités de calcul chaînées selon au moins un chaînage circulaire ledit procédé comprenant en outre l'étape de déterminer en fonction des secondes données pour chaque opération spécifique, s'il faut ou pas transmettre les résultats de ladite opération spécifique selon un chaînage circulaire ; ledit procédé comprenant en outre le cas échéant, l'étape de déterminer en fonction des secondes données et du mode de parcours quel chaînage circulaire utiliser pour transmettre les résultats de ladite opération spécifique.

10. Procédé selon l'une des revendications 2 à 9 dans lequel les données formatées spécifiques comprennent des informations concernant le groupement des opérations spécifiques, ce groupement consistant en la formation de paquets de une ou plusieurs opérations spécifiques destinées à être exécutées sans conserver les résultats de chaque opération spécifiques non nécessaires à un autre sous-traitement.

11. Procédé selon l'une des revendications 2 à 10 dans lequel les données formatées spécifiques comprennent des opérations spécifiques permettant de garder en mémoire de la plateforme au moins une partie des résultats d' opérations spécifiques nécessaires aux opérations spécifiques ultérieures pour un autre sous-traitement.

12. Procédé selon l'une des revendications 2 à 11 comprenant en outre l'étape de grouper en mémoire les résultats d'opérations spécifiques utilisées lors du sous-traitement d'un autre sous-objet en fonction de la position relative dudit autre sous-objet par rapport audit sous-objet.

13. Procédé selon l'une des revendications 2 à 12 comprenant en outre l'étape de grouper dans au moins une file les résultats d'opérations spécifiques effectuées lors du sous- traitement d'un sous-objet et utilisés lors du sous-traitement d'un autre sous-objet.

14. Procédé selon l'une des revendications 2 à 13 dans lequel les données formatées spécifiques comprennent des opérations spécifiques pour que des résultats d' opérations spécifiques soient calculés plusieurs fois dans la plateforme, de manière à ne perdre aucune information au moment de l'exécution des opérations spécifiques, notamment dans le cas où les sous-objets ont un recouvrement dans au moins une dimension de l'objet.

15. Procédé selon l'une des revendications 2 à 14 dans lequel les données formatées spécifiques contiennent des informations d'adressage pour permettre à la plateforme d' accéder à au moins une partie des résultats d' opérations spécifiques et/ou informations élémentaires en mémoire, ces informations d'adressage étant sous la forme « adresse de base + décalage » ou « (adresse de base + décalage) modulo (la taille d'une mémoire tampon située dans la plateforme), le décalage étant constant pour les résultats issus d'une même opération spécifique pour chaque sous-traitement.

16. Procédé selon la revendication 15 dans lequel on modifie l'adresse de base pour chaque sous-traitement.

17. Procédé selon l'une des revendications 15 ou 16 comprenant l'étape de calculer le décalage en fonction de l'ordre des opérations spécifiques, de manière à fournir à la plateforme des adresses d'emplacements mémoire vide ou contenant un résultat d'opération spécifique ou une information élémentaire qui n'est plus utilisée, afin de stocker des résultats d' opérations spécifiques .

18. Procédé selon l'une des revendications 2 à 17 dans lequel le traitement comporte le calcul d'au moins une boucle, le nombre d'itérations de la ou des boucles et, quand il y a plusieurs boucles, les imbrications des boucles, en fonction du mode de parcours .

19. Procédé selon l'une des revendications 2 à 18 traitant en outre au moins un paramètre, et dans lequel la (les) valeur (s) du (des) paramètre (s) utilisé (s) par les opérations spécifiques dépendent de la position absolue des sous-objets et/ou de la position absolue dans les sous-objets des informations élémentaires mises en jeu, directement ou indirectement, dans ces opérations spécifiques.

20. Procédé selon l'une des revendications précédentes traitant en outre au moins un paramètre, et dans lequel les données formatées spécifiques comprennent la (les) valeur (s) du (des) paramètres et/ou un code de calcul de la (des) valeur (s) du (des) paramètre (s).

21. Procédé selon l'une des revendications précédentes traitant en outre au moins un paramètre, et dans lequel on choisit la (les) valeur (s) de paramètre (s) en fonction de la plateforme de traitement, de sorte que le traitement tienne compte des caractéristiques de cette plateforme.

22. Procédé selon l'une des revendications précédentes traitant en outre au moins un paramètre, et dans lequel la (les) valeur (s) de paramètre (s) dépend (ent) de l'objet à traiter.

23. Procédé selon l'une des revendications précédentes dans lequel les opérations spécifiques comprennent au moins une opération spécifique de calcul prise dans le groupe comprenant : l'addition, la soustraction, la multiplication, l'application d'une table de correspondance, le minimum, le maximum, la sélection

24. Procédé selon l'une des revendications précédentes dans lequel le les opérations spécifiques sont effectuées par des unités de calcul chaînées au moyen d'au moins un chaînage circulaire CCI ; ledit chaînage circulaire CCI comportant en outre au moins une file ; au moins une opération spécifique IS4 de la séquence d'opération spécifique transmettant le résultat d'une opération spécifique IS5 effectuée sur une unité de calcul UCl à l'unité de calcul UC2 ou file qui suit ladite unité de calcul UCl selon ledit chaînage.

25. Procédé selon l'une des revendications précédentes dans lequel les opérations spécifiques comprennent au moins une opération spécifique géométrique prise dans le groupe comprenant : la transposition, la réplication, le sous- échantillonnage

26. Procédé selon l'une des revendications précédentes dans lequel les opérations spécifiques sont effectuées par des unités de calcul chaînées selon au moins un chaînage circulaire ; ledit chaînage circulaire comportant en outre au moins une file ;

27. Procédé selon l'une des revendications 2 à 26 dans lequel les opérations spécifiques sont effectuées par des unités de calcul chaînées selon au moins un chaînage circulaire ; ledit chaînage circulaire comportant en outre au moins une file ; la file ayant une taille et/ou une latence ; le procédé comprenant en outre l'étape de déterminer la taille et/ou la latence de la file en fonction de la séquence d'opérations générique et du mode de parcours .

28. Procédé selon l'une des revendications précédentes dans lequel l'objet à traiter est une image et les informations élémentaires sont des pixels de cette image.

29. Procédé selon l'une des revendications précédentes dans lequel la plateforme de traitement fait partie d'un appareil de capture et/ou de restitution d'image, et dans lequel la (les) valeur (s) du (des) paramètre (s) est (sont) liée (s) aux caractéristiques de l'optique et/ou du capteur et/ou de l'imageur et/ou de l'électronique et/ou du logiciel de l'appareil de capture et/ou de restitution d'images.

30. Procédé selon l'une des revendications 1 à 27dans lequel l'objet à traiter est un signal sonore numérisé et les informations élémentaires sont les échantillons sonores de ce signal.

31. Procédé selon l'une des revendications 1 à 27 dans lequel l'objet à traiter est un maillage numérique et les informations élémentaires sont les informations spatiales et temporelles caractérisant chaque point du maillage.

32. Système de traitement de données formatées génériques (12) , comprenant des premières données (14) décrivant une séquence d'opérations génériques ne comprenant pas de boucles, le système fournissant, directement ou indirectement, des données formatées spécifiques (18) , pour une plateforme déterminée 20) comportant Q processeur (s) et au moins une mémoire, la plateforme étant destinée à traiter, en fonction des données formatées spécifiques (18) , un objet (22) constitué d'informations élémentaires de même nature, chaque information élémentaire étant représentée par au moins une valeur numérique, le système comprenant : des moyens pour traduire la séquence d'opérations génériques en une séquence d'opérations spécifiques, en fonction de la plateforme, des moyens pour déterminer l'ensemble des boucles nécessaires au traitement en fonction de l'architecture de la plateforme et en fonction de la topologie de l'objet, et de manière indépendante des premières données, des moyens pour calculer les données formatées spécifiques comprenant la séquence d'opérations spécifiques contenant les boucles ainsi déterminées et permettant, directement ou indirectement, de traiter l'objet conformément aux données formatées génériques, de manière optimisée pour la plateforme en terme de taille de code et/ou taille mémoire et/ou temps de calcul .

33. Système selon la revendication 32 comprenant :

- des moyens pour déterminer un mode de parcours des informations élémentaires dans la plateforme en fonction de l'architecture de cette plateforme et en fonction de la topologie de l'objet et de manière indépendante des premières données, ces moyens pour déterminer ce mode de parcours comprenant des moyens pour choisir et/ou calculer : - un groupement d'informations élémentaires en sous-objets, comprenant chacun un nombre N d'informations élémentaires, multiple de Q, déterminé en fonction de la plateforme, le traitement dans la plateforme consistant à démarrer périodiquement un sous-traitement sur l'un des sous- objets, la forme et le recouvrement des sous-objets, déterminés en fonction de la plateforme, l'ordre de traitement des sous-objets, déterminé en fonction de la plateforme, - et

34. Système selon la revendication 33 comprenant des moyens pour déterminer quelle (s) opérations spécifique (s) de la séquence d'opérations spécifiques est (sont) effectuées par chaque processeur, chacune des opérations spécifiques étant appliquée au moins N fois sur chaque sous-objet, chaque opération spécifique faisant intervenir, directement et/ou indirectement, au moins une fois chacune des informations élémentaires d'un sous-objet au cours de ses N applications et produisant exactement N résultats ; le procédé comprenant en outre l'étape d'ajouter aux données formatées spécifiques les informations ainsi déterminées.

35. Système selon la revendication 33 ou 34 comprenant des moyens pour déterminer, à chaque instant relatif de la période, quelle (s) opérations spécifique (s) de la séquence d'opérations spécifiques est (sont) effectuées par chaque processeur, chacune des opérations spécifiques étant appliquée au moins N fois sur chaque sous-objet, chaque opération spécifique faisant intervenir, directement et/ou indirectement, au moins une fois chacune des informations élémentaires d'un sous-objet au cours de ses N applications et produisant exactement N résultats ; le procédé comprenant en outre l'étape d'ajouter aux données formatées spécifiques les informations ainsi déterminées.

36. Système selon l'une des revendications 33 à 35 comprenant des moyens pour, dans le cas où le nombre d'opérations spécifiques à appliquer sur chaque sous-objet n'est pas un multiple du nombre de processeurs Q et/ou le nombre d'informations élémentaires de l'objet à traiter n'est pas un multiple de N, ajouter des opérations spécifiques sans effet et/ou des informations élémentaires nulles, de manière que le nombre d'opérations spécifiques soit un multiple de Q et que le nombre d'informations élémentaires soit un multiple de N.

37. Système selon l'une des revendications 32 à 36 comprenant : des moyens pour que la séquence d' opérations génériques s'applique à au moins un ensemble d'informations élémentaires dénommé bloc logique,

- des moyens pour recevoir des données formatées génériques comprenant des secondes données, pour les opérations génériques impliquant au moins deux blocs logiques, se rapportant à la position relative et/ou à l'échelle relative, notamment spatiale ou temporelle, des blocs logiques les uns par rapport aux autres,

- des moyens pour que les informations élémentaires et/ou résultats d'opérations spécifiques sur lesquels doit s'appliquer chaque opération spécifique dépendent des secondes données et des moyens pour, dans le cas où au moins une position relative des blocs logiques les uns par rapport aux autres est non nulle, qu'au moins une opération spécifique fasse intervenir, directement ou indirectement, au moins une information élémentaire d'un autre sous-objet.

38. Système selon la revendication 37, comprenant des moyens pour déterminer, en fonction des secondes données, une partie des résultats d'opérations spécifiques nécessaires aux opérations spécifiques ultérieures pour un autre sous- traitement .

39. Système selon l'une des revendications 33 à 36 et l'une des revendications 37 et 38, comprenant une mémoire dans laquelle sont groupés les résultats d' opérations spécifiques nécessaires aux opérations spécifiques ultérieures pour un autre sous-traitement en fonction des secondes données et/ou du mode de parcours .

40. Système selon l'une des revendications 33 à 36 et l'une des revendications 37 à 39, comprenant des unités de calcul chaînées selon au moins un chaînage circulaire, et des moyens pour déterminer, en fonction des secondes données pour chaque opération spécifique, s'il faut ou non transmettre les résultats de ladite opération spécifique selon un chaînage circulaire, et des moyens pour, le cas échéant, déterminer, en fonction des secondes données et du mode de parcours, le chaînage circulaire à utiliser pour transmettre les résultats de ladite opération spécifiques.

41. Système selon l'une des revendications 33 à 40 comprenant des moyens pour que les données formatées spécifiques comprennent des informations concernant le groupement des opérations spécifiques, ce groupement consistant en la formation de paquets de une ou plusieurs opérations spécifiques destinées à être exécutées sans conserver les résultats de chaque opération spécifiques pour un autre sous-traitement.

42. Système selon l'une des revendications 33 à 41 comprenant des moyens pour que les données formatées spécifiques comprennent des opérations spécifiques permettant de garder en mémoire de la plateforme au moins une partie des résultats d'opérations spécifiques nécessaires aux opérations spécifiques ultérieures pour un autre sous-traitement .

43. Système selon l'une des revendications 33 à 42 comprenant une mémoire dans laquelle sont groupés les résultats d'opérations spécifiques utilisées lors du sous-traitement d'un autre sous-objet, en fonction de la position relative dudit autre sous-objet par rapport audit sous-objet.

44. Système selon l'une des revendications 33 à 43 comprenant au moins une file dans laquelle sont groupés les résultats d'opérations spécifiques effectuées lors du sous- traitement d'un sous-objet et utilisés lors du sous-traitement d'un autre sous-objet.

45. Système selon l'une des revendications 33 à 44 comprenant des moyens pour que les données formatées spécifiques comprennent des opérations spécifiques pour que des résultats d'opérations spécifiques soient calculés plusieurs fois dans la plateforme, de manière à ne perdre aucune information au moment de l'exécution des opérations spécifiques notamment dans le cas où les sous-objets ont un recouvrement dans au moins une dimension de l'objet.

46. Système selon l'une des revendications 33 à 45 comprenant des moyens pour que les données formatées spécifiques contiennent des informations d'adressage permettant à la plateforme d' accéder à au moins une partie des résultats d'opérations spécifiques et/ou informations élémentaires en mémoire, ces informations d'adressage étant sous la forme « adresse de base + décalage » ou « adresse de base + décalage modulo (la taille d'une mémoire tampon située dans la plateforme) , le décalage étant constant pour les résultats issus d'une même opération spécifique.

47. Système selon la revendication 46 comprenant des moyens pour modifier l'adresse de base pour chaque sous- traitement .

48. Système selon la revendication 46 ou 47 comprenant des moyens pour calculer le décalage en fonction de l'ordre des opérations spécifiques, de manière à fournir à la plateforme des adresses d'emplacements mémoire vide ou contenant un résultat d'opération spécifique ou une information élémentaire qui n'est plus utilisée, afin de stocker des résultats d'opérations spécifiques .

49. Système selon l'une des revendications 33 à 48 comprenant des moyens pour calculer au moins une boucle, le nombre d'itérations de la (ou des) boucle (s) et, quand il y a plusieurs boucles, les imbrications des boucles, en fonction du mode de parcours .

50. Système selon l'une des revendications 33 à 49 comprenant des moyens pour traiter en outre au moins un paramètre, de façon telle que la (les) valeur (s) du (des) paramètre (s) utilisé (s) par les opérations spécifiques dépende (nt) de la position dans les sous-objets des informations élémentaires mises en jeu, directement ou indirectement, dans ces opérations spécifiques .

51. Système selon l'une des revendications 32 à 50 comprenant des moyens pour traiter en outre au moins un paramètre, de façon telle que les données formatées spécifiques comprennent la (les) valeur (s) du (des) paramètres et/ou un code de calcul de la (des) valeur (s) du (des) paramètre (s) .

52. Système selon l'une des revendications 32 à 51 comprenant des moyens pour traiter en outre au moins un paramètre, et comprenant des moyens pour choisir la (les) valeur (s) de paramètre (s) en fonction de la plateforme de traitement, de sorte que le traitement tienne compte des caractéristiques de cette plateforme.

53. Système selon l'une des revendications 32 à 52 comprenant des moyens pour traiter en outre au moins un paramètre, de façon telle que la (les) valeur (s) du (des) paramètre (s) dépende (nt) de l'objet à traiter.

54. Système selon l'une des revendications 32 à 53, comprenant des moyens pour effectuer une opération spécifique comprise dans le groupe comprenant : l'addition, la soustraction, la multiplication, l'application d'une table de correspondance, le minimum, le maximum, la sélection.

55. Système selon l'une des revendications 32 à 54 comprenant des unités de calculs chaînées au moyen d'au moins un chaînage circulaire CCI, ledit chaînage circulaire CCI comportant en outre au moins une file ; le système comportant des moyens pour transmettre le résultat d'une opération spécifique IS5 effectuée sur une unité de calcul UCIs, à une unité de calcul UC2 ou file qui suit ladite unité de calcul UCl selon ledit chaînage.

56. Système selon l'une des revendications 32 à 55 comprenant des moyens pour effectuer au moins une opération spécifique géométrique comprise dans le groupe comprenant : la transposition, la réplication et le sous-échantillonnage.

57. Système selon l'une des revendications 32 à 56 comprenant des unités de calcul chaînées selon au moins un chaînage circulaire, le chaînage circulaire comportant en outre au moins une file.

58. Système selon l'une des revendications 33 à 55 comportant des unités de calcul chaînées selon au moins un chaînage circulaire, le chaînage circulaire comportant en outre au moins une file, et le système comportant des moyens pour déterminer une taille et/ou une latence de la file en fonction de la séquence d' opérations génériques et du mode de parcours .

59. Système selon l'une des revendications 32 à 58 comprenant des moyens pour que l'objet à traiter soit une image et pour que les informations élémentaires soient des pixels de cette image.

60. Système selon l'une des revendications 32 à 59 comprenant des moyens pour que la plateforme de traitement fasse partie d'un appareil de capture et/ou de restitution d'image, et pour que la (les) valeur (s) du (des) paramètre (s) soi (en) t liée (s) aux caractéristiques de l'optique et/ou du capteur et/ou de l'imageur et/ou de l'électronique et/ou du logiciel de l'appareil de capture et/ou de restitution d'images.

61. Système selon l'une des revendications 32 à 58 comprenant des moyens pour que l'objet à traiter soit un signal sonore numérisé et pour que les informations élémentaires soient des échantillons sonores de ce signal.

62. Système selon l'une des revendications 32 à 58 comprenant des moyens pour que l'objet à traiter soit un maillage numérique et pour que les des informations élémentaires des informations spatiales et temporelles caractérisant chaque point du maillage.