EP1964053A2

EP1964053A2 - Procede pour traiter un objet dans une plateforme a processeur(s) et memoire(s) et plateforme utilisant le procede

Info

Publication number: EP1964053A2
Application number: EP06847180A
Authority: EP
Inventors: Bruno Liege
Original assignee: Dxo Labs SA
Current assignee: GoPro Inc
Priority date: 2005-12-19
Filing date: 2006-12-19
Publication date: 2008-09-03
Also published as: KR101391498B1; US20080320038A1; CN101375311A; FR2895102A1; JP5025658B2; US8412725B2; WO2007071884A2; KR20080080398A; JP2009524123A; FR2895102B1; WO2007071884A3

Abstract

L'invention se rapporte à un procédé pour traiter, dans une plate-forme à processeur (s) et mémoire (s), un objet (55) constitué d'informations élémentaires (254, 256, 258, 260, 154, 156, 158, 160) de même nature, ce procédé comprenant l'étape de décomposer l'objet à traiter (255) en au moins deux sous- objets (250, 251, 252 et 253) constitués de N informations élémentaires (254, 256, 258, 154, 156, 158) chacun, tous les sous objets (250, 251, 252 et 253) ayant le même nombre N d'informations élémentaires et, le traitement consistant à effectuer au moins une séquence d'opérations spécifiques sur les informations élémentaires de chaque sous objet, le procédé comprenant en outre l'étape d'effectuer, pour chaque sous objet, au moins N fois chaque opération spécifique , de façon d'une part à faire intervenir au moins une fois chaque information élémentaire de chaque sous objet (250, 251, 252 et 253), et d'autre part à produire N résultats (264) pour chaque opération spécifique, la séquence d'opérations spécifiques étant telle qu'au moins une opération spécifique de la séquence (262) produit, au moins une fois au cours de ses N applications (262a, 262b, 262c, 262d, 262e et 262f ) , un résultat utilisé pour le traitement d'un autre sous objet 260, 160) .

Description

FlROCEDE POUR TRAITER UN OBJET DANS UNE PLATEFORME A PROCESSEUR(S) ET MEMOIRE(S) ET PLATEFORME UTILISANT LE PROCEDE

La présente invention concerne un procédé pour traiter, dans une plateforme à processeur (s) et mémoire (s), un objet constitué d'informations élémentaires. Elle concerne aussi une plateforme utilisant un tel procédé.

Dans la présente description, une information élémentaire est un élément d' information à traiter, représenté par une ou plusieurs valeurs numériques . Ces informations peuvent être codées selon divers types de codage tels que le codage sur 8 bits, le codage sur 10 bits ou encore le codage sur 16 bits signé. Dans le cas où l'objet à traiter est une image, les informations élémentaires seront les pixels de cette image.

Le traitement qui sera appliqué à l'objet dans la plateforme correspond à un algorithme, pouvant intervenir dans différents domaines tels que par exemple le traitement d'image, la compression ou décompression de données, le traitement de son, la modulation et démodulation de signal, la mesure, l'analyse de données, l'indexation ou la recherche dans une base de données, la vision par ordinateur, le traitement graphique, la simulation ou encore tout domaine mettant en œuvre un grand nombre de données . Lorsque l'on souhaite traiter, dans une plateforme à processeur et mémoire, un objet constitué d'informations élémentaires de même nature, on a une grande latitude pour déterminer l'ordre de traitement des informations élémentaires, les boucles, et la séquence d'opération correspondante.

Cependant, les contraintes de taille de code, de temps de calcul, de débit d'accès à la mémoire, de taille de la mémoire, et de régularité, peuvent être contradictoires et il est difficile d'exploiter au mieux le parallélisme d'un plateforme pour un algorithme donné.

Afin de résoudre ce problème, il est connu d'utiliser des librairies de bas niveau capables d'effectuer divers traitements sur des blocs physiques, tels que des convolutions, des multiplications, ou encore l'application de tables de correspondance. Ceci permet de n'optimiser qu'une fois ces librairies pour chaque plateforme. Toutefois, cette méthode présente de nombreux inconvénients :

- la taille des librairies, et donc du code, est importante,

- compte tenu du temps d'appel à des librairies, il est nécessaire d'utiliser des blocs physiques de taille relativement importante, ce qui se traduit par une utilisation mémoire importante, - les boucles internes sur les informations élémentaires se trouvant à l'intérieur des librairies, il n'est pas possible d'optimiser des séquences d'opérations, et les performances sont ainsi limitées, et - les blocs physiques sont stockés en mémoire, ce qui se traduit par une utilisation intensive de la mémoire et beaucoup de temps passé à écrire et lire des données intermédiaires depuis la mémoire . Par ailleurs, les processeurs programmables, par exemple de type processeur scalaire, processeur vectoriel, processeur de traitement du signal ou encore processeur vectoriel, notamment de type SIMD (« Single Instruction Multiple Data ») , permettent d'appliquer un algorithme sur un objet composé d'informations élémentaires et décomposé en blocs, ou sous-objets, c'est-à-dire en groupes d'informations élémentaires .

On applique habituellement chaque opération sur un bloc complet, puis on passe à l'opération suivante sur un bloc qui a pu être réduit en taille. En effet, certaines de ces opérations ont pour effet de réduire la taille des blocs, ayant pour conséquence des effets de bord lors de l'application des opérations suivantes. En conséquence, lorsqu'on souhaite appliquer un algorithme avec un processeur connu, il est nécessaire d'effectuer un grand nombre d'accès mémoire, car on applique une opération à tous les blocs, successivement, avant de passer à l'opération suivante, cette situation entraînant une écriture et une lecture fréquentes dans la mémoire. II est également nécessaire d'utiliser des blocs de grande taille pour réduire effets de bords, et il faut donc disposer d'une mémoire de taille relativement importante pour pouvoir stocker ces blocs de grande taille. En outre, un grand nombre de boucles signifie que le code d'initialisation des boucles et de fin de boucle est présent un grand nombre de fois, ce qui induit une taille de code importante.

En outre, certaines opérations telles que les tables de correspondances, ou l'application d'un déplacement local, se prêtent mal à une implantation sur un processeur vectoriel doté d'un schéma de communication par décalage ou permutation.

Par ailleurs, on a constaté que le code présente des problèmes de régularité, puisque la taille des blocs sur lesquels s'appliquent les opérations varie d'une opération à une autre. Il est donc difficile d'optimiser ce code en terme de mémoire et/ou de temps de calcul, puisque les optimisations sont limitées à une opération par bloc, au lieu de la séquence complète . II est donc très difficile d'optimiser la taille du code, la taille de la mémoire et le nombre d'instructions nécessaires, sans passer un temps considérable pour optimiser chaque combinaison algorithme + plateforme. En effet, chaque plateforme a ses propres caractéristiques, tant en terme de matériel (par exemple nombre et type de processeurs ou taille et type de mémoire), qu'en terme de langage utilisé (C pour un processeur scalaire et assembleur pour un processeur vectoriel) .

L' invention a pour but un procédé permettant de traiter un objet dans une plateforme, en remédiant à au moins un des inconvénients cités précédemment. Notamment, l'invention permet d'optimiser le traitement en terme de taille de code, de temps de calcul, de débit d'accès à la mémoire, de taille de la mémoire. Cette optimisation permet de réduire le temps de calcul d'un algorithme et la consommation électrique nécessaires pour une puissance de calcul et une taille mémoire, et donc une surface de silicium, données.

Elle permet également de réaliser une économie sur des caractéristiques matérielles telles que la surface de silicium, et la consommation électrique nécessaires à l'exécution d'un algorithme pour un temps de calcul donné.

Ainsi, l'invention concerne un procédé pour traiter, dans une plateforme à processeur (s) et mémoire (s), un objet constitué d' informations élémentaires de même nature, ce procédé comprenant l'étape de décomposer l'objet à traiter en au moins deux sous-objets constitués de N informations élémentaires chacun, tous les sous-objets ayant le même nombre N d'informations élémentaires et, le traitement consistant à effectuer au moins une séquence d'opérations spécifiques sur les informations élémentaires de chaque sous-objet, le procédé comprenant en outre l'étape d'effectuer, pour chaque sous-objet, au moins N fois chaque opération spécifique, de façon, d'une part, à faire intervenir au moins une fois chaque information élémentaire de chaque sous-objet, et, d'autre part, à produire N résultats pour chaque opération spécifique, la séquence d'opérations spécifiques étant telle qu'au moins une opération spécifique k de la séquence produit au moins une fois au cours de ses N applications, un résultat utilisé pour le traitement d'un autre sous-objet.

De préférence la séquence d'opérations spécifique ne comprend pas de boucle. Dans une réalisation, la plateforme comprend Q processeurs. De préférence, le traitement de chaque sous-objet est réparti sur les Q processeurs, qui effectuent chacun au moins une opération spécifique IS8 de la séquence d'opérations spécifique. De sorte que tous les processeurs sont utilisés pour chaque sous-objet et de sorte qu'un même processeur est utilisé pour l'ensemble des sous-objets. Ainsi, il n'est pas nécessaire d'affecter les sous-objets aux processeurs.

De préférence, lorsqu'une opération spécifique est effectuée par un processeur pour le traitement d'un sous-objet, la même opération spécifique est également effectuée par le même processeur pour le traitement de tous les autres sous-objets. Le traitement est ainsi régulier : les opérations spécifiques sont affectées aux processeurs et réalisées périodiquement ensuite pour chaque sous-traitement de sous-objet. De préférence, l'ensemble des boucles nécessaires au traitement dépendent de la topologie de l'objet et de la plateforme, mais sont indépendantes de la séquence d'opérations spécifiques .

De préférence, les boucles sont imbriquées les unes dans les autres autour de la séquence d'opérations spécifique complète. De cette façon, les boucles encapsulent l'ensemble de la séquence d'opérations spécifique et on ne découpe pas la séquence d'opérations spécifique en sous-séquences entourées chacune de boucles. De la même manière, il est possible de traiter l'objet en traitant un sous-objet à la fois sans qu'il soit nécessaire de stocker l'objet complet ni de stocker l'ensemble des résultats d'une opération spécifique, mais en stockant uniquement de manière temporaire les résultats qui sont nécessaires au traitement d'un autre sous-objet. L'utilisation de la mémoire est ainsi réduite.

De préférence, les sous-objets sont composés d' informations élémentaires contiguës . Ceci permet de mettre en œuvre des chaînages de processeurs comprenant au moins une file. On va maintenant définir la notion de file selon l'invention. Une file permet de transmettre et/ou stocker des informations élémentaires ou des résultats d' opérations spécifiques . Une file peut comporter ou utiliser une mémoire. Une file peut être implémentée à l'aide de un ou plusieurs processus de type FIFO (« First in first out » en anglais) . Une file comporte au moins une entrée et au moins une sortie.

- Une file peut être connectée fonctionnellement par tout moyen à une unité de calcul en entrée et une unité de calcul en sortie.

- Une file peut être également connectée fonctionnellement par tout moyen à PR unités de calcul en entrée et PR unités de calcul en sortie, dans ce cas la file se comporte comme PR files reliant chacune une unité de calcul d' entrée avec une unité de calcul en sortie.

De préférence, une file permet de gérer de manière indépendante plusieurs flux de données, chaque flux étant associé à une instruction spécifique déterminée.

Dans une réalisation, il est possible de lire et écrire simultanément dans une file. De préférence une file utilise au moins une unité de mémoire permettant de stocker, pour chaque flux, un nombre NF identique de données .

De préférence NF est déterminé en fonction de la disposition relative des sous-objets et du mode de parcours, de sorte que NF-I sous-objets soient traités entre le traitement d'un sous- objet produisant une donnée et le traitement du sous-objet utilisant la donnée. De préférence, un chaînage comprenant des unités de calcul et une file comprend un mécanisme permettant de gérer l'amorçage : la file est initialisée régulièrement, par exemple en début de chaque ligne si la file fait partie d'un chaînage horizontal et l'objet est une image ; tant que la file ne comprend pas NF données, le processeur qui suit la file dans le chaînage, prend en entrée la donnée qu'il envoie en sortie ; ensuite, le processeur qui suit la file dans le chaînage prend en entrée la donnée la plus ancienne dans la file et la retire de la file. De préférence la file permet de sortir les données dans le même ordre qu'elles ont été entrées dans la file. De préférence, le chaînage circulaire est unidirectionnel. De préférence, le chaînage circulaire est tel qu'il y a un seul lien en entrée et un seul lien en sortie par unité de calcul .

L'utilisation d'au moins une file permet ainsi de transmettre les résultats d'opérations spécifiques nécessaires au calcul d'au moins un autre sous-objet.

Une file est, par exemple, mise en œuvre à l'aide d'un microprocesseur.

Il est à noter que, dans toute la description, les termes « unité de calcul » et « processeur » ont la même signification. Dans une réalisation, pour traiter un sous-objet composé de N informations élémentaires, chacune des opérations spécifiques de la séquence est effectuée N fois au total et N/Q fois par chacun des Q processeurs. Dans le cas où la séquence d'opérations spécifique comprend des branchements conditionnels, chaque processeur effectue la partie de la séquence tenant compte de ces branchements conditionnels.

Dans une réalisation, les sous-objets n'ont pas de recouvrement selon au moins une dimension. De sorte qu'au moins un résultat d'opération spécifique produit lors du traitement d'un sous-objet est utilisé lors du traitement d'un autre sous- objet .

De préférence, les sous-objets n'ont de recouvrement selon aucune dimension. De sorte que l'on peut utiliser chacun des processeurs à 100% sans répéter de calcul.

De préférence, la séquence d'opérations spécifiques est telle qu'au moins une opération spécifique k de la séquence produit au moins une fois au cours de ses N applications, un résultat utilisé pour le traitement d'un autre sous-objet. De préférence, dans le cas où il y a plusieurs chaînages circulaires selon une même dimension du sous-objet (notamment lorsque les processeurs sont disposés selon une grille) , la file est partagée entre tous les chaînages circulaires selon la même dimension. De préférence, il y a exactement une file par dimension du sous-objet, et chaque file est partagée entre tous les chaînages circulaires selon la même dimension. De sorte que la communication entre les processeurs est particulièrement simple. De sorte que l'organisation de la mémoire est particulièrement simple.

L'invention permet également d'obtenir, pour un algorithme donné, une performance proportionnelle au nombre de processeurs, sans changer l'algorithme ni la taille mémoire, et tout en utilisant des processeurs de petite taille. Ainsi, l'invention permet de rendre disponible, sur un composant, une puissance de calcul de plusieurs dizaines de milliard d' opérations par seconde par mm² , pour un composant gravé avec un procédé de 0.09μ. Ces densités nécessitent habituellement une architecture câblée optimisée, donc longue à développer, et ne présentant aucune flexibilité pour changer d'algorithme. Au contraire, l'invention permet de programmer tout algorithme avec une très grande facilité et donc en un temps très court.

Ceci rend en outre atteignable, sur un seul composant, des performances se comptant en milliers de milliards d'opérations par seconde.

A cet effet, l'invention permet de rendre régulier un traitement composé d' opérations présentant des effets de bords .

Les objets traités par un procédé tel que celui décrit ci-dessus sont de préférence des images brutes (de type « raw ») avant opération de dématriçage (« demosaicing ») , auquel cas :

- dans une variante, l'information élémentaire est un pixel représenté par une valeur numérique correspondant, selon la position absolue du pixel, par exemple à du rouge, à du vert ou à du bleu

- dans une autre variante, une information élémentaire est un groupe de pixels (par exemple un groupe de 2*2 pixels vert, rouge, bleu, vert correspondant à un « Bayer ») représenté par une valeur numérique par pixel .

Les objets peuvent également être des images visibles, auquel cas l'information élémentaire est un pixel représenté, par exemple, par trois valeurs numériques, chacune des valeurs représentant une couleur, par exemple le rouge, le vert et le bleu.

Les objets peuvent également être des séquences d'images, notamment brutes ou visibles, auquel cas l'information élémentaire est un pixel d' une image de la séquence d' images . Les objets correspondent donc, par exemple, à des vidéos.

Dans le cas où l'objet est une image, l'image peut être issue d'un appareil de capture d'image et/ou destinée à un appareil de restitution d' images : - Un appareil de capture d'images est, par exemple, un appareil photo jetable, un appareil photo numérique, un appareil reflex (numérique ou non) , un scanner, un fax, un endoscope, une caméra, un caméscope, une caméra de surveillance, un jouet, une caméra ou un appareil photo intégré ou relié à un téléphone, à un assistant personnel ou à un ordinateur, une caméra thermique, un appareil d'échographie, un appareil d'imagerie IRM (résonance magnétique) , un appareil de radiographie à rayons X.

Un appareil de restitution d'images est, par exemple, un écran, un projecteur, un téléviseur, des lunettes de réalité virtuelle, ou une imprimante.

- Un appareil de capture et de restitution d'images, est, par exemple, un scanner/fax/imprimante, un mini lab d'impression photos, un appareil de vidéo conférence.

La plateforme de traitement peut prendre diverses formes selon l'application. A titre d'exemple, dans le cas où l'objet est une image, on citera notamment le cas où la plateforme de traitement est intégrée à l'un des appareils suivants : - Un appareil de capture d'images qui produit des images traitées, par exemple un appareil photo numérique qui intègre une plateforme de traitement.

- Un appareil de restitution d' images qui affiche ou imprime des images traitées, par exemple un projecteur vidéo ou une imprimante incluant une plateforme de traitement.

- Un appareil mixte qui corrige les défauts de ses éléments, par exemple un scanner/imprimante/télécopieur incluant une plateforme de traitement.

- Un appareil de capture d'image professionnel qui produit des images traitées, par exemple un endoscope incluant une plateforme de traitement.

La plateforme de traitement peut être déportée en tout ou partie sur un serveur. Un algorithme, ou un traitement d'objet, correspond, par exemple, sans que la liste soit limitative dans le cas où l'objet est une image à : un calcul, notamment de statistiques, pour une balance des blancs, et/ou

- un calcul, notamment de statistiques, pour une exposition automatique, et/ou

- un calcul, notamment de statistiques, pour une mise au point automatique, et/ou - un calcul, notamment de statistiques, pour une amélioration de contraste automatique, et/ou

- une conversion image brute en image visible (« image pipe » ou « Image Signal Processing (ISP) » en anglais) , et/ou

-une correction de défauts d'optique, et/ou - une amélioration de profondeur de champ, et/ou

- un traitement tel que décrit dans la demande de brevet PCT/FR2006/050022 « Procédé de réalisation d'un appareil de capture et/ou de restitution d' image, et appareil obtenu par ce procédé » et/ou dans la demande de brevet PCT/FR2006/050197 pour « Procédé pour commander une action, notamment une modification de netteté, à partir d'une image numérique en couleurs , et/ou

- une correction de défauts de capteur, et/ou -une correction de défauts d'imageur, et/ou

-un traitement notamment d'amélioration de netteté, et/ou

-un traitement, notamment d'amélioration de rendu couleur, et/ou - un traitement, notamment d'amélioration de rendu du contraste, et/ou

-un traitement, notamment d'amélioration de rendu des détails, et/ou

- une réduction de bruit, et/ou - une mesure, et/ou - une compression, et/ou

- une décompression, et/ou

- une interpolation ou zoom, et/ou

- un scan, et/ou - un effet spécial .

Selon l'invention, le traitement appliqué à l'objet peut être constitué d'une séquence d'opérations, également appelées opérations spécifiques . Les résultats des opérations spécifiques sont également appelés informations élémentaires et peuvent, ou non, être du même type que les informations élémentaires de l'objet.

Les sous-objets sont des ensembles d'informations élémentaires ayant une forme et une taille qui, selon les cas, dépendent des caractéristiques de la plateforme, notamment de la taille et du type de mémoire ainsi que, dans le cas d'un processeur vectoriel, de la taille d'un vecteur, mais aussi des caractéristiques de l'objet à traiter.

Dans une réalisation, les objets et sous-objets, ainsi que les blocs logiques ont plusieurs dimensions .

Les dimensions des sous-objets et des blocs logiques correspondent à toutes ou une partie des dimensions de l'objet. Les dimensions peuvent être de diverses natures, notamment :

-spatiale, par exemple une distance, un angle ou un parcours dans un maillage,

-temporelle,

-fréquentielle, par exemple couleur, une fréquence, une bande de fréquence

-une phase,

-une décomposition selon une base d'espace vectoriel, par exemple une décomposition en ondelettes, ou une décomposition en poids forts, poids faibles, -de manière générale, les dimensions de tout espace de topologie quelconque.

La liste suivante, non limitative, donne des exemples d'objets avec leurs dimensions :

-une image fixe avec 2 dimensions, correspondant chacune à des distances, notamment mesurées en pixels,

-une image fixe brute avec 2 dimensions, correspondant chacune à des distances, les pixels étant chacun doté d'une couleur, par exemple rouge, vert ou bleu,

-une image fixe en couleur, avec 2 dimensions, correspondant chacune à des distances, et une dimension correspondant à une fréquence représentant le canal couleur, par exemple rouge/vert/bleu, -une image animée avec 3 dimensions, correspondant, pour 2 d'entre elles, à des distances, notamment mesurées en pixels et, pour une d'entre elles, au temps,

-une image en relief avec 3 dimensions, correspondant à des distances, -une image en relief avec 3 dimensions, correspondant, pour 2 d'entre elles, à des distances, et pour la troisième à un angle de vue,

-une image médicale avec des dimensions de distance et, éventuellement des dimensions de canal, -un hologramme avec des dimensions d'angle de vue,

-de manière plus générale, une image des dimensions de distance et/ou d'angle et/ou temporelle, et/ou fréquentielle, -un son avec une dimension correspondant au temps, -un son avec 2 dimensions, correspondant au temps et à un canal,

-un signal modulé avec une ou plusieurs dimensions, correspondant au temps et, éventuellement, une fréquence et, éventuellement, une position dans l'espace ou un angle,

-la modulation et démodulation de signal, la mesure, l'analyse de données, l'indexation ou la recherche dans une base de données, la vision par ordinateur, le traitement graphique, la simulation représentés par des informations élémentaires disposés selon une ou plusieurs dimensions,

-de manière plus générale, un objet avec une ou plusieurs dimensions.

Selon l'invention, les informations élémentaires d'un objet peuvent avoir une position et/ou une échelle absolue notamment spatiale et/ou temporelle et/ou fréquentielle et/ou dans tout autre dimension de l'objet :

- une information élémentaire d'un objet « son » peut correspondre à une intensité ; dans ce cas, l'information élémentaire a une position absolue correspondant à un instant donné et dans le cas d'un son multicanaux pour un canal donné, - une information élémentaire d'un objet « image » peut correspondre à un pixel ; dans ce cas, l'information élémentaire a une position absolue correspondant à une position dans l'image et, dans le cas d'une image vidéo à un instant donné, - une information élémentaire d' un objet « donnée de simulation » peut correspondre à un état ; dans ce cas, une information élémentaire a une position absolue correspondant à un nœud de maillage et à un instant donné,

- une information élémentaire d'un objet « signal modulé » peut correspondre à une intensité et/ou une phase; dans ce cas, une information élémentaire a une position absolue correspondant à un instant donné et éventuellement une fréquence donnée et éventuellement une position donnée si plusieurs antennes ou émetteurs sont utilisés .

Les positions relatives et les échelles absolues ou relatives, selon au moins une dimension, notamment spatiales et/ou temporelles peuvent correspondre à divers concepts selon la nature de l'objet. Elles s'appliquent entre 2 blocs quelconques, quel que soit leur type (dans le cas d'une image comme décrit plus haut un bloc logique peut être notamment brut, rouge, vert, 8 bits...) .

Dans le cas où l'objet est une image fixe à pixels carrés, la position absolue ou relative peut correspondre, dans une réalisation, à 2 valeurs (verticale et horizontale) et l'échelle absolue ou relative à 2 valeurs (verticale et horizontale) . Les pixels de la ligne du haut d'un objet peuvent avoir comme positions absolues (0 ;0) (0 ;1) (0 ;2) ..., et les pixels de la n ième ligne peuvent avoir comme positions absolues (n ;0) (n ;1) (n ;2) . Dans ce cas, les positions relatives peuvent être codées de la façon suivante : (-1 ; 0) indique en haut, (0 ; 0) correspond à un déplacement nul, (0 ;1) indique à droite et (2 ; -2) indique 2 pixels au dessous et 2 à gauche ; une échelle relative de (0,5 ;0,5) correspond alors à une résolution de moitié dans chaque direction.

De manière plus générale, une combinaison de déplacement relatif et d' échelle relative peut être codée à l'aide de 2 fonctions f et g de la façon suivante : (f(x ;y) ;g(x ;y))) pour chaque pixel de position absolue x,y. II est à noter qu'une règle d'arrondi est nécessaire afin de prendre, par exemple, le pixel le plus proche. Ainsi : une position relative au-dessus se code avec f (x ;y)= -1 et g(x ;y)=0

- une échelle relative de 0,7 se code avec f (x ;y) = 0,7*(x-x0) et g(x ;y) =0, 7* (y-yO) ; xO et yO correspondant à un paramètre relatif à une position absolue;

- une correction de distorsion se code avec f et g correspondant au champ de distorsion

- un changement de format YUV 4 :2 :2, à savoir YYUV à partir des informations de luminance et de chrominance Y, U et V séparées, peut utiliser pour obtenir Yl Y2 xx xx Y3 Y4 xx xx ... à partir de Yl Y2 Y3 Y4 ... les fonctions suivantes f (x ; y) = x- xO)*O,5 si x pair et (x+l-xO)*O,5 si x-xO impair, et f (y) =y-yθ ; xO et yO correspondant à un paramètre relatif à une position absolue; La liste suivante, non limitative, donne d'autres exemples de réalisation avec divers types d'objets:

- Dans le cas où l'objet est une image fixe à pixels hexagonaux disposés par ligne, deux lignes successives étant décalées d'un demi-pixel, la position absolue ou relative peut correspondre à 2 valeurs (verticale et horizontale) et l'échelle absolue ou relative à 2 valeurs (verticale et horizontale) ; les pixels de la ligne du haut d'un objet peuvent avoir comme positions absolues (0 ;0) (0 ;1) (0 ;2) ..., et les pixels de la n ième ligne peuvent avoir comme positions absolues (n ;0,5) (n ;1,5) (n ;2,5) si la ligne est impaire, et (n ;0) (n ;1) (n ;2) si la ligne est paire. La position relative peut correspondre à 2 valeurs (verticale et horizontale) , par exemple (-0,5 ; 0,5) indique en haut à droite, (0,1) indique à droite et (-0,5 ; 1,5) indique le pixel situé à droite du pixel en haut à droite. Une échelle relative de (0,5 ;0,5) correspond alors à une résolution de moitié dans chaque direction. De même, une combinaison de déplacement relatif et d'échelle relative peut être codée à l'aide de 2 fonctions f et g de la façon suivante : (f(x ;γ) ;g(x ;γ))) pour chaque pixel de position absolue x,y. Il est à noter qu'une règle d'arrondi est nécessaire afin de prendre, par exemple, le pixel le plus proche.

- Dans le cas où l'objet est une image animée à pixels carrés, la position absolue ou relative peut correspondre à 3 valeurs (verticale, horizontale et temporelle) , par exemple (- 1 ; 0 ;0) indique le pixel situé au-dessus dans la même image, (0 ; 0 ; -1) indique le pixel ayant la même position dans l' image précédente et (2 ; -2, -1) indique le pixel situé 2 pixels au dessous et 2 à gauche dans l'image précédente. De même, une combinaison de déplacement relatif et d'échelle relative peut être codée à l'aide de 3 fonctions f, g, h de la façon suivante : (f(x ;γ ;t) ;g(x ;y ;t)) ; h(x ;y ;t)) pour chaque pixel de position absolue x,y à l'instant t. Il est à noter qu'une règle d'arrondi est nécessaire afin de prendre, par exemple, le pixel le plus proche. - Dans le cas où l'objet est un son monocanal, la position absolue ou relative peut correspondre à 1 valeur

(temporelle), par exemple (-1) indique l'instant précédent, et (2) indique 2 instants après, une fonction f(t) permet alors de coder un déplacement et échelle relatifs . Une règle d' arrondi étant utilisée pour prendre l'instant le plus proche.

- Dans le cas où l'objet est un son multi canal, la position absolue ou relative peut correspondre à 2 valeurs

(temporelle, canal), par exemple (-1, 0) indique l'instant précédent du même canal, et (2,1) indique 2 instants après du canal suivant, ordonnés par exemple spatialement de façon circulaire. De même, une combinaison de déplacement relatif et d'échelle relative peut être codée à l'aide de 2 fonctions f, g de la façon suivante : (f(t ;c) ;g(t ;c)) pour chaque échantillon sonore de position à l'instant t pour le canal c. Il est à noter qu'une règle d'arrondi est nécessaire afin de prendre, par exemple, l'instant et le canal le plus proche.

Dans le cas où l'objet est un maillage de simulation, la position absolue ou relative peut correspondre à n valeurs correspondant chacune à une dimension spatiale ou temporelle, fonction de la topologie du maillage. De même, une combinaison de déplacement relatif et d' échelle relative peut être codée à l'aide de n fonctions. Il est à noter qu'une règle d'arrondi est nécessaire afin de prendre par exemple le nœud et l'instant le plus proche.

- Dans le cas où l'objet est un signal modulé, la position absolue ou relative peut correspondre à n valeurs correspondant respectivement au temps, le cas échéant au canal fréquentiel (émission ou réception sur plusieurs fréquences) et le cas échéant (plusieurs émetteurs ou récepteurs disposés spatialement) à une dimension spatiale. De même, une combinaison de déplacement relatif et d'échelle relative peut être codée à l'aide de n fonctions, et une règle d'arrondi doit être choisie. - Dans le cas où l'objet est un ensemble de mesures, la position absolue ou relative peut correspondre à n valeurs correspondant chacune à une dimension de l'objet qui, selon le cas, peuvent être de nature temporelle, spatiale, fréquentielle, phase ou autre. De même, une combinaison de déplacement relatif et d'échelle relative peut être codée à l'aide de n fonctions et une règle d'arrondi doit être choisie.

- Dans le cas général où l'objet est de dimension n, la position absolue ou relative peut correspondre à n valeurs correspondant chacune à une dimension de l'objet qui, selon le cas, peuvent être de nature temporelle, spatiale, fréquentielle, phase ou autre. De même, une combinaison de déplacement relatif et d' échelle relative peut être codée à l'aide de n fonctions et une règle d'arrondi doit être choisie.

Différents types de sous-objets sans recouvrement sont illustrés par les figures la à Id. Sur ces figures, on voit qu'une même image peut être découpée en lignes (lignes 90, 91, 92 et 93 sur la figure la), en colonnes (colonnes 94, 95, 96 et 97 sur la figure Ib), en sous-objets d'une tout autre forme (formes 70, 71, 72 et 73 sur la figure Ic) , ou encore en rectangles (formes 60, 61, 62, 63, 64, 65, 66 et 67 sur la figure Id) . Dans le cas où les sous-objets sont sans recouvrement, il faut accéder à des informations élémentaires d'un moins un autre sous-objet pour traiter les informations élémentaires d'un sous-objet sans perdre de bord lors du calcul de filtres .

Ainsi, dans une réalisation, l'objet à traiter ayant DO dimensions, et étant décomposé en sous-objets ayant DSO dimensions sélectionnées parmi les DO dimensions de l'objet, la décomposition de l'objet est telle que, selon au moins une dimension du sous-objet, les sous-objets n'ont pas de recouvrement . Dans cette configuration, il n'est pas nécessaire de recalculer les instructions spécifiques mettant en œuvre, directement ou indirectement, des informations élémentaires appartenant à deux sous-objets. Dans une réalisation préférentielle, le procédé comprend en outre l'étape d'effectuer, pour chaque sous objet, exactement N fois chaque opération spécifique. De préférence on choisira DSO égal à DO.

Dans une réalisation, le procédé comprend en outre l'étape d'ajouter au moins une informations élémentaire à l'objet de sorte qu'il puisse être décomposé en sous-objet sans recouvrement .

La décomposition en sous-objets peut également dépendre de la séquence d'opérations à effectuer sur l'objet, notamment du nombre et du type de filtres, horizontaux ou verticaux, présents dans cette séquence.

Par ailleurs, lorsque certaines des opérations spécifiques de la séquence ont des effets de bord, il est nécessaire, pour qu'aucune information élémentaire ne soit perdue lors de l'exécution de l'algorithme, de décomposer l'image en sous-objets ayant un recouvrement non nul. Cette configuration est illustrée sur les figures le et If : la figure le représente un sous-objet composé de 6x6 informations élémentaires, dans le cas où la séquence d'opérations perd un pixel sur chaque bord, et la figure If représente un objet comprenant 100 informations élémentaires.

Sur cette figure le, on voit que les sous-objets sont quatre rectangles 80, 82, 83 et 84 contenant chacun 36 informations élémentaires. Le rectangle 80 est constitué des 36 informations élémentaires situées en haut à gauche dans l'image, et le rectangle 82 est constitué des 36 informations élémentaires en haut à droite de l'image. Ainsi, les 8 informations élémentaires 86 sont communes aux deux sous-objets 80 et 82. De même, les 8 informations élémentaires 85 sont communes aux deux sous-objets 80 et 83. De même, les 8 informations élémentaires 88 sont communes aux deux sous-objets 82 et 84. De même, les 8 informations élémentaires 89 sont communes aux deux sous-objets 83 et 84 Enfin, les 4 informations élémentaires 87 sont communes aux quatre sous-objets 80, 82, 83 et 84.

Dans le cas où l'objet est une image, dans une réalisation l'image est décomposé en sous-objets rectangulaires juxtaposés, les sous-objets sont traités, par exemple, de gauche à droite puis de haut en bas. Selon la plateforme, les sous- objets sont choisis et stockés selon l'une des façons suivantes, sans que la liste soit limitative :

- dans le cas d'un processeur de traitement du signal disposant d'une petite mémoire rapide et d'une grosse mémoire lente, la taille des sous-objets est choisie pour pouvoir effectuer le traitement d'un sous-objet sans accès à la mémoire lente ; on pourra, par exemple, prendre des sous-objets correspondant à des carrés de 32x32 pixels, le résultat du calcul sur le sous-objet précédent étant transféré en mémoire lente pendant le calcul relatif au sous-objet courant, et pendant le transfert de la mémoire lente vers la mémoire rapide des données nécessaires au calcul relatifs au sous-objet suivant

- dans le cas d'un processeur scalaire disposant d'une petite mémoire cache et d'une grosse mémoire lente, la taille des sous-objets est choisie pour pouvoir effectuer le traitement d'un sous-objet en utilisant la mémoire cache le plus possible ; on pourra, par exemple, prendre des sous-objets correspondant à des carrés de 32x32 pixels ou des sous-objets de 1 pixel ou des sous-objets de 4 pixels (2*2) ou de Nl*2 pixels, notamment dans le cas d'une image brute, de type « raw »

- dans le cas d'un processeur vectoriel, la taille des sous-objets est choisie comme égale à, ou multiple de, la taille d'un vecteur que la plateforme sait traiter et stocker, on pourra, par exemple, prendre des sous-objets correspondant à 64 pixels horizontaux. Dans le cas où l'objet est d'un autre type qu'une image, la décomposition en sous-objet peut être adaptée de manière similaire à la plateforme.

Le procédé selon l'invention permet de régulariser le séquencement des opérations spécifiques effectuées sur les sous- objets, puisqu'on effectue le même nombre N d'opérations à chaque fois. Ainsi, on peut simplifier les architectures matérielles et les algorithmes. Le fait de réaliser N opérations à chaque fois est rendu possible par le fait qu'on fait intervenir, dans la réalisation de ces opérations, des informations élémentaires appartenant à un sous-objet différent de celui sur lequel les opérations sont appliquées .

De cette façon, les informations élémentaires sur lesquelles s'applique l'opération k peuvent appartenir au même sous-objet ou à des sous-objets différents, en fonction du type d' opération spécifique et de la position des informations élémentaires dans les sous-objets.

Ceci permet également d'éviter l'apparition d' « effets de bord » aux limites des différents sous-objets. En effet, le fait de prévoir N opérations spécifiques produisant N résultats à chaque fois oblige à traiter toutes les informations élémentaires, y compris celles se trouvant sur le bord d'un sous-objet. C'est dans ce cas que l'on fait appel, lors de l'exécution des opérations, à des informations élémentaires appartenant aux autres sous-objets.

Par ailleurs, ce procédé permet d'appliquer plusieurs opérations spécifiques successives à un même sous-objet, par exemple une ligne d'une image, avant de passer au sous-objet suivant. Ainsi, le nombre d'accès mémoire peut être limité puisqu'on peut lire une ligne, et lui appliquer plusieurs opérations spécifiques avant d'écrire uniquement les résultats nécessaires au traitement d'autres sous-objets en mémoire et de passer à la ligne suivante. Dans une réalisation, la plateforme comprend au moins une mémoire de communication inter-objet pour stocker les informations élémentaires et/ou résultats d'opérations spécifiques calculés pendant le traitement d'un sous-objet et utilisés pour le traitement d'un autre sous-objet. Ainsi, on réduit les calculs redondants .

Dans une autre réalisation encore, la séquence d'opérations spécifiques ne comporte qu'une seule opération spécifique mettant en oeuvre les mêmes données lors du traitement de l'objet.

Dans la suite de la description, on appellera « données de communication » des informations élémentaires et/ou résultats d'opérations qui sont utilisés pour le traitement de plusieurs sous-objets ou pour plusieurs opérations spécifiques différentes.

De préférence, on choisira les données de communications entre sous-objets de telle façon que leur taille est le nombre de calculs soient minimisés . Par exemple, les données de communication inter-objet selon une dimension comprennent, notamment, les données d'entrée d'un filtre selon cette dimension, ainsi que les données à combiner avec la sortie du filtre, si elles ne sont pas alignées correctement entre elles .

La mémoire de communication inter-objet, c'est-à-dire la mémoire utilisée pour stocker les données de communication inter-objets, est de nature différente selon la durée de stockage nécessaire et le débit. Par exemple, cette mémoire peut consister en des registres et/ou en une mémoire locale, pour la communication selon la dimension de la boucle interne de parcours des sous-objets, et/ou en une mémoire locale et/ou partagée pour la communication selon les autres dimensions . Dans une réalisation de l'invention dans laquelle l'objet comprend DO dimensions, les informations élémentaires sont transmises à la plateforme d'abord selon une dimension sélectionnées DE, puis selon les autres dimensions. Dans cette réalisation, les sous-objets ont DSO dimensions, sélectionnées parmi les DO dimensions de l'objet, et comprenant la dimension DE, et le traitement comprend au moins une boucle interne de parcours des sous-objets effectuée selon la dimension DE.

Une boucle interne correspond à une boucle pour traiter un sous-objet, qui permet de traiter les N données à l'aide de Q processeurs.

Cette réalisation est particulièrement adaptée au cas d'un composant traitant les données « au vol », c'est-à-dire en temps réel à la vitesse d'entrée des informations élémentaires dans la plateforme, en utilisant, pour la communication interobjets, une mémoire située sur le même composant que les unités de calcul utilisées pour le traitement. Ainsi, le coût du composant est réduit, et le débit d'accès à la mémoire est proportionnel au nombre d'unités de calcul. Notamment, cette réalisation est utilisée dans le cas d'un processeur scalaire, ou vectoriel, ou pipeline.

De préférence, les sous-objets sont tels que DSO vaut un, ou DSO vaut deux dans le cas d'une image brute. Dans ce dernier cas, la taille du sous-objet dans la seconde dimension est deux.

De préférence, les opérations spécifiques sont effectuées par des unités de calculs disposées selon la dimension DE.

De préférence, la taille des sous-objets dans chaque dimension est un multiple de la taille de la matrice de processeurs dans la dimension considérée.

De préférence, les DSO dimensions sont la dimension DE, ainsi que les plus petites parmi les DO dimensions pour limiter la mémoire de communication inter-objets nécessaire. De préférence, il n'y a de recouvrement des sous- objets dans aucune des DO dimensions, de sorte que chaque information élémentaire n'est traitée qu'une seule fois ; de sorte que les boucles sont imbriquées, de sorte que le code est compact .

De préférence, aucun calcul n'est refait lors du traitement de 2 sous-objets

De préférence, les boucles de parcours des sous-objet sont imbriquées selon le même ordre que les dimensions selon lesquelles les informations élémentaires arrivent à la plateforme.

Dans une réalisation, dans laquelle l'objet comprend DO dimensions, les informations élémentaires sont transmises à la plateforme selon la dimension DE de l'objet, puis selon les autres dimensions. Dans cette réalisation les sous-objets comprennent les DO dimensions de l'objet ou DO-I dimensions sélectionnées parmi les DO dimensions de l'objet, la dimension DE n'étant pas comprise. Le traitement comprend en outre au moins une boucle interne de parcours des sous-objets effectuée selon la dimension DE.

Dans une autre réalisation, la taille des sous-objets dans chaque dimension est déterminée en fonction de la taille de l'objet, et/ou du débit de transmission des informations élémentaires transmises à la plateforme, et/ou de la vitesse de calcul de la plateforme et/ou de la taille et du débit d'au moins une mémoire de la plateforme .

Cette réalisation est particulièrement adaptée au cas d'un composant traitant les données « au vol » à la vitesse d' entrée des informations élémentaires dans la plateforme en utilisant pour la communication inter objets, une mémoire locale située sur le même composant que les unités de calcul utilisées pour le traitement servant de relais à une mémoire externe partagée plus lente utilisée pour le stockage à long terme des données de communication selon les DO-I une dimensions ne correspondant pas à DE. Dans ce cas, la taille de la mémoire locale augmente avec la taille du sous-objet, le débit avec la mémoire partagée diminue avec la taille du sous-objet et la taille de la mémoire externe augmente avec la taille du sous- objet selon les dimensions autres que la dimension DE, on peut ainsi ajuster la taille des mémoires internes et externes et le débit de la mémoire externe en ajustant la taille du sous-objet. Ainsi, le coût est réduit, le débit avec la mémoire est indépendant de la taille de l'objet, et un composant peut être optimisé pour une taille d'objet et réutilisé avec une mémoire externe pour des objets de taille plus importante.

Cette réalisation est également plus particulièrement adaptée au cas d'un composant traitant les informations élémentaires plus lentement que la vitesse d'entrée des informations élémentaires dans la plateforme, et utilisant une mémoire pour stocker l'objet pendant le traitement. Dans ce cas, on cherche à limiter la taille de la mémoire interne et la vitesse du traitement pour réduire la taille mémoire interne, le nombre d'unités de calcul et le débit mémoire nécessaire.

Cette réalisation s'applique notamment à un processeur scalaire ou vectoriel ou pipeline.

De préférence, les opérations spécifiques sont effectuées par Q unités de calculs disposées une dimension de taille supérieure à Q.

De préférence la taille des sous-objets dans chaque dimension est un multiple de la taille de la matrice de processeurs dans la dimension considérée. De préférence, les DSO dimensions sont, outre la dimension DE, les plus petites parmi les DO dimensions pour limiter la mémoire de communication inter-objets nécessaire.

De préférence, il n'y a de recouvrement des sous- objets dans aucune des DO dimensions, de sorte que chaque information élémentaire peuvent n'être traitées qu'une seule fois. Ainsi, les boucles sont imbriquées et le code est compact. De préférence, il n'y a pas de recouvrement des sous- objets et aucun calcul n'est refait lors du traitement de 2 sous-objets dans les dimensions de taille faible, alors que dans les dimensions de taille importante c'est moins important car les recalculs ont un coût marginal.

De préférence, pendant le calcul du sous-objet courant, on transfère depuis la mémoire locale vers la mémoire externe les données de communication inter-objets produites lors du calcul du sous-objet précédent, et on transfère depuis la mémoire externe vers la mémoire locale les données de communication inter-objets nécessaires pour le calcul du sous- objet suivant. Puisque la boucle interne de parcours des sous- objets se fait selon la dimension DE, les transferts entre mémoire interne et externes ne concernent que les données de communication inter-objets selon les DO-I dimensions qui excluent la dimension DE. Ainsi, la mémoire locale nécessaire est limitée à 3 fois la taille des données de communication inter-objets selon ces DO-I dimensions plus une fois la taille des données de communication inter-objets selon la dimension DE. Par exemple, dans le cas d'un algorithme de traitement d' image, la taille de la mémoire interne nécessaire se limite à quelques centaines ou milliers d'octets pour traiter plusieurs dizaines de millions de pixels par seconde.

De préférence, les données transitent de la façon suivante : les informations élémentaires de l'objet sont stockées dans la mémoire externe, les sous-objets sont lus depuis la mémoire externe lorsqu'au moins un sous-objet est présent en mémoire partagée, les données de communication interobjets selon les DO-I dimensions qui excluent la dimension DE sont lus depuis la mémoire partagée, le résultat du traitement du sous-objet et les données de communication inter-objets selon les DO-I dimensions qui excluent la dimension DE sont écrites en mémoire partagée, lorsque les données complètes selon la dimension utilisée pour la sortie sont présentes en mémoire partagée, elles sont lues en mémoire partagée et disponibles. Le transit est ainsi prédictible, simple et régulier.

De préférence, les boucles de parcours des sous-objets sont imbriqué selon le même ordre que les dimensions selon lesquelles les informations élémentaires arrivent à la plateforme.

Les réalisations qui vont maintenant être décrites dans le cas d'un processeur vectoriel peuvent s'appliquer à tout traitement sur Q unités de calcul consistant en une séquence d'opérations spécifiques simultanément effectuées sur les Q unités de calcul, cette séquence n'étant pas nécessairement appliquée à un objet constitué d'informations élémentaires de même nature. Ces réalisations décrivent une nouvelle façon d' établir une communication entre les différentes unités de calcul, par exemple dans le cas d'un processeur vectoriel.

Dans une réalisation, dans laquelle au moins une partie des opérations spécifiques met en œuvre au moins une valeur de paramètre, et dans laquelle les opérations spécifiques sont effectuées par Q unités de calculs calculant la même opération spécifique simultanément : la séquence d'opérations spécifiques comprend au moins une opération spécifique de sélection qui effectue la sélection d'une valeur de paramètre parmi C valeurs de paramètres en même temps sur les Q unités de calcul. Cette sélection se fait de manière différentiée par processeur, en fonction d'au moins une information élémentaire et/ou d'au moins un résultat d'opération spécifique et/ou d'au moins une valeur de paramètre.

Dans un exemple, C vaut 8.

Pour calculer une table de correspondance on peut, par exemple, utiliser 3 opérations spécifiques de sélection en fonction de la valeur d'entrée X de la table modulo C, pour obtenir a, b et c fonction de X et calculer a*X²+b*X+c, ce qui correspond à un calcul en parallèle de Q fonctions splines .

Pour déterminer un coefficient de filtre d'interpolation correspondant à un déphasage de n/C, on peut utiliser une opération spécifique de sélection en fonction de la valeur d'entrée n donnant le coefficient d'interpolation.

Pour choisir une valeur de paramètre fonction d'une position absolue, on peut calculer une fonction de la position donnant un résultat entre 1 et C, puis utiliser le résultat de ce calcul en entrée d'une opération spécifique de sélection donnant la valeur de paramètre pour la position absolue. On peut ainsi, par exemple, adapter une intensité de déflouage fonction de la position.

Pour choisir une valeur différentiée par canal entrelacé en couleur, résolution..., on peut, de même, calculer une fonction de la position entre 1 et C, puis utiliser le résultat de ce calcul en entrée d'une opération spécifique de sélection donnant la valeur de paramètre pour la position absolue. II est connu d'avoir, dans des processeurs vectoriels, des opérations spécifiques qui choisissent des données soit par décalage soit par permutation, par contre les processeurs vectoriels ne permettent par d'effectuer une indirection sur C données, notamment dans le cas où C est plus petit que Q afin d'optimiser la complexité du processeur.

Dans une réalisation, les Q processeurs correspondant à un vecteur à une dimension, on étend les C constantes dans un registre de Q constantes par duplication : C constantes à droite du vecteur, puis C constantes puis... ; l'opération spécifique de sélection permet de choisir une valeur parmi les C valeurs de gauche de chaque élément du vecteur.

Dans une réalisation, dans laquelle au moins une partie des opérations spécifiques est effectuée par Q unités de calculs calculant la même opération spécifique simultanément : la séquence d'opérations spécifiques comprend au moins une opération spécifique de sélection effectuant la sélection d'une donnée parmi C données en même temps sur les Q unités de calcul de manière différentiée par processeur, en fonction d'un déplacement relatif obtenu à partir d'au moins une information élémentaire et/ou d'au moins un résultat d'opération spécifique et/ou d'au moins une valeur de paramètre.

En pratique, dans l'exemple où les Q unités de calcul sont disposées selon un vecteur chaîné de manière circulaire, chaque unité de calcul peut accéder à des données issues de ses C voisins de gauche de manière simultanée et indépendante.

L' opération spécifique de sélection peut être conditionnelle, afin de permettre le choix parmi un nombre de 2*C, ou plus, de données.

Ainsi, on peut calculer une déformation locale, par exemple une distorsion fonction d'une position, et l'appliquer localement à un vecteur. On peut également aussi combiner des données localement pour faire un filtre, changer d'échelle ou effectuer toute autre opération mettant en œuvre un déplacement local .

Dans une réalisation, le déplacement nécessitant plus de C données peut être décomposé en au moins un déplacement uniforme suivi d'un déplacement local différentié réalisé à l'aide d'au moins une opération de sélection, le déplacement uniforme peut être réalisé, notamment, par application de plusieurs opérations de sélections, ou en utilisant une mémoire de communication.

Dans un exemple, le déplacement relatif est commun à toutes les informations élémentaires d'un sous-objet, et/ou d'un l'objet. Dans un autre exemple, il est différent pour chaque information élémentaire, et peut dépendre, ou non, de la position absolue de l'information élémentaire dans le sous-objet et/ou du sous-objet dans l'objet. De manière plus générale, ce déplacement est le résultat d'un calcul en fonction d'au moins une information élémentaire et/ou d'au moins un résultat d'opération spécifique et/ou d'au moins une valeur de paramètre.

Dans une réalisation, dans laquelle la séquence d' opérations spécifiques comprend au moins une opération spécifique de position et l'objet comporte DO dimensions, l'opération spécifique de position produit une information de position selon une des DO dimensions.

La position peut être, notamment, sans que la liste soit limitative, une position absolue d'information élémentaire dans un objet, une position de sous-objet, une position de processeur modulo C, une position de données multi-échelle dans un sous-objet, une position relative par rapport à une grille ou toute autre position.

Dans une réalisation, la séquence d'opérations spécifiques comprend au moins une opération spécifique produisant une position relative en fonction d' au moins une information élémentaire et/ou d'au moins un résultat d'opération spécifique et/ou d'au moins une valeur de paramètre.

L' opération spécifique de calcul de position relative peut être utilisée avant une opération spécifique de sélection.

Dans un exemple, la position relative est commune à toutes les informations élémentaires appartenant à un sous- objet, et/ou à un l'objet. Dans un autre exemple, elle est différente pour chaque information élémentaire, ou bien elle peut dépendre, ou non, de la position absolue de l'information élémentaire dans le sous-objet et/ou du sous-objet dans l'objet. De manière plus générale, elle peut être le résultat d'un calcul en fonction d' au moins une information élémentaire et/ou d' au moins un résultat d' opération spécifique et/ou d' au moins une valeur de paramètre. La taille des sous-objets, à savoir le nombre N d'informations élémentaires présentes dans chaque objet, est, par exemple, déterminée en fonction de l'architecture de la plateforme utilisée pour le traitement. Ainsi, dans une réalisation, au moins une partie des opérations spécifiques est effectuée par Q unités de calculs, Q étant égal à N ou un sous- multiple de N. Le fait que N soit un multiple de Q permet de rendre le traitement encore plus régulier, puisqu' ainsi toutes les unités de calcul terminent en même temps une même étape de calcul.

Dans une réalisation, le nombre de processeurs Q et le nombre d'informations élémentaires N sont différents, et le traitement du sous-objet comprend une seule boucle interne de N/Q itérations . Ainsi, le traitement est régulier, la mémoire et le nombre de registres utilisés sont minimisés, et la communication à l'intérieur de chaque sous-objet est réalisée de préférence avec des registres .

Dans une réalisation, le nombre d'unités de calcul est de quelques dizaines à quelques centaines, ce qui permet, notamment, de réaliser des calculs de quelques centaines d' opérations sur des images à plusieurs dizaines de millions de pixels par seconde en utilisant des procédés de fabrication de composants de 0.13μ.

Dans une autre réalisation, le nombre d'unités de calcul est de plusieurs milliers à plusieurs millions, et l'invention permet d'utiliser cette puissance de calcul pour traiter des objets en gardant une grande simplicité de programmation et avec une performance proportionnelle au nombre d'unités de calcul.

Pour améliorer encore cette régularité, le nombre P d'opérations spécifiques peut également être un multiple de Q. Généralement, les opérations spécifiques sont déterminées en amont de la plateforme par un compilateur, qui est configuré de telle sorte que, si le nombre d'opérations spécifiques n'est pas un multiple de Q, il crée des opérations spécifiques sans effet afin d'obtenir cette relation (le nombre d'opérations spécifiques est un multiple de Q) . Ainsi, quelle que soit l'affectation des opérations spécifiques aux différentes unités de calculs, le traitement sera parfaitement régulier.

Dans une réalisation de l'invention, les Q unités de calcul présentes dans la plateforme sont identiques .

Certaines opérations spécifiques utilisent des paramètres, et, dans ce cas, on traite également les valeurs de ces paramètres. Ces paramètres peuvent, par exemple, être des coefficients multiplicateurs . Ces paramètres peuvent correspondre, par exemple, sans que la liste soit limitative à : -des coefficients de filtres, et/ou

-des valeurs de saturation, et/ou -des valeurs de décalages, et/ou -des tables de correspondances .

Dans une réalisation, les valeurs des paramètres utilisés par les opérations spécifiques dépendent de la position dans les sous-objets des informations élémentaires mises en jeu, directement ou indirectement, dans ces opérations spécifiques . Par exemple, dans le cas où l'objet à traiter est une image, des défauts peuvent apparaître sur l'image, dus à l'optique ayant servi à faire la prise de vue. Ces défauts ne sont, en général, pas homogènes sur toute l'image, notamment sur les bords.

Dans ce cas, pour compenser ce flou, on n'appliquera pas les mêmes coefficients de compensation sur tous les pixels de l' image .

Par exemple, l'utilisation d'un paramètre commun à toutes les informations élémentaires, pour un filtre, permet d'augmenter la netteté de manière uniforme.

Par exemple, l'utilisation d'un paramètre dépendant de la position absolue des informations élémentaires dans l'objet à traiter, pour un filtre, permet d'augmenter la netteté de manière plus importante au bord afin de compenser un défaut optique.

Par exemple, l'utilisation d'un paramètre dépendant de la position absolue des informations élémentaires dans l'objet à traiter, pour une correction de vignetage, permet d'obtenir une compensation plus forte au bord afin de compenser un défaut optique.

Par exemple, l'utilisation d'un paramètre dépendant de la position absolue des informations élémentaires dans l'objet à traiter pour un dé matriçage (« demosaicing ») permet de traiter différemment les pixels rouges, les pixels verts et les pixels bleus d'une image brute issue d'un capteur.

Par exemple, l'utilisation de secondes données, notamment un déplacement, dépendant de la position absolue des informations élémentaires dans l'objet à traiter pour un calcul d'agrandissement (« zoom ») numérique ou une correction de distorsion, permet d'obtenir les pixels nécessaires au calcul de l'interpolation en chaque point. Ainsi, la valeur d'un paramètre, selon la nature de ce paramètre, peut :

-être constante et intrinsèque à l'algorithme ; dans ce cas la valeur de paramètre peut, notamment, être transmise au moyen de traitement ou à la plateforme, et/ou -dépendre de la provenance ou la destination de l'objet, par exemple dans le cas où l'objet à traiter est une image issue d'un appareil muni d'une optique donnée, la valeur du paramètre peut dépendre du type d'optique qui a un impact sur le niveau de flou dans l'image ; dans ce cas, la valeur de paramètre peut notamment être transmise au moyen de traitement ou à la plateforme, et/ou

-dépendre de l'objet à traiter, par exemple, dans le cas où l'objet à traiter est une image issue d'un capteur, la valeur du paramètre peut dépendre du gain du capteur effectivement utilisé pour capturer ledit objet qui a un impact sur le niveau de bruit dans l'image ; dans ce cas, la valeur de paramètre peut, notamment, être transmise, choisie ou calculée par la plateforme, et/ou

-dépendre de la position absolue de l'information élémentaire dans l'objet ; dans ce cas, la valeur de paramètre peut notamment être transmise, choisie ou calculée par la plateforme, et/ou

-ne pas dépendre de la position absolue de l'information élémentaire dans l'objet.

La valeur de paramètre peut être déterminée simultanément ou a posteriori par rapport à la définition de l'algorithme.

On a vu que la valeur de certains paramètres peut varier d'un objet à l'autre, d'un sous-objet à l'autre ou d'une information élémentaire à l'autre.

Dans ce cas, dans une réalisation, on calcule la valeur du paramètre à chaque changement. Dans une autre réalisation, on calcule a priori les valeurs possibles du paramètre, et, à chaque changement, on détermine l'index ou l'adresse permettant d'accéder à la valeur du paramètre par exemple dans une table.

Dans une autre réalisation, plus particulièrement adaptée aux paramètres dont la valeur varie d'un sous-objet à l'autre en fonction de la position absolue du sous-objet et dont le nombre de valeurs est limité, par exemple les paramètres correspondant aux caractéristiques de flou de l'optique, on détermine un nombre limité de jeux de valeurs de paramètres, on stocke chaque jeu et, pour chaque sous-objet, on sélectionne le jeu à utiliser, par exemple en calculant une fonction de la position donnant l'adresse du jeu à utiliser.

L' affectation des opérations spécifiques aux unités de calcul dépend à la fois du type d'opération, de la séquence, et des unités de calcul en elles-mêmes. Par exemple, dans une réalisation, les unités de calcul sont spécialisées, c'est-à-dire que les N résultats issus d'une même opération spécifique sont calculés par une même unité de calcul . Dans le cas où une opération spécifique fait appel à un paramètre présent dans une mémoire de la plateforme, le fait de disposer d'unités de calcul spécialisées permet de gagner du temps, puisque l'unité de calcul en charge de cette opération peut réaliser un accès mémoire au début du traitement, pour récupérer le paramètre, puis appliquer l'opération N fois sans avoir besoin d'effectuer à nouveau un accès mémoire.

Ainsi, dans une réalisation, lorsqu'au moins une opération spécifique met en œuvre au moins un paramètre, cette opération spécifique est effectuée par au moins une unité de calcul ayant accès à une unité de mémoire contenant une partie des valeurs des paramètres, cette partie étant déterminée en fonction des opérations spécifiques effectuées par cette unité de calcul. Pour le stockage de ces valeurs de paramètres, il peut exister différentes configurations matérielles, qui seront détaillées par la suite. Par exemple, chaque unité de calcul peut disposer de sa propre mémoire, ou il peut exister une mémoire commune à toutes les unités, ou bien encore les unités de calcul peuvent être regroupées, et disposer d'une mémoire pour chaque groupe.

Dans une réalisation, lorsqu'au moins une opération spécifique met en œuvre au moins un paramètre, la valeur de ce paramètre est fonction de la position du sous-objet et/ou de l'information élémentaire dans l'objet à traiter.

Pour certaines opérations, la valeur du paramètre sera fixe pour tout l'objet à traiter, alors que pour d'autres, cette valeur sera variable en fonction de la position. Ainsi, par exemple, les coefficients d'un filtre de correction de flou d'image pourront être plus ou moins forts selon que l'on se trouve au centre ou au bord de l'image. Selon la plateforme utilisée pour effectuer le traitement, la configuration des unités de calcul peut varier. Ainsi, dans une réalisation, les opérations spécifiques sont réalisées par des unités de calcul chaînées . En fait, dans ce cas, les unités de calcul peuvent être chaînées « en série » ou selon un arbre, et les résultats des calculs sur une information élémentaire à traiter transitent d'une unité à l'autre. Une telle configuration est rendue possible par le fait que le traitement est régulier, et que le transit des informations élémentaires peut donc également se faire de façon régulière.

Les unités de calcul peuvent également être placées en parallèle, afin de traiter plusieurs informations élémentaires simultanément. Dans ce cas, les unités de calculs sont chaînées pour pouvoir combiner des résultats de calculs issus d' informations élémentaires différentes par exemple des filtres .

Dans une réalisation, pour faciliter le câblage du composant comprenant les différents processeurs, les unités de calcul sont chaînées selon un chaînage à une dimension. Dans une autre réalisation, les unités de calcul sont chaînées selon au moins un chaînage circulaire. Cette dernière réalisation permet d' obtenir un traitement ininterrompu, puisque lorsqu' une information élémentaire a transité par toutes les unités de calcul, et a subi un certain nombre d'opérations spécifiques, elle est aussitôt transmise de nouveau à la première unité de calcul .

Dans une réalisation, dans laquelle les unités de calcul sont chaînées selon au moins un chaînage circulaire, le chaînage comporte en outre au moins une file.

Cette réalisation du procédé peut être mise en œuvre en tant que telle.

Dans une autre réalisation de l'invention, dans laquelle le sous-objet comporte DSO dimensions, les opérations spécifiques sont effectuées par des unités de calcul chaînées selon au moins un chaînage circulaire pour chaque dimension du sous-objet ; le (s) chaînage (s) circulaire (s) pour chaque dimension particulière Dl du sous-objet comportant en outre au moins une file partagée ou non entre le (s) chaînage (s) circulaire (s) pour la dimension particulière Dl du sous-objet.

Cette réalisation du procédé peut être mise en œuvre en tant que telle. Elle sera décrite ultérieurement en détail à l'aide des figures . De préférence, dans le cas où il y a plusieurs chaînages circulaires selon une dimension du sous-objet (notamment lorsque les processeurs sont disposés selon une grille) , la file est partagée entre tous les chaînages circulaires selon la même dimension. De préférence, il y a exactement une file par dimension du sous-objet, et chaque file est partagée entre tous les chaînages circulaires selon la même dimension.

Dans une autre réalisation de l'invention, dans laquelle le sous-objet comporte DSO dimensions, les opérations spécifiques sont effectuées par des unités de calcul chaînées selon une dimension déterminée DD du sous-objet au moyen d' au moins un chaînage circulaire CCI ; ledit chaînage circulaire CCI comportant en outre au moins une file. Dans cette réalisation, le procédé comprenant en outre l'étape, pour au moins une instruction spécifique, pour chaque application de ladite instruction spécifique de transmettre le résultat de cette application de l'instruction spécifique effectuée sur une unité de calcul UCl à l'unité de calcul UC2 ou file qui suit ladite unité de calcul UCl selon ledit chaînage. Cette réalisation du procédé peut être mise en œuvre en tant que telle.

De préférence, le sous-objet comporte DSO dimensions, les opérations spécifiques sont effectuées par des unités de calcul chaînées selon une dimension déterminée DD du sous-objet au moyen d'au moins un chaînage circulaire CCI ; ledit chaînage circulaire CCI comporte en outre au moins une file ; le procédé comprend en outre l'étape, pour au moins une instruction spécifique, pour chaque application de ladite instruction spécifique - de transmettre le résultat de ladite application de l'instruction spécifique effectuée sur une unité de calcul

UCl à l'unité de calcul UC2 ou file qui suit ladite unité de calcul UCl selon ledit chaînage de transmettre depuis la file à l'unité de traitement UCO qui suit la file, de manière conditionnelle en fonction de la position du sous-objet dans l'objet, un résultat de l'application de l'instruction spécifique transmis à la file lors du traitement d'un autre sous-objet.

Dans une réalisation, les unités de calcul appartiennent chacune à au moins un chaîne, ce dans chacune des dimensions du sous- objet .

Dans une réalisation, le procédé comprend en outre l'étape, pour au moins deux instructions spécifiques, pour chaque application de l'une des deux instruction spécifique, de transmettre le résultat de ladite application l'instruction spécifique effectuée sur une unité de calcul UCl à l'unité de calcul UC2 ou file qui suit ladite unité de calcul UCl selon un chaînage prédéterminé de manière indépendante pour chaque instruction spécifique. Le chaînage utilisé dépend en pratique du type de filtre effectué (vertical ou horizontal par exemple) par la séquence d'instruction spécifique.

Dans une réalisation, les opérations spécifiques sont de deux types : - soit elles ne mettent en œuvre aucun chaînage, soit elles mettent systématiquement en œuvre un chaînage, c'est à dire à chaque fois qu'elles sont effectuées; dans ce cas, tous les chaînages mis en œuvre par la même opération spécifique par les différents processeurs sont selon la même dimension. Dans une réalisation, les opérations spécifiques sont effectuées par des unités de calcul chaînées selon au moins un chaînage circulaire ; ledit chaînage permet de transmettre le résultat d'une opération spécifique au processeur ou file suivant dans le chaînage le processeur ayant produit ledit résultat.

Dans une réalisation, les opérations spécifiques sont effectuées par des unités de calcul chaînées selon au moins un chaînage circulaire ; ledit chaînage circulaire comportant en outre au moins une file ; ladite file permettant de transmettre les résultats d'opérations spécifiques nécessaires au calcul d'au moins un autre sous-objet.

Dans une autre réalisation, l'invention comprend en outre l'étape de grouper en mémoire les résultats d'opérations spécifiques utilisées lors du sous-traitement d'un autre sous- objet en fonction de la position relative dudit autre sous-objet par rapport au dit sous-objet.

Dans une réalisation, le procédé comprend en outre l'étape de grouper dans au moins une file les résultats d'opérations spécifiques utilisées lors du sous-traitement d'un autre sous-objet.

Par ailleurs, dans certaines réalisations, le procédé comprend l'étape supplémentaire de fournir à la plateforme des instructions permettant de garder en mémoire ou en file au moins une partie de ces résultats d'opérations spécifiques.

Le traitement doit, bien entendu, s'adapter à configuration de la plateforme, ceci afin d'utiliser au mieux les capacités matérielles de cette plateforme. A cet effet, dans une réalisation, le procédé comprend l'étape d'affecter les opérations spécifiques aux unités de calcul en fonction du chaînage des unités de calcul, et de la séquence. Cette étape peut également être réalisée par un compilateur situé en amont de la plateforme. Par ailleurs, toujours afin d'utiliser au mieux les capacités de la plateforme, il peut être intéressant d'utiliser des unités de calcul programmables, c'est-à-dire que la séquence d'opérations spécifiques et/ou l'affectation des opérations spécifiques aux différentes unités de calcul peut être modifiée après réalisation du composant contenant ces unités de calcul. Ainsi, dans une réalisation, l'ordre et/ou la nature des opérations spécifiques sont modifiables. Par contre, même si les unités de calcul sont programmables, elles peuvent être programmées une première fois au moment de la réalisation du composant. De cette façon, dans une réalisation de l'invention, les opérations spécifiques sont effectuées par des unités de calcul câblées selon au moins une séquence prédéterminée d'opérations spécifiques. Cette réalisation permet, par exemple, de se dispenser de l'utilisation d'une mémoire externe. En effet, au lieu de disposer d'une telle mémoire contenant le séquencement des opérations à réaliser pour un algorithme, on peut câbler les unités de calcul de façon telle que les opérations soient réalisées dans un ordre correspondant à cet algorithme que l'on veut appliquer à un objet.

La plateforme sur laquelle est effectuée le traitement peut disposer de différents types de mémoire qui varient, tant en terme de capacité qu'en terme de débit d'accès. Par exemple, une mémoire rapide et/ou des registres peuvent être utilisés pour stocker des résultats d'opérations à court terme, dans le cas d'opérations telles que des filtres qui nécessitent la réutilisation immédiate de certaines données. Ainsi, dans une réalisation, au moins une opération spécifique est effectuée par au moins une unité de calcul dotée d'une unité de mémoire de capacité limitée pour stocker des informations élémentaires et/ou des résultats d'opérations spécifiques, cette mémoire contenant au plus seize informations élémentaires et/ou résultats d'opérations spécifiques. Les mémoires rapides ici ayant généralement une capacité limitée, il est nécessaire, dans certains cas, de disposer également d'une mémoire de plus grande capacité afin de stocker davantage d' informations élémentaires et/ou résultats d' opérations spécifiques .

À cet effet, dans une réalisation, au moins une opération spécifique est effectuée par au moins une unité de calcul ayant accès à une unité de mémoire de communication, contenant au moins une information élémentaire et/ou au moins un des résultat d'opération spécifique issus d'autres sous-objets.

Cette mémoire de communication est, généralement, utilisée pour stocker des informations élémentaires et/ou résultats d'opérations spécifiques à long terme, utilisés pour des traitements d'autres sous-objets. Seulement une partie des opérations spécifiques produisent ou utilisent de telles données, et le débit nécessaire est donc limité. La régularité apportée par l'invention permet de déterminer très simplement quelles sont ces données et donc de se passer d'un mécanisme de mémoire cache, ce qui réduit la complexité et le coût de la plateforme. Ainsi, dans une réalisation, l'unité de mémoire de communication a un débit d'accès inférieur à 0.3*N accès/sous- objet/opération spécifique. Une telle mémoire, avec un débit d'accès relativement lent, sera moins onéreuse que si l'on souhaitait utiliser une mémoire à la fois rapide et de grande capacité. Ceci est un avantage de l'invention.

Si la plateforme de traitement est telle que la capacité mémoire est réduite, il faut choisir une taille de sous-objets telle qu'on peut appliquer correctement un traitement. Ainsi dans une réalisation, utilisée notamment dans le cas où la plateforme est intégrée dans un téléphone mobile, la valeur de Q est fixée à 1 et la valeur de N est comprise entre 2 et 16. Par exemple, si la plateforme est destinée à traiter des photographies prises par le téléphone mobile, toutes les opérations s'appliqueront à un seul pixel à la fois. Au contraire, dans certains cas comme, par exemple, lorsque la plateforme comporte un processeur vectoriel, on peut disposer d'un grand nombre d'unités de calcul. Cette configuration matérielle permet, si les unités de calcul sont utilisées à bon escient, d'accélérer le processus de traitement d'un objet. À cet effet, dans une réalisation, au moins une opération spécifique est effectuée simultanément par au moins deux unités de calcul identiques. L'invention permet alors, par la régularité du traitement, d'exploiter au mieux les processeurs.

Selon les réalisations, les opérations spécifiques comprennent au moins une opération spécifique de calcul prise dans le groupe comprenant : l'addition, la soustraction, la multiplication, l'application d'une table de correspondance, le minimum, le maximum, la sélection

Ainsi, dans une réalisation, au moins une opération spécifique de calcul réalise en outre un décalage, et/ou une saturation et/ou un arrondi. Selon l'invention, l'opération spécifique de calcul de sélection permet de choisir une donnée parmi au moins deux données en fonction de la valeur d'une troisième donnée

Dans une réalisation, l'application d'une table de correspondance est réalisée par un calcul mettant en œuvre l'entrée de la table et un nombre limité de coefficients. Dans une réalisation, le nombre limité de coefficients est fixé à 8.

Par ailleurs, dans d'autres réalisations, les opérations spécifiques sont effectuées par des unités de calcul chaînées au moyen d' au moins un chaînage circulaire CCI ; ledit chaînage circulaire CCI comportant en outre au moins une file ; au moins une instruction spécifique IS4 de la séquence d'instruction spécifique transmettant le résultat d'une instruction spécifique IS5 effectuée sur une unité de calcul UCl à l'unité de calcul UC2 ou file qui suit ladite unité de calcul UCl selon ledit chaînage . Dans une réalisation l'instruction spécifique IS4 transmet, depuis la file, à l'unité de calcul UCO qui suit la file, le résultat d'une instruction spécifique IS5 effectuée lors d'un sous-traitement précédent. De préférence la file permet de sortir les données dans le même ordre qu' elles ont été entrées dans la file. De préférence, un chaînage comprenant des unités de calcul et une file comprend un mécanisme permettant de gérer l'amorçage : la file est initialisée régulièrement, par exemple en début de chaque ligne si la file fait partie d'un chaînage horizontal et l'objet est une image ; à la première exécution de l'instruction spécifique IS4, aucune donnée n'est transmise à UCO depuis la file ; ensuite, l'instruction spécifique IS4 transmet, depuis la file, à l'unité de calcul UCO qui suit la file, le résultat d'une instruction spécifique IS5 effectuée lors d'un sous-traitement précédent.

Les valeurs de N et de Q varient selon les réalisations . Chacune des réalisations présentent des avantages différents . Ainsi, dans une réalisation N n'est pas multiple de Q. Dans une variante de cette réalisation, Q est égal au nombre d'opérations spécifiques de la séquence obtenue en traduisant la séquence d'opérations générique.

Dans une réalisation N est un multiple de Q. Ceci permet de rendre régulier le traitement. De préférence N = Q. Ceci permet de réduire la quantité de mémoire nécessaire au stockage de résultats temporaires .

Dans une réalisation Q=I et N=4. Ceci permet de réutiliser une même valeur de paramètre pour plusieurs application d'une même opération spécifique. Dans une réalisation Q>1 et N=Q. Ceci permet d'utiliser les Q unités de calcul d'un processeur vectoriel à 100%.

Dans une réalisation Q>1 et N est un multiple de Q. Ceci permet d'utiliser les Q unités de calcul d'un processeur vectoriel à 100%, en réduisant le nombre de résultat d'opérations spécifiques effectuées lors du traitement d'un sous-objet et utilisées pour le traitement d'un autre sous- objet .

Dans une réalisation, chaque processeur effectue toutes les opérations de la séquence d' opérations spécifiques . Dans une réalisation, tous les processeurs effectuent la même opération spécifique en même temps . Dans une autre réalisation, tous les processeurs effectuent la même opération spécifique successivement, ce qui permet d'effectuer des filtres récursifs. Le stockage en mémoire des informations élémentaires et des résultats d'opérations nécessite l'utilisation d'un adressage relativement simple, afin de ne pas perdre trop de temps lors de la recherche d'informations élémentaires. À cet effet, dans une réalisation, au moins une partie des résultats d'opérations spécifiques est stockée en mémoire à une adresse de la forme « adresse de base + décalage » ou « adresse de base + décalage modulo (taille d'une mémoire tampon) » , le décalage étant constant pour tous les résultats d'une même opération spécifique. La mémoire tampon est, de préférence, intégrée dans une des mémoires de la plateforme utilisée pour le traitement. La mémoire tampon peut être, notamment, une file.

Dans une autre réalisation, l'adresse de base est modifiée à chaque fois qu'on change de sous-objet dans le processus de traitement. Dans une réalisation, cet adressage peut être utilisé notamment pour les données de communication entre les sous- objets selon au moins une dimension.

Dans le cas particulier d'un processeur vectoriel, le calcul d'adresse est commun à l'ensemble des processeurs et à une mémoire délivrant des groupes d' informations élémentaires et/ou de résultat d'opérations spécifiques de la taille d'un sous-objet peut être utilisée.

On a vu plus haut que, dans certaines configurations matérielles, chaque unité de calcul disposait de sa propre mémoire. Dans ce cas, une adresse donnée peut être relative à plusieurs mémoires, c'est-à-dire qu'une adresse mémoire telle que définie ici représente en fait l'ensemble des adresses mémoire utilisées par toutes les unités de calcul effectuant une même opération spécifique.

Dans une réalisation, au moins une partie des résultats d' opérations spécifiques est stockée en mémoire à une adresse prédéterminée pour tous les résultats d'une même opération spécifique. Le procédé défini ci-dessus est tel que le nombre d'unités de calcul nécessaires pour effectuer le traitement peut être relativement réduit. Ainsi, dans une réalisation, lorsque les opérations spécifiques sont effectuées par au moins une unité de calcul dotée d'au moins une unité de registres et d'au moins une mémoire de communication entre sous-objets, le nombre de transistors de la plateforme de traitement est inférieur à 10000 par unité de calcul, y compris l'unité de registres associée sans la mémoire de communication.

Dans une réalisation de l'invention, on fournit à la plateforme, de préférence directement, des données formatées spécifiques calculées à partir de données formatées génériques, ces données formatées génériques comprenant des premières données décrivant au moins une séquence d'opérations génériques, le calcul des données formatées spécifiques étant effectué en tenant compte d'un mode de parcours des informations élémentaires dans la plateforme et d'opérations spécifiques issues des opérations génériques, ces opérations spécifiques formant la séquence d'opérations spécifiques à effectuer sur un objet lors de son traitement dans la plateforme. Ainsi, on peut facilement modifier le traitement de l'objet en changeant les données formatées génériques et obtenir automatiquement des données formatées spécifiques optimisées pour la plateforme. De sorte que la mise sur le marché des plateformes est accéléré. De sorte que la taille de code, le temps de calcul et la quantité de mémoire sont optimisés . De sorte que la consommation électrique et le coût de la plateforme sont réduits .

Les opérations génériques sont des opérations qui s'appliquent à des blocs logiques, c'est-à-dire à des entités abstraites, sans notion de taille ni de forme, composées d'informations élémentaires, et pouvant constituer tout ou partie de l'objet.

Dans la présente description, des données formatées génériques sont des données numériques permettant de décrire un traitement à apporter sur un objet par une plateforme de traitement de données, indépendamment de la plateforme elle- même. Les données formatées spécifiques peuvent être fournies directement ou indirectement en utilisant un compilateur pour générer un binaire adapté à la plateforme à partir des données formatées spécifiques.

Il existe différents modes de parcours possibles, dont certains seront décrits plus loin. A partir de ces modes de parcours, on peut ainsi générer automatiquement les opérations spécifiques qui doivent être appliquées à l'objet à traiter. Ceci permet une mise sur le marché des algorithmes en un temps relativement court.

Dans une réalisation, les opérations génériques comprennent au moins une opération générique élémentaire comprise dans le groupe comprenant : l'addition de blocs logiques et/ou de paramètres, la soustraction de blocs logiques et/ou de paramètres, le calcul de la valeur absolue de la différence entre des blocs logiques, la multiplication de blocs logiques et/ou de paramètres, le maximum parmi au moins deux blocs logiques et/ou paramètres, le minimum parmi au moins deux blocs logiques et/ou paramètres, l'application d'une table de correspondance, le choix conditionnel de blocs logiques et/ou paramètres, ce choix se faisant de la façon suivante : si a > b on choisit c, sinon on choisit d, avec a, b, c et d qui sont des blocs logiques et/ou des paramètres, l'histogramme d'un bloc logique, le changement d'échelle d'un bloc logique, et une opération produisant un bloc contenant au moins une coordonnée.

Dans une autre réalisation, les informations élémentaires sont représentées par des valeurs numériques en virgule fixe, et dans lequel les opérations génériques élémentaires comprennent des opérations de décalage, une opération de saturation et/ou au moins une opération générique élémentaire combinée à cette opération de saturation.

Toutes les caractéristiques matérielles qui viennent d'être définies sont, bien entendu, valables quel que soit le type de plateforme utilisée, et quel que soit le type d'objet à traiter.

Ainsi, dans une réalisation, l'objet à traiter est une image, et les informations élémentaires sont des pixels de cette image. Dans ce cas, la plateforme de traitement fait, par exemple, partie d'un appareil de capture et/ou de restitution d' image, et les opérations mettent en œuvre des paramètres dont les valeurs dépendent de la séquence d' opérations et/ou de la plateforme de traitement et/ou de l'objet à traiter, ces valeurs de paramètres étant liées aux caractéristiques de l'optique et/ou du capteur et/ou de l'imageur et/ou de l'électronique et/ou du logiciel de l'appareil de capture et/ou de restitution d'image. Les caractéristiques peuvent être par exemple des caractéristiques intrinsèques fixes pour tous les objets ou variables selon l'objet, par exemple des caractéristiques de bruit qui varient en fonction du gain d'un capteur. Les caractéristiques peuvent être identiques pour toutes les informations élémentaires ou variables selon la position absolue de l'information élémentaire, par exemple les caractéristiques de flou de l'optique.

Dans d'autres réalisations, l'objet à traiter est un signal sonore numérisé et les informations élémentaires sont les échantillons sonores de ce signal, ou bien encore l'objet à traiter est un maillage numérique et les informations élémentaires sont les informations spatiales et temporelles caractérisant chaque point du maillage.

L' invention concerne également une plateforme à processeur (s) et mémoire (s), destinée à traiter un objet (55) constitué d'informations élémentaires de même nature (54, 56, 58, 60, 154, 156, 158, et 160) , comprenant des moyens pour décomposer l'objet à traiter en au moins deux sous-objets (50, 51, 52 et 53) constitués de N informations élémentaires chacun (54, 56, 58, 154, 156, 158), tous les sous-objets (50, 51, 52 et 53) ayant le même nombre N d'informations élémentaires et, des moyens pour effectuer au moins une séquence d'opérations spécifiques sur les informations élémentaires de chaque sous- objet (50 , 51 , 52 , 53) , ces moyens de traitement comprenant en outre des moyens pour effectuer, pour chaque sous-objet, au moins N fois chaque opération spécifique, de façon, d'une part à faire intervenir au moins une fois chaque information élémentaire de chaque sous-objet, et d'autre part à produire N résultats pour chaque opération spécifique, les moyens de traitement étant tels qu'au moins une opération spécifique (62) de la séquence d'opérations spécifiques met en œuvre, directement ou indirectement, au moins une fois au cours de ses N applications (62a, 62b, 62c, 62d, 62e, 62f) , une information élémentaire appartenant à un autre sous-objet (60, 160) .

Dans une réalisation, l'objet à traiter comprend DO dimensions, les sous-objets comprennent DSO dimensions sélectionnées parmi les DO dimensions de l'objet, et les moyens pour décomposer l'objet sont tels que, selon au moins une dimension du sous-objet, les sous-objets n'ont pas de recouvrement .

Ainsi, de préférence, les opérations spécifiques sont effectuées par des unités de calcul chaînées selon au moins un chaînage circulaire selon la dimension selon laquelle les sous objets n'ont pas de recouvrement.

De préférence également, les sous objets n'ont de recouvrement selon aucune dimension. Dans une réalisation, la plateforme comprend au moins une mémoire de communications inter-objet pour stocker les informations élémentaires et/ou résultats d'opérations spécifiques réalisés pensant le traitement d'un sous-objet, et utilisés pour le traitement d'un autre sous-objet.

Dans une réalisation, la plateforme comprend des moyens pour effectuer une séquence d' opérations spécifiques ne comportant qu'une opération spécifiques mettant en œuvre les mêmes données lors du traitement de l'objet.

Dans une réalisation, l'objet comprend DO dimensions, les informations élémentaires sont reçues dans la plateforme selon une dimension DE de l'objet puis selon les autres dimensions, les sous-objets comprennent DSO dimensions sélectionnées parmi les DO dimensions de l'objet et comprenant la dimension DE, et la plateforme est telle qu'une boucle interne de parcours des sous-objets, comprise dans le traitement, s'effectue selon la dimension DE.

Dans une réalisation, l'objet comprend DO dimensions, les informations élémentaires sont reçues dans la plateforme selon une dimension DE de l'objet puis selon les autres dimensions, les sous-objets comprennent les DO dimensions de l'objet ou DO-I dimensions sélectionnées parmi les DO dimensions de l'objet, la dimension DE n'étant pas comprise, et la plateforme est telle qu'une boucle interne de parcours des sous- objets, comprise dans le traitement s'effectue selon la dimension DE. Dans une réalisation, les moyens pour décomposer l'objet à traiter sont tels que la taille des sous-objets dans chaque dimension est déterminée en fonction de la taille de l'objet et/ou du débit des informations élémentaires reçues par la plateforme, et/ou de la vitesse de calcul de la plateforme et/ou de la taille et du débit d'au moins une mémoire de la plateforme.

Dans une réalisation, dans le cas où au moins une partie des opérations spécifiques met en œuvre au moins une valeur de paramètres, la plateforme comprend Q unités de calculs calculant la même opération spécifique simultanément, et la plateforme comprend en outre des moyens pour effectuer au moins une séquence d'opérations spécifiques comprenant au moins une opération spécifique de sélection, cette opération spécifique de sélection effectuant la sélection d'une valeur de paramètre parmi C valeurs de paramètres en même temps sur les Q unités de calcul de manière différentiée par processeur, en fonction d'au moins une information élémentaire et/ou d' au moins un résultat d'opération spécifique et/ou d'au moins une valeur de paramètre.

Dans une réalisation, la plateforme comprend Q unités de calculs calculant la même opération spécifique simultanément, et comprend en outre des moyens pour effectuer au moins une séquence d'opérations spécifiques comprenant au moins une opération spécifique de sélection, cette opération spécifique de sélection effectuant la sélection d'une donnée parmi C donnée en même temps sur les Q unités de calcul de manière différentiée par processeur, en fonction d'au moins une information élémentaire et/ou d'au moins un résultat d'opération spécifique et/ou d'au moins une valeur de paramètre.

Dans une réalisation, la plateforme comprend des moyens pour effectuer une séquence d' opérations spécifiques comprenant au moins une opération spécifique de position, et, l'objet comportant DO dimensions, cette opération spécifique de position produisant une information de position selon une des DO dimensions .

Dans une réalisation, la plateforme comprend des moyens pour effectuer une séquence d' opérations spécifiques comprenant au moins une opération spécifique produisant une position relative en fonction d' au moins une information élémentaire et/ou d'au moins un résultat d'opération spécifique et/ou d'au moins une valeur de paramètre.

Dans une réalisation, la plateforme comprend Q unités de calculs pour effectuer au moins une partie des opérations spécifiques, Q étant égal à N ou un sous-multiple de N.

Dans une réalisation, le nombre d'unités de calcul Q est différent de N, et dans laquelle le traitement du sous-objet comprend une seule boucle interne de N/Q itérations .

Dans une réalisation, la plateforme est telle que les

Q unités de calcul sont identiques .

Dans une réalisation, la plateforme comprend des moyens pour que les N résultats issus d'une même opération spécifique soient calculés par une même unité de calcul.

Dans une réalisation, la plateforme comprend des moyens, lorsqu'au moins une opération spécifique mettant en œuvre au moins un paramètre, pour effectuer cette opération spécifique, et la plateforme comprend en outre une unité de calcul ayant accès à une unité de mémoire contenant une partie des valeurs des paramètres, la plateforme étant telle que cette partie étant déterminée en fonction des opérations spécifiques effectuées par cette unité de calcul. Dans une réalisation, la plateforme comprend des moyens pour que, lorsqu'au moins une opération spécifique met en oeuvre au moins un paramètre, ce paramètre soit fonction de la position du sous-objet dans un objet à traiter.

Dans une réalisation, la plateforme comprend des unités de calcul chaînées .

Dans une réalisation, la plateforme comprend des unités de calcul chaînées selon un chaînage à une dimension.

Dans une réalisation, la plateforme comprend des unités de calcul chaînées selon au moins un chaînage circulaire. Ce chaînage peut, en outre, dans une réalisation, comporter au moins une file.

Dans une réalisation, dans laquelle le sous-objet comporte DSO dimensions, la plateforme comprend des unités de calcul chaînées selon au moins un chaînage circulaire pour chaque dimension du sous objet. Le (s) chaînage (s) circulaire (s) pour chaque dimension particulière Dl du sous objet comportent en outre au moins une file partagée, ou non entre le (s) chaînage (s) circulaire (s) pour la dimension particulière Dl du sous objet.

Dans une réalisation, la plateforme comporte des unités de calcul chaînées selon au moins une dimension déterminée DD du sous objet au moyen d'un chaînage circulaire CCI . Le chaînage circulaire comporte en outre au moins une file ; et la plateforme est telle que pour chaque application d'une instruction spécifique, le résultat de cette application dans une première unité de calcul UCl est transmis à une unité de calcul UC2 ou file qui suit ladite première unité de calcul UCl selon ledit chaînage. Dans une réalisation, la plateforme comporte au moins une mémoire pour enregistrer les résultats d'opérations spécifiques utilisées lors du sous traitement d'un autre sous objet en fonction de la position relative dudit autre sous objet par rapport au dit sous objet.

Dans une autre réalisation encore, la plateforme comporte des unités de calcul chaînées selon au moins un chaînage circulaire, et des moyens pour affecter les opérations spécifiques aux unités de calcul en fonction du chaînage des unités de calcul et de la séquence

Dans une réalisation, la plateforme comprend des moyens pour que l'ordre et/ou la nature des opérations spécifiques soi (en) t modifiable (s) .

Dans une réalisation, la plateforme comprend des unités de calcul câblées pour effectuer les opérations spécifiques selon au moins une séquence prédéterminée d'opérations spécifiques.

Dans une réalisation, la plateforme comprend au moins une unité de calcul dotée d'une unité de mémoire de capacité limitée pour stocker des informations élémentaires et/ou des résultats d'opérations spécifiques, cette mémoire contenant au plus seize informations élémentaires et/ou résultats d'opérations spécifiques.

Dans une réalisation, la plateforme comprend au moins une unité de calcul ayant accès à une unité de mémoire de communication, contenant des informations élémentaires et/ou des résultats d'opérations spécifiques issus d'autres sous-objets. Dans une réalisation, la plateforme est telle que l'unité de mémoire de communication a un débit d'accès inférieur à 0.3*N accès/sous-objet/opération spécifique.

Dans une réalisation, la plateforme est notamment intégrée dans un téléphone mobile, et comprend des moyens pour que la valeur de Q soit fixée à 1 et pour que la valeur de N soit comprise entre 2 et 16.

Dans une réalisation, la plateforme comprend au moins deux unités de calcul identiques effectuant simultanément au moins une même opération spécifique.

Dans une réalisation, la plateforme comprend des moyens pour qu'au moins une partie des résultats d'opérations spécifiques soit stockée en mémoire à une adresse de la forme

« adresse de base + décalage » ou « adresse de base + décalage modulo (taille d'une mémoire tampon) », le décalage étant constant pour tous les résultats d'une même opération spécifique.

Dans une réalisation, la plateforme comprend des moyens pour modifier l'adresse de base à chaque fois que l'on change de sous-objet dans le processus de traitement.

Dans une réalisation, la plateforme comprend des moyens pour qu' au moins une partie des résultats d' opérations spécifiques soit stockée en mémoire à une adresse prédéterminée pour tous les résultats d'une même opération.

Dans une réalisation, la plateforme comprend au moins une unité de calcul dotée d'une mémoire, et dans laquelle le nombre de transistors est inférieur à 10000 par unité de calcul, y compris l'unité de mémoire associée. Dans une réalisation, la plateforme comprend des moyens pour recevoir en entrée, de préférence directement, des données formatées spécifiques calculées à partir de données formatées génériques, ces données formatées génériques comprenant des premières données décrivant au moins une séquence d'opérations génériques, le calcul des données formatées spécifiques étant effectué en tenant compte d'un mode de parcours des informations élémentaires dans la plateforme et d'opérations spécifiques issues des opérations génériques, ces opérations spécifiques formant une séquence d'opérations spécifiques, et la plateforme comprenant des moyens pour effectuer cette séquence d'opérations spécifiques sur un objet.

Dans une réalisation, la plateforme comprend des moyens pour traiter un objet étant constitué par une image, les informations élémentaires étant des pixels de cette image.

Dans une réalisation, la plateforme fait partie d'un appareil de capture et/ou de restitution d' image, les opérations mettant en œuvre des paramètres dont les valeurs dépendent de la séquence d'opérations et/ou de cette plateforme et/ou de l'objet à traiter, ces valeurs de paramètres étant liées aux caractéristiques de l'optique et/ou du capteur et/ou de l'imageur et/ou de l'électronique et/ou du logiciel de l'appareil de capture et/ou de restitution d'image.

Dans une réalisation, la plateforme comprend des moyens pour traiter un objet étant constitué par un signal sonore numérisé, les informations élémentaires étant les échantillons sonores de ce signal.

Dans une réalisation, la plateforme comprend des moyens pour traiter un objet étant constitué par un maillage numérique, les informations élémentaires sont les informations spatiales et temporelles caractérisant chaque point du maillage. L'invention concerne également un objet traité par un procédé de traitement conforme au procédé précédemment décrit.

D'autres caractéristiques et avantages de l'invention apparaîtront avec la description non limitative de certains de ses modes de réalisation, cette description étant effectuée à l'aide des figures sur lesquelles : les figures la, Ib, Ic Id, I^e et If, déjà décrites, représentent des exemples de décomposition d'une image en sous-objets, conformément à l'invention

- la figure 2 représente un dispositif utilisant un procédé conforme à l'invention,

- la figure 3 représente un exemple d' une séquence d'opérations génériques appliquée à plusieurs blocs logiques et à un paramètre, la figure 4 représente la structure de données formatées spécifiques fournies à une plateforme, dans un procédé conforme à l'invention, - la figure 5 représente l'application d'une opération spécifique à un objet, et les figures 6, 7 et 8 présentent différentes architectures de plateformes pouvant traiter des objets selon un procédé conforme à l'invention, - les figures 9a, 9b et 9c montrent des exemples de chaînage des processeurs dans une plateforme conforme à l'invention.

Le dispositif représenté sur la figure 2 est utilisé pour traiter une image 22, cette image étant un ensemble de pixels représentés par au moins une valeur numérique.

Dans ce dispositif, on fournit à un moyen de traitement de données numériques 10 des données formatées génériques 12. Ce moyen de traitement est par exemple un compilateur. Les données formatées génériques, fournies par un procédé conforme à l'invention, comprennent des premières et secondes données 14 qui décrivent des séquences d'opérations génériques et qui fournissent les positions relatives des blocs logiques impliqués dans ces opérations génériques . Ces premières et secondes données seront illustrées avec la figure 3.

Le moyen de traitement 10 reçoit également en entrée un mode de parcours 24 des informations élémentaires dans la plateforme déterminé en fonction des caractéristiques d'une plateforme de traitement 20, telle qu'un appareil de capture ou de restitution d' images .

A partir de ces données formatées génériques 12 et de ces paramètres, le moyen de traitement 10 fournit à la plateforme de traitement 20 des données formatées spécifiques 18.

Les données formatées spécifiques contiennent différents types de données, telles que des données concernant l'organisation des pixels dans la mémoire de la plateforme, l'ordre dans lequel les pixels sont traités par la plateforme ou encore le groupement des opérations effectuées par la plateforme.

La plateforme 20 utilise alors ces données formatées spécifiques 18 pour traiter l'image 22 qu'elle reçoit en entrée. Le tableau 4 ci-dessous et la figure 3 montrent un exemple de données formatées génériques sous la forme d'une séquence d' opérations génériques appliquées à un bloc logique Bl. Cette séquence comporte trois opérations génériques. Les colonnes du tableau représentent dans l'ordre : le rang de l'opération dans la séquence, - le nom de l'opération générique, le bloc logique (sortie) sur lequel est inscrit le résultat de l'opération générique, c'est-à-dire l'emplacement où se trouverait ce résultat si on reconstituait l'objet à l'issue de chaque opération, la première entrée (entrée 1) de l'opération générique, qui peut être un bloc logique ou un paramètre, la position relative du bloc logique à utiliser par rapport au bloc logique mis en entrée 1, s'il y a lieu, - la seconde entrée (entrée 2) de l'opération générique, qui peut également être un bloc logique ou un paramètre, et la position relative du bloc logique à utiliser par rapport au bloc logique mis en entrée 2, s'il y a lieu.

Les informations se trouvant dans les colonnes « position relative » sont les informations présentes dans les secondes données fournies à un moyen de traitement grâce à un procédé selon l'invention. Dans une réalisation, les secondes données se rapportent à la position relative, selon au moins une dimension de l'objet notamment spatiale et/ou temporelle, des blocs et/ou des paramètres les uns par rapport aux autres, et/ou se rapportant à l'échelle relative, selon au moins une dimension de l'objet notamment spatiale et/ou temporelle, des blocs logiques et/ou des paramètres les uns par rapport aux autres .

Dans ce tableau, ces informations se trouvent sous la forme « gauche » et « droite » pour être compréhensibles, mais en réalité, dans les données formatées génériques, elles peuvent également être codées par des valeurs numériques telles que (0 ;1) et/ou par des fonctions telle que

(f (x ;y) ;g(x ;y) ) .

Dans une réalisation, une opération générique permet d'obtenir un bloc logique constitué de la position absolue selon une dimension de l'objet, une autre opération générique dite d' indirection permet d' obtenir un bloc par déplacement et/ou changement d' échelle indiqué par un deuxième bloc à partir d'un troisième bloc. On peut alors effectuer les calculs des fonctions donnant la position relative et/ou l'échelle relative par exemple 0,5*(x-100) à l'aide d'opérations génériques sur les blocs puis utiliser l'opération générique d' indirection pour effectuer le déplacement relatif et/ou le changement d'échelle relatif correspondant .

Le tableau 4 n'est qu'un exemple de codage, les premières données et secondes données peuvent être codées de diverses façons sous forme tabulée, mais également sous forme symbolique, sous forme graphique ou sous toute autre forme.

10 De plus des informations supplémentaires relatives aux type des données, aux décalages et saturations ne sont pas représentées à des fins de simplification de l'exemple.

TABLEAU IV

15

Le premier bloc logique utilisé dans cette séquence d'opérations est un bloc logique Bl (51). La première opération générique est une addition (52) entre le bloc logique Bl décalé 20 à gauche (51g), et le bloc logique Bl décalé à droite (5Id) . Le résultat de cette addition est inscrit dans le bloc B2 (53) : B2=Blgauche + Bldroite.

La deuxième opération (54) est une transformation du bloc B2 (53) par rapport à une table. Cette opération a donc en 25 entrée le bloc B2 (53) et un paramètre Paraml (55) qui représente la table de modification. Le résultat de cette opération est inscrite dans le bloc B3 (56) : B3 = LUT (Paraml, B2) .

La troisième et dernière opération (57) de cette 30 séquence est une multiplication de blocs logiques. Cette opération a pour entrées le bloc logique B3 (56) et le bloc logique Bl (51) : B4 = B3*Bl .

Le bloc logique B4 (58) est ainsi le bloc obtenu à l'issue de la séquence d'opérations génériques.

Les données formatées génériques de l'exemple du tableau 4 sont indépendantes de la plateforme, de la décomposition de l'objet en sous-objets, du mode de parcours des informations élémentaires de l'objet, de l'ordre dans lequel les informations élémentaires seront traitées dans la plateforme, ainsi que de l'organisation en mémoire. En effet, les données formatées génériques du tableau 1 peuvent être traduites de diverses façons en données formatées spécifiques ou en code pour la plateforme, par exemple, sans que la liste soit limitative, selon les traductions suivantes.

Un premier exemple de traduction bien que non optimal en terme de mémoire et de temps de calcul permet d' illustrer une traduction simple sans passer par une décomposition en sous- objets :

Pour chaque pixel de l'objet d'entrée BPl

(correspondant au bloc logique Bl) en excluant les deux colonnes de gauche et de droite, les pixels étant parcourus de gauche à droite puis de haut en bas

Additionner le pixel situé à gauche du pixel courant et le pixel situé à droite, stocker le résultat dans un bloc physique BP2 (correspondant au bloc logique B2) .

Pour chaque pixel de BP2 parcouru de gauche à droite puis de haut en bas appliquer la table au pixel courant et stocker le résultat dans un bloc physique BP3 (correspondant au bloc logique B3) Pour chaque pixel de BP3 parcouru de gauche à droite puis de haut en bas

Multiplier le pixel courant par le pixel correspondant de BPl et stocker le résultat dans le bloc physique de sortie BP4 (correspondant au bloc logique B4)

Un deuxième exemple de traduction montre que l'on peut diminuer la taille de la mémoire utilisée sans changer les données formatées génériques. En effet, dans le premier exemple on utilise 4 blocs physiques de taille voisine de l'image. On peut n'utiliser que 2 blocs physique en utilisant la même mémoire pour BP2, BP3 et BP4. On obtient la traduction suivante :

Pour chaque pixel de l'objet d'entrée BPl (correspondant au bloc logique Bl) en excluant les deux colonnes de gauche et de droite, les pixels étant parcourus de gauche à droite puis de haut en bas Additionner le pixel situé à gauche du pixel courant et le pixel situé à droite, stocker le résultat dans un bloc physique BP2 (correspondant au bloc logique B2) .

Pour chaque pixel de BP2 parcouru de gauche à droite puis de haut en bas appliquer la table au pixel courant et stocker le résultat dans un bloc physique BP2 (correspondant maintenant au bloc logique B3)

Pour chaque pixel de BP2 parcouru de gauche à droite puis de haut en bas

Multiplier le pixel courant par le pixel correspondant de BPl et stocker le résultat dans le bloc physique de sortie BP2 (correspondant maintenant au bloc logique B4)

Un troisième exemple de traduction montre que l'on peut réduire le temps de calcul sans changer les données formatées génériques . En effet, dans le deuxième exemple on utilise 2 blocs physiques de taille voisine de l'image, mais on écrit 3 fois entièrement le bloc physique BP2, on lit 2 fois entièrement le bloc physique BPl et on lit 2 fois entièrement le bloc physique BP2. On peut se limiter à une lecture et une écriture seulement avec un mode de parcours différent et des blocs différents . Ceci réduit le nombre d' instructions nécessaires, mais également les accès à la mémoire. Dans ce cas un sous-objet est constitué de un pixel. On obtient la traduction suivante :

Pour chaque pixel de l'objet d'entrée BPl

Effectuer la séquence d'opération spécifique suivante : Additionner le pixel situé à gauche du pixel courant et le pixel situé à droite, appliquer la table au résultat et multiplier la sortie de la table par le pixel courant , stocker le résultat dans le bloc physique courant de sortie BP2 (correspondant au bloc logique B4)

Dans un quatrième exemple, plus particulièrement adapté à un processeur scalaire avec cache, on écrit le résultat dans la même zone mémoire que l'entrée. Ceci permet de réduire encore la taille de la mémoire et de rendre local les accès mémoire, ce qui est très favorable dans le cas d'une mémoire cache ou une mémoire paginée. Dans ce cas un sous-objet est constitué de un pixel. On obtient ainsi la traduction suivante :

Pour chaque pixel de l'objet d'entrée BPl

(correspondant au bloc logique Bl) en excluant les deux colonnes de gauche et de droite, les pixels étant parcourus de gauche à droite puis de haut en bas Effectuer la séquence d' opération spécifique suivante : Additionner le pixel situé à gauche du pixel courant et le pixel situé à droite, appliquer la table au résultat et multiplier la sortie de la table par le pixel courant , stocker le résultat dans le bloc physique courant de sortie BPl à la place du pixel situé à la gauche du pixel courant (le pixel de gauche n'est plus utilisé par la suite contrairement au pixel courant qui va devenir le pixel de gauche pour la prochaine itération ; BPl correspond partiellement au bloc logique B4 et partiellement au bloc logique Bl)

Un cinquième exemple de traduction est particulièrement adaptée à un processeur de traitement du signal avec une petite mémoire rapide et une grosse mémoire lente, chaque sous-objet est un rectangle par exemple 32x32 ou toute autre valeur maximisant l'utilisation de la mémoire rapide, les rectangles étant jointifs. On obtient ainsi la traduction suivante :

Pour chaque sous-objet, les sous-objets étant parcourus de gauche à droite puis de haut en bas

Lancer un transfert par un mécanisme de DMA. (« direct memory access » du bloc physique d'entrée suivant depuis la mémoire lente vers la mémoire rapide, correspondant au sous-objet suivant étendu de une colonne à gauche et à droite, soit 32x34

Lancer un transfert par un mécanisme de DMA.

(« direct memory access » du bloc physique de sortie précédent depuis la mémoire rapide vers la mémoire lente On prend en entrée le bloc physique correspondant au sous-objet courant étendu de une colonne à gauche et à droite, soit 32x34 et obtenu à l'issue du DMA de l'itération précédente

Effectuer la séquence d'opération spécifique suivante : Pour chaque pixel du bloc physique d' entrée (correspondant au bloc logique Bl) en excluant les deux colonnes de gauche et de droite parcouru de gauche à droite puis de haut en bas

Additionner le pixel situé à gauche du pixel courant et le pixel situé à droite, appliquer la table au résultat et multiplier la sortie de la table par le pixel courant du bloc, stocker le résultat dans le bloc physique courant de sortie (correspondant au bloc logique B4)

Un sixième exemple de traduction est particulièrement adaptée à un processeur vectoriel capable d'appliquer un même calcul aux différents pixels du vecteur, chaque sous-objet est un rectangle par exemple 64 pixels horizontaux ou toute autre valeur égale à la taille d'un vecteur que la plateforme sait traiter et stocker. Cette traduction ne nécessite aucune mémoire car un vecteur est traité à la fois. On obtient ainsi la traduction suivante :

Pour chaque sous-objet Vl de l'objet d'entrée BPl (correspondant au bloc logique Bl) en excluant les deux colonnes de gauche, les sous-objets étant parcourus de gauche à droite puis de haut en bas, effectuer la séquence d'opération spécifique suivante :

En début de chaque ligne créer un vecteur VO contenant à droite les 2 pixels de gauche de la ligne Extraire de VO et Vl, le vecteur V2 correspondant aux deux pixels de droite de VO et aux pixels de gauche de Vl en excluant les 2 pixels de droite de VO; additionner Vl et V2 pour obtenir V2, appliquer la table à chaque pixel de V2 pour obtenir V2, Extraire de VO et Vl, le vecteur V3 correspondant au pixel de droite de VO et aux pixels de gauche de Vl en excluant le pixel de droite de VO; copier Vl dans VO pour l'itération suivante ; multiplier V2 par V3 pour obtenir V2 , stocker le résultat V2 dans le bloc physique courant de sortie. Les troisième, quatrième, cinquième et sixième exemples ci-dessus correspondent à des réalisations selon l'invention pour diverses plateformes avec des architectures diverses notamment en terme de mémoire et de parallélisme. En particulier l'invention permet de : réduire la taille du code en n'utilisant qu'une seule boucle, et/ou

- réduire la taille mémoire, à 0 dans l'exemple, mais dans le cas plus général où il y a des filtres verticaux, il faut quand même quelques lignes de mémoire si on veut éviter de refaire des calculs pour les données en entrée des filtre verticaux, et/ou réduire le nombre d'instructions nécessaires, notamment en groupant les boucles, et/ou - s'adapter à toute taille de vecteur, et/ou s'adapter à toute architecture mémoire

Afin de simplifier, les exemples produisent une image plus petite que l'image d'entrée. On peut facilement si c'est nécessaire, obtenir une image de sortie de taille identique à l'image d'entrée en ajoutant du code en début et fin de chaque ligne pour dupliquer le pixel du bord.

La figure 4 représente la structure des données formatées spécifiques à la sortie d'un moyen de traitement 10, ces données étant destinées à être fournies à une plateforme de traitement 20, selon un procédé conforme à l'invention.

Les données formatées spécifiques sont calculées par un moyen de traitement à partir de données formatées génériques 32 fournies au moyen de traitement et d'un mode de parcours 34 des informations élémentaires dans la plateforme, déterminé par ce moyen de traitement . Les données formatées génériques comportent des premières données 36 contenant des données 38 décrivant au moins une opération générique ou séquence d'opérations à réaliser par le moyen de traitement. Les données formatées génériques comportent également des secondes données 40 se rapportant à la position et l'échelle relative de blocs logiques les uns par rapport aux autres, pour les opérations génériques impliquant au moins deux blocs logiques . A partir des ces données formatées génériques et du mode de parcours 34, le moyen de traitement fournit des données 42 relatives aux opérations spécifiques, et des données 44 relatives aux boucles. Ces données 42 et 44 font partie des données formatées spécifiques 30. La figure 5 représente l'application d'une opération ou opération spécifique à un objet. Dans cette figure, l'objet 55 est découpé en quatre sous-objets 250, 251, 252 et 253. Chacun de ces sous-objets est composé de six informations élémentaires . Parmi la séquence d' opérations à appliquer à l'objet 255 se trouve l'opération 262. Cette opération est appliquée six fois sur chaque sous-objet (262a, 262b, 262c, 262d, 262e et 262f) de manière à produire six résultats (264) . Au cours de ses six applications sur un sous-objet, l'opération 262 fait intervenir des informations élémentaires d'un autre sous-objet. Par exemple, son application au sous-objet 250 se déroule de la façon suivant : l'application 262a fait intervenir les informations élémentaires 254 et 256, l'application 262b fait intervenir les informations élémentaires 256 et 258, l'application 262c fait intervenir les informations élémentaires 258 et 260, l'information élémentaire 260 appartenant au sous- objet 252. De même l'application 262d fait intervenir les informations élémentaires 154 et 156, l'application 62e fait intervenir les informations élémentaires 156 et 158, l'application 62f fait intervenir les informations élémentaires 158 et 160, l'information élémentaire 160 appartenant au sous- objet 252.

On va maintenant décrire plusieurs exemples de modes de parcours pouvant être déterminés par un procédé conforme à l'invention. Chacun de ces modes de parcours est destiné à être utilisé dans une plateforme dont l'architecture est représentée sur l'une des figures 5 à 7.

Dans un premier exemple, illustré par la figure 6, la plateforme de traitement comporte cinq processeurs chaînés en une dimension, c'est-à-dire que le résultat des calculs sortant du processeur Proc A est utilisée en entrée du processeur ProcB, et ainsi de suite. L'information élémentaire sortant du processeur ProcE est appliquée à l'entrée du processeur ProcA. Chacun des processeurs est doté d'une unité de mémoire de capacité limitée, notée MemA à MemE Cette unité de mémoire est destinée à stocker les valeurs de paramètres utiles aux opérations spécifiques effectuées par le processeur, ou des informations élémentaires ou résultats d' opérations qui sont destinés à être réutilisés rapidement par le processeur.

Dans ce premier exemple, le traitement consiste à appliquer aux informations élémentaires composant l'objet une séquence de huit opérations notées OPl à 0P8. Afin de traiter l'objet, celui-ci doit être décomposé en sous-objets de N informations élémentaires chacun. N, qui doit être un multiple de Q (Q = 5, nombre d'unités de calculs), est déterminé en amont de la plateforme par un procédé conforme à l'invention, en fonction notamment des capacités mémoire de la plateforme. Dans l'exemple N = 5.

Par ailleurs, afin d'assurer un séquencement régulier des opérations spécifiques utiles, on crée des opérations spécifiques sans effet, 0P9 et OPlO par un moyen de traitement situé en amont de la plateforme, de telle sorte que le nombre d'opérations spécifiques à réaliser sur chaque sous-objet soit un multiple du nombre de processeurs disponibles.

En fonction du type des opérations spécifiques, on affecte chaque opération à effectuer à un processeur. Ici,

- le processeur A réalise OPl et 0P6, - le processeur B réalise 0P2 et 0P7, - le processeur C réalise 0P3 et 0P8,

- le processeur D réalise 0P4 et 0P9, et

- le processeur E réalise 0P5 et OPlO.

Chaque processeur exécute un jeu d'instructions (InsA à InsE) correspondant aux opérations spécifiques qui lui ont été affectées . De cette affectation dépendent également les paramètres stockés dans les mémoires à capacité limitée. Par exemple, si OPl est une multiplication par 2, la mémoire MemA contiendra le chiffre 2.

Une fois ces affectations réalisées, les opérations se déroulent selon un séquencement décrit par le tableau I ci- dessous :

Dans ce tableau, les instants d' avancement du processus sont notés Tl, T2, T14.

Tableau I

Chaque ligne représente une des 10 opérations spécifiques OPl à OPlO . Chaque colonne représente une des informations élémentaires IEl à IE5 composant chacun des sous- objets à traiter. Cette notation IEl à IE5 est formelle ; elle ne correspond pas forcément à une réalité spatiale ou temporelle. En effet, certaines opérations spécifiques ont pour effet de déplacer les informations élémentaires. Ainsi, l'information IEl traitée par l'opération spécifique 0P2 peut ne pas être le résultat de l'opération spécifique OPl appliquée à l'information IEl, mais le résultat de cette opération spécifique OPl appliquée à l'information IE2, par exemple si l'opération spécifique OPl consiste en un décalage vers la gauche .

Chaque case de ce tableau contient le nom du processeur qui effectue l'opération spécifique, ainsi que le moment où cette opération spécifique est effectuée au cours du traitement. Bien entendu, ce tableau ne représente qu'une partie du traitement. On suppose ici que tous les résultats d'opérations spécifiques nécessaires ont été calculés au préalable dans le traitement. Ainsi, on peut voir qu'à l'instant Tl, le processeur

ProcA effectue l'opération OPl sur la première information IEl du sous-objet 1. A cet instant, les autres processeurs sont en train d' effectuer d' autres opérations non représentées sur ce tableau. A l'instant T5, on voit que chacun des processeurs effectue une opération sur une des informations du sous-objet 1. Lorsqu'un processeur a effectué une opération spécifique sur toutes les informations élémentaires d'un sous- objet, il passe à l'opération suivante parmi celles qui lui ont été affectées. Ainsi, le processeur ProcA effectue, à partir de T6, l'opération 0P6.

Lorsqu'un processeur a effectué toutes les opérations spécifiques qui lui ont été affectées, le bloc suivant est traité. Deux sous-objets différents (sous-objet 1 et sous-objet 2) sont donc traités en même temps dans la plateforme.

Sur ce tableau on constate bien que chaque opération spécifique est effectuée N fois (ici N = 5) .

Ce séquencement est obtenu par le chaînage circulaire en une dimension des processeurs. Les informations élémentaires peuvent donc transiter d'une unité de calcul à l'autre. Par exemple, l'information élémentaire IEl passe par tous les processeurs pour « subir » les opérations spécifiques OPl à 0P5, puis elle remonte au processeur ProcA pour recommencer un cycle et « subir » les opérations 0P6 à 0P7. On rappelle que l'information élémentaire IEl de départ ne sera pas forcément l'information IEl à toutes les étapes.

Dans un deuxième exemple, illustré sur la figure 7, la plateforme contient cinq processeurs reliés à une mémoire commune. Une telle structure est classique : elle correspond à celle d'un processeur vectoriel (« Single Instruction Multiple Data » ou SIMD en anglais). Dans l'exemple, chaque processeur est relié individuellement à une petite mémoire pouvant contenir des paramètres tels qu'une table de correspondance T. Dans cette structure, chaque processeur effectue toutes les opérations spécifiques. Ainsi, tous les processeurs reçoivent le même jeu d' instructions INS .

On considère dans ce deuxième exemple le cas où l'une des opérations consiste en l'utilisation d'une table pour modifier une ou plusieurs informations élémentaires . Comme vu précédemment, chacun des processeurs à accès à sa propre table, toutes les tables étant identiques . Dans une variante chaque mémoire est partagée par un groupe de processeurs . Dans une variante, l'ensemble des processeurs partagent la même mémoire et obtiennent simultanément le même paramètre ; dans ce cas, l'application d'une table de correspondance doit être effectuée par calcul en utilisant un ou plusieurs paramètres permettant, par exemple, de calculer un polynôme.

II s'agit d'une réalisation parallèle : à chaque instant du processus, tous les processeurs réalisent la même opération sur des informations élémentaires différentes. Ce déroulement est illustré par le tableau II ci-dessous : Dans ce tableau, les instants d' avancement du processus sont notés Tl, T2, TlO.

Tableau II

On peut voir dans ce tableau qu'à un instant donné Ti, l'opération spécifique OPi est effectuée par chacun des processeurs ProcA à Proc E respectivement sur les informations élémentaires IEl à IE5. Au bout du lOième incrément, on constate bien que chaque opération spécifique de la séquence d'opérations spécifiques a été réalisée sur chacune des informations élémentaires d'un sous-objet.

Dans ce cas, il apparaît qu'il n'est pas nécessaire de compléter la séquence d'opérations spécifiques par des opérations sans effet, puisque les opérations spécifiques sont réalisées en parallèle par tous les processeurs. De cette façon, une fois l'opération 0P8 terminée, on peut recommencer le processus en appliquant l'opération OPl sur les informations élémentaires constituant le sous-objet suivant.

Dans un troisième exemple, illustré par la figure 8, la plateforme comporte un processeur vectoriel composé de cinq processeurs reliés à une mémoire commune, similaire au processeur vectoriel notamment présent dans un ordinateur de type personnel (PC) .. Ils sont également tous reliés à une petite mémoire pouvant contenir des paramètres, et notamment une table de correspondance. Dans cette structure, chaque processeur effectue toutes les opérations spécifiques. Ainsi, tous les processeurs reçoivent le même jeu d'instructions INS comportant des données décrivant toutes les opérations spécifiques à réaliser.

On considère dans cet exemple le cas où deux opérations spécifiques de suite consistent en l'utilisation d'une table pour modifier une ou plusieurs informations élémentaires. Ici, les tables ne sont présentes qu'à un seul endroit, et les processeurs doivent donc se les partager.

Au début du processus, on est dans une réalisation parallèle, puisque tous les processeurs réalisent en même temps une même opération sur les différentes informations élémentaires d'un sous-objet. Ce déroulement est illustré par le tableau III ci-dessous :

Dans ce tableau, les instants d'avancement du processus sont notés Tl, T2, T18.

Tableau III

On peut voir dans les trois premières lignes de ce tableau qu'à un instant donné Ti, l'opération spécifique OPi est effectuée par chacun des processeurs ProcA à Proc E respectivement sur les informations élémentaires IEl à IE5.

Lorsqu'on arrive à l'opération 0P4 qui utilise une table, on se retrouve face à un problème d'accès, puisque tous les processeurs ne peuvent pas accéder en même temps à cette table. Les processeurs sont donc obligés « d'attendre leur tour », c'est-à-dire d'attendre que le processeur précédent ait fini d'utiliser la table pour pouvoir s'en servir. Ainsi, l'opération 0P4 est effectuée par les processeurs ProcA à ProcE respectivement aux instants T4 à T8. Si l'on suppose que l'opération 0P5 fait également appel à une table, on aura de la même façon : l'opération 0P5 est effectuée par les processeurs ProcA à ProcE respectivement aux instants T9 à T13.

Une fois ces opérations effectuées, le processus peut reprendre normalement.

La figure 9a montre un exemple de réalisation d'une plateforme, comportant plusieurs chaînages circulaires selon une dimension du sous-objet. Dans ce premier exemple, l'objet est une image à deux dimensions, le sous-objet comporte 4 informations élémentaires, et le la plateforme comporte 4 processeurs disposés selon une grille de 4*1 processeurs correspondant à un rectangle de 4 processeurs horizontalement et 1 processeur verticalement. Les processeurs sont appelés de gauche à droite : Pl, P2, P3, et P4. Le procédé met en œuvre également dans cet exemple 2 files :

- une file horizontale FHa est connectée en entrée à une sortie de P4 et en sortie à une entrée du processeur Pl. Une sortie de Pl est connectée à une entrée de P2. Une sortie de P2 est connectée à une entrée de P3, et une sortie de P3 est connectée à une entrée de P4.

- une file verticale FVa est connectée en entrée à une sortie de Pl, P2, P3 et P4 et en sortie à une entrée du processeur Pl, P2, P3 et P4. La séquence d'opérations spécifiques peut mettre en œuvre un nombre arbitraire de filtres horizontaux FH tout en utilisant les 4 processeurs à 100%. Par exemple, dans le cas d'une opération spécifique 0S2 effectuant le calcul d'un filtre constitué d'une addition entre le résultat d'une opération spécifique OSl et le résultat de la même opération spécifique

051 située à gauche : le résultat de l'opération OSl du processeur P4 est mise dans la file FHa et sera utilisé par

052 sur Pl lors du calcul d'un prochain sous-objet ; le résultat de l'opération OSl du processeur P3 est transférée au processeur P4 pour être utilisée par 0S2 sur P4 en combinaison avec le résultat de OSl sur P4;le résultat de l'opération OSl du processeur P2 est transférée au processeur P3 pour être utilisée par 0S2 sur P3 en combinaison avec le résultat de OSl sur P3; le résultat de l'opération OSl du processeur Pl est transférée au processeur P2 pour être utilisée par 0S2 sur P2 en combinaison avec le résultat de

051 sur P2; le résultat de l'opération OSl effectuée par P4 lors d'un calcul d'un précédent sous-objet est sorti de la file FHa et transféré au processeur Pl pour être utilisée par

052 sur Pl en combinaison avec le résultat de OSl sur Pl; Une autre opération spécifique 0S3 de la séquence peut mettre en œuvre un autre filtre horizontal, la file permet de récupérer les données dans le bon ordre . - Mutatis mutandis, la séquence d'opérations spécifiques peut mettre en œuvre un nombre arbitraire de filtres verticaux FV tout en utilisant les 4 processeurs à 100%,

- Enfin, la séquence d'opérations spécifiques peut mettre en œuvre un nombre arbitraire de filtres non séparables selon les 2 dimensions horizontale et verticale FVH tout en utilisant les 4 processeurs à 100% ; par exemple un filtre non séparable 3x3 appliqué sur 4 résultats d'une opération spécifique 0S4, peut solliciter deux fois FVa puis six fois FHa, pour obtenir les 8 jeux de 4 résultats de 0S4 précédemment calculés à combiner avec le jeu de résultat de OS4 du sous-objet courant; par exemple ces filtres non séparables peuvent être utilisés en combinaison avec des filtres verticaux et/ou horizontaux, les 2 files permettent de récupérer les données dans le bon ordre. Lorsque l'on met en œuvre 2 filtres, la séquence d'opérations spécifiques est donc telle qu'au moins deux opérations spécifiques distinctes de la séquence produisent chacune au moins une fois au cours de leurs N applications, un résultat utilisé pour le traitement d'un autre sous-objet. Le résultat utilisé pour le traitement d'un autre sous-objet transite par la (les) file (s) .

De la même façon, la figure 9b montre un second exemple, dans lequel l'objet est une image à deux dimensions, le sous- objet comporte 4 informations élémentaires, et la plateforme comporte 4 processeurs disposés selon une grille de 2*2 processeurs correspondant à un rectangle de 2 processeurs horizontalement et 2 processeurs verticalement. Les processeurs sont appelés de gauche à droite : P4 et P5 sur la ligne du haut et P6 et P7sur la ligne du bas. Le procédé met en œuvre également dans cet exemple 2 files :

- une file horizontale FHb est connectée en entrée à la sortie de P3 et de P6 et en sortie à l'entrée de Pl et P4

- une file verticale FVb est connectée en entrée à une sortie de P4 et P5 et en sortie à une entrée du processeur P6 et

P7.

De même que dans l'exemple de la figure 9a, la séquence d'opérations spécifiques peut mettre en œuvre un nombre arbitraire de filtres verticaux et/ou horizontaux et /ou non séparables tout en utilisant les 4 processeurs à 100%.

Dans une troisième exemple, illustré sur la figure 9c, la plateforme comporte un seul processeur P8, connecté à une file horizontale FHc et à une file verticale FVc. Ces deux files peuvent être utilisées par le processeur pour stocker des résultats d'opérations spécifiques destinées à être réutilisées ultérieurement .

De même que dans l'exemple de la figure 9a, la séquence d'opérations spécifiques peut mettre en œuvre un nombre arbitraire de filtres verticaux et/ou horizontaux et /ou non séparables tout en utilisant le processeur à 100%.

Claims

REVENDICATIONS

1. Procédé pour traiter, dans une plateforme à processeur (s) et mémoire (s), un objet (255) constitué d'informations élémentaires de même nature (254, 256, 258, 260, 154, 156, 158, et 160), ce procédé comprenant l'étape de décomposer l'objet à traiter en au moins deux sous-objets

(250, 251, 252 et 253) , constitués de N informations élémentaires chacun (254, 256, 258, 154, 156, 158), tous les sous-objets (250, 251, 252 et 253) ayant le même nombre N d'informations élémentaires et, le traitement consistant à effectuer au moins une séquence d'opérations spécifiques sur les informations élémentaires de chaque sous-objet (250 , 251 , 252 , 253, le procédé comprenant en outre l'étape d'effectuer, pour chaque sous-objet, au moins N fois chaque opération spécifique, de façon d'une part à faire intervenir au moins une fois chaque information élémentaire de chaque sous-objet, et d' autre part à produire N résultats pour chaque opération spécifique, la séquence d'opérations spécifiques étant telle qu'au moins une opération spécifique (262) de la séquence produit au moins une fois au cours de ses N applications (262a, 262b, 22c, 262d, 262e, 262f) , un résultat utilisé pour le traitement d'un autre sous-objet (260, 160) .

2. Procédé selon la revendication 1 dans lequel, l'objet comprenant DO dimensions et les sous-objets comprenant DSO dimensions sélectionnées parmi les DO dimensions de l'objet, la décomposition de l'objet en sous-objet est telle que, selon au moins une dimension du sous-objet, les sous-objets n'ont pas de recouvrement.

3. Procédé selon l'une des revendication précédentes dans lequel la plateforme comprend au moins une mémoire de communication inter-objet pour stocker les informations élémentaires et/ou résultats d'opérations spécifique réalisés pendant le traitement d'un sous-objet et utilisés pour le traitement d'un autre sous-objet.

4. Procédé selon l'une des revendication précédentes dans lequel la séquence d'opérations spécifique ne comporte qu'une seule opération spécifique mettant en œuvre les mêmes données lors du traitement de l'objet.

5. Procédé selon l'une des revendication précédentes dans lequel, l'objet comprenant DO dimensions, les informations élémentaires sont transmises à la plateforme selon la dimension DE de l'objet puis selon les autres dimensions, les sous-objets comprennent DSO dimensions sélectionnées parmi les DO dimensions de l'objet et comprenant la dimension DE et le traitement comprenant en outre au moins une boucle interne de parcours des sous-objets effectuée selon la dimension DE

6. Procédé selon l'une des revendication précédentes dans lequel, l'objet comprenant DO dimensions, les informations élémentaires sont transmises à la plateforme selon la dimension DE de l'objet puis selon les autres dimensions, les sous-objets comprennent les DO dimensions de l'objet ou les sous-objets comprennent DO-I dimensions sélectionnées parmi les DO dimensions de l'objet et ne comprenant pas la dimension DE, et le traitement comprenant en outre au moins une boucle interne de parcours des sous-objets effectuée selon la dimension DE.

7. Procédé selon l'une des revendications précédentes dans lequel la taille des sous-objets dans chaque dimension est déterminée en fonction de la taille de l'objet, et/ou du débit de transmission des informations élémentaires transmises à la plateforme, et/ou de la vitesse de calcul de la plateforme et/ou de la taille et du débit d'au moins une mémoire de la plateforme.

8. Procédé selon l'une des revendications précédentes dans lequel au moins une partie des opérations spécifiques met en œuvre au moins une valeur de paramètre et sont effectuées par Q unités de calculs calculant la même opération spécifique simultanément, et dans lequel, la séquence d'opérations spécifiques comprenant au moins une opération spécifique de sélection, l' opération spécifique de sélection effectue la sélection d' une valeur de paramètre parmi C valeurs de paramètres en même temps sur les Q unités de calcul de manière différentiée par unité de calcul en fonction d'au moins une information élémentaire et/ou d'au moins un résultat d'opération spécifique et/ou d'au moins une valeur de paramètre.

9. Procédé selon l'une des revendications précédentes dans lequel au moins une partie des opérations spécifiques sont effectuées par Q unités de calculs calculant la même opération spécifique simultanément, et dans lequel, la séquence d' opérations spécifiques comprenant au moins une opération spécifique de sélection, l' opération spécifique de sélection effectue la sélection d'une donnée parmi C données en même temps sur les Q unités de calcul de manière différentiée par unité de calcul en fonction d' un déplacement relatif obtenu à partir d' au moins une information élémentaire et/ou d' au moins un résultat d' opération spécifique et/ou d' au moins une valeur de paramètre .

10. Procédé selon l'une des revendications précédentes dans lequel la séquence d'opérations spécifiques comprend au moins une opération spécifique de position et l'objet comporte DO dimensions, cette opération spécifique de position produisant une information de position selon une des DO dimensions.

11. Procédé selon l'une des revendications précédentes dans lequel la séquence d'opérations spécifiques comprend au moins une opération spécifique produisant une position relative en fonction d'au moins une information élémentaire et/ou d'au moins un résultat d'opération spécifique et/ou d'au moins une valeur de paramètre.

12. Procédé selon l'une des revendications précédentes dans lequel au moins une partie des opérations spécifiques est effectuée par Q unités de calculs, Q étant égal à N ou un sous- multiple de N.

13. Procédé selon la revendication 12 sans lequel Q et N sont différents et le traitement du sous-objet comprend une seule boucle interne de N/Q itérations .

14. Procédé selon la revendication 12 ou 13 dans lequel les Q unités de calcul sont identique.

15. Procédé selon l'une des revendications précédentes dans lequel les N résultats issus d'une même opération spécifique sont calculés par une même unité de calcul.

16. Procédé selon l'une des revendications précédentes dans lequel, au moins une opération spécifique mettant en œuvre au moins un paramètre, cette opération spécifique est effectuée par au moins une unité de calcul ayant accès à une unité de mémoire contenant une partie des valeurs des paramètres, cette partie étant déterminée en fonction des opérations spécifiques effectuées par cette unité de calcul.

17. Procédé selon l'une des revendications précédentes dans lequel, au moins une opération spécifique mettant en oeuvre au moins un paramètre, la valeur de ce paramètre est fonction de la position du sous-objet et/ou de l'information élémentaire dans l'objet à traiter.

18. Procédé selon l'une des revendications précédentes dans lequel les opérations spécifiques sont effectuées par des unités de calcul chaînées .

19. Procédé selon l'une des revendications précédentes dans lequel les opérations spécifiques sont effectuées par des unités de calcul chaînées selon un chaînage à une dimension.

20. Procédé selon l'une des revendications précédentes dans lequel les opérations spécifiques sont effectuées par des unités de calcul chaînées selon au moins un chaînage circulaire.

21. Procédé selon l'une des revendications précédentes dans lequel les opérations spécifiques sont effectuées par des unités de calcul chaînées selon au moins un chaînage circulaire ; ledit chaînage circulaire comportant en outre au moins une file .

22. Procédé selon l'une des revendications précédentes dans lequel le sous-objet comporte DSO dimensions, les opérations spécifiques sont effectuées par des unités de calcul chaînées selon au moins un chaînage circulaire pour chaque dimension du sous-objet ; le (s) chaînage (s) circulaire (s) pour chaque dimension particulière Dl du sous-objet comportant en outre au moins une file partagée ou non entre le (s) chaînage (s) circulaire (s) pour la dimension particulière Dl du sous-objet.

23. Procédé selon l'une des revendications précédentes dans lequel le sous-objet comporte DSO dimensions, les opérations spécifiques sont effectuées par des unités de calcul chaînées selon une dimension déterminée DD du sous-objet au moyen d' au moins un chaînage circulaire CCI ; ledit chaînage circulaire CCI comportant en outre au moins une file ; le procédé comprenant en outre l'étape, pour au moins une instruction spécifique, pour chaque application de ladite instruction spécifique de transmettre le résultat de ladite application de l'instruction spécifique effectuée sur une unité de calcul UCl à l'unité de calcul UC2 ou file qui suit ladite unité de calcul UCl selon ledit chaînage.

24. Procédé selon l'une des revendications précédentes comprenant en outre l'étape de grouper en mémoire les résultats d'opérations spécifiques utilisées lors du sous-traitement d'un autre sous-objet en fonction de la position relative dudit autre sous-objet par rapport au dit sous-objet.

25. Procédé selon l'une des revendications précédentes dans lequel les opérations spécifiques sont effectuées par des unités de calcul chaînées /ledit procédé comprenant l'étape d'affecter les opérations spécifiques aux unités de calcul en fonction du chaînage des unités de calcul et de la séquence.

26. Procédé selon l'une des revendications précédentes dans lequel l'ordre et/ou la nature des opérations spécifiques sont modifiables.

27. Procédé selon l'une des revendications précédentes dans lequel les opérations spécifiques sont effectuées par des unités de calcul câblées selon au moins une séquence prédéterminée d'opérations spécifiques.

28. Procédé selon l'une des revendications précédentes dans lequel au moins une opération spécifique est effectuée par au moins une unité de calcul dotée d'une unité de mémoire de capacité limitée pour stocker des informations élémentaires et/ou des résultats d'opérations spécifiques, cette mémoire contenant au plus seize informations élémentaires et/ou résultats d' opérations spécifiques .

29. Procédé selon l'une des revendications précédentes dans lequel au moins une opération spécifique est effectuée par au moins une unité de calcul ayant accès à une unité de mémoire de communication, contenant au moins une information élémentaire et/ou au moins un résultat d'opération spécifique issus d'autres sous-objets.

30. Procédé selon la revendication 29 dans lequel l'unité de mémoire de communication a un débit d'accès inférieur à 0.3*N accès/sous-objet/opération spécifique.

31. Procédé selon l'une des revendications précédentes, notamment utilisé dans le cas où la plateforme de traitement est intégrée dans un téléphone mobile, dans lequel la valeur de Q est fixée à 1 et N est compris entre 2 et 16.

32. Procédé selon l'une des revendications précédentes dans lequel au moins une opération spécifique est effectuée simultanément par au moins deux unités de calcul identiques .

33. Procédé selon l'une des revendications précédentes dans lequel au moins une partie des résultats d'opérations spécifiques est stockée en mémoire à une adresse de la forme « adresse de base + décalage » ou « (adresse de base + décalage) modulo (taille d'une mémoire tampon) », le décalage étant constant pour tous les résultats d'une même opération spécifique .

34. Procédé selon la revendication 33 dans lequel on modifie l'adresse de base à chaque fois que l'on change de sous- objet dans le processus de traitement.

35. Procédé selon l'une des revendications précédentes dans lequel au moins une partie des résultats d'opérations spécifiques est stockée en mémoire à une adresse prédéterminée pour tous les résultats d'une même opération.

36. Procédé selon l'une des revendications précédentes dans lequel, les opérations spécifiques étant effectuées par au moins une unité de calcul dotée d' au moins une unité de registres et d'au moins une mémoire de communication entre sous- objets, le nombre de transistors de la plateforme de traitement est inférieur à 10000 par unité de calcul, y compris l'unité de registre associée sans la mémoire de communication.

37. Procédé selon l'une des revendications précédentes dans lequel on fournit à la plateforme, de préférence directement, des données formatées spécifiques calculées à partir de données formatées génériques, ces données formatées génériques comprenant des premières données décrivant au moins une séquence d'opérations génériques, le calcul des données formatées spécifiques étant effectué en tenant compte d'un mode de parcours des informations élémentaires dans la plateforme et d'opérations spécifiques issues des opérations génériques, ces opérations spécifiques formant la séquence d'opérations spécifiques à effectuer sur un objet lors de son traitement dans la plateforme.

38. Procédé selon l'une des revendications précédentes dans lequel l'objet à traiter est une image et les informations élémentaires sont des pixels de cette image.

39. Procédé selon l'une des revendications précédentes dans lequel la plateforme de traitement fait partie d'un appareil de capture et/ou de restitution d'image, et dans lequel, les opérations mettant en œuvre des paramètres dont les valeurs dépendent de la séquence d'opérations et/ou de la plateforme de traitement et/ou de l'objet à traiter, ces valeurs de paramètres sont liées aux caractéristiques de l'optique et/ou du capteur et/ou de l'imageur et/ou de l'électronique et/ou du logiciel de l'appareil de capture et/ou de restitution d'image.

40. Procédé selon l'une des revendications 1 à 37 dans lequel l'objet à traiter est un signal sonore numérisé et les informations élémentaires sont les échantillons sonores de ce signal.

41. Procédé selon l'une des revendications 1 à 37 dans lequel l'objet à traiter est un maillage numérique et les informations élémentaires sont les informations spatiales et temporelles caractérisant chaque point du maillage.

42. Plateforme à processeur (s) et mémoire (s), destinée à traiter un objet (55) constitué d'informations élémentaires de même nature (54, 56, 58, 60, 154, 156, 158, et 160) , comprenant des moyens pour décomposer l'objet à traiter en au moins deux sous-objets (50, 51, 52 et 53) constitués de N informations élémentaires chacun (54, 56, 58, 154, 156, 158) , tous les sous- objets (50, 51, 52 et 53) ayant le même nombre N d'informations élémentaires et, des moyens pour effectuer au moins une séquence d'opérations spécifiques sur les informations élémentaires de chaque sous-objet (50 , 51 , 52 , 53) , ces moyens de traitement comportant des moyens pour effectuer, pour chaque sous-objet, au moins N fois chaque opération spécifique, de façon, d'une part, à faire intervenir au moins une fois chaque information élémentaire de chaque sous-objet, et, d'autre part, à produire N résultats pour chaque opération spécifique, les moyens de traitement étant tels qu' au moins une opération spécifique (62) de la séquence d'opérations spécifiques produit au moins une fois au cours de ses N applications (62a, 62b, 62c, 62d, 62e, 62f) , à un résultat utilisé pour le traitement d'un autre sous-objet (60, 160) .

43. Plateforme selon la revendication 42 dans laquelle, l'objet à traiter comprenant DO dimensions, les sous-objets comprennent DSO dimensions sélectionnées parmi les DO dimensions de l'objet et les moyens pour décomposer l'objet sont tels que, selon au moins une dimension du sous-objet, les sous-objets n'ont pas de recouvrement.

44. Plateforme selon la revendication 42 ou 43 comprenant au moins une mémoire de communication inter-objet pour stocker les informations élémentaires et/ou résultats d'opérations spécifiques réalisés pendant le traitement d'un sous-objet et utilisés pour le traitement d'un autre sous- objet .

45. Plateforme selon l'une des revendications 42 à 44comprenant des moyens pour effectuer une séquence d'opérations spécifiques ne comportant qu'une seule opération spécifique mettant en œuvre les mêmes données lors du traitement de l'objet.

46. Plateforme selon l'une des revendications 42 à 45 dans laquelle, l'objet comprenant DO dimensions, les informations élémentaires sont reçues selon la dimension DE de l'objet puis selon les autres dimensions, les sous-objets comprenant DSO dimensions sélectionnées parmi les DO dimensions de l'objet et comprenant la dimension DE, la plateforme étant telle qu'une boucle interne de parcours des sous-objets, comprise dans le traitement s'effectue selon la dimension DE.

47. Plateforme selon l'une des revendications 42 à 46 dans laquelle, l'objet comprenant DO dimensions, les informations élémentaires sont reçues selon la dimension DE de l'objet puis selon les autres dimensions, les sous-objets comprenant les DO dimensions de l'objet ou DO-I dimensions sélectionnées parmi les DO dimensions de l'objet, la dimension DE n'étant pas comprise, la plateforme étant telle qu'une boucle interne de parcours des sous-objets, comprise dans le traitement, s'effectue selon la dimension DE.

48. Plateforme selon l'une des revendications 42 à 47 dans laquelle les moyens pour décomposer l'objet à traiter sont tels que la taille des sous-objets dans chaque dimension est déterminée en fonction de la taille de l'objet et/ou du débit des informations élémentaires reçues par la plateforme, et/ou de la vitesse de calcul de la plateforme et/ou de la taille et du débit d'au moins une mémoire de la plateforme.

49. Plateforme selon l'une des revendications 42 à 48 comprenant, dans le cas où au moins une partie des opérations spécifiques met en œuvre au moins une valeur de paramètres, Q unités de calculs calculant la même opération spécifique simultanément, la plateforme comprenant en outre des moyens pour effectuer au moins une séquence d'opérations spécifiques comprenant au moins une opération spécifique de sélection, cette opération spécifique de sélection effectuant la sélection d'une valeur de paramètre parmi C valeurs de paramètres en même temps sur les Q unités de calcul de manière différentiée par unité de calcul, en fonction d'au moins une information élémentaire et/ou d'au moins un résultat d'opération spécifique et/ou d'au moins une valeur de paramètre.

50. Plateforme selon l'une des revendications 42 à 49 comprenant Q unités de calculs calculant la même opération spécifique simultanément, la plateforme comprenant en outre des moyens pour effectuer au moins une séquence d'opérations spécifiques comprenant au moins une opération spécifique de sélection, cette opération spécifique de sélection effectuant la sélection d'une donnée parmi C donnée en même temps sur les Q unités de calcul de manière différentiée par unité de calcul, en fonction d'au moins une information élémentaire et/ou d'au moins un résultat d' opération spécifique et/ou d' au moins une valeur de paramètre.

51. Plateforme selon l'une des revendications 42 à 50 comprenant des moyens pour effectuer une séquence d' opérations spécifiques comprenant au moins une opération spécifique de position, et, l'objet comportant DO dimensions, cette opération spécifique de position produisant une information de position selon une des DO dimensions .

52. Plateforme selon l'une des revendications 42 à 51 comprenant des moyens pour effectuer une séquence d' opérations spécifiques comprenant au moins une opération spécifique produisant une position relative en fonction d'au moins une information élémentaire et/ou d'au moins un résultat d'opération spécifique et/ou d'au moins une valeur de paramètre.

53. Plateforme selon l'une des revendication 42 à 52 comprenant Q unités de calculs pour effectuer au moins une partie des opérations spécifiques, Q étant égal à N ou un sous- multiple de N.

54. Plateforme selon la revendication 53 dans laquelle le nombre d'unités de calcul Q est différent de N, et dans laquelle le traitement du sous-objet comprend une seule boucle interne de N/Q itérations .

55. Plateforme selon la revendication 53 ou 54 dans laquelle les Q unités de calcul sont identique.

56. Plateforme selon l'une des revendications 42 à 55 comprenant des moyens pour que les N résultats issus d'une même opération spécifique soient calculés par une même unité de calcul .

57. Plateforme selon l'une des revendications 42 à 56 comprenant : des moyens pour, lorsqu'au moins une opération spécifique met en œuvre au moins un paramètre, effectuer cette opération spécifique, et une unité de calcul ayant accès à une unité de mémoire contenant une partie des valeurs des paramètres, la plateforme étant telle que cette partie étant déterminée en fonction des opérations spécifiques effectuées par cette unité de calcul.

58. Plateforme selon l'une des revendications 42 à 57 comprenant des moyens pour que, lorsqu'au moins une opération spécifique met en oeuvre au moins un paramètre, la valeur de ce paramètre soit fonction de la position du sous-objet et/ou de l'information élémentaire dans l'objet à traiter.

59. Plateforme selon l'une des revendications 42 à 58 comprenant des unités de calcul chaînées .

60. Plateforme selon l'une des revendications 42 à 59 comprenant des unités de calcul chaînées selon un chaînage à une dimension.

61. Plateforme selon l'une des revendications 42 à 60 comprenant des unités de calcul chaînées selon au moins un chaînage circulaire.

62. Plateforme selon l'une des revendications 42 à 61 comprenant des unités de calcul chaînées selon au moins un chaînage circulaire, ce chaînage circulaire comportant en outre au moins une file.

63. Plateforme selon l'une des revendications 42 à 62, comportant des unités de calcul chaînées selon au moins un chaînage circulaire pour chaque dimension du sous objet, le sous objet comportant DSO dimensions, et le (s) chaînage (s) circulaire (s) pour chaque dimension particulière Dl du sous objet comportant en outre au moins une file partagée, ou non entre le (s) chaînage (s) circulaire (s) pour la dimension particulière Dl du sous objet.

64. Plateforme selon l'une des revendications 42 à 63 comportant des unités de calcul chaînées selon au moins une dimension déterminée DD du sous objet au moyen d'un chaînage circulaire CCI ; ledit chaînage circulaire comportant en outre au moins une file ; et la plateforme étant telle que pour chaque application d'une instruction spécifique, le résultat de cette application dans une première unité de calcul UCl à une unité de calcul UC2 ou file qui suit ladite première unité de calcul UCl selon ledit chaînage.

65. Plateforme selon l'une des revendications 42 à 64 comportant au moins une mémoire pour enregistrer les résultats d'opérations spécifiques utilisées lors du sous traitement d'un autre sous objet en fonction de la position relative dudit autre sous objet par rapport au dit sous objet.

66. Plateforme selon l'une des revendications 42 à 65 comprenant des unités de calcul chaînées selon au moins un chaînage circulaire, et des moyens pour affecter les opérations spécifiques aux unités de calcul en fonction du chaînage des unités de calcul et de la séquence.

67. Plateforme selon l'une des revendications 42 à 66 comprenant des moyens pour que l'ordre et/ou la nature des opérations spécifiques soi (en) t modifiable (s) .

68. Plateforme selon l'une des revendications 42 à 67 comprenant des unités de calcul câblées pour effectuer les opérations spécifiques selon au moins une séquence prédéterminée d'opérations spécifiques.

69. Plateforme selon l'une des revendications 42 à 68 comprenant au moins une unité de calcul dotée d'une unité de mémoire de capacité limitée pour stocker des informations élémentaires et/ou des résultats d'opérations spécifiques, cette mémoire contenant au plus seize informations élémentaires et/ou résultats d' opérations spécifiques .

70. Plateforme selon l'une des revendications 42 à 69 comprenant au moins une unité de calcul ayant accès à une unité de mémoire de communication, contenant au moins une information élémentaire et/ou au moins un résultat d'opérations spécifiques issus d'autres sous-objets.

71. Plateforme selon la revendication 70 dans laquelle l'unité de mémoire de communication a un débit d'accès inférieur à 0.3*N accès/sous-objet/opération spécifique.

72. Plateforme selon l'une des revendications 42 à 71, notamment intégrée dans un téléphone mobile, comprenant des moyens pour que la valeur de Q soit fixée à 1 et pour que la valeur de N soit comprise entre 2 et 16.

73. Plateforme selon l'une des revendications 42 à 72 comprenant au moins deux unités de calcul identiques effectuant simultanément au moins une même opération spécifique.

74. Plateforme selon l'une des revendications 42 à 73 comprenant des moyens pour qu'au moins une partie des résultats d'opérations spécifiques soit stockée en mémoire à une adresse de la forme « adresse de base + décalage » ou « adresse de base + décalage modulo (taille d'une mémoire tampon) », le décalage étant constant pour tous les résultats d'une même opération spécifique .

75. Plateforme selon la revendication 74 comprenant des moyens pour modifier l'adresse de base à chaque fois que l'on change de sous-objet dans le processus de traitement.

76. Plateforme selon l'une des revendications 42 à 75 comprenant des moyens pour qu'au moins une partie des résultats d'opérations spécifiques soit stockée en mémoire à une adresse prédéterminée pour tous les résultats d'une même opération.

77. Plateforme selon l'une des revendications 42 à 76 comprenant au moins une unité de calcul dotée d' au moins une unité de registres et d'au moins une mémoire de communication, et dans laquelle le nombre de transistors est inférieur à 10000 par unité de calcul, y compris l'unité de registre associée sans la mémoire de communication.

78. Plateforme selon l'une des revendications 42 à 77 comprenant des moyens pour recevoir en entrée, de préférence directement, des données formatées spécifiques calculées à partir de données formatées génériques, ces données formatées génériques comprenant des premières données décrivant au moins une séquence d'opérations génériques, le calcul des données formatées spécifiques étant effectué en tenant compte d'un mode de parcours des informations élémentaires dans la plateforme et d'opérations spécifiques issues des opérations génériques, ces opérations spécifiques formant une séquence d' opérations spécifiques, et la plateforme comprenant des moyens pour effectuer cette séquence d'opérations spécifiques sur un objet.

79. Plateforme selon l'une des revendications 42 à 78 comprenant des moyens pour traiter un objet étant constitué par une image, les informations élémentaires étant des pixels de cette image.

80. Plateforme selon l'une des revendications 42 à 79 faisant partie d'un appareil de capture et/ou de restitution d' image, les opérations mettant en œuvre des paramètres dont les valeurs dépendent de la séquence d'opérations et/ou de cette plateforme et/ou de l'objet à traiter, ces valeurs de paramètres étant liées aux caractéristiques de l'optique et/ou du capteur et/ou de l'imageur et/ou de l'électronique et/ou du logiciel de l'appareil de capture et/ou de restitution d'image.

81. Plateforme selon l'une des revendications 42 à 80 comprenant des moyens pour traiter un objet étant constitué par un signal sonore numérisé, les informations élémentaires étant les échantillons sonores de ce signal .

82. Plateforme selon l'une des revendications 2 à 81 comprenant des moyens pour traiter un objet étant constitué par un maillage numérique, les informations élémentaires sont les informations spatiales et temporelles caractérisant chaque point du maillage.

83. Objet traité par un procédé de traitement conforme à l'une des revendications 1 à 41.