FR2762699A1

FR2762699A1 - Procede et appareil pour le codage et le decodage d'images mobiles, sur la base de regions

Info

Publication number: FR2762699A1
Application number: FR9800730A
Authority: FR
Inventors: Shunichi Sekiguchi; Yoshimi Isu; Kohtaro Asai
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1997-04-24
Filing date: 1998-01-23
Publication date: 1998-10-30
Anticipated expiration: 2018-01-23
Also published as: US20070009046A1; JP4514818B2; JP2006314126A; JP4514734B2; JP2008312245A; SG65041A1; DE19803781A1; JP4514819B2; US6633611B2; DE19803781C2; JP3835919B2; JP2012085344A; JP2012085345A; US20070263718A1; US20030108100A1; JP2009247019A; FR2762699B1; US20030035477A1; US20070263727A1; JP5138086B2

Abstract

L'invention concerne un procédé et un appareil pour le codage et le décodage d'images mobiles, sur la base de régions.L'appareil comporte une section (2) de subdivision d'une image d'entrée en régions, qui comprend une section de traitement de subdivision (12) pour subdiviser l'image en une pluralité de régions selon un critère et une section de traitement d'intégration (14) pour intégrer chacune des régions avec des régions adjacentes, et un codeur servant à coder des signaux d'image pour chacune des régions qui subsistent après l'intégration par la section (14).Application notamment à des appareils portables ou fixes de transmission d'images tels que des vidéotéléphones et dans des magnétoscopes et des serveurs vidéo.

Description

La présente invention concerne un procédé et un appareil pour introduire

et coder une image mobile, et un appareil pour décoder l'image mobile codée. La présente invention a trait notamment à une technique pour coder une image complète en subdivisant tout d'abord cette image en de multiples régions, et a trait à une technique pour

décoder l'image complète codée.

La figure 1, annexée à la présente demande, est un schéma-bloc d'une première technique antérieure représentant la configuration d'un codeur d'images mobiles basé sur la recommandation ITU-T H.263, sur lequel le chiffre de référence 1 désigne un signal d'image numérique d'entrée (désigné ci-après simplement sous l'expression image d'entrée), le chiffre de référence 101 désigne un différenciateur, le chiffre de référence 102 désigne un signal de prédiction, le chiffre de référence 103 désigne un signal d'erreur de prédiction, le chiffre de référence 104 désigne un codeur, le chiffre de référence 105 désigne des données codées, le chiffre de référence 106 désigne un décodeur, le chiffre de référence 107 désigne un signal d'erreur de prédiction décodé, le chiffre de référence 108 désigne un additionneur, le chiffre de référence 109 désigne un signal local décodé, le chiffre de référence 110 désigne une mémoire, le chiffre de référence 111 désigne une section de prédiction et le chiffre de référence 112

désigne un vecteur de déplacement.

L'image d'entrée 1 devant être codée est tout d'abord envoyée au différenciateur 101. Le différenciateur 101 prélève la différence entre l'image d'entrée 1 et le signal de prédiction 102 pour la délivrer en tant que signal d'erreur de prédiction 103. Le codeur 104 code l'image d'entrée 1, qui est un signal original, ou un signal d'erreur de prédiction 103 et délivre des données codées 105. Le procéde de codage dans le codeur 104 utilise une technique indiquée dans la recommandation mentionnée précédemment, dans laquelle un signal d'erreur de prédiction 103 est transformé depuis le domaine spatial en un domaine de fréquences en utilisant une transformation en cosinus discret (DCT), un type de transformation orthogonale, et le coefficient de transformation obtenu est

quantifié linéairement.

Les données codées 105 sont séparées en deux parties dirigées dans deux directions, une partie étant envoyée à un récepteur ou à un appareil de décodage d'images (non représenté) et dont l'autre partie est envoyée à un décodeur 106 à l'intérieur du présent appareil. Le décodeur 106 exécute une opération qui est inverse de celle du codeur 104 et délivre un signal d'erreur de prédiction décodé 107 à partir de données codées 105. L'additionneur 108 additionne le signal de prédiction 102 au signal d'erreur de prédiction décodé 107 et délivre le résultat sous la forme du signal d'image décodé 109. La section de prédiction 111 exécute une prédiction, compensée du point de vue du déplacement, en utilisant le signal d'image 1 et le signal d'image décodé 109 de l'image complète précédente mémorisée dans la mémoire 110 et délivre le signal de prédiction 102 et le vecteur de déplacement 112. A cet instant, la compensation de déplacement est exécutée en des unités de blocs ayant

des dimensions fixées et désignées sous le terme de macro-

bloc comprenant 16 x 16 pixels. En tant que fonction optionnelle pour un bloc dans une région comprenant des déplacements conséquents, la prédiction, compensée du point

de vue du déplacement, peut être exécutée avec le macro-

bloc subdivisé en quatre unités formant sous-blocs de 8 x 8 pixels. Le vecteur de déplacement obtenu 112 est transmis à l'appareil de décodage d'images, et le signal de prédiction 102 est envoyé au différenciateur 102 et à l'additionneur 108. Conformément à cet appareil, la quantité de données de l'image mobile peut être comprimée tout en conservant la qualité d'image grâce à l'utilisation de la prédiction

compensée du peint de vue déplacement.

Dans cette technique antérieure, la forme de la région de l'unité de codage est limitée à deux types. En outre les deux formes sont rectangulaires. C'est pourquoi, il existe naturellement une limite au codage qui peut être adaptée à la structure de la scène ou à des caractéristiques d'une image. Par exemple, s'il est souhaitable d'augmenter la quantité de code uniquement pour un objet présentant des déplacements conséquents, il est préférable, bien que ceci soit difficile dans cette technique antérieure, de définir une région ayant une forme

identique à celle de l'objet.

La figure 2, annexée à la présente demande, est un schéma-bloc d'un appareil de codage d'images concernant une seconde technique antérieure. Cet appareil est basé sur un procédé de codage qui a été proposé dans l'article "A Very Low Bit Rate Video Coder Based on Vector Quantization" de L. C. Real et al. (IEEE Transactions on Images Processing, Vol. 5, N 2, Février 1996). Sur la même figure, le chiffre de référence 113 désigne une section de subdivision en régions, le chiffre de référence 114 désigne une section de prédiction, le chiffre de référence 115 désigne une section de détermination de régions, le chiffre de référence 116 désigne une information de mode de codage comprenant une information de codage à l'intérieur d'une image complète et une information de codage entre images complètes, le chiffre de référence 117 désigne un vecteur de déplacement, le chiffre de référence 118 désigne un codeur et le chiffre de référence 119 désigne des données codées. Dans cet appareil, l'image d'entrée 1 est tout d'abord subdivisée en de multiples régions par la section de subdivision en régions 113. La section de subdivision en régions 113 détermine des dimensions de régions en fonction de l'erreur de prédiction compensée du point de vue déplacement. La section de subdivision en régions 113 exécute une évaluation en utilisant un seuil en rapport avec la dispersion du signal entre images complètes et affecte de petits blocs à des régions dans lesquelles il existe un déplacement conséquent, et de grands blocs à des régions, tels que des arrière-plans, ayant un petit déplacement à partir de dix types de tailles de blocs préparées par avance et égales à 4 x 4, 4 x 8, 8 x 4, 8 x 8, 8 x 16, 16 x 8, 16 x 16, 16 x 32, 32 x 16 et 32 x 32. En termes concrets, une valeur de dispersion est calculée par une section de détermination de régions 115 pour le signal d'erreur de prédiction obtenu par la section de prédiction 114 et, sur la base de cette valeur, la taille du bloc est déterminée. Une information d'attribut 116, telle qu'une information de forme de région et une information de mode de codage, ainsi qu'un vecteur de déplacement 117 sont déterminés à cet instant, et le signal d'erreur de prédiction ou le signal original est codé par le codeur 118 conformément à l'information de mode de codage de manière à fournir des données codées 119. Des traitements ultérieurs

sont identiques à ceux de la première technique antérieure.

Cette technique antérieure a une souplesse de traitement plus grande que la première technique antérieure, du point de vue de la préparation de blocs ayant des tailles multiples. Cependant, cet appareil limite également chaque région à une forme rectangulaire. Par conséquent, même avec des formes rectangulaires en dix tailles, il existe des possibilités d'améliorations du caractère adaptatif en rapport avec des régions d'images

dans des formes quelconques.

La présente invention tient compte de ces problèmes en vue de fournir une technique de codage d'images mobiles permettant d'exécuter un traitement plus souple conformément aux conditions de l'image devant être traitée. Plus concrètement, la présente invention a pour but de fournir une technique de codage d'images utilisant des techniques de subdivision en régions qui permettent de traiter d'une manière précise différentes structures d'image. Un autre but de la présente invention est de fournir un critère de séparation basé sur différents points de vue lors de la subdivision en régions pour le codage. Un autre but de la présente invention est de fournir une technique permettant de décoder correctement les données codées de régions, qui ont été subdivisées en différentes formes. Le procédé de codage d'images mobiles selon la présente invention inclut deux étapes. Une première étape subdivise une image d'entrée en de multiples régions sur la

base d'un critère prédéterminé d'évaluation de subdivision.

Le codage jusqu'à ce point est identique au codage général classique basé sur des régions. Cependant, lors d'une seconde étape, la présente invention inclut chacune des régions multiples séparées avec des régions adjacentes sur la base d'un critère prédéterminé d'évaluation d'intégration. Ensuite, lors d'une troisième étape, le signal d'image est codé pour chacune des régions qui subsistent après l'intégration. Conformément à ce procédé, le processus d'intégration permet d'avoir différentes formes pour les régions. Par conséquent, on peut produire une région ayant une forme étroitement adaptée à la

structure d'une image ou au contour d'un objet.

L'appareil de codage d'images mobiles selon la présente invention comprend une section de subdivision en régions et un codeur. La section de subdivision en régions comprend une section de traitement de subdivision pour subdiviser l'image d'entrée en de multiples régions sur la base d'un critère prédéterminé d'évaluation de subdivision, et une section de traitement d'intégration pour intégrer chacune de multiples régions séparées par la section de traitement de subdivision, avec des régions adjacentes sur la base d'un critère prédéterminé d'évaluation d'intégration. Le codeur code le signal d'image pour chacune des régions qui subsistent après l'intégration par la section de traitement d'intégration. Conformément à cette technique, on peut obtenir une qualité d'image comparativement élevée, pour des taux de compression de données comparativement élevés, tout en supportant avec

souplesse les structures d'images.

La section de traitement d'intégration mentionnée précédemment effectue un codage et un décodage préliminaires d'images pour chaque région et peut examiner la quantité de code et la distorsion de codage. Dans un tel cas, la distorsion de codage peut être réduite dans le cadre de la contrainte d'une quantité prédéterminée de code. La section de traitement de subdivision mentionnée précédemment inclut une section d'identification de classes servant à classer l'importance de régions scus la forme de classes, et peut évaluer si il faut ou non séparer chaque région sur la base d'une activité devant être décrite ultérieurement et sur la base de la classe. Si la référence de la section d'identification de classe caractérise les paramètres dans des images, la reconnaissance d'objets devient possible, ce qui facilite

l'obtention d'une subdivision plus précise en régions.

D'autre part, l'appareil de décodage d'images mobiles selon la présente invention introduit et décode les données de l'image, qui a été codée après avoir été subdivisée en de multiples régions. Cet appareil inclut une section de rétablissement de la forme des régions et un codeur de données d'image. La section de rétablissement de la forme des régions rétablit, sur la base de l'information de formes de régions contenue dans les données codées, la forme de chaque région qui a été subdivisée pendant le codage. Après spécification de la séquence dans laquelle des régions ont été codées sur la base des formes des régions rétablies, le décodeur de données d'image décode

l'image pour chaque région à partir des données codées.

Conformément à cet appareil, on obtient un décodage précis même si des régions ayant des formes différentes sont

produites dans l'étage de codage.

De façon plus précise l'invention concerne un procédé de codage d'images mobiles, caractérisé en ce qu'il comprend les étapes consistant à: subdiviser une image d'entrée en une pluralité de régions sur la base d'un critère prédéterminé d'évaluation de subdivision; intégrer des régions avec des régions adjacentes, pour l'ensemble des différentes régions séparées, sur la base d'un critère prédéterminé d'évaluation d'intégration; et coder des signaux d'image pour des régions qui subsistent après l'intégration. Selon une autre caractéristique de l'invention, ledit critère d'évaluation de subdivision implique une comparaison entre l'exécution du codage avec une région donnée séparée et l'exécution du codage sans la région séparée. Selon une autre caractéristique de l'invention, ledit critère d'évaluation d'intégration implique une comparaison entre l'exécution d'un codage avec une région donnée composée avec des régions adjacentes et exécuter le

codage sans la région composée avec les régions adjacentes.

L'invention a trait en outre à un appareil de codage d'images mobiles, caractérisé en ce qu'il comporte: une section de subdivision en régions, qui inclut une section de traitement de subdivision pour subdiviser une image d'entrée en une pluralité de régions sur la base d'un critère prédéterminé d'évaluation de subdivision et une section de traitement d'intégration pour intégrer chacune d'une pluralité de régions séparées par la section de traitement de subdivision, avec des régions adjacentes; et un codeur pour coder des signaux d'image pour chacune des régions qui subsistent après l'intégration au moyen de la

section de traitement d'intégration.

Selon une autre caractéristique de l'invention, ladite section de traitement d'intégration comprend: un codeur provisoire effectuant un codage provisoire pour coder de façon préliminaire une image pour chaque région et calculer la quantité de code de cette image; un décodeur pour décoder l'image codée au moyen du code en effectuant un codage provisoire; une section de calcul de distorsion de codage pour calculer la distorsion de codage en utilisant l'image décodée par le décodeur; et une section de calcul d'une valeur d'évaluation pour calculer une valeur d'évaluation pour évaluer l'avantage du codage lorsqu'on prend en compte à la fois la quantité de code et la distorsion de codage; une détermination étant effectuée pour chaque région pour savoir s'il faut effectuer ou non l'intégration pour la région sur la base d'un résultat de comparaison de la valeur d'évaluation, qui est obtenue dans le cas o la région est intégrée avec des régions adjacentes, et la valeur d'évaluation qui est obtenue dans le cas o la région n'est pas intégrée avec des régions adjacentes. Selon une autre caractéristique de l'invention, ladite section de traitement de subdivision comprend: une section de calcul d'activité pour calculer une puissance d'erreur de prédiction accompagnant une prédiction, compensée du point de vue déplacement, de chaque région en tant qu'activité de la région; et une section d'évaluation de subdivision pour comparer l'activité calculée à une valeur formant critère, qui a été fixée par avance; et subdivise en outre des régions ayant une activité supérieure à la valeur de critère, en des régions plus

petites.

Selon une autre caractéristique de l'invention, ladite section de traitement de subdivision comprend: une section de calcul d'activité pour calculer une intensité de bord d'un signal original pour chaque région en tant qu'activité de la région; et une section d'évaluation de subdivision pour calculer l'activité calculée à une valeur de critère qui a été fixée par avance; et subdivise en outre des régions ayant une activité supérieure à la valeur

de critère en des régions plus petites.

Selon une autre caractéristique de l'invention, ladite section de traitement de subdivision comprend: une section de calcul d'activité pour calculer, pour chaque région, une somme linéaire d'une pluralité de valeurs numériques indiquant les caractéristiques de l'image de la région; et une section d'évaluation de subdivision pour comparer l'activité calculée à une valeur de critère qui a été fixée par avance; et subdivise en outre des régions ayant une activité supérieure à la valeur de critère en des

régions plus petites.

Selon une autre caractéristique de l'invention, ladite pluralité de valeurs numériques comprend une puissance d'erreur de prédiction et un paramètre de déplacement de chaque région, qui accompagnent une

prédiction compensée du point de vue déplacement.

Selon une autre caractéristique de l'invention, ladite pluralité de valeurs numériques comprend une quantité de code d'un paramètre de déplacement de chaque région, une puissance d'erreur de prédiction qui accompagne une compensation de déplacement, une valeur de dispersion d'un signal original, une intensité de bord et une

amplitude du paramètre de déplacement de chaque région.

Selon une autre caractéristique de l'invention, ladite section de traitement de subdivision comprend en outre une section d'identification de classes et évalue s'il faut ou non subdiviser chaque région sur la base à la

fois de ladite activité et de ladite classe.

Selon une autre caractéristique de l'invention, ladite section d'identification de classes observe une structure d'objet recouvrant une pluralité de régions et fixe des classes pour les régions. Selon une autre caractéristique de l'inventicn, ladite structure d'objet est évaluée sur la base d'une dispersion, dans le signal original, de la région, de l'intensité de bord et du degré de raccordement du bord à

des régions adjacentes.

Selon une autre car--".'-istique de l'invention, ladite section d'identification de classes observe des caractéristiques d'une image, effectue une détection d'objets et, sur la base des résultats de cette observation

et de cette détection, fixe des classes pour la région.

Selon une autre caractéristique de l'invention, ladite section d'identification de classes mémorise par avance, pour chaque objet prédit comme devant être inclus dans l'image, des caractéristiques de l'image incluant l'objet, et détermine la classe de chaque région sur la base du degré de coïncidence entre les caractéristiques de l'image de chaque région et les caractéristiques mémorisées

de l'objet.

Selon une autre caractéristique de l'invention, ladite section de traitement de subdivision comprend: un codeur provisoire effectuant un codage provisoire peur coder de façon préliminaire l'image pour chaque région et calculer la quantité de code de cette région; un décodeur pour décoder l'image codée au moyen du codeur provisoire; une section de calcul de distorsion de codage pour calculer la distorsion de codage en utilisant l'image décodée par le

décodeur; et une section de calcul d'une valeur d'évalua-

tion pour calculer une valeur d'évaluation pour évaluer l'avantage du codage lorsqu'on prend en compte à la fois la quantité de code et la distorsion de codage; une détermination étant effectuée pour chaque région pour savoir s'il faut effectuer ou non l'intégration pour la région sur la base d'un résultat de comparaison de la valeur d'évaluation, qui est obtenue dans le cas o la région est subdivisée en supplément en régions plus petites, et la valeur d'évaluation qui est obtenue dans le cas o la région n'est pas subdivisée en supplément en

régions plus petites.

Selon une autre caractéristique de l'invention, un paramètre de quantification d'un signal d'erreur de prediction accompagnant une prédiction, compensée du point de vue déplacement, est réglé d'une manière variable dans ledit codeur réalisant un codage provisoire, et ladite section de calcul de la valeur d'évaluation calcule la valeur d'évaluation tout en modifiant le paramètre de quantification. Selon une autre caractéristique de l'invention, une section de calcul de la valeur d'évaluation servant à obtenir, en tant que valeur d'évaluation, une somme linéaire de la puissance d'erreur de prédiction et de la quantité de code du paramètre de déplacement de chaque région accompagnant la prédiction, compensée du point de vue du déplacement, est disposée dans un étage situé en amont de celui dudit codeur effectuant un codage provisoire, et ledit codeur effectuant un codage provisoire détecte le paramètre de déplacement sur la base de la

valeur d'évaluation.

L'invention concerne en outre un appareil pour produire et décoder des données codées d'une image qui a été codée après avoir été subdivisée en une pluralité de régions, caractérisé en ce qu'il comporte: une section de régénération de la forme de la région, servant à régénérer, sur la base d'une information de la forme de région contenue dans les données codées, la forme de chaque région qui a été séparée pendant le codage; et un décodeur de données d'image pour décoder l'image de chaque région à

partir de données codées correspondant à sa région.

Selon une autre caractéristique de l'invention, ladite information concernant la forme de la région inclut une information se rapportant au traitement lorsque des régions sont séparées et intégrées pendant le codage et, sur la base de cette information, ladite section de rétablissement de la forme de la région identifie l'état séparé de régions par reproduction du même processus que

celui de l'appareil de codage.

L'invention concerne en outre un procédé de codage d'images mobiles, caractérisé en ce qu'il comprend les étapes consistant à: intégrer des régions préalablement séparées, avec des régions adjacentes sur la base d'un critère prédéterminé d'évaluation d'intégration; et coder des signaux d'image pour des régions qui

subsistent après l'intégration.

L'invention concerne en outre un appareil de codage d'images mobiles, caractérisé en ce qu'il comporte: une section de traitement d'intégration pour intégrer chacune d'une pluralité de régions préalablement séparées, avec des régions adjacentes, et un codeur pour coder des signaux d'image pour chacune des régions qui subsistent après l'intégration par la section de traitement

d'intégration.

D'autres caractéristiques et avantages de la

présente invention ressortiront de la description donnée

ci-après prise en référence aux dessins annexés, sur lesquels: - la figure 1, dont il a déjà été fait mention, représente un appareil de codage d'images mobiles relatif à un premier art antérieur; - la figure 2, dont il a déjà été fait mention, représente un appareil de codage d'images mobiles relatif à un second art antérieur; - la figure 3 est un schéma-bloc usuel pour un appareil général de codage d'images mobiles selon une forme de réalisation; - la figure 4 est un organigramme illustrant le fonctionne:aent de l'appareil de codage d'images de la figure 3; - la figure 5 est un schéma-bloc interne de la section de subdivision en régions de la figure 3; - la figure 6 est un schéma-bloc interne de la section de traitement de subdivision de la figure 5; - la figure 7 est un organigramme illustrant un fonctionnement de la section de traitement de subdivision de la figure 6; - la figure 8 représente un exemple d'un résultat de subdivision uniforme dans la section de traitement de subdivision de la figure 6; - la figure 9 représente un résultat d'une première subdivision initiale dans la section de traitement de subdivision de la figure 6; - la figure 10 représente un résultat final de subdivision initiale dans la section de traitement de subdivision de la figure 6; - la figure 11 est un schéma-bloc interne de la section de traitement d'intégration de la figure 5; - la figure 12 est un organigramme illustrant un fonctionnement de la section de traitement d'intégration de la figure 11; - la figure 13 représente un exemple d'étiquetage d'une région dans la section de traitement d'intégration de la figure 11; - la figure 14 représente un exemple de positionnement de régions adjacentes dans la section de traitement d'intégration de la figure 11; - la figure 15 est un organigramme illustrant la procédure de S19 sur la figure 12; - la figure 16 est un schéma-bloc interne d'une autre forme de réalisation de la section de traitement de subdivision de la figure 5; - la figure 17 représente un résultat final d'une subdivision initiale dans la section de traitement de subdivision de la figure 16; la figure 18 est un schéma-bloc interne d'une autre forme de réalisation de la section de traitement de subdivision de la figure 5; - la figure 19 est un organigramme illustrant une opération de fonctionnement de la section de traitement de subdivision de la figure 18; - la figure 20 représente une autre forme de réalisation de la section d'identification de classes de la figure 18; - la figure 21 représente une prédiction, compensée du point de vue déplacement, sur la base d'une mise en correspondance de blocs; - la figure 22 est un schéma-bloc interne d'une autre forme de réalisation de la section de traitement de subdivision de la figure 5; - la figure 23 est un organigramme illustrant un fonctionnement de la section de traitement de subdivision de la figure 22; - la figure 24 est un schéma-bloc interne d'une autre forme de réalisation de la section de traitement d'intégration de la figure 5; - la figure 25 est un organigramme illustrant un fonctionnement de la section de traitement d'intégration de la figure 24; - la figure 26 est un schémabloc interne d'une autre forme de réalisation de la section de traitement d'intégration de la figure 5; - la figure 27 est un schéma- bloc interne d'un appareil de décodage d'images mobiles associé à la forme de realisation; et - la figure 28 est un organigramme illustrant un

fonctionnement de l'appareil de décodage de la figure 24.

On va donner ci-après une forme de description

détaillée des formes de réalisation préférées.

PREMIERE FORME DE REALISATION

La figure 3 est un schéma-bloc représentant une configuration d'un appareil de codage d'images mobiles associé à cette forme de réalisation. Cet appareil peut être utilisé dans un équipement portable ou fixe pour des transmission d'images, tels que des vidéotéléphones et des circuits de conférence de télévision. On peut également l'utiliser en tant qu'appareil de codage d'images mobiles dans un appareil de mémorisation et d'enragistrement d'images tels que des magnétoscopes numériques ou des serveurs vidéo. En outre les processus intervenant dans cet appareil peuvent être égalementés en tant que programmes de codage d'images mobiles devant être installé sous la forme d'un logiciel ou d'un logiciel microprogrammé

DSP.

Sur la figure 3, le chiffre de référence 1 désigne l'image d'entrée, le chiffre de référence 2 désigne une section de subdivision en régions, le chiffre de référence 3 désigne une information concernant la forme des régions, le chiffre de référence 4 désigne un signal d'image de région, le chiffre de référence 5 désigne une information de déplacement de région, le chiffre de référence 6 désigne une information d'attribut de région, le chiffre de référence 7 designe un codeur, le chiffre de référence 8 désigne une information de déplacement de région, le chiffre de référence 6 désigne une information d'attribut de région, le chiffre de référence 7 désigne un codeur, le chiffre de référence 8 désigne une image localedécodée, le chiffre de référence 9 désigne une mémoire, le chiffre de référence 10 désigne une image de référence et le chiffre de référence 11 désigne un flux binaire codé. La figure 4 est un crganigramme illustrant un fonctionnement de l'appareil. On va tout d'abord décrire le fonctionnement

d'ensemble de l'appareil en référence aux figures 3 et 4.

L'image d'entrée 1 est envoyée à une section de subdivision en régions 2 (Sl), dans laquelle l'image est subdivisée en de multiples régions. La section de subdivision en régions 2 exécute une subdivision initiale (S2) et une intégration de régions adjacentes (S3), comme cela sera décrit plus loin. La section de subdivision en régions 2 transmet une information de forme 3, un signal d'image 4, une information d'attribut 6 telle que des mots de codage des régions, et une information de déplacement 11 pour chaque région obtenue en tant que résultat de la subdivision au codeur 7. Le codeur 7 transforme et multiplexe ces éléments d'information en un profil binaire sur la base d'un procédé de codage prédéterminé pour le

délivrer sous la forme d'un flux binaire codé 11 (S4, S5).

Pour effectuer la subdivision en régions et le codage sur la base d'une prédiction compensée du point de vue déplacement, le codeur 7 produit une image locale décodée 8 pour chaque région et l'introduit en mémoire dans une mémoire 9. La section de subdivision en régions 2 et le codeur 7 extraient l'image locale décodée mémorisée dans la mémoire 9, en tant qu'image de référence 10 pour effectuer

une prédiction compensée du point de vue déplacement.

La figure 5 représente un schéma-bloc détaillé de la section de subdivision en régions 2, sur lequel le chiffre de référence 12 désigne une section de traitement de subdivision, le chiffre de référence 13 désigne une information initiale sur la forme de subdivision et le chiffre de référence 14 désigne une section de traitement d'informations. (1) Subdivision initiale La subdivision initiale correspondant à S2 sur la figure 4 est exécutée dans la section de traitement de subdivision 12. L'expression subdivision initiale désigne

la subdivision qui est exécutée avant de passer à l'inté-

gration, et le compte total de subdivision dépend de l'état de l'image, à savoir les particularités ou caractéristiques

de l'image.

La figure 6 représente une configuration interne d'une section de traitement de subdivision 12, dans laquelle le chiffre de référence 15 désigne une section de subdivision uniforme, le chiffre de référence 16 désigne une section de calcul d'activité, le chiffre de référence 17 désigne une activité, le chiffre de référenze 18 désigne une section d'évaluation de subdivision, et le chiffre de référence 19 désigne un signal d'instruction d'état de subdivision. L'activité se réfère à une valeur évaluée permettant d'évaluer les particularités ou caractéristiques de l'image au regard d'une propriété prédéterminée. Une puissance d'erreur de prédiction accompagnant une prédiction, compensée du point de vue déplacement, pour une région est utilisée en tant qu'activité dans cette forme de réalisation. La figure 21 représente un procédé de prédiction, compensé du point de vue déplacement, sur la base d'un procédé de mise en correspondance de blocs. Dans le procédé de mise en correspondance de blocs, un vecteur v fourni par la formule suivante est trouvé en tant que vecteur de

déplacement de la région S devant être prédite.

Dmin = min(Z [fs(x + vx, y + vy, t-l) - fs(x,y,t)]) vER S Le terme fs(x, y, t) est la valeur du pixel dans (x, y) à l'instant t de la région prédite S, fs(x, y, t-l) est la valeur du pixel dans (x, y) à l'instant t-l, et fs(x+vx, y+Vy, t-l) est la valeur de pixel de la position qui est déplacée, et ce du module du vecteur v, à partir de la position (x, y, t-l). R représente la gamme de recherche

du vecteur de déplacement.

A partir du vecteur v obtenu, l'image de prédiction est obtenue au moyen de fs(x+vx, y+vy, t-1), et la puissance d'erreur de prédiction ou activité devient Dmin. La définition de l'activité avec ce procédé permet d'exécuter la subdivision en régions en fonction de la complexité du déplacement local de l'image. La commande devient possible, comme par exemple pour un codage détaillé pour des parties ayant des déplacements conséquents, et un codage approximatif pour des parties ayant de petits déplacements. On peut utiliser une compensation du déplacement affine pour l'obtention de paramètres de déplacement affine et la compensation de déplacement en perspective pour la détection d'un déplacement

tridimensionnel.

La figure 7 est un organigramme illustrant un fonctionnement de la section de traitement de subdivision 12, dans laquelle une subdivision uniforme inconditionnelle en blocs est tout d'abord exécutée (S8) au moyen de la section de subdivision uniforme 15. Simultanément, une image complète est subdivisée par exemple en blocs de

32 x 32 pixels comme cela est représenté sur la figure 8.

Ce processus de subdivision est désigné comme étant un étage de subdivision d'ordre 0. Le nombre de blocs produits dans l'étage de subdivision d'ordre O est désigné par NO et

chaque bloc est désigné par B0n (1 < n < NO).

Ensuite, une évaluation est faite individuellement pour déterminer s'il faut effectuer ou non une autre subdivision en blocs pour chaque B0n (S9). A cet effet, l'activité 17 pour chaque B0n est calculée dans la section de calcul d'activité 16. La section d'évaluation de subdivision 18 compare le seuil TH0, qui a été réglé par avance avec l'activité de chaque bloc, et si l'activité 17 est supérieure à TH0, le bloc correspondant Bon est en outre subdivisé en quatre blocs (S10). Ceci est désigné

comme étant un 1-er étage de subdivision.

La figure 9 illustre l'image subdivisée au niveau de la 1-ère étape de subdivision. Le nombre de blocs de 16 x 16 pixels nouvellement produits est désigné par N1 et chaque bloc est désigné par Bln (1 < n < N1). Ensuite, on calcule l'activité de chaque B1n et on exécute une 2-ème étape de subdivision en utilisant le seuil TH1. Ensuite, on applique le seuil THj au bloc BJn produit dans une j-ème étape de subdivision et on exécute la j+1-ème étape de subdivision (S13 à S16). Le positionnement initial est terminé lorsque j atteint une valeur limite supérieure

prédéterminée. On suppose ici pour la description que le

traitement se termine à la fin de leur 2-ème étape de subdivision. Dans ce cas, des blocs tels que représentés sur la figure 10 sont produits. Les tailles des blocs sont comprises entre 8 x 8 pixels et 32 x 32 pixels. Le nombre de blocs à la fin de la subdivision initiale est désigné par M0 et la région initiale de chaque bloc est désignée par SOn. L'information de forme pour S0n est transmise à la section de traitement d'intégration 14 en tant

qu'information 13 sur la forme de la subdivision initiale.

(2) Intégration de régions adjacentes La section de traitement d'intégration 14 exécute une intégration avec des régions adjacentes pour chaque SOn. La configuration interne de la section de traitement d'intégration 14 est représentée sur la figure 11, sur laquelle le chiffre de référence 20 désigne une section d'étiquetage, le chiffre de référence 21 désigne une section de positionnement de régions adjacentes, le chiffre de référence 22 désigne un codeur réalisant un codage provisoire, le chiffre de référence 23 désigne un codeur, le chiffre de référence 24 désigne une section de calcul de déformation de codage, le chiffre de référence 25 désigne une section de calcul de la valeur d'évaluation, le chiffre de référence 26 désigne une constante pour le calcul de la valeur d'évaluation, le chiffre de référence 27 désigne une section d'évaluation d'intégration, et le chiffre de référence 28 désigne un signal d'instruction d'itération du

processus d'intégration.

La figure 12 est un organigramme illustrant un fonctionnement de la section de traitement d'informations 14. Comme cela est représenté sur l'organigramme, les nombres ou étiquettes sont tout d'abord affectés à des régions initiales SOn par la section d'étiquetage 20 en fonction d'une règle prédéterminée (S17). Par exemple, des nombres sont affectés en séquence à des régions bien que l'image complète soit balayée horizontalement selon des unités de pixels depuis le coin supérieur gauche jusqu'au coin supérieur droit. Un simple exemple d'étiquetage est illustré sur la figure 13, les étiquettes "1", "2", etc.

étant affectées aux régions selon leur séquence d'appari-

tion sur la ligne de balayage. A cet instant, on néglige la taille de la région. Ensuite, la valeur d'étiquette de la région Skn est désignée par l(Skn). Le k correspond ici à une k-ème étape de subdivision qui sera décrite plus loin,

l'état initial étant k=C.

Ensuite les "régions adjacentes" de chaque région sont définies par la section 21 de positionnement de régions adjacentes (S18) qui utilise les étiquettes. La figure 14 est un exemple de régions adjacentes, dans lesquelles les régions adjacentes d'une région SOn sont basées sur les étiquettes de la figure 13. Les régions B, C et D, qui sont adjacentes aux bords de la région A et comportent des valeurs d'étiquettes supérieures à celles de

la région A, sont définies en tant que régions adjacentes.

Ensuite, une évaluation est faite pour chaque région de manière à déterminer si la région peut être intégrée ou non avec ses régions adjacentes. Pour cette raison, une valeur d'évaluation pour l'intégration est calculée (S19) par le codeur 22 réalisant un codage provisoire, le décodeur 23, la section 24 de calcul de distorsion de codage et la section 25 de calcul de la valeur d'évaluation. La valeur d'évaluation est une quantité de code - coût de distorsion L(Skn) exprimée par la formule suivante: L(Skn) = D(Skn) + ÀR(Skn) Formule 1 Ici D(Skn) est la distorsion de codage de SSkn, c'est-à-dire la sommation d'erreurs au carré, R(Skn) est la

quantité de code de Skn et À est la constante 26. L'intégra-

tion s'effectue dans la direction des valeurs décroissantes de L(Skn). La diminution de L(Skn) est équivalente à la diminution de la distorsion de codage à l'intérieur de la gamme de la quantité prédéterminée de code basée sur la constante donnée A. Une réduction de la sommation de L(Skn) permet de réduire la distorsion de codage lorsqu'on utilise

la même quantité de code.

La figure 15 est un organigramme détaillé de S19.

Tout d'abord Sk est codé de façon préliminaire (S22) dans n le décodeur 22 réalisant un codage provisoire. Ce codage est exécuté à titre de préparatifs pour le calcul de la quantité de code R(Skn) et l'obtention de la distorsion de codage D(Skn). Dans cette forme de réalisation, le codeur 22 réalisant un codage provisoire exécute une compensation de déplacement en utilisant l'image de référence 10. Les données devant être codées comprennent les données d'image, à savoir le signal d'erreur de prédiction ou le signal original, l'information de déplacement pour spécifier l'image de prédiction et l'information d'attribut telle que celle du mode de ccdage, la sommation des quantités de ces codes étant R(Skn). Le signal d'erreur de prédiction est obtenu en tant que différence du signal original de Skn et

de l'image de prédiction.

La figure 23 produit l'image locale décodée pour Skn (S23) en utilisant les données décodées fournies par le codeur 22 réalisant un codage provisoire. Ensuite la distorsion D(Skn) de l'image locale décodée et de l'image originale est calculée (S24) par la section de calcul de distorsion de codage 24. La section de calcul de la valeur d'évaluation 25 calcule (S25) la quantité de code - coût de distorsion L(Skn) à partir de R(Skn) et D(Skn).

Le pas 19 exécute le calcul de la valeur d'éva-

luation précédente pour toutes les régions pour les trois types de 1. Chaque région Skn elle-même: L(Skn) 2. Des régions adjacentes Ni[Skn] de Skn: L(Ni[Skn]) 3. Région intégrant temporairement skn et Ni[Skn]: L(Skn+Ni[Skn]) Ici, Ni[Skn] désigne une régicn adjacente de Skn et i est un nombre servant à distinguer les multiples régions

adjacentes.

Ensuite dans la section d'intégration d'évalua-

tion 27, un emplacement à l'intérieur de l'image complète, dans lequel on a DL = L(Skn)+L(Ni[Skn])-L(Skn+Ni[Skn]) est maximum, est recherché et les valeurs correspondantes Skn et Ni[Skn] sont intégrées (S20). C'est la k-ème étape

d'intégration. Ensuite, la section d'évaluation d'intégra-

tion 27 commande à la section d'étiquetage 20 de mettre à jour des étiquettes au moyen d'un signal 28 de commande d'itération du processus d'intégration. La section d'étiquetage 20 remplace l'étiquette l(Ni[Skn]) par l(Skn), et positionne à nouveau des régions adjacentes au moyen de la section de positionnement de régions adjacentes 21. Ceci fournit une nouvelle région Sk+ln et de nouvelles adjacentes Ni[sk+ln], ce qui détermine L(Sk+ln), LNi[Sk+in]

et L(Sk+ln+Ni[sk+ln]). La section d'évaluation d'intégra-

tion 27 bloque les instructions envoyées à la section d'étiquetage 20 lorsqu'il n'existe pas d'autres combinaisons fournissant des valeurs positives de DL et

arrête le processus d'intégration (S21).

Ceci termine le traitement de subdivision et d'intégration, et l'information 3 exprimant l'état de l'image d'entrée 1 subdivisée en régions, l'état de l'image 4 pour chaque région, l'information de déplacement 5 et l'information d'attribut 6 sont envoyées au codeur 7. Ensuite un codage est exécuté conformément à un procédé de

codage prédéterminé.

Dans cette forme de réalisation, l'intégration a été réalisée ainsi que la subdivision et chaque région peut être exprimée comme un ensemble de blocs rectangulaires de différentes tailles. Par exemple un objet à l'intérieur d'une image présentant des déplacements conséquent peut être intégré dans une seule région ayant une forme similaire aux contours de l'objet. Il en résulte que la quantité de code est commandée par la modification des paramètres de quantification pour chaque objet de manière à permettre un traitement souple d'images sur la base de leurs structures réelles. En outre, une subdivision optimale en régions, qui réduit la distorsion de codage, est obtenue dans le cas d'une quantité fixe de code. C'est pourquoi, par rapport à l'appareil classique de codage d'images mobiles, on peut obtenir une qualité d'image plus

importante avec une plus faible quantité de code.

Bien que la subdivision initiale dans cette forme de réalisation se soit terminée à la fin de la 2-ème étape de subdivision, elle peut naturellement se terminer au cours d'une autre étape. Par exemple, si le déplacement d'ensemble de l'image est faible, la subdivision initiale peut être interrompue dans la 1-ère étape et, si ce n'est pas le cas, le nombre d'étapes peut être accru. En outre, bien que des images complètes aient été codées dans cette forme de réalisation, il est également possible d'appliquer ce codage d'une manière similaire à une zone d'image rectangulaire incluant un objet de forme quelconque dans

l'image complète.

Pour le codeur décrit 7 et le codeur provisoire 22 réalisant un codage provisoire, le codage de Sk était n exécuté au moyen d'une combinaison de DCT et d'une quantification linéaire. Cependant, on peut utiliser d'autres procédés de codage, tels qu'une quantification vectorielle, un codage de bandes secondaires ou un codage en vaguelettes. On peut préparer de multiples procédés de codage et on peut utiliser une configuration utilisant de façon sélective le procédé fournissant le meilleur

rendement de codage.

Bien que l'on ait adopté la puissance d'erreur de prédiction pour l'activité dans cette forme de réalisation,

on peut considérer d'autres exemples indiqués ci-après.

Un premier exemple est une valeur de dispersion dans la région. La valeur de dispersion exprime la complexité de la distribution des pixels de la région, et la valeur de dispersion devient supérieure pour une région qui inclut des images dans lesquelles des valeurs de pixels, telles que celles présentes au niveau des bords, varient brusquement. La valeur de dispersion as est fournie par la formule suivante lorsque la valeur de pixel dans la région S est fixée à fs(x, y, t) et que la moyenne de la valeur du pixel dans la région S est réglée à ps as = - Z (fs(x,y,t) p5)2 N S Sur la base de cette activité, on peut séparer les régions conformément à la complexité de la structure locale de l'image, et il est possible de réaliser une commande pour un codage détaillé de parties, dans lesquelles des valeurs de pixels varient fortement et pour réaliser un codage approximatif de parties, dans lesquelles

des valeurs de pixels varient de façon minimale.

Un second exemple est l'intensité de bord de la région. L'intensité de bord peut être résolue en utilisant un opérateur Sobel comme cela est mentionné dans "Edge detection by compass gradient masks" de G. Robinson (Journal of Computer Graphics and Image Processing, Vol. 6, N 5, Octobre 1977) en tant que nombre de pixels distribués sur le bord ou dans la zone de distribution de bord. Dans le cas de ce procédé, les régions peuvent être subdivisées conformément à la structure de bord de l'image, et la commande est possible pour un codage détaillé de parties dans lesquelles des bords sont situés, et un codage approximatif de parties, au niveau desquelles des bords

n'existent pas.

Comme troisième exemple, on peut indiquer l'amplitude du paramètre de déplacement sur la base d'une prédiction, compensée du point de vue déplacement, de la région. Sous l'effet de la prédiction compensée du point de vue déplacement, on obtient le paramètre de déplacement. Ce paramètre correspond au vecteur v dans le procédé de mise en correspondance de blocs. Conformément à ce procédé, on peut subdiviser des régions conformément au degré de déplacement de l'image, et une commande est possible pour un codage détaillé de parties dans lesquelles des déplacements localisés conséquents de l'image se produisent, comme par exemple des régions de l'objet, et un codage approximatif de parties dans lesquelles les déplacements apparaissent rarement, comme par exemple des

régions d'arrière-plan.

Un quatrième exemple est la somme linéaire de la quantité de code du paramètre de déplacement basée sur une prédiction, compensée du point de vue du déplacement, de la région et sur la puissance d'erreur de prédiction. La valeur d'évaluation de cela est définie dans la formule suivante: mc = Dmc + Rmc Formule 2 Ici Dmc est la puissance d'erreur de prédiction déterminée au cours de la détection du paramètre de déplacement, À est une constante et Rmc est la quantité de code du paramètre de déplacement. Le paramètre de déplacement réduisant Lmc est déterminé et la valeur

d'évaluation à cet instant est réglée en tant qu'activité.

Conformément à ce procédé, des régions sont subdivisées de manière à réduire le coût total de codage y compris la quantité d'information des paramètres de déplacement et la quantité d'information basée sur la complexité du déplacement de l'image, ce qui permet d'effectuer un codage

de subdivisions avec une faible quantité d'information.

Un cinquième exemple est la somme linéaire des valeurs d'activité. En effectuant une pondération appropriée pour chaque activité, il devient possible de

traiter une variété d'images.

Bien que la subdivision initiale soit exécutée dans la section de traitement de subdivision 12 dans cette forme de réalisation, cette section analogue peut être prévue à l'extérieur de la section de subdivision en régions 2. Avec cet agencement la subdivision initiale est exécutée à l'extérieur du dispositif de codage d'images mobiles représenté sur la figure, et une image préalablement subdivisée est envoyée directement à la

section de subdivision de région 2.

SECONDE FORME DE REALISATION

Cette forme de réalisation concerne un appareil dans lequel la section de subdivision en régions 2 de la

première forme de réalisation a été partiellement modifiée.

La figure 16 est un schéma-bloc interne d'une section 2 de

subdivision en régions dans cette forme de réalisation.

Comme cela est représenté sur ce schéma, la section de subdivision en régions 2 de la seconde forme de réalisation possède une configuration dans laquelle la section de traitement de subdivision 12 de la figure 5 a été remplacée par la section de subdivision uniforme 15. Comme représenté sur la figure 17, l'évaluation de seuil de l'activité n'est pas effectuée pendant le processus de subdivision initiale dans cette configuration, et une subdivision uniforme est exécutée d'une manière inconditionnelle selon des blocs carrés ayant une surface de région minimale. On peut prévoir que cette surface de région minimale peut être sélectionnée. Le réglage du seuil est inutile dans cette forme de réalisation, et la subdivision en régions est exécutée uniquement pour une quantité de code - coût de distorsion en tant que valeur d'évaluation. Par conséquent, la procédure associée au réglage du seuil devient inutile de

même que le calcul de l'activité et le traitement d'évalua-

tion de comparaison. Par conséquent, on peut utiliser cette forme de réalisation en plus de la première forme de réalisation pour réduire la charge de calcul relative à ces processus.

TROISIEME FORME DE REALISATION

Dans le processus de subdivision selon cette forme de réalisation, une évaluation est faite concernant le fait qu'une subdivision est possible ou non y compris non seulement l'activité, mais également un index (désigné ci-après sous le terme classe) indiquant l'importance de la région. Il est préférable d'exécuter un codage détaillé pour la région ayant une grande importance et de réduire les surfaces des régions. Les régions ayant une faible importance sont rendues aussi grandes que possible de

manière à réduire la quantité de code par pixel.

L'activité est par exemple une valeur statistique logique fermée à l'intérieur de la région. D'autre part, les classes dans cette forme de réalisation sont basées sur les caractéristiques des régions couvrant l'image. Dans cette forme de réalisation, les classes sont définies sur la base du degré avec lequel une personne voit la région, à savoir un degré d'observation de la personne, en raison de la structure d'objet traversant la région. Par exemple, lorsque la distribution de bord d'une région donnée s'étend sur une distance conséquente et que la liaison avec des régions adjacentes est serrée, il est tout à fait possible que la région soit située au niveau de la limite d'un objet. La figure 18 est un schéma-bloc interne de la section de traitement de subdivision 12 de cette forme de réalisation. En dehors de ce qui est représenté, la représentation est identique à celle de la première forme

de réalisation et la description qui va suivre concerne les

différences par rapport à la première forme de réalisation.

Sur le même schéma, le chiffre de référence 29 indique une section d'identification de classes, le chiffre de référence 30 désigne un identifiant de la classe, et le chiffre de référence 31 désigne une section d'évaluation de subdivision. La figure 19 est un organigramme représentant un fonctionnement de la fonction de traitement de

subdivision 12 représenté sur la figure 18.

Comme cela est représenté sur la figure 19, on

effectue tout d'abord une subdivision uniforme (S26).

Ensuite, la classe 30 de chaque région est déterminée (S27) au moyen de la section 29 d'identification de classes. La section 29 d'identification de classes détermine la classe en évaluant l'amplitude a de la dispersion à l'intérieur de la région, l'état e de la distribution de bord à l'intérieur de la région (y compris la direction du bord et la zone de distribution) et la connectivité y pour les bords avec des régions adjacentes. Par exemple une région possédant une dispersion a qui est inférieure à une valeur prédéterminée est réglée en tant que classe la plus basse (classe A), tandis que la distribution de bord e à l'intérieur de la région est en outre déterminée pour des régions ayant une dispersion a qui est supérieure à la valeur prédéterminée. La détermination de e peut être réalisée par exemple au moyen de l'opérateur Sobel mentionné précédemment. Si f est inférieur à la valeur prédéterminée, la région est considérée comme étant une petite zone ayant un bord indépendant plutôt qu'une limite d'objet, puis est classée dans une classe intermédiaire (classe B). Lorsque atteint une certaine valeur élevée, la connectivité y est évaluée, et si y possède une valeur élevée, la région est classée dans la classe la plus

importante (classe C).

Après classification en des classes, l'activité 17 est calculée dans la section de calcul d'activité 16, et une évaluation de seuil concernant l'activité est tout d'abord effectuée (S28) par la section d'évaluation de subdivision 31. Pour une région évaluée ici comme nécessitant une subdivision, une évaluation est faite de manière à permettre la subdivision basée sur la classe 30 (S29). Par conséquent, la section d'évaluation de subdivision 31 retient par avance un critère qui définit sur quelle valeur de taille une région de chaque classe doit être subdivisée. Si l'autorisation de subdivision est accordée en rapport avec une classe, la région est subdivisée (S30). Ceci est exécuté pour toutes les régions, et le même processus de subdivision est également exécuté pour les régions subdivisées nouvellement créées (S33 à S38). Conformément à cette forme de réalisation, le codage d'images peut être exécuté tout en prenant en compte des caractéristiques d'image englobant de multiples régions, en particulier les contours d'objets. Une commande est possible de telle sorte que des régions ayant un faible degré d'observation soient codées de façon approximative pour réduire la quantité d'informations, et que la quantité d'informations réduite est appliquée à des régions ayant un

degré élevé d'observation.

QUATRIEME FORME DE REALISATION

Le degré d'observation de la personne a été utilisé dans la détermination des classes dans la troisième forme de réalisation. Dans cette forme de réalisation, les caractéristiques d'une image connue sont mémorisées et les classes sont déterminées en fonction du degré de coïncidence entre les caractéristiques mémorisées et les

caractéristiques calculées à partir de chaque région.

Par exemple, pour des images de visages, une recherche considérable a été exécutée, et de nombreuses techniques ont été proposées pour numériser les structures de visages. Une fois que ces caractéristiques sont mémorisées, un visage d'une personne (ayant en général une grande importance) peut être détecté à partir de l'intérieur de l'image. Pour d'autres buts, il existe également de nombreux cas o on peut décrire ces objets au moyen de caractéristiques basées sur une information de luminance et de texture. Pour exprimer clairement le visage d'une personne, la région présentant des caractéristiques coïncidant avec des caractéristiques du visage de lapersonne est réglée comme étant la classe la plus importante A, tandis que d'autres régions sont réglées comme faisant partie de la classe B, ayant une importance normale. La figure 20 est un schéma-bloc de la section 29 d'identification de classes dans cette forme de réalisation. Les autres blocs sont équivalents à ceux de la troisième forme de réalisation. Sur la figure 20, le chiffre de référence 21 désigne une mémoire de caractéristiques, le chiffre de référence 32 désigne une section de calcul du degré de coïncidence de caractéristiques, et le chiffre de référence 34 désigne une

section de détermination de classe.

La mémoire de caractéristiques 32 conserve les caractéristiques associées à des objets pour chaque objet classé dans des classes. La section 33 de calcul de degré de coïncidence des caractéristiques calcule le degré de coïncidence d'une image d'entrée 1 et des caractéristiques de l'objet classé selon des classes. Le degré de coïncidence est déterminé par exemple en tant qu'erreur entre les caractéristiques d'une image d'entrée 1 et les caractéristiques à l'intérieur de la mémoire de caractéristiques 32. Ensuite, l'objet possédant le degré maximum de coïncidence est détecté par la section de détermination de classe 34, et les régions concernées sont

classées dans cette classe d'objets.

Conformément à cette forme de réalisation, l'identification ou la détection d'objets devient possible en fonction de caractéristiques de l'image. La qualité d'image peut être en outre améliorée lorsque cela est nécessaire. La classification d'objets en des classes peut être exécutée conformément aux caractéristiques associées au degré d'observation de la personne, auquel cas un codage peut être exécuté tout en tenant compte de caractéristiques

visuelles humaines en rapport avec l'image.

CINQUIEME FORME DE REALISATION

On a tenu compte d'une distorsion de codage pendant le processus d'intégration, dans la première forme de réalisation. Dans cette première forme de réalisation, une distorsion de codage lors de l'étape du processus de

subdivision est prise en considération.

La figure 22 est un schéma-bloc interne de la section de traitement de subdivision 12 dans cette forme de réalisation, le chiffre de référence 35 désignant une section d'évaluation de subdivision, le chiffre de référence 36 indiquant un signal d'instruction d'itération du processus de subdivision. La figure 23 est un organigramme illustrant un fonctionnement de la section de

traitement de subdivision 12 de la figure 22.

La section de traitement de subdivision 12 de cette forme de réalisation utilise une formule 1 qui a été introduite dans la première forme de réalisation. Grâce à l'utilisation de cette formule, le processus de subdivision initiale est exécuté dans le sens d'une réduction de la sommation de L(Skn) dans l'image complète de sorte que la distorsion de codage peut être réduite lorsqu'on utilise la même quantité de code. Comme représenté sur la figure 23, une subdivision en blocs uniformes est tout d'abord exécutée (S39) dans la section de subdivision uniforme 15 par

exemple de telle sorte qu'on obtient l'état de la figure 8.

Cela correspond à l'étape de subdivision d'ordre 0. Le nombre de blocs obtenus à cet instant est désigné par No et chaque bloc est désigné par B0n (1 < n < NO). Une évaluation est faite pour chaque B0n pour déterminer s'il faut exécuter ou non une subdivision supplémentaire en blocs. Une comparaison est effectuée entre L(B0n) associé à

B0n et la sommation de L(SB0n(i)) associée à chaque sous-

bloc SBO n(i) (1 < i < 4) obtenu après que Bo n a été subdivisé en quatre parties. La subdivision est permise si

elle est plus petite.

Lors du calcul de la quantité de code - coût de distorsion, un codage de B0n et de B0n(i) est tout d'abord

exécuté dans le codeur 22 effectuant le codage provisoire.

Ensuite dans le décodeur 23, les images locales décodées de Bon et de SBOn(i) sont produites à partir des données codées obtenues à partir du codeur 2 réalisant un codage provisoire. Ensuite la distorsion entre les images locales décodées et l'image originale D(B0n) et D(B0n(i)), sont calculées par la section de calcul de distorsion de codage 24. La section de calcul de la valeur d'évaluation 25 calcule L(B0n) et L(B0n(i)) à partir des quantités de codes R(B0n) et R(B0n(i)) et des distorsions de codage D(BO0n) et

D(BO n(i)) (S40, S41).

La section d'évaluation de subdivision 35 compare L(B0n) et la sommation des quatre sous-blocs de L(B0n(i)) (i = 1, 2, 3, 4) (S42) et subdivise SB0 en quatre parties de SB0n(i) si cette dernière est plus petite (S43). Cela correspond à la 1-ère étape de subdivision. Les blocs subdivisés en SB0n(i) sont désignés, d'une nouvelle manière, par Bin (1<n<N1) et la même évaluation de subdivision est exécutée en rapport avec Bln (S46 à S51). Ensuite le même processus de subdivision est exécuté un nombre prédéterminé de fois. Comme résultat on obtient

l'état subdivisé représenté sur la figure 10 par exemple.

Etant donné que des opérations associées à l'activité ne sont pas utilisées dans cette forme de réalisation, cette forme de réalisation est particulièrement avantageuse si on place de l'importance à la réduction de la quantité d'opérations.

SIXIEME FORME DE REALISATION

Un autre exemple de la section de traitement d'intégration 14 représentée sur la figure 11 de la première forme de réalisation est décrite. La figure 24 est un schéma-bloc interne de la section de traitement d'informations 14 de cette forme de réalisation, dans laquelle le chiffre de référence 37 désigne une section de réglage du paramètre de quantification, le chiffre de référence 38 désigne un paramètre de quantification et le chiffre de référence 39 désigne un codeur réalisant un codage provisoire. Le fonctionnement de la section de traitement d'intégration 14 est fondamentalement identique

à celui représenté sur la figure 12, à l'exception de S19.

La figure 25 est un organigramme illustrant un processus de calcul de la valeur d'évaluation correspondant à S19. Le calcul de la valeur d'évaluation est exécuté au moyen du codeur 39 effectuant un codage provisoire, du codeur 23, de la section de calcul de distorsion de codage

24 et de la section de calcul de la valeur d'évaluation 25.

Tout d'abord, une valeur de paramètre initiale est positionnée dans la section de réglage du paramètre de quantification 37 et est envoyée (S52) au codeur 39 réalisant un codage provisoire. Pendant le codage, une quantification est exécutée en utilisant le paramètre de

quantification réglé.

Le décodeur 23 produit l'image locale décodée de Skn à partir des données codées obtenues de cette manière (S54). Ensuite, la distorsion D(Skn) entre l'image locale décodée et l'image originale est calculée (S55) dans la section de calcul de distorsion de codage 24. La section 25 de calcul de la valeur d'évaluation calcule L(Skn) à partir de la quantité de code R(Skn) et de la distorsion de codage D(Skn) (S56). La valeur de coût obtenue à partir du calcul initial est conservée en tant que Lmin, à la suite de quoi le paramètre de quantification est modifié et le même calcul de coût est exécuté. Etant donné qu'une modification du paramètre de quantification modifie l'équilibre entre la quantité de code et la distorsion, on utilise le paramètre pour lequel la quantité de code - le coût de distorsion est minimum, ce qui conduit à une quantité de code coût de distorsion L(Skn) de la région Sk (S57 à S60). Le reste

est identique à la première forme de réalisation.

Conformément à cette forme de réalisation, on obtient un processus d'intégration cptimum tout en prenant en compte le paramètre de quantification. Le procédé d'inclusion du paramètre de quantification est également applicable au processus de subdivision basé sur la quantité de code - le coût de distorsion décrit dans la cinquième

forme de réalisation.

SEPTIEME FORME DE REALISATION

On va décrire dans cette forme de réalisation un autre exemple de la sixième forme de réalisation. La figure 26 est un schéma-bloc interne de la section de traitement d'intégration 14 de cette forme de réalisation, dans laquelle le chiffre de référence 40 désigne une section de calcul du coût de prédiction, compensée du point de vue déplacement, le chiffre de référence 41 désigne un coût de prédiction compensé du point de vue déplacement et le chiffre de référence 42 désigne un codeur réalisant un

codage provisoire.

Le codeur 42 réalisant un codage provisoire utilise un codage basé sur une prédiction, compensée du point de vue déplacement, pour déterminer le paramètre de déplacement. A cet instant, on utilise le coût de prédiction compensé du point de vue déplacement (formule 2) décrit dans la première forme de réalisation. En d'autres termes, la détermination du paramètre de déplacement pendant un codage temporaire est exécutée de telle sorte que le coût est réduit par l'établissement d'un équilibre entre la distorsion de mise en correspondance, basée sur une compensation du déplacement, et la quantité de code du paramètre de déplacement. Concrètement, lors du codage réalisé par le codeur 42 réalisant un codage provisoire, le paramètre de déplacement est déterminé à partir de la valeur du coût qui est calculée par la section 40 de calcul du coût de prédiction, compensée du point de vue déplacement. Le reste du processus est similaire à celui de

la sixième forme de réalisation.

Conformément à cette forme de réalisation, pour une valeur À constante donnée, la forme de réalisation peut être déterminée tout en réduisant la quantité de code selon le coût de distorsion global depuis la compensation de déplacement jusqu'au codage. Il en résulte que la distorsion de codage basée sur une quantité prédéterminée

de code peut être réduite.

HUITIEME FORME DE REALISATION

* Dans cette forme de réalisation, un appareil de décodage d'images mobiles est décrit pour le décodage de flux binaires codés, qui sont produits par différents appareils de codage d'images mobiles. La figure 27 représente une configuration de l'appareil de décodage, dans lequel le chiffre de référence 43 désigne un analyseur du flux binaire, le chiffre de référence 44 désigne un décodeur de mise en forme de régions, le chiffre de référence 45 désigne un décodeur d'informations d'attribut, le chiffre de référence 46 désigne un décodeur de données d'image, le chiffre de référence 47 désigne un décodeur de l'information de déplacement, le chiffre de référence 48 désigne un paramètre de déplacement, le chiffre de référence 49 désigne une section de compensation de déplacement, le chiffre de référence 50 désigne une image de prédiction, le chiffre de référence 51 désigne un décodeur d'images, le chiffre de référence 52 désigne une mémoire externe et le chiffre de référence 53 désigne une

image reproduite.

Cet appareil de décodage décode les flux binaires codés constitués par une information de formes de régions représentant un état subdivisé en régions associé à une image complète ou à une image partielle dans une image complète (désignées ci-après par "images complètes et analogues"), des données d'image pour des régions codées au moyen d'un procédé prédéterminé, une information d'attribut de régions et une information de déplacement de régions; rétablit des images de régions; et reproduit des images

complètes et analogues.

Pour cette forme de réalisation, le procédé de

description pour une information de formes de régions

diffère de procédés classiques généraux en ce que des régions de forme non rectangulaire sont produites dans le

processus de codage. Le procédé de description utilisé dans

cette forme de réalisation est basé sur i) des coordonnées explicites de sommets de chaque région; ii) un processus explicite de codage lorsque des régions sont séparées ou intégrées, ou analogues. Dans le procédé ii) par exemple le nombre des régions séparées lors de la 1-ère étape de subdivision et

le nombre de régions intégrées dans la j-ème étape d'inté-

gration pour des i et j quelconques sont marquées. Comme dans l'appareil de codage, l'étape de subdivision d'ordre 0 est tout d'abord exécutée conformément à la figure 8 dans l'appareil de décodage, à la suite de quoi l'état subdivisé final peut être rétabli au moyen d'un suivi de la même procédure que dans l'appareil de codage. Dans le procédé selon ii), la quantité de données est en général faible par

rapport au procédé de notation directe et de coordonnées.

La figure 28 est un organigramme représentant un fonctionnement de cet appareil de décodage. Le flux binaire 11 est tout d'abord introduit par un analyseur de flux binaire 43, dans lequel le flux binaire est converti en des données codées (S61). Parmi les données codées, l'information sur la forme des régions est décodée dans le décodeur de formes de régions 44, et l'état subdivisé en régions est rétabli (S62) pour des images complètes et

analogues, en utilisant le procédé mentionné précédemment.

En rétablissant la région, la séquence codée de l'information de région codée en des flux binaires suivants

est identifiée. Les régions sont désignées par Sn.

Ensuite, les données de régions sont décodées en séquences à partir du flux binaire conformément à la séquence codée. Tout d'abord, l'information d'attribut pour la région Sn est décodée par le décodeur d'informations d'attribut 45, et l'information de mode de codage pour la région est décodé (S63). Si le mode actuel est un mode inter-image (mode de codage inter-image), c'est-à-dire un mode dans lequel le signal d'erreur de prédiction est codé (S64), le paramètre de déplacement 48 est décodé par le décodeur d'information de déplacement 47 (S65). le paramètre de déplacement 48 est envoyé à la section 49 de compensation de déplacement et, sur la base de ceci, la section 49 de compensation du déplacement calcule une adresse de mémoire correspondant à l'image de prédiction parmi des images de référence mémorisées dans une mémoire externe 52, et extrait l'image de prédiction 50 de la mémoire externe 52 (S66). Ensuite, les données d'image pour la région Sn sont décodées dans le décodeur de données d'image 46 (S67). Dans le cas du mode inter-image, les données d'image décodées et l'image de prédiction 50 sont ajoutées pour obtenir l'image finale reproduite pour la

région Sn.

D'autre part, dans le cas du mode intérieur d'une image complète (mode de codage à l'intérieur d'une image complète), les données d'image décodées deviennent

directement l'image finale reproduite 53 pour la région Sn.

L'image reproduite est utilisée étant donné que l'image de référence pour la production ultérieure de l'image de

prédiction est ainsi écrite dans la mémoire externe 52.

Cette évaluation et ce rétablissement de l'image reproduite

sont exécutés dans le décodeur d'images 51 (S68).

La série de processus se termine lorsque les processus ont été exécutés pour toutes les régions incluses dans des images complètes et analogues. Des processus similaires peuvent être également exécutés pour d'autres

images complètes suivantes et analogues.

Bien que l'on ait décrit ici ce que l'on considère actuellement comme étant des formes de réalisation préférées de l'invention, on comprendra que

différentes modifications peuvent y être apportées.

Claims

REVEND I CATIONS

1. Procédé de codage d'images mobiles, caractérisé en ce qu'il comprend les étapes consistant à: subdiviser une image d'entrée en une pluralité de régions ($2) sur la base d'un critère prédéterminé d'éva- luation de subdivision; intégrer des régions avec des régions adjacentes (S3), pour l'ensemble des différentes régions séparées, sur

la base d'un critère prédéterminé d'évaluation d'inté-

gration; et coder des signaux d'image pour des régions qui

subsistent après l'intégration (S4,S5).

2. Procédé selon la revendication 1, caractérisé en ce que ledit critère d'évaluation de subdivision implique une comparaison entre l'exécution du codage avec une région donnée séparée et l'exécution du codage sans la

région séparée.

3. Procédé selon l'une des revendications i ou 2,

caractérisé en ce que ledit critère d'évaluation d'intégration implique une comparaison entre l'exécution d'un codage avec une région donnée composée avec des régions adjacentes et l'exécution du codage sans la région

composée avec les régions adjacentes.

4. Appareil de codage d'images mobiles, caractérisé en ce qu'il comporte: une section (2) de subdivision en régions, qui inclut une section de traitement de subdivision (12) pour subdiviser une image d'entrée en une pluralité de régions sur la base d'un critère prédéterminé d'évaluation de subdivision et une section de traitement d'intégration (14) pour intégrer chacune d'une pluralité de régions séparées par la section de traitement de subdivision, avec des régions adjacentes; et un codeur (7) pour coder des signaux d'image pour chacune des régions qui subsistent après l'intégration au

moyen de la section de traitement d'intégration (14).

5. Appareil selon la revendication 4, caractérisé en ce que ladite section de traitement d'intégration (14) comprend: un codeur provisoire (22) effectuant un codage provisoire pour coder de façon préliminaire une image pour chaque région et calculer la quantité de code de cette image; un décodeur (23) pour décoder l'image codée au moyen du code en effectuant un codage provisoire; une section (24) de calcul de distorsion de codage pour calculer la distorsion de codage en utilisant l'image décodée par le décodeur; et

une section (25) de calcul d'une valeur d'évalua-

tion pour calculer une valeur d'évaluation pour évaluer l'avantage du codage lorsqu'on prend en compte à la fois la quantité de code et la distorsion de codage; une détermination étant effectuée pour chaque région pour savoir s'il faut effectuer ou non l'intégration pour la région sur la base d'un résultat de comparaison de la valeur d'évaluation, qui est obtenue dans le cas o la région est intégrée avec des régions adjacentes, et la valeur d'évaluation qui est obtenue dans le cas o la

région n'est pas intégrée avec des régions adjacentes.

6. Appareil selon l'une des revendications 4 ou

, caractérisé en ce que ladite section de traitement de subdivision (12) comprend: une section de calcul d'activité (16) pour calculer une puissance d'erreur de prédiction accompagnant une prédiction, compensée du point de vue déplacement, de chaque région en tant qu'activité de la région; et une section d'évaluation de subdivision (18) pour comparer l'activité calculée à une valeur formant critère, qui a été fixée par avance; et subdivise en outre des régions ayant une activité supérieure à la valeur de critère, en des régions plus petites.

7. Appareil selon l'une des revendications 4 ou

, caractérisé en ce que ladite section de traitement de subdivision (12) comprend: une section de calcul d'activité (16) pour calculer une intensité de bord d'un signal original pour chaque région en tant qu'activité de la région; et une section d'évaluation de subdivision (18) pour calculer l'activité calculée à une valeur de critère qui a été fixée par avance; et subdivise en outre des régions ayant une activité supérieure à la valeur de critère en des régions plus petites.

8. Appareil selon l'une des revendications 4 ou

, caractérisé en ce que ladite section de traitement de subdivision (12) comprend: une section de calcul d'activité (16) pour calculer, pour chaque région, une somme linéaire d'une pluralité de valeurs numériques indiquant les caractéristiques de l'image de la région; et une section d'évaluation de subdivision (18) pour comparer l'activité calculée à une valeur de critère qui a été fixée par avance; et subdivise en outre des régions ayant une activité supérieure à la valeur de critère en des régions plus petites.

9. Appareil selon la revendication 8, caractérisé en ce que ladite pluralité de valeurs numériques comprend une puissance d'erreur de prédiction et un paramètre de déplacement de chaque région, qui accompagnent une

prédiction compensée du point de vue déplacement.

10. Appareil selon la revendication 8, caractérisé en ce que ladite pluralité de valeurs numériques comprend une quantité de code d'un paramètre de déplacement de chaque région, une puissance d'erreur de prédiction qui accompagne une compensation de déplacement, une valeur de dispersion d'un signal original, une intensité de bord et une amplitude du paramètre de déplacement de chaque région.

11. Appareil selon l'une quelconque des

revendications 6 à 10, caractérisé en ce que ladite section

de traitement de subdivision (12) comprend en outre une section d'identification de classes (29) et évalue s'il faut ou non subdiviser chaque région sur la base à la fois

de ladite activité et de ladite classe.

12. Appareil selon la revendication 11, caractérisé en ce que ladite section d'identification de classes (29) observe une structure d'objet recouvrant une

pluralité de régions et fixe des classes pour les régions.

13. Appareil selon la revendication 12, caractérisé en ce que ladite structure d'objet est évaluée sur la base d'une dispersion, dans le signal original, de la région, de l'intensité de bord et du degré de

raccordement du bord à des régions adjacentes.

14. Appareil selon la revendication 11, caractérisé en ce que ladite section d'identification de classes (29) observe des caractéristiques d'une image, effectue une détection d'objets et, sur la base des résultats de cette observation et de cette détection, fixe

des classes pour la région.

15. Appareil selon la revendication 14, caractérisé en ce que ladite section d'identification de classes (29) mémorise par avance, pour chaque objet prédit comme devant être inclus dans l'image, des caractéristiques de l'image incluant l'objet, et détermine la classe de chaque région sur la base du degré de coïncidence entre les caractéristiques de l'image de chaque région et les

caractéristiques mémorisees de l'objet.

16. Appareil selon l'une des revendications 4 ou

, caractérisé en ce que ladite section de traitement de subdivision (12) comprend: un codeur provisoire (22) effectuant un codage provisoire pour coder de façon préliminaire l'image pour chaque région et calculer la quantité de code de cette région; un décodeur (23) pour décoder l'image codée au moyen du codeur provisoire; une section (24) de calcul de distorsion de codage pour calculer la distorsion de codage en utilisant l'image décodée par le décodeur; et

une section (25) de calcul d'une valeur d'évalua-

régions plus petites.

17. Appareil selon l'une des revendications 5 ou

16, caractérisé en ce qu'un paramètre de quantification d'un signal d'erreur de prédiction accompagnant une prédiction, compensée du point de vue déplacement, est réglé d'une manière variable dans ledit codeur (22) réalisant un codage provisoire, et ladite section (25) de calcul de la valeur d'évaluation calcule la valeur d'évaluation tout en modifiant le paramètre de quantification.

18. Appareil selon l'une des revendications 5 ou

16, caractérisé en ce qu'une section (40) de calcul de la valeur d'évaluation servant à obtenir, en tant que valeur d'évaluation, une somme linéaire de la puissance d'erreur de prédiction et de la quantité de code du paramètre de déplacement de chaque région accompagnant la prédiction, compensée du point de vue du déplacement, est disposée dans un étage en amont de celui dudit codeur (22) effectuant un codage provisoire, et ledit codeur effectuant un codage provisoire détecte le paramètre de déplacement sur la base

de la valeur d'évaluation.

19. Appareil pour produire et décoder des données codées d'une image qui a été codée après avoir été subdivisée en une pluralité de régions, caractérisé en ce qu'il comporte: une section (44) de régénération de la forme de la région, servant à régénérer, sur la base d'une information de la forme de région contenue dans les données codées, la forme de chaque région qui a été séparée pendant le codage; et un décodeur de données d'image (51) pour décoder l'image de chaque région à partir de données codées

correspondant à sa région.

20. Appareil selon la revendication 19, caractérisé en ce que ladite information concernant la forme de la région inclut une information se rapportant au traitement lorsque des régions sont séparées et intégrees pendant le codage et, sur la base de cette information, ladite section (44) de rétablissement de la forme de la région identifie l'état séparé de régions par reproduction

du même processus que celui de l'appareil de codage.

21. Procédé de codage d'images mobiles, caractérisé en ce qu'il comprend les étapes consistant à: intégrer des régions préalablement séparées, avec des régions adjacentes sur la base d'un critère prédéterminé d'évaluation d'intégration; et coder des signaux d'image pour des régions qui

subsistent après l'intégration.

22. Appareil de codage d'images mobiles, caractérisé en ce qu'il comporte: une section de traitement d'intégration pour intégrer chacune d'une pluralité de régions préalablement séparées, avec des régions adjacentes, et un codeur pour coder des signaux d'image pour chacune des régions qui subsistent après l'intégration par

la section de traitement d'intégration.