WO2010072983A2

WO2010072983A2 - Procede d'encodage par segmentation d'une image

Info

Publication number: WO2010072983A2
Application number: PCT/FR2009/052681
Authority: WO
Inventors: Jean-Pierre Morard; Olivier Pietquin; Stéphane VIALLE
Original assignee: Sagem Communications Sas
Priority date: 2008-12-23
Filing date: 2009-12-23
Publication date: 2010-07-01
Also published as: US8630500B2; EP2380352A2; BRPI0923548A2; US20110262051A1; WO2010072983A3; FR2940577B1; FR2940577A1; CN102308582A; EP2380352B1; CN102308582B

Abstract

Dans l'invention, on propose un procédé d'encodage d'une image, le dit encodage étant de type encodage mixte avec la possibilité d'utiliser un premier type de compression sans perte (100), et un deuxième type de compression avec perte (101), ledit procédé comportant l'opération consistant à diviser l'image en une pluralité de blocs élémentaires (201); caractérisé en ce que ledit procédé comporte les différentes étapes supplémentaires consistant à : déterminer les blocs élémentaires (302; 303) présentant un niveau de détail important; attribuer, à chaque bloc élémentaire (302;303) présentant un niveau de détail important, le premier type de compression; attribuer, à chaque bloc élémentaire (301) ne présentant pas un niveau de détail important, le deuxième type de compression.

Description

Procédé d'encodage par segmentation d'une image.

DOMAINE TECHNIQUE DE L'INVENTION

La présente invention a pour objet un procédé d'encodage par segmentation d'une image vidéo. L'invention a notamment pour but d'améliorer la qualité de rendu d'une image ayant préalablement fait l'objet d'une opération de compression afin de limiter le débit d'informations nécessaire pour le stockage et/ou la transmission des informations relatives à l'image considérée une fois encodée. L'opération d'encodage selon l'invention est réalisée notamment en assurant la possibilité d'une restitution d'un maximum de détails pour des zones de l'image correspondant à des zones dites d'IHM (Interface Homme-Machine) par rapport à d'autres zones de l'image considérée correspondant à des zones de photos, de vidéo....

Le domaine de l'invention est, d'une façon générale, celui de la compression des images vidéo. A titre d'exemple, sans que cela soit limitatif de la portée de l'objet de l'invention, le domaine de l'invention sera plus particulièrement détaillé dans un contexte faisant essentiellement intervenir la norme de compression dite H264, sans que cet aspect soit limitatif quant à la portée de l'invention. En effet, d'autres normes de compression, par exemple du type VC1 ou DivX, même si elles sont moins avantageuses dans certains contextes, peuvent être utilisées dans la mise en œuvre du procédé selon l'invention.

Les différentes normes de codage vidéo s'appuient toutes sur des mêmes grands principes. D'une part elles s'appuient sur la redondance d'informations temporelles, ou spatiale, afin de réduire la quantité d'informations, sans nécessairement introduire de pertes. D'autre part, certaines informations, ou détails, sont supprimés, ce qui introduit des pertes dans l'image restaurée, lesdites pertes étant généralement ciblées par rapport aux propriétés de la psycho-vision. En effet, certains détails des images ne sont pas ou peu perçus par l'œil et peuvent donc être omis. On obtient alors un flux vidéo compressé. Les principales étapes de la compression vidéo sont ainsi les suivantes :

- Codage de l'image à encoder en luminance-chrominance ;

- Division de l'image en macro-blocs, ou blocs élémentaires, uqi sont des régions rectangulaires qui ont une taille comprise entre 4M et 16^*16 pixels ; Estimation de mouvements ;

- Compensation de mouvements ;

- Transformée fréquentielle : On applique une DCT (Transformée en cosinus discret ) sur chaque bloc élémentaire. Une telle transformée permet d'obtenir une représentation fréquentielle de l'image.

- Quantification ; les données issues de la DCT sont quantifiées en étant codées sur un nombre limité de bits. C'est ici qu'intervient la perte d'informations.

- Codage entropique. Dans un tel codage, plus une valeur donnée apparait souvent, plus elle va être codée sur un petit nombre de bits.

Le contexte dans lequel sera décrit la présente invention sera celui de la mise en place d'applications de type média center, qui consiste en l'utilisation, de façon distante, d'un ordinateur dans un domicile en différents points dudit domicile, afin de disposer de divers services qui peuvent être utilisés au travers de postes clients, par exemple un décodeur de télévision numérique, répartis dans l'habitat. A cet effet, il est nécessaire de transférer différentes informations, et notamment des images vidéo, au travers du réseau constitué par l'ordinateur, les clients et les liaisons les reliant ; la compression des images est ainsi une nécessité pour assurer un bon fonctionnement de l'application de type média center distribuée sur un réseau. ARRIERE-PLAN TECHNOLOGIQUE DE L'INVENTION

La norme H264 prévoit deux types de compression, illustrés à la figure 1. Un premier type de compression 100, dit mode de compression sans perte, ou compression lossless, permet d'obtenir, à partir d'une image originale 103, une image restaurée 104 après une phase de compression 105 qui n'induit aucune perte dans l'image restaurée 104. Un deuxième type de compression 101 , dit mode de compression avec perte, ou compression lossy, permet d'obtenir, à partir d'une image originale 106, une image restaurée 107 après une phase de compression 108 qui induit une perte d'informations dans l'image restaurée 107 par rapport à l'image originale 106, perte d'informations qui se traduit par une diminution de la qualité de l'image, notamment en terme de netteté.

La norme H264 est privilégiée pour la transmission de vidéo à travers le réseau créé. Mais cette norme est, comme expliqué précédemment, susceptible de produire des pertes d'informations lors des opérations de compression intervenant lors de l'encodage des données vidéo notamment. A la base, ces pertes sont sensées ne pas être réellement discernables par l'œil humain ; c'était le cas notamment lorsque les données vidéo à encoder et à transmettre étaient uniquement du type photos ou images d'émission de télévision, par exemple. Cependant, dans certains cas, les défauts introduits par ces pertes d'informations peuvent devenir très visibles. C'est le cas en particulier lorsque l'on a des images telles que les boutons, les menus, ou tout autre élément contenant du texte et beaucoup de détails.

D'une façon plus générale, lorsque l'on compresse une image pour gagner du temps dans une transmission ou de l'espace de stockage, un certain taux de perte est consenti afin d'obtenir un meilleur taux de compression. Or ces pertes, qui ne posent pas de problèmes pour la visualisation de vidéo, sont un inconvénient pour le rendu d'images de type IHM graphique. En effet, le rendu d'IHM doit être plus particulièrement soigné car l'image est très souvent statique ou légèrement animée, et les défauts y sont perceptibles. D'autre part, lorsqu'un utilisateur final passe d'un poste de type PC à une application sur le téléviseur, son appréciation, à contenu identique, est plus critique.

DESCRIPTION GENERALE DE L'INVENTION

Le procédé selon l'invention propose une solution aux problèmes et inconvénients qui viennent d'être exposés. Dans l'invention, on propose une solution pour améliorer la qualité du rendu de l'image à restituer. A cet effet, dans l'invention, on cherche notamment à distinguer des zones de l'image correspondant à des IHM, dont la qualité de restitution doit être optimisée, et des zones de l'image correspondant à du contenu de type photo, vidéo, images..., pour lesquelles une compression avec perte peut être acceptée.

En fonction de la nature des zones distinguées, on applique alors soit un mode de compression sans perte, soit un mode de compression avec perte.

L'invention concerne donc essentiellement un procédé d'encodage d'une image, le dit encodage étant de type encodage mixte avec la possibilité d'utiliser un premier type de compression sans perte, et un deuxième type de compression avec perte, ledit procédé comportant l'opération consistant à diviser l'image en une pluralité de blocs élémentaires ; caractérisé en ce que ledit procédé comporte les différentes étapes supplémentaires consistant à :

- déterminer les blocs élémentaires présentant un niveau de détail important ;

- attribuer, à chaque bloc élémentaire présentant un niveau de détail important, le premier type de compression; - attribuer, à chaque bloc élémentaire ne présentant pas un niveau de détail important, le deuxième type de compression.

Le procédé selon l'invention peut comporter, en plus des étapes principales qui viennent d'être mentionnées dans le paragraphe précédent, une ou plusieurs caractéristiques supplémentaires parmi les suivantes: - l'étape consistant à déterminer les blocs élémentaires présentant un niveau de détail important comporte les différentes opérations consistant à, pour chaque bloc élémentaire considéré :

- réaliser un filtrage spatial pour obtenir une représentation fréquentielle ;

- mesurer un taux de composantes hautes fréquences de la représentation fréquentielle ;

- si le taux de composantes hautes fréquences est supérieur à un seuil préalablement déterminé, alors identifier le bloc élémentaire considéré comme un bloc élémentaire présentant un niveau de détail important ;

- les différentes opérations de l'étape consistant à déterminer les blocs élémentaires présentant un niveau de détail important sont réalisées pour chacun des plans couleurs de l'image considérée, le bloc élémentaire considéré étant identifié comme un bloc élémentaire présentant un niveau de détail important si, pour un des plans couleur considéré, le taux de composantes hautes fréquences est supérieur à un seuil spécifique préalablement déterminé, chaque plan couleur étant associé à un seuil spécifique ;

- les seuils spécifiques de chaque plan couleur ont la même valeur ;

- le procédé comporte les étapes supplémentaires consistant à :

- appliquer le premier type de compression à chaque bloc élémentaire auquel ledit premier type de compression a été attribué ; - appliquer le premier type de compression à tout bloc élémentaire directement encadré par deux blocs élémentaires auxquels le premier type de compression a été attribué ; par l'expression "directement encadré", on désigne le fait que le bloc élémentaire considéré est adjacent à au moins deux bloc élémentaires de type lossless, les deux blocs élémentaires étant situé soit à gauche et à droite du bloc élémentaire considéré, soit au-dessus et au-dessous du bloc élémentaire considéré ;

- le procédé comporte l'étape supplémentaire consistant à appliquer le premier type de compression à tout bloc élémentaire de type bloc élémentaire homogène ;

- l'encodage est du type encodage H264.

Les différentes caractéristiques supplémentaires du procédé selon l'invention, dans la mesure où elles ne s'excluent pas mutuellement, sont combinées selon toutes les possibilités d'association pour aboutir à différents exemples de mise en œuvre de l'invention.

L'invention et ses différentes applications seront mieux comprises à la lecture de la description qui suit et à l'examen des figures qui l'accompagnent.

BREVE DESCRIPTION DES FIGURES

Celles-ci ne sont présentées qu'à titre indicatif et nullement limitatif de l'invention.

- la figure 1 , déjà décrite, illustre schématiquement le fonctionnement de deux modes de compression différents ; - la figure 2 illustre schématiquement le procédé d'encodage selon l'invention ;

- la figure 3 illustre un exemple de mise en œuvre du procédé selon l'invention dans lequel certains blocs élémentaires de l'image à compresser sont compressés selon un mode de compression sans perte après la mise en place de critères particuliers de détermination du mode de compression ;

- la figure 4 illustre un exemple d'image ayant subi un encodage par un exemple de mise en œuvre du procédé selon l'invention.

DESCRIPTION DES FORMES DE REALISATION PREFEREES DE L'INVENTION Les éléments apparaissant sur différentes figures auront conservé, sauf précision contraire, les mêmes références.

Dans l'invention, on cherche à segmenter une image à encoder en utilisant des critères particuliers pour déterminer si chaque bloc élémentaire considéré doit être encodé selon une mode de compression lossless ou selon un mode de compression lossy. Les critères définis visent à permettre de distinguer les éléments de I¹IHM (boutons, menus, etc..) du reste de l'image. Un critère essentiel réside dans la présence massive ou non de textes dans chaque bloc élémentaire considéré.

Dans l'invention, on propose, dans un premier temps, d'analyser le contenu spectral de chaque bloc élémentaire ; une telle démarche est justifiée par le fait que les éléments de texte, dans une image, se caractérisent par le nombre important de transitions brusques en luminosité et/ou chrominance. Ainsi, dans l'invention, on propose de mesurer le taux des composantes hautes fréquences présentes dans chaque bloc élémentaire, et ceci pour chacune des trois composantes couleur de l'image considérée. Si l'amplitude des composantes fréquentielles situées au-delà d'une certaine fréquence dépasse un seuil donné, le bloc élémentaire considéré est marqué comme une zone lossless.

La figure 2 illustre un tel principe. Sur cette figure, un bloc élémentaire 201 contenant un élément graphique de type bouton 202 est représenté. Le bloc élémentaire subit dans un premier temps un filtrage 203, équivalent à une détection de contour. Il s'agit d'un filtrage passe haut permettant d'obtenir un bloc élémentaire haute fréquence 204. Un tel filtrage amplifie les variations brutales de l'image contenue dans le bloc élémentaire considéré, et atténue les parties lisses, sans détails, de l'image de départ. On retrouve ainsi, dans le bloc élémentaire haute fréquence, une quantité importante de pixels très lumineux aux endroits où il y a du texte, ou beaucoup de détails.

L'image haute fréquence 204 peut être obtenue par un filtre différenciateur tel que le Laplacien Dans un deuxième temps, une opération de seuillage 205 est réalisée afin de déterminer si la compression du bloc élémentaire doit être du type lossless ou lossy. Ainsi, une fois que l'image haute fréquence a été calculée pour le bloc élémentaire considérée, il est nécessaire de marquer ledit bloc élémentaire comme lossless ou lossy. On prévoit ainsi, par exemple, les différentes étapes suivantes : - Une étape de seuillage appliquée sur l'image haute fréquence, où on affecte la valeur "1 " à un pixel dont la valeur fréquentielle est supérieure à un seuil préalablement déterminé, avantageusement empiriquement ;

- Une étape de comptage dans laquelle on compte le nombre de pixels, dans le bloc élémentaire considéré, qui se sont vus affecter la valeur

1 dans l'étape précédente ;

- Une étape de décision : si le nombre obtenu lors de la précédente étape est supérieur à une valeur donnée, déterminée par exemple empiriquement, alors le bloc élémentaire considéré est marqué comme lossless. Dans le cas contraire, le bloc élémentaire considéré est marqué comme lossy.

Comme montré à la figure 3, on obtient ainsi, pour une image 300 composée, à titre d'exemple, de 16 blocs élémentaires, une pluralité de blocs élémentaires marqués lossless, représentés en hachurés, les autres blocs élémentaires étant marqués lossy, représentés non hachurés.

Selon un premier mode avantageux de mise en œuvre de l'invention, on prévoit, si un bloc élémentaire 301 qui, à l'issue de l'opération de seuillage 205 est marqué lossy, mais est encadré par un premier bloc élémentaire 302 marqué lossless et par un deuxième bloc élémentaire 303 marqué également lossless, de finalement marquer le bloc élémentaire 301 considéré comme lossless. Il fera donc l'objet d'une compression sans perte. Une telle opération améliore le rendu de l'image qui sera ultérieurement restaurée, en évitant des transitions trop nombreuses entre les blocs élémentaires compressés sans perte et les blocs élémentaires compressés avec perte.

Selon un autre mode avantageux de mise en œuvre du procédé selon l'invention, les blocs élémentaires homogènes qui ont, à l'issue de l'opération de seuillage 205, été marquées lossy, sont transformés en blocs élémentaires marqués lossless. Par bloc élémentaire homogène, également appelé zone plate, on désigne des zones de gradient nul : de telles zones sont caractérisées, pour les trois composantes de couleur considérées, par une dérivée vectorielle nulle selon deux axes perpendiculaires de l'image considérée.

Un tel mode de mise en œuvre permet également d'améliorer le rendu de l'image restaurée, les zones de texte, qui sont donc encodées en lossless étant très souvent directement entourées par des zones plates. Ce mode de mise en œuvre n'est par ailleurs pas pénalisant en terme de bande passante requise, les blocs élémentaires homogènes, même encodés en lossless, La figure 4 montre une image 402, composée d'une première fenêtre

400 et d'une deuxième fenêtre 401. Des blocs élémentaires 403 ayant subi une compression sans perte, représentés en hachuré, et des blocs élémentaires 404 ayant subi une compression avec perte, représentés non hachurés, sont illustrés sur cette figure. L'image 402 a subi le procédé d'encodage selon l'invention, avec l'application de la mise en œuvre du premier mode avantageux qui vient d'être décrit. Ainsi, on ne trouve aucun bloc élémentaire lossy disposé directement entre deux blocs élémentaires lossless.

Claims

REVENDICATIONS

1 - Procédé d'encodage d'une image, le dit encodage étant de type encodage mixte avec la possibilité d'utiliser un premier type de compression sans perte (100), et un deuxième type de compression avec perte (101 ), ledit procédé comportant l'opération consistant à diviser l'image en une pluralité de blocs élémentaires (201 ) ; caractérisé en ce que ledit procédé comporte les différentes étapes supplémentaires consistant à : - déterminer les blocs élémentaires (302 ; 303) présentant un niveau de détail important ;

- attribuer, à chaque bloc élémentaire (302 ; 303) présentant un niveau de détail important, le premier type de compression;

- attribuer, à chaque bloc élémentaire (301 ) ne présentant pas un niveau de détail important, le deuxième type de compression ;

- appliquer le premier type de compression (100) à chaque bloc élémentaire auquel ledit premier type de compression a été attribué ;

- appliquer le premier type de compression à tout bloc élémentaire (301 ) directement encadré par deux blocs élémentaires auxquels le premier type de compression a été attribué.

2- Procédé d'encodage selon la revendication précédente caractérisé en ce que l'étape consistant à déterminer les blocs élémentaires présentant un niveau de détail important comporte les différentes opérations consistant à, pour chaque bloc élémentaire considéré : - réaliser un filtrage spatial (203) pour obtenir une représentation fréquentielle ;

- mesurer (205) un taux de composantes hautes fréquences de la représentation fréquentielle ;

- si le taux de composantes hautes fréquences est supérieur à un seuil préalablement déterminé, alors identifier le bloc élémentaire considéré comme un bloc élémentaire présentant un niveau de détail important.

3- Procédé d'encodage selon la revendication précédente caractérisé en ce que les différentes opérations de l'étape consistant à déterminer les blocs élémentaires présentant un niveau de détail important sont réalisées pour chacun des plans couleurs de l'image considérée, le bloc élémentaire considéré étant identifié comme un bloc élémentaire présentant un niveau de détail important si, pour un des plans couleur considéré, le taux de composantes hautes fréquences est supérieur à un seuil spécifique préalablement déterminé, chaque plan couleur étant associé à un seuil spécifique.

4- Procédé selon la revendication précédente caractérisé en ce que les seuils spécifiques de chaque plan couleur ont la même valeur.

5- Procédé selon l'une au moins des revendications précédentes caractérisé en ce qu'il comporte l'étape supplémentaire consistant à : - appliquer le premier type de compression à tout bloc élémentaire de type bloc élémentaire homogène.

6- Procédé selon l'une au moins des revendications précédentes caractérisé en ce que l'encodage est du type encodage H264.