BE1022166B1

BE1022166B1 - Procede de compression d'images

Info

Publication number: BE1022166B1
Application number: BE2014/5148A
Authority: BE
Inventors: Michel Dauw; Muelenaere Pierre De
Original assignee: I.R.I.S.
Priority date: 2014-12-23
Filing date: 2014-12-23
Publication date: 2016-02-23

Abstract

Procédé permettant de créer, à partir d'une image numérique, une couche d'avant-plan à utiliser dans la compression d'images telle que MRC (Mixed Raster Content). Un masque est tout d'abord déterminé. Chaque pixel du masque correspond à une fenêtre de mise à l'échelle dans l'image numérique. Les pixels noirs dans le masque correspondent à des éléments d'avant-plan et les pixels blancs dans le masque correspondent à des éléments d'arrière-plan. Puis, une image de transition est déterminée dans laquelle des pixels blancs dans le masque obtiennent une valeur vide et des pixels noirs dans le masque obtiennent une valeur déterminée à partir des couleurs des pixels dans une fenêtre de moyennage, ladite fenêtre de moyennage d'un pixel comprenant plus de pixels que la fenêtre de mise à l'échelle dudit pixel.

Description

« Procédé de compression d'images »

Domaine de l'invention . L'invention concerne un procédé de compression d'images. De manière spécifique, l'invention concerne un procédé permettant de créer à partir d'une image numérique une couche d'avant-plan à utiliser dans la compression d'images.

Art antérieur de l'invention

La compression d'images (impression, numérisation par balayage, binarisation) modifie les couleurs d'une image, en particulier le bord d'éléments comme des caractères où le contraste entre pixels adjacents est élevé. Cette modification introduit une certaine inhomogénéité dans les éléments colorés de l'image, ce qui a pour résultat une certaine inhomogénéité de la couche d'avant-plan utilisée dans la compression MRC. Le fait que la compression MRC, telle que décrite par exemple dans US2012/0093412A1, ne peut pas fournir un taux de compression aussi élevé pour une couche d'avant-plan inhomogène que pour une couche d’avant-plan homogène constitue un problème. '

Le fait qu'une détérioration de l'homogénéité de la couche d'avant-plan induit une détérioration de la lisibilité de l'image après compression constitue un autre problème. Résumé de l'invention

Par conséquent, un but de la présente invention est de fournir un procédé permettant de créer une image d’avant-plan de bonne homogénéité à utiliser dans la compression d’images.

Un autre but de la présente invention est un procédé de compression faisant appel à une image d'avant-plan de bonne homogénéité.

Un autre but de la présente invention est un support non temporaire lisible par l'ordinateur stockant un programme amenant un ordinateur à exécuter un procédé permettant de créer une couche d'avant-plan de bonne homogénéité à utiliser dans la compression d'images.

Un autre but de la présente invention est un système comprenant un processeur et un support non temporaire lisible par l'ordinateur stockant un programme amenant un ordinateur à exécuter un procédé permettant de créer une couche d'avant-plan de bonne homogénéité à utiliser dans la compression d'images.

Ce but est atteint selon des modes de réalisation de l’invention.

Selon un aspect de la présente invention, il est prévu un procédé permettant de créer, à partir d'une image numérique initiale, une image d'avant-plan à utiliser dans la compression d'images, comprenant les étapes de al création d'une image de masque binaire à partir de l'image numérique initiale, chaque pixel de l’image de masque binaire étant créé à partir d’une première fenêtre de pixels correspondante dans l'image numérique initiale, et ladite image de masque binaire comprenant un premier ensemble de pixels qui sont d’une première valeur et un deuxième ensemble de pixels qui sont d'une deuxième valeur; b/ génération d’une image de transition qui a une quantité de pixels égale à la quantité de pixels de l'image de masque binaire en déterminant pour chaque pixel de l'image de transition correspondant à un pixel du premier ensemble de pixels dans l'image de masque binaire une deuxième fenêtre de pixels correspondante dans l'image numérique initiale, la deuxième fenêtre de pixels comprenant plus de pixels que la première fenêtre de pixels; déterminant une couleur pour chaque pixel de l'image de transition correspondant à un pixel du premier ensemble de pixels dans l'image de masque binaire par un calcul basé sur les couleurs des pixels dans la deuxième fenêtre correspondante; et établissant chaque pixel de l'image de transition correspondant à un pixel du deuxième ensemble de pixels dans l'image de masque binaire comme étant vide; et cl création de l’image d'avant-plan à partir de l'image de transition en gardant la couleur des pixels non vides et détermination d'une couleur pour les pixels vides en utilisant les pixels non vides voisins.

Comme la deuxième fenêtre comprend plus de pixels que la première fenêtre, les couleurs déterminées pour des pixels proches sont plus proches que si les couleurs étaient déterminées sur la deuxième fenêtre. Cela induit des couleurs plus similaires sur les pixels de l'image de transition et donc des couleurs plus similaires sur les pixels de la couche d'avant-plan. Cette bonne homogénéité permet une bonne compression et une bonne lisibilité des caractères de texte compressés de cette façon.

Selon un aspect de l'invention, la première fenêtre de pixels comprend un pixel. C'est le cas quand l'image de masque binaire a la même taille que l'image numérique initiale.

Selon un autre aspect de l'invention, la première fenêtre de pixels comprend une fenêtre η x n de pixels, n étant au moins 2. C'est le cas quand l'image de masque binaire a une résolution plus faible que l'image numérique initiale.

Selon un aspect de l'invention, le calcul basé sur les couleurs des pixels dans la deuxième fenêtre correspondante est un moyennage.

Selon un aspect de l'invention, l'emplacement du centre d'un pixel dans l'image de transition correspond a l'emplacement du centre de la deuxième fenêtre de pixels correspondante dans l'image numérique initiale. La deuxième fenêtre indique les pixels de l'image numérique initiale utilisée pour déterminer la couleur des pixels de l'image de transition. Il est par conséquent avantageux que l'emplacement du centre de la deuxième fenêtre corresponde au centre du pixel correspondant de l'image de transition.

Selon un aspect de l'invention, le procédé comprend une étape de réduction de la résolution de l'image de transition entre sa génération et la création de l'image d'avant-plan. Une telle compression peut être avantageuse pour obtenir une compression plus élevée et une résolution plus faible pour l’image d'avant-plan.

Selon un aspect de l'invention, la couleur des pixels vides est déterminée à partir des pixels non vides en utilisant un algorithme séquentiel en deux étapes.

Selon un aspect de l'invention, le procédé comprend l'étape de découpage de l'image numérique initiale en groupes de pixels, la couleur de chaque pixel dans l’image de transition étant déterminée indépendamment pour chaque groupe de pixels. Selon un aspect de l'invention, le procédé comprend l'étape de découpage de l'image de masque binaire en groupes de pixels correspondant aux groupes de pixels dans l'image numérique initiale.

Selon un aspect de l'invention, chaque groupe de pixels dans l'image initiale contient au moins un de: un seul composant connecté, un seul élément textuel, un seul élément lineart ou un seul caractère. Cet aspect de l'invention est particulièrement avantageux quand des éléments (composant connecté, lettres, symboles, lignes pleines, ...) de différentes couleurs sont proches les uns des autres dans l'image numérique initiale. Les éléments sont distribués en groupes de pixels. Cet aspect de l'invention fait que ces couleurs de différents groupes de pixels ne se mélangent pas dans l'image d'avant-plan.

Selon un aspect de l'invention, le procédé comprend les étapes consistant: à détecter si, dans un groupe de pixels dans l'image numérique initiale, les pixels correspondant aux pixels du premier ensemble de pixels de l'image de masque binaire ont des couleurs qui sont nettement différentes, et à déterminer, si les pixels dans l'image numérique initiale n'ont pas des couleurs nettement différentes, la couleur moyenne des pixels dans l'image numérique initiale et à appliquer la couleur moyenne sur chaque pixel dans l'image de transition correspondant au groupe de pixels dans l’image numérique initiale et correspondant aux pixels, dans le premier ensemble de pixels de l'image de masque binaire.

Cet aspect de l'invention est particulièrement avantageux si les pixels dans un élément correspondant à un groupe de pixels sont de couleurs similaires. Dans un tel cas, il est suffisant de calculer une fois la couleur pour le groupe et de donner cette couleur à tous les pixels de l’image de transition correspondant à ce groupe de pixels et qui sont de première valeur, par exemple noire, dans le masque binaire. Ce processus additionnel réduit le nombre d'étapes de calcul du procédé, étant donné que le moyennage n'est effectué qu'une fois par groupe et fournit une homogénéité plus élevée, étant donné que tous les pixels de l’élément dans l'image de transition ont la même couleur. Ce moyennage sur la totalité du groupe n'est toutefois pas utilisé si les pixels du groupe ont des couleurs trop différentes.

Selon un aspect de l'invention, il est prévu un procédé de compression pour compresser une image numérique initiale d'un document numérisé par balayage, ledit procédé de compression comprend l'étape de segmentation de l'image numérique initiale en multiples couches d'image comprenant une image d'avant-plan contenant des informations de couleur pour les éléments d'avant-plan dudit document, une image d'arrière-plan contenant des informations de couleur pour les éléments d'arrière-plan dudit document et une image binaire pour sélectionner entre pixels dans ladite image d'avant-plan et ladite image d'arrière-plan, l'image d'avant-plan étant créée selon l'un quelconque des procédés permettant de créer une image d'avant-plan selon l'invention.

Selon un aspect de l'invention, il est prévu un support non temporaire lisible par ordinateur stockant un programme amenant un ordinateur à exécuter un procédé selon l'un quelconque des procédés permettant de créer une image d'avant-plan selon l'invention. Selon un aspect de l'invention, il est prévu un système comprenant un processeur et un support non temporaire lisible par ordinateur stockant un programme amenant le processeur à exécuter l'un quelconque des procédés permettant de créer une image d'avant-plan selon l'invention. Le procédé de l'invention est avantageusement mis en œuvre par un programme d'ordinateur.

Selon un aspect de l'invention, le système comprend un dispositif d'imagerie pour capturer l'image numérique initiale. Un dispositif d'imagerie peut introduire une inhomogénéité dans l'image numérique initiale, laquelle est au moins en partie compensée dans l'image résultant de la compression par le procédé selon l'invention.

Brève description des figures

Pour une meilleure compréhension de la présente invention, il sera maintenant fait référence, à titre d’exemple uniquement, aux dessins joints dans lesquels:

La figure 1 montre un organigramme d'un procédé de compression d'images.

La figure 2 montre un organigramme d'un procédé de segmentation d’images.

La figure 3 montre un organigramme d'un procédé de construction d'une couche d'avant-plan.

La figure 4 montre un organigramme d'un procédé de construction d'une couche d'avant-plan selon un mode de réalisation de l'invention.

La figure 5 montre un organigramme d'un procédé de détermination d'une image de transition selon un mode de réalisation de l'invention.

La figure 6 illustre un procédé de détermination d'une image de transition selon un mode de réalisation de l'invention.

La figure 7 illustre un procédé de détermination d'une image de transition selon un mode de réalisation de l'invention.

La figure 8 montre un organigramme d’un procédé de détermination d'une image de transition selon un mode de réalisation de l'invention.

La figure 9 illustre un procédé de détermination d'une image de transition selon un mode de réalisation de l'invention.

La figure 10 montre un organigramme d’un procédé de détermination d'une image de transition selon un mode de réalisation de l'invention.

Description de l'invention

La présente invention sera décrite en rapport avec des modes de réalisation particuliers et en référence à certains dessins mais l'invention n'y est toutefois pas limitée. Les dessins décrits ne sont que schématiques et sont non limitatifs. Dans les dessins, la taille de certains des éléments peut être exagérée et non dessinée à l'échelle à des fins illustratives.

En outre, les termes premier, deuxième, troisième et similaire dans la description et dans les revendications sont utilisés pour faire la distinction entre éléments similaires et pas nécessairement pour décrire un ordre séquentiel ou chronologique. Les termes sont interchangeables dans les circonstances appropriées et les modes de réalisation de l'invention peuvent fonctionner dans d'autres séquences que celles décrites ou illustrées dans le présent document.

De plus, les divers modes de réalisation, bien que qualifiés de "préférés", doivent être interprétés comme des façons exemplaires dont l'invention peut être mise en œuvre plutôt que comme limitant la portée de l'invention.

Le terme "comprenant", utilisé dans les revendications, ne doit pas être interprété comme étant limité aux moyens ou étapes énumérés ci-dessous; il n’exclut pas d’autres éléments ou étapes. Il doit être interprété comme spécifiant la présence des éléments, nombres entiers, étapes ou composants cités auxquels il est fait référence mais n'exclut pas la présence ou l'ajout d'un ou plusieurs autres éléments, nombres entiers, étapes ou composants ou groupes de ceux-ci. Donc, la portée de l'expression "un dispositif comprenant A et B" ne devrait pas être limitée à des dispositifs comprenant uniquement les composants A et B, au contraire, en ce qui concerne la présente invention, les seuls composants énumérés du dispositif sont A et B, et la revendication devrait également être interprétée comme incluant des équivalents de ces composants.

Sur les figures, des éléments identiques ou analogues peuvent être désignés par un même numéro. .

Dans ce qui suit, des aspects de l'invention appliqués dans un procédé de compression d’images seront décrits. Il est à noter qu’un grand nombre des étapes ou algorithmes décrits peuvent aussi être utilisés pour d'autres applications, par exemple pour la reconnaissance de texte ou autre. De plus, de nombreuses modifications peuvent être apportées aux étapes et algorithmes décrits sans s’écarter du cadre de l'invention.

Telle qu'utilisée dans le présent document, l'expression "image numérique" est censée se référer à une matrice de pixels où chaque pixel a une valeur qui correspond à sa couleur dans ladite image. Un pixel peut avoir une valeur "vide" qui signifie qu'aucune couleur ne correspond audit pixel dans ladite image. Dans ce qui suit, les mots "valeur" et "couleur" sont équivalents quand ils se réfèrent à un pixel. Les images numériques sont stockées dans des dispositifs de mémoire lisibles par des dispositifs électroniques tels que des ordinateurs.

Tel qu'utilisé dans le présent document, le mot "lineart" se référant à un élément est censé faire référence à des droites ou courbes connectées placées contre un arrière-plan (en général uni), l'élément lineart n'ayant aucune gradation de nuance (noirceur) ou tonalité chromatique (couleur). Un élément noir sur un fond blanc en est un exemple.

Telle qu'utilisée dans le présent document, l'expression "ton continu" se référant à un élément est censée faire référence à un élément dans lequel les couleurs et les niveaux de gris se fondent en douceur dans les couleurs ou niveaux de gris voisins au lieu de produire des zones distinctes, nettement délimitées, de couleur ou niveau de gris.

Telle qu'utilisée dans le présent document, l'expression "composant connecté" dans une image faite de pixels de couleur et de pixels vides est censée faire référence à un groupe de pixels connectés par des pixels de couleur.

Telle qu'utilisée dans le présent document, l'expression "composant connecté" dans une image en noir et blanc est censée faire référence à un groupe de pixels noirs qui sont connectés les uns aux autres par des pixels noirs. Un composant connecté peut être dénommé un "blobM.

Telle qu'utilisée dans le présent document, l'expression "image d'un composant connecté" est censée faire référence à une image numérique qui comprend un seul composant connecté.

Le procédé de compression d'images 10 montré sur la figure 1 est basé sur le modèle MRC. Le modèle MRC est censé produire une bonne compression d'image "mixte" qui contient ton continu (comme une photo) et lineart (comme des lignes continues, des caractères).

Une image originale 1 est prise comme entrée par une étape de traitement 2 d'image initiale, ce qui a pour résultat une image pleine taille 11 qui est une image numérique. L'image pleine taille 11 est prise comme entrée par une segmentation 100. La segmentation 100 a pour résultat trois images numériques: une couche d'avant-plan 12, un masque 13 et une couche d'arrière-plan 14. La segmentation 100 utilise comme paramètres un facteur de réduction 15 de la résolution de l'avant-plan, un facteur de réduction 16 de la résolution du masque et un facteur de réduction 17 de la résolution de l'arrière-plan. La couche d'avant-plan 12 est compressée par une étape de compression 18 qui utilise comme paramètre une qualité d'avant-plan 19 et génère une couche d'avant-plan compressée 28. Le masque 13 est compressé par une étape de compression 20 qui utilise comme paramètre une qualité de masque 21 et génère une couche de masque compressée 30. La couche d'arrière-plan 14 est compressée par une étape de compression 22 qui utilise comme paramètre une qualité d'arrière-plan 23 et génère une couche d'arrière-plan compressée 32. Après la compression d'images 10, les trois images compressées (avant-plan 28, masque 30 et arrière-plan 32) sont utilisées dans un traitement d'image ultérieur 24. L'image originale 1 peut être une image sur papier ou une image numérique. Elle peut provenir d'une impression, d'un écrit..... elle peut comprend du texte, des figures, des photos, des codes à barres, ... Le traitement d'image initial 2 numérise l'image originale 1 si elle n'était pas numérique. Il peut inclure un traitement d'image. L'image pleine taille 11 résultant du traitement d'image initial 2 est stockée dans un dispositif de mémoire. Le traitement d'image initial 2 peut utiliser un dispositif d'imagerie tel qu'un numériseur à balayage, une caméra, une souris, un stylo numérique.....

Le traitement d'image initial 2 peut utiliser un dispositif de calcul tel qu'un ordinateur, un téléphone intelligent (smartphone), une tablette,.... L'image pleine taille 11 est en couleur, en niveaux de gris..... L'image pleine taille 11 peut contenir des photos et du texte avec des caractères à reconnaître à un stade ultérieur du traitement d'image. L'étape de segmentation 100 est décrite de manière détaillée plus loin dans le présent document. La couche d'avant-plan 12 et la couche d'arrière-plan 13 sont en couleur, en niveaux de gris, selon l'image pleine taille 11. Le masque 13 est une image binaire, ce qui signifie que les pixels du masque 13 prennent des valeurs binaires (noir ou blanc, allumé ou éteint, 1 ou

La compression 18 de la couche d'avant-plan 12 peut utiliser une technique de compression de tons continus avec perte tel que JPEG ou JPEG-2000. La compression 20 du masque 13 peut utiliser une technique de compression binaire telle que JBIG2 ou TIFF G4. La compression 22 de la couche d'arrière-plan 14 peut utiliser une technique de compression de tons continus avec perte tel que JPEG ou JPEG-2000. L'utilisation d'une technique de tons continus avec perte pour la couche d'arrière-plan et d'avant-’plan fournit une compression élevée tout en maintenant la gamme de couleurs.

Le traitement d'image ultérieur 24 comprend typiquement une décompression des trois couches (avant-plan 28, masque 30 et arrière-plan 32) et une reconstruction d'une image à partir des couches décompressées. La reconstruction sélectionne la couleur des pixels de la manière suivante. Un pixel noir, c'est-à-dire allumé ou égal à 1, dans le masque indique que pendant la reconstruction, la valeur dudit pixel est égale à la valeur dudit pixel dans la couche d'avant-plan 12. Un pixel blanc dans le masque 13 (c’est-à-dire éteint ou qui a une valeur égale à 0) indique que pendant la reconstruction, la valeur dudit pixel est égale à la valeur dudit pixel dans la couche d'arrière-plan 14.

Le traitement d'image ultérieur 24 peut comprendre: segmentation, normalisation, extraction de caractéristiques, classification, reconnaissance de caractères, détermination de blobs, transfert d'images, stockage d'images,...

La compression d'images 10 peut être utilisée pour créer un document PDF. Le document PDF comprend les trois images compressées (avant-plan, masque et arrière-plan). Quand le document PDF est ouvert, le logiciel de lecture, Acrobat Reader par exemple, décompresse les trois images compressées et effectue la reconstruction d'images, pendant l’ouverture du document.

La figure 2 illustre la segmentation 100 de l’image pleine taille 11 en trois images numériques: couche d'avant-plan 12, masque 13 et couche d'arrière-plan 14. Une étape de binarisation 101 prend comme entrée l'image pleine taille 11 et génère comme sortie une image en noir et blanc 102 qui est une image numérique. Une détermination des éléments d’avant-plan 103 prend comme entrée l'image en noir et blanc 102 et éventuellement l'image pleine taille 11 et génère comme sortie un masque initial 104 qui est une image numérique. Une étape de réduction de la résolution (ou diminution d'échelle) 105 prend comme entrées le masque initial 104 et le facteur de réduction 16 de la résolution du masque et génère le masque 13. Une étape de construction de la couche d'avant-plan 200 prend comme entrées l'image pleine taille 11 et le masque initial 104 et génère la couche d'avant-plan 12. Une étape de construction de la couche d'arrière-plan 106 prend comme entrées l'image pleine taille 11 et le masque initial 104 et génère la couche d’arrière-plan 14.

La binarisation 101 peut être effectuée par un algorithme local adaptatif ou un autre algorithme de binarisation pour générer l'image en noir et blanc 102 qui est une version binaire de l'image pleine taille 11.

Les éléments d'avant-plan sont alors sélectionnés dans l'image en noir et blanc 102 dans l'étape de détermination 103 pour former les pixels noirs dans le masque initial 104. Des éléments de texte tels que des caractères et des signes de ponctuation sont typiquement des éléments d'avant-plan. Dans un mode de réalisation de l'invention, tout élément qui n'est pas de ton continu est pris comme un élément d'avant-plan. Par conséquent, des éléments de texte, des lignes continues et des cadres de tableaux sont des éléments d'avant-plan.

Les éléments qui ne sont pas d'avant-plan forment les pixels blancs dans le masque initial 14. Les éléments qui ne sont pas d’avant-plan sont des éléments d'arrière-plan. La détermination 103 peut être réalisée par un filtrage qui utilise le principe de longueur de description minimale, lequel est connu dans l'art. Il est décidé ici pour chaque ensemble de pixels noirs et chaque ensemble de pixels blancs s'il s’agit d'un élément d’avant-plan ou un élément d'arrière-plan. Un exemple de cette technique est décrit dans le brevet US8331706.

Le masque 13 est généré à partir de la réduction de la résolution 105 du masque initial 104. L'étape de réduction de la résolution 105 est optionnelle. Elle améliore la compression mais détériore la résolution.

La construction de la couche d'avant-plan 200 est décrite de manière plus détaillée plus loin dans le présent document. La construction de la couche d'arrière-plan 106 peut être effectuée par une quelconque technique connue dans l'art. Un exemple de cette technique est décrit dans le brevet US8331706. ·

Une construction de la couche d'avant-plan 200 est montrée sur la figure 3. Pour faire la différence entre plusieurs procédés de construction de la couche d'avant-plan, la construction de la couche d'avant-plan 200 illustrée sur la figure 3 est désignée par 200A, L'image pleine taille 11 et le masque initial 104 sont utilisés comme entrées dans l'étape de sélection 201 des pixels des éléments d’avant-plan dans l'image pleine taille 11, ce qui génère une image des éléments d'avant-plan 202, qui est une image numérique, comme sortie. Le masque initial 104 et un facteur de réduction 252 de la résolution du masque opérant sont utilisés comme entrée dans une étape de réduction de la résolution 251 qui génère un masque opérant 253, qui est une image numérique binaire. L'image des éléments d'avant-plan 202 et le masque opérant 253 sont alors utilisés comme entrée dans une étape de détermination 300 d'une image de transition, ce qui détermine une image de transition 203, qui est une image numérique. Une étape de remplissage 204 est effectuée sur l'image de transition 203 pour générer la couche d'avant-plan 12. L'étape de sélection 201 des pixels des éléments d'avant-plan dans l'image pleine taille 11 construit une image numérique, l'image des éléments d'avant-plan 202, où un pixel qui est noir dans le masque initial 104 prend la même valeur que dans l'image pleine taille 11, et un pixel qui est blanc dans le masque initial 104 est établi comme étant "vide”. L'étape de réduction de la résolution 251 crée le masque opérant 253 par une réduction de la résolution du masque initial 104 par un facteur n égal au facteur de réduction 252 de la résolution du masque opérant. Par conséquent, un pixel dans le masque opérant 253 correspond à une première fenêtre de η x n pixels dans le masque initial 104 et donc dans l'image pleine taille 11, avec n=1, 2, ... Dans des variantes de réalisation, la première fenêtre utilisée pour générer le masque opérant 253 à partir du masque initial 104 a une forme rectangulaire, une forme polygonale, une forme circulaire ou elliptique,... L’étape de détermination 300 d'une image de transition introduit une réduction d'échelle de telle manière que l'image de transition 203 résultant de l'étape 300 ait la même échelle que le masque opérant 253, ce qui signifie que l’image de transition 203 est à échelle réduite par un facteur de réduction de la résolution n par rapport à l'image des éléments d'avant-plan 202 et donc dans l'image pleine taille 11. L'étape de détermination 300 d'une image de transition est décrite de manière plus détaillée plus loin dans le présent document. L'image de transition 203 résultant de l'étape 300 a la même échelle que le masque opérant 253, ce qui signifie que l'image de transition 203 est à échelle réduite par un facteur de réduction de la résolution n par rapport à l'image des éléments d'avant-plan 202. Le facteur de réduction 15 de la résolution de l'avant-plan est par conséquent égal au facteur de réduction 252 de la résolution du masque opérant dans la construction de la couche d'avant-plan 200A. Des pixels qui sont blancs dans le masque opérant 253 sont vides dans l'image de transition 203.

Dans un mode de réalisation de l'invention, l'étape de sélection 201 des éléments d'avant-plan et l'étape de détermination 300 d'une image de transition sont combinées en une seule étape. L'image de transition 203 est directement calculée à partir de l'image pleine taille, du masque initial 104 et du masque opérant 253 sans calculer l'image des éléments d'avant-plan 202 en tant que telle. Le fait de sauter le calcul et le stockage de cette image des éléments d'avant-plan 202 réduit la mémoire requise pour le calcul informatisé. L'étape de remplissage 204 remplit les pixels vides en utilisant les pixels non vides voisins, par exemple par un algorithme séquentiel en deux étapes. Un tel algorithme est décrit dans le brevet US8331706. L’étape de remplissage 204 génère la couche d'avant-plan 12 comme sortie.

La construction de la couche d'avant-plan 200 selon un mode de réalisation de la présente invention est illustrée sur la figure 4. Pour faire la différence entre plusieurs procédés de construction de la couche d'avant-plan, la construction de la couche d'avant-plan 200 illustrée sur la figure 4 est désignée par 200B. L'image pleine taille 11 et le masque initial 104 sont utilisés comme entrées dans l'étape de sélection 201 des pixels des éléments d'avant-plan dans l’image pleine taille 11, ce qui génère une image d’éléments d'avant-plan 202, qui est une image numérique, comme sortie. Le masque initial 104 et un facteur de réduction 252 de la résolution du masque opérant sont utilisés comme entrée dans une étape de réduction de la résolution 251 qui génère un masque opérant 253, qui est une image numérique binaire. L'image des éléments d'avant-plan 202 et le masque opérant 253 sont alors utilisés comme entrée dans une étape de détermination 300 d'une image de transition, ce qui détermine une image de transition 203, qui est une image numérique. Une étape de remplissage 204 est effectuée sur l’image de transition 203 pour générer la couche d'avant-plan 12. L'étape de sélection 201 des pixels des éléments d’avant-plan dans l'image pleine taille 11 construit une image numérique, l'image des éléments d'avant-plan 202, où un pixel qui est noir dans le masque initial 104 prend la même valeur que dans l'image pleine taille 11, et un pixel qui est blanc dans le masque initial 104 est établi comme étant "vide". L'étape de réduction de la résolution 251 crée le masque opérant 253 par une réduction de la résolution du masque initial 104 par un facteur n égal au facteur de réduction 252 de la résolution du masque opérant. Par conséquent, un pixel dans le masque opérant 253 correspond à une première fenêtre de η x n pixels dans le masque initial 104, avec n=1, 2, ... Dans des variantes de réalisation, la première fenêtre utilisée pour générer le masque opérant 253 à partir du masque initial 104 a une forme rectangulaire, une forme polygonale, une forme circulaire ou elliptique,.,. L'étape de détermination 300 d'une image de transition introduit une réduction d'échelle de telle manière que l'image de transition 203 résultant de l'étape 300 ait la même échelle que le masque opérant 253, ce qui signifie que l'image de transition 203 est à échelle réduite par un facteur de réduction de la résolution n par rapport à l'image des éléments d'avant-plan 202. L'étape de détermination 300 d'une image de transition est décrite de manière plus détaillée plus loin dans le présent document. L'image de transition 203 résultant de l'étape 300 a la même échelle que le masque opérant 253, ce qui signifie que l'image de transition 203 est à échelle réduite par un facteur de réduction de la résolution n par rapport à l'image des éléments d'avant-plan 202. Des pixels qui sont blancs dans .le masque opérant 253 sont vides dans l'image de transition 203.

Dans un mode de réalisation de l'invention, l'étape de sélection 201 des éléments d'avant-plan et l'étape de détermination 300 d'une image de transition sont combinées en une seule étape. L'image de transition 203 est directement calculée à partir de l'imagé pleine taille, du masque initial 104 et du masque opérant 253 sans calculer l'image des éléments d'avant-plan 202 en tant que telle. Le fait de sauter le calcul et le stockage de cette image des éléments d'avant-plan 202 réduit la mémoire requise pour le calcul informatisé.

La réduction de la résolution 205 réduit la résolution de l’image de transition 203. Étant donné que la couche d'avant-plan 12 est au total à échelle réduite par rapport à l'image pleine taille 11 par le facteur de réduction de la résolution de l'avant-plan 15 rfg, la réduction de la résolution 205 a un facteur de réduction 206 de la résolution égale au facteur de réduction 15 de la résolution de Pavant-plan divisé par le facteur de réduction 252 de la résolution du masque opérant dans la construction de la couche d'avant-plan 200B, En d'autres termes, la réduction de la résolution 205 réduit l'échelle de l'image de transition 203 par un facteur 206 égal à rfg/n, rfg étant supérieur à n. Le facteur de réduction 15 de la résolution de l'avant-plan est par conséquent plus grand que le facteur de réduction 252 de la résolution du masque opérant dans fa construction de la couche d'avant-plan 200B. L'étape de remplissage 204 remplît les pixels vides en utilisant les pixels non vides voisins, par exemple par un algorithme séquentiel en deux étapes. L'étape de remplissage 204 génère la couche d’avanî-plan 12 comme sortie. L'étape de détermination 300 d'une image de transition selon un mode de réalisation de la présente invention est illustrée sur la figure 5. Pour faire la différence entre plusieurs modes de réalisation de la présente invention, l'étape de détermination 300 d'une image de transition de la figure 5 est désignée par 3Q0A. L'étape de détermination 3Q0A d'une image de transition commence avec la création 350 d'une image 351 de pixels vides de même taille que le masque opérant 253. Un pixel dans l'image 351 de pixels vides correspond à un seul pixel dans le masque opérant 253. L'étape de détermination 300A d'une image de transition comprend alors une boucle 310 sur les pixels noirs 301 du masque opérant 253. La boucle 310 remplace, dans l'image 351 de pixels vides, chaque pixel qui correspond à un pixel noir dans le masque opérant 253 par un pixel de couleur 304.

Chaque pixel noir 301 du masque opérant 253 est considéré à son tour. Une étape de moyennage de couleur 302 utilise comme entrées un pixel noir 301 du masque opérant 253, un facteur de moyennage m 303 et l'image des éléments d'avant-plan 202, et génère un pixel de couleur 304 à l'emplacement dudit pixel. Le pixel de couleur 304 remplace un pixel vide de l'image 351 de pixels vides. Puis, un autre pixel noir 301 du masque opérant 253 est pris en considération et ainsi de suite pour tous les pixels noirs du masque opérant 253. Au lieu d’une boucle 310 sur les pixels noirs 301 du masque opérant 253, iesdits pixels noirs 301 pourraient être pris en considération en parallèle. À la fin de la boucle, l'image de transition 203 est formée par les pixels de couleur 304 qui sont situés aux emplacements des pixels noirs 301 du masque opérant 253 et par des pixels vides qui sont situés aux emplacements des pixels blancs du masque opérant 253 et qui viennent de l'image 351 de pixels vides. Par conséquent, l'image de transition 203 a la même échelle que le masque opérant 253. Le moyennage de couleur 302 pour un pixel noir 301 donné du masque opérant 253 est un moyennage de couleur portant sur les couleurs d'un groupe de pixels dans l'image des éléments d'avant-plan 202, lesdits pixels dudit groupe ont deux caractéristiques. Premièrement, ils n'ont pas la valeur "vide" dans l'image des éléments d'avant-plan 202, ce qui signifie qu'ils correspondent aux pixels noirs dans le masque initial 104. Deuxièmement, ils sont dans une fenêtre de m x m pixels dans l'image des éléments d'avant-plan 202 qui est centrée sur le pixel noir 301 donné, où m, le facteur de moyennage de couleur 303, est plus élevé que rfg, le facteur de réduction 15 de la résolution de l'avant-plan.

Par conséquent, ledit pixel noir 301 correspond pour ce qui est de son emplacement à une fenêtre de mise à l'échelle de rfg x rfg pixels dans l'image pleine taille 11 et est la moyenne de couleur sur une fenêtre de moyennage de m x m pixels dans l'image pleine taille 11 (où les pixels qui sont blancs dans le masque initial 104 ne sont pas pris en considération), avec rfg<m. Ce procédé où le moyennage de couleur est effectué sur une fenêtre plus grande que la fenêtre de mise à l'échelle crée des couleurs plus homogènes dans l'image de transition 203, et donc dans la couche d'avant-plan 12, qu'un procédé où le moyennage de couleur est effectué sur la fenêtre de mise à l'échelle.

La fenêtre de moyennage peut être appelée "deuxième fenêtre" par opposition à la "première fenêtre" qui est la fenêtre de mise à l'échelle.

Si le centrage de la fenêtre de moyennage sur l'emplacement dudit pixel noir 301 n'est pas possible, par exemple parce que rfg est égal à 2 et m est égal à 3, le centre de la fenêtre de moyennage peut être déplacé par rapport au centre de la fenêtre de mise à l'échelle.

La fenêtre de moyennage peut avoir une forme quelconque, une taille quelconque, tant qu'elle comprend plus de pixels que la fenêtre de mise à l'échelle. Si le masque opérant 253 a la même échelle que l'image en couleur 11 parce qu'aucune réduction de résolution 251 n'a été effectuée, le moyennage des couleurs 302 est effectué sur une fenêtre d'au moins deux pixels de l'image des éléments d’avant-plan 202. Dans un mode de réalisation de l'invention, la fenêtre de moyennage varie en taille et/ou en forme selon une règle prédéterminée. Par exemple, la fenêtre de moyennage peut être plus grande dans des régions où la variation de couleur des pixels est petite et étroite dans des régions où la couleur varie fortement de pixel à pixel.

Dans un mode de réalisation de l'invention, le moyennage des couleurs 302 est effectué à partir des valeurs des pixels d'une fenêtre de moyennage dans l'image pleine taille 11, ne prenant en considération que des pixels qui sont noirs dans le masque initial 104. Cela fournit la même image de transition 203 que le procédé décrit jusqu'ici qui utilise l'image des éléments d'avant-plan 202 sans requérir cette image intermédiaire des éléments d'avant-plan 202.

Le moyennage de couleur 302 pour le pixel noir 301 fournit la couleur 304 dudit pixel noir 301 dans l'image de transition 203. Puis, un pixel noir 301 suivant est pris en considération et sa couleur 304 dans l'image de transition 203 est fournie par le moyennage de couleur 302, jusqu'à ce que la couleur dans l'image de transition de tous les pixels noirs 301 du masque opérant 253 ait été calculée.

Dans un mode de réalisation de l'invention, la fenêtre de moyennage n'a pas la même taille pour tous les pixels de l'image de transition 203. Dans un mode de réalisation de l'invention, la fenêtre de moyennage n'est pas plus grande que la fenêtre de mise à l'échelle pour certains pixels de l'image de transition 203. Dans un mode de réalisation de l'invention, la fenêtre de moyennage a la même taille que la fenêtre de mise à l'échelle pour certains pixels de l'image de transition 203 et est plus grande que la fenêtre de mise à l'échelle pour d'autres pixels de l'image de transition 203,

Dans un mode de réalisation de l'invention, le moyennage de couleur 302 est remplacé par une autre opération qui détermine une couleur à partir des couleurs des pixels dans la fenêtre de moyennage. Cette opération peut être une détermination d'une médiane, d'un mode statistique, d’une moyenne géométrique, d'une moyenne pondérée,,..

La figure 6 fournit une illustration de la détermination de l'image de transition 300A décrite en se référant à la figure 5. La figure 6 est à une dimension, prenant en considération une ligne de pixels, mais le procédé décrit peut être immédiatement généralisé au cas d'une matrice de pixels à deux dimensions. La ligne 601 fournit l'indice des pixels d'un trait horizontal. L'indice sera utilisé plus loin dans le présent document. La ligne 602 fournit la valeur des pixels dans une image originale en niveaux de gris 1, la valeur d'un pixel indiquant le niveau de gris dudit pixel. La ligne 603 fournit la valeur des pixels déterminée par une numérisation par balayage de l'image originale en niveaux de gris 1. La ligne 603 est l'image pleine taille 11 à laquelle il est fait référence dans la description de la présente invention. La ligne 604 est le masque initial 104 déterminé à partir de l'image pleine taille 11 (ligne 603) par les étapes de binarisation 101 et de détermination des éléments d’avant-plan 103. La ligne 605 est l'image des éléments d'avant-plan 202. La ligne 606 est le masque opérant 253, déterminé à partir du masque initiai 104 par la réduction de la résolution 251. La ligne 607 est l'image de transition 203 résultant de la détermination de l'image de transition 300A selon un mode de réalisation de la présente invention. La ligne 608 est l'image de transition 203 résultant d'un procédé connu de détermination de l'image de transition. La ligne 609 fournit l'indice des pixels à une échelle réduite sur le trait horizontal.

Une valeur de pixel plus élevée dans les lignes 602, 603, 605, 607 et 608 indique un niveau de gris proche du blanc et une valeur plus basse indique un niveau de gris proche du noir. L'image originale comprend une première partie claire (pixels a et b), une partie foncée (pixels c à g), un pixel entre clair et foncé (pixel h) et une deuxième partie claire (pixels i et j). L'image pleine taille (ligne 603) n’est pas exactement égale à l'image originale (ligne 602) parce que la couleur au bord entre les parties claires et la partie foncée (pixels c et g) est un mélange entre les parties foncée et claires, cela peut être dû à l'impression, à la numérisation par balayage ou à un autre traitement d'image physique ou numérique. Le masque initial (ligne 604) est déterminé en considérant que tous les pixels avec une valeur inférieure à 100 sont noirs (valeur = 1) et les autres sont blancs (valeur = 0). L'image des éléments d'avant-plan 202 (ligne 605) est déterminée à partir de l'image pleine taille 11 (ligne 603) et du masque initial (ligne 604) en établissant comme étant vides les pixels blancs du masque initial et en assignant aux pixels noirs du masque initial leur valeur dans l'image pleine taille (ligne 603). Le masque opérant (ligne 606) est déterminé à partir du masque initial (ligne 604) par une mise à l'échelle par un facteur de réduction de résolution n égal à 2. L’image de transition résultant de la détermination de l'image de transition 300A selon un mode de réalisation de la présente invention (ligne 607) a la même échelle que le masque opérant (ligne 606). Les pixels ab et ij qui sont blancs (valeur = 0) dans le masque (ligne 606) sont établis comme étant vides dans l'image de transition (ligne 607). La valeur des pixels cd, ef et gh qui sont noirs (valeur = 1) dans le masque opérant (ligne 606) est déterminée par une moyenne des valeurs des pixels non vides de l'image des éléments d'avant-plan (ligne 605) qui ne sont pas vides et sont dans une fenêtre de quatre (m=4) pixels centrée sur les pixels noirs du masque opérant. De manière plus spécifique, la valeur du pixel cd dans la ligne 607 est la moyenne de c, d et e de la ligne 605; la valeur du pixel ef dans la ligne 607 est la moyenne de d, e, f et g de la ligne 605; et la valeur du pixel gh dans la ligne 607 est la moyenne de f et g de la ligne 605. L'image de transition résultant d'un procédé connu de détermination de l'image de transition (ligne 608) a la même échelle que le masque opérant (ligne 606). Les pixels ab et ij qui sont blancs (valeur = 0) dans le masque (ligne 606) sont établis comme étant vides dans l’image de transition (ligne 608). La valeur des pixels cd, ef et gh qui sont noirs (valeur = 1) dans le masque opérant (ligne 606) est déterminée par une moyenne des valeurs des pixels non vides de l’image des éléments d'avant-plan (ligne 605) en utilisant la même fenêtre pour le moyennage que pour la mise à l'échelle. De manière plus spécifique, la valeur des pixels cd dans la ligne 608 est la moyenne de c et d de la ligne 605; la valeur du pixel ef dans la ligne 608 est la moyenne de e et f de la ligne 605; et la valeur du pixel gh dans la ligne 608 est égale à la valeur du pixel g de la ligne 605. Il apparaît que les valeurs dans la ligne 607 sont plus homogènes que les valeurs dans la ligne 608.

La figure 7 fournit une deuxième illustration de la détermination de l'image de transition 300A décrite en se référant à la figure 5. Une matrice 701 fournit la valeur des pixels dans une image originale en niveaux de gris 1, la valeur d'un pixel indiquant le niveau de gris dudit pixel. L'image originale représente un premier caractère 702.et un deuxième caractère 703 qui sont plus foncés (nombre moindre dans l'échelle des gris) que le reste de ladite image originale. Une matrice 704 fournît la valeur des pixels déterminée par une numérisation par balayage de l'image originale en niveaux de gris 1. La matrice 704 est l'image pleine taille 11 à laquelle il est fait référence dans la description de la présente invention. Les deux caractères sont dénommés 705 et 706 dans 704. Une matrice 707 est le masque initial 104 déterminé à partir de l'image pleine taille 11 (matrice 704) par les étapes de binarisation 101 et de détermination des éléments d'avant-plan 103. Les deux caractères sont dénommés 708 et 709 dans 707. Une matrice 710 est l'image des éléments d'avant-plan 202. Les deux caractères sont dénommés 711 et 712 dans 710. Une matrice 713 est le masque opérant 253, déterminé à partir du masque initial 104 par la réduction de la résolution 251. Les deux caractères sont dénommés 714 et 715 dans 713. Une matrice 716 est l'image de transition 203 résultant de la détermination de l'image de transition 300A selon un mode de réalisation de la présente invention. Les deux caractères 717 et 718 sont présents dans la matrice 716. Un des pixels de la matrice 716 a reçu un numéro de référence 719. Une matrice 722 est l'image des éléments d'avant-plan 202 où sont indiquées la fenêtre de mise à l'échelle 723 et la fenêtre de moyennage 724 correspondant au pixel 719 dans l'image de transition 203 (matrice 716). L'image pleine taille (matrice 704) n'est pas exactement égale à l'image originale (matrice 701), principalement parce que la couleur au bord entre les parties claires et la partie foncée est un mélange entre les parties foncée et claires. Le masque initial (matrice 707) est déterminé en considérant que tous les pixels avec une valeur inférieure à 100 sont noirs et que les autres sont blancs. L'image des éléments d'avant-plan 202 (matrice 710) est déterminée à partir de l'image pleine taille (matrice 704) et du masque initial (matrice 707) en établissant comme étant vides les pixels blancs du masque initial et en assignant aux pixels noirs du masque initial leur valeur dans l'image pleine taille (matrice 704). Le masque opérant (matrice 713) est déterminé à partir du masque initial (matrice 707) par une mise à l’échelle par un facteur der réduction de résolution n égal à 2. Différentes formules de mise à l'échelle sont possibles. Le procédé de mise à l’échelle préféré consiste à considérer un pixel résultant d'une mise à l'échelle égale à 1 si au moins un pixel dans la fenêtre de mise à l'échelle est égal à 1. L'image de transition (matrice 716) résultant de la détermination de l’image de transition 300A selon un mode de réalisation de la présente invention a la même échelle que le masque opérant (matrice 713). Les pixels blancs du masque opérant (matrice 713) sont des pixels vides dans l'image de transition (matrice 716). Les pixels noirs du masque opérant (matrice 713) sont calculés à partir d'une moyenne sur une fenêtre de 16 (quatre x quatre) pixels non vides (m=4) de l'image des éléments d'avant-plan centrée sur les pixels noirs du masque, La position du pixel 719 correspond à la fenêtre 723 dans l'image des éléments d’avant-plan (matrice 722) et la valeur (ou couleur) du pixel 719 est calculée comme la moyenne portant sur les valeurs des pixels non vides de la fenêtre 724. L’étape de détermination 300 d'une image de transition selon un autre mode de réalisation de la présente invention est illustrée sur la figure 8, Pour faire la différence entre plusieurs modes de réalisation de la présente invention, l'étape de détermination 300 d’une image de transition de la figure 8 est désignée par 3Q0B. L'étape de détermination 300B d'une image de transition commence à partir de l'image des éléments d'avant-plan 202. Des images 402 de composants connectés sont calculées à partir de l'image des éléments d'avant-plan 202 à l'étape 401. Des images correspondantes 404 de composants connectés dans le masque opérant sont calculées à partir du masque opérant 253 ä l'étape 403. L'étape de détermination 300B d'une image de transition comprend une boucle 450 sur les images 404 de composants connectés dans le masque opérant qui comprend une série 400 d'étapes accomplies pour tout composant connecté 404 dans le masque opérant. La série 400 d'étapes commence avec la création 490 d'une image 491 de pixels vides pour le composant connecté considéré. L'image 491 a la même taille que l'image 404 considérée de composant connecté dans le masque opérant 253. Un pixel dans l'image 491 de pixels vides correspond à un seul pixel dans l'image 404 considérée de composant connecté dans le masque opérant 253.

La série 400 d'étapes comprend une boucle 420 sur les pixels noirs de l'image 404 considérée de composant connecté dans le masque opérant 253. La boucle 420 remplace, dans l'image 491 de pixels vides pour le composant connecté considéré, tout pixel qui est noir dans l'image 404 du composant connecté dans le masque opérant 253 par un pixel de couleur 408. Chaque pixel noir 405 de l'image 404 considérée est considéré à son tour. Une étape de moyennage de couleur 406 utilise comme entrées ledit pixel noir 405, un facteur de moyennage de couleur m 407 et l'image du composant connecté 402 correspondant dans l’image des éléments d'avant-plan, et génère le pixel de couleur 408 dans le composant connecté considéré dans l'image de transition à l'emplacement correspondant au pixel noir 404. Le pixel de couleur 408 remplace un pixel vide de l'image 491 de pixels vides. Puis, un autre pixel noir 405 de l’image 404 considérée du composant connecté est pris en considération et ainsi de suite pour tous les pixels noirs de l'image 404 considérée du composant connecté. À la fin de la boucle 420, un composant connecté 412 dans l'image de transition 203 est formé par les pixels de couleur 408 qui sont situés aux emplacements des pixels noirs 405 du composant connecté 404 correspondant dans le masque opérant 253 et par des pixels vides qui sont situés aux emplacements des pixels blancs du composant connecté 404 correspondant dans le masque opérant 253 et qui proviennent de l'image vide 491. Par conséquent, le composant connecté 412 dans l'image de transition 203 a la même échelle que le composant connecté 404 correspondant dans le masque opérant 253.

Puis, un autre composant connecté 404 dans le masque opérant est considéré dans la boucle 450 avec la création 490 d'une image 491 de pixels vides pour le composant connecté considéré et une boucle 420 sur ses pixels noirs. À la fin de l'étape de détermination 300B d'une image de transition, tous les composants connectés 412 de l'image de transition forment l'image de transition 203.

En raison de la façon dont elle a été construite à l'étape de sélection 201 des pixels des éléments d'avant-plan dans l'image pleine taille, l’image des éléments d'avant-plan 202 est faite de pixels de couleur et de pixels vides. À l'étape 401 de création d'images de composant connecté à partir de l'image d'élément d’avant-plan 202, les composants connectés de ladite image 202 sont découpés en images numériques 402 individuelles qui sont des images plus petites que ladite image 202. Toute image 402 d'un composant connecté contient un seul composant connecté. Par exemple, un composant connecté 402 dans l'image des éléments d'avant-plan peut comprendre un élément textuel, un caractère, un élément lineart, une lettre, un symbole ou un signe de ponctuation.

Dans un mode de réalisation de l'invention, une image 402 d'un composant connecté correspond à un rectangle englobant du composant connecté, c'est-à-dire le plus petit rectangle qui comprend le composant connecté. Dans un mode de réalisation de l'invention, la coordonnée supérieure gauche du rectangle englobant est conservée afin de faire la correspondance avec l'image des éléments d'avant-plan 202. Les rectangles englobants de deux composants connectés peuvent se chevaucher. Par exemple, si l'image représente les lettres "VA", le rectangle englobant de 'V' peut chevaucher le rectangle englobant de 'A'. À l'étape 403 de création d'images 404 de composants connectés dans le masque opérant 253, chaque image de composant connecté 404 du masque opérant est sélectionnée pour correspondre à une image de composant connecté 402 dans l'image des éléments d'avant-plan. Une image de composant connecté 402 dans l'image des éléments d'avant-plan et l'image correspondante du composant connecté 404 dans le masque correspond au même ensemble de pixels dans l'image pleine taille 11.

Le moyennage de couleur 406 pour un pixel noir 405 donne de l'image de composant connecté 404 du masque est un moyennage de couleur portant sur les couleurs d'un groupe de pixels de l'image de composant connecté 402 dans l'image des éléments d'avant-plan qui correspond à l'image de composant connecté 404 dans le masque opérant, lesdits pixels dudit groupe ayant deux caractéristiques. Premièrement, ils n'ont pas la valeur "vide" dans l'image de composant connecté 402 dans l’image des éléments d'avant-plan, ce qui signifie qu'ils correspondent aux pixels noirs dans le masque initial 104. Deuxièmement, ils sont dans une fenêtre de m x m pixels dans l'image de composant connecté 402 dans l'image des éléments d'avant-plan qui est centrée sur le pixel noir 405 donné, où m, le facteur de moyennage de couleur, est supérieur à n, le facteur de réduction de la résolution du masque opérant. Si la fenêtre va au-delà des pixels de l'image de composant connecté 402, cette partie au-delà des pixels de l'image de composant connecté n'est pas prise en compte dans le moyennage 406.

Par conséquent, ledit pixel noir 405 correspond pour ce qui est de son emplacement à une fenêtre de mise à l'échelle de m x m pixels dans l'image pleine taille 11, mais est la moyenne de couleur sur une fenêtre de m x m pixels dans une seule image de composant connecté de l'image pleine taille 11 (où les pixels qui sont blancs dans le masque initial 104 ne sont pas pris en considération). Ce procédé où le moyennage de couleur est effectué sur une fenêtre plus grande que la fenêtre dé mise à l'échelle crée des couleurs plus homogènes dans l'image de transition 203, et donc dans la couche d'avant-plan 12, qu'un procédé où le moyennage de couleur est effectué sur la fenêtre de mise à l'échelle. À cause de la séparation en image de composant connecté, les couleurs des pixels de différents composants connectés ne peuvent pas se mélanger pendant le moyennage des couleurs 406. Si un caractère bleu est suivi par un caractère rouge, le bleu et le rouge ne se mélangent pas.

Si le centrage de la fenêtre de moyennage sur l'emplacement dudit pixel noir 405 n'est pas possible, par exemple parce que n est égal à 2 et m est égal à 3, le centre de la fenêtre de moyennage peut être déplacé par rapport au centre de la fenêtre de mise à l'échelle.

La fenêtre de moyennage peut avoir une forme quelconque, une taille quelconque, tant qu'elle comprend plus de pixels que la fenêtre de mise à l'échelle et de pixels d'un seul composant connecté. Si le masque opérant 253 a la même échelle que l'image pleine taille 11, le moyennage des couleurs 406 est effectué sur une fenêtre d'au moins deux pixels dans l'image de composant connecté 402 de l'image des éléments d'avant-plan, dans un mode de réalisation de l'invention, la fenêtre de moyennage varie en taille et/ en forme selon une règle prédéterminée. Par exemple, la fenêtre de moyennage peut être grande pour un composant connecté correspondant à un grand trait et étroite pour un composant connecté correspondant à un trait étroit.

Le moyennage de couleur 406 pour le pixel noir 405 fournit un pixel de couleur 408 à l'emplacement dudit pixel noir 405 dans l'image de composant connecté 412 dans l'image de transition. Puis un pixel noir 405 suivant est considéré et le pixel de couleur 408 correspondant dans l'image de composant connecté 412 dans l'image de transition est fourni par le moyennage 406 jusqu'à ce que la couleur de tous les pixels noirs 301 de l’image de composant connecté 404 du masque ait été calculée.

Les pixels de couleur 408 et les pixels vides établis à l'étape 490 forment l’image de composant connecté 412 dans l'image de transition. Puis le composant connecté 404 suivant du masque opérant est considéré dans la boucle 450. Par conséquent, l'image de composant connecté 412 dans l'image de transition a la même échelle que l'image de composant connecté 404 dans le masque et l'image de transition 203 a la même échelle que le masque opérant 253.

Dans un mode de réalisation de l'invention, le moyennage de couleurs 406 est effectué à partir des valeurs des pixels d'une fenêtre de moyennage dans l'image pleine taille 11, en ne prenant en considération que des pixels qui sont noirs dans le masque initial 104. Cela fournit la même image de transition 203 que le procédé décrit jusqu'ici qui utilise l’image des éléments d'avant-plan 202 sans requérir cette image intermédiaire des éléments d'avant-plan 202.

La a figure 9 fournit une illustration de la détermination de l'image de transition 300B décrite en référence à la figure 8.

Une matrice 901 fournît la valeur des pixels dans une image originale en niveaux de gris 1, la valeur d'un pixel indiquant le niveau de gris dudit pixel. L'image originale représente un premier caractère 902 et un deuxième caractère 903 qui sont plus foncés (nombre moindre dans l'échelle des gris) que l'arrière-plan de ladite image originale. Une matrice 904 fournit la valeur des pixels déterminée par une numérisation par balayage de l'image originale en niveaux de gris 1. La matrice 904 est l'image pleine taille 11 à laquelle il est fait référence dans la description de la présente invention. Les deux caractères sont dénommés 905 et 906 dans 904. L'ensemble de pixels des colonnes 1 à 6 a reçu le numéro de référence 960 et l'ensemble de pixels des colonnes 7 à 10 a reçu le numéro de référence 970. Une matrice 907 est le masque initial 104 déterminé à partir de l'image pleine taille 11 (matrice 904) par les étapes de binarisation 101 et de détermination des éléments d’avant-plan 103. Les deux caractères sont dénommés 908 et 909 dans 907. Une matrice 910 est l'image des éléments d'avant-plan 202. Les deux caractères sont dénommés 911 et 912 dans 910. Une matrice 913 est le masque opérant 253, déterminé à partir du masque initial 104 par la réduction de la résolution 105. Les deux caractères sont dénommés 914 et 915 dans 913,

Deux matrices, 917 et 919, illustrent les images de composants connectés 402 dans l'image des éléments d'avant-plan. La matrice 917 comprend un caractère 918. La matrice 919 comprend un caractère 920. Deux matrices, 922 et 924, illustrent les images de composants connectés 404 dans le masque. La matrice 922 comprend un caractère 923. La matrice 924 comprend un caractère 925. Deux matrices, 927 et 929, illustrent les images de composants connectés 412 dans l'image de transition. La matrice 927 comprend un caractère 928. La matrice 929 comprend un caractère 930. Un des pixels de la matrice 927 a reçu un numéro de référence 931. Une matrice 932 est l'image de transition 203 résultant de la détermination de l'image de transition 300B selon un mode de réalisation de la présente invention. Les deux caractères 933 et 934 sont présents dans la matrice 932. Deux matrices, 936 et 937, montrent les images de composants connectés 402 dans l’image des éléments d'avant-plan qui sont indiqués dans la fenêtre de mise à l'échelle 938 et la fenêtre de moyennage 939 correspondant au pixel 931 de l’image de composant connecté 412 correspondante de l'image de transition (matrice 927). L'image pleine taille (matrice 904) n'est pas exactement égale à l'image originale (matrice 901), principalement parce que la couleur au bord entre les parties claires et la partie foncée est un mélange entre les parties foncée et claires. Le masque initial (matrice 907) est déterminé en considérant que tous les pixels avec une valeur inférieure à 100 sont noirs et que les autres sont blancs. L'image des éléments d'avant-plan 202 (matrice 910) est déterminée à partir de l'image pleine taille (matrice 904) et du masque initial (matrice 907) en établissant comme étant vides les pixels blancs du masque initial et en assignant aux pixels noirs du masque initial leur valeur dans l'image pleine taille (matrice 904). Le masque (matrice 913) est déterminé à partir du masque initial (matrice 907) par une mise à l’échelle par un facteur de réduction de résolution n égal à 2.

Les images de composants connectés 402 dans l'image des éléments d'avant-plan (matrices 917 et 919) sont des matrices de pixels déterminées de telle manière que tout composant connecté corresponde à une image et que chaque image corresponde à chaque composant connecté. '

Le caractère 918 est le composant connecté de l’image 917 et correspond au trait 905 dans l’image pleine taille (matrice 904) et le caractère 920 est le composant connecté de l'image 919 et correspond au trait 906 de l'image pleine taille (matrice 904). Les images de composants connectés 404 du masque (matrices 922 et 924) correspondent aux images de composants connectés 402 dans l'image des éléments d'avant-plan (matrices 917 et 919). 917 et 922 correspondent au même ensemble 960 de pixels dans l'image pleine taille 11 (matrice 904) et 918 et 923 ont par conséquent une base dans le même trait 905 dans l'image pleine taille 11. 919 et 924 correspondent au même ensemble 970 de pixels dans l’image pleine taille 11 (matrice 904) et 920 et 925 ont par conséquent une base dans le même trait 906 dans l'image pleine taille 11,

Les images de composants connectés 412 dans l'image de transition (matrices 927 et 929) ont la même échelle que les images de composants connectés dans le masque (matrices 922 et 924). Les pixels blancs des images de composants connectés dans le masque (matrices 922 et 924) sont des pixels vides dans les images de composants connectés 412 dans l'image de transition (matrices 927 et 929). Chaque pixel noir d’une image de composant connecté du masque (matrices 922 et 924) est calculé à partir d'une moyenne faite sur les pixels non-vides d'une fenêtre de 16 (quatre sur quatre) pixels (m=4) de l'image de composant connecté correspondante dans l'image des éléments d'avant-plan (matrices 917 et 919) centrée sur lesdîts pixels noirs, la partie de la fenêtre en dehors de la matrice n'étant pas prise en compte dans l’établissement de la moyenne. Par exemple, la position du pixel 931 correspond à la fenêtre 938 dans les images de composants connectés dans l'image des éléments d'avant-plan (matrice 936) et la valeur (ou couleur) du pixel 931 est calculée comme la moyenne des valeurs des pixels non vides de la fenêtre de moyennage 939. Les pixels de l'autre image de composant connecté (matrice 937) ne sont pas pris en compte dans le calcul de la valeur du pixel 931. L'étape de détermination 300 d'une image de transition selon un autre mode de réalisation de la présente invention est illustrée sur la figure 10. Pour faire la différence entre plusieurs modes de réalisation de la présente invention, l'étape de détermination 300 d'une image de transition de la figure 10 est désignée par 3Q0C, L'étape de détermination 300C d'une image de transition commence à partir de l'image des éléments d'avant-plan 202. Des images 402 de composants connectés sont calculées à partir de l'image des éléments d'avant-plan 202 à l'étape 401. Des images correspondantes 404 de composants connectés dans le masque opérant sont calculées à partir du masque opérant 253 à l'étape 403. L'étape de détermination 300C d'une image de transition comprend une boucle 550 sur les images de composants connectés 402. La boucle 550 comprend une étape de vérification 501 qui contrôle si les couleurs dans l'image de composant connecté 402 prise en considération sont nettement différentes. Si oui, la même série 400 d'étapes que dans l'étape de détermination 300B d'une image de transition selon un mode de réalisation de l'invention précédemment décrit est .effectuée sur les pixels de l'image de composant connecté 404 du masque qui correspond à l'image de composant connecté 402 considérée pour déterminer la couleur des pixels d'une image du composant connecté 412 considéré dans l'image de transition. Si non, une série 500 d'étapes est effectuée.

La série 500 d’étapes comprend un moyennage de couleur 502 qui utilise comme entrée l'image de composant connecté 402 considérée dans l'image des éléments d'avant-plan et fournit une couleur moyenne 503.

La série 500 d'étapes commence avec la création 590 d'une image 591 de pixels vides pour le composant connecté considéré. L'image 591 a la même taille que l'image 404 de composant connecté considérée dans le masque opérant 253. Un pixel dans l'image 591 de pixels vides correspond à un seul pixel dans l'image 404 de composant connecté considérée dans le masque opérant 253.

La série 500 d'étapes comprend une boucle 560 sur les pixels noirs de l'image de composant connecté 404 considérée dans le masque qui correspond à l’image de composant connecté 402 considérée dans l'image des éléments d'avant-plan. La boucle 560 remplace, dans l'image 591 de pixels vides pour le composant connecté considéré, tout pixel qui est noir dans l'image 404 du composant connecté dans le masque opérant 253 par un pixel de couleur 506.

Chaque pixel noir 504 de l'image de composant connecté 404 dans le masque est pris en considération à son tour. Une étape d'établissement de la valeur du pixel égale à la couleur moyenne 505 utilise comme entrées le pixel noir 504 de l'image de composant connecté 404 dans le masque qui correspond à l'image de composant connecté 402 considérée dans l’image des éléments d'avant-plan et la couleur moyenne 503, et génère un pixel de couleur 506 à l'emplacement du pixel 504 dans l'image de composant connecté 507 dans l'image de transition. Le pixel de couleur 506 remplace un pixel vide de l'image 591 de pixels vides. Puis, un autre pixel noir 504 de l'image de composant connecté 404 dans le masque qui correspond à l'image de composant connecté 402 considérée dans l'image des éléments d'avant-plan est pris en considération et ainsi de suite pour tous les pixels noirs de l'image de composant connecté 404 dans le masque qui correspond à l'image de composant connecté 402 considérée dans l'image des éléments d'avant-plan. À la fin de la boucle 560, un composant connecté 507 dans l’image de transition 203 est formé par les pixels de couleur 506 qui sont situés aux emplacements des pixels noirs 504 du composant connecté 404 correspondant dans le masque opérant 253 et par des pixels vides qui sont situés aux emplacements des pixels blancs du composant connecté 404 correspondant dans le masque opérant 253 et qui proviennent de l'image vide 591. Par conséquent, le composant connecté 412 dans l'image de transition 203 a la même échelle que le composant connecté 404 correspondant dans le masque opérant 253.

Après soit la série 400 d'étapes soit la série 500 d'étapes, une autre image de composant connecté 402 dans l'image des éléments d'avant-plan est prise en considération dans la boucle 550 et l'étape de vérification 501 est effectuée. A la fin de l'étape de détermination 300C d'une image de transition, toutes les images de composants connectés 412 (générées dans la série 400 d'étapes) et 507 dans l'image de transition forment l'image de transition 203.

Pour chaque image de composant connecté 402 dans l'image des éléments d’avant-plan, l'étape de vérification 501 contrôle si ladite image de composant connecté 402 dans l'image des éléments d'avant-plan comprend des pixels de couleur nettement différents. Un procédé pour effectuer une telle vérification consiste à déterminer l'écart standard de la couleur des pixels non vides de l’image de composant connecté 402 et de considérer que les couleurs sont nettement différentes si ledit écart standard est plus grand qu'un seuil. Si les couleurs d'une image de composant connecté 402 ne sont pas nettement différentes, une moyenne globale des couleurs sur la totalité du composant connecté (ne prenant pas en considération des pixels vides) fournit une estimation satisfaisante de l'ensemble des couleurs de l'image de composant connecté tout en conduisant à la possibilité d'un taux de compression plus élevé que les moyennes locales parce qu'une région avec les mêmes valeurs de couleur a besoin de moins de bits pour la compression que quand les valeurs sont différentes. Cela correspond à la série 500 d'étapes qui a pour résultat des composants connectés 507 unicolores dans l'image de transition. Si les couleurs d'une image de composant connecté 402 sont nettement différentes, l'établissement d'une moyenne sur la totalité de l'image de composant connecté ne fournirait pas une estimation satisfaisante des couleurs du composant connecté et ne fournirait pas en fin de compte une bonne couche d'avant-plan 12. Il est par conséquent préférable d'effectuer une moyenne locale des couleurs. Cela correspond à la série 400 d'étapes.

Le moyennage de couleur 502 pour une image de composant connecté 402 donnée dans l'image des éléments d'avant-plan est un moyennage de couleur portant sur les couleurs de tous les pixels non vides de l'image de composant connecté 402 dans l'image des éléments d'avant-plan qui correspond à l'image de composant connecté 404 dans le masque. Lesdits pixels correspondent aux pixels noirs dans le masque initial 104 à l'emplacement de ladite image de composant connecté. Le moyennage 502 de couleur et l'étape 505 d'établissement des couleurs des pixels comme étant égales à la moyenne 503 sont équivalentes à considérer que la fenêtre de moyennage de tous les pixels 504 est l'image de composant connecté 402 complète dans l'image des éléments d'avant-plan. Le moyennage 502 de couleur portant sur l'image de composant connecté 402 complète fournit ta couleur moyenne 503 qui est assignée à l'étape 505 à tout pixel 504 de l'image de composant connecté qui est noir dans le masque opérant 253. Tout pixel 409 de l'image de composant connecté qui est blanc dans le masque opérant 253 est établi comme étant vide à l'étape 410. La collection de pixels de couleur 506 et de pixels vides 411 forment l’image de composant connecté 507 dans l'image de transition si la série 500 d'étapes est utilisée. L'image de composants connectés 412 fournie par la série 400 d'étapes, qui peut comprendre plusieurs couleurs, et l'image de composants connectés 507 avec des composants connectés unicolores fournie par la série 500 d'étapes forment l'image de transition 203 fournie par la détermination 300C de l'image de transition.

Le présent document comprend la description de deux algorithmes ou procédés 200A et 200B de construction de la couche d'avant-plan, chacun d'eux comprenant une étape de détermination 300 d'une image de transition. Le présent document comprend également la description de trois algorithmes ou procédé 300A, 300B et 300C de détermination de l'image de transition. Des modes de réalisation de la présente invention comprennent la combinaison de l'un quelconque des procédés 200A et 200B avec l'un quelconque des procédés 300A, 300B et 300C,

Claims

Revendications

1. Procédé permettant de créer, à partir d'une image numérique initiale (11), une image d'avant-plan (12) à utiliser dans la compression d'images, comprenant les étapes de a/ création d’une image de masque binaire (253) à partir de l’image numérique initiale (11), chaque pixel de l'image de masque binaire (253) étant créé à partir d'une première fenêtre de pixels correspondante dans l’image numérique initiale (11), et ladite image de masque binaire (253) comprenant un premier ensemble de pixels qui sont d'une première valeur et un deuxième ensemble de pixels qui sont d'une deuxième valeur; bf génération d'une image de transition (203) qui a une quantité de pixels égale à la quantité de pixels de l'image de masque binaire (253) en déterminant pour chaque pixel de l'image de transition (203) correspondant à un pixel du premier ensemble de pixels dans l'image de masque binaire (253) une deuxième fenêtre de pixels correspondante dans l'image numérique initiale (11), la deuxième fenêtre de pixels comprenant plus de pixels que la première fenêtre de pixels, déterminant une couleur pour chaque pixel de l'image de transition (203) correspondant à un pixel du premier ensemble de pixels dans l'image de masque binaire (253) par un calcul basé sur les couleurs des pixels dans la deuxième fenêtre correspondante, et établissant chaque pixel de l'image de transition (203) correspondant à un pixel du deuxième ensemble de pixels dans l’image de masque binaire (253) comme étant vide; et cl création de l'image d'avant-plan (12) à partir de l'image de transition (203) en gardant la couleur des pixels non vides et détermination d'une couleur pour les pixels vides en utilisant les pixels non vides voisins.
2. Procédé selon la revendication 1, dans lequel la première fenêtre de pixels comprend un pixel.
3. Procédé selon la revendication 1, dans lequel la première fenêtre de pixels comprend une fenêtre η x n de pixels, n étant au moins 2.
4. Procédé selon l'une quelconque des revendications précédentes, dans lequel le calcul basé sur les couleurs des pixels dans la deuxième fenêtre correspondante est un moyennage.
5. Procédé selon l'une quelconque des revendications précédentes, dans lequel l'emplacement du centre d'un pixel dans l'image de transition correspond à l'emplacement du centre de la deuxième fenêtre de pixels correspondante dans l'image numérique initiale,
6. Procédé selon l'une quelconque des revendications précédentes, comprenant en outre une étape (205) de réduction de la résolution de l'image de transition (203) par l'étape b) et l'étape c).
7. Procédé selon l'une quelconque des revendications précédentes, dans lequel à l'étape c) la couleur des pixels vides est déterminée à partir des pixels non vides en utilisant un algorithme séquentiel à deux étapes.
8. Procédé selon l'une quelconque des revendications précédentes, comprenant en outre l’étape de création à partir de l'image numérique initiale (11) de groupes (402) de pixels, dans lequel la couleur de chaque pixel dans l'image de transition (203) est déterminée indépendamment pour chaque groupe (402) de pixels.
9. Procédé selon la revendication 8, comprenant en outre l'étape de découpage de l'image de masque binaire (253) en groupes (404) de pixels correspondant aux groupes (402) de pixels dans l'image numérique initiale (11).
10. Procédé selon la revendication 8 ou 9, dans lequel chaque groupe (402) de pixels dans l'image initiale (11) contient au moins un de: un seul composant connecté, un seul élément textuel, un seul élément lineart ou un seul caractère.
11. Procédé selon l'une quelconque des revendications 8 à 10, comprenant en outre les étapes consistant à détecter si, dans un groupe (402) de pixels dans l'image numérique initiale (11), les pixels correspondant aux pixels du premier ensemble de pixels de l'image de masque binaire ont des couleurs qui sont nettement différentes, et, à déterminer, si les pixels dans l'image numérique initiale (11) n’ont pas des couleurs nettement différentes, la couleur moyenne (503) des pixels dans l'image numérique initiale (11) et à appliquer la couleur moyenne (503) sur chaque pixel dans l'image de transition (203) correspondant au groupe de pixels dans l'image numérique initiale (11) et correspondant aux pixels dans le premier ensemble de pixels de l'image de masque binaire (253).
12. Procédé de compression (10) pour compresser une image numérique initiale (11) d'un document numérisé par balayage, ledit procédé de compression (10) comprend l'étape de segmentation de l'image numérique initiale (11) en multiples couches d'image comprenant une image d'avant-plan (12) contenant des informations de couleur pour les éléments d'avant-plan dudit document, une image d'arrière-plan (14) contenant des informations de couleur pour des éléments d’arrière-plan dudit document et une image binaire (13) pour sélectionner entre pixels dans ladite image d’avant-plan (12) et ladite image d’arrière-plan (14), dans lequel ladite image d'avant-plan (12) est créée selon un quelconque des procédés des revendications 1 à 11.
13. Support non temporaire lisible par ordinateur stockant un programme amenant un ordinateur à exécuter un procédé selon l'un quelconque des procédés des revendications 1 à 12.
14. Système comprenant un processeur et un support non temporaire lisible par ordinateur stockant un programme amenant le processeur à exécuter un quelconque des procédés des revendications 1 à 12.
15. Système selon la revendication 14 comprenant en outre un dispositif d'imagerie pour capturer l'image numérique initiale.