EP1020083A1 - Procede de controle du taux de compression d'images numeriques - Google Patents

Procede de controle du taux de compression d'images numeriques

Info

Publication number
EP1020083A1
EP1020083A1 EP98943619A EP98943619A EP1020083A1 EP 1020083 A1 EP1020083 A1 EP 1020083A1 EP 98943619 A EP98943619 A EP 98943619A EP 98943619 A EP98943619 A EP 98943619A EP 1020083 A1 EP1020083 A1 EP 1020083A1
Authority
EP
European Patent Office
Prior art keywords
scale factor
compression ratio
compression
compression rate
rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP98943619A
Other languages
German (de)
English (en)
Inventor
Javier Bracamonte
Frédéric BARMAN
Michael Ansorge
Fausto Pellandini
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asulab AG
Original Assignee
Asulab AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asulab AG filed Critical Asulab AG
Publication of EP1020083A1 publication Critical patent/EP1020083A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output

Definitions

  • the present invention relates to a method for controlling the compression rate of digital images.
  • the compression ratio i.e. the number of bits in the uncompressed image divided by the number of bits in the compressed image
  • the compression rate of an image of a cloudy sky is equal to twice or triple, or even more, the compression rate of an image of a crowd in a stadium.
  • Controlling the compression ratio is also important in networks that transmit still images or sequences of images.
  • the time specified for transmitting a compressed image is fixed or, at the very least, limited and must not exceed a certain value, which excludes the use of coding schemes which do not control the rate of compression.
  • the present invention proposes to carry out an image compression process in which it is possible to choose the compression ratio with excellent precision.
  • the method according to the invention is characterized in that it includes the operations of:
  • the conventional compression method is the JPEG method
  • the parameter on which it is acted is a scaling factor used to modify the values of the normalization matrix used by the algorithm of the JPEG method.
  • an initial scale factor is advantageously defined, the JPEG method is applied for the first time using this initial scale factor and the said method is again applied by modifying the scale factor if the actual compression ratio is outside the tolerance range of the set compression ratio.
  • the scaling factor is increased when the actual compression ratio is lower than the nominal compression ratio, and it is decreased when the actual compression ratio is greater than the nominal compression ratio.
  • the scale factor is modified as a function of an at least partially linear model representing the compression ratio as a function of the scale factor.
  • the actual compression ratio is determined using said initial scale factor, the curve representing the compression ratio as a function of the scale factor is approximated by a straight line having a predefined slope m 0 and passing through a point having for abscissa the initial scale factor and for ordinate the real compression ratio obtained by applying the JPEG process with the initial scale factor, a scale factor is determined from the approximation line and the set compression rate, the JPEG process is applied using this new scale factor, it is determined whether the actual compression ratio is within the tolerance range of the set compression ratio, the process is stopped if the actual compression ratio is within this range, otherwise a new scale factor is determined from a straight line approximating the curve of the actual compression ratio as a function of the scale factor.
  • the curve representing the actual compression ratio as a function of the scale factor is advantageously approximated by line segments having different slopes and forming a continuous curve.
  • FIG. 1 is a block diagram illustrating a first embodiment of the method according to the present invention
  • FIG. 3 is a block diagram of a second embodiment of the method according to the present invention.
  • FIGS. 4a to 4d represent the compression ratio at different stages of the method of FIG. 3.
  • the method according to the present invention is based on the JPEG algorithm and is perfectly compatible with it. The main steps of this algorithm are defined below.
  • the image to be compressed is separated into blocks of 8 x 8 pixels. Each block is then processed sequentially, identically. The process steps are described below for an 8 x 8 pixel block.
  • Each block is associated with a matrix of eight lines and eight columns, hereinafter called "matrix of a block”.
  • This matrix is multiplied by the core of a linear transform known under the abbreviation 2D-DCT (2 dimensions - Discrete Cosine Transform), as defined in the JPEG algorithm.
  • 2D-DCT 2 dimensions - Discrete Cosine Transform
  • This discrete cosine transform (TCD) converts the 8 x 8 pixels of the spatial domain into 8 x 8 coefficients in the so-called frequency domain.
  • TCD discrete cosine transform
  • This transformation produces a resulting matrix containing relatively large values in an area toward the upper left of the matrix, and relatively small values elsewhere.
  • the size of the area containing the large values depends on the complexity of the image.
  • a normalization matrix is defined. This matrix is used to quantify the TCD coefficients which are visually significant with a small quantization step, while, for the rest of the coefficients, larger quantization steps are used.
  • the quantification of the TCD coefficients is the main mechanism of compression, but also of information loss.
  • the system increases the compression level by doing an entropy coding of the quantizer output.
  • the normalization matrix can be scaled by a factor, called a scaling factor, which can take any real value greater than zero. By modifying the value of this factor, one can modify the compression ratio given by the JPEG method. The greater the value of the scale factor, the greater the compression ratio obtained and vice versa.
  • the present invention defines an efficient way to find this scale factor by doing a minimum number of iterations, with a method which in no way degrades the quality of the compressed image.
  • the proposed method is based on the demonstration by the inventors that the ratio between the scale factor and the compression ratio obtained with JPEG compression is of a quasi-linear nature.
  • the invention is based on the discovery that it is possible to define a relationship between the scale factor and the image compression rate. This relation can be represented graphically by placing the scale factor SF on the abscissa axis and the compression ratio CR on the ordinate axis.
  • This first embodiment of the method is based on a strictly linear model of the compression ratio as a function of the scale factor.
  • the final compression ratio to be achieved is fixed. This rate is called the setpoint compression rate and abbreviated as
  • This rate can be set either permanently in the compression rate control system, or by the user depending on the quality of the desired image, the number of images to be saved in a given memory or the capacity of a transmission channel in particular.
  • an initial scale factor SFi is defined.
  • this initial scale factor is defined once and for all. According to the described embodiment of the method, the initial scale factor is fixed at 1.
  • the JPEG algorithm is used, in a second step 11, to compress an input image, the real compression rate CR 1 being calculated in this same step.
  • step 12 of the method the relative error between the actual compression rate CR T obtained and the reference compression rate CR T is determined . If this relative error is less than a predefined threshold value, for example ⁇ 5%, the process is stopped and the image is stored or transmitted. This corresponds to step 30 of FIG. 1. The difference between the set compression rate and the actual compression rate is noted ⁇ CR in FIG. 2d.
  • a predefined threshold value for example ⁇ 5%
  • step 13 consists in defining a line representing the compression ratio as a function of the scale factor, this line modeling the real curve of the compression ratio as a function of the scale factor.
  • step 14 of the method the value of the scale factor corresponding to the compression ratio to be reached is determined, by means of the line defined above.
  • the JPEG algorithm is again used with the scale factor SF 2 .
  • the actual compression ratio CR 2 is determined.
  • Figure 2c A point P 2 , having the coordinates SF 2 and CR 2 , is illustrated in FIG. 2c.
  • step 16 the value CR 2 obtained is compared with the value of the compression ratio CR T. If their difference is less than 5%, the process is stopped.
  • step 18 of the method The determination of this value SF is carried out in step 18 of the method.
  • the JPEG algorithm is again used to obtain the actual compression ratio CR 3 . This corresponds to step 19 in Figure 1.
  • This actual compression rate CR 3 is compared, in step 20, to the set compression rate CR T and the process is stopped if these two rates have a difference less than a predefined value. Otherwise, the method is carried out using as straight line the line passing through the last two points having the pairs of coordinates SF and CR calculated.
  • FIG. 2d also illustrates the real curve of the compression ratio as a function of the scale factor. This curve has the reference 113.
  • the compression ratio as a function of the scale factor is approximated by a straight line
  • the compression ratio is approximated by straight line segments forming a continuous curve, the slope of each segment varying in different areas of the scale factor, as a function of the actual compression ratio obtained after an iteration using SFi as a scale factor.
  • a step 40 the set compression rate CR T is introduced .
  • the real compression ratio CRi is determined by applying the JPEG method with a given scale factor SFi, for example equal to 2.
  • a step 42 the value of CRi is compared with the setpoint value CR T. If the relative error of these two values is less than a predefined threshold value, for example 5%, the process is stopped and the image is stored or transmitted. This corresponds to step 50. Otherwise, the process continues with the step described below.
  • a predefined threshold value for example 5%
  • each zone is formed by a segment having a given slope.
  • the most suitable line is chosen, that is to say the one which best approximates the real curve of the compression ratio as a function of the scale factor. This is carried out in step 43 of the method illustrated in FIG. 3.
  • the scale factor SF 2 which could correspond to the set compression rate CR T is then estimated, using the segment model given by the appropriate slope m and by the point (CRi, SFi).
  • the JPEG process is again applied using SF 2 , which results in a compression rate CR 2 .
  • step 45 if the relative error between this calculated rate CR 2 and the set compression rate CR T is less than a predefined threshold value, for example ⁇ 5%, the process is stopped. Otherwise, an additional iteration of the process is performed.
  • a predefined threshold value for example ⁇ 5%
  • the number of iterations depends on the desired precision.
  • the process is stopped as soon as the set compression rate is reached, within a limit depending on this desired precision.
  • the set compression ratio is given, abbreviated as CR T as illustrated in FIG. 4a.
  • This figure also includes a curve 200 representing the compression ratio as a function of the scale factor.
  • the input image is compressed using a scale factor equal to 2.
  • the resulting compression ratio is called CRi (see Fig. 4a). If the absolute value of the relative error between CR T and CRi is smaller than a predetermined threshold value, for example 5%, the process is stopped. Otherwise, it continues.
  • zone No. 4 is first used of the Board.
  • This scale factor is called SF 2 (see Fig. 4a).
  • This compression ratio is called SF 2 .
  • the previous value of SF 2 becomes SF 2 '.
  • the input image is then compressed using the normalization matrix scaled by the value of SF 2 .
  • CR 2 is called the resulting compression ratio (see Fig. 4c).
  • CR 3 is called the resulting compression ratio (see Fig. 4d). If the relative error between CR 3 and CR T is less than a predetermined threshold value, the process is stopped. Otherwise, the process continues similarly to what has been described previously.
  • the method according to the present invention makes it possible to choose the compression rate and thus to choose the memory space necessary to store an image, or the required transmission time.
  • This choice of compression ratio can be made by the user or be predefined when designing the coding system for several compression ratio values, so that it cannot be changed.
  • the present invention is not limited to the embodiments described, but extends to any variant obvious to a person skilled in the art.
  • the initial scale factor can be changed so that it achieves the desired result as quickly as possible.
  • the modeling of the compression ratio curve as a function of the scale factor can be refined.
  • the tolerance on the value of the compression ratio can be chosen as a function of the precision required.
  • the description of the invention refers to the case where the set compression ratio can be chosen within a range of values corresponding to the greatest possible number of applications of the system.
  • the set compression rate is limited to a few previously defined and constant values, it is possible, while remaining within the scope of the invention, to optimize the ratios of the scale factor to the compression rate so as to reduce at 2 the number of iterations the system needs to converge at the set compression rate.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

La présente invention concerne un procédé de contrôle du taux de compression d'images numériques. Ce procédé consiste à comprimer une image numérisée au moyen d'un procédé conventionnel tel que celui connu sous l'abréviation JPEG. En modifiant un paramètre du procédé JPEG, appelé le facteur d'échelle, on modifie le taux de compression de l'image. Selon l'invention, ce facteur d'échelle est modifié jusqu'à ce que le taux de compression obtenu soit compris dans une plage de tolérance du taux de compression souhaité. Le procédé utilise une approximation de la courbe réelle du taux de compression en fonction du facteur d'échelle afin de minimiser le nombre d'itérations nécessaires pour atteindre le taux de compression souhaité.

Description

PROCEDE DE CONTROLE DU TAUX DE COMPRESSION D'IMAGES NUMERIQUES
La présente invention concerne un procédé de contrôle du taux de compression d'images numériques.
La quantité d'images numériques augmente chaque jour au fur et à mesure que l'on en trouve de nouvelles applications. Cependant, pour représenter une seule image numérique, une quantité énorme de données est nécessaire. De façon générale, cette quantité de données est si grande que le stockage et la transmission des images dans leur représentation originale sont trop coûteux et donc peu pratiques, aussi bien du point de vue du traitement numérique de signaux que d'un point de vue économique.
A ce jour, différents algorithmes de compression d'images ont été développés. Un effort conjoint entre l'ITU (International Télécommunication Union) et de l'ISO (International Organization for Standardization) a eu comme résultat la création d'un standard de compression d'image fixes connu sous le nom de JPEG (Joint Photographie Expert Group). Cet algorithme est défini dans "ITU-
T Recommendation T.81 , Digital Compression and Coding of Continuous-tone Still Images" (September 1992) et amplement illustré dans "W.B. Pennebaker and J.L. Mitchell, "JPEG Still Image Compression Standard", Van Nostrand Reinhold, New York, NY, USA, 1993.
En utilisant l'algorithme JPEG, le taux de compression, c'est-à-dire le nombre de bits de l'image non compressée divisé par le nombre de bits de l'image compressée, est variable en fonction de la complexité de l'image. Ainsi, par exemple, pour une qualité de restitution sensiblement identique, le taux de compression d'une image d'un ciel peu nuageux est égal au double ou au triple, voire plus, du taux de compression d'une image d'une foule dans un stade.
Dans un grand nombre d'applications, il est souhaitable ou nécessaire que l'utilisateur et/ou le système puisse contrôler le taux de compression des images acquises. Dans un appareil de prises de vues numériques, tel qu'un appareil photo, il est important de pouvoir prévoir la taille des images compressées, afin de garder sous contrôle l'allocation de la mémoire de l'appareil.
Contrôler le taux de compression est également important dans les réseaux qui transmettent des images fixes ou des séquences d'images. Dans ces réseaux, le temps spécifié pour transmettre une image compressée est fixe ou, tout au moins, limité et ne doit pas dépasser une certaine valeur, ce qui exclut l'utilisation de schémas de codage qui n'ont pas de contrôle du taux de compression.
La présente invention se propose de réaliser un procédé de compression d'images dans lequel il est possible de choisir le taux de compression avec une excellente précision.
Pour atteindre ce but, le procédé selon l'invention est caractérisé en ce qu'il comporte les opérations de:
- compression d'une image numérisée au moyen d'un procédé conventionnel comportant au moins un paramètre permettant de modifier le taux de compression, c'est-à-dire le rapport de la taille de l'image non comprimée à la taille de l'image comprimée,
- détermination du taux de compression dudit procédé conventionnel,
- vérification que le taux de compression est compris dans une plage de tolérance d'une valeur de taux de compression de consigne, - modification dudit paramètre si le taux de compression n'est pas compris dans la plage de tolérance, et
- répétition de la compression de l'image jusqu'à ce que le taux de compression soit compris dans la plage de tolérance.
Selon une forme de réalisation préféré, le procédé de compression conventionnel est le procédé JPEG, et le paramètre sur lequel on agit est un facteur d'échelle servant à modifier les valeurs de la matrice de normalisation utilisée par l'algorithme du procédé JPEG.
Dans le procédé selon la présente invention, on définit avantageusement un facteur d'échelle initial, on applique une première fois le procédé JPEG en utilisant ce facteur d'échelle initial et on applique à nouveau ledit procédé en modifiant le facteur d'échelle si le taux de compression réel n'est pas compris dans la plage de tolérance du taux de compression de consigne.
Selon un mode de réalisation avantageux du procédé, on augmente le facteur d'échelle lorsque le taux de compression réel est inférieur au taux de compression de consigne, et on le diminue lorsque le taux de compression réel est supérieur au taux de compression de consigne.
Avantageusement, le facteur d'échelle est modifié en fonction d'un modèle au moins partiellement linéaire représentant le taux de compression en fonction du facteur d'échelle.
De préférence, on détermine le taux de compression réel en utilisant ledit facteur d'échelle initial, on approxime la courbe représentant le taux de compression en fonction du facteur d'échelle par une droite ayant une pente prédéfinie m0 et passant par un point ayant pour abscisse le facteur d'échelle initial et pour ordonnée le taux de compression réel obtenu en appliquant le procédé JPEG avec le facteur d'échelle initial, on détermine un facteur d'échelle à partir de la droite d'approximation et du taux de compression de consigne, on applique le procédé JPEG en utilisant ce nouveau facteur d'échelle, on détermine si le taux de compression réel est compris dans la plage de tolérance du taux de compression de consigne, on arrête le procédé si le taux de compression réel est compris dans cette plage, sinon on détermine un nouveau facteur d'échelle à partir d'une droite approximant la courbe du taux de compression réel en fonction du facteur d'échelle.
Selon une variante de réalisation, la courbe représentant le taux de compression réel en fonction du facteur d'échelle est avantageusement approximée par des segments de droites ayant des pentes différentes et formant une courbe continue.
La présente invention sera mieux comprise en référence à deux modes de réalisation non limitatifs de l'invention et aux dessins annexés dans lesquels :
- la figure 1 est un schéma-bloc illustrant une première forme de réalisation du procédé selon la présente invention ;
- les figures 2a à 2d représentent schématiquement le taux de compression à différentes étapes du procédé de la figure 1 ;
- la figure 3 est un schéma-bloc d'une deuxième forme de réalisation du procédé selon la présente invention ; et
- les figures 4a à 4d représentent le taux de compression à différentes étapes du procédé de la figure 3. Le procédé selon la présente invention est basé sur l'algorithme JPEG et est parfaitement compatible avec celui-ci. Les étapes principales de cet algorithme sont définies ci-dessous.
L'image à compresser est séparée en blocs de 8 x 8 pixels. De manière séquentielle, chaque bloc est ensuite traité séparément, de façon identique. Les étapes du procédé sont décrites ci-après pour un bloc de 8 x 8 pixels.
Chaque bloc est associé à une matrice de huit lignes et de huit colonnes, appelée par la suite "matrice d'un bloc".
Cette matrice est multipliée par le noyau d'une transformée linéaire connue sous l'abréviation 2D-DCT (2 dimensions - Discrète Cosine Transform), telle que définie dans l'algorithme JPEG. Cette transformée en cosinus discrète (TCD) convertit les 8 x 8 pixels du domaine spatial en 8 x 8 coefficients dans le domaine dit fréquentiel. Le but de cette transformation est de décorreler les données originales et de redistribuer l'énergie du signal entre un faible nombre de coefficients, dans la partie des basses fréquences du spectre de la transformée.
Cette transformation produit une matrice résultante contenant des valeurs relativement grandes, dans une zone située vers la partie supérieure gauche de la matrice, et des valeurs relativement petites ailleurs. La dimension de la zone contenant les grandes valeurs dépend de la complexité de l'image.
Basée sur une analyse psychovisuelle, une matrice de normalisation est définie. Cette matrice est utilisée pour quantifier les coefficients TCD qui sont significatifs du point de vue visuel avec un faible pas de quantification, tandis que, pour le reste des coefficients, on utilise des pas de quantification plus grands. La quantification des coefficients TCD est le principal mécanisme de compression, mais aussi de perte d'information. Le système augmente le niveau de compression en faisant un codage d'entropie de la sortie du quantificateur.
La matrice de normalisation peut être mise à l'échelle par la voie d'un facteur, dit facteur d'échelle, qui peut prendre n'importe quelle valeur réelle plus grande que zéro. En modifiant la valeur de ce facteur, on peut modifier le taux de compression donné par la méthode JPEG. Plus la valeur du facteur d'échelle est grande, plus le taux de compression obtenu devient grand et vice versa.
La présente invention définit une façon efficace de trouver ce facteur d'échelle en faisant un nombre minimum d'itérations, avec une méthode qui ne dégrade en aucune manière la qualité de l'image compressée.
Le procédé proposé est basé sur la mise en évidence par les inventeurs que le rapport entre le facteur d'échelle et le taux de compression obtenu avec la compression JPEG est de nature quasi-linéaire.
Une première forme de réalisation du procédé est décrite ci-dessous en référence aux figures 1 et 2.
Comme déjà mentionné, l'invention repose sur la découverte qu'il est possible de définir une relation entre le facteur d'échelle et le taux de compression de l'image. Cette relation peut être représentée graphiquement en plaçant le facteur d'échelle SF sur l'axe des abscisses et le taux de compression CR sur l'axe des ordonnées. Cette première forme de réalisation du procédé est basée sur un modèle strictement linéaire du taux de compression en fonction du facteur d'échelle.
Dans une première étape 10 du procédé, on fixe le taux de compression final à atteindre. Ce taux est appelé taux de compression de consigne et abrégé en
CRT. Il est représenté par une droite portant la référence 110 sur les figures 2a à 2d. Ce taux peut être fixé soit définitivement dans le système de contrôle du taux de compression, soit par l'utilisateur en fonction de la qualité de l'image voulue, du nombre d'images à enregistrer dans une mémoire donnée ou de la capacité d'un canal de transmission notamment.
Dans cette même étape 10 du procédé, on définit un facteur d'échelle initial SFi . Généralement, ce facteur d'échelle initial est défini une fois pour toutes. Selon le mode de réalisation décrit du procédé, le facteur d'échelle initial est fixé à 1.
L'algorithme JPEG est utilisé, dans une deuxième étape 11 , pour compresser une image d'entrée, le taux de compression réel CR1 étant calculé dans cette même étape.
Dans l'étape 12 du procédé, on détermine l'erreur relative entre le taux de compression réel CRT obtenu et le taux de compression de consigne CRT. Si cette erreur relative est inférieure à une valeur de seuil prédéfinie, par exemple à ± 5%, le procédé est arrêté et l'image est stockée ou transmise. Ceci correspond à l'étape 30 de la figure 1. La différence entre le taux de compression de consigne et le taux de compression réel est noté ΔCR dans la figure 2d.
Dans le cas contraire, l'étape 13 consiste à définir une droite représentant le taux de compression en fonction du facteur d'échelle, cette droite modélisant la courbe réelle du taux de compression en fonction du facteur d'échelle. La droite passe par un point Pi ayant comme abscisse SFi = 1 et comme ordonnée CR^ Sa pente est définie dans le système de contrôle du taux de compression. Cette pente est déterminée comme la pente moyenne d'un ensemble d'images test.
La droite peut s'écrire de la façon suivante : cr = m0 . sf + b0 où cr est le taux de compression, sf le facteur d'échelle et b0 l'ordonnée à l'origine. Cette droite porte la référence 111 sur les figures 2b, 2c et 2d.
La valeur de b0 est donnée par :
On détermine ensuite, dans l'étape 14 du procédé, la valeur du facteur d'échelle correspondant au taux de compression à atteindre, au moyen de la droite définie ci-dessus.
Au taux de compression de consigne, on a: CRT = m0 . SF2 + b0 , d'où
SF2 = (CRT - b0) / m0
Ceci permet de calculer un nouveau facteur d'échelle en fonction des taux de compression de consigne et du taux de compression réel obtenu en première approximation.
A cette étape du procédé, on utilise de nouveau l'algorithme JPEG avec le facteur d'échelle SF2. Ceci correspond à l'étape 15 de la figure 1. Dans cette même étape, le taux de compression réel CR2 est déterminé. Ceci correspond à la figure 2c. Un point P2 , ayant les coordonnées SF2 et CR2, est illustré dans la figure 2c.
Dans l'étape 16, la valeur CR2 obtenue est comparée avec la valeur du taux de compression CRT. Si leur différence est inférieure à 5%, le procédé est arrêté.
Dans le cas contraire, on utilise une droite modélisée passant par le point P^ ayant pour abscisse SF1 = 1 et pour ordonnée CRi et par le point P2 ayant pour abscisse SF2 et pour ordonnée CR2. Ceci est effectué dans l'étape 17. Cette droite porte la référence 112 sur la figure 2d. Elle a une pente mi donnée par : m! = (CR2- CR-,) / (SF2 - SF
Comme précédemment, on définit un nouveau modèle: dans lequel: CRi - (m,. SF = CR2 - (m! . SF2)
Au point de consigne du taux de compression CRT, on a: d'où
La détermination de cette valeur SF est effectuée dans l'étape 18 du procédé. On utilise encore une fois l'algorithme JPEG pour obtenir le taux de compression réel CR3. Ceci correspond à l'étape 19 de la figure 1.
Ce taux de compression réel CR3 est comparé, dans l'étape 20, au taux de compression de consigne CRT et le procédé est arrêté si ces deux taux ont une différence inférieure à une valeur prédéfinie. Dans le cas contraire, le procédé est réalisé en utilisant comme droite d'approximation la droite passant par les deux derniers points ayant les couples de coordonnées SF et CR calculés.
Le procédé se poursuit jusqu'à ce que la valeur du taux de compression réel soit dans les limites acceptables pour le taux de compression de consigne. Généralement, cette condition est réalisée après une à trois itérations lorsque la différence relative entre le taux de compression réel et le taux de compression de consigne doit être inférieure ou égale à 5%. La figure 2d illustre, en outre, la courbe réelle du taux de compression en fonction du facteur d'échelle. Cette courbe porte la référence 113.
Les figures 3 et 4 illustrent une deuxième forme de réalisation du procédé selon la présente invention dans laquelle le nombre d'itérations peut être réduit. Ce but est atteint en commençant le procédé tel que décrit ci-dessus en utilisant un facteur d'échelle initial SF1 = 2, et en utilisant une meilleure approximation de la courbe représentant le taux de compression en fonction du facteur d'échelle.
Dans le mode de réalisation illustré par les figures 1 et 2, le taux de compression en fonction du facteur d'échelle est approximé par une droite, alors que dans le mode de réalisation illustré par les figures 3 et 4, le taux de compression est approximé par des segments de droite formant une courbe continue, la pente de chaque segment variant dans différentes zones du facteur d'échelle, en fonction du taux de compression réel obtenu après une itération en utilisant SFi comme facteur d'échelle.
Dans une étape 40, on introduit le taux de compression de consigne CRT . Dans une étape 41 , on détermine le taux de compression réel CRi en appliquant le procédé JPEG avec un facteur d'échelle SFi donné, par exemple égal à 2.
Dans une étape 42 , on compare la valeur de CRi à la valeur de consigne CRT. Si l'erreur relative de ces deux valeurs est inférieure à une valeur de seuil prédéfinie, par exemple 5%, le procédé est arrêté et l'image est stockée ou transmise. Ceci correspond à l'étape 50. Dans le cas contraire, le procédé se poursuit par l'étape décrite ci-dessous.
L'approximation de la courbe du taux de compression en fonction du facteur d'échelle permet de définir des zones de pente différente. Chaque zone est formée d'un segment ayant une pente donnée. La valeur de la pente pour chaque zone est choisie en fonction de la valeur de CRi, d'après les équations m = f(CRι) du tableau ci-dessous dans lequel, à titre d'exemple de réalisation concret, on a défini six zones formant six segments de droites.
En fonction de la valeur réelle de CRi, on choisit la droite la mieux adaptée, c'est-à-dire celle qui approximé le mieux la courbe réelle du taux de compression en fonction du facteur d'échelle. Ceci est réalisé dans l'étape 43 du procédé illustré par la figure 3. Dans une étape 44, on estime ensuite le facteur d'échelle SF2 qui pourrait correspondre au taux de compression de consigne CRT, en utilisant le modèle de segment donné par la pente m appropriée et par le point (CRi, SFi). On applique de nouveau le procédé JPEG en utilisant SF2, ce qui donne comme résultat un taux de compression CR2.
Selon l'étape 45, si l'erreur relative entre ce taux calculé CR2 et le taux de compression de consigne CRT est inférieure à une valeur de seuil prédéfinie, par exemple ± 5%, le procédé est arrêté. Dans le cas contraire, une itération supplémentaire du procédé est effectuée.
Le nombre d'itérations dépend de la précision souhaitée. Le procédé est arrêté dès que le taux de compression de consigne est atteint, dans une limite dépendant de cette précision voulue.
Un mode de réalisation particulier est décrit en référence aux figures 4a à 4d. Dans ce mode de réalisation, on supposera que le facteur d'échelle recherché est compris entre 5 et 10.
Les étapes du procédé sont décrites ci-dessous.
On donne le taux de compression de consigne, abrégé en CRT tel qu'illustré par la figure 4a. Cette figure comporte également une courbe 200 représentant le taux de compression en fonction du facteur d'échelle.
On compresse l'image d'entrée en utilisant un facteur d'échelle égal à 2. Le taux de compression résultant est appelé CRi (voir Fig. 4a). Si la valeur absolue de l'erreur relative entre CRT et CRi est plus petite qu'une valeur de seuil prédéterminée, par exemple 5%, le procédé est arrêté. Dans le cas contraire, il se poursuit.
On détermine alors la pente de la droite approximant le taux de compression en fonction du facteur d'échelle au moyen du tableau ci-dessus. Dans l'exemple ci-dessus, le facteur d'échelle correspond à la zone No. 5 dans laquelle 5<sf<= 10. Toutefois, à partir du point (2, CRi) on utilise d'abord la zone No. 4 du tableau. En ayant la valeur de m4 et le point (SFi = 2, CRi) l'ordonnée à l'origine b est implicitement définie, de même qu'un modèle linéaire cr = m4. sf+b4, portant la référence 201. On utilise ensuite ce modèle linéaire pour trouver le facteur d'échelle qui correspond à un taux de compression cr = CRT. Ce facteur d'échelle est appelé SF2 (voir Fig. 4a).
Dans le cas illustré, SF2 > 5. On utilise ensuite le modèle linéaire 201 cr = m .sf + b4 pour trouver le taux de compression CR qui correspond à un facteur d'échelle sf = 5. Cette opération détermine le point (5, CR) (voir Fig. 4b).
On insère la valeur de CRi dans la zone no. 5 du tableau ci-dessus pour trouver la pente m5 du modèle linéaire pour la région 5<sf<=10. Ce modèle porte la référence 202 sur la figure 4b. En ayant la valeur de m5 et le point (5,CR), la valeur de b5 est implicitement définie, de même que le modèle linéaire cr = m5.sf + b5.
On utilise alors ce modèle pour trouver le facteur d'échelle qui correspond à un taux de compression cr = CRT. Ce taux de compression est appelé SF2. La valeur précédente de SF2 devient SF2'. On compresse ensuite l'image d'entrée en utilisant la matrice de normalisation mise à l'échelle par la valeur de SF2. CR2 est appelé le taux de compression résultant (voir Fig. 4c).
Si la valeur absolue de l'erreur relative entre CRT et CRi est plus petite qu'une valeur de seuil prédéterminée, par exemple 5%, le procédé est arrêté. Sinon, il est poursuivi .
Pour approximer plus précisément la valeur de CRT, un ajustement de l'ordonnée à l'origine b5 est alors nécessaire. La pente m5 et le point (SF2, CR2) définissent implicitement un modèle plus précis cr = m5.sf + b5' de la caractéristique du taux de compression en fonction du facteur d'échelle de l'image d'entrée. Avec ce nouveau modèle, on détermine le facteur d'échelle qui correspond à un taux de compression cr = CRT. Ce facteur d'échelle est appelé SF3.
Enfin, en utilisant SF3 comme facteur d'échelle de la matrice de normalisation, on compresse l'image d'entrée. CR3 est appelé taux de compression résultant (voir Fig. 4d). Si l'erreur relative entre CR3 et CRT est inférieure à une valeur de seuil prédéterminée, le procédé est arrêté. Dans le cas contraire, le procédé se poursuit de façon similaire à ce qui a été décrit précédemment.
Bien que le principe de base utilisé dans cette variante soit équivalent au principe du procédé exposé précédemment, la valeur de consigne CRT du taux de compression est atteinte plus rapidement que dans le mode de réalisation précédent.
Le procédé selon la présente invention permet de choisir le taux de compression et de choisir ainsi l'espace mémoire nécessaire pour stocker une image, ou le temps de transmission requis. Ce choix du taux de compression peut être effectué par l'utilisateur ou être prédéfini lors de la conception du système de codage pour plusieurs valeurs de taux de compression, de telle façon qu'il ne puisse pas être modifié.
La présente invention n'est pas limitée aux modes de réalisation décrits, mais s'étend à toute variante évidente pour l'homme du métier. En particulier, le facteur d'échelle initial peut être modifié de façon qu'il permette d'arriver au résultat souhaité le plus rapidement possible. De même, la modélisation de la courbe du taux de compression en fonction du facteur d'échelle peut être affinée. Par ailleurs, la tolérance sur la valeur du taux de compression peut être choisie en fonction de la précision nécessaire.
Plus précisément encore, la description de l'invention qui vient d'être faite se réfère au cas où le taux de compression de consigne peut être choisi dans une plage de valeurs correspondant au plus grand nombre possible d'applications du système. Toutefois, si le taux de compression de consigne est limité à quelques valeurs préalablement bien définies et constantes, on peut, tout en restant dans le cadre de l'invention, optimiser les rapports du facteur d'échelle au taux de compression de manière à réduire à 2 le nombre d'itérations dont le système a besoin pour converger au taux de compression de consigne.

Claims

REVENDICATIONS
1. Procédé de contrôle du taux de compression d'images numériques, caractérisé en ce qu'il comporte les opérations de: - compression d'une image numérisée au moyen d'un procédé conventionnel comportant au moins un paramètre permettant de modifier le taux de compression, c'est-à-dire le rapport de la taille de l'image non comprimée à la taille de l'image comprimée,
- détermination du taux de compression dudit procédé conventionnel, - vérification que le taux de compression est compris dans une plage de tolérance d'une valeur de taux de compression de consigne,
- modification dudit paramètre si le taux de compression n'est pas compris dans la plage de tolérance, et
- répétition de la compression de l'image jusqu'à ce que le taux de compression soit compris dans la plage de tolérance.
2. Procédé selon la revendication 1 , caractérisé en ce que ledit procédé de compression conventionnel est le procédé de Joint Photographie Expert Group, connu sous l'abréviation JPEG, et en ce que ledit paramètre est un facteur d'échelle servant à modifier les valeurs de la matrice de normalisation utilisée par l'algorithme du procédé JPEG.
3. Procédé selon la revendication 2, caractérisé en ce qu'il comporte la définition d'un facteur d'échelle initial, l'application une première fois du procédé JPEG en utilisant ce facteur d'échelle initial puis l'application dudit procédé en modifiant le facteur d'échelle si le taux de compression réel n'est pas compris dans la plage de tolérance du taux de compression de consigne.
4. Procédé selon l'une des revendications 2 et 3, caractérisé en ce que le facteur d'échelle est::
- augmenté lorsque le taux de compression réel est inférieur au taux de compression de consigne, et - diminué lorsque le taux de compression réel est supérieur au taux de compression de consigne.
5. Procédé selon la revendication 4, caractérisé en ce que le facteur d'échelle est modifié en fonction d'un modèle au moins partiellement linéaire représentant le taux de compression en fonction du facteur d'échelle.
6. Procédé selon la revendication 3, caractérisé en ce qu'il comporte:
- la détermination du taux de compression réel en utilisant ledit facteur d'échelle initial, - l'approximation de la courbe représentant le taux de compression en fonction du facteur d'échelle par une droite ayant une pente prédéfinie m0 et passant par un point ayant pour abscisse le facteur d'échelle initial et pour ordonnée le taux de compression réel obtenu en appliquant le procédé JPEG avec le facteur d'échelle initial, - la détermination d'un facteur d'échelle à partir de la droite d'approximation et du taux de compression de consigne,
- l'application du procédé JPEG en utilisant ce nouveau facteur d'échelle,
- la vérification que le taux de compression réel est compris dans la plage de tolérance du taux de compression de consigne, - l'arrêt du procédé si le taux de compression réel est compris dans cette plage, sinon
- la détermination d'un nouveau facteur d'échelle à partir d'une droite approximant la courbe du taux de compression réel en fonction du facteur d'échelle.
7. Procédé selon la revendication 6, caractérisé en ce que la courbe représentant le taux de compression réel est approximée en fonction du facteur d'échelle par des segments de droites ayant des pentes différentes et formant une courbe continue.
EP98943619A 1997-10-01 1998-09-28 Procede de controle du taux de compression d'images numeriques Withdrawn EP1020083A1 (fr)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR9712562 1997-10-01
FR9712562A FR2769161B1 (fr) 1997-10-01 1997-10-01 Procede de controle du taux de compression d'images numeriques
PCT/CH1998/000413 WO1999018734A1 (fr) 1997-10-01 1998-09-28 Procede de controle du taux de compression d'images numeriques

Publications (1)

Publication Number Publication Date
EP1020083A1 true EP1020083A1 (fr) 2000-07-19

Family

ID=9511979

Family Applications (1)

Application Number Title Priority Date Filing Date
EP98943619A Withdrawn EP1020083A1 (fr) 1997-10-01 1998-09-28 Procede de controle du taux de compression d'images numeriques

Country Status (8)

Country Link
US (1) US6668089B1 (fr)
EP (1) EP1020083A1 (fr)
JP (1) JP2001519631A (fr)
KR (1) KR100503666B1 (fr)
CN (1) CN1134169C (fr)
AU (1) AU9150498A (fr)
FR (1) FR2769161B1 (fr)
WO (1) WO1999018734A1 (fr)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7302628B2 (en) 2000-12-14 2007-11-27 Telefonaktiebolaget L M Ericsson (Publ) Data compression with incremental redundancy
US6981060B2 (en) * 2000-12-14 2005-12-27 Telefonaktiebolaget L M Ericsson (Publ) Compression based on channel characteristics
JP2004179840A (ja) * 2002-11-26 2004-06-24 Matsushita Electric Ind Co Ltd 画像データ圧縮装置および画像データ圧縮方法
JP4406640B2 (ja) * 2004-04-09 2010-02-03 ノキア コーポレイション 圧縮画像データファイルの作成方法、画像データ圧縮装置及び撮影装置
US7567722B2 (en) * 2005-03-22 2009-07-28 Qualcomm Incorporated Dynamically scaled file encoding
WO2010077333A1 (fr) * 2008-12-29 2010-07-08 Thomson Licensing Procédé et appareil pour la régulation du débit de compression de trames vidéo
US8804814B1 (en) * 2013-06-04 2014-08-12 Centri Technology, Inc. Seeding of a workspace to optimize codec operations
US11039139B2 (en) * 2018-09-14 2021-06-15 Tencent America LLC Method and apparatus for identity transform in multiple transform selection

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03224363A (ja) * 1990-01-30 1991-10-03 Ricoh Co Ltd 圧縮データ量制御方式
JPH04175067A (ja) * 1990-11-08 1992-06-23 Toshiba Corp 画像圧縮復元装置
JP2797159B2 (ja) * 1992-03-02 1998-09-17 カシオ計算機株式会社 画像データ圧縮装置及び画像データ圧縮方法
US5379122A (en) * 1992-10-02 1995-01-03 Xerox Corporation Decompression of standard ADCT-compressed images
FR2702580B1 (fr) * 1993-03-09 1995-06-16 Blondel Gerard Procédé de compression d'une image numérique à une taille prédéterminée, et procédé de décompression correspondant.
JP2921358B2 (ja) 1993-10-06 1999-07-19 富士ゼロックス株式会社 画像符号化装置
US5489943A (en) * 1994-02-14 1996-02-06 Sony Corporation One-pass adaptive bit rate control
US5488364A (en) * 1994-02-28 1996-01-30 Sam H. Eulmi Recursive data compression
JPH08275150A (ja) * 1995-03-29 1996-10-18 Nikon Corp 画像処理装置
JP3682353B2 (ja) * 1996-02-29 2005-08-10 株式会社リコー 画像圧縮方法および画像圧縮装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO9918734A1 *

Also Published As

Publication number Publication date
FR2769161A1 (fr) 1999-04-02
FR2769161B1 (fr) 1999-12-24
JP2001519631A (ja) 2001-10-23
CN1280745A (zh) 2001-01-17
KR20010024343A (ko) 2001-03-26
US6668089B1 (en) 2003-12-23
AU9150498A (en) 1999-04-27
KR100503666B1 (ko) 2005-07-26
WO1999018734A1 (fr) 1999-04-15
CN1134169C (zh) 2004-01-07

Similar Documents

Publication Publication Date Title
EP0782339B1 (fr) Procédé et dispositif de compression de données numériques
US20020036704A1 (en) Method for providing variable bit rate in streaming service
FR2754127A1 (fr) Procede de codage/decodage de signal video sur la base d&#39;une quantification de treillis adaptative
JP2009538560A (ja) 重み付け符号化する方法及びシステム
EP1020083A1 (fr) Procede de controle du taux de compression d&#39;images numeriques
EP0533539A1 (fr) Procédé de compression d&#39;images
US6424739B1 (en) Image data compression apparatus capable of reducing false color
CN111340901A (zh) 基于生成式对抗网络的复杂环境下输电网图片的压缩方法
FR3037756A1 (fr) Procede et dispositif de production d&#39;une image numerique
FR2815151A1 (fr) Procede de recherche d&#39;images dans un film et dispositif faisant application dudit procede
EP2947888A1 (fr) Procédé de téléchargement adaptatif de contenus numériques pour plusieurs écrans
FR2825224A1 (fr) Procede et dispositif de compression et ou d&#39;indexation d&#39;images numeriques
EP1298935A2 (fr) Procédé et dispositif de compression d&#39;un signal d&#39;image
EP1812903A1 (fr) Procede de codage d&#39;images codees par ondelettes a controle de debit, dispositif de codage et programme d&#39;ordinateur correspondants
EP0631443B1 (fr) Dispositif pour la transmission d&#39;images relevées par un satellite
EP1714498B1 (fr) Procede de recherche de la directon de prediction en codage video intra-image
FR2702580A1 (fr) Procédé de compression d&#39;une image numérique à une taille prédéterminée, et procédé de décompression correspondant.
FR2597282A1 (fr) Procede de quantification dans un codage par transformation pour la transmission de signaux d&#39;image
FR3125375A1 (fr) Procédé d’encodage et décodage vidéo à faible latence
EP0240383B1 (fr) Procédé de compression d&#39;images numériques et dispositif de mise en oeuvre d&#39;un tel procédé
FR3116635A1 (fr) Procédé de mise à jour d’un réseau de neurones artificiel
WO2024079339A1 (fr) Récepteur pour décompression de données avec rehaussement par auto-encodeur
Korus et al. Quantifying the cost of reliable photo authentication via high-performance learned lossy representations
JP2004159171A (ja) 画像圧縮方法及び画像圧縮装置
FR2717927A1 (fr) Procédé et appareil de compression, de palettisation, d&#39;émission et de réception d&#39;images en couleur.

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20000502

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): CH DE FR GB IT LI NL

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20061020