FR2783388A1 - Procede de compression d'images et dispositif pour la mise en oeuvre de ce procede - Google Patents

Procede de compression d'images et dispositif pour la mise en oeuvre de ce procede Download PDF

Info

Publication number
FR2783388A1
FR2783388A1 FR9811495A FR9811495A FR2783388A1 FR 2783388 A1 FR2783388 A1 FR 2783388A1 FR 9811495 A FR9811495 A FR 9811495A FR 9811495 A FR9811495 A FR 9811495A FR 2783388 A1 FR2783388 A1 FR 2783388A1
Authority
FR
France
Prior art keywords
group
images
image
coding
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9811495A
Other languages
English (en)
Other versions
FR2783388B1 (fr
Inventor
Philippe Guillotel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Technicolor SA
Original Assignee
Thomson Multimedia SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Multimedia SA filed Critical Thomson Multimedia SA
Priority to FR9811495A priority Critical patent/FR2783388B1/fr
Priority to ZA9905802A priority patent/ZA995802B/xx
Priority to EP99402224.2A priority patent/EP0987903B1/fr
Priority to JP25921999A priority patent/JP4733800B2/ja
Priority to BRPI9904108-1A priority patent/BR9904108B1/pt
Priority to PL99335413A priority patent/PL335413A1/xx
Priority to CNB991190726A priority patent/CN1166210C/zh
Priority to MYPI99003983A priority patent/MY128350A/en
Priority to KR1019990039301A priority patent/KR100646385B1/ko
Priority to US09/396,570 priority patent/US6480540B1/en
Priority to IDP990865D priority patent/ID23263A/id
Publication of FR2783388A1 publication Critical patent/FR2783388A1/fr
Priority to HK00105139A priority patent/HK1026097A1/xx
Application granted granted Critical
Publication of FR2783388B1 publication Critical patent/FR2783388B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

L'invention est relative à un procédé de compression d'images, notamment du type MPEG2, dans lequel les images sont codées suivant des groupes (GOP) dont chacun comprend N images, avec une image I codée en intra, des images P prédites en fonction de l'image intra I ou d'une image P précédente, chaque image P étant précédée et suivie par n images B prédites bidirectionnellement, n pouvant être nul. Le nombre M = n + 1 représente la structure du groupe. On détermine à l'aide d'un codage d'essai (70) au moins un paramètre caractérisant les images sources devant être codées suivant un groupe et on fait dépendre les nombres N et M de ce (s) paramètre (s). Au cours du codage d'essai, on confère des valeurs déterminées à N, M et au pas de quantification Q.

Description

1.
PROCEDE DE CCMPRESSION D'IMAGES ET DISPOSITIF POUR LA MISE EN
OEUVRE DE CE PROCEDE
L'invention est relative à un procédé de compression d'images dans lequel les images sont codées suivant des groupes
de longueurs variables.
Elle concerne plus particulièrement un procédé de type MPEG, notammnent de type MPEG2. Bien que l'invention ne soit pas
limitée à cette norme, dans la suite de la description, on se
référera principalement à celle-ci.
On rappelle ci-après le principe d'une telle com-
pression. Dans la norme MPEG2 vidéo, on obtient une compression
des signaux numériques vidéo en exploitant la redondance spa-
tiale et la redondance temporelle des images codées.
La redondance spatiale est évaluée principalement
grâce à la succession de trois opérations: une opération com-
munément appelée transformée cosinus discrète et notée DCT ("Discrete Cosine Transform"), une opération de quantification des coefficients issus de la DCT et une opération de codage à longueur variable pour décrire les coefficients quantifiés issus
de la DCT.
La redondance temporelle est analysée par une opéra-
tion de compensation de mouvement qui consiste, par translation de chaque bloc de l'image courante, à rechercher le bloc le plus ressemblant situé dans une image de référence. L'analyse de la redondance temporelle conduit à déterminer un champ de vecteurs de translation, communément appelés vecteurs de mouvement, ainsi qu'une erreur de prédiction qui est la différence entre le signal de l'image courante et le signal de l'image prédite par compensation de mouvement. L'erreur de prédiction est alors
analysée selon le principe de la redondance spatiale.
Le codage MPEG2 est de type prédictif. Il s'ensuit que
le décodage qui lui est associé doit être régulièrement réini-
tialisé afin de protéger le signal contre toute erreur de trans-
mission ou toute rupture de signal due au basculement du
décodeur d'un programme sur un autre.
A cette fin, la norme MPEG2 prévoit que, périodi-
quement, les images doivent être codées en mode spatial, c'est-
à-dire selon un mode exploitant seulement la redondance spatiale. Les images codées en mode spatial sont appelées images INTRA ou images I.
Les images codées en exploitant la redondance tempo-
relle sont de deux types: d'une part, les images construites par référence à une image temporellement antérieure à partir d'une prédiction avant et, d'autre part, les images construites
par référence à deux images temporellement antérieure et pos-
térieure à partir d'une prédiction avant et d'une prédiction
arrière.
Les images codées construites à partir d'une prédic-
tion avant sont appelées images prédites ou images P et les images codées construites à partir d'une prédiction avant et d'une prédiction arrière sont appelées images bidirectionnelles ou images B. Une image I est décodée sans faire référence à d'autres images qu'à elle-même. Une image P est décodée en faisant référence à l'image P ou I qui la précède. Une image B est décodée en faisant appel à l'image I ou P qui la précède et
à l'image I ou P qui la suit.
La périodicité des images I définit un groupe d'images
communément noté GOP ("Group Of Pictures").
A l'intérieur d'un même GOP, la quantité de données contenues dans une image I est généralement supérieure à la quantité de données contenues dans une image P et la quantité de données contenues dans une image P est généralement supérieure à la quantité de données contenues dans une image B.
En 50 Hertz, le GOP se présente comme une image I sui-
vie d'une séquence d'images B et P qui présente, la plupart du temps, la séquence suivante
I, B, B, P, B, B, P, B, B, P, B, B.
Cependant, la norme n'oblige pas à prévoir, comme c'est le cas en général, N = 12 images dans un GOP, ni à prévoir que les distances M entre deux images P soient toujours égales à 3. De façon plus précise, la distance M est le nombre n d'images B précédant ou suivant une image P, augmenté d'une unité, soit
M = n + 1.
Le nombre N représente la taille ou longueur du GOP,
tandis que le nombre M représente sa structure.
L'invention résulte de la constatation que l'on peut agir sur les paramètres M et N pour améliorer le taux de
compression et/ou améliorer la qualité du codage.
Le procédé de codage selon l'invention est caractérisé en ce qu'on détermine au moins un paramètre caractérisant les images sources devant être codées suivant un groupe et en ce qu'on fait dépendre la longueur et la structure du groupe de
ce(s) paramètre(s).
Dans un mode de réalisation, le (les) paramètre(s) caractérisant les images sources est déterminé à l'aide d'un
codage d'essai au cours duquel on confère des valeurs déter-
minées à N, M et au pas Q de quantification.
Le codage d'essai est par exemple réalisé en boucle ouverte. Dans une réalisation particulièrement simple, on détermine séparement un paramètre (Pcost) caractérisant les images P obtenues lors du codage d'essai et un paramètre (Bcost) caractérisant les images B obtenues lors du codage d'essai, ces paramètres caractérisant les images P et B étant, de préférence, les coûts moyens de codage des images P et B. Le coût de codage d'une image est le nombre de bits (en-têtes compris) nécessaire
pour le codage.
Dans ce cas, on peut faire dépendre le nombre N du paramètre caractérisant les images P et le nombre M du paramètre caractérisant les images B. Lors d'essais effectués dans le cadre de l'invention, sur des séquences d'images de natures diverses, on a constaté qu'il existait, pour chaque nature de séquence, un nombre N optimal fournissant un minimum de coût de codage (ou débit) pour les images P et un nombre M optimal fournissant un minimum de coût de codage (ou débit) pour les images B, ces coûts étant obtenus lors du codage d'essai. Ces séquences se distinguent les unes des autres par des mouvements d'amplitudes variables, des objets différents, des définitions spatiales différentes et des
contenus différents.
On a en outre constaté qu'il existe une relation pra-
tiquement linéaire entre le nombre N optimal et le débit des images P. De même, il existe une relation pratiquement linéaire entre le nombre M et le débit des images B. Ainsi, connaissant les débits des images P et B, il est aisé de calculer les
nombres N et M fournissant les meilleurs résultats.
Dans un exemple correspondant à la norme MPEG2, 50 Hz, le codage d'essai s'effectue avec N = 12, M = 3 et Q = 15, la relation entre N et le débit des images P est approximativement la suivante: (1) N = INT[389000 -Pcos t] + 1, avec 12 < N < 30, et la relation entre M et le débit, ou coût, Bcost des images B est la suivante: J17900 O - B cos t (2) M = IN179 000 B cs t1 + 1, avec 1 < M < 7
)l% f - -
Il est également possible de limiter M à 5.
Dans ces formules, INT signifie la partie entière.
La limitation de N entre 12 et 30 et la limitation de M à une valeur maximale de 7 permet une réalisation simple des codeurs et de limiter le temps de changement de programme. Dans le même but, on peut aussi imposer d'autres limitations ou contraintes, notamment que M soit constant dans le GOP et/ou qu'il soit un sous-multiple de N. Dans une réalisation, si les valeurs de N et de M prises individuellement et ensemble ne sont pas compatibles avec les contraintes, on choisira des valeurs de M et de N les plus
proches des valeurs calculées et qui satisfont à la compati-
bilité imposée. Dans ce cas, on privilégiera la valeur de M, c'est-à- dire que si un choix doit être effectué entre plusieurs couples M, N, on choisira le couple pour lequel la valeur M est
la plus proche de celle qui résulte du calcul.
La formule (2) ci-dessus ne s'applique que si Bcost ne dépasse pas 179000. Dans le cas contraire, c'est-à-dire si Bcost > 179000, l'expérience a montré qu'il fallait, dans cet exemple, que M soit choisi de la façon suivante:
(3) M = 5.INTLP cos t - 1. avec 1 < M < 7.
LBcos t Si le coût d'une image B est supérieur au coût d'une image P, il est préférable que le GOP ne contienne pas d'image B, c'est-à-dire M = 1. En effet, les images P présentant une meilleure qualité de prédiction que les images B et étant, par hypothèse, de coût inférieur, la présence de telles images B
constituerait un inconvénient dans ce cas.
Les coûts, en bits, de chaque image P et de chaque image B sont déterminés, par exemple, au fur et à mesure de l'apparition de ces images. Dans une réalisation, les valeurs de M et N sont sélectionnées en effectuant une moyenne sur toutes les images P et B du codage d'essai, le codage proprement dit n'étant effectué qu'après le codage d'essai de N images sources, N étant déterminé par le coût de codage des images P. Dans ce
cas, le paramètre M peut rester constant dans le GOP.
Dans une autre réalisation, qui permet une adaptation plus rapide aux variations de contenus des scènes ainsi qu'une réduction du retard entre l'arrivée des images sources et le codage proprement dit (et qui permet donc une mémoire tampon de capacité plus réduite), on fait démarrer le codage proprement dit dès que le codage d'essai fournit des données permettant ce démarrage. Ainsi, la première image B du codage d'essai fournit un nombre M permettant de démarrer le codage et le nombre N est
fourni par la première image P du codage d'essai. Il est égale-
ment possible de ne faire débuter le codage qu'après le codage d'essai de la première image P; dans ce cas, le codage démarre
lorsqu'une valeur de N et une valeur de M sont connues.
Avec ce type de codage "à la volée", le nombre M, c'est-à-dire la structure, peut varier à l'intérieur d'un GOP, ce qui permet une adaptation rapide aux variations de contenu de
la scène.
Dans ce codage effectué au fur et à mesure, le GOP est interrompu quand le nombre d'images déjà codées dans le GOP courant est au moins égal au nombre N mesuré (par Pcost dans
l'exemple ci-dessus), ou lors d'un changement de scène.
Pour éviter des variations importantes des paramètres entre groupes qui se succèdent, il peut s'avérer utile de
s'écarter des valeurs calculées. Par exemple, si le calcul mon-
tre que, pour une grande partie de la longueur du GOP, par exemple au moins 80%, il faudrait M = 1, alors que, pour le reste du GOP, le calcul montre que M doit être supérieur à 1, on adopte, malgré tout, la valeur 1 pour M, même si le calcul
montre qu'il faut une valeur différente.
De façon similaire, si pour le GOP précédent, M = 1 et si, pour le GOP courant, le calcul montre qu'il faudrait une valeur M = 1 pour une partie importante du GOP courant, par exemple au moins 60%, on adopte aussi la valeur 1 pour M, même si le résultat du calcul, tel qu'il résulte de la formule (2)
ci-dessus, implique une valeur différente.
On sait que lorsqu'un changement de scène intervient, c'est-à-dire lorsqu'il apparaît une discontinuité dans la suite des images vidéo, il est nécessaire d'adapter les groupes d'images GOP de part et d'autre de la discontinuité de façon
telle que le nouveau groupe, qui démarre avec une image I, cor-
responde à la nouvelle scène.
Dans un mode de réalisation, si le changement de scène intervient dans un groupe, la scène nouvelle constitue l'image I
d'un groupe nouveau, le groupe altéré étant raccourci pour s'ar-
rêter avant cette scène nouvelle si le changement de scène intervient, dans le groupe altéré, à une distance du début au moins égale au nombre minimum admissible pour N. Le début du groupe altéré est utilisé pour allonger le groupe qui le précède lorsque la somme du nombre d'images précédant le changement de scène dans le groupe altéré et du nombre d'images du groupe qui le précède ne dépasse pas le maximum admissible pour N. Dans ce groupe précédent ainsi modifié (raccourci ou allongé), il peut être nécessaire de modifier le nombre M précédemment calculé
pour ce GOP.
Dans une variante, qui s'utilise de préférence dans le cas o la longueur du groupe altéré est inférieure au nombre admissible pour N, quand un changement de scène intervient dans un groupe, la scène nouvelle constitue l'image I d'un groupe nouveau, ce groupe nouveau ayant une longueur égale à la moyenne de la longueur du groupe avant altération et de la longueur du
groupe qui le précède. Avec cette variante, il peut être néces-
saire de modifier le nombre M précédemment calculé pour les GOP.
Quand deux modifications sont possibles, par exemple quand la longueur du groupe altéré est inférieure au minimum admissible pour N. on peut effectuer un choix entre ces deux modifications en effectuant, pour chaque modification, un calcul
de la distance du couple (M,N) obtenu ou couple M,N avant modi-
fication et en sélectionnant le couple pour lequel la distance
est la plus faible.
Pour déterminer les paramètres N et M, on peut faire
appel à la mesure d'autres paramètres que la mesure des débits.
Par exemple, on peut faire appel, pour déterminer N, à l'énergie des images Intra I. On peut également déterminer l'amplitude des mouvements ou l'erreur de compensation de mouvement dite DFD (Displaced Frame Difference) pour la détermination de M et N. D'autres caractéristiques et avantages de l'invention
apparaîtront avec la description de certains de ses modes de
réalisation, celle-ci étant effectuée en se référant aux dessins ciannexés, sur lesquels: la figure 1 illustre un macrobloc au standard 4.2. 0, la figure 2 est un schéma illustrant la transformation
DCT,
la figure 3 montre un groupe d'images GOP selon la norme MPEG ou analogue, les figures 4 à 7 sont des diagrammes illustrant le procédé conforme à l'invention, et la figure 8 est un schéma d'un montage pour la mise en
oeuvre du procédé selon l'invention.
On se réfère tout d'abord aux figures 1 à 3 qui visent
à rappeler certains principes utilisés dans le codage MPEG2.
Dans la norme MPEG2, on peut partir d'une image com-
portant, en mode progressif, 576 lignes de 720 points chacune.
En mode entrelacé, cette image est composée de deux trames dont
chacune comprend 288 lignes, également de 720 points chacune.
Chaque image est décomposée en macroblocs dont chacun est formé par un carré de 16X16 points de luminance. Chaque macrobloc est ainsi formé de quatre blocs carrés de 8X8 points de luminance. A chacun de ces quatre blocs de luminance, on associe (dans le format 4.2.0) deux blocs de chrominance dont chacun présente 8X8 points, l'un des blocs représentant le signal Cr de différence de couleur ou chrominance rouge et l'autre bloc représentant le signal Cb de différence de couleur ou chrominance bleue. Dans le format 4.2.2, à chaque macrobloc de luminance, on associe quatre blocs de chrominance 8X8, deux
blocs pour la chrominance bleue et deux blocs pour la chro-
minance rouge. Il existe aussi un format 4.4.4 pour lequel chacune des composantes de luminance et de chrominances comporte
chacune quatre blocs 8x8.
On a représenté sur la figure 1 quatre blocs de lumi-
nance 8x8, de référence 10 dans l'ensemble et des blocs 12 et 14 de chrominance 8x8 pour les chrominances respectivement bleue et
rouge, l'ensemble illustrant un macrobloc au standard 4.2.0.
Chaque bloc est codé en utilisant une transformation notée DCT qui est une transformation cosinus discrète qui permet de transformer un bloc de luminance (par exemple) en un bloc de coefficients représentant des fréquences spatiales. Comme on peut le voir sur la figure 2, un bloc source 16 est transformé en un bloc 18 de 8X8 coefficients. Le coin supérieur gauche 20 du bloc 18 correspond aux fréquences spatiales nulles (valeur
moyenne du bloc) et, à partir de cette origine 20, les fré-
quences horizontales augmentent vers la droite, comme représenté par la flèche 22, tandis que les fréquences spatiales verticales augmentent en partant du haut vers le bas, comme représenté par
la flèche 24.
Pour chaque macrobloc, il faut choisir le type de codage: soit "intra", soit "inter". Un codage intra consiste à appliquer la transformation DCT sur un bloc source de l'image, tandis qu'un codage inter consiste à appliquer la transformation DCT sur un bloc représentant la différence entre un bloc source et un bloc prédit, ou bloc de prédiction, d'une image précédente
ou suivante.
Le choix dépend en partie du type d'images auquel appartient le macrobloc. Ces images sont de trois types: le premier type est le type dit I, ou intra, pour lequel le codage
est intra pour tous les macroblocs.
Le second type est de type P ou de prédiction; dans ce type d'images, le codage de chaque macrobloc peut être soit intra soit inter. Dans le cas d'un codage inter sur une image de type P. la transformation DCT est appliquée sur la différence entre le macrobloc courant de cette image P et un macrobloc de
prédiction issu de l'image I ou P précédente.
Le troisième type d'images est appelé B ou bidi- rectionnel. Chaque macrobloc d'un tel type d'image est soit codé
en intra, soit codé en inter. Le codage en inter consiste éga-
lement à appliquer la transformation sur la différence entre le
macrobloc courant de cette image B et un macrobloc de prédic-
tion. Ce macrobloc de prédiction peut être issu soit de l'image
précédente soit de l'image suivante ou des deux à la fois (pré-
diction bidirectionnelle), les images de prédiction dites précé-
dente ou suivante ne pouvant être que de type I ou P. On a représenté sur la figure 3 un ensemble d'images formant un groupe appelé GOP ("Group Of Pictures") qui comprend douze images, à savoir une image I suivie de onze images B et P selon la succession suivante: B, B, P, B, B, P, B, B, P, B, B. Un GOP est caractérisé par une longueur, c'est-à-dire un nombre d'images N qui, dans un exemple, ne peut être compris
que entre 12 et 30, et par un paramètre de structure M repré-
sentant la distance entre deux images P, c'est-à-dire le nombre d'images B entre deux images P successives, augmenté d'une unité. Dans cet exemple, ce paramètre M est égal à 3. Egalement à titre d'exemple, ce nombre M peut être compris entre 1 (pas d'image B) et 7. En outre, on impose que ce nombre M soit un
sous multiple du nombre N pour simplifier le codeur.
Jusqu'à présent, les images sont codées en gardant N
et M constants dans le codeur.
L'invention résulte de la constatation qu'il existe des valeurs optimales de M et de N qui diffèrent selon des séquences d'images codées. En effet, selon que les séquences d'images présentent une définition plus ou moins importante et un mouvement plus ou moins important, les valeurs optimales de M
et de N peuvent différer de façon importante. Par valeur opti-
2Z maie, on entend celles qui, pour une même qualité, exigent un
nombre minimum de bits.
Au surplus, les études expérimentales effectuées dans le cadre de l'invention ont montré que la taille optimale Nopt du GOP pour une séquence déterminée d'images correspond à la valeur minimale Pcost, sur cette séquence, du nombre de bits qu'il faut utiliser pour coder (entêtes compris) les images P. Cette propriété est illustrée par le diagrammne de la figure 4
sur lequel on a porté, en abscisses, le nombre N et, en ordon-
nées, la valeur Pcost pour une séquence notée i. Cette valeur Pcost est le nombre de bits à utiliser pour coder une image P en valeur moyenne sur la séquence i. On voit, ainsi, que la valeur Pcost(i) est représentée par une courbe 32 présentant un minimum
34 pour lequel la valeur de N est optimale (Nopt).
De façon analogue, on a constaté que la valeur opti-
male du nombre M correspond au minimum Bcost(i) du nombre de bits à utiliser en valeur moyenne pour coder des images B sur une séquence déterminée, notée i. Ainsi, sur le diagranmme de la figure 5, le nombre M a été représenté en abscisses et, en
ordonnées, on a porté le nombre Bcost(i). On voit, sur ce dia-
gramme, que la courbe 36 présente un minimum 38 correspondant à
la valeur optimale de M (Mopt).
Des mesures ont été effectuées, notamment sur des séquences test classiques en codage MPEG et notées "Horse", "Flower garden" et "Mobcal". La séquence "Horse" correspond à des mouvements rapides et avec une bonne définition, la séquence "Flower garden"' correspond également à une bonne définition et
des mouvements moyens, tandis que la séquence "Mobcal" corres-
pond à peu de mouvement et à une définition élevée. D'autres séquences ont également été testées, telles qu'une séquence de kayak avec des mouvements rapides et peu de définition, une séquence de basket et une séquence avec des mouvements moyens,
homogènes et des images de bonne définition.
On a aussi constaté que, si le groupe est soumis à un codage d'essai avec des valeurs déterminées M, de N, et du pas Q
de quantification, ces valeurs ne correspondant pas obligatoire-
ment aux valeurs optimales pour la séquence i considérée, le coût moyen de codage Pcost des images P et le coût moyen de codage Bcost des images B représentent respectivement N et M. En outre, comme le montre la figure 6, il existe une relation simple entre les nombres Nopt pour chaque séquence i et le coût
de codage Pcost à M, N et Q déterminés. Cette relation est liné-
aire ou sensiblement linéaire, étant représentée par une droite (figure 6) sur laquelle des points différents 42, 44, etc.
représentent des séquences différentes.
La figure 7 est un diagramme sur lequel les nombres Mopt sont portés en abscisses et le coût de codage Bcost (à M, N et Q déterminés) est porté en ordonnées; chaque point 52, 54, 56, etc. correspond à une séquence donnée. On voit que ces points se trouvent sur une droite 60. Il y a donc une relation
linéaire entre Mopt et le coût du codage d'essai.
Lorsque les valeurs de M, N et Q, utilisées au cours du codage d'essai, sont les suivantes:
M = 12,
2C N= 3, et
Q = 15,
les valeurs de M et N satisfont aux relations sui-
vantes: F389000 - P cos t
(1) N = INT 1389 000- cs t + 1, avec 12 < N < 30.
L 10000
(2) M = INT[ 179000 - B cos t + 1, avec 1 < M < 7.
L 20000 -
Bien que pour la formule (2) ci-dessus, on ait indiqué que M devait être compris entre 1 et 7, on voit sur le diagramme
de la figure 7 qu'en fait, M peut être limité à 5.
Un montage destiné à la mise en oeuvre de l'invention est représenté sur la figure 8. Il comprend un premier codeur MPEG2 70 destiné à effectuer le codage d'essai ou "première
passe" de codage. Ce codeur d'essai est réglé avec les para-
mètres fixés indiqués ci-dessus, à savoir, dans l'exemple: M = 12, N = 3 et Q = 15. Ce codeur d'essai fonctionne, dans
l'exemple, en boucle ouverte, c'est-à-dire sans régulation.
Le codeur 70 fournit les valeurs Bcost et Pcost qui
sont appliquées à un convertisseur 72 qui réalise les conver-
sions de Pcost en Nopt et Bcost en Mopt, comme représenté sur
les figures 6 et 7 et conformément aux relations (1) et (2) ci-
dessus. Ces valeurs N et M sont calculées pour un groupe d'images, comme décrit ci-dessus, et sont ensuite appliquées à
une entrée de commande 76 d'un codeur MPEG2 74.
Les données à l'entrée du codeur 74 sont les mêmes que celles à l'entrée du codeur d'essai 70. On prévoit donc une mémoire tampon 78 pour tenir compte du temps de traitement dans le codeur d'essai 70 et dans le convertisseur 72, cette mémoire
78 retenant les données pendant le traitement.
Dans le convertisseur 72, il est également vérifié que
les couples N,M résultant des formules (1) et (2) sont compa-
tibles avec les contraintes imposées dans le mode de réali-
sation, en particulier que M est un sous multiple de N. Si les valeurs résultant du calcul ne sont pas compatibles, on adopte des valeurs de N et de M les plus proches de celles qui ont été calculées, en privilégiant, cependant, la valeur M.
Le convertisseur 72 tient également compte de condi-
tions supplémentaires.
En premier lieu, il effectue une comparaison entre Bcost et Pcost et, si Bcost est supérieur à Pcost, on affecte la valeur 1 au nombre M, le GOP ne contenant pas d'image B. En effet, dans cette hypothèse, les images B entraînent un coût de codage supérieur aux images P, il est préférable de ne conserver
que des images P qui présentent une qualité de prédiction supé-
rieure. En second lieu, le convertisseur compare Bcost à la
valeur 179000 et si Bcost dépasse 179000, la relation (2) ci-
dessus est remplacée par la relation heuristique ci-dessous:
(3) M = 5.INT c - 1], avec 1 < M < 7.
B cos t Le convertisseur 72 permet aussi de tenir compte de
deux cas particuliers pour lesquels il est nécessaire de s'écar-
ter de la relation (2) pour obtenir une homogénéité de qualité des images. Le premier cas est le suivant: le codage d'essai montre que M doit présenter une valeur au moins égale à 2, mais, par ailleurs, ce codage d'essai montre aussi que les valeurs intermédiaires obtenues par M sont égales à 1 sur une grande partie du groupe, par exemple au moins 80%. Dans ce cas, le
convertisseur 72 impose que M soit égal à 1.
Le second cas est similaire au premier: le codage d'essai montre que M devrait être au moins égal à 2, mais les valeurs intermédiaires obtenues pour M sont égales à 1 pour au moins une partie de la longueur du groupe, par exemple 60% (cette limite est inférieure à la limite prévue dans le premier cas), et le groupe précédent est tel que M = 1. Dans ce cas, on confère aussi la valeur 1 au nombre M. Ces deux cas particuliers pour lesquels on pose la
valeur 1 à M résultent d'essais effectués dans le cadre de l'in-
vention qui ont montré que ces conditions permettent, pour un même type de séquence, une bonne uniformité de qualité sur des
groupes successifs.
Enfin, le convertisseur 72 tient compte des chan-
gements de scène ou "cuts" qui sont habituellement détectés dans les codeurs. Quand un tel changement de scène intervient, on fait démarrer le GOP avec la nouvelle scène, c'est-à-dire que, lorsque la nouvelle scène apparaît, on lui attribue une image Intra I. En outre, avec le procédé de l'invention, quand un changement de scène est détecté, on configure le GOP précédent et le GOP courant en fonction des considérations suivantes: Si le changement de scène apparaît dans un GOP après
la douzième image, le nouveau GOP démarre alors avec le change-
ment de scène, le GOP précédent étant ainsi limité ou raccourci.
Si, par contre, le changement de scène apparaît avant la douzième image, il n'est alors plus possible de limiter le GOP précédent de façon à ce qu'il se termine juste avant le changement de scène, car, dans ce cas, son nombre d'images serait inférieur au nombre minimum imposé. On modifie alors le
GOP précédent et le GOP courant de la façon suivante en dis-
tinguant deux cas. Dans le premier cas, le changement de scène apparaît à un moment tel que
la somme du nombre d'images du GOP précédent et du nombre d'images du GOP courant, juste avant le changement de scène, soit au plus égal à 30. Dans ce cas, le GOP précédent
est allongé.
Dans le second cas, la somme du nombre d'images du GOP précédent et du nombre d'images du GOP courant juste avant le changement de scène est supérieur à 30. Le GOP précédent et le
GOP courant sont alors réarrangés en calculant une moyenne cor-
respondant à ces deux GOP.
Par exemple, si le GOP précédent est tel que N = 25 et M = 2 et si le changement de scène intervient après la huitième image du GOP courant pour lequel le calcul indique N = 20 et M = 3, le GOP précédent allongé du GOP courant écourté comporte 33 images. Cette valeur dépassant le maximum admissible (30), on cherche une "moyenne" correspondant à deux GOP dont le nombre total d'images est 33, chacun des GOP devant respecter les contraintes imposées. Dans ce cas, on voit qu'on peut choisir N = 18 et M = 2 pour le GOP précédent et N = 15 et M = 3 pour le GOP juste avant le changement de scène. Les longueurs 18 et 15
sont proches de la moyenne (16,5) de la longueur du groupe pré-
cédent (25) et de la longueur (8) du groupe courant altéré.
Des tests ont été réalisés sur douze séquences diffé-
rentes avec des changements de scène, des éclairs lumineux
(flashes) et des durées relativement importantes, et on a com-
paré les résultats obtenus avec un procédé de codage classique, correspondant à des valeurs fixes de M et de N aux résultats obtenus avec le procédé selon l'invention qui adapte les valeurs de M et de N à des séquences. Ces tests ont été réalisés avec plusieurs débits. On a constaté une augmentation de qualité, mesurée par le paramètre PSNR (Peak Signal to Noise Ratio), de 0,2 dB à 1,14 dB. Cette augmentation de PSNR correspond à une
économie en bits comprise entre 2 et 22% environ.
Le procédé selon l'invention peut être utilisé pour tout type de procédé de compression d'images vidéo dans lequel
on prévoit des images I, P et B. Il s'applique tant à l'enre-
gistrement, en temps réel ou en temps différé, qu'à la trans-
mission. Le procédé n'est pas limité au cas o la taille du GOP
est déterminée avant codage. Il s'applique aussi quand les para-
mètres M et N sont calculés pour chaque image, le codage proprement dit s'effectuant à la volée. Dans ce cas, le nombre M peut varier dans un GOP, un nouveau GOP commençant par exemple quand le nombre d'images codées dans le GOP courant est au moins égal au nombre N calculé. Le nombre M peut varier en fonction de
la complexité des images à l'intérieur d'un GOP.
Dans ce cas, il n'est pas nécessaire de mémoriser l'ensemble du GOP dans la mémoire tampon 78 (dont la capacité peut être réduite), les contraintes sur les valeurs de M et N sont réduites, étant seulement imposées par la norme MPEG2; les contraintes imposées lors des changements de scènes sont aussi
moins sévères.

Claims (16)

REVENDICATIONS
1. Procédé de compression d'images dans lequel les
images sont codées suivant des groupes (GOP) dont chacun com-
prend un nombre N d'images, N représentant la longueur du groupe, lequel comporte une image I codée en intra, des images P prédites en fonction de l'image intra I ou d'une image P pré- cédente, chaque image P étant précédée et suivie par n images B prédites bidirectionnellement, n pouvant être nul, le nombre M, qui est égal au nombre n augmenté d'une unité, représentant la structure du groupe, caractérisé en ce qu'on détermine au moins un paramètre caractérisant les images sources devant être codées suivant un groupe et en ce qu'on fait dépendre la longueur N et
la structure M du groupe de ce(s) paramètre(s).
2. Procédé selon la revendication 1, caractérisé en ce que le (les) paramètre(s) caractérisant les images sources est déterminé à l'aide d'un codage d'essai au cours duquel on
confère des valeurs déterminées à N, M et au pas de quantifica-
tion Q 3. Procédé selon la revendication 2, caractérisé en ce
que le codage d'essai est réalisé en boucle ouverte.
4. Procédé selon la revendication 2 ou 3, caractérisé en ce que, pour caractériser les images sources, on détermine un paramètre (Pcost) caractérisant les images P obtenues lors du codage d'essai et un paramètre (Bcost) caractérisant les images
B obtenues lors du codage d'essai.
5. Procédé selon la revendication 4, caractérisé en ce
que le nombre N est déterminé à partir du paramètre caracté-
risant au moins une image P, et en ce que le nombre M est déter-
miné en fonction du paramètre caractérisant au moins une image B. 6. Procédé selon la revendication 4 ou 5, caractérisé en ce que les paramètres (Pcost, Bcost) caractérisant les images P et B sont les coûts de codage de ces images P et B, par
exemple les coûts moyens.
7. Procédé selon les revendications 5 et 6, caracté-
risé en ce que, lorsque le coût de codage moyen (Bcost) de cha-
que image B est, au cours du codage d'essai, supérieur au coût de codage moyen (Pcost) de chaque image P, on confère la valeur 1 au nombre M, le groupe ne comprenant ainsi pas d'image B. 8. Procédé selon la revendication 6 ou 7, caractérisé en ce qu'au cours du codage d'essai, on détermine, au fur et à mesure de l'arrivée des images sources, le coût de codage pour
chaque image B et le nombre M correspondant.
9. Procédé selon la revendication 8, caractérisé en ce que, lorsque les nombres M déterminés avant la fin du codage d'essai sont égaux à 1 pour une fraction importante du groupe,
on confère la valeur 1 au nombre M pour le groupe.
10. Procédé selon la revendication 8 ou 9, caractérisé en ce que, lorsque les nombres M déterminés avant la fin du
codage d'essai sont égaux à 1 pour au moins une fraction déter-
minée du groupe, et lorsque le nombre M est égal à 1 pour le groupe précédent, on confère la valeur 1 au nombre M pour le groupe.
11. Procédé selon l'une quelconque des revendications
précédentes, caractérisé en ce qu'en cas de changement de scène intervenant dans un groupe, la scène nouvelle constitue l'image I d'un groupe nouveau, le groupe altéré étant raccourci pour s'arrêter avant cette scène nouvelle si le changement de scène intervient, dans le groupe altéré, à une distance du début au moins égale au nombre minimum admissible pour N, le début du
groupe altéré étant utilisé pour allonger le groupe qui le pré-
cède lorsque la sommne du nombre d'images précédant le changement de scène dans le groupe altéré, et du nombre d'images du groupe 3C qui le précède ne dépasse pas le maximum admissible pour N.
12. Procédé selon l'une quelconque des revendications 1
à 9, caractérisé en ce qu'en cas de changement de scène inter-
venant dans un groupe, la scène nouvelle constitue l'image I
d'un groupe nouveau, le groupe altéré et le groupe qui le pré-
cède étant réarrangés de façon que chacun présente une longueur proche de la moyenne de la longueur du groupe après altération
et du groupe qui le précède.
13. Procédé selon la revendication 6, caractérisé en ce que le codage d'essai étant effectué selon une norme de type MPEG à 50 Hertz, avec N = 12, M = 3 et Q = 5, les nombres N et M sont fonction respectivement des coûts moyens de codage des images B et P selon les relations suivantes: (1) N= I[389000 - P cos t]i (1) N = INT 389000 - P cos +1, avec 12 < N < 30,
L 9000 B
(2) M = IN 179000- Bc] + 1, avec 1 < M < 7,
INT signifiant partie entière.
14. Procédé selon la revendication 13, caractérisé en
ce que 1 < M < 5.
15. Procédé selon la revendication 13 ou 14, caracté-
risé en ce que, lorsque le coût de codage (Bcost) est supérieur à 179000, le nombre M est déterminé par la relation suivante:
(3) M = 5.INTP cost -1], avec 1 < M < 7.
B cos t
16. Procédé selon l'une quelconque des revendications 1
à 6, caractérisé en ce qu'on fait varier le nombre M à l'in-
térieur d'un groupe.
2. 17. Procédé selon l'une quelconque des revendications 2
à 6, caractérisé en ce que la compression est effectuée après le
codage d'essai.
18. Procédé selon l'une quelconque des revendications 4
à 6, caractérisé en ce que la compression débute après détermi-
2! nation du paramètre caractérisant la première image B ou la pre-
mière image P. 19. Procédé selon la revendication 18, caractérisé en ce que la formation d'un groupe codé est interrompue quand son nombre d'images codées es- au moins égal au nombre N déterminé à
partir de l'image P courante.
20. Dispositif de codage pour la mise en oeuvre du pro-
cédé selon la revendication 4, 5 ou 6, caractérisé en ce qu'il comporte un canal pour effectuer le codage d'essai et déterminer les paramètres M et N et un canal de codage (78, 74) recevant
les informations du premier canal pour effectuer le codage pro-
prement dit.
FR9811495A 1998-09-15 1998-09-15 Procede de compression d'images et dispositif pour la mise en oeuvre de ce procede Expired - Fee Related FR2783388B1 (fr)

Priority Applications (12)

Application Number Priority Date Filing Date Title
FR9811495A FR2783388B1 (fr) 1998-09-15 1998-09-15 Procede de compression d'images et dispositif pour la mise en oeuvre de ce procede
ZA9905802A ZA995802B (en) 1998-09-15 1999-09-09 Method of image compression and device for implementing this method.
EP99402224.2A EP0987903B1 (fr) 1998-09-15 1999-09-10 Méthode de compression d'images et dispositif pour mettre en oeuvre la méthode
JP25921999A JP4733800B2 (ja) 1998-09-15 1999-09-13 画像圧縮方法及びこの方法を実施する装置
PL99335413A PL335413A1 (en) 1998-09-15 1999-09-14 Image compressing method and apparatus therefor
CNB991190726A CN1166210C (zh) 1998-09-15 1999-09-14 图像压缩方法以及实现这种方法的装置
BRPI9904108-1A BR9904108B1 (pt) 1998-09-15 1999-09-14 Método de compressão de imagem e dispositivo de codificação para executar o dito método
MYPI99003983A MY128350A (en) 1998-09-15 1999-09-14 Method of image compression and device for implementing this method
KR1019990039301A KR100646385B1 (ko) 1998-09-15 1999-09-14 화상 압축 방법과 그 방법을 실행하기 위한 장치
US09/396,570 US6480540B1 (en) 1998-09-15 1999-09-15 Method of image compression and device for implementing this method
IDP990865D ID23263A (id) 1998-09-15 1999-09-15 Metode pemampatan gambar dan alat untuk melaksanakan metode ini
HK00105139A HK1026097A1 (en) 1998-09-15 2000-08-16 Method of image compression and device for implementing this method.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9811495A FR2783388B1 (fr) 1998-09-15 1998-09-15 Procede de compression d'images et dispositif pour la mise en oeuvre de ce procede

Publications (2)

Publication Number Publication Date
FR2783388A1 true FR2783388A1 (fr) 2000-03-17
FR2783388B1 FR2783388B1 (fr) 2000-10-13

Family

ID=9530444

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9811495A Expired - Fee Related FR2783388B1 (fr) 1998-09-15 1998-09-15 Procede de compression d'images et dispositif pour la mise en oeuvre de ce procede

Country Status (12)

Country Link
US (1) US6480540B1 (fr)
EP (1) EP0987903B1 (fr)
JP (1) JP4733800B2 (fr)
KR (1) KR100646385B1 (fr)
CN (1) CN1166210C (fr)
BR (1) BR9904108B1 (fr)
FR (1) FR2783388B1 (fr)
HK (1) HK1026097A1 (fr)
ID (1) ID23263A (fr)
MY (1) MY128350A (fr)
PL (1) PL335413A1 (fr)
ZA (1) ZA995802B (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7295612B2 (en) 2003-09-09 2007-11-13 Apple Inc. Determining the number of unidirectional and bidirectional motion compensated frames to be encoded for a video sequence and detecting scene cuts in the video sequence

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3757088B2 (ja) * 1999-10-26 2006-03-22 日本電気株式会社 動画像符号化装置および方法
KR100377190B1 (ko) * 1999-12-24 2003-03-26 한국전자통신연구원 블록별 생성 비트스트림 크기에 따른 채널 오류 발생가능성 예측에 의한 인트라 갱신 블록 결정 기법을 이용한 영상 부호화 방법
JP2002010259A (ja) * 2000-06-21 2002-01-11 Mitsubishi Electric Corp 画像符号化装置及び画像符号化方法及び画像符号化プログラムを記録した記録媒体
WO2005036886A1 (fr) * 2003-10-13 2005-04-21 Koninklijke Philips Electronics N.V. Codage video a deux passes
US7889792B2 (en) 2003-12-24 2011-02-15 Apple Inc. Method and system for video encoding using a variable number of B frames
US7327223B1 (en) * 2005-01-26 2008-02-05 Crossroads Systems, Inc. Method and system for distributing management information over power networks
WO2008134256A1 (fr) * 2007-04-25 2008-11-06 Pixon Imaging Llc Compression et décompression d'image en utilisant le procédé de pixon
US8139875B2 (en) * 2007-06-28 2012-03-20 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method and image decoding method
WO2009141011A1 (fr) * 2008-05-22 2009-11-26 Telefonaktiebolaget L M Ericsson (Publ) Codeur adaptatif de contenu vidéo, et procédé de codage
CN112019850B (zh) * 2020-08-27 2022-08-23 广州市百果园信息技术有限公司 基于场景切换的图像组划分方法、视频编码方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0597647A2 (fr) * 1992-11-13 1994-05-18 Sony Corporation Codage de signaux vidéo
EP0705041A2 (fr) * 1994-09-29 1996-04-03 Sony Corporation Codeur vidéo adaptif aux changements de scènes
EP0737014A2 (fr) * 1995-04-08 1996-10-09 Sony Corporation Appareil de codage et méthodes
EP0762778A2 (fr) * 1995-09-04 1997-03-12 Sony Corporation Codage et enregistrement de données vidéo
US5694171A (en) * 1994-08-22 1997-12-02 Nec Corporation Moving image encoding apparatus

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0846969A (ja) * 1994-07-26 1996-02-16 Mitsubishi Electric Corp 映像信号符号化方式
JP3307143B2 (ja) * 1995-03-20 2002-07-24 松下電器産業株式会社 画像符号化方法及び画像符号化装置
JP3604864B2 (ja) * 1997-04-25 2004-12-22 シャープ株式会社 動画像符号化装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0597647A2 (fr) * 1992-11-13 1994-05-18 Sony Corporation Codage de signaux vidéo
US5694171A (en) * 1994-08-22 1997-12-02 Nec Corporation Moving image encoding apparatus
EP0705041A2 (fr) * 1994-09-29 1996-04-03 Sony Corporation Codeur vidéo adaptif aux changements de scènes
EP0737014A2 (fr) * 1995-04-08 1996-10-09 Sony Corporation Appareil de codage et méthodes
EP0762778A2 (fr) * 1995-09-04 1997-03-12 Sony Corporation Codage et enregistrement de données vidéo

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
FAN J ET AL: "ADAPTIVE IMAGE SEQUENCE CODING BASED ON GLOBAL AND LOCAL COMPENSABILITY ANALYSIS", OPTICAL ENGINEERING, vol. 35, no. 10, 1 October 1996 (1996-10-01), pages 2838 - 2843, XP000634361 *
LEE J ET AL: "RATE-DISTORTION OPTIMIZED FRAME TYPE SELECTION FOR MPEG ENCODING", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, vol. 7, no. 3, 1 June 1997 (1997-06-01), pages 501 - 510, XP000690588 *
LEE J ET AL: "TEMPORALLY ADAPTIVE MOTION INTERPOLATION EXPLOITING TEMPORAL MASKING IN VISUAL PERCEPTION", IEEE TRANSACTIONS ON IMAGE PROCESSING, vol. 3, no. 5, 1 September 1994 (1994-09-01), pages 513 - 526, XP000476828 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7295612B2 (en) 2003-09-09 2007-11-13 Apple Inc. Determining the number of unidirectional and bidirectional motion compensated frames to be encoded for a video sequence and detecting scene cuts in the video sequence

Also Published As

Publication number Publication date
JP4733800B2 (ja) 2011-07-27
PL335413A1 (en) 2000-03-27
EP0987903B1 (fr) 2018-07-25
BR9904108B1 (pt) 2015-02-18
JP2000102021A (ja) 2000-04-07
BR9904108A (pt) 2000-09-05
US6480540B1 (en) 2002-11-12
EP0987903A1 (fr) 2000-03-22
ID23263A (id) 2000-04-05
CN1166210C (zh) 2004-09-08
HK1026097A1 (en) 2000-12-01
KR100646385B1 (ko) 2006-11-17
ZA995802B (en) 2000-04-03
MY128350A (en) 2007-01-31
FR2783388B1 (fr) 2000-10-13
KR20000023133A (ko) 2000-04-25
CN1248864A (zh) 2000-03-29

Similar Documents

Publication Publication Date Title
EP1099352B1 (fr) Procede et dispositif de quantification pour compression video
EP0595403B1 (fr) Dispositif de codage de signaux numériques représentatifs d&#39;images, et dispositif de décodage correspondant
FR2764156A1 (fr) Dispositif de pretraitement pour codage mpeg ii
FR2783388A1 (fr) Procede de compression d&#39;images et dispositif pour la mise en oeuvre de ce procede
FR2760872A1 (fr) Procede d&#39;optimisation de la compression de donnees d&#39;image, a selection automatique de conditions de compression
FR2881898A1 (fr) Procede et dispositif de codage d&#39;une image video en mode inter ou intra
FR2948845A1 (fr) Procede de decodage d&#39;un flux representatif d&#39;une sequence d&#39;images et procede de codage d&#39;une sequence d&#39;images
FR2857205A1 (fr) Dispositif et procede de codage de donnees video
FR2940577A1 (fr) Procede d&#39;encodage par segmentation d&#39;une image.
FR2688958A1 (fr) Procede de codage d&#39;images bi-standard tres bas debit et codeur-decodeur pour la mise en óoeuvre de ce procede.
EP3139608A1 (fr) Procédé de compression d&#39;un flux de données vidéo
FR2782879A1 (fr) Procede de compression d&#39;images
FR2768003A1 (fr) Procede de codage d&#39;un signal de forme binaire
EP1302078B1 (fr) Procede et dispositif de codage d&#39;un flux d&#39;images video
EP0689361B1 (fr) Procédé de quantification de coéfficients dans un codeur d&#39;images vidéo numérique
EP0489890B1 (fr) Procede de codage a parametres ajustables d&#39;un champ de mouvement dans une sequence d&#39;images animees
FR2860940A1 (fr) Dispositif et procede de reduction de bruit d&#39;un signal video
EP1161101A1 (fr) Codage vidéo de source avec prédiction du movement et filtrage des effets de blocs
FR2740642A1 (fr) Appareil et procede de codage d&#39;image
EP1468565A2 (fr) Procede et dispositif de compression de donnees video codees par paquets video
FR2829345A1 (fr) Dispositif et procede de codage d&#39;images video par compensation de mouvement
WO2013107600A1 (fr) Procede de quantification dynamique pour le codage de flux de donnees
EP0724812B1 (fr) Procede et dispositif de codage inter-trame avec regulation de debit pour l&#39;enregistrement d&#39;images sur magnetoscope
FR2661063A1 (fr) Procede et dispositif de post-filtrage pour codage d&#39;images par transformation cosinus discrete.
FR2728129A1 (fr) Dispositif de multiplexage numerique de programmes video

Legal Events

Date Code Title Description
ST Notification of lapse