FR2857205A1 - Dispositif et procede de codage de donnees video - Google Patents

Dispositif et procede de codage de donnees video Download PDF

Info

Publication number
FR2857205A1
FR2857205A1 FR0308154A FR0308154A FR2857205A1 FR 2857205 A1 FR2857205 A1 FR 2857205A1 FR 0308154 A FR0308154 A FR 0308154A FR 0308154 A FR0308154 A FR 0308154A FR 2857205 A1 FR2857205 A1 FR 2857205A1
Authority
FR
France
Prior art keywords
images
image
coding
frame
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR0308154A
Other languages
English (en)
Other versions
FR2857205B1 (fr
Inventor
Xavier Ducloux
Patrice Alexandre
Ludovic Noblet
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nextream SA
Original Assignee
Nextream France SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nextream France SA filed Critical Nextream France SA
Priority to FR0308154A priority Critical patent/FR2857205B1/fr
Priority to EP04013925A priority patent/EP1494483A3/fr
Priority to TW093119869A priority patent/TWI339524B/zh
Priority to JP2004196600A priority patent/JP4669239B2/ja
Priority to US10/884,158 priority patent/US7577196B2/en
Priority to KR1020040051572A priority patent/KR101146037B1/ko
Priority to MYPI20042648A priority patent/MY141436A/en
Priority to CN200410062160A priority patent/CN100588256C/zh
Publication of FR2857205A1 publication Critical patent/FR2857205A1/fr
Application granted granted Critical
Publication of FR2857205B1 publication Critical patent/FR2857205B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

L'invention concerne un dispositif de codage de séquences d'images vidéo, comportant- des moyens (1) de mesurer l'activité spatiale des images vidéo à coder,- des moyens (1) de mesurer l'activité temporelle des images vidéo à coder,- des moyens (2) de coder les images en structure image ou en structure trame,Selon l'invention, les moyens (2) de coder les images en structure image ou en structure trame sont aptes à choisir dynamiquement la structure trame ou image en fonction des mesures d'activité spatiale et temporelle de ladite image.

Description

I
L'invention concerne un dispositif et un procédé de codage de données vidéo.
L'invention s'applique plus particulièrement au codage d'images entrelacées, c'est à dire composées de deux trames échantillonnées à des instants distincts.
Le codage d'images vidéo est nécessaire pour la transmission des données vidéo numériques dans les réseaux à bande passante limitée ainsi que pour les applications où le stockage constitue une limite.
La compression des données vidéo numériques sans dégradation significative de la qualité est possible lorsque les séquences vidéo affichent un degré élevé de redondance spatiale, de redondance spectrale, de redondance temporelle, de redondance psycho-visuelle.
Au cours des dernières années, l'intérêt pour le multimédia a conduit à l'émergence de nouveaux standards de compression et a vu le développement de standards tels que MPEG-2 et plus récemment H.264 défini sous la référence: ITU-T Rec. H.264 J ISOIIEC 14496-10 AVC.
Ces normes visent un vaste éventail d'applications aux exigences variées quant au débit binaire, à la qualité d'image, à la complexité, à la résilience à l'erreur et au délai ainsi qu'à l'amélioration des rapports de compression.
Le standard de compression H.264 a introduit, à l'image de ce qui était fait dans MPEG-2, la notion de structure de codage image ( frame en anglais) entrelaçant les lignes de l'image ou trame ( field en anglais) séparant deux trames de l'image.
L'image ou la trame est constituée de rangées horizontales, chacune contenant 16 lignes de pixels. Dans chaque rangée, on trouve des macroblocs, chacun étant de dimension 16*16. Un macrobloc est organisé en 4 blocs de luminance et en 2, 4 ou 8 blocs de chrominance selon le type d'échantillonnage.
Dans un schéma de compression formatant les données en mode image dans un macrobloc, les deux trames restent entrelacées dans un bloc commun. Dans le mode de codage de type trame, les deux trames sont séparées dans le macrobloc: un bloc correspond à la trame paire et un autre correspond à la trame impaire.
On retrouve dans la norme H.264 les types d'image connus et définis dans la norme MPEG-2, à savoir: - Les images I (intra) dont le codage ne dépend d'aucune autre image, - Les images P (prédictives) dont le codage dépend d'images 10 reçues précédemment, - Les images B (bi-prédictives) qui dépendent d'images reçues précédemment et/ou postérieurement. Le groupe d'images entre deux images I est appelé GOP (acronyme anglais de Group Of Pictures signifiant groupe d'images), sa taille est variable et sa structure interne en terme de type d'images est également libre.
Le modèle de référence de la norme H.264 a fait le choix de codage dit à posteriori, c'est-à-dire après codage de l'image dans les structures image ou trame. Le codage ayant fourni le meilleur compromis débit/distorsion est retenu.
Un tel mode de codage est peu envisageable pour des applications temps réel car il est trop coûteux en temps ou en moyen de calculs: il impose le calcul des prédictions trames en structure image, des prédictions images en structure image, des prédictions trames en structure trame, soit 3 fois plus de calculs que le codage d'une source progressive (prédictions images en structure image) qui est déjà critique pour un format de télévision standard dans l'état actuel de la technologie.
D'autre part, le modèle de référence du standard implémente une structure de GOP fixe, ce qui ne garantie pas que le choix de codage, bien qu'effectué en à postériori, permette d'obtenir le codage le meilleur en terme de compromis débit/distorsion.
La présente invention propose un dispositif de codage dans lequel les choix de codage en mode trame ou image sont réalisés avant le codage.
A cet effet, l'invention propose un dispositif de codage de séquences d'images vidéo, comportant - des moyens de mesurer l'activité spatiale des images vidéo à coder, - des moyens de mesurer l'activité temporelle des images vidéo à coder, - des moyens de coder les images en structure image ou en structure trame, Selon l'invention, les moyens de coder les images en structure image ou en structure trame sont aptes à choisir dynamiquement la structure trame ou image en fonction des mesures d'activité spatiale et temporelle de ladite image.
L'invention peut rendre possible une réduction du nombre de calculs de 30 à 60% par rapport à l'approche du modèle de référence. Cette optimisation des calculs ne se fait pas au détriment de la qualité de codage: l'invention vise plus particulièrement des applications de qualité de codage élevée.
Selon un mode préféré de réalisation, les moyens de codage étant aptes à coder les séquences vidéo sous forme de groupes d'images, ledit dispositif comporte des moyens de choisir la structure du groupe d'images (GOP) en fonction des mesures d'activité spatiale et temporelle.
De cette manière, les séquences présentant une faible activité temporelle peuvent être codées en utilisant des groupes d'images comportant des séquences d'images B consécutives plus importantes que les séquences présentant une forte activité temporelle.
Le couplage du choix de la structure de codage image/trame et de la structure GOP peut permettre de dépasser les performances du modèle de référence du standard.
Dans une forme de réalisation préférée, le dispositif comporte des moyens de décider si les séquences vidéo sont de type entrelacé ou de type progressif.
De cette manière, ceci rend possible de coder en structure image une séquence d'images de type progressif. En effet, les séquences progressives présentent une forte corrélation spatiale et il est donc préférable de les coder en structure image.
Selon un mode préféré de réalisation, les groupes d'images comportant des images codées en mode intra, en mode prédictif et en mode bi-prédictif, les images de type bi-prédictif sont aptes à servir d'image de référence pour le codage de certaines images du groupe d'images.
Préférentiellement, les groupes d'images sont aptes à comporter des 15 séquences composées d'un nombre quelconque d'images consécutives codées en mode bi-prédictif.
Ceci est particulièrement intéressant dans le cas de séquences présentant une activité temporelle faible, le codage en mode bi-prédictif étant 20 peu coûteux.
Selon un mode préféré de réalisation, lorsque la séquence d'entrée est de type entrelacée, les images de type I sont codées en structure trame, la seconde trame de l'image devenant une trame de type P (prédictif) par rapport à la première trame de l'image.
Ceci peut rendre possible une réduction du coût de codage et donc une amélioration du débit de codage.
L'invention concerne également un procédé de codage de données 30 vidéo, comportant les étapes de: - mesure de l'activité spatiale des images vidéo à coder, - mesure de l'activité temporelle des images vidéo à coder, codage des images en structure image ou en structure trame, Selon l'invention, le codage des images en structure image ou en structure trame choisit dynamiquement une structure trame ou image en fonction des mesures d'activité spatiale et temporelle de ladite image.
L'invention concerne également un produit programme d'ordinateur caractérisé en ce qu'il comprend des instructions de code de programme aptes à mettre en oeuvre le procédé selon l'invention lorsque le programme est exécuté sur un ordinateur.
L'invention sera mieux comprise et illustrée au moyen d'exemples de modes de réalisation et de mise en oeuvre avantageux, nullement limitatifs, en référence aux figures annexées sur lesquelles: - la figure 1 représente un dispositif de codage selon un mode préféré de réalisation de l'invention, - la figure 2 représente un mode préféré de réalisation d'un bloc diagramme fonctionnel de l'invention, - la figure 3 représente un mode préféré de calcul des corrélations intra et inter trames, - La figure 4 représente un groupe d'images (GOP) selon un mode préféré de réalisation de l'invention dans le cas de séquences à faible mouvement.
La figure 1 représente un dispositif de codage selon le mode préféré de réalisation. Le dispositif de codage comporte un module 1 de pré-analyse qui reçoit en entrée les séquences d'images provenant du flux vidéo à coder. Le flux vidéo est également transmis à l'entrée d'un module 3 de réorganisation des images.
La sortie du module 3 de réorganisation des images est connectée à l'entrée d'une boucle de codage 4 dont la sortie est connectée à un module de codage entropique 5 qui fournit en sortie le flux de données vidéo codées.
Le module 1 de pré-analyse est connecté en sortie à l'entrée d'un module 2 de contrôle de codage qui fournit au module 5 de codage entropique des données de contrôle, qui fournit au module 3 de réorganisation des images le type d'image à coder et qui fournit à la boucle de codage 4 le type de structure de codage, à savoir un codage de type image ou trame.
Le module 5 de codage entropique fournit en sortie le flux vidéo codé. 5 La boucle de codage 4 est une boucle de codage conforme aux boucles de codage définies dans la norme H.264. Selon d'autres modes de réalisation, cette boucle de codage peut obéir à d'autres normes de codage telles MPEG2 par exemple ou tout autre type de codage. Les fonctions des différents modules sont détaillées en référence aux figures suivantes.
La figure 2 représente une décomposition en blocs fonctionnels des modules de pré-analyse 1 et de contrôle du codage 2 représentés en figure 1.
Les blocs fonctionnels représentés peuvent ou non correspondre à des entités physiquement distinguables. Par exemple, ces modules ou certains d'entre eux peuvent être regroupés dans un unique composant ou constituer des fonctionnalités d'un même logiciel. A contrario, certains modules peuvent éventuellement être composés d'entités physiques séparées.
Les modules 6 et 7 sont des modules de pré-analyse et les modules 8, 9 et 10 sont des modules permettant le contrôle du codage.
Le module 6 effectue des calculs de corrélations trame.
La figure 3 explique le schéma de corrélation utilisé par le module 6.
La module 6 effectue une évaluation de l'activité spatiale comme indiqué ci-après.
Le module 6 effectue une corrélation intra-trame de l'image courante en mesurant la corrélation intra-trame de chaque trame de l'image.
La corrélation intra-trame de la trame paire est notée Clntra[0] et la corrélation intra-trame de la trame impaire est notée Clntra[1] comme indiqué en figure 3.
j=nblines / 2 1 i=nbpels 1 CIntra[0] = Fn - Zj * 2, i) Fn - A * 2 + 1, i) j=0 i=0 j=nblines /2 1 i=nbpels 1 Clntra[1]= E Fn(j* 2,i) Fn(j* 2+1,i) j=o i=o j représente le nombre de lignes de chaque trame, considérée 5 séparément.
F représente la valeur de la luminance du pixel (i,j).
Le module 6 effectue une évaluation de l'activité temporelle comme indiqué ci-dessous.
La période entre deux trames est notée T. Lors d'un signal à 50 Hz, la période trame est de 1/50 s et dans le cas d'un signal 60Hz, la période trame est de 1/60 s.
Le module 6 effectue une mesure de la corrélation inter-trame entre la 15 première trame de l'image courante et la dernière trame de l'image précédente notée C T[0].
j=nblines 1 i=nbpels 1 C T[0]= E E Fn - 1(j, i) -Fn - 2(j, i) j=o i=o Le module 6 effectue une mesure de la corrélation inter trame entre la première trame de l'image courante et la première trame de l'image précédente notée C_2T[0].
j=nblines 1 i=nbpels 1 C 2T[O] = E E Fn - 1(j, i) Fn - 3(j,i) j=0 i=0 Le module 6 effectue une mesure de la corrélation inter trame entre la seconde trame de l'image courante et la première trame de l'image courante notée C_T[1].
j=nblines 1 i=nbpels 1 CT[1]= 1 E IFn(j,i) Fn-1(j,i) j=0 i=0 Le module 6 effectue une mesure de la corrélation inter trame entre la seconde trame de l'image courante et la seconde trame de l'image 5 précédente notée C_2T[1].
j=nblines 1 i=nbpels 1 C_2T[1]= E 1I Fn(j,i) Fn-2(j,i) j=0 i=0 Le module 6 fournit les mesures de corrélation inter-trame et intra-10 trame au module 7.
Le module 7 comporte un module de décision progressiflentrelacé 11 et un module 12 de calcul de l'activité temporelle pondérée.
Le module 11 détermine si la séquence courante reçue en entrée du dispositif de codage est issue d'une source progressive (un film par exemple) 15 ou d'une source vidéo entrelacée.
A cet effet, il effectue la comparaison suivante: Si (0.9 * (C_Intra[0]+ C_Intra[1]) > C_T[1]), alors la séquence est considérée comme étant progressive, sinon la séquence est considérée comme étant entrelacée.
Le module 12 effectue un calcul de l'activité temporelle pondérée par l'activité spatiale.
Le codage de type image est approprié pour les séquences d'images à faible mouvement, c'est-à-dire les séquences d'images dont l'activité 25 temporelle est faible.
Le codage de type trame est approprié, à l'inverse, pour les séquences d'images à fort mouvement, c'est-à-dire les séquences d'images dont l'activité temporelle est forte.
L'activité temporelle est pondérée par l'activité spatiale. En effet, 30 lorsque les séquences sont très texturées et présentent donc une activité spatiale forte, le codage de type image, gardant toutes les lignes, donne de meilleurs résultats qu'un codage en mode trame qui lui ne garde qu'une ligne sur deux.
L'activité temporelle pondérée est calculée selon la formule suivante: 1+min{C_T[0},C_T[1]} Act 2 + 0.5 * max{taille _ image, (C _ int ra[0]+ C int ra[l])} Les valeurs 2 et 0.5 sont données à titre indicatif et peuvent être modifiées dans d'autres modes de réalisation.
Ensuite, le codage est effectué selon un mode trame ou un mode image en fonction de la valeur de Act et de la détection du type de codage, progressif ou entrelacé faite par le module 11. Le choix du codage est réalisé par le module 8 qui reçoit en entrée le type de séquence détecté et l'activité temporelle pondérée.
Si le module 11 a détecté une séquence entrelacée pour la paire de trames (l'image) courantes, et pour la paire de trames précédentes, alors l'image courante peut être codée en utilisant un codage de type trame, sinon, l'image courante sera codée en utilisant un codage de type image.
Si le mode de codage trame est possible, alors: Si Act > 3, l'image est codée en mode trame. Sinon, l'image est codée en mode image.
Dans d'autres modes de réalisation la valeur de seuil égale à 3 peut être différente. Une modification de la valeur du seuil peut permettre de favoriser l'un ou l'autre des modes de codage.
Ensuite le module 8 effectue le choix de la structure du groupe d'images (GOP).
Si le module 8 a pris la décision de codage en mode trame, alors le GOP comportera entre chaque image P, une seule image B. La seule structure de GOP possible est alors. 10,0 10,1 B1,o B11 1 P2,0 P2,1 B3,0 B3,1 P4,0 P4, 1 B5,0 B5,1 P6,O P6,1.
Où i,j dans X;i représentent respectivement le numéro d'image et le numéro de trame. La longueur du GOP n'est pas fixe.
Si le module 8 a pris la décision de coder l'image en mode image, alors le nombre d'images B consécutives à l'intérieur du GOP peut être supérieur à 1.
Dans ce cas, le module 8 calcule dans un premier temps, le nombre optimal d'images B consécutives en calculant la période I/P optimale T11p opt, c'est-à-dire la période entre une image I et l'image P suivante.
T,/Popt = 7 2 * Act + 0.5 les valeurs 7, 2 et 0.5 sont données à titre indicatif et peuvent être modifiées dans d'autres modes de réalisation.
Ensuite le module 8 calcule le nombre effectif d'images B: Le nombre effectif d'images B consécutives est parfois différent du nombre optimal d'images B en fonction des contraintes de l'application. La période I/P maximale peut en effet être imposée par des exigences de temps de traitement court dans la chaîne de codage-décodage.
La période I/P est ainsi bornée par l'intervalle [2, période I/P maxi.
La valeur 2 correspond à une image de type B entre une image de type I et une image de type P. Le module 8 transmet au module de décision finale 9 la proposition de type et structure d'image. Le module 9 reçoit également via le module 10 l'historique de décisions sur les dernières images codées. Si la structure et le type de codage du GOP courant sont différents de ceux proposés par le module 8, le module 9 ne tiendra compte de cette dernière proposition que si la structure du GOP courant ainsi que le type de codage peuvent être modifiés. Dans ce cas, un même GOP peut contenir des images codées en structure trame ou en structure image.
Selon un mode préféré de réalisation, le GOP peut être raccourci afin de permettre le passage d'un codage de type trame vers un codage de type image ou inversement. Dans ce cas, chaque GOP possède une structure de codage, de type image ou trame, et une structure de GOP associée, constantes. Lorsque l'on change de structure, on change alors de GOP en codant la première image en mode intra. Ceci permet d'obtenir une qualité de codage performante et d'une grande stabilité et facilite également l'implémentation d'une régulation de débit pour un codage en boucle fermée.
Le module 9 transmet ensuite les informations nécessaires au codage au module 3 de réorganisation des images représenté en figure 3 et à la 10 boucle de codage 4 représentée en figure 4 ainsi que des données de contrôle au module de codage entropique 5 représenté en figure 5. Les données de contrôle sont constituées par exemple des paramètres de haut niveau, indiquant le mode de codage entropique ( cabac ou cavlc en codage H.26L), le nombre d'images de référence pour les prédictions, la taille 15 de l'image (largeur, hauteur), le profil et le niveau ( level en anglais).
Plus précisément, le module 2 de contrôle de codage transmet au module 3 de réorganisation des images le type dans lequel l'image suivante doit être codée (intra, bi-prédictif ou prédictif) et transmet à la boucle de 20 codage 4 la structure de l'image (trame ou image).
Selon un mode préféré de réalisation de l'invention, l'image de type I est toujours codée en mode trame (avec la deuxième trame de l'image codée en type P par rapport à la première trame), quels que soient la structure et le 25 mode de codage du GOP courant, à partir du moment où la séquence est considérée de type entrelacé.
Selon un mode préféré de réalisation de l'invention, lorsque le nombre d'images B insérées dépasse 2 (séquences à faible mouvement), les images 30 B seront utilisées comme images de référence possibles des autres images B. La figure 4 représente un exemple de groupe d'images selon ce mode préféré de réalisation.
2857205 12 La période entre une image I et une image P est de 4, c'est-àdire qu'il y a 3 images B entre une image I et une image P. L'image B2 centrale, comprise entre les deux autres images B est une image de référence pour le codage des deux images B l'entourant. Cette image B2 est codée, avant l'image B1, à partir de l'image 10 précédente du GOP courant et de l'image P4 suivante du GOP courant.
L'image B1 est codée à partir de l'image IO précédente de l'image B2 suivante et de l'image P4 suivante.
L'image B3 est codée à partir de l'image 10, de l'image B2, de l'image P4.

Claims (8)

Revendications
1. Dispositif de codage de séquences d'images vidéo, comportant - des moyens (1) de mesurer l'activité spatiale des images vidéo à coder, des moyens (1) de mesurer l'activité temporelle des images vidéo à coder, des moyens (2) de coder les images en structure image ou en 10 structure trame, caractérisé en ce que les moyens (2) de coder les images en structure image ou en structure trame sont aptes à choisir dynamiquement la structure trame ou image en fonction des mesures d'activité spatiale et temporelle de ladite image.
2. Dispositif de codage selon la revendication 1 caractérisé en ce que les moyens de codage étant aptes à coder les séquences vidéo sous forme de groupes d'images (GOP), ledit dispositif comporte des moyens de choisir la structure du groupe d'images (GOP) en fonction des mesures d'activité spatiale et temporelle.
3. Dispositif selon l'une des revendications précédentes caractérisé en ce qu'il comporte des moyens (11) de décider si les séquences vidéo sont de type entrelacé ou de type progressif.
4. Dispositif selon l'une des revendications précédentes caractérisé en ce que les groupes d'images comportant des images codées en mode intra (I) , en mode prédictif (P) et en mode bi-prédictif (B), les images de type biprédictif (B) sont aptes à servir d'image de référence pour le codage de certaines images du groupe d'images (GOP).
5. Dispositif selon la revendication 3 caractérisé en ce que les groupes d'images (GOP) sont aptes à comporter des séquences composées d'un nombre quelconque d'images consécutives codées en mode bi-prédictif (B).
6. Dispositif selon la revendication 3 caractérisé en ce que, lorsque la séquence d'entrée est de type entrelacé, les images de type intra (I) sont codées en structure trame, la seconde trame de l'image devenant une trame de type prédictif (P) par rapport à la première trame de l'image.
7. Procédé de codage de données vidéo, comportant les étapes de - mesure de l'activité spatiale des images vidéo à coder, - mesure de l'activité temporelle des images vidéo à coder, - codage des images en structure image ou en structure trame, caractérisé en ce que le codage des images en structure image ou en structure trame est choisit dynamiquement en fonction des mesures d'activité spatiale et temporelle de ladite image.
8. Produit programme d'ordinateur caractérisé en ce qu'il comprend des instructions de code de programme aptes à mettre en oeuvre le procédé selon la revendication 7 lorsque le programme est exécuté sur un ordinateur.
FR0308154A 2003-07-04 2003-07-04 Dispositif et procede de codage de donnees video Expired - Fee Related FR2857205B1 (fr)

Priority Applications (8)

Application Number Priority Date Filing Date Title
FR0308154A FR2857205B1 (fr) 2003-07-04 2003-07-04 Dispositif et procede de codage de donnees video
EP04013925A EP1494483A3 (fr) 2003-07-04 2004-06-15 Codeur vidéo avec controle de la structure de GOP selon l'activité spatiale et temporelle
TW093119869A TWI339524B (en) 2003-07-04 2004-07-01 Device and method for coding video data
US10/884,158 US7577196B2 (en) 2003-07-04 2004-07-02 Device and method for coding video data
JP2004196600A JP4669239B2 (ja) 2003-07-04 2004-07-02 ビデオデータを符号化するための装置および方法
KR1020040051572A KR101146037B1 (ko) 2003-07-04 2004-07-02 비디오 데이터를 코딩하기 위한 디바이스 및 방법
MYPI20042648A MY141436A (en) 2003-07-04 2004-07-02 Device and method for coding video data
CN200410062160A CN100588256C (zh) 2003-07-04 2004-07-05 用于编码视频数据的设备和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0308154A FR2857205B1 (fr) 2003-07-04 2003-07-04 Dispositif et procede de codage de donnees video

Publications (2)

Publication Number Publication Date
FR2857205A1 true FR2857205A1 (fr) 2005-01-07
FR2857205B1 FR2857205B1 (fr) 2005-09-23

Family

ID=33427687

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0308154A Expired - Fee Related FR2857205B1 (fr) 2003-07-04 2003-07-04 Dispositif et procede de codage de donnees video

Country Status (8)

Country Link
US (1) US7577196B2 (fr)
EP (1) EP1494483A3 (fr)
JP (1) JP4669239B2 (fr)
KR (1) KR101146037B1 (fr)
CN (1) CN100588256C (fr)
FR (1) FR2857205B1 (fr)
MY (1) MY141436A (fr)
TW (1) TWI339524B (fr)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2857205B1 (fr) 2003-07-04 2005-09-23 Nextream France Dispositif et procede de codage de donnees video
CA2565670A1 (fr) * 2004-05-04 2005-11-17 Qualcomm Incorporated Procede et dispositif de conversion par elevation de la frequence de trame compensee
WO2006007527A2 (fr) * 2004-07-01 2006-01-19 Qualcomm Incorporated Procede et systeme utilisant des techniques de conversion-elevation de frequences de trames dans un codage video scalaire
EP1772017A2 (fr) * 2004-07-20 2007-04-11 Qualcomm Incorporated Procede et appareil d'elevation de la frequence de trames assistee par un codeur (ea-fruc) pour compression video
US8553776B2 (en) * 2004-07-21 2013-10-08 QUALCOMM Inorporated Method and apparatus for motion vector assignment
KR100694137B1 (ko) 2005-07-08 2007-03-12 삼성전자주식회사 동영상 부호화 장치, 동영상 복호화 장치, 및 그 방법과,이를 구현하기 위한 프로그램이 기록된 기록 매체
KR100775787B1 (ko) * 2005-08-03 2007-11-13 경희대학교 산학협력단 영역별 시공간적 특성을 이용한 동영상 부호화 장치 및 그방법
TWI304303B (en) * 2006-01-04 2008-12-11 Sunplus Technology Co Ltd Apparatus for image encoding and the method thereof
KR100754205B1 (ko) 2006-02-07 2007-09-03 삼성전자주식회사 다시점 동영상 부호화 장치 및 방법
US20070230564A1 (en) * 2006-03-29 2007-10-04 Qualcomm Incorporated Video processing with scalability
US8634463B2 (en) * 2006-04-04 2014-01-21 Qualcomm Incorporated Apparatus and method of enhanced frame interpolation in video compression
US8750387B2 (en) * 2006-04-04 2014-06-10 Qualcomm Incorporated Adaptive encoder-assisted frame rate up conversion
FR2903271A1 (fr) 2006-06-30 2008-01-04 Thomson Licensing Sa Procede de codage en mode trame ou bitrame
US20090268981A1 (en) * 2006-09-29 2009-10-29 Xiaoan Lu Spatial activity metric and method for evaluating the same
JP4892450B2 (ja) * 2007-10-17 2012-03-07 パナソニック株式会社 画像符号化装置および画像符号化方法
US8670484B2 (en) * 2007-12-17 2014-03-11 General Instrument Corporation Method and apparatus for selecting a coding mode
KR100952340B1 (ko) 2008-01-24 2010-04-09 에스케이 텔레콤주식회사 시공간적 복잡도를 이용한 부호화 모드 결정 방법 및 장치

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0782344A2 (fr) * 1995-12-28 1997-07-02 Daewoo Electronics Co., Ltd ContrÔleur pour un système de codage d'un signal vidéo
US5784107A (en) * 1991-06-17 1998-07-21 Matsushita Electric Industrial Co., Ltd. Method and apparatus for picture coding and method and apparatus for picture decoding
FR2764156A1 (fr) * 1997-05-27 1998-12-04 Thomson Broadcast Systems Dispositif de pretraitement pour codage mpeg ii
EP1081959A1 (fr) * 1999-09-03 2001-03-07 STMicroelectronics S.r.l. Méthode de reconnaissance de l'aspect entrelacé ou progressif d'une séquence vidéo
US6259733B1 (en) * 1998-06-16 2001-07-10 General Instrument Corporation Pre-processing of bit rate allocation in a multi-channel video encoder
US6272177B1 (en) * 1992-12-12 2001-08-07 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for coding an input signal based on characteristics of the input signal
US20030053538A1 (en) * 2001-03-05 2003-03-20 Ioannis Katsavounidis Systems and methods for detecting scene changes in a video data stream

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5347309A (en) * 1991-04-25 1994-09-13 Matsushita Electric Industrial Co., Ltd. Image coding method and apparatus
JP2684941B2 (ja) * 1992-11-25 1997-12-03 松下電器産業株式会社 画像符号化方法及び画像符号化装置
JP3166835B2 (ja) * 1991-10-14 2001-05-14 株式会社ディーディーアイ 動画像の高能率符号化方法及び装置
US5506844A (en) * 1994-05-20 1996-04-09 Compression Labs, Inc. Method for configuring a statistical multiplexer to dynamically allocate communication channel bandwidth
JPH08275160A (ja) * 1995-03-27 1996-10-18 Internatl Business Mach Corp <Ibm> 離散余弦変換方法
US5652629A (en) * 1995-09-12 1997-07-29 International Business Machines Corporation Bidirectional motion estimation in a motion video compression system
US5682204A (en) * 1995-12-26 1997-10-28 C Cube Microsystems, Inc. Video encoder which uses intra-coding when an activity level of a current macro-block is smaller than a threshold level
US6108039A (en) * 1996-05-23 2000-08-22 C-Cube Microsystems, Inc. Low bandwidth, two-candidate motion estimation for interlaced video
JP2001169290A (ja) * 1999-12-10 2001-06-22 Matsushita Electric Ind Co Ltd 動画像符号化方法、動画像符号化装置及び動画像符号化システム
JP4378824B2 (ja) * 2000-02-22 2009-12-09 ソニー株式会社 画像処理装置及び方法
JP2003333505A (ja) * 2002-05-14 2003-11-21 Pioneer Electronic Corp 記録媒体、映像記録装置、映像再生装置及び映像記録再生装置
US7020200B2 (en) * 2002-08-13 2006-03-28 Lsi Logic Corporation System and method for direct motion vector prediction in bi-predictive video frames and fields
FR2857205B1 (fr) * 2003-07-04 2005-09-23 Nextream France Dispositif et procede de codage de donnees video

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5784107A (en) * 1991-06-17 1998-07-21 Matsushita Electric Industrial Co., Ltd. Method and apparatus for picture coding and method and apparatus for picture decoding
US6272177B1 (en) * 1992-12-12 2001-08-07 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for coding an input signal based on characteristics of the input signal
EP0782344A2 (fr) * 1995-12-28 1997-07-02 Daewoo Electronics Co., Ltd ContrÔleur pour un système de codage d'un signal vidéo
FR2764156A1 (fr) * 1997-05-27 1998-12-04 Thomson Broadcast Systems Dispositif de pretraitement pour codage mpeg ii
US6259733B1 (en) * 1998-06-16 2001-07-10 General Instrument Corporation Pre-processing of bit rate allocation in a multi-channel video encoder
EP1081959A1 (fr) * 1999-09-03 2001-03-07 STMicroelectronics S.r.l. Méthode de reconnaissance de l'aspect entrelacé ou progressif d'une séquence vidéo
US20030053538A1 (en) * 2001-03-05 2003-03-20 Ioannis Katsavounidis Systems and methods for detecting scene changes in a video data stream

Also Published As

Publication number Publication date
MY141436A (en) 2010-04-30
KR101146037B1 (ko) 2012-05-14
JP2005033789A (ja) 2005-02-03
CN1578470A (zh) 2005-02-09
TW200509675A (en) 2005-03-01
KR20050004112A (ko) 2005-01-12
EP1494483A2 (fr) 2005-01-05
TWI339524B (en) 2011-03-21
JP4669239B2 (ja) 2011-04-13
FR2857205B1 (fr) 2005-09-23
US7577196B2 (en) 2009-08-18
EP1494483A3 (fr) 2005-01-19
CN100588256C (zh) 2010-02-03
US20050117644A1 (en) 2005-06-02

Similar Documents

Publication Publication Date Title
FR2857205A1 (fr) Dispositif et procede de codage de donnees video
US9538190B2 (en) Intra rate control for video encoding based on sum of absolute transformed difference
US6944224B2 (en) Systems and methods for selecting a macroblock mode in a video encoder
KR101131689B1 (ko) 필터 선택을 이용한 비디오 압축 방법
US20070199011A1 (en) System and method for high quality AVC encoding
US7180944B2 (en) Low-complexity spatial downscaling video transcoder and method thereof
EP1515564A2 (fr) Systèmes et procédés pour le filtrage adaptatif de coefficients TCD dans un codeur vidéo
KR100345447B1 (ko) 스트리밍 서비스를 위한 가변 비트율 처리 방법
US20040240560A1 (en) Video decoder architecture and method for using same
JP2011505781A (ja) 高解像度デジタル静止画像をビデオと並行して符号化するためのavc規格の拡張
JP2011505780A (ja) 高解像度デジタル静止画像をビデオと連続して符号化するためのavc規格の拡張
US20010026587A1 (en) Image encoding apparatus and method of same, video camera, image recording apparatus, and image transmission apparatus
CN1605209A (zh) 视频编码方法
KR20160007564A (ko) 높은 프레임 레이트 및 가변 프레임 레이트 캡처를 위한 비디오 압축 튜닝
FR2948845A1 (fr) Procede de decodage d&#39;un flux representatif d&#39;une sequence d&#39;images et procede de codage d&#39;une sequence d&#39;images
Xu et al. The impact of bitrate and GOP pattern on the video quality of H. 265/HEVC compression standard
US7440629B2 (en) Image encoding apparatus and image encoding method
EP2410749A1 (fr) Procédé d&#39;encodage adaptatif d&#39;un flux vidéo numérique, notamment pour diffusion sur ligne xDSL
KR20060009898A (ko) 블록 기반 적응성 스캔 순서를 이용한 비디오 정보 인코딩
KR20000023133A (ko) 화상 압축 방법과 그 방법을 실행하기 위한 장치
FR2944936A1 (fr) Procedes de codage et de decodage d&#39;un bloc de donnees images, dispositifs de codage et de decodage implementant lesdits procedes
FR2927758A1 (fr) Procede et dispositif de codage-decodage d&#39;images video successives selon un flux video principal en pleine resolution et selon un flux video secondaire en qualite reduite
Fitzek et al. VideoMeter tool for YUV bitstreams
KR101071201B1 (ko) 폴리페이즈 방식을 이용한 영상 압축 방법
WO2011161259A1 (fr) Procede de codage d&#39;une entite de donnees image et procede de reconstruction d&#39;une entite de donnees image

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20110331