WO2013068676A1 - Procede d'evaluation d'au moins un defaut de qualite dans un signal de donnees, dispositif et programme d' ordinateurs associes - Google Patents

Procede d'evaluation d'au moins un defaut de qualite dans un signal de donnees, dispositif et programme d' ordinateurs associes Download PDF

Info

Publication number
WO2013068676A1
WO2013068676A1 PCT/FR2012/052512 FR2012052512W WO2013068676A1 WO 2013068676 A1 WO2013068676 A1 WO 2013068676A1 FR 2012052512 W FR2012052512 W FR 2012052512W WO 2013068676 A1 WO2013068676 A1 WO 2013068676A1
Authority
WO
WIPO (PCT)
Prior art keywords
defect
signal
quality
image
gel
Prior art date
Application number
PCT/FR2012/052512
Other languages
English (en)
Inventor
Emmanuel Wyckens
Catherine Colomes
Ulrich LEHY
Original Assignee
France Telecom
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom filed Critical France Telecom
Priority to US14/356,787 priority Critical patent/US9143775B2/en
Priority to EP12794413.0A priority patent/EP2777292A1/fr
Publication of WO2013068676A1 publication Critical patent/WO2013068676A1/fr

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/004Diagnosis, testing or measuring for television systems or their details for digital television systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/04Diagnosis, testing or measuring for television systems or their details for receivers

Definitions

  • a method of evaluating at least one quality defect in a data signal, device and associated computer program is a method of evaluating at least one quality defect in a data signal, device and associated computer program.
  • the field of the invention is that of quality evaluation of audiovisual data signals comprising at least one video component and one audio component.
  • the defects of the video component often materialize by saccades or frosts of images.
  • the defects on the audio component are manifested by a loss of sound.
  • the duration of these two degradations fluctuates from a few milliseconds to a few hours.
  • the frequency of occurrence of this type of event may also vary over time.
  • the defects may as well have a low occurrence as sustained on a time scale.
  • the deployed equipment ensuring the automatic control of the audio-visual quality make measurements on the audio and video components of signals at the output of the terminal or samples at the decoder level without taking into account the reference signal, since these are rendered inaccessible. technically or legally. They use models classified as "without reference” and produce fluctuating notes on a quality scale. The conclusions of the expertise of the "no reference” prediction devices have shown that the performances must be greatly improved with respect to the human feeling.
  • Document WO2006 / 103327 discloses a method for evaluating a quality degradation of an audiovisual signal based on a model for predicting the impact of the discontinuity of the fluidity of the images on the subjective quality.
  • a schematic diagram of the evaluation method in question is presented. Discontinuity measurements are conducted in parallel on the video and audio components of the signal to be evaluated. Different audio and video metrics are used to qualify different types of defects (for example, image freezes, the presence of blurs or blocks in the images for the video component, sound losses for the audio component).
  • a video decision module takes into account the results of the evaluations performed using the different metrics and assigns an overall quality score to the video component, using a video interaction model.
  • An audio decision module does the same for the audio component and assigns an overall quality score to the audio component based on an audio interaction model.
  • An audio / video weighting module takes into account both the overall video quality score and the overall audio quality score to assign an overall quality score to the audiovisual signal. It is a so-called cognitive approach because the model reproduces the mechanism of human judgment by producing notes on a quality scale.
  • the prior art calculates the degradation of the perceived quality caused by each break in fluidity, and noise cutoff. The calculations are done in a disjointed way on the audio and video components and without interaction a priori or a posteriori of the results obtained. This approach fails in the face of artificially created discontinuities and when they are not considered perceptible by human judgment. In these cases, interpretation errors appear and generate false alarms.
  • the invention improves the situation by means of a method for evaluating at least one quality defect of a signal carrying data intended to be returned to a recipient, said signal comprising at least one video component and a component audio.
  • Such a method comprises the following steps, implemented on at least one sample of said signal:
  • a fault class is assigned to it.
  • the method according to the invention obtains or not the results of a search for defects on the audio component, with a view to confirming or invalidating the detected fault on the video component.
  • the method according to the invention makes it possible to improve the evaluation of the quality of a degraded video signal by resorting to a fault detection on the audio component, which enables it to remove an indeterminacy on the video degradation detection.
  • the method according to the invention therefore enriches the video quality evaluation model directly to the video component. help degrade detection results on the audio component.
  • the invention thus proposes an entirely new and inventive approach to the evaluation of the impairments undergone by a signal, which is based on the enrichment of the video model used to evaluate the video component of this signal using the results. of the evaluation of the audio component.
  • the decision step comprises a sub-step of cumulation of the durations associated with the image defects of the same class detected, a substep of rejection of said defects of the same class, if their cumulative duration is less than a second predetermined perceptual detection threshold. In this way, only the image defects of a particular class that are actually perceived by the user are retained for evaluating the quality of the audiovisual signal.
  • the detection step is intended to detect image-free image defects, in that it comprises a step of calculating a value of similarity between images of the sample. and a step of comparing the calculated similarity value with a predetermined threshold.
  • the detection of defects on the video component relates to image-free defects.
  • An image freeze is detected when several images of the sequence are sufficiently similar to each other.
  • the detected image freeze class belongs to a group comprising at least:
  • a macro-gel At a detected image freeze is assigned a gel class from a set of predetermined gel-like defect classes.
  • the step of obtaining a search result of a defect in the audio component is implemented for an image-free defect of which the class belongs to the group comprising less:
  • the step of obtaining a result of searching for a defect in the audio component is not implemented for a defect of the image freeze type whose class belongs to the group comprising at least:
  • the detection step is intended to detect block effect type defects, and it comprises a step of calculating a block rate value per image of the sample and a step comparing the calculated value to a predetermined threshold.
  • Block effects are another type of defects that are likely to be detected on a video component.
  • a blockiness type defect is detected when several images of the sequence have a sufficiently high block rate.
  • the invention also relates to a device for evaluating a quality defect of a signal, able to implement the method just described.
  • the invention relates to a storage medium, readable by a processor, storing a computer program implementing the evaluation method of at least one quality defect that has just been described.
  • FIG. 1 illustrates the evaluation scheme of a degradation of quality of an audiovisual signal according to the prior art
  • FIG. 2 schematically shows an example of a distribution system of an audiovisual signal according to the invention
  • FIG. 3 schematically shows the structure of a device for evaluating quality defects of an audiovisual signal according to the invention.
  • FIG. 4 schematically shows the method for evaluating a quality defect of an audiovisual signal according to the invention
  • FIG. 5 schematically shows the steps of the method for evaluating quality defects of an audiovisual signal according to one embodiment of the invention, according to which image-gel defects are evaluated;
  • FIG. 6 schematically shows a graphical representation of an image of the video component of an audiovisual signal to be evaluated
  • Figure 7 schematically illustrates an example of sound loss in an audio component of an audiovisual stream
  • FIG. 8 schematically shows classes of image-free-image defects taken into account in one embodiment of the invention.
  • Figure 9 shows schematically the profile of a micro-gel type defect
  • Figure 10 schematically shows a variation curve of a similarity rate measure for an image gel belonging to the postproduction effects class.
  • an audiovisual signal S comprising at least one video component Cv and at least one audio component Ca is considered.
  • Such a signal S can be intercepted at any stage of an audiovisual transmission chain, between transmitter equipment, telecommunication network node equipment or customer receiving equipment.
  • the invention can be implemented in any of these equipment Serv, EN1, EN2, ER which form the distribution chain of the audiovisual signal S.
  • the device comprises a memory 110 comprising a buffer memory M, a processing unit 120, equipped for example with a processor P, and driven by a computer program Pg 130, implementing the evaluation method of quality according to the invention.
  • the code instructions of the computer program 130 are for example loaded into a RAM memory before being executed by the processor of the processing unit 120.
  • the processing unit 120 receives as input at least a sample of an audiovisual signal to be evaluated.
  • the processor of the processing unit 120 implements the steps of the quality evaluation method described above, according to the instructions of the
  • the device comprises, in addition to the memory 110, means for obtaining a detection of at least one quality defect on the video component of the sample, means for allocating a defect class audit at least one detected defect at least according to its associated duration, means for obtaining a search result of at least one defect on the audio component at the instants corresponding to the sample according to the assigned fault class and decision means to confirm the detection of a quality defect on the sequence at least according to the result of the fault search on the audio component. These means are controlled by the processor of the processing unit 120.
  • such a device 100 may be integrated with at least one of the equipment Serv, EN1, EN2 and E of the distribution system of an audiovisual signal according to the invention.
  • the method according to the invention applies to such a sample e, of the signal.
  • a sample ei of the video component Cv includes Nbl images, with non-zero integer Nbl.
  • the detected fault Dvj is then identified during a step E 2 , at least according to the j calculated duration. It is to assign an image defect class among several predetermined fault classes Cil to CIK, with K nonzero integer.
  • a step E 3 of obtaining an analysis result of the audio component Ca on a sample eai corresponding to the sample evi, is triggered or not. It will be understood that for certain classes of image defect, the analysis of the video component alone is not in itself considered sufficient to allow reliable identification of the detected defect.
  • the analysis of the audio component which has been, for example, carried out in parallel with that of the video component, can lead to the detection of possible audio defects Dal to DaL, with L nonzero integer, on the component S signal audio.
  • An example of an audio component analysis method will be presented later.
  • the class Clk considered it is either to verify that an audio defect was detected at the same instants as the current fault Dvj, or on the contrary to verify that there is no audio defect corresponding to the defect Dvj to to confirm. Depending on the result of this verification, the defect in question is therefore retained or rejected.
  • the decision step E 4 comprises a sub-step E 4 , 2 of cumulation of the durations associated with image defects of the same class and of comparisons of the cumulative duration obtained at a given time. threshold. Only the defects of sufficient cumulative duration are retained and participate in the evaluation of the quality of the signal perceived by the user.
  • Evaluation of image freeze defects In relation with FIG. 5, the implementation of the method according to the invention for the detection of image-free defects is now considered as an illustrative and nonlimiting example.
  • the video component Cv of an audiovisual signal S is cut into samples evi, i integer ranging from 0 to I, each of duration for example between 5 and 10 ms.
  • the method according to the invention is implemented for at least one evi sample.
  • a step ⁇ image freeze defects are detected on an evi sample.
  • An image-free defect is characterized by a break in fluidity between the image k and the neighboring image P prec of the video sequence.
  • a break in fluidity is evaluated by calculating the luminance and chrominance derivative as follows:
  • Y represents the luminance of the pixel, U the component unlike the blue and V the component unlike the red pixel.
  • ref refe [0, Nbl-2], Vke [1, Nbl-1], V ie [0, Vheight] and V je [0, Vwidth] if :
  • ⁇ YMax, ⁇ UMax and ôVMax are integer and positive parameters allowing to adjust the level of similarity between Pk (i, j) and Pprec (i, j).
  • APMax is a positive integer that represents the number of max differences accepted to consider that two consecutive images of a video are identical.
  • the duration of an image freeze is calculated as follows. For a sequence of x consecutive images of the sample ev, of the video component, consider the preceding image precf such that prece [0, Nbl-x -1], images k, such that ke [prec +1, prec + x], X the number of images of the gel sequence and FPS the display frequency of the video.
  • the duration of the image freeze corresponds to: t gel FPS
  • the duration of freezing t ge is greater than 40 ms then the gel is considered potentially perceptible. If this condition is not satisfied, the rupture of fluidity is not taken into account.
  • a defect class of gel type is assigned to each defect detected, at least according to its duration, among a group of classes comprising the following defects:
  • micro gel freeze time if and only if: a. There is no audio mute on the audio component (s) associated with the video component (it is detected using the audio signal) for the duration
  • tgel ⁇ [imin 'Îmax] ⁇ tgel- & ⁇ ⁇ is a real in the interval [0, 1], it represents the cyclic ratio of the pseudo period of a gel below which the gel is considered as micro gel.
  • is the pseudo period of the micro-gel or the time between two starts of freezing.
  • tgel represents the duration of the video freeze as defined previously,
  • represents the minimum duration of the micro gel ( ⁇ 76ms)
  • a video freeze of time t fre e Z e is considered as a post-production effect of the "interpub" type and therefore as not inconvenient by the observer, if and only if: c.
  • a sound loss is associated with freezing of image and the duration of the sound loss satisfies the following relation: T ⁇ X * ⁇ r
  • T Mute is the duration of the mute detected, a is a percentage generally greater than or equal to 80% (it allows to take into account the audio / video shift), tjrgeze G [T MinF ⁇ T MaxFF l J ⁇ ⁇ 200ms and T MaxFF ⁇ ls;
  • FIG. 10 there is shown an example of an image freeze having video similarity rates considered representative of a post-production effect.
  • xrnoy is the arithmetic mean of the similarity rates of the analyzed gel images.
  • An image freeze will be directly considered perceptible by itself if the freezing time exceeds the duration t min M F- In this case, we are dealing with a macro freeze and only the video component is considered to make a decision . We do not use an analysis of the audio component.
  • step E ' 2 the identification of an image-free defect class among the predetermined plurality of classes is made at least from the calculated duration and possibly from functions. other measures.
  • the micro-gel relies on the measurement of a pseudo period of the detected gel and the fact that the calculated duration of the gel is much lower than this pseudo period (duty cycle low).
  • the conventional gel is identified by its duration which must be greater than a predetermined threshold.
  • an audio error detection result is obtained.
  • a loss-of-sound type audio defect is detected when the audio signal is attenuated with an energy level of the audio signal below a certain energy threshold over a given period of time. Each detected fault is therefore associated with a level of energy and a duration.
  • an exemplary energy profile of an audio signal presenting an audio gel or sound loss is considered.
  • the first step is to measure an energy loss of the audio signal over time.
  • the second step is to verify that for times when a power loss has been measured, the energy of the audio signal does not exceed a certain energy threshold.
  • the measurement is used on all the audio channels of a chain to be analyzed.
  • the first step is to find out if there is a falling edge.
  • the falling edge at time n is taken into account if and only if E " ⁇ and E n -i> ⁇ ' ⁇ with In energy of the audio signal at time n, ⁇ a threshold of energy max and ⁇ ' a threshold of energy min.
  • the duration of the sound loss is then calculated as follows:
  • the signal has a sound loss for a duration t PS if and only if this state begins with a falling edge of mute and that the energy level remains lower than ⁇ during the duration of the Mute state.
  • s N Ech x- - (4)
  • N Ech is the number of samples meeting the above conditions.
  • F Ech is the sampling frequency of the audio signal.
  • step E ' 4 will now be described in more detail for this particular embodiment. At the end of the steps of detecting at least one image gel on a sample ei and analyzing the audio component, this step E ' 4 ensures the production of the results on a Nbl analysis time window corresponding to the sample ei. It is first for each defect Dvj identified confirm or deny the class that has been assigned.
  • the class will be confirmed if a sound loss has been identified and if it has a duration that satisfies the condition previously exposed (slightly lower);
  • step E'2 For a macro-free fault, the class has been confirmed since step E'2 and the result of the audio analysis is not used.
  • the decision module according to the invention therefore provides at the output a reduced number of image defects compared to the number of candidates from step E'1, corresponding to those who have passed the tests of substeps E'41 and E'42.
  • the field of application of the invention is not limited to the evaluation of image-like image defects, but concerns any other type of image defect introduced by the transmission of an audiovisual stream on a In fact, an alteration of the multiplexed stream has an impact on the audio and video components at the same time instants.
  • image defects of the block effect type are considered.
  • the detection of block effects (“blockiness effects") can be associated with the results of an evaluation of sound losses on the audio component associated with the video component.
  • the block-type effects may have different characteristics: in particular, the block effect times may vary between 20 ms to a few seconds.
  • a block effect can be limited to a small area of the image or conversely relate to the entire image.
  • the detection does not pose any particular difficulty and does not require the use of the method according to the invention.
  • the method according to the invention can be applied to defects of the block effect type.
  • a previous detection of gel-type defects over a common analysis period can be validly exploited by the method according to the invention to confirm or invalidate the presence of troublesome block-effect type defects in an audiovisual stream.
  • the invention that has just been presented can be applied to any audiovisual signal at any stage of its distribution chain. It makes it possible to more effectively evaluate the quality defects caused by its transmission or transcoding step, according to perceptual criteria.

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

Procédé d'évaluation d'au moins un défaut de qualité dans un signal de données, dispositif et programme d'ordinateurs associés. L'invention concerne un procédé d'évaluation d'au moins un défaut de qualité d'un signal porteur de données destinées à être restituées à un destinataire, ledit signal comprenant au moins une composante vidéo et une composante audio. Un tel procédé comprend les étapes suivantes, mises en œuvre sur au moins un échantillon dudit signal : - détection d'au moins un défaut sur la composante vidéo de l'échantillon et calcul d'une durée associée audit au moins un défaut; - affectation d'une classe de défaut audit au moins un défaut détecté au moins en fonction de sa durée associée; - selon la classe de défaut affectée, obtention d'un résultat de recherche d'au moins un défaut sur la composante audio aux instants correspondant à l'échantillon; - décision de confirmer la détection d'un défaut de qualité sur la séquence au moins en fonction du résultat de la recherche de défaut sur la composante audio.

Description

Procédé d'évaluation d'au moins un défaut de qualité dans un signal de données, dispositif et programme d'ordinateurs associés.
1. Domaine de l'invention
Le domaine de l'invention est celui de l'évaluation de qualité de signaux de données audiovisuelles comprenant au moins une composante vidéo et une composante audio.
L'invention s'applique en particulier aux signaux de données audiovisuelles qui ont subi des dégradations lors de leur transmission sur des réseaux de télécommunications ou lors d'opérations de transcodage.
Aujourd'hui, les contenus audiovisuels sont transmis via des services de vidéo à la demande, vidéo de rattrapage, direct etc. Ces services possèdent des chaines de production et diffusion bien définies avec lesquelles des erreurs peuvent apparaître et se cumuler sur les différents maillons de ces deux chaines.
Selon les systèmes de captation, de contribution, d'encodage, de transmission, de réception, et terminaux audiovisuels employés, les erreurs pourront se traduire par une apparition d'artéfacts sur les composantes audio et vidéo. L'apparition de ces dégradations pourra survenir de manière simultanée sur ces deux composantes.
Les défauts de la composante vidéo se matérialisent souvent par des saccades ou des gels d'images. Les défauts sur la composante audio se manifestent quant à eux par une perte sonore. La durée de ces deux dégradations fluctue de quelques millisecondes à quelques heures. La fréquence d'apparition de ce type d'événement peut également varier au cours du temps. Les défauts peuvent aussi bien avoir une occurrence faible que soutenue selon une échelle temps.
Ces dégradations sont une source d'inconfort pour les utilisateurs finaux, qui les conduit parfois à rejeter le service, si la gêne occasionnée devient trop importante.
Actuellement, les équipements déployés assurant le contrôle automatique de la qualité audiovisuelle effectuent des mesures sur les composantes audio et vidéo de signaux à la sortie du terminal ou des échantillons au niveau du décodeur sans prise de compte du signal référence, car ces derniers sont rendus inaccessibles techniquement ou juridiquement. Ils utilisent des modèles classés comme "sans référence" et produisent des notes qui fluctuent sur une échelle de qualité. Les conclusions des expertises des dispositifs de prédiction "sans référence" ont montré que les performances doivent être fortement améliorées par rapport au ressenti humain.
On connaît du document WO2006/103327 un procédé d'évaluation d'une dégradation de qualité d'un signal audiovisuel basé sur un modèle de prédiction de l'impact de la discontinuité de la fluidité des images sur la qualité subjective. En relation avec la Figure 1, on présente un schéma de principe du procédé d'évaluation en question. Des mesures de discontinuité sont menées en parallèle sur les composantes vidéo et audio du signal à évaluer. Différentes métriques audio et vidéo sont employées pour qualifier différents types de défaut (par exemple les gels d'image, la présence de flous ou encore de blocs dans les images pour la composante vidéo, des pertes sonores pour la composante audio). Un module de décision vidéo prend en compte les résultats des évaluations réalisées à l'aide des différentes métriques et attribue une note de qualité globale à la composante vidéo, à l'aide d' un modèle d'interaction vidéo. Un module de décision audio fait de même pour la composante audio et attribue une note de qualité globale à la composante audio sur la base d'un modèle d'interaction audio. Un module de pondération audio/vidéo prend en compte à la fois la note de qualité globale vidéo et la note de qualité globale audio pour affecter au signal audiovisuel une note de qualité globale. Il s'agit d'une approche dite cognitive car le modèle reproduit le mécanisme de jugement humain par la production de notes sur une échelle de qualité.
2. Inconvénients de la technique antérieure
La technique antérieure calcule la dégradation de la qualité perçue provoquée par chaque rupture de fluidité, et coupure sonore. Les calculs sont effectués de manière disjointe sur les composantes audio et vidéo et sans interaction a priori ou a postériori des résultats obtenus. Cette approche échoue face à des discontinuités artificiellement créées et lorsqu'elles ne sont pas considérées comme perceptibles par le jugement humain. Dans ces cas de figure, des erreurs d'interprétation apparaissent et génèrent de fausses alarmes.
3. Exposé de l'invention
L'invention vient améliorer la situation à l'aide d'un procédé d'évaluation d'au moins un défaut de qualité d'un signal porteur de données destinées à être restituées à un destinataire, ledit signal comprenant au moins une composante vidéo et une composante audio.
Un tel procédé comprend les étapes suivantes, mises en œuvre sur au moins un échantillon dudit signal :
- détection d'au moins un défaut sur la composante vidéo de l'échantillon et calcul d'une durée associée audit au moins un défaut;
- affectation d'une classe de défaut audit au moins un défaut détecté au moins en fonction de sa durée associée;
- Selon la classe de défaut affectée, obtention d'un résultat de recherche d'au moins un défaut sur la composante audio aux instants correspondant à l'échantillon ;
- décision de confirmer la détection d'un défaut de qualité sur la séquence au moins en fonction du résultat de la recherche de défaut sur la composante audio.
Avec l'invention, lorsqu'un défaut est détecté sur la composante vidéo, une classe de défaut lui est affectée. Selon la classe de défaut affectée, le procédé selon l'invention obtient ou non les résultats d'une recherche de défauts sur la composante audio, en vue de confirmer ou infirmer le défaut détecté sur la composante vidéo.
Ainsi le procédé selon l'invention permet d'améliorer l'évaluation de la qualité d'un signal vidéo dégradé en recourant à une détection de défaut sur la composante audio, ce qui lui permet de lever une indétermination sur la détection de dégradation vidéo.
Plutôt que de prendre en parallèle une décision pour la composante vidéo et une décision pour la composante audio comme c'est le cas dans l'art antérieur, le procédé selon l'invention enrichit donc le modèle d'évaluation de qualité vidéo directement à l'aide des résultats de détection des dégradations sur la composante audio.
L'invention propose donc une approche tout-à-fait nouvelle et inventive de l'évaluation des dégradations subies par un signal, qui repose sur l'enrichissement du modèle vidéo utilisé pour évaluer la composante vidéo de ce signal à l'aide des résultats de l'évaluation de la composante audio.
Selon un aspect de l'invention, l'étape de détection comprend, suite à la détection d'un défaut sur la composante vidéo, une sous-étape de rejet du défaut détecté si sa durée associée est inférieure à un premier seuil de détection perceptuel prédéterminé.
Ainsi, seuls les défauts de durée suffisante pour être potentiellement perceptibles par l'utilisateur sont retenus pour les étapes suivantes du procédé. Selon un autre aspect de l'invention, l'étape de décision comprend une sous-étape de cumul des durées associées aux défauts d'image de même classe détectés, une sous-étape de rejet desdits défauts de même classe, si leur durée cumulée est inférieure à un deuxième seuil de détection perceptuel prédéterminé. De cette manière, seuls les défauts d'image d'une classe particulière qui sont effectivement perçus par l'utilisateur, sont conservés pour l'évaluation de la qualité du signal audiovisuel.
Selon un autre aspect de l'invention, l'étape de détection est destinée à détecter des défauts de type gel d'images, en ce qu'elle comprend une étape de calcul d'une valeur de similitude entre des images de l'échantillon et une étape de comparaison de la valeur de similitude calculée à un seuil prédéterminé.
Parmi les défauts susceptibles d'être détectés sur une composante vidéo, on trouve les défauts de type gel d'image. Selon ce mode de réalisation de l'invention, la détection de défauts sur la composante vidéo concerne les défauts de type gel d'image. Un gel d'image est détecté lorsque plusieurs images de la séquence sont suffisamment similaires entre elles.
Selon un autre aspect, la classe de gel d'image détecté appartient à un groupe comprenant au moins :
- un micro-gel ;
- un gel classique ;
- un effet de postproduction ;
- un macro-gel. A un gel d'image détecté est affectée une classe de gel parmi un ensemble de classes de défauts prédéterminés de type gel.
Selon un autre aspect de l'invention, l'étape d'obtention d'un résultat de recherche d'un défaut dans la composante audio est mise en œuvre pour un défaut de type gel d'image dont la classe appartient au groupe comprenant au moins :
- micro-gel ;
- gel classique :
- effet de postproduction.
Pour les classes de défauts d'images énumérés, il existe une indétermination sur le résultat de la détection qui justifie le recours à l'analyse de la composante audio.
Selon un autre aspect de l'invention, l'étape d'obtention d'un résultat de recherche d'un défaut dans la composante audio n'est pas mise en œuvre pour un défaut de type gel d'image dont la classe appartient au groupe comprenant au moins :
- macro-gel.
Pour cette classe de gel d'image, le résultat de la détection sur la composante vidéo est considéré comme suffisamment fiable pour qu'il ne soit pas nécessaire de recourir à la recherche de dégradations sur la composante audio.
Selon un autre aspect de l'invention, l'étape de détection est destinée à détecter des défauts de type effet de bloc, et elle comprend une étape de calcul d'une valeur de taux de blocs par image de l'échantillon et une étape de comparaison de la valeur calculée à un seuil prédéterminé.
Les effets de blocs constituent un autre type de défauts qui sont susceptibles d'être détectés sur une composante vidéo. Selon ce mode de réalisation de l'invention, un défaut de type effet de bloc (« blockiness », en anglais) est détecté lorsque plusieurs images de la séquence ont un taux de bloc suffisamment élevé. L'invention concerne aussi un dispositif d'évaluation d'un défaut de qualité d'un signal, apte à mettre en œuvre le procédé qui vient d'être décrit.
Un tel dispositif peut être intégré à un récepteur de signaux audiovisuels ou à tout autre équipement nœud d'un réseau de télécommunications, tel qu'un système de contribution ou de transcodage audiovisuel. L'invention concerne donc en outre un récepteur d'un signal vidéo transmis dans un réseau de télécommunications, ledit signal comprenant au moins une composante vidéo et une composante audio. Selon l'invention, un tel récepteurl comprend un dispositif d'évaluation de défauts de qualité selon l'invention.
Elle concerne aussi un équipement nœud d'un réseau de télécommunications comprenant un dispositif d'évaluation de qualité selon l'invention.
L'invention concerne également un système de distribution d'un signal audiovisuel à au moins un terminal d'utilisateur, ledit système comprenant une pluralité d'équipements nœuds connectés à au moins un réseau de télécommunications, un équipement nœud étant apte à recevoir ledit signal et à le retransmettre à un équipement nœud voisin. Selon l'invention, au moins un équipement parmi le groupe comprenant la pluralité d'équipements nœuds et l'équipement récepteur comprend le dispositif d'évaluation d'un défaut de qualité qui vient d'être présenté.
L'invention concerne encore un programme d'ordinateur comportant des instructions pour la mise en œuvre d'un procédé d'évaluation de qualité d'un signal audiovisuel tel que décrit précédemment, lorsque ce programme est exécuté par un processeur. Un tel programme peut utiliser n'importe quel langage de programmation. Il peut être téléchargé depuis un réseau de communication et/ou enregistré sur un support lisible par ordinateur.
Enfin, l'invention se rapporte à un support de stockage, lisible par un processeur, mémorisant un programme d'ordinateur mettant œuvre le procédé d'évaluation d'au moins un défaut de qualité qui vient d'être décrit.
4. Liste des figures
D'autres avantages et caractéristiques de l'invention apparaîtront plus clairement à la lecture de la description suivante d'un mode de réalisation particulier de l'invention, donné à titre de simple exemple illustratif et non limitatif, et des dessins annexés, parmi lesquels : la figure 1 illustre le schéma d'évaluation d'une dégradation de qualité d'un signal audiovisuel selon l'art antérieur;
la figure 2 présente de façon schématique un exemple de système de distribution d'un signal audiovisuel selon l'invention ;
la figure 3 présente de façon schématique la structure d'un dispositif d'évaluation de défauts de qualité d'un signal audiovisuel selon l'invention.
la figure 4 présente de façon schématique le procédé d'évaluation d'un défaut de qualité d'un signal audiovisuel selon l'invention;
la figure 5 présente de façon schématique les étapes du procédé d'évaluation de défauts de qualité d'un signal audiovisuel selon un mode de réalisation de l'invention, selon lequel des défauts de type gels d'images sont évalués ;
la figure 6 présente de façon schématique une représentation graphique d'une image de la composante vidéo d'un signal audiovisuel à évaluer ;
la figure 7 illustre de façon schématique un exemple de perte sonore dans une composante audio d'un flux audiovisuel ;
la figure 8 présente de façon schématique des classes de défauts de type gel d'image prises en compte dans un mode de réalisation de l'invention ;
la figure 9 présente de façon schématique le profil d'un défaut de type micro gel ; et la figure 10 présente de façon schématique une courbe de variation d'une mesure de taux de similitude pour un gel d'image appartenant à la classe des effets de postproduction.
5. Description d'un mode de réalisation particulier de l'invention
Le principe général de l'invention repose sur le recours au résultat de l'analyse du signal audio en cas d'indétermination sur la détection d'au moins un défaut d'image dans la composante audio. 5.1 Système de distribution d'un signal audiovisuel Dans la suite de la description, on considère un signal audiovisuel S comprenant au moins une composante vidéo Cv et au moins une composante audio Ca. Un tel signal S peut être intercepté à n'importe quel stade d'une chaîne de transmission audiovisuelle, entre un équipement émetteur, un équipement nœud du réseau de télécommunications ou un équipement récepteur client.
En relation avec la figure 2, on considère un système de distribution d'un signal audiovisuel S selon l'invention. Un tel système comprend un serveur Serv de distribution du audiovisuel S. Un tel serveur peut être par exemple un serveur de vidéo à la demande ou un serveur de diffusion de contenus audiovisuels en direct. Le signal S est transmis via un réseau de télécommunications 1, qui comprend une pluralité d'équipements nœuds ENl, EN2. Les équipements nœuds ENl, EN2 sont aptes à recevoir le signal S d'un nœud voisin et à le retransmettre à un autre nœud du réseau 1. Le signal S est finalement reçu par au moins un équipement destinataire, par exemple l'équipement récepteur E , qui peut être un terminal client du type terminal mobile ou décodeur TV par exemple.
L'invention peut être mise en œuvre dans n'importe lequel de ces équipements Serv, ENl, EN2, ER qui forment la chaîne de distribution du signal audiovisuel S.
5.2 Exemple de structure d'un dispositif d'évaluation de défauts de qualité
On présente, en relation avec la figure 3, la structure simplifiée d'un dispositif 100 d'évaluation de qualité d'un signal audiovisuel mettant en œuvre l'invention.
Par exemple, le dispositif comprend une mémoire 110 comprenant une mémoire tampon M, une unité de traitement 120, équipée par exemple d'un processeur P, et pilotée par un programme d'ordinateur Pg 130, mettant en œuvre le procédé d'évaluation de qualité selon l'invention.
A l'initialisation, les instructions de code du programme d'ordinateur 130 sont par exemple chargées dans une mémoire RAM avant d'être exécutées par le processeur de l'unité de traitement 120. L'unité de traitement 120 reçoit en entrée au moins un échantillon d'un signal audiovisuel à évaluer. Le processeur de l'unité de traitement 120 met en œuvre les étapes du procédé d'évaluation de qualité décrit précédemment, selon les instructions du programme d'ordinateur 130. Pour cela, le dispositif comprend, outre la mémoire 110, des moyens d'obtention d'une détection d'au moins un défaut de qualité sur la composante vidéo de l'échantillon, des moyens d'affectation d'une classe de défaut audit au mois un défaut détecté au moins en fonction de sa durée associée, des moyens d'obtention d'un résultat de recherche d'au moins un défaut sur la composante audio aux instants correspondant à l'échantillon selon la classe de défaut affectée et des moyens de décision de confirmer la détection d'un défaut de qualité sur la séquence au moins en fonction du résultat de la recherche de défaut sur la composante audio. Ces moyens sont pilotés par le processeur de l'unité de traitement 120.
Avantageusement, un tel dispositif 100 peut être intégré à au moins un des équipements Serv, EN1, EN2 et E du système de distribution d'un signal audiovisuel selon l'invention.
5.3 Procédé d'évaluation d'un défaut de qualité selon l'invention
En relation avec la figure 4, on présente les étapes du procédé d'évaluation d'un défaut de qualité subi par le signal audiovisuel S selon l'invention. Un tel procédé est avantageusement mis en œuvre par le dispositif 100 qui vient d'être décrit.
On considère un signal S découpé en I échantillons e,, avec I entier non nul, chacun d'une durée TéCh paramétrable, dont la valeur est généralement de 5 à 10 ms.
Le procédé selon l'invention s'applique à un tel échantillon e, du signal.
Un échantillon ei de la composante vidéo Cv comprend Nbl images, avec Nbl entier non nul.
Au cours d'une étape E1( au moins un défaut d'image Dvj est détecté sur un échantillon e, de la composante vidéo Cv du signal S. Dans la suite, on considère J défauts Dvl à DvJ détectés dans l'échantillon ei, avec J entier non nul. Evidemment, si aucun défaut n'est détecté, il n'est pas nécessaire de mettre en œuvre le procédé selon l'invention.
De façon avantageuse la détection précitée est obtenue par analyse de la composante vidéo sur l'échantillon e,. Un exemple de méthode d'analyse sera détaillé ultérieurement.
Au cours de cette étape E1( une durée dj du défaut Dvj est calculée, pour chaque défaut Dvj détecté, et lui est associée.
Le défaut Dvj détecté est ensuite identifié au cours d'une étape E2, au moins en fonction de la durée dj calculée. Il s'agit de lui affecter une classe de défaut d'image parmi plusieurs classes de défaut prédéterminées Cil à CIK, avec K entier non nul.
Selon la classe de défaut d'image identifiée, une étape E3 d'obtention d'un résultat d'analyse de la composante audio Ca sur un échantillon eai correspondant à l'échantillon evi, est déclenchée ou non. On comprendra que pour certaines classes de défaut d'image, l'analyse de la composante vidéo seule n'est en effet pas considérée à elle seule comme suffisante pour permettre une identification fiable du défaut détecté.
L'analyse de la composante audio, qui a été, par exemple, menée en parallèle de celle de la composante vidéo, peut conduire à la détection d'éventuels défauts de type audio Dal à DaL, avec L entier non nul, sur la composante audio Ca du signal S. Un exemple de méthode d'analyse de la composante audio sera présentée ultérieurement.
On considère maintenant le résultat d'analyse audio Da, obtenu. Qu'il soit positif (au moins un défaut Dal de type gel audio détecté) ou négatif (aucun défaut de type gel d'image détecté sur l'échantillon audio ea,), il est pris en considération, lors d'une étape E4 de décision. Au cours de cette étape de décision, on considère au moins les défauts d'image Dvj appartenant à des classes Clk, k entier compris entre 1 et K, pour lesquelles le recours au résultat de l'analyse de la composante audio est jugée nécessaire. Ces défauts sont soumis à une sous-étape E4 1 de confirmation, destinée à confirmer ou à infirmer le défaut Dvj comme un défaut à prendre en considération pour la qualité du signal perçue par l'utilisateur. Selon la classe Clk considérée, il s'agit soit de vérifier qu'un défaut audio a été détecté aux mêmes instants que le défaut Dvj courant, soit au contraire de vérifier qu'il n'y a aucun défaut audio correspondant au défaut Dvj à confirmer. En fonction du résultat de cette vérification, le défaut en question est donc conservé ou rejeté.
Selon un mode de réalisation de l'invention, l'étape de décision E4 comprend une sous- étape E4,2 de cumul des durées associées à des défauts d'image de même classe et de comparaisons de la durée cumulée obtenue à un seuil. Seuls les défauts de durée cumulée suffisante sont retenus et participent à l'évaluation de la qualité du signal perçue par l'utilisateur. 5.4 Evaluation des défauts de type gel d'image En relation avec la Figure 5, on considère maintenant, à titre d'exemple illustratif et non limitatif, la mise en œuvre du procédé selon l'invention pour la détection de défauts de type gel d'image. La composante vidéo Cv d'un signal audiovisuel S est découpée en échantillons evi, i entier allant de 0 à I, chacun de durée comprise par exemple entre 5 et 10 ms. Le procédé selon l'invention est mis en œuvre pour au moins un échantillon evi. De façon avantageuse il est itéré pour chaque échantillon de la composante vidéo Cv.
Au cours d'une étape ΕΊ, des défauts de type gel d'image sont détectés sur un échantillon evi.
Une méthode de détection des défauts de type gel d'image dans un échantillon evi d'une composante vidéo Cv d'un signal audiovisuel S va maintenant être présentée.
5.4.1 Détection vidéo
On considère un échantillon ev, d'une composante vidéo Cv d'un signal audiovisuel S, représentée dans un espace colorimétrique quelconque. Dans la suite, on se limitera à une représentation colorimétrique en luminance et en chrominance contenant Nbl images, avec Nbl entier strictement positif, et dont la taille de l'image est Vheight*Vwidth . Vheight et Vwidth sont des entiers strictement positifs. En relation avec la figure 6, on note Pk(i,j), le pixel de la k'eme image à la ligne i et à la colonne j, et on note Pprec(i, j) le pixel d'une image précédente de la k'eme image de la vidéo en analyse.
ke [1, Nbl-1], ie [0, Vheight] et je [0, Vwidth].
Un défaut de type gel d'image se caractérise par une rupture de fluidité entre l'image k et l'image voisine Pprecde la séquence vidéo.
Une rupture de fluidité est évaluée en calculant la dérivée de luminance et chrominance de la façon suivante :
On note Yk(i,j), Uk(i,j), Vk(i,j) et Yprec(i, j), Uprec(i,j) et Vprec(i, j), les composantes respectivement Y, U et V de Pk(i,j) et Pprec(i, j).
Y représente la luminance du pixel, U la composante à la différence au bleu et V la composante à la différence au rouge du pixel. Soit AP{k, ref)(i,j) la fonction telle que refe [0, Nbl-2], Vke [1, Nbl-1], V ie [0, Vheight] et V je [0, Vwidth] si :
( I Yk (U) - Ypred (i ,j) I > <^Max) I I ( I Uk(U) - Uprec (' ,j) I≥ àJMax) I I ( I Vk (i,j) - Vpre c(i ,j) I > <¾/Max)
est vrai alors AP(k, vprec(i,j) = 1 (pixel(i,j) différente), sinon AP(k, prec) (i,j) = 0 (pixel(i,j) identique).
ôYMax, ôUMax et ôVMax sont des paramètres entiers et positifs permettant d'ajuster le niveau de similitude entre Pk(i, j) et Pprec(i,j). · ôYMax e [0, 220]
• ôUMax e [0, 220]
• ôVMax e [0, 220]
On considère qu'il y a gel vidéo à la k'eme image entre les images d'indices ref et k, prece [0, Nbl-2] et ke [1, Nbl-1] si et seulement si Vie [0, Vheight] et Vje [0, Vwidth], l'équation suivante est vérifiée :
Vheight Vwidht
∑ ∑ Δ P 0', j)≤ Δ PMax
i=0 =0
APMax est un entier positif qui représente le nombre de différences max acceptées pour considérer que deux images consécutives d'une vidéo sont identiques.
Il y a donc gel sur une séquence de X images consécutives d'une vidéo si et seulement si: refe [0, Nbl-X-1] et Vke [prec+1, ref+X-2]
Vheight Vwidht
∑ ∑ Δ P(k,prec) (i, j)≤ A PMax (1)
i=0 =0
On définit maintenant un taux de similitude entre l'image d'indice k et l'image d'indice prec. Il est noté x(k, ref) et est obtenu de la manière suivante: VheightVwidht
∑ ∑ & P(kt prec) (i, j)
i = 0 ; = 0
Vheight x Vwidth
Calcul de durée ; suite à la détection d'un gel d'image Dvj, un calcul de la durée dj (en ms) de ce gel est réalisé.
La durée d'un gel d'image est calculée de la façon suivante. Pour une séquence de x images consécutives de l'échantillon ev, de la composante vidéo, on considère l'image précédente precf telle que prece [0, Nbl- x -1], des images k, telles que ke [prec +1, prec+x], X le nombre d'images de la séquence de gel et FPS la fréquence d'affichage de la vidéo. La durée du gel d'image correspond à : tgel FPS
Les résultats de cette détection sont obtenus au cours d'une étape ΕΊ. 5.4.2 Seuillage perceptuel
De façon avantageuse, au cours d'une étape E'1 2, la durée du gel d'image détecté peut être comparée à un premier seuil perceptuel τρ1, typiquement de l'ordre de 40 ms et rejeté selon le critère de décision suivant :
Si la durée du gel tge| est supérieure à 40 ms alors le gel est considéré comme potentiellement perceptible. Si cette condition n'est pas satisfaite la rupture de fluidité n'est alors pas prise en compte.
Un exemple de méthode de détection d'un défaut de type gel audio va maintenant être décrit plus en détails.
5.4.3 Classification des défauts de type gel d'image
Au cours d'une étape E'2, une classe de défaut de type gel est affectée à chaque défaut détecté, au moins en fonction de sa durée, parmi un groupe de classes comprenant les défauts suivants :
- Micro gel, Effet de postproduction ;
Gel classique ;
Macro gel.
En relation avec la figure 7, on considère, à titre illustratif, des classes de gels d'image susceptibles d'être détectés dans un échantillon d'une composante audio. Ils sont positionnés sur l'axe temporel en fonction de leur durée typique. Dans un ordre de durée croissante, on trouve le micro gel, l'effet de postproduction, le gel d'image classique et le macro gel.
Dans le contexte de l'invention, ils sont définis comme suit : Le micro gel :
En relation avec la Figure 9, on considère un micro gel de durée tgel, corne étant pseudo périodique de période Τμ.
Il y a micro gel de durée gel si et seulement si : a. Il n'y a pas de mute audio sur la ou les composantes audio associées à la composante vidéo (on le détecte en utilisant le signal audio) pendant la durée
Figure imgf000016_0001
b. tgel ^ [imin ' Îmax ] ^ tgel— & Τμ σ est un réel compris dans l'intervalle [0, 1], il représente le rapport cyclique de la pseudo période d'un gel en deçà de laquelle le gel est considéré comme micro gel.
Τμ est la pseudo période du micro gel ou la durée entre deux débuts de gel. tgel représente la durée du gel vidéo tel que défini précédemment,
ΐιτιϊημ représente la durée minimum du micro gel (~76ms),
représente la durée maximum du micro gel (~350ms),
Avec l'invention, lorsqu'un micro gel est identifié en E'2 à l'aide de la définition précédente, une analyse de la composante audio est déclenchée, afin de vérifier qu'il n'y a pas de perte audio associée.
Effet de Post production Un gel vidéo de durée tfreeZe est considéré comme un effet de post production de type "interpub" et donc comme non gênant par l'observateur, si et seulement si: c. Une perte sonore est associée au gel d'image et la durée de la perte sonore satisfaite la relation suivante : T ≥ X *†r
ί mute freeze
T Mute est la durée du mute détectée, a est un pourcentage généralement supérieure ou égal à 80% ( il permet de prendre en compte le décalage audio/vidéo), tjrgeze G [TMinF^TMaxFFl J ^ ~200ms et T MaxFF ~ls ;
d. xrnoy < xMaxi , le taux moyen de similitude entre les différentes images gelées ne dépassent pas le seuil TMaX| P.
En relation avec la figure 10, on présente un exemple de gel d'image présentant des taux de similitude vidéo considérés comme représentatifs d'un effet de post-production.
xrnoy est la moyenne arithmétique des taux de similitudes des images du gel analysé.
On comprend que pour que la classe « effet de post production » soit affectée à un gel d'image, plusieurs conditions doivent être réunies :
Des conditions sur le défaut de type gel d'image lui-même (taux de similitude inférieur à un seuil)
- La conjonction d'un défaut audio de type perte sonore et une condition relative à la durée de la perte sonore par rapport à la durée du gel d'image.
Le gel d'image classique ("freeze", en anglais)
On considère qu'il y a réellement gel d'image d'une durée tpp si et seulement si : a. Ce gel n'est pas un « effet de post production » ;
b. L'analyse audio a conduit à la détection d'une perte sonore associée dont la durée vérifie la relation T ≥ X * f , . Où T Mute est la durée du mute détecté, a est un
mute l freeze
pourcentage généralement supérieure ou égal à 80%( il permet de prendre en compte le décalage audio/vidéo) ; c. La durée du gel tpp e [tminF, tminM F], où tminF représente la durée minimum d'un freeze et tminMF représente la durée maximum d'un défaut de type gel . Le Macro Gel
Un gel d'image sera directement considéré comme perceptible à lui seul si le temps de gel dépasse la durée tmin MF- Dans ce cas de figure, on a affaire à un macro gel et seule la composante vidéo est considérée pour prendre une décision. On n'a donc pas recours à une analyse de la composante audio.
Il en résulte qu'au niveau de l'étape E'2, l'identification d'une classe de défaut de type gel d'image parmi la pluralité de classes prédéterminée se fait au moins à partir de la durée calculée et éventuellement en fonctions d'autres mesures.
Par exemple pour le micro gel, elle s'appuie sur la mesure d'une pseudo période du gel détecté et le fait que la durée calculée du gel soit très inférieure à cette pseudo période (rapport cyclique du défaut faible).
En ce qui concerne un défaut de type effet de post production, elle s'appuie sur une mesure de taux de similitude lequel doit rester inférieur à un seuil prédéterminé (les images ne sont pas toujours exactement identiques les unes aux autres).
Le gel classique est identifié à l'aide de sa durée qui doit être supérieure à un seuil prédéterminé.
Le macro gel est lui aussi identifié à l'aide de sa durée qui doit être supérieure à un seuil prédéterminé.
5.4.4 Détection audio
Au cours d'une étape E'3, un résultat de détection de défauts audio est obtenu. Selon ce mode de réalisation, un défaut audio de type perte sonore est détecté lorsque le signal audio subit un affaiblissement énergétique avec un niveau d'énergie du signal audio en-deçà d'un certain seuil énergétique sur une période de temps donnée. A chaque défaut détecté est donc associé un niveau d'énergie et une durée.
En relation avec la figure 8, on considère une exemple de profil énergétique d'un signal audio présentant un gel audio ou perte sonore (« mute », en anglais). Dans cet exemple, on considère une méthode de détection de perte sonore basée sur une approche en deux étapes. La première étape consiste à mesurer un affaiblissement énergétique du signal audio dans le temps. La deuxième étape consiste à vérifier que pour les instants où un affaiblissement énergétique a été mesuré, l'énergie du signal audio ne dépasse pas un certain seuil énergétique.
En conséquence, on considère qu'une perte sonore est manifeste lorsque l'affaiblissement énergétique est suffisant pour maintenir l'énergie du signal audio en-deçà d'un certain seuil énergétique sur une période de temps donnée.
La mesure s'emploie sur l'ensemble des canaux audio d'une chaîne à analyser.
La première étape revient à rechercher s'il existe un front descendant.
Le front descendant à l'instant n est pris en compte si et seulement si E„≤ et E n-i > δ' · avec En énergie du signal audio à l'instant n, δ un seuil d'énergie max et δ' un seuil d'énergie min.
La durée de la perte sonore est ensuite calculée de la façon suivante :
On considère que le signal présente une perte sonore pendant une durée tPS si et seulement si cet état commence par un front descendant de mute et que le niveau d'énergie reste inférieur à δ pendant la durée de l'état Mute. s = NEchx- — (4)
^Ech
NEch correspond au nombre d'échantillons respectant les conditions précédentes.
FEch correspond à la fréquence d'échantillonnage du signal audio.
Les résultats de cette détection audio seront pris en considération au cours d'une étape E'4 de décision, en fonction de la classe du défaut considérée.
5.4.5 Module décisionnel
L'étape de décision E'4 va maintenant être décrite plus en détails pour ce mode de réalisation particulier. A l'issue des étapes de détection d'au moins un gel d'image sur un échantillon ei et d'analyse de la composante audio, cette étape E'4 assure la production des résultats sur une fenêtre temporelle d'analyse Nbl correspondant à l'échantillon ei. Il s'agit d'abord pour chaque défaut Dvj identifié de confirmer ou d'infirmer la classe qui lui a été affectée.
Selon la classe du défaut examiné, une telle sous-étape E' 1 de confirmation a recours aux résultats de la détection de défauts audio :
Pour un micro gel, l'absence de perte sonore sur l'échantillon permet de confirmer que le défaut Dvj est un micro gel ;
Pour un défaut Dvj identifié comme un effet de production, la classe sera confirmée si une perte sonore a été identifiée et si elle a une durée qui satisfait la condition exposée précédemment (légèrement inférieure) ;
Pour un défaut de type gel classique, la classe est confirmée si une perte sonore a été identifiée et si elle a une durée qui satisfait la condition exposée précédemment (légèrement inférieure) ;
Pour un défaut de type macro gel, la classe a été confirmée dès l'étape E'2 et le résultat de l'analyse audio n'est pas exploité.
Ensuite, au cours d'une autre sous étape E'4,2, le module décisionnel détermine alors pour chaque échantillon ei d'un flux audiovisuel si les défauts confirmés par E'4,1 sont gênants ou non pour l'utilisateur. Pour chaque défaut d'image confirmé, on considère d'abord sa classe. S'il s'agit d'un effet de postproduction, il est rejeté, car considéré comme non gênant pour l'utilisateur.
Sinon, pour les autres classes :
On considère le groupe de MCik défauts appartenant à une même classe Clk et on effectue, un cumul TcumU| des durées des défauts de ce groupe, que l'on compare à un deuxième seuil perceptuel τρ2.
cumul / m 2
m=0
Où MCik est le nombre de défauts confirmés pour la classe Clk.
On considère qu'en deçà de ce seuil, dont la valeur est de l'ordre de 500ms, les défauts de cette classe de défaut ne sont pas gênants pour l'utilisateur. Tous les défauts d'une même classe Clk peuvent donc être rejetés si leur durée cumulée n'est pas suffisante selon ce critère perceptuel.
Le module décisionnel selon l'invention fournit donc en sortie un nombre réduit de défauts d'image par rapport au nombre de candidats issus de l'étape E'1, correspondant à ceux qui ont réussi les tests des sous-étapes E'41 et E'42.
5.5 Evaluation de défauts de type effet de bloc
Le champ d'application de l'invention ne se limite pas à l'évaluation de défauts d'image de type gel d'images, mais concerne tout autre type de défaut d'image introduit par la transmission d'un flux audiovisuel sur un réseau .En effet, une altération du flux multiplexé a un impact sur les composantes audio et vidéo aux mêmes instants temporels.
Selon un autre mode de réalisation de l'invention, on considère des défauts d'image de type effet de blocs. De façon similaire à la détection de gels d'image, la détection d'effets de bloc ("blockiness effects", en anglais) peut être associée aux résultats d'une évaluation de pertes sonores sur la composante audio associée à la composante vidéo.
En effet, de la même façon que pour les défauts de type gel d'image, les effets de type bloc peuvent présenter des caractéristiques différentes : notamment, Les durées d'effet de bloc peuvent varier entre 20 ms à quelques secondes. D'autre part, un effet de bloc peut être limité à une petite zone de l'image ou à l'inverse concerner l'image entière.
Dans le cas où les effets de bloc sont manifestes, la détection ne pose pas de difficulté particulière et ne nécessite pas le recours au procédé selon l'invention.
En revanche, lorsque les zones spatiales concernées par l'effet de bloc détecté sont petites et/ou lorsque la durée associée à cet effet de bloc est trop faible, le recours à la détection de pertes sonores sur l'échantillon concerné peut permettre de confirmer ou d'infirmer la présence d'effets de blocs gênants dans l'échantillon.
On comprend que de façon similaire à celle présentée pour les défauts d'image de type gel, il est possible d'établir des classes d'effets de blocs prédéterminées, qui se différencient au moins par leur durée et/ou leur étendue spatiale. Ainsi, le procédé selon l'invention peut être appliqué aux défauts de type effets de bloc. Selon une variante, une précédente détection de défauts de type gel sur une période d'analyse commune peut être valablement exploitée par le procédé selon l'invention pour confirmer ou infirmer la présence de défauts de type effets de blocs gênants dans un flux audiovisuel.
L'invention qui vient d'être présentée peut s'appliquer à tout signal audiovisuel à n'importe quel stade de sa chaîne de distribution. Elle permet d'évaluer de façon plus efficace les défauts de qualité engendrés par sa transmission ou étape de transcodage, en fonction de critères perceptuels.

Claims

REVENDICATIONS
1. Procédé d'évaluation d'au moins un défaut de qualité d'un signal porteur de données destinées à être restituées à un destinataire, ledit signal comprenant au moins une composante vidéo et une composante audio, ledit procédé étant caractérisé en ce qu'il comprend les étapes suivantes, mises en œuvre sur au moins un échantillon dudit signal :
- détection d'au moins un défaut sur la composante vidéo de l'échantillon et calcul d'une durée associée audit au moins un défaut;
- affectation d'une classe de défaut audit au moins un défaut détecté au moins en fonction de sa durée associée;
- selon la classe de défaut affectée, obtention d'un résultat de recherche d'au moins un défaut sur la composante audio aux instants correspondant à l'échantillon ;
- décision de confirmer la détection d'un défaut de qualité sur la séquence au moins en fonction du résultat de la recherche de défaut sur la composante audio.
2. Procédé d'évaluation d'au moins un défaut de qualité selon la revendication 1, caractérisé en ce que l'étape de détection comprend, suite à la détection d'un défaut sur la composante vidéo, une sous-étape de rejet du défaut détecté si sa durée associée est inférieure à un premier seuil de détection perceptuel prédéterminé.
3. Procédé d'évaluation d'au moins un défaut de qualité selon la revendication 1, caractérisé en ce que l'étape de décision comprend une sous-étape de cumul des durées associées aux défauts d'image de même classe détectés, une sous-étape de rejet desdits défauts de même classe, si leur durée cumulée est inférieure à un deuxième seuil de détection perceptuel prédéterminé.
4. Procédé d'évaluation d'au moins un défaut de qualité selon la revendication 1, caractérisé en ce que l'étape de détection est destinée à détecter des défauts de type gel d'images, en ce qu'elle comprend une étape de calcul d'une valeur de similitude entre des images de l'échantillon et une étape de comparaison de la valeur de similitude calculée à un seuil prédéterminé.
5. Procédé d'évaluation d'au moins un défaut de qualité selon la revendication 4, caractérisé en ce que la classe de gel d'image détecté appartient à un groupe comprenant au moins :
- un micro-gel ;
- un gel classique ;
- un effet de postproduction ;
- un macro-gel.
6. Procédé d'évaluation d'au moins un défaut de qualité selon la revendication 5, caractérisé en ce que l'étape d'obtention d'un résultat de recherche d'un défaut dans la composante audio est mise en œuvre pour un défaut de type gel d'image dont la classe appartient au groupe comprenant au moins :
- micro-gel ;
- gel classique :
- effet de postproduction.
7. Procédé de détection d'une dégradation de qualité selon la revendication 5, caractérisé en ce que l'étape d'obtention d'un résultat de recherche d'un défaut dans la composante audio n'est pas mise en œuvre pour un défaut de type gel d'image dont la classe appartient au groupe comprenant au moins :
- macro-gel.
8. Procédé d'évaluation d'au moins un défaut de qualité selon la revendication 1, caractérisé en ce que l'étape de détection est destinée à détecter des défauts de type bloc, en ce qu'elle comprend une étape de calcul d'une valeur de taux de bloc entre des images de l'échantillon et une étape de comparaison de la valeur calculée à un seuil prédéterminé.
9. Dispositif d'évaluation d'au moins un défaut de qualité d'un signal porteur de données destinées à être restituées à un destinataire, ledit signal comprenant au moins une composante vidéo et une composante audio, ledit dispositif étant caractérisé en ce qu'il comprend les moyens suivants, mis en œuvre sur au moins un échantillon d'une séquence d'images dudit signal :
- détection d'au moins un défaut sur la composante vidéo de la séquence d'image et calcul d'une durée associée audit au moins un défaut;
- affectation d'une classe de défaut audit au mois un défaut détecté au moins en fonction de sa durée associée;
- Selon la classe de défaut affectée, obtention d'un résultat de recherche d'au moins un défaut sur la composante audio aux instants correspondant à l'échantillon ;
- décision de confirmer la détection dudit au moins un défaut d'image sur l'échantillon au moins en fonction du résultat de la recherche de défaut sur la composante audio obtenu.
10. Récepteur d'un signal vidéo transmis dans un réseau de télécommunications, ledit signal comprenant au moins une composante vidéo et une composante audio, caractérisé en ce qu'il comprend un dispositif d'évaluation de défauts de qualité selon la revendication 9.
11. Système de distribution d'un signal audiovisuel à au moins un terminal d'utilisateur, ledit système comprenant une pluralité d'équipements nœuds connectés à au moins un réseau de télécommunications, un équipement nœud étant apte à recevoir ledit signal et à le retransmettre à un équipement nœud voisin, ledit système étant caractérisé en qu'au moins un équipement parmi le groupe comprenant la pluralité d'équipements nœuds et l'équipement récepteur comprend le dispositif d'évaluation d'un défaut de qualité selon la revendication 9.
12. Programme d'ordinateur caractérisé en ce qu'il comprend des instructions pour la mise en œuvre d'un procédé d'évaluation de défauts de qualité d'un signal audiovisuel selon l'une des revendications 1 à 8, lorsque ce programme est exécuté par un processeur.
13. Support d'enregistrement lisible par un processeur sur lequel est enregistré un programme comprenant des instructions pour l'exécution du procédé d'évaluation d'un défaut de qualité selon l'une des revendications 1 à 8.
PCT/FR2012/052512 2011-11-07 2012-10-30 Procede d'evaluation d'au moins un defaut de qualite dans un signal de donnees, dispositif et programme d' ordinateurs associes WO2013068676A1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US14/356,787 US9143775B2 (en) 2011-11-07 2012-10-30 Method of evaluating at least one defect of quality in a data signal, associated device and computer program
EP12794413.0A EP2777292A1 (fr) 2011-11-07 2012-10-30 Procede d'evaluation d'au moins un defaut de qualite dans un signal de donnees, dispositif et programme d' ordinateurs associes

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1160118A FR2982449A1 (fr) 2011-11-07 2011-11-07 Procede d'evaluation d'au moins un defaut de qualite dans un signal de donnees, dispositif et programme d'ordinateurs associes
FR1160118 2011-11-07

Publications (1)

Publication Number Publication Date
WO2013068676A1 true WO2013068676A1 (fr) 2013-05-16

Family

ID=47263448

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2012/052512 WO2013068676A1 (fr) 2011-11-07 2012-10-30 Procede d'evaluation d'au moins un defaut de qualite dans un signal de donnees, dispositif et programme d' ordinateurs associes

Country Status (4)

Country Link
US (1) US9143775B2 (fr)
EP (1) EP2777292A1 (fr)
FR (1) FR2982449A1 (fr)
WO (1) WO2013068676A1 (fr)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1244312A1 (fr) * 2001-03-23 2002-09-25 BRITISH TELECOMMUNICATIONS public limited company Evaluation multimodal de la qualité
WO2006103327A1 (fr) 2005-03-29 2006-10-05 France Telecom S.A. Procede et dispositif d’evaluation d’une degradation de qualite causee par une invariance d’un stimulus, telle que percue par un destinataire dudit stimulus
EP1804519A1 (fr) * 2004-10-18 2007-07-04 Nippon Telegraph and Telephone Corporation Dispositif d évaluation objective de qualité de vidéo, méthode et programme d évaluation
EP2112835A1 (fr) * 2008-04-24 2009-10-28 Psytechnics Ltd Procédé et appareil pour la génération d'un paramètre de qualité vidéo

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09102970A (ja) * 1995-10-05 1997-04-15 Sony Corp 映像音声機器エラー監視システム
US6400400B1 (en) * 1997-07-30 2002-06-04 Sarnoff Corporation Method and apparatus for automated testing of a video decoder
JP3566546B2 (ja) * 1998-04-01 2004-09-15 Kddi株式会社 画像の品質異常検出方法および装置
EP1092324B1 (fr) * 1998-06-29 2003-10-08 BRITISH TELECOMMUNICATIONS public limited company Mesures des performances de systemes de communication
US6795580B1 (en) * 1998-09-10 2004-09-21 Tektronix, Inc. Picture quality measurement using blockiness
US6906743B1 (en) * 1999-01-13 2005-06-14 Tektronix, Inc. Detecting content based defects in a video stream
US6493023B1 (en) * 1999-03-12 2002-12-10 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Method and apparatus for evaluating the visual quality of processed digital video sequences
US6285797B1 (en) * 1999-04-13 2001-09-04 Sarnoff Corporation Method and apparatus for estimating digital video quality without using a reference video
US6377297B1 (en) * 1999-12-07 2002-04-23 Tektronix, Inc. Detection of repeated and frozen frames in a video signal
US6798919B2 (en) * 2000-12-12 2004-09-28 Koninklijke Philips Electronics, N.V. System and method for providing a scalable dynamic objective metric for automatic video quality evaluation
US6633329B2 (en) * 2001-02-06 2003-10-14 Tektronix, Inc. Frozen field detection of formerly encoded video
US7002637B2 (en) * 2001-03-16 2006-02-21 Evertz Microsystems Ltd. System and method for detecting picture freeze within a video signal
US6734898B2 (en) * 2001-04-17 2004-05-11 General Instrument Corporation Methods and apparatus for the measurement of video quality
JP2002359603A (ja) * 2001-05-31 2002-12-13 Mitsubishi Electric Corp ストリーム変換装置
US7154533B2 (en) * 2001-10-30 2006-12-26 Tandberg Telecom As System and method for monitoring and diagnosis of video network performance
US7038710B2 (en) * 2002-07-17 2006-05-02 Koninklijke Philips Electronics, N.V. Method and apparatus for measuring the quality of video data
JP4286068B2 (ja) * 2003-06-03 2009-06-24 大塚電子株式会社 画面の動画質評価方法
MX2007008930A (es) * 2005-01-24 2007-08-22 Thomson Licensing Tecnica de deteccion de error de video con el uso de un codigo de paridad de verificacion de redundancia ciclica (crc).
US7683931B2 (en) * 2006-03-06 2010-03-23 Dell Products L.P. Image artifact detection in video quality benchmarks
US7876355B2 (en) * 2006-04-17 2011-01-25 Harmonic Inc. Video abnormality detection
EP2106154A1 (fr) * 2008-03-28 2009-09-30 Deutsche Telekom AG Estimation de la qualité audiovisuelle
US8564669B2 (en) * 2009-07-30 2013-10-22 General Instrument Corporation System and method of analyzing video streams for detecting black/snow or freeze
US8581987B1 (en) * 2011-03-21 2013-11-12 Marvell International Ltd. Systems and methods for evaluating video quality
CN103583042B (zh) * 2011-06-03 2016-06-15 艾科星科技公司 用于通过评估含有嵌入的参考特性的输出视频帧来测试视频硬件的系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1244312A1 (fr) * 2001-03-23 2002-09-25 BRITISH TELECOMMUNICATIONS public limited company Evaluation multimodal de la qualité
EP1804519A1 (fr) * 2004-10-18 2007-07-04 Nippon Telegraph and Telephone Corporation Dispositif d évaluation objective de qualité de vidéo, méthode et programme d évaluation
WO2006103327A1 (fr) 2005-03-29 2006-10-05 France Telecom S.A. Procede et dispositif d’evaluation d’une degradation de qualite causee par une invariance d’un stimulus, telle que percue par un destinataire dudit stimulus
EP2112835A1 (fr) * 2008-04-24 2009-10-28 Psytechnics Ltd Procédé et appareil pour la génération d'un paramètre de qualité vidéo

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PASTRANA-VIDAL ET AL: "Métrique perceptuelle de rupture de fluidité vidéo sans référence", CONFERENCE CORESA, XX, XX, 26 May 2004 (2004-05-26), XP002354701 *

Also Published As

Publication number Publication date
US20140293067A1 (en) 2014-10-02
US9143775B2 (en) 2015-09-22
FR2982449A1 (fr) 2013-05-10
EP2777292A1 (fr) 2014-09-17

Similar Documents

Publication Publication Date Title
EP2419900B1 (fr) Procede et dispositif d&#39;evaluation objective de la qualite vocale d&#39;un signal de parole prenant en compte la classification du bruit de fond contenu dans le signal
EP2510701B1 (fr) Procede et systeme pour la determination de parametres de codage sur des flux a resolution variable
FR2906950A1 (fr) Procede et dispositifs pour adapter le debit de transmission d&#39;un flux de donnees en presence d&#39;interferences.
EP1274242A1 (fr) Mobile pour videoconférence
FR2805429A1 (fr) Procede de controle de la qualite numeriques distribuees par detection de faux contours
CA2377808C (fr) Procede d&#39;evaluation de la qualite de sequences audiovisuelles
EP1763163A1 (fr) Dispositif et procédé d&#39;obtention automatisée d&#39;informations relatives aux audiences de programmes transmis par un réseau de communication
FR3011426A1 (fr) Procede et dispositif de transmission d&#39;au moins une partie d&#39;un signal lors d&#39;une session de visioconference
WO2013068676A1 (fr) Procede d&#39;evaluation d&#39;au moins un defaut de qualite dans un signal de donnees, dispositif et programme d&#39; ordinateurs associes
WO2007080520A2 (fr) Codage et décodage adaptatifs
EP1864511A1 (fr) Procede et dispositif d&#39;evaluation d&#39;une degradation de qualite causee par une invariance d&#39;un stimulus, telle que percue par un destinataire dudit stimulus
EP2559218B1 (fr) Reception d&#39;un contenu numerique en mode truque
WO2002043051A1 (fr) Detection non intrusive des defauts d&#39;un signal de parole transmis par paquets
WO2012140347A1 (fr) Evaluation de la qualite vocale d&#39;un signal de parole code
EP2025174A1 (fr) Utilisation d&#39;un canal de retour pour la diffusion d&#39;images
WO2011070158A1 (fr) Procede d&#39;estimation de la qualite video a une resolution quelconque
WO2022128693A1 (fr) Procédé et passerelle pour détecter et diagnostiquer des lenteurs dans un réseau local de communication sans fil
EP3582500B1 (fr) Procédé, systeme et programme informatique d&#39;analyse de la complexité d&#39;un contenu multimédia source pour une diffusion à la demande
EP2317722B1 (fr) Procédé et système pour la préservation de la bande passante dans un réseau IPTV
EP2656531B1 (fr) Mesure de bruit impulsif par detection spectrale
WO2004047452A1 (fr) Procede et systeme de mesure des degradations d&#39;une image video introduites par les systemes de diffusion numerique.
FR3145663A1 (fr) Procede et systeme d&#39;automatisation des operations de maintenance de cameras
WO2020128246A1 (fr) Procédé de détermination d&#39;un chemin de transmission de données, et dispositif correspondant
WO2007042719A1 (fr) Mesure de la qualite de perception par un utilisateur d&#39;un signal multimedia transmis sur un reseau de transmission de donnees par paquets
WO2011073559A1 (fr) Dispositif et procede de determination d&#39;une note d&#39;acceptabilite du temps de zapping

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12794413

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 14356787

Country of ref document: US

REEP Request for entry into the european phase

Ref document number: 2012794413

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2012794413

Country of ref document: EP