WO2008081134A2 - Procede d'estimation de la qualite d'une communication en mode paquet - Google Patents

Procede d'estimation de la qualite d'une communication en mode paquet Download PDF

Info

Publication number
WO2008081134A2
WO2008081134A2 PCT/FR2007/052477 FR2007052477W WO2008081134A2 WO 2008081134 A2 WO2008081134 A2 WO 2008081134A2 FR 2007052477 W FR2007052477 W FR 2007052477W WO 2008081134 A2 WO2008081134 A2 WO 2008081134A2
Authority
WO
WIPO (PCT)
Prior art keywords
reference signal
packets
media stream
degraded
ref
Prior art date
Application number
PCT/FR2007/052477
Other languages
English (en)
Other versions
WO2008081134A3 (fr
Inventor
Julien Faure
Original Assignee
France Telecom
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom filed Critical France Telecom
Publication of WO2008081134A2 publication Critical patent/WO2008081134A2/fr
Publication of WO2008081134A3 publication Critical patent/WO2008081134A3/fr

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/20Arrangements for detecting or preventing errors in the information received using signal quality detector
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals

Definitions

  • the present invention relates to a method for estimating the transmission quality of a media stream at a point of a packet mode communication link between a transmitting terminal and a receiving terminal.
  • the invention applies in a general manner to the field of telecommunications, and more particularly to the measurement of the quality of media flow transmission, especially in IP telephony also called VoIP ("Voice over Internet Protocol").
  • intrusive methods Two broad categories of methods are currently known for estimating the quality of media flow transmission over a packet-mode communication link between a transmitting terminal and a receiving terminal: intrusive methods and non-intrusive methods.
  • Intrusive methods include transmitting a reference signal at one end of the link near the transmitting terminal and recording the degraded reference signal received at another end of the link near the receiving terminal.
  • the comparison between the reference signal and the degraded reference signal makes it possible to obtain an estimate of the quality of the transmission. Most often, the result of this estimation is the attribution of a so-called MOS score for "Mean Opinion Score".
  • PESQ Perceptual evaluation of speech quality
  • a voice activity detection used to identify the silence periods on the side of the calling terminal.
  • the calling terminal transmits a portion of the reference signal in the form of RTP ("Real-time Tranport Protocol") stream packets marked with an identifier, such as, for example, a codec number (coder-decoder); arbitrary arbitrary, so as to distinguish the side of the terminal called the actual media flow packets of the reference signal packets.
  • RTP Real-time Tranport Protocol
  • the RTP stream corresponding to the reference signal and identified by said identifier is decoded so as to obtain the degraded reference signal. Knowing the original reference signal, it is possible to apply the algorithm with PESQ reference to measure voice quality degradation.
  • Non-intrusive methods consist in measuring, at a point in the link, data concerning the packets of media streams transmitted between the transmitting terminal and the receiving terminal and evaluating a quality score based on these data.
  • IP IP
  • packets are duplicated and recorded at the measurement point by a port mirror ("switch port mirroring") and decoded by a device called "packet sniffer" to extract data from the packet header. as a basis for quality assessment.
  • the measured IP data may only relate to the packets themselves, such as jitter, or fluctuation in packet arrival time, packet loss rate, reverse packet rate, and so on.
  • jitter or fluctuation in packet arrival time
  • packet loss rate packet loss rate
  • reverse packet rate Several types of perceived quality models can then be used.
  • parametric models such as the E model or the Reynolds et al model. described in US Patent Application No. 2004/162684, based on the arrival time of each IP packet from which parameters are constructed which are then used to evaluate a voice quality MOS score
  • an object of the present invention is to propose a quality estimation method which makes it possible to apply the algorithms usually used during intrusive measurements, that is to say with reference, closer to the sensation of users, to non-intrusive measurements, namely on real communications without overloading the network.
  • This object is achieved, according to the invention, by means of a method for estimating the transmission quality of a media stream at a point, called a measurement point, of a packet mode communication link between a transmitting terminal and a receiver terminal, this estimation being performed by comparison between a reference signal and the reference signal degraded at the measurement point, this method being remarkable in that it comprises the steps of: defining a reference signal,
  • the method according to the invention makes it possible to obtain a degraded reference signal associated with a reference signal, and thus to be able to apply a quality estimation algorithm with reference, from a measurement in a point of the link, without overloading the network and on real communications.
  • the invention thus combines the respective advantages of intrusive and non-intrusive methods, without the disadvantages.
  • the estimation of a MOS score can then be performed by applying a psycho-acoustic algorithm with reference, such as the PESQ algorithm for example.
  • the solution proposed by the invention does not require modifying existing terminals or using particular terminals, they can be any: digital or videophone.
  • the media streams whose transmission quality is to be measured can be of any nature, in particular data of audio conversation, streaming of voice or music, etc., as long as these data flows in the form of packets.
  • the measurement point must be taken closer to the receiving terminal.
  • the degraded reference signal packets are created by replacing in the series of recorded media stream packets the payload of a sequence number packet / by the segment 1 + in 0 of the reference signal. code.
  • the degraded reference signal packets are created by taking as payload a packet of sequence number / in a series of media stream packets reconstructed segment 1 + in 0 of the encoded reference signal.
  • the invention provides that said series of reconstituted media stream packets are reconstructed from timestamp data and sequence numbers extracted from the set of recorded media stream packets.
  • the reference signal for the second estimate is the degraded reference signal extracted from the first estimate.
  • the invention further relates to a computer program comprising program code instructions for performing the steps of the method according to the invention when this program is executed by a computer.
  • the invention finally relates to a device for estimating the transmission quality of a media stream at a point, called a measurement point, of a packet mode communication link between a transmitting terminal and a receiving terminal, this estimate being performed by comparison between a reference signal and the reference signal degraded at the measurement point, this device being remarkable in that it comprises:
  • a recording module at the measurement point, of at least one series of media stream packets, able to extract at least one of the stored packets at least the length and type of coding of the payload
  • a coded reference signal segment forming module comprising a reference signal storage unit, and a coding and cutting unit, according to said type of coding of N reference signal segments of length equal to said payload length
  • a module for constituting a degraded reference signal comprising a degraded reference signal packet generation unit consisting of taking as payload a sequence number packet / in a series of recorded media stream packets and carrying n sequence numbers 0 to n o + N-1, the segment 1 + 0 in the coded reference signal, and an extraction unit of the degraded reference signal from the degraded reference signal packets, - a quality estimation module by comparison between the reference signal and the degraded reference signal.
  • the degraded reference signal packet generation unit comprises means for replacing, in said series of media stream packets, the payload of a sequence number packet / by the segment 1 + in 0 of the coded reference signal.
  • the degraded reference signal packet creation unit is able to reconstruct a series of media stream packets, and to take as payload a sequence number packet / in the series of reconstructed packets, the segment 1 + in 0 of the coded reference signal.
  • said recording module is able to extract time stamp and sequence number data, from the series of recorded media stream packets, and to transmit to the reconstruction means said data. timestamp and sequence number extracted.
  • FIG. 1 is a diagram of a first embodiment of a transmission quality estimation device according to the invention.
  • FIG. 2 is a diagram of a second embodiment of a transmission quality estimation device according to the invention.
  • FIG. 3 is a diagram of an alternative embodiment of the device of FIG. 2.
  • FIG. 4 is a diagram of a transmission quality estimation device with transcoding on the communication link.
  • FIG. 1 shows a device 10 for estimating the transmission quality of a media stream on a communication link in the mode packet between a transmitting terminal 1 and a receiving terminal 2.
  • Said media stream is for example a VoIP audio stream.
  • the transmission quality measurement is performed non-intrusively at a point PM of the link between the two terminals.
  • the measuring point PM must be chosen near the receiving terminal 2.
  • the device 10 of FIG. 1 will now be described with reference to a transmission quality estimation method which it allows to implement.
  • the method according to the invention although constituting a non-intrusive method, implements an algorithm with reference, such as the PESQ algorithm for example.
  • a reference signal Ref of determined length is stored in a storage unit 210 of a module 200 forming coded reference signal segments.
  • This module 200 belongs to a subset 11 of analysis of the quality estimation device 10.
  • a recording module 100 comprising a switch ( switch) 1 10 with a port mirror capable of duplicating the packets, and a packet sniffer 120 for decoding the header of the duplicate packets and extracting data therefrom, such as the length Ln of the payload (" payload ") of the packets, the CodeType code type used by the receiver terminal 2 to decode the payload of the packets, the sequence number SeqNb of each packet and a TS datum of timestamp representative of the instant issuing a packet.
  • a recording module 100 comprising a switch ( switch) 1 10 with a port mirror capable of duplicating the packets, and a packet sniffer 120 for decoding the header of the duplicate packets and extracting data therefrom, such as the length Ln of the payload (" payload ") of the packets, the CodeType code type used by the receiver terminal 2 to decode the payload of the packets, the sequence number SeqNb of each packet and a TS datum of timestamp representative of the instant issuing a packet.
  • the information collected by the recording module 100 is transmitted to the subset 11 for analysis in order to obtain the desired quality estimate.
  • length Ln data and code code type are provided to module 200 to enable a splitting unit 220. and coding to form coded reference signal segments from the Ref reference signal stored in the storage unit 210.
  • the aforementioned signal segments are called frames.
  • the division of the Ref reference signal is done in N segments, the length of each segment being equal to the length Ln of the payload of the packets.
  • L is the length of the reference signal
  • N ULn.
  • N expresses the length of the reference signal in number of media stream packets.
  • the reference signal segments are encoded according to the CodeType data. In practice, these clipping and coding operations can be performed in advance for standard packets and codecs.
  • the unit 220 then contains a library of pre-cut and precoded reference signal files.
  • the packets of recorded media streams are transmitted by the recording module 100 to a module 300 for constituting a degraded reference signal Ref * .
  • This module 300 comprises a degraded reference signal packet creation unit 310, consisting of replacing the payload of a sequence number packet / in a series of recorded media flow packets and carrying sequence numbers of n 0. n o + N-1, the segment 1 + 0 in the coded reference signal received from the switching unit 220 and coding.
  • the degraded reference signal packets are obtained in this case by replacing the payload of these packets respectively by the segments coded signal bearing the numbers 1 2 4 5 6 8 7 9 10 11, thus reproducing the absence of the packet 125 and the inversion of the packets 129 and 130.
  • a unit 320 extracts the degraded reference signal Ref * by processing the degraded reference signal packets from the unit 310 by a jitter compensation register 321 and decoding means 322 in accordance with the data.
  • CodeType the degraded reference signal Ref * by processing the degraded reference signal packets from the unit 310 by a jitter compensation register 321 and decoding means 322 in accordance with the data.
  • the degraded reference signal Ref * and the reference Ref signal provided by the storage unit 210 are compared by a transmission quality estimation module 400 by means of an algorithm with reference, for example the PESQ algorithm. .
  • the extraction unit 320 can simulate the receiver terminal 2.
  • the jitter compensation register 321 and the decoding means 322 are then identical to those of the terminal 2. But it is also possible to simulate any other terminal by selecting jitter compensation registers and any decoding means.
  • Figure 2 shows a second embodiment in which the recording module 100 extracts recorded packets and sends the module 300, instead of the packets themselves, timestamp TS data and packet sequence numbers SeqNb. This data is sufficient to allow the packet creation unit 310 to reconstruct a series of packets equivalent to the series of packets recorded by the module 100.
  • the coded reference signal segments from the unit 220 are introduced according to the procedure explained above as a payload in this reconstructed series. The rest of the treatment is identical to that described for the embodiment of FIG.
  • FIG. 3 is a variant of FIG. 2 in which the subset 11 of analysis has been deported to a remote server S.
  • the traffic allows it, we can completely transmit to the server S the whole packets of media stream, the method according to the embodiment of Figure 1 being then used.
  • FIG. 4 illustrates the situation where transcoding is performed on the link at a point PT between, for example, a G.729 codec and a G.711 codec.
  • a first quality estimate can be made at a measuring point PM 1 upstream of the point PT by a server S for the connection between the transmitting terminal 1 and the point PT.
  • a second estimate can then be made at a point PM 2 near the receiving terminal 2 by the same server S for the entire link between the two terminals, using for reference signal Ref 2 for the second estimate the signal ReU * degraded reference, available on the S server, used for the first estimate.
  • This method extends to any number of transcodings on the link. It is also possible to calculate an MOS score for different sections of a link and to identify in this way those which are responsible for a drop in quality.

Abstract

Dispositif d'estimation de la qualité de transmission de flux média en mode paquet entre un terminal émetteur (1 ) et un terminal récepteur (2). Selon l'invention, ledit dispositif (10) comprend : - un module (100) d'enregistrement en un point (PM) de mesure d'au moinsune série de paquets de flux média; un module (200) de formation de segments de signal de référence codé, comportant une unité (210) de stockage d'un signal (Ref) de référence et une unité (220) de découpage et de codage de N segments de signal de référence; un module (300) de constitution d'un signal (Ref*) de référence dégradé, comportant une unité (310) de création de paquets de signal de référence dégradé consistant à prendre pour charge utile d'un paquet de numéro de séquence / dans une série de paquets de flux média enregistrée et portant des numéros de séquence de n0 à no+N- 1, le segment 1+i-n0 du signal de référence codé, et une unité (320) d'extraction dudit signal {Ref*} de référence; un module (400) d'estimation de qualité par comparaison entre le signal (Ref*) de référence et ledit signal {Ref*} de référence dégradé. Application à la téléphonie sur IP (VoIP).

Description

PROCEDE D'ESTIMATION DE LA QUALITE D'UNE COMMUNICATION EN
MODE PAQUET
La présente invention concerne un procédé d'estimation de la qualité de transmission d'un flux média en un point d'une liaison de communication en mode paquet entre un terminal émetteur et un terminal récepteur.
L'invention s'applique de manière générale au domaine des télécommunications, et plus particulièrement à la mesure de la qualité de transmission de flux média, notamment en téléphonie sur IP appelée aussi VoIP (« Voice over Internet Protocol »).
On connaît actuellement deux grandes catégories de méthodes pour estimer la qualité de transmission de flux média sur une liaison de communication en mode paquet entre un terminal émetteur et un terminal récepteur : les méthodes intrusives et les méthodes non intrusives.
Les méthodes intrusives consistent à émettre un signal de référence à une extrémité de la liaison à proximité du terminal émetteur et à enregistrer le signal de référence dégradé reçu à une autre extrémité de la liaison, à proximité du terminal récepteur. La comparaison entre le signal de référence et le signal de référence dégradé permet d'obtenir une estimation de la qualité de la transmission. Le plus souvent, le résultat de cette estimation se traduit par l'attribution d'une note dite MOS pour « Mean Opinion Score ».
Il existe plusieurs algorithmes psycho-acoustiques qui permettent d'obtenir une note de qualité perçue à partir d'un signal de référence et du signal de référence dégradé. L'algorithme le plus utilisé pour les communications audio est l'algorithme PESQ normalisé à I1ITU-T P.862
{"Perceptual évaluation of speech quality (PESQ) : An objective method for end-to-end speech quality assessment of narrow-band téléphone networks and speech codées", février 2001 ). Cet algorithme, ainsi que d'autres comme ceux qui suivent les recommandations de l'ITU-T J.144R et de l'ITU-R BT.1683 dans le domaine vidéo, sont des algorithmes d'évaluation de la qualité dits « avec référence ».
Parmi les réalisations de méthodes intrusives en VoIP, on peut citer la demande de brevet américain n° 2004/162684 qui propose d'exploiter les silences dans la conversation pour faire transiter des signaux de référence entre deux points. Plus particulièrement, la méthode décrite dans ce document comporte trois étapes :
- Une détection d'activité vocale utilisée pour identifier les périodes de silence du coté du terminal appelant. - Pendant les périodes de silence, le terminal appelant émet une partie du signal de référence sous forme de paquets de flux RTP (« Real-time Tranport Protocol ») marqués par un identifiant, comme par exemple un numéro de codée (codeur-décodeur) arbitraire quelconque, de manière à pouvoir distinguer du côté du terminal appelé les paquets de flux média proprement dits des paquets de signal de référence.
- Au niveau du terminal appelé, le flux RTP correspondant au signal de référence et repéré par ledit identifiant est décodé de manière à obtenir le signal de référence dégradé. Connaissant le signal de référence original, il est possible d'appliquer l'algorithme avec référence PESQ pour mesurer la dégradation de qualité vocale.
Les méthodes non intrusives consistent à mesurer, en un point de la liaison, des données concernant les paquets de flux média transmis entre le terminal émetteur et le terminal récepteur et à évaluer une note de qualité à partir de ces données. En IP, les paquets sont dupliqués et enregistrés au point de mesure par un miroir de port (« switch port mirroring ») et décodés par un dispositif appelé « renifleur de paquets » afin d'extraire de l'en-tête des paquets les données servant de base à l'évaluation de qualité.
Les données mesurées en IP peuvent ne concerner que les paquets eux-mêmes, comme la gigue, ou fluctuation du temps d'arrivée des paquets, le taux de pertes de paquets, le taux de paquets inversés, etc. Plusieurs types de modèles de qualité perçue peuvent alors être utilisés. Parmi ces modèles, on connaît par exemple : - les modèles paramétriques comme le modèle E ou le modèle de Reynolds et al. décrit dans la demande de brevet américain n° 2004/162684, basés sur le temps d'arrivée de chaque paquet IP à partir duquel sont construits des paramètres qui sont ensuite utilisés pour évaluer une note MOS de la qualité vocale,
- les modèles basés sur un apprentissage de paramètres IP mettant en œuvre des réseaux de neurones.
D'autres méthodes non intrusives de mesure en un point nécessitent de reconstituer le signal audio lui-même. Dans ce cas, il faut décoder le signal contenu sous forme encodée dans la charge utile des paquets. Il existe deux familles de modèles permettant d'obtenir une note de qualité à partir du signal audio reconstitué :
- les modèles psycho-acoustiques (ITU-T Recommendation P563, "Single- ended method for objective speech quality assessment in narrow-band telephony applications", mai 2004),
- les modèles avec apprentissage des défauts du signal audio au moyen de réseaux de neurones.
Cependant, les méthodes d'estimation de la qualité vocale qui viennent d'être exposées pour illustrer l'état de la technique actuellement connu ne sont pas entièrement satisfaisantes et présentent les inconvénients suivants.
Dans le cas des mesures non intrusives, les algorithmes mis en jeu sont beaucoup moins représentatifs de la sensation perçue par les utilisateurs du fait qu'il s'agit d'algorithmes « sans référence » contrairement à ceux utilisés dans les méthodes intrusives. Par contre, ces mesures sont faites sur des communications réelles et ne surchargent pas le réseau par des signaux exclusivement dédiés à la mesure de qualité.
Dans le cas des mesures intrusives, les signaux de mesure de qualité surchargent le réseau et doivent donc être limités en nombre. De plus, ces signaux ne correspondent pas à des appels réels. Par contre, les mesures intrusives utilisent des algorithmes « avec référence » qui permettent une évaluation de la qualité au plus proche de la sensation perçue par les utilisateurs. La méthode décrite dans la demande de brevet américain n° 2004/162684 précitée permet en partie de répondre à l'inconvénient majeur des méthodes intrusives puisque le signal de référence est transmis pendant les périodes de silence où la communication est inactive. Ces mesures ne surchargent pas le réseau et sont faites lors de communications réelles. Néanmoins, les informations sur la façon dont le signal de référence est découpé au gré des périodes de silence ont besoin d'être transmises d'une extrémité à l'autre extrémité afin que le terminal récepteur puisse reconstituer le signal dégradé. Cette méthode nécessite l'utilisation de terminaux émetteurs spéciaux qui permettent le découpage, l'envoi du signal de référence et le marquage de paquets nécessaires à la reconstitution du signal dégradé par le terminal récepteur.
Aussi, un but de la présente invention est de proposer un procédé d'estimation de qualité qui permette d'appliquer les algorithmes habituellement utilisés lors de mesures intrusives, c'est-à-dire avec référence, plus proches de la sensation des utilisateurs, à des mesures non intrusives, à savoir sur des communications réelles sans surcharge du réseau.
Ce but est atteint, conformément à l'invention, grâce à un procédé d'estimation de la qualité de transmission d'un flux média en un point, dit point de mesure, d'une liaison de communication en mode paquet entre un terminal émetteur et un terminal récepteur, cette estimation étant effectuée par comparaison entre un signal de référence et le signal de référence dégradé au point de mesure, ce procédé étant remarquable en ce qu'il comprend des étapes consistant à : - définir un signal de référence,
- lors d'une communication, enregistrer au point de mesure des paquets de flux média et en extraire au moins la longueur et le type de codage de la charge utile,
- découper le signal de référence en N segments de longueur égale à la longueur de la charge utile des paquets de flux média enregistrés,
- coder les segments de signal de référence conformément au codage de la charge utile des paquets de flux média enregistrés, - créer des paquets de signal de référence dégradé en prenant pour charge utile d'un paquet de numéro de séquence / dans une série de paquets de flux média enregistrée et portant des numéros de séquence de n0 à no+N-1, le segment 1+i-n0 du signal de référence codé, - extraire le signal de référence dégradé des paquets de signal de référence dégradé,
- effectuer l'estimation de qualité par comparaison entre le signal de référence et le signal de référence dégradé.
Ainsi, on comprend que le procédé conforme à l'invention permet d'obtenir un signal de référence dégradé associé à un signal de référence, et donc de pouvoir appliquer un algorithme d'estimation de qualité avec référence, à partir d'une mesure en un point de la liaison, sans surcharge du réseau et sur des communications réelles. L'invention combine donc les avantages respectifs des méthodes intrusives et non intrusives, sans en avoir les inconvénients. L'estimation d'une note MOS peut alors être effectuée en appliquant un algorithme psycho-acoustique avec référence, comme l'algorithme PESQ par exemple.
De plus, la solution proposée par l'invention ne nécessite pas de modifier des terminaux existants ni d'utiliser des terminaux particuliers, ceux-ci pouvant être quelconques : numériques ou visiophoniques. De même, les flux média dont on veut mesurer la qualité de transmission peuvent être de n'importe quelle nature, notamment données de conversation audio, lecture en transit (« streaming ») de voix ou de musique, etc., du moment que ces données transitent sous forme de paquets. Bien entendu, si l'on veut estimer la qualité de transmission sur toute la longueur de la liaison, le point de mesure doit être pris au plus près du terminal récepteur.
Selon un premier mode de réalisation, les paquets de signal de référence dégradé sont créés en remplaçant dans la série de paquets de flux média enregistrée la charge utile d'un paquet de numéro de séquence / par le segment 1+i-n0 du signal de référence codé.
Selon un deuxième mode de réalisation, les paquets de signal de référence dégradé sont créés en prenant pour charge utile d'un paquet de numéro de séquence /dans une série de paquets de flux média reconstituée le segment 1+i-n0 du signal de référence codé. Dans ce cas, l'invention prévoit que ladite série de paquets de flux média reconstituée est reconstituée à partir de données d'horodatage et de numéros de séquence extraites de la série de paquets de flux média enregistrée.
Il est également prévu par l'invention que, lorsqu'au moins un transcodage du flux média étant réalisé en un point de la liaison de communication, dit point de transcodage, une première estimation de qualité est effectuée en un premier point de mesure en amont du point de transcodage, et une deuxième estimation de qualité est effectuée en un deuxième point de mesure en aval du point de transcodage.
Pour obtenir une estimation de qualité de bout en bout, le signal de référence pour la deuxième estimation est le signal de référence dégradé extrait de la première estimation. L'invention concerne en outre un programme d'ordinateur comprenant des instructions de code de programme pour l'exécution des étapes du procédé selon l'invention lorsque ce programme est exécuté par un ordinateur.
L'invention concerne enfin un dispositif d'estimation de la qualité de transmission d'un flux média en un point, dit point de mesure, d'une liaison de communication en mode paquet entre un terminal émetteur et un terminal récepteur, cette estimation étant effectuée par comparaison entre un signal de référence et le signal de référence dégradé au point de mesure, ce dispositif étant remarquable en ce qu'il comprend :
- un module d'enregistrement, au point de mesure, d'au moins une série de paquets de flux média, apte à extraire desdits paquets enregistrés au moins la longueur et le type de codage de la charge utile,
- un module de formation de segments de signal de référence codé, comportant une unité de stockage d'un signal de référence, et une unité de découpage et de codage, selon ledit type de codage de N segments de signal de référence de longueur égale à ladite longueur de charge utile,
- un module de constitution d'un signal de référence dégradé, comportant une unité de création de paquets de signal de référence dégradé consistant à prendre pour charge utile d'un paquet de numéro de séquence / dans une série de paquets de flux média enregistrée et portant des numéros de séquence de n0 à no+N-1, le segment 1+i-n0 du signal de référence codé, et une unité d'extraction du signal de référence dégradé à partir des paquets de signal de référence dégradé, - un module d'estimation de qualité par comparaison entre le signal de référence et le signal de référence dégradé.
Selon un premier mode de réalisation, l'unité de création de paquets de signal de référence dégradé comprend des moyens pour remplacer, dans ladite série de paquets de flux média, la charge utile d'un paquet de numéro de séquence / par le segment 1+i-n0 du signal de référence codé.
Selon un deuxième mode de réalisation, l'unité de création de paquets de signal de référence dégradé est apte à reconstituer une série de paquets de flux média, et à prendre pour charge utile d'un paquet de numéro de séquence / dans la série de paquets reconstituée, le segment 1+i-n0 du signal de référence codé. Dans ce cas, l'invention prévoit que ledit module d'enregistrement est apte à extraire des données d'horodatage et de numéro de séquence, à partir de la série de paquets de flux média enregistrée, et à transmettre aux moyens de reconstruction lesdites données d'horodatage et de numéro de séquence extraites. La description qui va suivre en regard des dessins annexés, donnés à titre d'exemples non limitatifs, fera bien comprendre en quoi consiste l'invention et comment elle peut être réalisée.
La figure 1 est un schéma d'un premier mode de réalisation d'un dispositif d'estimation de qualité de transmission conforme à l'invention. La figure 2 est un schéma d'un deuxième mode de réalisation d'un dispositif d'estimation de qualité de transmission conforme à l'invention.
La figure 3 est un schéma d'une variante de réalisation du dispositif de la figure 2.
La figure 4 est un schéma d'un dispositif d'estimation de qualité de transmission avec transcodage sur la liaison de communication.
Sur la figure 1 est représenté un dispositif 10 d'estimation de la qualité de transmission d'un flux média sur une liaison de communication en mode paquet entre un terminal émetteur 1 et un terminal récepteur 2. Ledit flux média est par exemple un flux audio en VoIP.
La mesure de qualité de transmission est effectuée de manière non intrusive en un point PM de la liaison entre les deux terminaux. Bien entendu, pour obtenir une estimation précise de la qualité perçue à la réception d'un flux audio émis par le terminal émetteur 1 , le point PM de mesure doit être choisi à proximité du terminal récepteur 2.
Le dispositif 10 de la figure 1 va maintenant être décrit en référence à un procédé d'estimation de qualité de transmission dont il permet la mise en œuvre.
Comme cela a été mentionné plus haut, le procédé conforme à l'invention, bien que constituant une méthode non intrusive, met en œuvre un algorithme avec référence, comme l'algorithme PESQ par exemple. A cet effet, un signal Ref de référence de longueur déterminée est stocké dans une unité 210 de stockage d'un module 200 de formation de segments de signal de référence codé. Ce module 200 appartient à un sous-ensemble 1 1 d'analyse du dispositif 10 d'estimation de qualité.
Lors d'une communication entre le terminal émetteur 1 et le terminal récepteur 2, au moins une série de paquets de flux média arrivant jusqu'au terminal récepteur 2 est enregistrée au point PM de mesure par un module 100 d'enregistrement comprenant un commutateur (switch) 1 10 avec un miroir de port apte à dupliquer les paquets, et un renifleur 120 de paquets destiné à décoder l'en-tête des paquets dupliqués et à en extraire des données, telles que la longueur Ln de la charge utile (« payload ») des paquets, le type CodeType de codée utilisé par le terminal récepteur 2 pour décoder la charge utile des paquets, le numéro SeqNb de séquence de chaque paquet et une donnée TS d'horodatage (« Timestamp ») représentative de l'instant d'émission d'un paquet.
Les informations recueillies par le module 100 d'enregistrement sont transmises au sous-ensemble 1 1 pour analyse en vue d'obtenir l'estimation de qualité recherchée.
En particulier, les données Ln de longueur et CodeType de codée sont fournies au module 200 de manière à permettre à une unité 220 de découpage et de codage de former des segments de signal de référence codé à partir du signal Ref de référence stocké dans l'unité 210 de stockage. On notera que, dans le cas d'un signal audio ou vidéo, les segments précités de signal sont appelés des trames. Plus précisément, le découpage du signal Ref de référence est effectué en N segments, la longueur de chaque segment étant égale à la longueur Ln de la charge utile des paquets. Ainsi, si L est la longueur du signal de référence, le nombre de segments est donné par N=ULn. N exprime donc la longueur du signal de référence en nombre de paquets de flux média. Après découpage, les segments de signal de référence sont codés conformément à la donnée CodeType. Dans la pratique, ces opérations de découpage et de codage peuvent être réalisées à l'avance pour des paquets et des codées standards. L'unité 220 contient alors une bibliothèque de fichiers de signaux de référence prédécoupés et précodés.
Dans le mode de réalisation de la figure 1 , les paquets de flux média enregistrés sont transmis par le module 100 d'enregistrement à un module 300 de constitution d'un signal Ref* de référence dégradé. Ce module 300 comprend une unité 310 de création de paquets de signal de référence dégradé, consistant à remplacer la charge utile d'un paquet de numéro de séquence / dans une série de paquets de flux média enregistrée et portant des numéros de séquence de n0 à no+N-1, par le segment 1+i-n0 du signal de référence codé reçu de l'unité 220 de découpage et de codage.
Par exemple, à un signal Ref de référence de N=11 segments numérotés de 1 à 11, est associée une série de paquets de flux média enregistrée dont les numéros de séquence SeqNb s'étendent de n0 à no+ 1O, soit :
123 124 126 127 128 λ 30 129 131 132 133 avec no= 123
Dans cette série de paquets, on voit que le paquet 125 est manquant et que les paquets 129 et 130 ont été inversés.
Les paquets de signal de référence dégradé sont obtenus dans ce cas en remplaçant la charge utile de ces paquets respectivement par les segments du signal codé portant les numéros 1 2 4 5 6 8 7 9 10 11, reproduisant ainsi l'absence du paquet 125 et l'inversion des paquets 129 et 130.
Ensuite, une unité 320 procède à l'extraction du signal Ref* de référence dégradé en traitant les paquets de signal de référence dégradé issu de l'unité 310 par un registre 321 de compensation de gigue et des moyens 322 de décodage conformément à la donnée CodeType.
Le signal Ref* de référence dégradé et le signal Ref de référence fourni par l'unité 210 de stockage sont comparés par un module 400 d'estimation de la qualité de transmission au moyen d'un algorithme avec référence, par exemple l'algorithme PESQ.
Il est à noter que l'unité 320 d'extraction peut simuler le terminal récepteur 2. Le registre 321 de compensation de gigue et les moyens 322 de décodage sont alors identiques à ceux du terminal 2. Mais il est également possible de simuler tout autre terminal en choisissant des registres de compensation de gigue et des moyens de décodage quelconques.
La figure 2 représente un deuxième mode de réalisation dans lequel le module 100 d'enregistrement extrait des paquets enregistrés et envoie au module 300, au lieu des paquets eux-mêmes, des données TS d'horodatage et les numéros SeqNb de séquence de paquets. Ces données sont suffisantes pour permettre à l'unité 310 de création de paquets de reconstituer une série de paquets équivalente à la série de paquets enregistrée par le module 100. Les segments de signal de référence codé issus de l'unité 220 sont introduits selon la procédure expliquée plus haut en tant que charge utile dans cette série reconstituée. La suite du traitement est identique à celle qui a été décrite pour le mode de réalisation de la figure 1.
La figure 3 est une variante de la figure 2 dans laquelle le sous- ensemble 1 1 d'analyse a été déporté sur un serveur S distant. En effet, dans cette configuration, il est en général préférable de transmettre au serveur S les seules données d'horodatage TS et les numéros SeqNb plutôt que les paquets eux-mêmes, ceci afin d'éviter des surcharges du réseau. Cependant, si le trafic le permet, on peut tout à fait transmettre au serveur S les paquets entiers de flux média, le procédé selon le mode de réalisation de la figure 1 étant alors utilisé.
La figure 4 illustre la situation où un transcodage est réalisé sur la liaison en un point PT entre par exemple un codée G.729 et un codée G.711. Une première estimation de qualité peut être effectuée en un point PM1 de mesure en amont du point PT par un serveur S pour la liaison entre le terminal émetteur 1 et le point PT. Une deuxième estimation peut ensuite être effectuée en un point PM2 à proximité du terminal récepteur 2 par le même serveur S pour l'ensemble de la liaison entre les deux terminaux, en utilisant pour signal Ref2 de référence pour la deuxième estimation le signal ReU * de référence dégradé, disponible sur le serveur S, ayant servi à la première estimation.
Ce procédé s'étend à un nombre quelconque de transcodages sur la liaison. Il est aussi possible de calculer une note MOS pour différents tronçons d'une liaison et d'identifier de cette manière ceux qui sont responsables d'une baisse de qualité.

Claims

REVENDICATIONS
1. Procédé d'estimation de la qualité de transmission d'un flux média en un point (PM), dit point de mesure, d'une liaison de communication en mode paquet entre un terminal émetteur (1 ) et un terminal récepteur (2), ladite estimation étant effectuée par comparaison entre un signal (Reή de référence et le signal {Ref*) de référence dégradé audit point de mesure, caractérisé en ce que ledit procédé comprend des étapes consistant à :
- définir un signal (Reή de référence,
- lors d'une communication, enregistrer audit point (PM) de mesure des paquets de flux média et en extraire au moins la longueur (Ln) et le type (CodeType) de codage de la charge utile, - découper ledit signal (Reή de référence en N segments de longueur égale à la longueur (Ln) de la charge utile des paquets de flux média enregistrés,
- coder lesdits segments de signal de référence conformément au codage (CodeType) de la charge utile des paquets de flux média enregistrés,
- créer des paquets de signal de référence dégradé en prenant pour charge utile d'un paquet de numéro de séquence / dans une série de paquets de flux média enregistrée et portant des numéros de séquence de n0 à no+N-1, le segment 1+i-n0 du signal de référence codé,
- extraire ledit signal (Ref*) de référence dégradé desdits paquets de signal de référence dégradé, - effectuer ladite estimation par comparaison entre le signal (Reή de référence et ledit signal (Ref*) de référence dégradé.
2. Procédé selon la revendication 1 , dans lequel lesdits paquets de signal de référence dégradé sont créés en remplaçant, dans ladite série de paquets de flux média enregistrée, la charge utile d'un paquet de numéro de séquence / par le segment 1+i-n0 du signal de référence codé.
3. Procédé selon la revendication 1 , dans lequel lesdits paquets de signal de référence dégradé sont créés en prenant pour charge utile d'un paquet de numéro de séquence /, dans une série de paquets de flux média reconstituée, le segment 1+i-n0 du signal de référence codé.
4. Procédé selon la revendication 3, dans lequel ladite série de paquets de flux média reconstituée est reconstituée à partir de données d'horodatage (TS) et de numéros {SeqNb) de séquence, extraites de la série de paquets de flux média enregistrée.
5. Procédé selon l'une quelconque des revendications 1 à 4, dans lequel l'extraction du signal (Ref*) de référence dégradé, à partir des paquets de signal de référence dégradé, est réalisée par compensation de gigue des paquets de signal de référence dégradé et décodage conformément au codage {CodeTypë) de la charge utile des paquets de flux média enregistrés.
6. Procédé selon l'une quelconque des revendications 1 à 5, dans lequel, au moins un transcodage du flux média étant réalisé en un point (PT) de ladite liaison, dit point de transcodage, une première estimation de qualité est effectuée en un premier point (PM1) de mesure en amont dudit point (PT) de transcodage, et une deuxième estimation de qualité est effectuée en un deuxième point (PM2) de mesure en aval dudit point de transcodage.
7. Procédé selon la revendication 6, dans lequel le signal {Ref2) de référence pour la deuxième estimation est le signal [ReU *) de référence dégradé extrait de la première estimation.
8. Procédé selon l'une quelconque des revendications 1 à 7, dans lequel l'estimation de qualité est effectuée au moyen d'un algorithme psychoacoustique avec référence.
9. Procédé selon la revendication 8, dans lequel ledit algorithme est l'algorithme PESQ.
10. Programme d'ordinateur comprenant des instructions de code de programme pour l'exécution des étapes du procédé selon l'une quelconque des revendications 1 à 9 lorsque ledit programme est exécuté par un ordinateur.
1 1. Dispositif d'estimation de la qualité de transmission d'un flux média en un point (PM), dit point de mesure, d'une liaison de communication en mode paquet entre un terminal émetteur (1 ) et un terminal récepteur (2), ladite estimation étant effectuée par comparaison entre un signal {Ref) de référence et le signal (Ref*) de référence dégradé audit point de mesure, caractérisé en ce que ledit dispositif (10) comprend :
- un module (100) d'enregistrement, audit point (PM) de mesure, d'au moins une série de paquets de flux média, apte à extraire desdits paquets au moins la longueur (Ln) et le type (CodeType) de codage de la charge utile,
- un module (200) de formation de segments de signal de référence codé, comportant une unité (210) de stockage d'un signal (Ref) de référence, et une unité (220) de découpage et de codage selon ledit type de codage (CodeType) de N segments de signal de référence de longueur égale à ladite longueur (Ln) de charge utile,
- un module (300) de constitution d'un signal (Ref*) de référence dégradé, comportant une unité (310) de création de paquets de signal de référence dégradé, consistant à prendre pour charge utile d'un paquet de numéro de séquence / dans une série de paquets de flux média enregistrée et portant des numéros de séquence de n0 à no+N-1, le segment 1+i-n0 du signal de référence codé, et une unité (320) d'extraction dudit signal (Ref*) de référence dégradé à partir desdits paquets de signal de référence dégradé,
- un module (400) d'estimation de qualité par comparaison entre le signal (Ref) de référence et ledit signal (Ref*) de référence dégradé.
12. Dispositif selon la revendication 1 1 , dans lequel ladite unité (310) de création de paquets de signal de référence dégradé comprend des moyens pour remplacer, dans ladite série de paquets de flux média enregistrée, la charge utile d'un paquet de numéro de séquence / par le segment 1+i-n0 du signal de référence codé.
13. Dispositif selon la revendication 1 1 , dans lequel ladite unité (310) de création de paquets de signal de référence dégradé est apte à reconstituer une série de paquets de flux média, et à prendre pour charge utile d'un paquet de numéro de séquence / dans la série de paquets reconstituée, le segment 1+i-n0 du signal de référence codé.
14. Dispositif selon la revendication 13, dans lequel ledit module (100) d'enregistrement est apte à extraire des données d'horodatage (TS) et de numéro (SeqNb) de séquence à partir desdits paquets de la série de paquets de flux média enregistrée, et à transmettre lesdites données extraites à ladite unité (310) de création.
15. Dispositif selon l'une quelconque des revendications 11 à 14, dans lequel ladite unité (320) d'extraction comprend un registre (321 ) de compensation de gigue et des moyens (322) de décodage conformément au codage (CodeType) de la charge utile des paquets de flux média enregistrés.
PCT/FR2007/052477 2006-12-26 2007-12-11 Procede d'estimation de la qualite d'une communication en mode paquet WO2008081134A2 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0655946 2006-12-26
FR0655946A FR2910758A1 (fr) 2006-12-26 2006-12-26 Procede d'estimation de la qualite d'une communication en mode paquet

Publications (2)

Publication Number Publication Date
WO2008081134A2 true WO2008081134A2 (fr) 2008-07-10
WO2008081134A3 WO2008081134A3 (fr) 2008-09-12

Family

ID=38319328

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2007/052477 WO2008081134A2 (fr) 2006-12-26 2007-12-11 Procede d'estimation de la qualite d'une communication en mode paquet

Country Status (2)

Country Link
FR (1) FR2910758A1 (fr)
WO (1) WO2008081134A2 (fr)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996006496A1 (fr) * 1994-08-18 1996-02-29 British Telecommunications Public Limited Company Analyse de qualite audio
US20040162684A1 (en) * 2003-01-21 2004-08-19 Psytechnics Limited Quality assessment tool
US20060265211A1 (en) * 2005-05-20 2006-11-23 Lucent Technologies Inc. Method and apparatus for measuring the quality of speech transmissions that use speech compression

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996006496A1 (fr) * 1994-08-18 1996-02-29 British Telecommunications Public Limited Company Analyse de qualite audio
US20040162684A1 (en) * 2003-01-21 2004-08-19 Psytechnics Limited Quality assessment tool
US20060265211A1 (en) * 2005-05-20 2006-11-23 Lucent Technologies Inc. Method and apparatus for measuring the quality of speech transmissions that use speech compression

Also Published As

Publication number Publication date
WO2008081134A3 (fr) 2008-09-12
FR2910758A1 (fr) 2008-06-27

Similar Documents

Publication Publication Date Title
US7376132B2 (en) Passive system and method for measuring and monitoring the quality of service in a communications network
EP1468416B1 (fr) Procede d'evaluation qualitative d'un signal audio numerique.
Mazurczyk et al. Using transcoding for hidden communication in IP telephony
Jelassi et al. Quality of experience of VoIP service: A survey of assessment approaches and open issues
CA3122534C (fr) Systemes et procedes de detection d'une provenance d'appel a partir de l'element audio d'appel
US7583613B2 (en) Method of monitoring the quality of a realtime communication
US20050015253A1 (en) Voice quality analysis technique
TW200820748A (en) A method of determining video quality
EP1356455B1 (fr) Methode et dispositif de traitement d'une pluralite de flux binaires audio
FR2884989A1 (fr) Procede d'adaptation pour une interoperabilite entre modeles de correlation a court terme de signaux numeriques.
FR2984580A1 (fr) Procede de detection d'une bande de frequence predeterminee dans un signal de donnees audio, dispositif de detection et programme d'ordinateur correspondant
Jelassi et al. A study of artificial speech quality assessors of VoIP calls subject to limited bursty packet losses
EP1692824B1 (fr) Procede et serveur de controle des flux de donnees dans un reseau de telecommunications
Conway Output-based method of applying PESQ to measure the perceptual quality of framed speech signals
WO2008081134A2 (fr) Procede d'estimation de la qualite d'une communication en mode paquet
WO2002043051A1 (fr) Detection non intrusive des defauts d'un signal de parole transmis par paquets
EP2697794A1 (fr) Evaluation de la qualite vocale d'un signal de parole code
FR3067541A1 (fr) Emission et reception d'un flux de donnees
Geiser Paths toward HD-voice communication
Schlosser et al. Monitoring the user perceived quality of SILK-based voice calls
Orosz et al. A no-reference voice quality estimation method for Opus-based VoIP services
Issing et al. Flexible playout adaptation for low delay AAC RTP communication
Gambhir Objective measurement of speech quality in VoIP over wireless LAN during handoff
Lin et al. Capability Measure for VoIP Performance
EP1418742A1 (fr) Procédé et dispositif d'évaluation de la qualité percue d'un signal de parole recu via un réseau de commutation de paquets

Legal Events

Date Code Title Description
NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 07871908

Country of ref document: EP

Kind code of ref document: A2