WO2009150932A1 - オーディオ品質推定方法、オーディオ品質推定装置およびプログラム - Google Patents

オーディオ品質推定方法、オーディオ品質推定装置およびプログラム Download PDF

Info

Publication number
WO2009150932A1
WO2009150932A1 PCT/JP2009/059529 JP2009059529W WO2009150932A1 WO 2009150932 A1 WO2009150932 A1 WO 2009150932A1 JP 2009059529 W JP2009059529 W JP 2009059529W WO 2009150932 A1 WO2009150932 A1 WO 2009150932A1
Authority
WO
WIPO (PCT)
Prior art keywords
audio
average
packet
packet loss
quality
Prior art date
Application number
PCT/JP2009/059529
Other languages
English (en)
French (fr)
Inventor
則次 恵木
林 孝典
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to CN200980121452.2A priority Critical patent/CN102057634B/zh
Priority to KR1020107027628A priority patent/KR101224171B1/ko
Priority to BRPI0914795A priority patent/BRPI0914795B8/pt
Priority to EP09762362.3A priority patent/EP2288087B1/en
Priority to US12/996,767 priority patent/US8868222B2/en
Priority to JP2010516804A priority patent/JP5123384B2/ja
Publication of WO2009150932A1 publication Critical patent/WO2009150932A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • H04L43/0829Packet loss
    • H04L43/0835One way packet loss
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2236Quality of speech transmission monitoring

Definitions

  • the present invention relates to a technique for estimating the subjective quality of audio in a stream type multimedia communication service, and more particularly to an audio quality design / management technique for a multimedia communication service.
  • the parametric model is a model that takes a quality factor as an input and estimates the user experience quality based on the relationship between the quality factor and the user experience quality, and is suitable for service quality design.
  • the parametric packet layer model is a model for measuring a part of quality factors given as an input of the parametric model based on packet header information on the transmission / reception side, and is suitable for measuring user experience quality during service provision.
  • ITU-T International Telecommunication Union, Telecommunication Standardization Sector
  • ITU-T. 564 describes standards for packet layer models for telephone bands or broadband telephones (see “Conformance testing for narrow-band voice over IP transmission quality assessment models”, ITU-T Recommendation P.564, July 2006).
  • the conventional objective quality evaluation method targets a service in which the time length of data stored in one packet is fixed and a single medium.
  • the amount of data (time length) stored in one packet is not constant depending on the encoding method, and the packet may include media other than audio.
  • the conventional parametric packet layer model has a problem in that audio quality cannot be estimated appropriately. As described above, the conventional objective quality evaluation method cannot estimate the subjective quality of audio in the multimedia communication service.
  • the present invention has been made to solve the above-described problems, and an object thereof is to provide an audio quality estimation method, an audio quality estimation apparatus, and a program capable of appropriately estimating the subjective quality of audio in a multimedia communication service.
  • the present invention relates to an audio quality estimation method for a multimedia communication service in which an audio packet that is an IP packet including audio data and an IP packet that does not include audio data are mixedly transmitted. Based on the information, when there is at least one audio packet to be evaluated among IP packet losses that have occurred individually or continuously, the audio packet counts the packet loss as one time regardless of the length of the continuous length.
  • the average influence time that is the average time that affects the audio quality when the audio packet loss frequency is 1 time, or 1 time Audio packet level included in audio packet loss
  • Subjective quality evaluation for obtaining a subjective quality evaluation value based on an average influence time or average audio burst length calculation step for calculating an average audio burst length as a number, the number of audio packet losses, and an average influence time or average audio burst length And a value estimation step.
  • the audio quality estimation apparatus of the present invention is based on the received IP packet information, and when there is at least one audio packet to be evaluated among the IP packet loss generated singly or continuously, the packet loss Audio packet loss frequency calculation means for determining the number of audio packet losses that counts as one time regardless of the length of the continuous length, and the audio quality when the number of audio packet losses is one based on the received IP packet information
  • An average influence time that is an average influence time that affects the average audio burst length or an average audio burst length that is an average number of audio packets included in one audio packet loss
  • Packet loss count and average impact time or average Is characterized in further comprising a subjective quality assessment value estimation means for obtaining a subjective quality assessment value based on the audio burst length.
  • the audio quality estimation program is based on the received IP packet information, and when there is at least one audio packet to be evaluated among IP packet losses generated independently or continuously, the packet loss Audio packet loss count calculation step for obtaining the number of audio packet losses that counts as one time regardless of the length of the continuous length, and the audio quality when the number of audio packet losses is one based on the received IP packet information Calculating the average influence time or average audio burst length, which is an average influence time that is an average influence time of the audio packet, or an average number of audio packets that are included in one audio packet loss, and the audio Number of packet loss and average shadow And subjective quality assessment value estimation step of obtaining a subjective quality assessment value based on the time or average audio burst length and, is characterized in causing a computer to execute.
  • the audio packet loss frequency calculation step for obtaining the audio packet loss frequency the average influence time or average audio burst length calculation step for calculating the average influence time or average audio burst length, and the audio
  • a subjective quality evaluation value estimation step for obtaining a subjective quality evaluation value based on the number of packet losses and the average influence time or the average audio burst length
  • the appropriate subjective quality of the audio on the receiving side in the multimedia communication service is provided.
  • an accurate subjective quality evaluation value can be measured in-service by calculating several quality parameters on the receiving side. As a result, in the present invention, information necessary for quality control and complaint handling can be easily and timely obtained from the receiving side.
  • FIG. 1 is a block diagram showing the configuration of an audio quality estimation apparatus representing the principle of the present invention.
  • FIG. 2 is a diagram for explaining the number of audio packet losses and the average influence time.
  • FIG. 3 is a diagram illustrating an IP packet used in a subjective quality evaluation experiment for determining the relationship between the number of audio packet losses and the user experience quality.
  • FIG. 4 is a diagram illustrating an example of the relationship between the number of audio packet losses and the user experience quality.
  • FIG. 5 shows a method of converting one audio packet loss at the average influence time length other than the reference influence time length into the number of audio packet losses at the reference influence time length that gives the same quality degradation as this loss. It is a figure for demonstrating.
  • FIG. 1 is a block diagram showing the configuration of an audio quality estimation apparatus representing the principle of the present invention.
  • FIG. 2 is a diagram for explaining the number of audio packet losses and the average influence time.
  • FIG. 3 is a diagram illustrating an IP packet used in a subjective quality evaluation experiment for determining the
  • FIG. 6 is a diagram illustrating an example of the relationship between the average influence time and the number of losses considered.
  • FIG. 7 is a block diagram showing the configuration of the audio quality estimation apparatus according to the first embodiment of the present invention.
  • FIG. 8 is a flowchart showing the operation of the audio quality estimation apparatus according to the first embodiment of the present invention.
  • FIG. 9 is a flowchart showing an audio bit rate calculation method by the audio bit rate calculation unit in the first embodiment of the present invention.
  • FIG. 10 is a flowchart showing a method for calculating the number of IP packet losses and the number of IP packet losses and the average burst length by the average burst length calculator in the first embodiment of the present invention.
  • FIG. 10 is a flowchart showing a method for calculating the number of IP packet losses and the number of IP packet losses and the average burst length by the average burst length calculator in the first embodiment of the present invention.
  • FIG. 11 is a flowchart showing a method for calculating the ratio of the number of audio packets by the audio packet number ratio calculation unit in the first embodiment of the present invention.
  • FIG. 12 is a block diagram showing a configuration example of the audio packet loss frequency calculation unit in the first embodiment of the present invention.
  • FIG. 13 is a flowchart showing a method of calculating the audio packet loss frequency by the audio packet loss frequency calculator in the first embodiment of the present invention.
  • FIG. 14 is a flowchart showing a method of calculating an average audio burst length by the average audio burst length calculation unit in the first embodiment of the present invention.
  • FIG. 15 is a flowchart showing a method for calculating the average number of audio packets by the average audio packet number calculation unit in the first embodiment of the present invention.
  • FIG. 12 is a block diagram showing a configuration example of the audio packet loss frequency calculation unit in the first embodiment of the present invention.
  • FIG. 13 is a flowchart showing a method of calculating the audio packet loss frequency
  • FIG. 16 is a block diagram illustrating a configuration example of the average influence time calculation unit in the first embodiment of the present invention.
  • FIG. 17 is a flowchart showing a method of calculating the average influence time by the average influence time calculation unit in the first embodiment of the present invention.
  • FIG. 18 is a block diagram illustrating a configuration example of the subjective quality evaluation value estimation unit in the first embodiment of the present invention.
  • FIG. 19 is a flowchart showing a subjective quality evaluation value estimation method by the subjective quality evaluation value estimation unit in the first embodiment of the present invention.
  • FIG. 20 is a block diagram showing a configuration of an audio quality estimation apparatus according to the second embodiment of the present invention.
  • FIG. 21 is a flowchart showing the operation of the audio quality estimation apparatus according to the second embodiment of the present invention.
  • FIG. 22 is a block diagram illustrating a configuration example of the subjective quality evaluation value estimation unit in the second embodiment of the present invention.
  • FIG. 23 is a flowchart showing a subjective quality evaluation value estimation method by the subjective quality evaluation value estimation unit in the second embodiment of the present invention.
  • the present invention derives a parametric model for estimating audio quality in a multimedia communication service, and uses input parameters that vary in-service such as an audio bit rate, the number of packet losses, and an average burst length.
  • input parameters that vary in-service such as an audio bit rate, the number of packet losses, and an average burst length.
  • a parametric packet layer model is proposed in which the input parameters are calculated based on the packet header information on the receiving side.
  • the multimedia communication service is a communication service in which an audio packet that is an IP packet including audio data and an IP packet that does not include audio data are mixedly transmitted. In the multimedia communication service, these packets are transmitted via the IP network.
  • FIG. 1 is a block diagram showing the configuration of an audio quality estimation apparatus representing the principle of the present invention.
  • the audio quality estimation apparatus in FIG. 1 includes a parameter derivation unit 1 that derives input parameters, and a quality estimation unit 2 that calculates audio subjective quality evaluation values based on the input parameters.
  • the parameter deriving unit 1 includes an audio bit rate calculating unit 10 that calculates an audio bit rate based on information about an IP packet received from an IP network (not shown), and an audio packet loss count based on information about the IP packet received from the IP network.
  • An audio packet loss frequency calculation unit 11 and an average influence time calculation unit 12 that calculates an average influence time based on information of IP packets received from the IP network.
  • the quality estimation unit 2 includes an encoded audio quality value database 20 in which encoded audio quality values representing the subjective quality of audio whose quality has deteriorated due to encoding by the codec are stored in advance, and coefficients for calculating subjective quality evaluation values.
  • a coefficient database 21 stored in advance and a subjective quality evaluation value estimation unit 22 that calculates a subjective quality evaluation value based on the number of audio packet losses and an average influence time are included.
  • Audio quality estimation device takes into account distortion due to encoding and degradation due to packet loss.
  • Audio quality measurement whose quality has deteriorated due to coding distortion is a database of subjective quality evaluation values by measuring subjective quality evaluation values at each audio bit rate (kbps) and sampling rate (kHz) through subjective quality evaluation experiments.
  • An encoded audio quality value database 20 is created, and this encoded audio quality value database 20 is used.
  • FIG. 2A shows audio data before being IP-packetized, and 200 shows a frame.
  • the length of one frame is 100 ms.
  • FIG. 2B shows an IP packet in which audio data and other data are stored.
  • 201 and 202 are audio packets in which audio data is stored
  • 203 is an IP packet in which data other than audio is stored.
  • one frame of audio data is divided into two and stored in IP packets 201 and 202.
  • the loss 204 indicates a case where eight IP packets are lost continuously
  • the loss 205 indicates a case where two IP packets are continuously lost
  • the loss 206, 207 indicates a case where one IP packet is lost. Yes.
  • the number of IP packet losses is 4, and the number of lost IP packets is 12.
  • the audio packet loss frequency L a regardless of the packet loss on the length of the run length when the evaluated audio packets into a single or sequential IP packet loss that occurred is that there is at least one It counts as one time. Since loss 207 is a loss of IP packets including data other than audio, as shown in (C) of FIG. Therefore, the number of audio packet losses is three.
  • the average influence time t is an average time that affects the audio quality when the number of audio packet losses is one.
  • loss 204 audio data for two frames is lost
  • the user of the audio quality estimation apparatus derives in advance a model (quality estimation function) for estimating the subjective quality evaluation value from the number of audio packet losses and the average influence time.
  • a reference value t ′ (ms) is set for the average influence time, and the average influence time is fixed to the reference influence time t ′ (ms).
  • t ′ one frame length
  • t ′ one frame length
  • a packet loss 300 in which audio data for one frame is lost occurs, and this packet loss 300 is smaller than that for one frame.
  • a subjective quality evaluation experiment is performed on an IP packet stream having an average influence time other than the reference influence time t '.
  • the subjective quality evaluation experiment is performed in the same manner as described above for the IP packet stream in which the average influence time is t ′′ (ms) other than the reference value t ′ (ms) and the number of audio packet losses is one.
  • Q ′′ be the user experience quality.
  • the user calculates the number of audio packet losses that gives the user experience quality Q ′′ when the average influence time is the reference value t ′ (ms) based on the relational expression fa (FIG. 5).
  • the packet loss count is regarded as the loss count V ′′.
  • the number of loss times V ′′ is calculated for IP packet streams with various average influence times t ′′ (ms), and the relationship between the average loss time and the number of losses as shown in FIG. Get. Then, the user regards the average influence time as the average influence time from the relationship shown in FIG.
  • the relational expressions fa and fb derived as described above are set in the subjective quality evaluation value estimation unit 22 in advance.
  • the subjective quality evaluation value estimation unit 22 calculates the deemed loss frequency V from the average influence time length t calculated by the average influence time calculation unit 12 using the relational expression fb. calculates a loss frequency audio packet loss frequency calculation unit 11 to the V is multiplied by the audio packet loss frequency L a counted value (V ⁇ L a), determined quality, the reference influence time t 'a and losses (V ⁇ L a )
  • the audio subjective quality evaluation value Q is calculated from the audio packet loss count (V ⁇ L a ) using the relational expression fa, assuming that the quality is equivalent to the quality at the time of occurrence.
  • the audio bit rate calculation unit 10 measures the data of information related to audio from the header information of the IP packet received from the IP network, and calculates the data amount per second, thereby calculating the audio bit rate.
  • the audio packet loss frequency calculation unit 11 detects a lost IP packet from the header information of the IP packet received from the IP network, and determines the IP packet including the audio data among the lost IP packets from the ratio of the audio data to the total data. Estimate the number. Then, the loss count of the IP packet including the audio data estimated within a certain time is set as the audio packet loss count.
  • the average influence time calculation unit 12 detects a lost IP packet from header information of an IP packet received from the IP network, and an IP including audio data in the lost IP packet from the ratio of audio data to all data. Estimate the number of packets. Then, the average of the burst lengths of the IP packets including the audio data estimated within a certain time is set as the average audio burst length.
  • FIG. 7 is a block diagram showing the configuration of the audio quality estimation apparatus according to the first embodiment of the present invention.
  • the audio quality estimation apparatus includes a parameter deriving unit 1, a quality estimating unit 2, and an intermediate parameter deriving unit 3 for deriving intermediate parameters for obtaining the number of audio packet losses and the average influence time derived by the parameter deriving unit 1. Is done.
  • the intermediate parameter derivation unit 3 includes an audio packet number ratio calculation unit 30 that calculates a ratio of the number of audio packets to the total number of IP packets based on information of IP packets received from an IP network (not shown), and information on received IP packets. Based on the above, the number of IP packet loss counted as one time regardless of the length of the continuous length, and the average number of IP packets included in one IP packet loss The average number of audio packets included in one audio packet loss based on the number of IP packet loss times and average burst length calculation unit 31 for obtaining a certain average burst length, and the ratio of the average burst length and the number of audio packets to the total number of IP packets The average audio burst for which the average audio burst length is calculated Has a strike length calculation unit 32, based on information of received IP packets, the average audio packet count calculation unit 33 for calculating an average number of audio packets the audio data of one frame is stored.
  • FIG. 8 is a flowchart showing the operation of the audio quality estimation apparatus of this embodiment. In the audio quality estimation apparatus, first, each parameter is obtained.
  • the audio bit rate calculation unit 10 calculates the audio bit rate A (step S1).
  • FIG. 9 is a flowchart showing a method of calculating the audio bit rate A by the audio bit rate calculation unit 10.
  • the audio bit rate calculation unit 10 acquires the IP packet stream for T ′ seconds (step S100), and rearranges the order of the IP packets based on the sequence number in the RTP header of each IP packet of the IP packet stream ( Step S101).
  • the audio bit rate calculation unit 10 extracts one unchecked IP packet from the IP packet stream, extracts the source IP address and the destination IP address from the IP header of the IP packet, and extracts the IP packet
  • the source port number and destination port number are extracted from the UDP header, and the 7-bit payload type number is extracted from the RTP header of the IP packet (step S102).
  • the audio bit rate calculation unit 10 matches the extracted source IP address and destination IP address with the evaluation source IP address and destination IP address, and the extracted start port number and destination port number are the start points of the evaluation target. It is determined whether the port number matches the destination port number, and whether the extracted payload type number matches the payload type number to be evaluated (step S103).
  • the audio bit rate calculation unit 10 selects the extracted IP packet.
  • the audio packet is to be evaluated, and the process proceeds to step S104. If at least one of the source IP address, the destination IP address, the start port number, the destination port number, and the payload type number does not match, the process proceeds to step S105.
  • step S104 the audio bit rate calculation unit 10 measures the data amount D (kb) of the audio packet, and adds the measured data amount D to the audio data amount D a (kb) that is a cumulative value.
  • step S104 determines whether there is an unchecked IP packet in the IP packet stream (step S105). ). When there is an unchecked IP packet, the process returns to step S102, and when there is no unchecked IP packet, the process proceeds to step S106. In this way, the processes of steps S102 to S105 are repeated until all the IP packets in the IP packet stream are checked.
  • the audio bit rate calculation unit 10 calculates the audio bit rate A by dividing the audio data amount D a (kb) by the time T ′ as in the following equation (step S106).
  • A D a / T ′ (1)
  • the process of the audio bit rate calculation part 10 is complete
  • an audio packet loss frequency L a first as three intermediate parameters, obtains an IP packet loss frequency L, the average burst length B, and the ratio P a of the number of audio packets to the total IP packet count.
  • the IP packet loss frequency and average burst length calculation unit 31 calculates the IP packet loss frequency L and the average burst length B (step S2 in FIG. 8).
  • FIG. 10 is a flowchart showing a method of calculating the IP packet loss frequency L and the average burst length B by the IP packet loss frequency L and the average burst length calculation unit 31.
  • the IP packet loss count and average burst length calculation unit 31 acquires an IP packet stream for T seconds (step S200), and arranges the order of the IP packets based on the sequence number in the RTP header of each IP packet of the IP packet stream. Change (step S201). Subsequently, the IP packet loss count and average burst length calculation unit 31 acquires the sequence number in the RTP header of each IP packet (step S202).
  • the IP packet loss count and average burst length calculation unit 31 compares the sequence number S s of the first RTP packet acquired in step S202 with the sequence number S l of the last RTP packet, and the first sequence number S s is the last determine if it is greater than the sequence number S l (step S203).
  • the IP packet loss frequency and average burst length calculation unit 31 determines that all Xs satisfying S s ⁇ X ⁇ S 1 Among them, numbers X 1 , X 2 ,..., X k that did not exist as the sequence numbers acquired in step S202 are extracted (step S204).
  • the IP packet loss frequency and average burst length calculation unit 31 a sequence number X 1, X 2 was the missing ..., with obtaining the lost IP packet count k is a total number of X k, a sequence number X 1 , X 2 ,..., X k, and the number of IP packet losses is calculated based on the continuity, and the calculated number of times is defined as the number of IP packet losses L in T seconds (step S205).
  • the IP packet loss frequency L when there are consecutive missing sequence numbers, the loss of the IP packet at the location where the sequence numbers are continued is counted as one time.
  • the IP packet loss frequency and average burst length calculation unit 31 determines that 0 ⁇ X ⁇ S l or S s ⁇ X when the first sequence number S s is greater than the last sequence number S l (determination YES in step S203). Among all Xs satisfying ⁇ 65535, the numbers X 1 , X 2 ,..., X k that did not exist as the sequence numbers acquired in step S202 are extracted (step S206).
  • the IP packet loss frequency and average burst length calculation unit 31 a sequence number X 1, X 2 was the missing ..., with obtaining the lost IP packet count k is a total number of X k, a sequence number X 1 , X 2 ,..., X k, and the number of IP packet losses is calculated based on the continuity of X k , and the calculated number of times is set as the IP packet loss count L in T seconds (step S207).
  • the IP packet loss count and average burst length calculation unit 31 includes both 0 and 65535 in the sequence numbers X 1 , X 2 ,..., X k extracted in step S206. Whether or not (step S208). IP packet loss frequency and average burst length calculation unit 31, a sequence number X 1, X 2, ⁇ ⁇ ⁇ , if 0 and 65535 in the X k is present both proceeds to step S209, among the 0 and 65535 When at least one does not exist, it progresses to step S210.
  • IP packet loss frequency and average burst length calculation unit 31 if the sequence number X 1, X 2, ⁇ ⁇ ⁇ , 0 and 65535 in the X k is both present, loss and sequence number containing the sequence number 0 65535 Therefore, the value obtained by subtracting 1 from the IP packet loss count L calculated in step S207 is set as the final IP packet loss count L (step S209).
  • the value calculated in step S207 is determined as the IP packet loss count L as it is.
  • the IP packet loss count and average burst length calculation unit 31 calculates the average burst length B by dividing the number of lost IP packets k by the IP packet loss count L as in the following equation (step S210).
  • B k / L (2)
  • Audio packet count ratio calculation unit 30 calculates the ratio P a of the number of audio packets to the total IP packet count (Fig. 8 step S3).
  • Figure 11 is a flow chart illustrating a method of calculating the ratio P a of the number of audio packets by the audio packet count ratio calculation unit 30.
  • the audio packet number ratio calculation unit 30 acquires the IP packet stream for T ′ seconds (step S300), and rearranges the order of the IP packets based on the sequence number in the RTP header of each IP packet of the IP packet stream. (Step S301).
  • step S303 the audio bit rate calculation unit 10 extracts the source IP address, the destination IP address, the start point port number, the destination port number, and the payload type number extracted from the IP packet if they match the values to be evaluated.
  • the determined IP packet is set as an audio packet to be evaluated, and the process proceeds to step S304. If at least one of the transmission source IP address, the destination IP address, the start port number, the destination port number, and the payload type number does not match, the process proceeds to step S305.
  • step S304 the audio packet count ratio calculation unit 30 adds 1 to the audio packet count N a.
  • step S305 the audio packet number ratio calculation unit 30 adds 1 to the total number of IP packets N of the IP packet stream.
  • the audio packet number ratio calculation unit 30 determines whether there is an unchecked IP packet in the IP packet stream (step S306). If there is an unchecked IP packet, the process returns to step S302, and if there is no unchecked IP packet, the process proceeds to step S307. In this way, the processes in steps S302 to S306 are repeated until all the IP packets in the IP packet stream are checked.
  • the audio packet number ratio calculation unit 30 divides the audio packet number N a by the total IP packet number N as shown in the following equation, and the ratio P a of the audio packet number N a to the total IP packet number N Is calculated (step S307).
  • P a N a / N (3)
  • the processing of the audio packet number ratio calculation unit 30 ends.
  • Audio packet loss frequency calculation unit 11 above manner calculated IP packet loss frequency L, based on the ratio P a of the audio packet count N a to the average burst length B and the total IP packet count N, the audio packet loss frequency counting L a (FIG. 8 step S4).
  • Figure 12 is a block diagram showing a configuration example of an audio packet loss frequency calculation unit 11
  • FIG. 13 is a flowchart showing a method of calculating the audio packet loss frequency L a by the audio packet loss frequency calculation unit 11.
  • Audio packet loss frequency calculation unit 11 by multiplying the ratio P a of the audio packet count N a to the average burst length B and the total IP packet count N, the expected value of the number of audio packets lost by an IP packet loss of one time having a loss audio packet count expected value calculation unit 110 which calculates to, the audio packet loss frequency determination unit 111 for determining the audio packet loss frequency L a from the expected value and the IP packet loss frequency L of this number of audio packets.
  • the audio packet loss frequency calculation unit 11 cannot determine what type of data is stored in the payload of the lost IP packet. Therefore, the audio packet loss frequency calculation unit 11, an average burst length B, based on the ratio P a of the audio packet count N a to the total IP packet count N, the expected number of audio packets lost by an IP packet loss of one time
  • the average audio burst length B a and the average number of audio packets P n storing one frame of audio data are calculated as two intermediate parameters.
  • Average audio burst length calculation unit 32 calculates the average audio burst length B a (FIG. 8 step S5).
  • Figure 14 is a flowchart showing a method of calculating the average audio burst length B a by the average audio burst length calculation unit 32.
  • Steps S500, S501, S502, and S504 are the same as steps S400, S401, S402, and S404 in FIG.
  • the average audio packet number calculation unit 33 calculates the average number of audio packets P n in which one frame of audio data is stored (step S6 in FIG. 8).
  • FIG. 15 is a flowchart showing a method of calculating the average audio packet number P n by the average audio packet number calculating unit 33.
  • the average audio packet number calculation unit 33 acquires the IP packet stream for T ′ seconds (step S600), and rearranges the order of the IP packets based on the sequence number in the RTP header of each IP packet of the IP packet stream. (Step S601).
  • steps S602, S603, and S604 are the same as steps S302, S303, and S304 in FIG. 1 is added to the audio packet count N a in step S604, the average audio packet count calculation unit 33, the marker bit of the RTP header contained in the audio packet extracted in step S603 determines whether 1 (step S605) .
  • the average audio packet number calculation unit 33 adds 1 to the frame number N m (step S606).
  • step S606 when the process of step S606 ends, or when the determination is NO in steps S603 and S605, the average audio packet number calculation unit 33 adds 1 to the total number of IP packets N in the IP packet stream (step S603). S607).
  • the average audio packet number calculation unit 33 determines whether there is an unchecked IP packet in the IP packet stream (step S608). If there is an unchecked IP packet, the process returns to step S602, and if there is no unchecked IP packet, the process proceeds to step S609. In this way, the processes in steps S602 to S608 are repeated until the check for all IP packets in the IP packet stream is completed.
  • the average influence time calculation unit 12 calculates the average influence time t based on the average audio burst length B a calculated as described above and the average number of audio packets P n in which one frame of audio data is stored (FIG. 8). Step S7).
  • FIG. 16 is a block diagram illustrating a configuration example of the average influence time calculation unit 12, and
  • FIG. 17 is a flowchart illustrating a method of calculating the average influence time t by the average influence time calculation unit 12.
  • the average influence time calculation unit 12 calculates the number of frames in which the loss of one audio packet affects the quality from the average audio burst length B a and the average number of audio packets P n in which one frame of audio data is stored.
  • a number expectation value calculation unit 120 and an average influence time determination unit 121 that obtains an average influence time by multiplying the number of frames by the frame length.
  • the average influence time calculation unit 12 calculates an expected value N f of the number of frames affected by one audio packet loss by dividing the average audio burst length B a by the average number of audio packets P n (Ste S700). Subsequently, the average influence time calculation unit 12 determines whether or not the number of frames N f is smaller than 1 (step S701).
  • Average influence time calculation unit 12 if N f ⁇ 1, as an audio packet loss of one time influences the N f frames (step S702), multiplied by the known frame length F in frame number N f The value is set as an average influence time t of one loss (step S703).
  • the encoded audio quality value database 20 in the quality estimation unit 2 stores in advance encoded audio quality values Ie representing subjective audio quality corresponding to the audio bit rate and sampling rate.
  • the encoded audio quality value Ie is derived in advance by a subjective quality evaluation experiment and set in the encoded audio quality value database 20.
  • the audio data is encoded using the codec used in the stream type multimedia communication service to be evaluated, the audio data is decoded and reproduced, and the subject evaluates the reproduced voice.
  • An encoded audio quality value Ie is determined.
  • Such subjective quality evaluation experiments are performed on audio data of various audio bit rates and sampling rates.
  • DMOS Difference Mean Opinion Score
  • the length of the audio data used in the subjective quality evaluation experiment at this time is made equal to T. The larger the number of subjects and data, the better.
  • the encoded audio quality value database 20 estimates a subjective quality evaluation value by using the audio bit rate A value input from the audio bit rate calculation unit 10 and the encoded audio quality value Ie corresponding to the known sampling rate of the audio to be evaluated.
  • the data is output to the unit 22 (step S8 in FIG. 8).
  • the encoded audio quality value database 20 is the audio bit rate closest to the value A among the audio bit rates stored in the database.
  • the encoded audio quality value Ie is output to the subjective quality evaluation value estimation unit 22.
  • FIG. 18 is a block diagram illustrating a configuration example of the subjective quality evaluation value estimation unit 22, and FIG. 19 is a flowchart illustrating a subjective quality evaluation value estimation method by the subjective quality evaluation value estimation unit 22.
  • the subjective quality evaluation value estimator 22 uses a reference value determined in advance for the average influence time as the reference influence time, and for this loss of audio packet when the influence on the quality is the average influence time length, A conversion unit that regards the average influence time t calculated by the average influence time calculation unit 12 as the number of loss times, with the number of audio packet losses when the reference influence time length giving the same quality degradation is regarded as the number of loss times with respect to the average influence time. It has a 220, and a subjective quality assessment value calculation unit 221 which calculates the subjective quality assessment value based on the loss frequency regarded as encoded audio quality value Ie and audio packet loss frequency L a.
  • the subjective quality evaluation value estimation unit 22 calculates the encoded audio quality value Ie input from the encoded audio quality value database 20, the audio packet loss count L a input from the audio packet loss count calculation unit 11, and the average influence time calculation. Based on the average influence time t input from the unit 12, the subjective quality evaluation value Q is calculated as in the following equation (step S10 in FIG. 8).
  • Q (Ie-1) ((1-n 1 ) e (-LaV / n2) + n 1 e (-LaV / n3) ) (7)
  • V (t / n 4 ) n5 (8)
  • V represents the number of deemed losses in the average influence time t.
  • the conversion unit 220 calculates the deemed loss frequency V using equation (8) (S800), and the subjective quality evaluation value calculation unit 221 calculates the subjective quality evaluation value Q using equation (7) (step S801).
  • Expression (7) corresponds to the above relational expression fa
  • expression (8) corresponds to the above relational expression fb.
  • Formula (7) and Formula (8) are examples, and are not limited thereto.
  • the coefficients n 1 , n 2 and n 3 in the equation (7) and the coefficients n 4 and n 5 in the equation (8) are calculated. It is necessary to obtain from the coefficient database 21 in advance.
  • coefficients n 1 , n 2 , n 3 , n 4 , and n 5 for each codec are stored in advance.
  • the coefficient database 21 supplies coefficients n 1 , n 2 , n 3 , n 4 , and n 5 corresponding to known codecs used in the stream type multimedia communication service to be evaluated to the subjective quality evaluation value estimation unit 22.
  • Output (step S9 in FIG. 8). The method for deriving each coefficient is as follows.
  • the user of the audio quality estimation apparatus sets a reference value t ′ for the average influence time, and creates audio data having the reference influence time t ′. Then, this audio data is reproduced, and the subjective quality evaluation value Q is determined by evaluating the reproduced voice by the subject.
  • Such subjective quality evaluation experiments are performed on audio data with various audio packet loss times, and a subjective quality evaluation value Q is obtained for each audio packet loss frequency. Further, the same subjective quality evaluation experiment is performed on the lossless audio data having the reference influence time t ′ to determine the encoded audio quality value Ie.
  • N 2 , n 3 are derived by nonlinear least squares fitting.
  • the user creates audio data having an average influence time t ′′ other than the reference influence time t ′ and the number of audio packet losses is one. Then, the audio data is reproduced and the subject is reproduced.
  • the subjective quality evaluation value Q is determined by evaluating the voice, and the user calculates the number of losses V when the subjective quality evaluation value Q is obtained using the equation (7), and the calculated value is the average influence time t. “Deemed loss count V” is used. Such subjective quality evaluation experiment is performed on audio data having various average influence times t ”.
  • n 4 is derived by a non-linear least square fit, and the coefficients n 1 , n 2 , n 3 , n 4 , and n 5 can be derived as described above.
  • the encoded audio quality values Ie, Q, and the subject are encoded audio quality values. It is desirable to be the same as when creating the database 20.
  • the subjective quality estimation corresponding to any packet loss pattern is performed by dividing the packet loss into the number of times and the magnitude of the effect of 1 loss, and further estimating the effect of 1 loss from the time length. Can do.
  • FIG. 20 is a block diagram showing the configuration of an audio quality estimation apparatus according to the second embodiment of the present invention.
  • the same reference numerals are given to the same configurations as those in FIGS.
  • the audio quality estimation device includes a parameter deriving unit 1a, a quality estimating unit 2a, and an intermediate parameter deriving unit 3a.
  • the parameter deriving unit 1a includes an audio bit rate calculating unit 10, an audio packet loss frequency calculating unit 11, and an average audio burst length calculating unit 32.
  • the intermediate parameter derivation unit 3 a includes an audio packet number ratio calculation unit 30 and an IP packet loss count and average burst length calculation unit 31.
  • the quality estimation unit 2a includes an encoded audio quality value database 20, a coefficient database 21, and a subjective quality evaluation value estimation unit 22a.
  • This embodiment instead of the average influence time calculation unit 12 of the first embodiment, the average of the provided audio burst length calculation unit 32, audio packet loss frequency L a and the average audio burst length subjective quality assessment value based on B a Is calculated.
  • FIG. 22 is a block diagram showing a configuration example of the subjective quality evaluation value estimation unit 22a
  • FIG. 23 is a flowchart showing a subjective quality evaluation value estimation method by the subjective quality evaluation value estimation unit 22a.
  • the subjective quality evaluation value estimation unit 22a sets a reference value determined in advance for the average audio burst length as the reference audio burst length, and for this one audio packet loss when the influence on the quality is the average audio burst length, the audio packet loss frequency at the time of the reference audio burst length which gives loss comparable quality degradation as loss frequency deemed to the average audio burst length, loss considers an average audio burst length B a calculated by the average audio burst length calculation unit 32 having a conversion unit 220a that converts the number V, and the subjective quality assessment value calculation unit 221a for calculating the subjective quality assessment value Q based on the loss frequency V regarded as encoded audio quality value Ie and audio packet loss frequency L a.
  • the subjective quality evaluation value estimator 22a includes an encoded audio quality value Ie input from the encoded audio quality value database 20, coefficients n 1 , n 2 , n 3 , n 4 , n 5 input from the coefficient database 21, Based on the audio packet loss frequency L a input from the audio packet loss frequency calculation unit 11 and the average audio burst length B a input from the average audio burst length calculation unit 32, the subjective quality evaluation value Q is expressed as follows: Is calculated (step S10a in FIG. 21).
  • Q (Ie-1) ((1-n 1 ) e (-LaV / n2) + n 1 e (-LaV / n3) ) (9)
  • V (B a / n 4 ) n5 (10)
  • the conversion unit 220a calculates the number of deemed losses V using equation (10) (S900), and the subjective quality evaluation value calculation unit 221a calculates the subjective quality evaluation value Q using equation (9) (step S901).
  • the average influence time described in the above principle and the first embodiment may be replaced with the average audio burst length, and the reference influence time may be replaced with the reference audio burst length.
  • the same effect as that of the first embodiment can be obtained.
  • the audio quality estimation apparatus can be realized by a computer having a CPU, a storage device, and an external interface, and a program for controlling these hardware resources.
  • an audio quality estimation program for realizing the audio quality estimation method of the present invention is provided in a state recorded in a recording medium such as a flexible disk, a CD-ROM, a DVD-ROM, or a memory card.
  • the CPU writes the program read from the recording medium to the storage device, and executes the processes described in the first and second embodiments according to the program.
  • the audio quality estimation apparatus is described as one apparatus, but the present invention is not limited to this.
  • the parameter deriving units 1 and 1a and the intermediate parameter deriving units 3 and 3a are provided in the receiving terminal
  • the quality estimating units 2 and 2a are provided in the management center of the multimedia communication service
  • the parameters calculated in the receiving terminal are You may make it send to the quality estimation part 2 and 2a of a management center.
  • the present invention can be applied to a technique for estimating the subjective quality of audio experienced by a user in a multimedia communication service.

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

 オーディオ品質推定装置は、受信したIPパケットの情報に基づいて、単独または連続して発生したIPパケット損失の中に評価対象のオーディオパケットが少なくとも1個存在する場合にそのパケット損失を連続長の長さによらずに1回として数えるオーディオパケット損失回数を求めるオーディオパケット損失回数算出部(11)と、受信したIPパケットの情報に基づいて、オーディオパケット損失回数が1回のときにオーディオ品質に影響が及ぶ平均時間である平均影響時間を算出する平均影響時間算出部(12)と、オーディオパケット損失回数と平均影響時間に基づいて主観品質評価値を求める主観品質評価値推定部(22)とを備える。

Description

オーディオ品質推定方法、オーディオ品質推定装置およびプログラム
 本発明は、ストリーム型マルチメディア通信サービスにおいてオーディオの主観品質を推定する技術に関するものであり、特にマルチメディア通信サービスのオーディオ品質設計・管理技術に関する。
 ストリーム型マルチメディア通信サービスを提供する上で、インサービス品質管理やユーザクレ-ム対応の観点から、通信サービス提供中にユーザが体感するオーディオ品質を測定することが重要である。最も正確にユーザ体感品質を測定する方法は、実際に被験者に体感品質を評価してもらう主観品質評価法であるが、提供中のサービスの品質を測定することはできない。そのため、客観的にユーザ体感品質を測定する技術の開発が望まれる。
 客観品質評価法はいくつかのカテゴリに分類される。パラメトリックモデルは、品質要因を入力とし、品質要因とユーザ体感品質との間の関係に基づきユーザ体感品質を推定するモデルであり、サービスの品質設計に適している。パラメトリックパケットレイヤモデルは、パラメトリックモデルの入力として与える品質要因の一部を、送受信側のパケットヘッダ情報に基づき測定するモデルであり、サービス提供中のユーザ体感品質を測定するのに適している。国際標準化機関ITU-T(International Telecommunication Union Telecommunication Standardization Sector)が勧告したP.564では、電話帯域あるいは広帯域電話に対するパケットレイヤモデルに対する基準が記載されている(文献「“Conformance testing for narrow-band voice over IP transmission quality assessment models ”,ITU-T Recommendation P.564,July 2006」参照)。
 従来の客観品質評価法では、1つのパケットに格納するデータの時間長が固定かつ単一メディアであるサービスを対象としている。しかしながら、マルチメディア通信サービスにおいて利用されるオーディオデータでは、1パケットに格納されるデータ量(時間長)が符号化方式によって一定ではなく、さらにパケットがオーディオ以外のメディアを含んでいる場合もあるため、従来のパラメトリックパケットレイヤモデルではオーディオの品質を適切に推定することができないという問題点があった。このように、従来の客観品質評価法では、マルチメディア通信サービスにおいてオーディオの主観品質を推定することは不可能であった。
 本発明は、上記課題を解決するためになされたもので、マルチメディア通信サービスにおいてオーディオの主観品質を適切に推定することができるオーディオ品質推定方法、オーディオ品質推定装置およびプログラムを提供することを目的とする。
 本発明は、オーディオデータを含むIPパケットであるオーディオパケットとオーディオデータを含まないIPパケットとが混在して伝送されるマルチメディア通信サ-ビスのオーディオ品質推定方法であって、受信したIPパケットの情報に基づいて、単独または連続して発生したIPパケット損失の中に評価対象のオーディオパケットが少なくとも1個存在する場合にそのパケット損失を連続長の長さによらずに1回として数えるオーディオパケット損失回数を求めるオーディオパケット損失回数算出ステップと、受信したIPパケットの情報に基づいて、オーディオパケット損失回数が1回のときにオーディオ品質に影響が及ぶ平均時間である平均影響時間、または1回のオーディオパケット損失に含まれるオーディオパケットの平均個数である平均オーディオバースト長を算出する平均影響時間または平均オーディオバースト長算出ステップと、前記オーディオパケット損失回数と、平均影響時間または平均オーディオバースト長とに基づいて主観品質評価値を求める主観品質評価値推定ステップとを備えることを特徴とするものである。
 また、本発明のオーディオ品質推定装置は、受信したIPパケットの情報に基づいて、単独または連続して発生したIPパケット損失の中に評価対象のオーディオパケットが少なくとも1個存在する場合にそのパケット損失を連続長の長さによらずに1回として数えるオーディオパケット損失回数を求めるオーディオパケット損失回数算出手段と、受信したIPパケットの情報に基づいて、オーディオパケット損失回数が1回のときにオーディオ品質に影響が及ぶ平均時間である平均影響時間、または1回のオーディオパケット損失に含まれるオーディオパケットの平均個数である平均オーディオバースト長を算出する平均影響時間または平均オーディオバースト長算出手段と、前記オーディオパケット損失回数と、平均影響時間または平均オーディオバースト長とに基づいて主観品質評価値を求める主観品質評価値推定手段とを備えることを特徴とするものである。
 また、本発明のオーディオ品質推定プログラムは、受信したIPパケットの情報に基づいて、単独または連続して発生したIPパケット損失の中に評価対象のオーディオパケットが少なくとも1個存在する場合にそのパケット損失を連続長の長さによらずに1回として数えるオーディオパケット損失回数を求めるオーディオパケット損失回数算出ステップと、受信したIPパケットの情報に基づいて、オーディオパケット損失回数が1回のときにオーディオ品質に影響が及ぶ平均時間である平均影響時間、または1回のオーディオパケット損失に含まれるオーディオパケットの平均個数である平均オーディオバースト長を算出する平均影響時間または平均オーディオバースト長算出ステップと、前記オーディオパケット損失回数と、平均影響時間または平均オーディオバースト長とに基づいて主観品質評価値を求める主観品質評価値推定ステップとを、コンピュータに実行させることを特徴とするものである。
 以上説明したように、本発明によれば、オーディオパケット損失回数を求めるオーディオパケット損失回数算出ステップと、平均影響時間または平均オーディオバースト長を算出する平均影響時間または平均オーディオバースト長算出ステップと、オーディオパケット損失回数と、平均影響時間または平均オーディオバースト長とに基づいて主観品質評価値を求める主観品質評価値推定ステップとを備えることにより、マルチメディア通信サービスにおいて受信側のオーディオの適切な主観品質をインサービスで測定することができる。また、本発明では、受信側においていくつかの品質パラメータを算出することにより、正確な主観品質評価値をインサービスで測定することができる。これにより、本発明では、品質管理やクレーム対応において必要な情報を、受信側からタイムリーかつ容易に入手することが可能となる。
図1は、本発明の原理を表すオーディオ品質推定装置の構成を示すブロック図である。 図2は、オーディオパケット損失回数と平均影響時間を説明するための図である。 図3は、オーディオパケット損失回数とユーザ体感品質との関係を求める主観品質評価実験に用いるIPパケットを示す図である。 図4は、オーディオパケット損失回数とユーザ体感品質との関係の1例を示す図である。 図5は、基準影響時間長以外の平均影響時間長のときの1回のオーディオパケット損失を、この損失と同等の品質劣化を与える基準影響時間長のときのオーディオパケット損失回数に変換する方法を説明するための図である。 図6は、平均影響時間とみなし損失回数との関係の1例を示す図である。 図7は、本発明の第1実施例に係るオーディオ品質推定装置の構成を示すブロック図である。 図8は、本発明の第1実施例に係るオーディオ品質推定装置の動作を示すフローチャートである。 図9は、本発明の第1実施例においてオーディオビットレート算出部によるオーディオビットレートの算出方法を示すフローチャートである。 図10は、本発明の第1実施例においてIPパケット損失回数および平均バースト長算出部によるIPパケット損失回数と平均バースト長の算出方法を示すフローチャートである。 図11は、本発明の第1実施例においてオーディオパケット数割合算出部によるオーディオパケット数の割合の算出方法を示すフローチャートである。 図12は、本発明の第1実施例におけるオーディオパケット損失回数算出部の構成例を示すブロック図である。 図13は、本発明の第1実施例においてオーディオパケット損失回数算出部によるオーディオパケット損失回数の算出方法を示すフローチャートである。 図14は、本発明の第1実施例において平均オーディオバースト長算出部による平均オーディオバースト長の算出方法を示すフローチャートである。 図15は、本発明の第1実施例において平均オーディオパケット数算出部による平均オーディオパケット数の算出方法を示すフローチャートである。 図16は、本発明の第1実施例における平均影響時間算出部の構成例を示すブロック図である。 図17は、本発明の第1実施例において平均影響時間算出部による平均影響時間の算出方法を示すフローチャートである。 図18は、本発明の第1実施例における主観品質評価値推定部の構成例を示すブロック図である。 図19は、本発明の第1実施例において主観品質評価値推定部による主観品質評価値推定方法を示すフローチャートである。 図20は、本発明の第2実施例に係るオーディオ品質推定装置の構成を示すブロック図である。 図21は、本発明の第2実施例に係るオーディオ品質推定装置の動作を示すフローチャートである。 図22は、本発明の第2実施例における主観品質評価値推定部の構成例を示すブロック図である。 図23は、本発明の第2実施例において主観品質評価値推定部による主観品質評価値推定方法を示すフローチャートである。
[発明の原理]
 本発明は、上記課題を解決するために、マルチメディア通信サービスにおけるオーディオ品質を推定するパラメトリックモデルを導出するとともに、オーディオビットレート、パケット損失回数、平均バースト長など、インサービスにおいて変動する入力パラメータに対しては、受信側のパケットヘッダ情報に基づき、前記入力パラメータを算出するようなパラメトリックパケットレイヤモデルを提案する。
 ここで、マルチメディア通信サービスとは、オーディオデータを含むIPパケットであるオーディオパケットとオーディオデータを含まないIPパケットとを混在して伝送する通信サービスである。マルチメディア通信サービスでは、これらのパケットがIP網を介して伝送される。
 図1は本発明の原理を表すオーディオ品質推定装置の構成を示すブロック図である。図1のオーディオ品質推定装置は、入力パラメータを導出するパラメータ導出部1と、入力パラメータに基づいてオーディオの主観品質評価値を算出する品質推定部2とから構成される。
 パラメータ導出部1は、図示しないIP網から受信したIPパケットの情報に基づいてオーディオビットレートを算出するオーディオビットレート算出部10と、IP網から受信したIPパケットの情報に基づいてオーディオパケット損失回数を数えるオーディオパケット損失回数算出部11と、IP網から受信したIPパケットの情報に基づいて平均影響時間を算出する平均影響時間算出部12とを有する。
 品質推定部2は、コーデックによる符号化によって品質が劣化したオーディオの主観品質を表す符号化オーディオ品質値があらかじめ蓄積された符号化オーディオ品質値データベース20と、主観品質評価値算出のための係数があらかじめ蓄積された係数データベース21と、オーディオパケット損失回数と平均影響時間に基づいて主観品質評価値を算出する主観品質評価値推定部22とを有する。
 本オーディオ品質推定装置では、符号化による歪みおよびパケット損失による劣化について考慮する。符号化歪みにより品質が劣化したオーディオの品質測定は、各オーディオビットレート(kbps)およびサンプリングレート(kHz)における主観品質評価値を主観品質評価実験により測定することで主観品質評価値のデータベースである符号化オーディオ品質値データベース20を作成し、この符号化オーディオ品質値データベース20を使用する。
 パケット損失により品質劣化したオーディオの品質測定は、以下のようにして測定する。始めに、パケット損失をオーディオパケット損失回数Laおよび1損失の平均影響時間t(ms)に分ける。図2はオーディオパケット損失回数Laと平均影響時間tを説明するための図である。図2の(A)はIPパケット化される前のオーディオデータを示し、200はフレームを示す。ここでは、1フレームの長さを100msとする。
 図2の(B)はオーディオデータやその他のデータが格納されたIPパケットを示している。201,202はオーディオデータが格納されたオーディオパケット、203はオーディオ以外のデータが格納されたIPパケットである。図2の(B)の例では、1フレームのオーディオデータが2つに分割され、IPパケット201,202に格納される。ここで、図2の(B)の204~207で示す損失がIPパケットに発生したとする。損失204はIPパケットが連続して8個損失した場合を示し、損失205はIPパケットが連続して2個損失した場合を示し、損失206,207はIPパケットが1個損失した場合を示している。
 IPパケットの単位で損失を数えるとIPパケット損失回数は4回であり、損失IPパケット数は12個である。損失IPパケット数をIPパケット損失回数で割った平均バースト長は、12/4=3となる。
 一方、オーディオパケット損失回数Laとは、単独または連続して発生したIPパケット損失の中に評価対象のオーディオパケットが少なくとも1個存在する場合にそのパケット損失を連続長の長さによらずに1回として数えるものである。損失207はオーディオ以外のデータを含むIPパケットの損失なので、図2の(C)に示すようにオーディオパケット損失回数の算出対象となるのは、損失204~206である。したがって、オーディオパケット損失回数は3回となる。
 また、平均影響時間tとは、オーディオパケット損失回数が1回のときにオーディオ品質に影響が及ぶ平均時間である。損失204では2フレーム分のオーディオデータが損失し、損失205,206ではそれぞれ1フレーム分のオーディオデータが損失している。損失により影響を受けた合計のフレーム数は4フレームであるので、3回の損失により影響を受ける平均影響フレーム数は4/3=1.333・・・となる。平均影響時間は、この平均影響フレーム数にフレーム長を掛けた値であり、1.333・・・×100(ms)=133.333・・・(ms)となる。
 次に、オーディオ品質推定装置のユーザは、オーディオパケット損失回数と平均影響時間から主観品質評価値を推定するモデル(品質推定関数)を予め導出する。
 まず、平均影響時間について基準値t’(ms)を設定し、平均影響時間を基準影響時間t’(ms)に固定する。具体的には、1フレーム長をt’(ms)とし、図3に示すように、1フレーム分のオーディオデータが失われるパケット損失300が発生し、かつこのパケット損失300が1フレーム分よりも大きくならないようにしたIPパケットストリームを用意する。この場合、平均影響フレーム数は1となるので、平均影響時間はt’(ms)となる。このIPパケットストリームで伝送されるオーディオデータを再生して、被験者が再生された音声を評価してユーザ体感品質を決める主観品質評価実験を行う。
 このような主観品質評価実験を様々なオーディオパケット損失回数のIPパケットについて行い、図4に示すようなオーディオパケット損失回数とユーザ体感品質との関係を得る。そして、ユーザは、図4に示した関係からオーディオパケット損失回数とユーザ体感品質との関係式faを導出する。
 次に、基準影響時間t’以外の平均影響時間のIPパケットストリームについて主観品質評価実験を行う。ここでは、平均影響時間を基準値t’(ms)以外のt”(ms)とし、オーディオパケット損失回数を1回としたIPパケットストリームについて上記と同様に主観品質評価実験を行う。このとき得られたユーザ体感品質をQ”とする。ユーザは、平均影響時間を基準値t’(ms)としたときにユーザ体感品質Q”が得られるオーディオパケット損失回数を上記関係式faに基づいて算出する(図5)。このとき算出したオーディオパケット損失回数をみなし損失回数V”とする。
 このような主観品質評価実験とみなし損失回数V”の算出を、様々な平均影響時間t”(ms)のIPパケットストリームについて行い、図6に示すような平均影響時間とみなし損失回数との関係を得る。そして、ユーザは、図6に示した関係から平均影響時間とみなし損失回数との関係式fbを導出する。以上のようにして導出した関係式fa,fbが主観品質評価値推定部22にあらかじめ設定されている。
 オーディオの品質を推定する際には、主観品質評価値推定部22は、平均影響時間算出部12が算出した平均影響時間長tから関係式fbを用いてみなし損失回数Vを算出し、このみなし損失回数Vにオーディオパケット損失回数算出部11が数えたオーディオパケット損失回数Laを乗算した値(V×La)を算出し、求める品質が、基準影響時間t’でかつ損失が(V×La)回発生したときの品質と同等であるとみなして、オーディオパケット損失回数(V×La)から関係式faを用いてオーディオの主観品質評価値Qを算出する。
 本発明のオーディオ品質推定装置では、いくつかの入力パラメータについてはIP網から受信したIPパケットのヘッダ情報から算出することにより、リアルタイムでの品質推定を可能とする。
 オーディオビットレート算出部10は、IP網から受信したIPパケットのヘッダ情報からオーディオに関する情報のデータを測定し、秒単位でのデータ量を算出することにより、オーディオビットレートを算出する。
 オーディオパケット損失回数算出部11は、IP網から受信したIPパケットのヘッダ情報から損失IPパケットを検出し、全データに対するオーディオデータの比率から損失IPパケットのうちオーディオデータが含まれているIPパケットの数を推定する。そして、一定時間内において推定したオーディオデータを含むIPパケットの損失回数を、オーディオパケット損失回数とする。
 同様に、平均影響時間算出部12は、IP網から受信したIPパケットのヘッダ情報から損失IPパケットを検出し、全データに対するオーディオデータの比率から損失IPパケットのうちオーディオデータが含まれているIPパケットの数を推定する。そして、一定時間内において推定したオーディオデータを含むIPパケットの各バースト長の平均を平均オーディオバースト長とする。
[第1実施例]
 以下、本発明の第1実施例について図面を用いて説明する。図7は本発明の第1実施例に係るオーディオ品質推定装置の構成を示すブロック図であり、図1と同様の構成には同一の符号を付してある。
 オーディオ品質推定装置は、パラメータ導出部1と、品質推定部2と、パラメータ導出部1で導出するオーディオパケット損失回数および平均影響時間を求めるための中間パラメータを導出する中間パラメータ導出部3とから構成される。
 中間パラメータ導出部3は、図示しないIP網から受信したIPパケットの情報に基づいて、全IPパケット数に対するオーディオパケット数の割合を算出するオーディオパケット数割合算出部30と、受信したIPパケットの情報に基づいて、単独または連続して発生したIPパケット損失を連続長の長さによらずに1回として数えたIPパケット損失回数、および1回のIPパケット損失に含まれるIPパケットの平均個数である平均バースト長を求めるIPパケット損失回数および平均バースト長算出部31と、平均バースト長と全IPパケット数に対するオーディオパケット数の割合に基づいて、1回のオーディオパケット損失に含まれるオーディオパケットの平均個数である平均オーディオバースト長を求める平均オーディオバースト長算出部32と、受信したIPパケットの情報に基づいて、1フレームのオーディオデータが格納される平均オーディオパケット数を算出する平均オーディオパケット数算出部33とを有する。
 本実施例は、IP/UDP(User Datagram Protocol)/RTP(Real-time Transport Protocol)パケット構造でのデータ伝送を対象としている。図8は本実施例のオーディオ品質推定装置の動作を示すフローチャートである。オーディオ品質推定装置では、始めに各パラメータを求める。
 オーディオビットレート算出部10は、オーディオビットレートAを算出する(ステップS1)。図9はオーディオビットレート算出部10によるオーディオビットレートAの算出方法を示すフローチャートである。まず、オーディオビットレート算出部10は、IPパケットストリームをT’秒間取得し(ステップS100)、このIPパケットストリームの各IPパケットのRTPヘッダ内のシーケンス番号に基づいてIPパケットの順番を並び替える(ステップS101)。
 次に、オーディオビットレート算出部10は、IPパケットストリームからチェックをしていないIPパケットを1つ抽出し、このIPパケットのIPヘッダから送信元IPアドレスおよび宛先IPアドレスを抽出し、IPパケットのUDPヘッダから始点ポート番号および宛先ポート番号を抽出し、IPパケットのRTPヘッダから7ビットのペイロードタイプ番号を抽出する(ステップS102)。
 そして、オーディオビットレート算出部10は、抽出した送信元IPアドレスと宛先IPアドレスが評価対象の送信元IPアドレスと宛先IPアドレスと一致し、抽出した始点ポート番号と宛先ポート番号が評価対象の始点ポート番号と宛先ポート番号と一致し、抽出したペイロードタイプ番号が評価対象のペイロードタイプ番号と一致するかどうかを判定する(ステップS103)。
 オーディオビットレート算出部10は、IPパケットから抽出した送信元IPアドレス、宛先IPアドレス、始点ポート番号、宛先ポート番号およびペイロードタイプ番号の全てが評価対象の値と一致する場合、抽出したIPパケットを評価対象のオーディオパケットとし、ステップS104に進む。また、送信元IPアドレス、宛先IPアドレス、始点ポート番号、宛先ポート番号およびペイロードタイプ番号のうち少なくとも1つが一致しない場合は、ステップS105に進む。
 ステップS104において、オーディオビットレート算出部10は、オーディオパケットのデータ量D(kb)を測定し、この測定したデータ量Dを累計値であるオーディオデータ量Da(kb)に加算する。
 ステップS104が終了した場合、あるいはステップS103において判定NOとなった場合、オーディオビットレート算出部10は、IPパケットストリームの中にチェックをしていないIPパケットが存在するかどうかを判定する(ステップS105)。チェックをしていないIPパケットが存在する場合はステップS102に戻り、チェックをしていないIPパケットが存在しない場合はステップS106に進む。こうして、IPパケットストリームの全てのIPパケットについてチェックが終わるまで、ステップS102~S105の処理が繰り返される。
 チェックの終了後、オーディオビットレート算出部10は、次式のようにオーディオデータ量Da(kb)を時間T’で除算して、オーディオビットレートAを算出する(ステップS106)。
 A=Da/T’                    ・・・(1)
以上で、オーディオビットレート算出部10の処理が終了する。
 次に、オーディオパケット損失回数Laの導出では、まず3つの中間パラメータとして、IPパケット損失回数L、平均バースト長B、および全IPパケット数に対するオーディオパケット数の割合Paを求める。
 IPパケット損失回数および平均バースト長算出部31は、IPパケット損失回数Lと平均バースト長Bを算出する(図8ステップS2)。図10はIPパケット損失回数および平均バースト長算出部31によるIPパケット損失回数Lと平均バースト長Bの算出方法を示すフローチャートである。
 IPパケット損失回数および平均バースト長算出部31は、IPパケットストリームをT秒間取得し(ステップS200)、このIPパケットストリームの各IPパケットのRTPヘッダ内のシーケンス番号に基づいてIPパケットの順番を並び替える(ステップS201)。続いて、IPパケット損失回数および平均バースト長算出部31は、各IPパケットのRTPヘッダ内のシーケンス番号を取得する(ステップS202)。
 IPパケット損失回数および平均バースト長算出部31は、ステップS202で取得した最初のRTPパケットのシーケンス番号Ssと最後のRTPパケットのシーケンス番号Slとを比較し、最初のシーケンス番号Ssが最後のシーケンス番号Slよりも大きいかどうかを判定する(ステップS203)。
 IPパケット損失回数および平均バースト長算出部31は、最初のシーケンス番号Ssが最後のシーケンス番号Slより小さい場合(ステップS203において判定NO)、Ss<X<Slを満たす全てのXの中で、ステップS202で取得したシーケンス番号として存在しなかった番号X1,X2,・・・,Xkを抽出する(ステップS204)。
 そして、IPパケット損失回数および平均バースト長算出部31は、この欠落したシーケンス番号X1,X2,・・・,Xkの累計個数である損失IPパケット数kを求めると共に、シーケンス番号X1,X2,・・・,Xkの連続性に基づきIPパケット損失回数を算出し、この算出した回数をT秒間におけるIPパケット損失回数Lとする(ステップS205)。IPパケット損失回数Lの算出においては、シーケンス番号の欠落が連続する場合、このシーケンス番号が連続した箇所のIPパケットの損失を1回として数える。
 また、IPパケット損失回数および平均バースト長算出部31は、最初のシーケンス番号Ssが最後のシーケンス番号Slより大きい場合(ステップS203において判定YES)、0≦X<SlまたはSs<X≦65535を満たす全てのXの中で、ステップS202で取得したシーケンス番号として存在しなかった番号X1,X2,・・・,Xkを抽出する(ステップS206)。
 そして、IPパケット損失回数および平均バースト長算出部31は、この欠落したシーケンス番号X1,X2,・・・,Xkの累計個数である損失IPパケット数kを求めると共に、シーケンス番号X1,X2,・・・,Xkの連続性に基づきIPパケット損失回数を算出し、この算出した回数をT秒間におけるIPパケット損失回数Lとする(ステップS207)。
 ステップS207の処理終了後、IPパケット損失回数および平均バースト長算出部31は、ステップS206で抽出したシーケンス番号X1,X2,・・・,Xkの中に0および65535が両方とも存在するかどうかを判定する(ステップS208)。IPパケット損失回数および平均バースト長算出部31は、シーケンス番号X1,X2,・・・,Xkの中に0および65535が両方とも存在する場合はステップS209に進み、0と65535のうち少なくとも一方が存在しない場合はステップS210に進む。
 IPパケット損失回数および平均バースト長算出部31は、シーケンス番号X1,X2,・・・,Xkの中に0および65535が両方とも存在する場合、シーケンス番号0を含む損失とシーケンス番号65535を含む損失とを1回の損失とするため、ステップS207で算出したIPパケット損失回数Lから1減算した値を最終的なIPパケット損失回数Lとする(ステップS209)。シーケンス番号X1,X2,・・・,Xkの中に0と65535のうち少なくとも一方が存在しない場合は、ステップS207で算出した値がそのままIPパケット損失回数Lとして確定される。
 最後に、IPパケット損失回数および平均バースト長算出部31は、次式のように損失IPパケット数kをIPパケット損失回数Lで除算して、平均バースト長Bを算出する(ステップS210)。
 B=k/L                     ・・・(2)
以上で、IPパケット損失回数および平均バースト長算出部31の処理が終了する。
 オーディオパケット数割合算出部30は、全IPパケット数に対するオーディオパケット数の割合Paを算出する(図8ステップS3)。図11はオーディオパケット数割合算出部30によるオーディオパケット数の割合Paの算出方法を示すフローチャートである。
 まず、オーディオパケット数割合算出部30は、IPパケットストリームをT’秒間取得し(ステップS300)、このIPパケットストリームの各IPパケットのRTPヘッダ内のシーケンス番号に基づいてIPパケットの順番を並び替える(ステップS301)。
 ステップS302,S303の処理は、図9のステップS102,S103と同様である。ステップS303において、オーディオビットレート算出部10は、IPパケットから抽出した送信元IPアドレス、宛先IPアドレス、始点ポート番号、宛先ポート番号およびペイロードタイプ番号の全てが評価対象の値と一致する場合、抽出したIPパケットを評価対象のオーディオパケットとし、ステップS304に進む。また、送信元IPアドレス、宛先IPアドレス、始点ポート番号、宛先ポート番号およびペイロードタイプ番号のうち少なくとも1つが一致しない場合は、ステップS305に進む。
 ステップS304において、オーディオパケット数割合算出部30は、オーディオパケット数Naに1を加算する。
 次に、ステップS304の処理が終了した場合、あるいはステップS303において判定NOとなった場合、オーディオパケット数割合算出部30は、IPパケットストリームの全IPパケット数Nに1を加算する(ステップS305)。
 続いて、オーディオパケット数割合算出部30は、IPパケットストリームの中にチェックをしていないIPパケットが存在するかどうかを判定する(ステップS306)。チェックをしていないIPパケットが存在する場合はステップS302に戻り、チェックをしていないIPパケットが存在しない場合はステップS307に進む。こうして、IPパケットストリームの全てのIPパケットについてチェックが終わるまで、ステップS302~S306の処理が繰り返される。
 チェックの終了後、オーディオパケット数割合算出部30は、次式のようにオーディオパケット数Naを全IPパケット数Nで除算して、全IPパケット数Nに対するオーディオパケット数Naの割合Paを算出する(ステップS307)。
 Pa=Na/N                     ・・・(3)
 以上で、オーディオパケット数割合算出部30の処理が終了する。
 オーディオパケット損失回数算出部11は、以上のようにして算出されたIPパケット損失回数L、平均バースト長Bおよび全IPパケット数Nに対するオーディオパケット数Naの割合Paに基づき、オーディオパケット損失回数Laを数える(図8ステップS4)。図12はオーディオパケット損失回数算出部11の構成例を示すブロック図、図13はオーディオパケット損失回数算出部11によるオーディオパケット損失回数Laの算出方法を示すフローチャートである。
 オーディオパケット損失回数算出部11は、平均バースト長Bと全IPパケット数Nに対するオーディオパケット数Naの割合Paとの乗算により、1回のIPパケット損失によって失われるオーディオパケット数の期待値を算出する損失オーディオパケット数期待値算出部110と、このオーディオパケット数の期待値とIPパケット損失回数Lからオーディオパケット損失回数Laを決定するオーディオパケット損失回数決定部111とを有する。
 オーディオパケット損失回数算出部11は、損失したIPパケットのペイロード内にどの種類のデータが格納されていたかを判断できない。そこで、オーディオパケット損失回数算出部11は、平均バースト長Bと、全IPパケット数Nに対するオーディオパケット数Naの割合Paに基づき、1回のIPパケット損失によって失われるオーディオパケットの数の期待値Yを次式により算出する(ステップS400)。
 Y=B×Pa                     ・・・(4)
 続いて、オーディオパケット損失回数算出部11は、期待値Yが1より小さいかどうかを判定する(ステップS401)。オーディオパケット損失回数算出部11は、Y>1であれば、1回のIPパケット損失内に必ずY個のオーディオパケットが含まれているとして(ステップS402)、オーディオパケット損失回数La=Lとする(ステップS403)。
 また、オーディオパケット損失回数算出部11は、ステップS401においてY<1であれば、Y(=B×Pa)の確率で1回のパケット損失内に1つのオーディオパケットが含まれているとする(ステップS404)。この場合、IPパケット損失回数LのうちL×Y個のパケット損失でオーディオパケットが1個損失していることになる。そこで、オーディオパケット損失回数算出部11は、オーディオパケット損失回数La=L×Yとする(ステップS405)。以上で、オーディオパケット損失回数算出部11の処理が終了する。
 次に、平均影響時間tの算出では、まず2つの中間パラメータとして、平均オーディオバースト長Ba、および1フレームのオーディオデータが格納される平均オーディオパケット数Pnを算出する。
 平均オーディオバースト長算出部32は、平均オーディオバースト長Baを算出する(図8ステップS5)。図14は平均オーディオバースト長算出部32による平均オーディオバースト長Baの算出方法を示すフローチャートである。
 ステップS500,S501,S502,S504の処理は、図13のステップS400,S401,S402,S404と同様である。平均オーディオバースト長算出部32は、Y>1であれば、平均オーディオバースト長Ba=Yとし(ステップS503)、Y<1であれば、平均オーディオバースト長Ba=1とする(ステップS505)。以上で、平均オーディオバースト長算出部32の処理が終了する。
 平均オーディオパケット数算出部33は、1フレームのオーディオデータが格納される平均オーディオパケット数Pnを算出する(図8ステップS6)。図15は平均オーディオパケット数算出部33による平均オーディオパケット数Pnの算出方法を示すフローチャートである。
 まず、平均オーディオパケット数算出部33は、IPパケットストリームをT’秒間取得し(ステップS600)、このIPパケットストリームの各IPパケットのRTPヘッダ内のシーケンス番号に基づいてIPパケットの順番を並び替える(ステップS601)。
 ステップS602,S603,S604の処理は、図11のステップS302,S303,S304と同様である。
 ステップS604においてオーディオパケット数Naに1を加算した後、平均オーディオパケット数算出部33は、ステップS603で抽出したオーディオパケットに含まれるRTPヘッダのマーカビットが1かどうかを判定する(ステップS605)。マーカビットの値が1である場合には、当該パケットがオーディオデータのフレームの最後のデータを含むオーディオパケットであることを示している。そこで、平均オーディオパケット数算出部33は、マーカビットが1である場合には、フレーム数Nmに1を加算する(ステップS606)。
 次に、ステップS606の処理が終了した場合、あるいはステップS603,S605において判定NOとなった場合、平均オーディオパケット数算出部33は、IPパケットストリームの全IPパケット数Nに1を加算する(ステップS607)。
 続いて、平均オーディオパケット数算出部33は、IPパケットストリームの中にチェックをしていないIPパケットが存在するかどうかを判定する(ステップS608)。チェックをしていないIPパケットが存在する場合はステップS602に戻り、チェックをしていないIPパケットが存在しない場合はステップS609に進む。こうして、IPパケットストリームの全てのIPパケットについてチェックが終わるまで、ステップS602~S608の処理が繰り返される。
 チェックの終了後、平均オーディオパケット数算出部33は、次式のようにオーディオパケット数Naをフレーム数Nmで除算して、1フレームのオーディオデータが格納される平均オーディオパケット数Pnを算出する(ステップS609)。
 Pn=Na/Nm                     ・・・(5)
以上で、平均オーディオパケット数算出部33の処理が終了する。
 平均影響時間算出部12は、以上のようにして算出された平均オーディオバースト長Baおよび1フレームのオーディオデータが格納される平均オーディオパケット数Pnに基づき平均影響時間tを算出する(図8ステップS7)。図16は平均影響時間算出部12の構成例を示すブロック図、図17は平均影響時間算出部12による平均影響時間tの算出方法を示すフローチャートである。
 平均影響時間算出部12は、平均オーディオバースト長Baと1フレームのオーディオデータが格納される平均オーディオパケット数Pnから1回のオーディオパケット損失が品質に影響を与えるフレーム数を算出する損失フレーム数期待値算出部120と、このフレーム数にフレーム長を乗算することにより平均影響時間を求める平均影響時間決定部121とを有する。
 まず、平均影響時間算出部12は、平均オーディオバースト長Baを平均オーディオパケット数Pnで除算することにより、1回のオーディオパケット損失が影響を与えるフレーム数の期待値Nfを算出する(ステップS700)。続いて、平均影響時間算出部12は、フレーム数Nfが1より小さいかどうかを判定する(ステップS701)。
 平均影響時間算出部12は、Nf≧1であれば、1回のオーディオパケット損失がNf個のフレームに影響するとして(ステップS702)、フレーム数Nfに既知のフレーム長Fを乗算した値を1回の損失の平均影響時間tとする(ステップS703)。
 また、平均影響時間算出部12は、ステップS701においてNf<1であれば、1回のオーディオパケット損失が1つのフレームに影響するとして(ステップS704)、平均影響時間t=Fとする(ステップS705)。1回のオーディオパケット損失により必ず1フレーム以上に対して影響があることから、ステップS704,S705の処理では、フレーム数Nfが次式に示すように必ず1以上となるようにしている。
 Nf=max(Ba/Pn,1)              ・・・(6)
以上で、平均影響時間算出部12の処理が終了する。
 次に、品質推定部2内の符号化オーディオ品質値データベース20には、オーディオビットレートおよびサンプリングレートに対応するオーディオの主観品質を表す符号化オーディオ品質値Ieがあらかじめ蓄積されている。この符号化オーディオ品質値Ieは、あらかじめ主観品質評価実験によって導出され、符号化オーディオ品質値データベース20に設定される。
 具体的には、評価対象のストリーム型マルチメディア通信サ-ビスで使用されるコーデックを用いてオーディオデータを符号化し、このオーディオデータをデコードして再生し、被験者が再生された音声を評価して符号化オーディオ品質値Ieを決める。このような主観品質評価実験を様々なオーディオビットレートおよびサンプリングレートのオーディオデータについて行う。ここでは、符号化オーディオ品質値IeとしてDMOS(Difference Mean Opinion Score)を用いるが、これに限るものではない。また、このときの主観品質評価実験で用いるオーディオデータの長さはTと等しくする。被験者やデータの数は多いほど望ましい。
 符号化オーディオ品質値データベース20は、オーディオビットレート算出部10から入力されたオーディオビットレートAの値および評価対象のオーディオの既知のサンプリングレートに対応する符号化オーディオ品質値Ieを主観品質評価値推定部22へ出力する(図8ステップS8)。ただし、符号化オーディオ品質値データベース20は、入力されたオーディオビットレートAの値がデータベース内に存在しない場合には、データベース内に蓄積されたオーディオビットレートのうち、値Aに最も近いオーディオビットレートのときの符号化オーディオ品質値Ieを主観品質評価値推定部22へ出力する。
 図18は主観品質評価値推定部22の構成例を示すブロック図、図19は主観品質評価値推定部22による主観品質評価値推定方法を示すフローチャートである。
 主観品質評価値推定部22は、平均影響時間についてあらかじめ定められた基準値を基準影響時間とし、品質に及ぼす影響が平均影響時間長のときの1回のオーディオパケット損失に対して、この損失と同等の品質劣化を与える基準影響時間長のときのオーディオパケット損失回数を平均影響時間に対するみなし損失回数として、平均影響時間算出部12で算出された平均影響時間tをみなし損失回数に変換する変換部220と、符号化オーディオ品質値Ieとオーディオパケット損失回数Laとみなし損失回数に基づいて主観品質評価値を算出する主観品質評価値算出部221とを有する。
 主観品質評価値推定部22は、符号化オーディオ品質値データベース20から入力された符号化オーディオ品質値Ie、オーディオパケット損失回数算出部11から入力されたオーディオパケット損失回数La、および平均影響時間算出部12から入力された平均影響時間tに基づいて、次式のように主観品質評価値Qを算出する(図8ステップS10)。
 Q=(Ie-1)((1-n1)e(-LaV/n2)+n1(-LaV/n3))  ・・・(7)
 V=(t/n4n5                   ・・・(8)
 Vは平均影響時間tにおけるみなし損失回数を表す。変換部220は式(8)によりみなし損失回数Vを算出し(S800)、主観品質評価値算出部221は式(7)により主観品質評価値Qを算出する(ステップS801)。式(7)は上記の関係式faに対応するものであり、式(8)は上記の関係式fbに対応するものである。ただし、式(7)、式(8)は1例であって、これに限るものではない。式(7)、式(8)を用いて主観品質評価値Qを算出するには、式(7)における係数n1,n2,n3および式(8)における係数n4,n5をあらかじめ係数データベース21から取得する必要がある。
 係数データベース21には、コーデックごとの係数n1,n2,n3,n4,n5があらかじめ蓄積されている。係数データベース21は、評価対象のストリーム型マルチメディア通信サ-ビスで使用される既知のコーデックに対応する係数n1,n2,n3,n4,n5を主観品質評価値推定部22へ出力する(図8ステップS9)。各係数の導出方法は以下のとおりである。
 始めに、オーディオ品質推定装置のユーザは、平均影響時間の基準値t’を設定し、基準影響時間t’を持つオーディオデータを作成する。そして、このオーディオデータを再生し、被験者が再生された音声を評価して主観品質評価値Qを決める。このような主観品質評価実験を様々なオーディオパケット損失回数のオーディオデータについて行い、オーディオパケット損失回数ごとに主観品質評価値Qを求める。さらに、基準影響時間t’を持つ、損失無しのオーディオデータについて同様の主観品質評価実験を行って符号化オーディオ品質値Ieを決める。そして、ユーザは、みなし損失回数を1(V=1)とし、式(7)においてオーディオパケット損失回数ごとの主観品質評価値Qと符号化オーディオ品質値Ieとの誤差が最小となる係数n1,n2,n3を、非線形最小二乗フィットにより導出する。
 次に、ユーザは、基準影響時間t’以外の平均影響時間t”を持ち、かつオーディオパケット損失回数が1回であるオーディオデータを作成する。そして、このオーディオデータを再生し、被験者が再生された音声を評価して主観品質評価値Qを決める。ユーザは、この主観品質評価値Qが得られるときの損失回数Vを式(7)を用いて算出し、算出した値を平均影響時間t”におけるみなし損失回数V”とする。このような主観品質評価実験を様々な平均影響時間t”のオーディオデータについて行う。そして、ユーザは、平均影響時間t”ごとのみなし損失回数V”と式(8)に平均影響時間t”を代入したときに得られるみなし損失回数Vとの誤差が最小となる係数n4,n5を、非線形最小二乗フィットにより導出する。以上のようにして、係数n1,n2,n3,n4,n5を導出することができる。
 なお、係数n1,n2,n3,n4,n5を導出する主観品質評価実験においては、使用するオーディオデータ、符号化オーディオ品質値Ie,Q、および被験者は、符号化オーディオ品質値データベース20を作成するときと同様であることが望ましい。
 以上に説明した第1実施例によれば、受信側の情報のみからインサービスでの主観品質推定を行うことが可能となる。本実施例では、パケット損失を回数と1損失の影響の大きさに分け、さらに1損失の影響を時間長から推定することにより、どのようなパケット損失パタンにも対応した主観品質推定を行うことができる。
[第2実施例]
 次に、本発明の第2実施例について説明する。図20は本発明の第2実施例に係るオーディオ品質推定装置の構成を示すブロック図であり、図1、図7と同様の構成には同一の符号を付してある。
 オーディオ品質推定装置は、パラメータ導出部1aと、品質推定部2aと、中間パラメータ導出部3aとから構成される。
 パラメータ導出部1aは、オーディオビットレート算出部10と、オーディオパケット損失回数算出部11と、平均オーディオバースト長算出部32とを有する。
 中間パラメータ導出部3aは、オーディオパケット数割合算出部30と、IPパケット損失回数および平均バースト長算出部31とを有する。
 品質推定部2aは、符号化オーディオ品質値データベース20と、係数データベース21と、主観品質評価値推定部22aとを有する。
 本実施例は、第1実施例の平均影響時間算出部12の代わりに、平均オーディオバースト長算出部32を設け、オーディオパケット損失回数Laと平均オーディオバースト長Baに基づいて主観品質評価値を算出するようにしたものである。
 次に、本実施例のオーディオ品質推定装置の動作を図21を参照して説明する。ステップS1~S5,S8,S9の処理は、第1実施例で説明したとおりなので、説明は省略する。
 図22は主観品質評価値推定部22aの構成例を示すブロック図、図23は主観品質評価値推定部22aによる主観品質評価値推定方法を示すフローチャートである。
 主観品質評価値推定部22aは、平均オーディオバースト長についてあらかじめ定められた基準値を基準オーディオバースト長とし、品質に及ぼす影響が平均オーディオバースト長のときの1回のオーディオパケット損失に対して、この損失と同等の品質劣化を与える基準オーディオバースト長のときのオーディオパケット損失回数を平均オーディオバースト長に対するみなし損失回数として、平均オーディオバースト長算出部32で算出された平均オーディオバースト長Baをみなし損失回数Vに変換する変換部220aと、符号化オーディオ品質値Ieとオーディオパケット損失回数Laとみなし損失回数Vに基づいて主観品質評価値Qを算出する主観品質評価値算出部221aとを有する。
 主観品質評価値推定部22aは、符号化オーディオ品質値データベース20から入力された符号化オーディオ品質値Ie、係数データベース21から入力された係数n1,n2,n3,n4,n5、オーディオパケット損失回数算出部11から入力されたオーディオパケット損失回数La、および平均オーディオバースト長算出部32から入力された平均オーディオバースト長Baに基づいて、次式のように主観品質評価値Qを算出する(図21ステップS10a)。
 Q=(Ie-1)((1-n1)e(-LaV/n2)+n1(-LaV/n3)) ・・・(9)
 V=(Ba/n4n5                  ・・・(10)
 変換部220aは式(10)によりみなし損失回数Vを算出し(S900)、主観品質評価値算出部221aは式(9)により主観品質評価値Qを算出する(ステップS901)。なお、上記の原理および第1実施例で記述した平均影響時間に関する説明は、全て本実施例に適用することができる。すなわち、上記の原理および第1実施例で記述した平均影響時間を平均オーディオバースト長に置き換え、基準影響時間を基準オーディオバースト長に置き換えればよい。
 こうして、本実施例においても、第1実施例と同様の効果を得ることができる。
 なお、第1実施例、第2実施例のオーディオ品質推定装置は、CPU、記憶装置および外部とのインタフェースを備えたコンピュータとこれらのハードウェア資源を制御するプログラムによって実現することができる。このようなコンピュータにおいて、本発明のオーディオ品質推定方法を実現させるためのオーディオ品質推定プログラムは、フレキシブルディスク、CD-ROM、DVD-ROM、メモリカードなどの記録媒体に記録された状態で提供される。CPUは、記録媒体から読み込んだプログラムを記憶装置に書き込み、プログラムに従って第1実施例、第2実施例で説明したような処理を実行する。
 また、第1実施例、第2実施例では、オーディオ品質推定装置を1台の装置として説明しているが、これに限るものではない。例えばパラメータ導出部1,1aと中間パラメータ導出部3,3aを受信側の端末に設け、品質推定部2,2aをマルチメディア通信サービスの管理センタに設けて、受信側の端末で算出したパラメータを管理センタの品質推定部2,2aに送るようにしてもよい。
 本発明は、マルチメディア通信サ-ビスにおいてユーザが体感するオーディオの主観品質を推定する技術に適用することができる。

Claims (35)

  1.  オーディオデータを含むIPパケットであるオーディオパケットとオーディオデータを含まないIPパケットとが混在して伝送されるマルチメディア通信サ-ビスのオーディオ品質推定方法であって、
     受信したIPパケットの情報に基づいて、単独または連続して発生したIPパケット損失の中に評価対象のオーディオパケットが少なくとも1個存在する場合にそのパケット損失を連続長の長さによらずに1回として数えるオーディオパケット損失回数を求めるオーディオパケット損失回数算出ステップと、
     受信したIPパケットの情報に基づいて、オーディオパケット損失回数が1回のときにオーディオ品質に影響が及ぶ平均時間である平均影響時間、または1回のオーディオパケット損失に含まれるオーディオパケットの平均個数である平均オーディオバースト長を算出する平均影響時間または平均オーディオバースト長算出ステップと、
     前記オーディオパケット損失回数と、平均影響時間または平均オーディオバースト長とに基づいて主観品質評価値を求める主観品質評価値推定ステップとを備えることを特徴とするオーディオ品質推定方法。
  2.  請求項1記載のオーディオ品質推定方法において、
     さらに、受信したIPパケットの情報に基づいて、単独または連続して発生したIPパケット損失を連続長の長さによらずに1回として数えるIPパケット損失回数を求めるIPパケット損失回数算出ステップと、
     受信したIPパケットの情報に基づいて、前記IPパケット損失回数算出ステップで検出される1回のIPパケット損失に含まれるIPパケットの平均個数である平均バースト長を求める平均バースト長算出ステップと、
     受信したIPパケットの情報に基づいて、全IPパケット数に対するオーディオパケット数の割合を算出するオーディオパケット数割合算出ステップと、
     前記平均バースト長と全IPパケット数に対するオーディオパケット数の割合に基づいて、前記オーディオパケット損失回数算出ステップで検出される1回のオーディオパケット損失に含まれるオーディオパケットの平均個数である平均オーディオバースト長を求める平均オーディオバースト長算出ステップと、
     受信したIPパケットの情報に基づいて、1フレームのオーディオデータが格納される平均オーディオパケット数を算出する平均オーディオパケット数算出ステップとを備え、
     前記オーディオパケット損失回数算出ステップは、前記IPパケット損失回数と平均バースト長と全IPパケット数に対するオーディオパケット数の割合に基づいて前記オーディオパケット損失回数を求め、
     前記平均影響時間または平均オーディオバースト長算出ステップは、フレーム長と前記平均オーディオバースト長と1フレームのオーディオデータが格納される平均オーディオパケット数に基づいて前記平均影響時間を求めることを特徴とするオーディオ品質推定方法。
  3.  請求項1記載のオーディオ品質推定方法において、
     さらに、受信したIPパケットの情報に基づいて、単独または連続して発生したIPパケット損失を連続長の長さによらずに1回として数えるIPパケット損失回数を求めるIPパケット損失回数算出ステップと、
     受信したIPパケットの情報に基づいて、前記IPパケット損失回数算出ステップで検出される1回のIPパケット損失に含まれるIPパケットの平均個数である平均バースト長を求める平均バースト長算出ステップと、
     受信したIPパケットの情報に基づいて、全IPパケット数に対するオーディオパケット数の割合を算出するオーディオパケット数割合算出ステップとを備え、
     前記オーディオパケット損失回数算出ステップは、前記IPパケット損失回数と平均バースト長と全IPパケット数に対するオーディオパケット数の割合に基づいて前記オーディオパケット損失回数を求め、
     前記平均影響時間または平均オーディオバースト長算出ステップは、前記平均バースト長と全IPパケット数に対するオーディオパケット数の割合に基づいて、前記オーディオパケット損失回数算出ステップで検出される1回のオーディオパケット損失に含まれるオーディオパケットの平均個数である平均オーディオバースト長を求めることを特徴とするオーディオ品質推定方法。
  4.  請求項2記載のオーディオ品質推定方法において、
     前記オーディオパケット損失回数算出ステップは、
     前記平均バースト長と全IPパケット数に対するオーディオパケット数の割合との乗算により、1回のIPパケット損失によって失われるオーディオパケット数の期待値を算出するオーディオパケット数期待値算出ステップと、
     このオーディオパケット数の期待値と前記IPパケット損失回数から前記オーディオパケット損失回数を決定するオーディオパケット損失回数決定ステップとを含むことを特徴とするオーディオ品質推定方法。
  5.  請求項3記載のオーディオ品質推定方法において、
     前記オーディオパケット損失回数算出ステップは、
     前記平均バースト長と全IPパケット数に対するオーディオパケット数の割合との乗算により、1回のIPパケット損失によって失われるオーディオパケット数の期待値を算出するオーディオパケット数期待値算出ステップと、
     このオーディオパケット数の期待値と前記IPパケット損失回数から前記オーディオパケット損失回数を決定するオーディオパケット損失回数決定ステップとを含むことを特徴とするオーディオ品質推定方法。
  6.  請求項2記載のオーディオ品質推定方法において、
     前記平均影響時間または平均オーディオバースト長算出ステップは、
     前記平均オーディオバースト長と1フレームのオーディオデータが格納される平均オーディオパケット数から1回のオーディオパケット損失が品質に影響を与えるフレーム数を算出するフレーム数算出ステップと、
     このフレーム数にフレーム長を乗算することにより前記平均影響時間を求める平均影響時間決定ステップとを含むことを特徴とするオーディオ品質推定方法。
  7.  請求項2記載のオーディオ品質推定方法において、
     さらに、受信したIPパケットの情報に基づいて、オーディオビットレートを算出するオーディオビットレート算出ステップを備え、
     前記主観品質評価値推定ステップは、コーデックによる符号化によって品質が劣化したオーディオの主観品質を表す符号化オーディオ品質値があらかじめ蓄積された符号化オーディオ品質値データベースから、前記オーディオビットレートおよび評価対象のコーデックのサンプリングレートに対応する符号化オーディオ品質値を受け取り、この符号化オーディオ品質値と前記オーディオパケット損失回数と平均影響時間に基づいて前記主観品質評価値を算出することを特徴とするオーディオ品質推定方法。
  8.  請求項3記載のオーディオ品質推定方法において、
     さらに、受信したIPパケットの情報に基づいて、オーディオビットレートを算出するオーディオビットレート算出ステップを備え、
     前記主観品質評価値推定ステップは、コーデックによる符号化によって品質が劣化したオーディオの主観品質を表す符号化オーディオ品質値があらかじめ蓄積された符号化オーディオ品質値データベースから、前記オーディオビットレートおよび評価対象のコーデックのサンプリングレートに対応する符号化オーディオ品質値を受け取り、この符号化オーディオ品質値と前記オーディオパケット損失回数と平均オーディオバースト長に基づいて前記主観品質評価値を算出することを特徴とするオーディオ品質推定方法。
  9.  請求項7記載のオーディオ品質推定方法において、
     前記主観品質評価値推定ステップは、
     平均影響時間についてあらかじめ定められた基準値を基準影響時間とし、品質に及ぼす影響が平均影響時間長のときの1回のオーディオパケット損失に対して、この損失と同等の品質劣化を与える基準影響時間長のときのオーディオパケット損失回数を平均影響時間に対するみなし損失回数として、前記平均影響時間または平均オーディオバースト長算出ステップで算出された平均影響時間をみなし損失回数に変換する変換ステップと、
     前記符号化オーディオ品質値とオーディオパケット損失回数とみなし損失回数に基づいて前記主観品質評価値を算出する主観品質評価値算出ステップとを含むことを特徴とするオーディオ品質推定方法。
  10.  請求項8記載のオーディオ品質推定方法において、
     前記主観品質評価値推定ステップは、
     平均オーディオバースト長についてあらかじめ定められた基準値を基準オーディオバースト長とし、品質に及ぼす影響が平均オーディオバースト長のときの1回のオーディオパケット損失に対して、この損失と同等の品質劣化を与える基準オーディオバースト長のときのオーディオパケット損失回数を平均オーディオバースト長に対するみなし損失回数として、前記平均影響時間または平均オーディオバースト長算出ステップで算出された平均オーディオバースト長をみなし損失回数に変換する変換ステップと、
     前記符号化オーディオ品質値とオーディオパケット損失回数とみなし損失回数に基づいて前記主観品質評価値を算出する主観品質評価値算出ステップとを含むことを特徴とするオーディオ品質推定方法。
  11.  請求項9記載のオーディオ品質推定方法において、
     前記主観品質評価値算出ステップは、前記符号化オーディオ品質値とオーディオパケット損失回数とみなし損失回数と主観品質評価値とのあらかじめ定められた関係に基づいて、前記主観品質評価値を算出するものであり、
     前記符号化オーディオ品質値とオーディオパケット損失回数とみなし損失回数と主観品質評価値との関係は、前記基準影響時間長のときの主観品質評価値をオーディオパケット損失回数ごとに決定する主観品質評価実験を行うことにより導出されることを特徴とするオーディオ品質推定方法。
  12.  請求項10記載のオーディオ品質推定方法において、
     前記主観品質評価値算出ステップは、前記符号化オーディオ品質値とオーディオパケット損失回数とみなし損失回数と主観品質評価値とのあらかじめ定められた関係に基づいて、前記主観品質評価値を算出するものであり、
     前記符号化オーディオ品質値とオーディオパケット損失回数とみなし損失回数と主観品質評価値との関係は、前記基準オーディオバースト長のときの主観品質評価値をオーディオパケット損失回数ごとに決定する主観品質評価実験を行うことにより導出されることを特徴とするオーディオ品質推定方法。
  13.  請求項11記載のオーディオ品質推定方法において、
     前記変換ステップは、前記平均影響時間とみなし損失回数とのあらかじめ定められた関係に基づいて、前記平均影響時間をみなし損失回数に変換するものであり、
     前記平均影響時間とみなし損失回数との関係は、特定の影響時間でのオーディオパケット損失回数が1回のときの主観品質評価値を主観品質評価実験によって決定し、この主観品質評価値と同等の品質を与える基準影響時間のときのオーディオパケット損失回数を、前記符号化オーディオ品質値とオーディオパケット損失回数と主観品質評価値との関係から算出し、算出した値を前記影響時間におけるみなし損失回数とすることを、複数の影響時間について行うことにより、導出されることを特徴とするオーディオ品質推定方法。
  14.  請求項12記載のオーディオ品質推定方法において、
     前記変換ステップは、前記平均オーディオバースト長とみなし損失回数とのあらかじめ定められた関係に基づいて、前記平均オーディオバースト長をみなし損失回数に変換するものであり、
     前記平均オーディオバースト長とみなし損失回数との関係は、特定のオーディオバースト長でのオーディオパケット損失回数が1回のときの主観品質評価値を主観品質評価実験によって決定し、この主観品質評価値と同等の品質を与える基準オーディオバースト長のときのオーディオパケット損失回数を、前記符号化オーディオ品質値とオーディオパケット損失回数と主観品質評価値との関係から算出し、算出した値を前記オーディオバースト長におけるみなし損失回数とすることを、複数のオーディオバースト長について行うことにより、導出されることを特徴とするオーディオ品質推定方法。
  15.  請求項7記載のオーディオ品質推定方法において、
     前記オーディオパケット数割合算出ステップと平均オーディオパケット数算出ステップとオーディオビットレート算出ステップとは、IPパケットヘッダのIPアドレス、ポート番号およびペイロードタイプの情報に基づいて評価対象のオーディオパケットのみを取り出すことを特徴とするオーディオ品質推定方法。
  16.  請求項8記載のオーディオ品質推定方法において、
     前記オーディオパケット数割合算出ステップとオーディオビットレート算出ステップとは、IPパケットヘッダのIPアドレス、ポート番号およびペイロードタイプの情報に基づいて評価対象のオーディオパケットのみを取り出すことを特徴とするオーディオ品質推定方法。
  17.  請求項2記載のオーディオ品質推定方法において、
     前記平均オーディオパケット数算出ステップは、受信IPパケット内のプロトコル構造に基づいて1フレームのオーディオデータが格納される平均オーディオパケット数を算出することを特徴とするオーディオ品質推定方法。
  18.  オーディオデータを含むIPパケットであるオーディオパケットとオーディオデータを含まないIPパケットとが混在して伝送されるマルチメディア通信サ-ビスのオーディオ品質推定装置であって、
     受信したIPパケットの情報に基づいて、単独または連続して発生したIPパケット損失の中に評価対象のオーディオパケットが少なくとも1個存在する場合にそのパケット損失を連続長の長さによらずに1回として数えるオーディオパケット損失回数を求めるオーディオパケット損失回数算出手段と、
     受信したIPパケットの情報に基づいて、オーディオパケット損失回数が1回のときにオーディオ品質に影響が及ぶ平均時間である平均影響時間、または1回のオーディオパケット損失に含まれるオーディオパケットの平均個数である平均オーディオバースト長を算出する平均影響時間または平均オーディオバースト長算出手段と、
     前記オーディオパケット損失回数と、平均影響時間または平均オーディオバースト長とに基づいて主観品質評価値を求める主観品質評価値推定手段とを備えることを特徴とするオーディオ品質推定装置。
  19.  請求項18記載のオーディオ品質推定装置において、
     さらに、受信したIPパケットの情報に基づいて、単独または連続して発生したIPパケット損失を連続長の長さによらずに1回として数えるIPパケット損失回数を求めるIPパケット損失回数算出手段と、
     受信したIPパケットの情報に基づいて、前記IPパケット損失回数算出手段で検出される1回のIPパケット損失に含まれるIPパケットの平均個数である平均バースト長を求める平均バースト長算出手段と、
     受信したIPパケットの情報に基づいて、全IPパケット数に対するオーディオパケット数の割合を算出するオーディオパケット数割合算出手段と、
     前記平均バースト長と全IPパケット数に対するオーディオパケット数の割合に基づいて、前記オーディオパケット損失回数算出手段で検出される1回のオーディオパケット損失に含まれるオーディオパケットの平均個数である平均オーディオバースト長を求める平均オーディオバースト長算出手段と、
     受信したIPパケットの情報に基づいて、1フレームのオーディオデータが格納される平均オーディオパケット数を算出する平均オーディオパケット数算出手段とを備え、
     前記オーディオパケット損失回数算出手段は、前記IPパケット損失回数と平均バースト長と全IPパケット数に対するオーディオパケット数の割合に基づいて前記オーディオパケット損失回数を求め、
     前記平均影響時間または平均オーディオバースト長算出手段は、フレーム長と前記平均オーディオバースト長と1フレームのオーディオデータが格納される平均オーディオパケット数に基づいて前記平均影響時間を求めることを特徴とするオーディオ品質推定装置。
  20.  請求項18記載のオーディオ品質推定装置において、
     さらに、受信したIPパケットの情報に基づいて、単独または連続して発生したIPパケット損失を連続長の長さによらずに1回として数えるIPパケット損失回数を求めるIPパケット損失回数算出手段と、
     受信したIPパケットの情報に基づいて、前記IPパケット損失回数算出手段で検出される1回のIPパケット損失に含まれるIPパケットの平均個数である平均バースト長を求める平均バースト長算出手段と、
     受信したIPパケットの情報に基づいて、全IPパケット数に対するオーディオパケット数の割合を算出するオーディオパケット数割合算出手段とを備え、
     前記オーディオパケット損失回数算出手段は、前記IPパケット損失回数と平均バースト長と全IPパケット数に対するオーディオパケット数の割合に基づいて前記オーディオパケット損失回数を求め、
     前記平均影響時間または平均オーディオバースト長算出手段は、前記平均バースト長と全IPパケット数に対するオーディオパケット数の割合に基づいて、前記オーディオパケット損失回数算出手段で検出される1回のオーディオパケット損失に含まれるオーディオパケットの平均個数である平均オーディオバースト長を求めることを特徴とするオーディオ品質推定装置。
  21.  請求項19記載のオーディオ品質推定装置において、
     前記オーディオパケット損失回数算出手段は、
     前記平均バースト長と全IPパケット数に対するオーディオパケット数の割合との乗算により、1回のIPパケット損失によって失われるオーディオパケット数の期待値を算出するオーディオパケット数期待値算出手段と、
     このオーディオパケット数の期待値と前記IPパケット損失回数から前記オーディオパケット損失回数を決定するオーディオパケット損失回数決定手段とを含むことを特徴とするオーディオ品質推定装置。
  22.  請求項20記載のオーディオ品質推定装置において、
     前記オーディオパケット損失回数算出手段は、
     前記平均バースト長と全IPパケット数に対するオーディオパケット数の割合との乗算により、1回のIPパケット損失によって失われるオーディオパケット数の期待値を算出するオーディオパケット数期待値算出手段と、
     このオーディオパケット数の期待値と前記IPパケット損失回数から前記オーディオパケット損失回数を決定するオーディオパケット損失回数決定手段とを含むことを特徴とするオーディオ品質推定装置。
  23.  請求項19記載のオーディオ品質推定装置において、
     前記平均影響時間または平均オーディオバースト長算出手段は、
     前記平均オーディオバースト長と1フレームのオーディオデータが格納される平均オーディオパケット数から1回のオーディオパケット損失が品質に影響を与えるフレーム数を算出するフレーム数算出手段と、
     このフレーム数にフレーム長を乗算することにより前記平均影響時間を求める平均影響時間決定手段とを含むことを特徴とするオーディオ品質推定装置。
  24.  請求項19記載のオーディオ品質推定装置において、
     さらに、受信したIPパケットの情報に基づいて、オーディオビットレートを算出するオーディオビットレート算出手段を備え、
     前記主観品質評価値推定手段は、コーデックによる符号化によって品質が劣化したオーディオの主観品質を表す符号化オーディオ品質値があらかじめ蓄積された符号化オーディオ品質値データベースから、前記オーディオビットレートおよび評価対象のコーデックのサンプリングレートに対応する符号化オーディオ品質値を受け取り、この符号化オーディオ品質値と前記オーディオパケット損失回数と平均影響時間に基づいて前記主観品質評価値を算出することを特徴とするオーディオ品質推定装置。
  25.  請求項20記載のオーディオ品質推定装置において、
     さらに、受信したIPパケットの情報に基づいて、オーディオビットレートを算出するオーディオビットレート算出手段を備え、
     前記主観品質評価値推定手段は、コーデックによる符号化によって品質が劣化したオーディオの主観品質を表す符号化オーディオ品質値があらかじめ蓄積された符号化オーディオ品質値データベースから、前記オーディオビットレートおよび評価対象のコーデックのサンプリングレートに対応する符号化オーディオ品質値を受け取り、この符号化オーディオ品質値と前記オーディオパケット損失回数と平均オーディオバースト長に基づいて前記主観品質評価値を算出することを特徴とするオーディオ品質推定装置。
  26.  請求項24記載のオーディオ品質推定装置において、
     前記主観品質評価値推定手段は、
     平均影響時間についてあらかじめ定められた基準値を基準影響時間とし、品質に及ぼす影響が平均影響時間長のときの1回のオーディオパケット損失に対して、この損失と同等の品質劣化を与える基準影響時間長のときのオーディオパケット損失回数を平均影響時間に対するみなし損失回数として、前記平均影響時間または平均オーディオバースト長算出手段で算出された平均影響時間をみなし損失回数に変換する変換手段と、
     前記符号化オーディオ品質値とオーディオパケット損失回数とみなし損失回数に基づいて前記主観品質評価値を算出する主観品質評価値算出手段とを含むことを特徴とするオーディオ品質推定装置。
  27.  請求項25記載のオーディオ品質推定装置において、
     前記主観品質評価値推定手段は、
     平均オーディオバースト長についてあらかじめ定められた基準値を基準オーディオバースト長とし、品質に及ぼす影響が平均オーディオバースト長のときの1回のオーディオパケット損失に対して、この損失と同等の品質劣化を与える基準オーディオバースト長のときのオーディオパケット損失回数を平均オーディオバースト長に対するみなし損失回数として、前記平均影響時間または平均オーディオバースト長算出手段で算出された平均オーディオバースト長をみなし損失回数に変換する変換手段と、
     前記符号化オーディオ品質値とオーディオパケット損失回数とみなし損失回数に基づいて前記主観品質評価値を算出する主観品質評価値算出手段とを含むことを特徴とするオーディオ品質推定装置。
  28.  請求項26記載のオーディオ品質推定装置において、
     前記主観品質評価値算出手段は、前記符号化オーディオ品質値とオーディオパケット損失回数とみなし損失回数と主観品質評価値とのあらかじめ定められた関係に基づいて、前記主観品質評価値を算出するものであり、
     前記符号化オーディオ品質値とオーディオパケット損失回数とみなし損失回数と主観品質評価値との関係は、前記基準影響時間長のときの主観品質評価値をオーディオパケット損失回数ごとに決定する主観品質評価実験を行うことにより導出されることを特徴とするオーディオ品質推定装置。
  29.  請求項27記載のオーディオ品質推定装置において、
     前記主観品質評価値算出手段は、前記符号化オーディオ品質値とオーディオパケット損失回数とみなし損失回数と主観品質評価値とのあらかじめ定められた関係に基づいて、前記主観品質評価値を算出するものであり、
     前記符号化オーディオ品質値とオーディオパケット損失回数とみなし損失回数と主観品質評価値との関係は、前記基準オーディオバースト長のときの主観品質評価値をオーディオパケット損失回数ごとに決定する主観品質評価実験を行うことにより導出されることを特徴とするオーディオ品質推定装置。
  30.  請求項28記載のオーディオ品質推定装置において、
     前記変換手段は、前記平均影響時間とみなし損失回数とのあらかじめ定められた関係に基づいて、前記平均影響時間をみなし損失回数に変換するものであり、
     前記平均影響時間とみなし損失回数との関係は、特定の影響時間でのオーディオパケット損失回数が1回のときの主観品質評価値を主観品質評価実験によって決定し、この主観品質評価値と同等の品質を与える基準影響時間のときのオーディオパケット損失回数を、前記符号化オーディオ品質値とオーディオパケット損失回数と主観品質評価値との関係から算出し、算出した値を前記影響時間におけるみなし損失回数とすることを、複数の影響時間について行うことにより、導出されることを特徴とするオーディオ品質推定装置。
  31.  請求項29記載のオーディオ品質推定装置において、
     前記変換手段は、前記平均オーディオバースト長とみなし損失回数とのあらかじめ定められた関係に基づいて、前記平均オーディオバースト長をみなし損失回数に変換するものであり、
     前記平均オーディオバースト長とみなし損失回数との関係は、特定のオーディオバースト長でのオーディオパケット損失回数が1回のときの主観品質評価値を主観品質評価実験によって決定し、この主観品質評価値と同等の品質を与える基準オーディオバースト長のときのオーディオパケット損失回数を、前記符号化オーディオ品質値とオーディオパケット損失回数と主観品質評価値との関係から算出し、算出した値を前記オーディオバースト長におけるみなし損失回数とすることを、複数のオーディオバースト長について行うことにより、導出されることを特徴とするオーディオ品質推定装置。
  32.  請求項24記載のオーディオ品質推定装置において、
     前記オーディオパケット数割合算出手段と平均オーディオパケット数算出手段とオーディオビットレート算出手段とは、IPパケットヘッダのIPアドレス、ポート番号およびペイロードタイプの情報に基づいて評価対象のオーディオパケットのみを取り出すことを特徴とするオーディオ品質推定装置。
  33.  請求項25記載のオーディオ品質推定装置において、
     前記オーディオパケット数割合算出手段とオーディオビットレート算出手段とは、IPパケットヘッダのIPアドレス、ポート番号およびペイロードタイプの情報に基づいて評価対象のオーディオパケットのみを取り出すことを特徴とするオーディオ品質推定装置。
  34.  請求項19記載のオーディオ品質推定装置において、
     前記平均オーディオパケット数算出手段は、受信IPパケット内のプロトコル構造に基づいて1フレームのオーディオデータが格納される平均オーディオパケット数を算出することを特徴とするオーディオ品質推定装置。
  35.  オーディオデータを含むIPパケットであるオーディオパケットとオーディオデータを含まないIPパケットとが混在して伝送されるマルチメディア通信サ-ビスにおいてユーザが体感するオーディオの主観品質を推定するオーディオ品質推定装置としてコンピュータを動作させるオーディオ品質推定プログラムであって、
     受信したIPパケットの情報に基づいて、単独または連続して発生したIPパケット損失の中に評価対象のオーディオパケットが少なくとも1個存在する場合にそのパケット損失を連続長の長さによらずに1回として数えるオーディオパケット損失回数を求めるオーディオパケット損失回数算出ステップと、
     受信したIPパケットの情報に基づいて、オーディオパケット損失回数が1回のときにオーディオ品質に影響が及ぶ平均時間である平均影響時間、または1回のオーディオパケット損失に含まれるオーディオパケットの平均個数である平均オーディオバースト長を算出する平均影響時間または平均オーディオバースト長算出ステップと、
     前記オーディオパケット損失回数と、平均影響時間または平均オーディオバースト長とに基づいて主観品質評価値を求める主観品質評価値推定ステップとを、コンピュータに実行させることを特徴とするオーディオ品質推定プログラム。
PCT/JP2009/059529 2008-06-11 2009-05-25 オーディオ品質推定方法、オーディオ品質推定装置およびプログラム WO2009150932A1 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN200980121452.2A CN102057634B (zh) 2008-06-11 2009-05-25 音频质量估计方法以及音频质量估计设备
KR1020107027628A KR101224171B1 (ko) 2008-06-11 2009-05-25 오디오 품질 추정 방법, 오디오 품질 추정 장치 및 이를 위한 프로그램을 기록하는 컴퓨터-판독가능 기록 매체
BRPI0914795A BRPI0914795B8 (pt) 2008-06-11 2009-05-25 Método para avaliação da qualidade de áudio, aparelho para avaliação da qualidade de áudio e meio de gravação legível por computador que grava um programa
EP09762362.3A EP2288087B1 (en) 2008-06-11 2009-05-25 Audio quality estimation method, audio quality estimation device, and program
US12/996,767 US8868222B2 (en) 2008-06-11 2009-05-25 Audio quality estimation method, audio quality estimation apparatus, and computer readable recording medium recording a program
JP2010516804A JP5123384B2 (ja) 2008-06-11 2009-05-25 オーディオ品質推定方法、オーディオ品質推定装置およびプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2008153089 2008-06-11
JP2008-153089 2008-06-11

Publications (1)

Publication Number Publication Date
WO2009150932A1 true WO2009150932A1 (ja) 2009-12-17

Family

ID=41416643

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2009/059529 WO2009150932A1 (ja) 2008-06-11 2009-05-25 オーディオ品質推定方法、オーディオ品質推定装置およびプログラム

Country Status (8)

Country Link
US (1) US8868222B2 (ja)
EP (1) EP2288087B1 (ja)
JP (1) JP5123384B2 (ja)
KR (1) KR101224171B1 (ja)
CN (1) CN102057634B (ja)
BR (1) BRPI0914795B8 (ja)
RU (2) RU2517393C2 (ja)
WO (1) WO2009150932A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108111908A (zh) * 2017-12-25 2018-06-01 深圳Tcl新技术有限公司 音频品质确定方法、设备及计算机可读存储介质

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011034090A1 (ja) * 2009-09-18 2011-03-24 日本電気株式会社 音声品質解析装置、音声品質解析方法およびプログラム
PL2525353T3 (pl) * 2011-05-16 2014-02-28 Deutsche Telekom Ag Parametryczny model jakości audio dla usług IPTV
CN103379360B (zh) * 2012-04-23 2015-05-27 华为技术有限公司 一种视频质量评估方法和装置
CN103632679A (zh) * 2012-08-21 2014-03-12 华为技术有限公司 音频流质量评估方法及装置
CN104539943B (zh) * 2012-08-22 2017-01-04 华为技术有限公司 多媒体质量的监控方法和设备
CN103634577B (zh) 2012-08-22 2014-12-31 华为技术有限公司 多媒体质量的监控方法和设备
CN105100508B (zh) 2014-05-05 2018-03-09 华为技术有限公司 一种网络语音质量评估方法、装置和系统
CN104463339A (zh) * 2014-12-23 2015-03-25 合一网络技术(北京)有限公司 多媒体资源制作者的评估方法及其装置
US10178144B1 (en) * 2015-12-14 2019-01-08 Marvell International Ltd. Scattering audio streams
CN105845138A (zh) * 2016-03-25 2016-08-10 乐视控股(北京)有限公司 语音信号处理方法及装置
CN108401263B (zh) * 2017-02-07 2021-09-17 大唐移动通信设备有限公司 一种语音质量的评估方法及装置
WO2021161440A1 (ja) * 2020-02-13 2021-08-19 日本電信電話株式会社 音声品質推定装置、音声品質推定方法及びプログラム
US10778479B1 (en) * 2020-04-27 2020-09-15 Bestechnic (Shanghai) Co., Ltd. Systems and methods for wireless transmission of audio information
CN113808618B (zh) * 2021-09-06 2024-04-16 广州世音联软件科技有限公司 音频质量评估方法及其装置、设备、介质、产品

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040096422A1 (en) 1997-06-17 2004-05-20 Schwartz Herbert E. Compositions of polyacids and polyethers and methods for their use in reducing pain
GB2360178B (en) * 2000-03-06 2004-04-14 Mitel Corp Sub-packet insertion for packet loss compensation in Voice Over IP networks
US7167451B1 (en) * 2000-12-21 2007-01-23 Cisco Technology, Inc. User controlled audio quality for voice-over-IP telephony systems
US7386000B2 (en) * 2001-04-17 2008-06-10 Nokia Corporation Packet mode speech communication
KR20040079203A (ko) 2003-03-06 2004-09-14 삼성전자주식회사 휴대용 통신 장치
EP1455504B1 (en) * 2003-03-07 2014-11-12 Samsung Electronics Co., Ltd. Apparatus and method for processing audio signal and computer readable recording medium storing computer program for the method
CA2536391A1 (en) * 2003-08-21 2005-03-10 Vidiator Enterprises Inc. Quality of experience (qoe) metrics for wireless communication networks
US20070047515A1 (en) * 2003-11-11 2007-03-01 Telefonaktiebolaget Lm Ericsson (Publ) Adapting playout buffer based on audio burst length
JP3905891B2 (ja) * 2004-02-26 2007-04-18 日本電信電話株式会社 ネットワーク品質管理目標値算出方法および装置、並びに、ネットワーク品質監視方法および装置
US8405773B2 (en) * 2005-09-06 2013-03-26 Nippon Telegraph And Telephone Corporation Video communication quality estimation apparatus, method, and program
EP1763173A2 (en) * 2005-09-08 2007-03-14 Acterna, LLC Transmission quality monitoring for multimedia streams
JP4490483B2 (ja) 2006-05-09 2010-06-23 日本電信電話株式会社 映像品質推定装置、方法、およびプログラム

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
"Conformance testing for narrow-band voice over IP transmission quality assessment models", ITU-T RECOMMENDATION, July 2006 (2006-07-01), pages 564
KAZUHISA YAMAGISHI ET AL.: "Eizo Communication Service no Sogo Hinshitsu Suitei Gijutsu", NTT GIJUTSU JOURNAL, vol. 19, no. 3, 1 March 2007 (2007-03-01), pages 74 - 77, XP008137120 *
NORITSUGI EGI ET AL.: "Kotonaru Codec o Mochiita VoIP Network Sogo Setsuzokuji no QoE Suiteiho", IEICE TECHNICAL REPORT, vol. 107, no. 230, 20 September 2007 (2007-09-20), pages 159 - 164, XP008137244 *
See also references of EP2288087A4
TAKANORI HAYASHI ET AL.: "Multimedia Tsushin Service no QoE Hyoka Gijutsu ni Kansuru Doko to Kadai", THE TRANSACTIONS OF THE INSTITUTE OF ELECTROS, vol. J91-A, no. 6, 1 June 2008 (2008-06-01), pages 600 - 612, XP008137122 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108111908A (zh) * 2017-12-25 2018-06-01 深圳Tcl新技术有限公司 音频品质确定方法、设备及计算机可读存储介质

Also Published As

Publication number Publication date
EP2288087B1 (en) 2016-03-30
KR101224171B1 (ko) 2013-01-21
EP2288087A1 (en) 2011-02-23
US20110075852A1 (en) 2011-03-31
JP5123384B2 (ja) 2013-01-23
BRPI0914795B1 (pt) 2021-02-17
EP2288087A4 (en) 2014-07-23
CN102057634B (zh) 2015-01-28
US8868222B2 (en) 2014-10-21
CN102057634A (zh) 2011-05-11
BRPI0914795A2 (pt) 2020-08-18
RU2461972C2 (ru) 2012-09-20
RU2010150154A (ru) 2012-07-20
JPWO2009150932A1 (ja) 2011-11-10
BRPI0914795B8 (pt) 2022-08-30
RU2517393C2 (ru) 2014-05-27
RU2012131955A (ru) 2014-02-10
KR20110015623A (ko) 2011-02-16

Similar Documents

Publication Publication Date Title
JP5123384B2 (ja) オーディオ品質推定方法、オーディオ品質推定装置およびプログラム
Ding et al. Speech quality prediction in voip using the extended e-model
EP1267555A2 (en) Measuring speech quality
US11748643B2 (en) System and method for machine learning based QoE prediction of voice/video services in wireless networks
CN101523916A (zh) 确定视频质量的方法
KR20110044258A (ko) 시-변화 전송 미디어를 통한 데이터 스트리밍
JP4914400B2 (ja) 品質推定方法、品質推定システム、ユーザ端末、品質管理端末およびプログラム
JP2008301026A (ja) 映像品質推定方法、装置、およびプログラム
Ding et al. Non-intrusive single-ended speech quality assessment in VoIP
JP2007013674A (ja) 総合通話品質評価装置および総合通話品質評価方法
WO2006070471A1 (ja) 通信品質評価方法、導出装置、通信品質評価システム及びコンピュータプログラム
JP3809164B2 (ja) 総合通話品質推定方法及び装置、その方法を実行するプログラム、及びその記録媒体
KR101199448B1 (ko) 확장된 E-모델을 이용한 VoIP 기반 음성품질 예측 장치, 방법 및 기록매체
Zhang et al. Perceived QoS assessment for Voip networks
JP5335867B2 (ja) 基本GoP長を用いた映像品質推定装置及び方法及びプログラム
JP6586044B2 (ja) 音声品質推定装置、音声品質推定方法及びプログラム
Masuda et al. Non-intrusive quality monitoring method of VoIP speech based on network performance metrics
JP6511003B2 (ja) 音声品質推定装置、音声品質推定方法、及びプログラム
CN107113357B (zh) 与语音质量估计相关的改进方法和设备
JP2016139848A (ja) 音声品質推定装置、方法及びプログラム
JP2003283496A (ja) 通信品質推定方法、通信品質推定装置、通信品質推定プログラム、および当該プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2009290891A (ja) 通信品質評価方法、導出装置、通信品質評価システム及びコンピュータプログラム
Mousa et al. Function approximation models for non-intrusive prediction of voip quality
Grah et al. Dynamic QoS for commercial VoIP in heterogeneous networks
JP2013051545A (ja) TimestampedTS(TTS)を用いた映像フレーム判別装置および方法およびプログラム、及びTTSを用いて判別した映像フレームを用いた映像品質推定装置及び方法及びプログラム

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 200980121452.2

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09762362

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2010516804

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 4571/KOLNP/2010

Country of ref document: IN

WWE Wipo information: entry into national phase

Ref document number: 12996767

Country of ref document: US

Ref document number: 2009762362

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 20107027628

Country of ref document: KR

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2010150154

Country of ref document: RU

ENP Entry into the national phase

Ref document number: PI0914795

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20101207