PT2525353E - Modelo de qualidade de áudio paramétrico para serviços iptv - Google Patents

Modelo de qualidade de áudio paramétrico para serviços iptv Download PDF

Info

Publication number
PT2525353E
PT2525353E PT121666440T PT12166644T PT2525353E PT 2525353 E PT2525353 E PT 2525353E PT 121666440 T PT121666440 T PT 121666440T PT 12166644 T PT12166644 T PT 12166644T PT 2525353 E PT2525353 E PT 2525353E
Authority
PT
Portugal
Prior art keywords
quality
audio signal
estimating
audio
encrypted
Prior art date
Application number
PT121666440T
Other languages
English (en)
Inventor
Bernhard Feiten
Marie-Neige Garcia
Peter List
Alexander Raake
Savvas Argyropoulos
Ulf Wuestenhagen
Original Assignee
Deutsche Telekom Ag
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deutsche Telekom Ag filed Critical Deutsche Telekom Ag
Publication of PT2525353E publication Critical patent/PT2525353E/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/61Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
    • H04L65/611Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for multicast or broadcast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

ΕΡ2525353Β1
DESCRIÇÃO
MODELO DE QUALIDADE DE ÁUDIO PARAMÉTRICO PARA SERVIÇOS IPTV A presente invenção refere-se a um método e um aparelho para estimar a qualidade de um sinal áudio, e em particular para estimar a qualidade de um sinal áudio transmitido usando métodos de codificação e/ ou métodos de compressão e/ou métodos de encriptação.
Entre os numerosos serviços de distribuição TV, IPTV (protocolo de Internet TV) está a tornar-se incrementalmente importante e tem substituído métodos de transmissão com base em não pacote ou analógica. É uma grande responsabilidade do fornecedor de difusão para quer fornecedor de conteúdo quer cliente manter a qualidade do seu serviço. Em grandes redes IPTV apenas sondas de monitorização de qualidade totalmente automatizadas podem preencher este requisito.
Para obter um alto grau de satisfação de utilizador para serviços multimédia com base em IP como IPTV, a qualidade percebida de áudio, vídeo e áudio-vídeo precisa de ser estimada. Isto pode ser obtido conduzindo testes de percepção. Contudo, é bem conhecido que testes de percepção são demorados e não são aplicáveis em caso de operação de serviços em tempo real. Como uma consequência, métodos instrumentais são frequentemente preferidos. Estes métodos podem por exemplo sair o grau de similaridade entre o vídeo recebido no lado de utilizador e o vídeo não degradado original. Ainda, em documento EP 2 413 604 Al, um método e 1 ΕΡ2525353Β1 um aparelho para estimar a qualidade de um sinal vídeo tem sido fornecido. A presente invenção, contudo, concentra-se na métrica de qualidade de um sinal áudio.
Rix et al. fornecem em Ref. [1] uma visão global de métrica de qualidade de fala e áudio existente. Quer métodos intrusivos quer não intrusivos, como também modelos com base- em parâmetro e- sinal são cobertos. No contexto da presente invenção, acesso ao fluxo de bit encriptado codificado é disponível antes de entrar o descodificador, isto é antes de o sinal ser descodificado. A referência (não- degradada) e o sinal áudio descodificado não estão disponíveis. Aliás, a complexidade do modelo deveria ficar baixa. Assim, a presente invenção concentra-se em métrica de qualidade de áudio paramétrica não- intrusiva. A maioria de modelos paramétricos representados na literatura (Refs. [2, 3] e [4]) são dedicados a ligação de voz. Contudo, estas abordagens como também as umas relacionadas com a parametrização do efeito de perda de pacote em Voz sobre IP (VoIP) [5, 6] podem ser usadas no contexto de ligação áudio também. Por exemplo, Graubner et al. fazem uso em Ref. [7] do factor de degradação com base em abordagem do E-modelo para prever qualidade de áudio de Difusão Áudio sobre IP com um modelo de referência total.
Um modelo de qualidade de áudio paramétrico não intrusivo é o modelo proposto por Egi et al. em Ref. [8] . Este modelo é adequado para aplicações de quer taxa de bits alta quer baixa como TV Móvel e IPTV. Toma como parâmetros de entrada a taxa de bits de áudio, o tipo de codec, a taxa 2 ΕΡ2525353Β1 de amostragem, o comprimento de trama, a frequência de perda de pacote (o número de eventos de perda), e o comprimento de rajada médio. 0 tipo de codec, taxa de amostragem e comprimento de trama são pré-determinados. Este modelo mostra alta execução de correlação com os resultados de teste subjectivo. Contudo, tem sido treinado num codec apenas (AAC-LC) . Aliás, como notado pelos autores, a interacção entre taxa de bits de áudio e taxa de perda de pacote não é considerada.
Como uma consequência, ainda há uma necessidade para um método com base num modelo de qualidade de áudio paramétrico para serviços IPTV para vários codec tipicamente usados em IPTV, e um aparelho que permite usar este método. 0 objecto da presente invenção é assim fornecer um método com base num modelo de qualidade de áudio paramétrico para serviços IPTV para vários codec tipicamente usados em IPTV, e um aparelho que permite usar este método.
Este objecto é obtido pelo método e o aparelho com as caracteristicas como reveladas pelas reivindicações apresentadas neste documento. A invenção pode ser sumarizada como segue: 0 método de acordo com a presente invenção emprega um modelo de qualidade de áudio paramétrico para serviços IPTV. 0 método é aplicável a planeamento de rede e 3 ΕΡ2525353Β1 monitorização de qualidade de camada de pacote de áudio encriptado. Degradações faladas são compressão de áudio (MPEG-I Camada II & III, MPEG-2 AAC LC, MPEG-4 HE-AACv2, e AC-3) e perda de trama de áudio para vários padrões de perda de trama. Testes de percepção de áudio têm mostrado que o codec AAC e HE-AAC executam melhor de que o MPEG-I Camada II e III quer em casos com perdas quer sem perdas. Tem também sido observado que para estes dois antigos codec, sinal áudio que contém fala produz diferente qualidade percebida de que sinal sem fala. A localização de perda não parece influenciar a qualidade percebida enquanto o comprimento de rajada parece para taxas de perda de pacote baixas. 0 método inventado toma como parâmetros de entrada o codec áudio, taxa de bits, taxa de perda de trama e comprimento de rajada e mostra uma correlação de 95 % com as avaliações subjectivas.
Agora, uma descrição do modelo de áudio paramétrico a invenção é baseada em vai ser dada:
No seguinte, é assumido que a degradação perceptual ligada com certas espécies de degradações pode ser considerada como aditiva numa escala de avaliação perceptual. Com base nesta assunção, computamos a Nota Média de Opinião (MOS) por condição através de todos sujeitos, transformamo-la para o modelo de escala de 100 pontos (R) que usa a conversão definida em Recomendação ITUT G.107 Apêndice I [2], e decompomos o modelo de qualidade de áudio como segue (ver Refs. [13] e [14] para pormenores no modelo): 4 ΕΡ2525353Β1 ΕΡ2525353Β1 0)
Qa ~ Qoa - IcodA - Iíraà , em que QA é a qualidade de áudio prevista (no seguinte também denominado "qualidade de percepção") e QoA é o nível de qualidade de base (no seguinte também simplesmente referido a como "qualidade de base") o sinal áudio transmitido pode alcançar para o serviço alvo respectivo. Neste papel, QoA é configurado para a avaliação de qualidade máxima transformada obtida nos testes subjectivos de áudios. IcodA é o impacto de qualidade devido a compressão de áudio (no seguinte também referido a como "impacto de qualidade de compressão"), e ItraA é o impacto de qualidade devido a perda de trama de áudio (no seguinte também denominado " impacto de qualidade de perda de trama"). IcodA é derivado dos testes subjectivos para condições sem erro como segue: IcodA = QoA - QA. Usando todas condições, obtemos ItraA computando ItraA= QoA - IcodA ~ Qa-
Num procedimento de ajuste de curva de mínimo quadrado que usa os resultados de teste de áudio (um exemplo de um teste de áudio correspondente vai ser infradescrito com a ajuda das figuras) como valores alvo, obtemos para o caso sem perda de trama:
IcodA = al · exp(a2 · bitrate) + a3 , (2) em que al, a2, e a3 são coeficientes de ajuste de curva que dependem do codec usado.
Seguindo o mesmo procedimento de mínimo quadrado, obtém-se em caso de perda de trama: 5 ΕΡ2525353Β1 ItraA = (bO - IcodA)
Pfl(φϊ·μ + ό2) + Pfl) ’ (3)
Aqui, bO, bl, e b2 são os coeficientes de ajuste de-curva. Os parâmetros Pfl e μ são resp. a taxa de- perda de trama média (preferencialmente em percentagem ) e o número médio de tramas perdidas numa linha. A qualidade de base é preferencialmente configurada para QoA = 100. Contudo, como este valor pode em principio ser escolhido arbitrariamente, apenas dependendo da escala usada para medir a qualidade de percepção QA, também valores diferentes para a qualidade de base (como também para a máxima qualidade de percepção QA) podem ser usados, por exemplo QoA = 1. Claro, a configuração de parâmetros al, a2, a3, bO, bl, e b2 tem de ser escolhida consequentemente.
Para uma qualidade de base de QoA = 100, um exemplo para uma configuração de parâmetros adequada (isto é, al, a2, a3, bO, bl, e b2) a ser usados dentro das Eqs. (l)a (3) de cima empregues no método é dado na seguinte Tabela 1. Como pode ser visto, a configuração de parâmetro depende do codec usado. Contudo, outros valores podem também ser usados nas Eqs. (1) a (3) de cima. Em particular, pode ser apropriado variar cada dos parâmetros dentro de um alcance de um desvio relativo de ±10% do respectivo valor dado em Tabela 1. 6 ΕΡ2525353Β1
Tabela 1: valores exemplares para os parâmetros al, a2, a3, bO, bl, e b2 em dependência do codec usado a ser usado em Eqs. (1) a (3) juntamente com a qualidade de base QoA = 100 .
Codec al a2 a3 bO bl b2 aac 60,67 -0,04 16,78 132 15, 04 15, 04 heaac 75,58 -0,09 24,67 200 37,99 36, 04 mp2 92,81 -0,02 17,74 92,1 1,72 0,76 mp3 92,53 -0,01 0 84,77 0,33 0,33 ac3 100 -0,03 20,65 80 0 1,59
Embora tenha sido provado (ver abaixo) que o tipo de conteúdo tem uma influência na qualidade percebida, o modelo fornece a mesma qualidade estimada para todos conteúdos.
Um aspecto da invenção refere-se a um método para estimar a qualidade de percepção de um sinal áudio descodificado que é descodificado de um sinal áudio codificado e/ou encriptado. Este método compreende as seguintes etapas: a) estimar o impacto de qualidade de compressão IcodA devido a compressão de áudio; b) estimar a qualidade de percepção QA do sinal áudio descodificado que usa as estimações obtidas em pelo menos uma das etapas anteriores.
Um aspecto da invenção refere-se a um método, em que etapa a) de estimar o impacto de qualidade de compressão IcodA usa um ou mais coeficientes e/ou a taxa de bits, em que o um ou mais coeficientes dependem do tipo do sinal 7 ΕΡ2525353Β1 áudio codificado e/ou encriptado.
Um aspecto da invenção refere-se a um método, em que etapa a) de estimar o impacto de qualidade de compressão IcodA é executada em conformidade com a equação
IcodA = al · exp(a2 * bitrate) + a3 , em que al, a2, e a3 são coeficientes que dependem do tipo do sinal áudio codificado e/ou comprimido e/ou encriptado e bitrate representa a taxa de bits.
Um aspecto da invenção refere-se a um método, em que etapa b) é executada que usa a equação
Qa = Qoa -IcodA , em que QoA representa uma qualidade de base fixa , e em que preferencialmente QoA = 100.
Um aspecto da invenção refere-se a um método com uma etapa adicional de a' ) estimar o impacto de qualidade de perda de trama ItraA devido a perda de trama de áudio; e em que o impacto de qualidade de perda de trama estimado ItraA é também usado numa etapa de estimar a qualidade de percepção QA. 8 ΕΡ2525353Β1
Um aspecto da invenção refere-se a um método, em que a etapa a' ) de estimar o impacto de qualidade de perda de trama ItraA usa: um ou mais coeficientes e/ou a taxa de perda de trama média Pfl, preferencialmente em percentagem, e/ou o número médio de tramas perdidas numa linha μ.
Um aspecto da invenção refere-se a um método, em que a etapa a' ) de estimar o impacto de qualidade de perda de trama ItraA usa o impacto de qualidade de compressão estimado IcodA.
Um aspecto da invenção refere-se a um método, em que a etapa de estimar o impacto de qualidade de perda de trama ItraA é executada em conformidade com a equação
ItraA =(JbO-IcodA)
Pflm-M + b2) + Pfl) ’ em que bO, bl, e b2 são coeficientes.
Um aspecto da invenção refere-se a um método, em que etapa b) é executada que usa a equação
Qa f (Qoa , IcodA , ItraÂ) com uma função adequada f > em que QoA representa uma qualidade de base fixa, e em que 9 ΕΡ2525353Β1 preferencialmente QoA = 100.
Um aspecto da invenção refere-se a um método, em que etapa b) é executada que usa a equação
Qa = Qoa-aIcodA -βItraA com Oío βί1 em que QoA representa uma qualidade de base fixa, e em que preferencialmente QoA = 100.
Um aspecto da invenção refere-se a um método, em que etapa b) é executada que usa a equação
Qa = QoA- IcodA- ItraA , em que QoA representa uma qualidade de base fixa, e em que preferencialmente QoA =100.
Um aspecto da invenção refere-se a um método, em que os coeficientes são obtidos aplicando um procedimento de ajuste de curva de quadrado mínimo que usa as taxas de testes de percepção como valores alvo.
Um aspecto da invenção refere-se a um método, em que o sinal áudio é codificado/descodifiçado e/ou encriptado/ desencriptado de acordo com um dos seguintes tipos de codec: MPEG-1 Camada II (mp2), MPEG-1 Camada III (mp3), MPEG-2 AAC LC (aac) , MPEG-4 HE-AACv2 (heaac), e AC-3 (ac3) .
Um aspecto da invenção refere-se a um método, em que o sinal áudio é pelo menos uma parte de um fluxo de dados não 10 ΕΡ2525353Β1 interactivo. 0 fluxo de dados nao interactivo pode ser um fluxo de áudio ou audiovisual não interactivo.
Um aspecto da invenção refere-se a um método, em que o sinal áudio é pelo menos uma parte de um fluxo de dados interactivo. 0 fluxo de dados interactivo pode ser um fluxo de áudio ou audiovisual interactivo.
Um aspecto da invenção refere-se a um método, em que pelo menos uma parte dos coeficientes estão ainda a depender do conteúdo do sinal áudio.
Um aspecto da invenção refere-se a um método, em que pelo menos uma parte dos coeficientes e/ou a taxa de bits, e/ou, tanto quanto usado, a taxa de perda de trama média Pfl e/ou o número médio de tramas perdidas numa linha μ são computados da informação de cabeçalho de pacote extraída do fluxo de bit do sinal áudio e/ou derivada de informação de lado.
Um aspecto da invenção refere-se a um método, em que o método da invenção é combinado com um ou mais outros métodos para estimar o impacto na qualidade por outras degradações de que codificação e/ou encriptação de um sinal áudio, em que o um ou mais outros métodos cada compreendem pelo menos uma etapa de estimar uma qualidade de percepção do sinal áudio descodificado.
Um aspecto da invenção refere-se a um método, em que a combinação do método da invenção e o um ou mais outros métodos é uma função linear desses métodos. 11 ΕΡ2525353Β1
Um aspecto da invenção refere-se a um método, em que a combinação do método da invenção e o um ou mais outros métodos é uma função multiplicativa desses métodos.
Um aspecto da invenção refere-se a um método, em que o método da invenção é combinado com um método para estimar a qualidade de percepção de um sinal vídeo descodificado que é descodificado de um sinal vídeo codificado e/ou encriptado.
Um aspecto da invenção refere-se a um método para monitorizar a qualidade de um sinal áudio transmitido com as etapas: A) transmitir o sinal áudio de um servidor ao cliente; B) lado de cliente que executa o método para estimar a qualidade de percepção do sinal áudio transmitido; C) transferir o resultado da estimatição de etapa B) ao servidor; D) lado de servidor que monitoriza a qualidade do sinal áudio transmitido.
Um aspecto da invenção refere-se a um método para monitorizar a qualidade de um sinal áudio transmitido da reivindicação 18 com as etapas adicionais: E) analisar a qualidade monitorizada do sinal áudio transmitido, preferencialmente em dependência de 12 ΕΡ2525353Β1 parâmetros de transmissão; e opcionalmente F) mudar os parâmetros de transmissão com base na análise de etapa E) para aumentar a qualidade do sinal áudio transmitido.
Um aspecto da invenção refere-se a um aparelho para estimar a qualidade de percepção de um sinal áudio descodificado que é descodificado de um sinal áudio codificado e/ou encriptado. 0 aparelho compreende: um estimador de qualidade de compressão confiqurado para estimar o impacto de qualidade de compressão IcodA devido a compressão de áudio; um ajustador configurado para ajustar a qualidade de percepção QA do sinal áudio descodificado.
Um aspecto da invenção refere-se a um aparelho em que o ajustador é configurado para ajustar a qualidade de percepção QA do sinal áudio descodificado que usa a equação
Qa — Qoa - IcodA ; em que QoA representa uma qualidade de base fixa,
Um aspecto da invenção refere-se a um aparelho configurado para ajustar a qualidade de percepção QA do sinal áudio descodificado, em que a qualidade de base fixa é configurada para QoA = 100. 13 ΕΡ2525353Β1
Um aspecto da invenção refere-se a um aparelho configurado para ajustar a qualidade de percepção QA do sinal áudio descodificado, em que o estimador de qualidade de compressão é configurado para estimar a qualidade de compressão usando a equação
IcodA - al · exp(a2 · bitratè) + a3 , em que al, a2, e a3 são coeficientes que dependem do tipo de sinal áudio codificado e/ou comprimido e/ou encriptado e bitrate representa a taxa de bits.
Um aspecto da invenção refere-se a um aparelho, em que o aparelho ainda compreende um estimador de impacto de qualidade de perda de trama configurado para estimar o impacto de qualidade de perda de trama ItraA devido a perda de trama de áudio.
Um aspecto da invenção refere-se a um aparelho, em que o ajustador é configurado para ajustar a qualidade de percepção QA do sinal áudio descodificado que usa a equação
Qa = Qoa ~ IcodA - ltraA\ em que QoA representa uma qualidade de base fixa, e em que preferencialmente QoA = 100.
Um aspecto da invenção refere-se a um aparelho em que o ajustador é configurado para ajustar a qualidade de percepção QA do sinal áudio descodificado, em que o 14 ΕΡ2525353Β1 estimador de qualidade de compressão é configurado para estimar a qualidade de compressão IcodA usando a equação
IcocIa = al * exp(a2 · bitraté) + a3 , em que al, a2, e a3 são coeficientes que dependem do tipo do sinal áudio codificado e/ou encriptado e bitrate representa a taxa de bits; e/ou o estimador de impacto de qualidade de perda de trama configurado para estimar o impacto de qualidade de perda de trama ItraA usando a equação ltraA = (60 - IcodA )
Pfl ((61// + 62) + Pfl) ’ a taxa de perda de trama média, em percentagem, μ é o número médio de numa linha, e bO, bl, e b2 são em que Pfl é preferencialmente tramas perdidas coeficientes.
Um aspecto da invenção refere-se a um aparelho para estimar a qualidade de percepção de um sinal áudio descodificado que é descodificado de um sinal áudio codificado e/ou encriptado, o aparelho que compreende um computador ou microchip configurado para executar qualquer um dos métodos supradescritos.
Um aspecto da invenção refere-se a um descodificador ligável a um receptor para receber um sinal áudio codificado e/ou encriptado, em que o descodificador compreende um aparelho como supradescrito. 15 ΕΡ2525353Β1
Lista das figuras: A Fig. 1: escala de qualidade de 11 pontos ( Recomendações ITU-T P .910 [12]) usada nos testes subjectivos de áudio. A Fig. 2: Qualidade subjectiva (na escala de 11 pontos) para quatro diferentes codec e várias taxas de bits. A Fig. 3: Qualidade de áudio percebida como uma função da taxa de bits de áudio para vários tipos de conteúdos e para codec mp2. A Fig. 4: Qualidade subjectiva para perda de trama aleatória para diferente codec e taxas de bits. A Fig. 5: Qualidade subjectiva para perda de trama de rajada e aleatória para codec mp2 e duas taxas de bits. A Fig. 6: Qualidade percebida para perda de trama aleatória para cada codec e taxa de bits alta tomando os resultados médios por conteúdo e por padrão de erro. A Fig. 7: Qualidade subjectiva para perda de trama de rajada para codec mp2 e taxa de bits alta. A Fig. 8: Qualidade de áudio estimada vs. qualidade de áudio percebida. 16 ΕΡ2525353Β1
Outros aspectos, características, e vantagens vão ser aparentes do sumário de cima, como também da descrição que segue, incluindo as figuras e as reivindicações.
Concepção Experimental
Para desenvolver o modelo de qualidade de áudio, dois testes subjectivos de áudio têm sido conduzidos. Teste 1 fala quatro codec e taxa de- perda de- trama aleatória, e Teste 2 concentra-se em codec MPEG-1 Camada II e perda de trama de rajada. 0 material fonte consiste em cinco conteúdo de áudio de 16 s de duração cada. Os conteúdos de áudio são representativos de diferentes programas de TV. Diferem em termos de género e categoria de áudio. Os tipos de conteúdo de áudio resultantes são descritos em Tabela 2.
Tabela 2: Descrições de conteúdo de áudio. ÍD Áudio A Fala em música B Fala C Barulho de multidão (fãs de futebol) D Música clássica E Música Pop com cantor
Para simular degradações IPTV típicas, os cinco conteúdos de fonte foram processados off-line de acordo com as condições de teste listadas em Tabela 3. Isto resulta em 49 condições de teste de áudio para cada dos cinco conteúdos de áudio, levando a 245 sequências de áudio a ser classificadas pelos sujeitos. 17 ΕΡ2525353Β1
Tabela 3: Condições de testes usadas em Teste 1 e Teste 2. FLR: Taxa de Perda de Trama; FLD: Distribuição de Perda de Trama; PLC: Ocultação de Perda de Pacote.
Parâmetros Teste 1 Teste 2 Formato wav (48 kHz, 16 bit, estéreo bit, estéreo) ) wav (48 kHz,16 Codec MPEG-2 AAC LCa (aac) aac MPEG-4 HE-AACv2b (heaac) heaac MPEG-1 CII (mp2) mp2 MPEG-1 CIII (mp3) mp3 CBR aac:{48, 64, 96} kbps aac: {24, 32, 48, 96} kbps heaac: {32, 48, 64} kbps heaac: {16, 24} kbps mp2: {48, 96, 192} kbps mp2: {48, 64, 192} kbps mp3: {64, 96, 128} kbps mp3:{32, 48} kbps FLR {0, 1, 4, 8} % mp2 : { 0, 1, 4, 8} % FLD aleatória aleatória & rajada: {2, 4, 6} PLC codec incorporado mp2: inserção de silêncio (para pormenores ver Ref. [9] ) , aAAC: Codificação de Áudio Avançada; LC: Complexidade Baixa bHE-AAC: Codificação de Áudio Avançada de Eficiência Alta
As mesmas seis âncoras foram usadas em dois testes subjectivos. Estas âncoras cobrem o todo alcance de qualidade e tipos de degradação usados nos testes. São usadas para mapear os resultados de ambos testes. Mais informação pode ser encontrada nas âncoras em Ref. [9] e no procedimento de mapeamento em Ref. [10]. 18 ΕΡ2525353Β1 A perda foi inserida no nivel de trama de áudio. Para estudar a influência da localização de perda na qualidade percebida, quatro padrões de erro foram usados por conteúdo e condição, uma condição que é a combinação de um codec, taxa de bits, taxa de perda de trama e comprimento de rajada de trama (isto é o número médio de tramas perdidas numa linha) . Cada padrão de erro foi classificado por um quarto dos sujeitos.
Condições de audição estiveram em conformidade com Recomendação ITU-T P.800 [11]. Para assegurar que o material processado, mas incomprimido pudesse ser reproduzido sem artefactos de reprodução, sistemas de alta execução profissional foram usados para apresentação de áudio. 29 sujeitos participaram em cada teste, e cada sujeito foi permitido participar em apenas um teste. Uma classificação de categoria absoluta (ACR) foi usada para recolher juízos de qualidade subjectiva. Os sujeitos classificaram a qualidade que usa a contínua escala de qualidade de 11 pontos recomendada nas Recomendações ITU-T P.910 [12] e mostrada na Figura 1. 0 áudio original incomprimido foram usados como referências escondidas nos testes, mas as notas para a referência escondida não foram subtraídas das notas, isto é nenhuma remoção de referência escondida foi aplicada.
Resultados de Teste
Resultados foram recolhidos de dois testes subjectivos supradescritos. Para cada teste subjectivo, a Nota Média de Opinião (MOS) foi computada por condição através de todos 19 ΕΡ2525353Β1 sujeitos, conteúdos e padrões de erro.
Alguns dos resultados de teste já têm sido apresentados em Ref. [9]. São reproduzidos aqui quando servem como base para o modelamento da qualidade de áudio.
No seguinte, o impacto de compressão na qualidade percebida do sinal áudio vai ser discutido. A Figura 2 mostra o impacto de qualidade da taxa de bits de áudio para os quatro codec usados nos testes e em ausência de perda de pacote. 0 melhor codec executante é heaac, seguido por aac, então mp3 e mp2. Para cada codec, a qualidade percebida como uma função da taxa de bits de áudio segue uma forma exponencial. Para o caso de não perda, uma análise de variância que usa a qualidade percebida como variável dependente, o codec, taxa de bits e conteúdos como variáveis independentes, e os sujeitos como variável aleatória, encontram um efeito significativo do conteúdo na qualidade percebida. Isto é particularmente válido para mp2, como mostrado na Figura 3, para que o conteúdo de apenas fala (conteúdo "B") produz qualidade inferior aos outros conteúdos. A Figura 4 mostra o impacto de qualidade de perda de trama uniforme para os quatro codec em várias taxas de bits. Pode ser observado que para uma dada taxa de bits, heaac e aac produzem qualidade similar sob perda de pacote. heaac parece estar a executar ligeiramente superior a aac em taxa de bits igual (64 kbps) , mas a diferença não é significativa, embora sistemática. 20 ΕΡ2525353Β1
Quer codec aac quer heaac são muito menos sensitivos a perda de trama de que mp2 e mp3. Por seu turno, mp2 executa melhor de que mp3. Estes resultados são esperados pois heaac e aac aplicam ocultação com base em interpolação e com base em repetição de trama enquanto mp2 e mp3 inserem silêncio como ocultação de erro.
Por fim, para taxas de perda de trama baixa a média e todos codec, a qualidade percebida aumenta com a taxa de bits. Isto reflecte o impacto de compressão em caso de taxa de perda de trama baixa a média enquanto este efeito é escondido em caso de taxa de perda de trama alta.
Nesta fase, temos estudado o impacto da perda de trama em caso de perda uniforme apenas. A Figura 5 mostra o impacto de qualidade de perda de rajada para mp2. Como para perda uniforme, tem sido observado para os diferentes níveis de rajada um pequeno impacto da taxa de bits, com qualidade superior para taxa de bits superior. 0 comprimento de rajada varia de uniforme a seis perdas tramas numa linha. Em taxa de perda de trama alta, o comprimento de rajada não tem impacto. Em taxa de perda de trama inferior, comprimento de rajada maior realça a qualidade. Esta observação é esperada estar ainda válida com comprimento de rajada superior. Nota que selecionar seis perdas de trama numa linha como comprimento de rajada máximo foi motivado pela encapsulação de trama: temos simulado o caso comum de ter seis tramas de áudio numa trama PES (Fluxo Elementar Empacotado) . Quando perder uma trama de áudio na trama PES, o descodif icador não pode ressincronizar até o próximo cabeçalho PES. Como uma 21 ΕΡ2525353Β1 consequência, perder a primeira trama de áudio da trama PES resulta em perder seis tramas numa linha.
No seguinte, o impacto de padrão de erro e tipo de conteúdo na qualidade percebida do sinal áudio vão ser discutidos.
Em caso de perda de trama, resultados foram até agora médios através de todos sujeitos, conteúdos e padrões de erro. Vale a pena investigar a validade da supraobservação quando tomar os resultados médios por conteúdo e por padrão de erro sobre através de os sujeitos. A Figura 6 mostra a qualidade percebida de taxa de perda uniforme para cada codec tomando os resultados médios por conteúdo e padrão de erro. É óbvio que os algoritmos de ocultação de perda implementados em heaac e aac executam muito melhor em conteúdos que não contêm fala (conteúdos "C" e "D") . Isto é esperado pois sinais de fala são muito menos estacionários de que sinal de não fala. Assim, quando repetir uma trama de áudio para compensar uma trama perdida como é o caso com aac, ou interpolando a trama de áudio de tramas não perdidas rodeadas com o é o caso com heaac, a ocultação é muito menos audível em caso de sinais estacionários. Esta dependência de conteúdo não é verdadeira para mp2 e mp3. Pelo contrário, o sinal de apenas fala "B" parece produzir melhor qualidade de que outros tipos de sinal.
Duas instanciações da mesma taxa de perda de trama para um dado codec e taxa de bits são representadas pelo 22 ΕΡ2525353Β1 mesmo símbolo numa linha vertical na Figura 6. Pode ser observado nesta figura que a influência do padrão de erro e assim da localização de perda é baixa especialmente comparada com o impacto de qualidade de taxa baixa e conteúdo em caso de heaac e aac.
Deveria ser recordado aqui que apenas um quarto dos sujeitos classificaram cada padrão de erro. Como uma consequência, os valores de intervalo de confiança de 95% são superiores ao uns usualmente obtemos quando tomar a média através de todos sujeitos. Isto reduz a probabilidade de ter uma diferença significativa entre a qualidade percebida de duas instanciações da mesma taxa de perda de trama. Isto confirma a baixa influência da localização de perda na qualidade percebida. Por motivo de clareza, o intervalo de confiança de 95% não foi representado na Fig. 6.
Uma análise de variância que toma como variável dependente a qualidade percebida, como variável independente a condição, o conteúdo e o padrão de erro, e como variável aleatória o sujeito, confirmou que a influência do tipo de conteúdo na qualidade percebida é significativa mas não a influência do padrão de erro.
Por fim, a Figura 7 mostra a qualidade percebida como uma função da taxa de perda de trama para áudio mp2 codificado de taxa de bits alta e perdas de rajada quando tomar os resultados por padrão de erro. Tem já sido supradiscutido que o comprimento de rajada influencia a qualidade percebida em caso de taxa de perda de trama 23 ΕΡ2525353Β1 baixa. Tomando agora as avaliações por padrão de erro, queremos verificar que mediar as avaliações por padrão de erro não estava a esconder uma influência superior do comprimento de rajada. A Figura 7 confirma a observação previamente fizemos na Figura 5: a influência do comprimento de rajada, embora bastante baixa, é visível, especialmente para taxas de perda de trama baixas. A Figura 8 mostra a qualidade de áudio como estimada pelo modelo descrito por Eqs. (1) a (3) versus a qualidade de áudio percebida. 0 modelo é avaliado contra resultados de testes subjectivo em termos de Correlação de Pearson (R) e Erro Quadrático Médio de Raiz (RMSE, no modelo de escala de 100 pontos). Mostra alta execução quer quando tomar os resultados médios através de todos conteúdos (R = 0,99 e um RMSE = 2,27) quer médios por conteúdo (R = 0,95 e um RMSE = 6,61) .
Com base nos resultados de testes de percepção de áudio, temos analisado o impacto de qualidade de compressão de áudio e perda de trama para quatro codec (MPEG-I Camada II&III, MPEG-2 AACLC, MPEG-4 HE-AACv2) e cinco tipos de conteúdo típicos para serviços IPTV. Os codec HE-AAC e AAC são o melhor codec executante quer em presença quer em ausência de perda de trama. Também temos observado que o comportamento dos quatro codec difere entre sinais sem fala e de fala, especialmente para o HE-AAC e AAC. Por fim, há uma tendência que perdas de rajada produzem melhor qualidade percebida de que perda uniforme enquanto a localização de perda não influencia a qualidade percebida. Estas análises serviram como base para o desenvolvimento de 24 ΕΡ2525353Β1 modelo de qualidade de áudio paramétrico para serviços IPTV. Este modelo toma como entrada o codec áudio, taxa de bits, taxa de perda de trama, comprimento de rajada e mostram alta correlação (R = 0.95) e baixo RMSE (RMSE = 6.61) com resultados de teste subjectivo.
Enquanto a invenção tem sido ilustrada e descrita em pormenor nos desenhos e descrição anterior, tal ilustração e descrição são serem consideradas ilustrativas ou exemplares e não restritivas. Deve ser entendido que mudanças e modificações podem ser feitas por esses de perícia comum dentro do âmbito das seguintes reivindicações. Em particular, a presente invenção cobre ainda formas de realização com qualquer combinação de características de diferentes formas de realização supra e infradescritas.
Aliás, nas reivindicações a palavra "que compreende" não exclui outros elementos ou etapas, e o artigo indefinido "um" ou "um" não exclui uma pluralidade. Uma única unidade pode cumprir as funções de várias características recitadas nas reivindicações. Os termos "essencialmente", "sobre", "aproximadamente" e semelhantes em ligação com um atributo ou um valor particularmente também definem exactamente o atributo ou exactamente o valor, respectivamente. Quaisquer sinais de referência nas reivindicações deveriam não ser construídos como limitando o âmbito. 25 ΕΡ2525353Β1
Referências [1] A.W. Rix, J.G. Beerends, e D.-S-Kim, "Estimação Objectiva de Qualidade Áudio e de Fala - Tecnologia e Aplicações," in IEEE Transactions on Audio, Speech and Language Processing, 2006, vol. 14 n°6.
[2] Recomendação ITU-T G.107, "O E-modelo, um modelo computacional para uso em planeamento de transmissão," 2005.
[3] A. Clark, "Descrição de algoritmo VQMON," in ITUT del. cont. COM12-D105, 2003.
[4] S. Broom, "VoIP: estimação de gualidade: Tomar em consideração do dispositivo periférico," in IEEE Trans. Audio Speech Language Process, 2006, vol. 14 n°6.
[5] A. Clark, "Modelar os efeitos de perda de pacote de rajada e recência em gualidade de voz subjectiva," in Workshop de Telefonia de Internet (IPtel), 2001.
[6] A. Raake, "Comportamento de perda de pacote a curto e longo prazo: Para previsão de gualidade de fala para distribuições de perda arbitrárias," in IEEE Trans. Audio, Speech Language Process, 2006, vol. 14 n°6.
[7] M. Graubner, P. Mogre, e T. Lorenzen, " Estimação QoE para Contribuição Áudio através de IP (ACIP)," in 38a Conferência Internacional sobre Avaliação de Qualidade de Som de AES, 2 010. 26 ΕΡ2525353Β1 [8] N. Egi, Τ. Hayashi, e A. Takahashi, "Modelo de Camada de Pacote Paramétrico para Avaliação Qualidade de Áudio em Serviços de Fluxo Multimédia, " in IEICE Transactions on Communications, 2010, vol. E93.B, pp. 1359-1366.
[9] B.Feiten,A. Raake, M.-N. Garcia,U. Wustenhagen, e J. Kroll, "Avaliação de Qualidade Subjectiva de Aplicações de Fluxo de Áudio e Escalas de Avaliação Absoluta e Emparelhada," in Pro. da 126a Convenção AES, 2009.
[10] M-N. Garcia e A. Raake, "Normalização de Resultados de Teste de Vídeo Subjectivo Que Usam um Teste de Referência E Condições de Âncora para Desenvolvimento de Modelo Eficiente," in Proc. De Segundo Workshop Internacional em Qualidade de Experiência Multimédia (QoMEX'10), 2010.
[11] "Recomendação ITU-T P.800: Métodos para Determinação Subjectiva de Qualidade de Transmissão.," 1996.
[12] "Recomendação ITU-T P. 910: Métodos de estimação de qualidade de vídeo subjectiva para aplicações multimédia," 1999.
[13] A. Raake, M.N. Garcia, S. Moeller, J. Berger,F. Kling, P. List, J. Johann, e C. Heidemann, "Modelo-T-V: Previsão com base em parâmetro de qualidade IPTV" in Proc. de ICASSP, 2008.
[14] M-N. Garcia e A. Raake, "Modelo de qualidade audiovisual com base em factor de degradação para IPTV," in Proc. de QOMEX, 2009. 27 ΕΡ2525353Β1
REFERÊNCIAS CITADAS NA DESCRIÇÃO
Esta lista de referências citadas pelo requerente é apenas para a conveniência do leitor. A mesma não faz parte do documento de Patente Europeia. Embora tenha sido tomado muito cuidado na compilação das referências, não se poderão excluir erros e omissões e o IEP nao assume qualquer responsabilidade neste sentido.
Documentos de Patente citados na descrição • EP 2413604 AI [0003]
Literatura não relacionada com patentes referida na descrição: • A.W. RIX; J.G. BEERENDS; D.-S-KIM. Objective Assessment of Speech and Audio Quality - Technology and Applications. IEEE Transactions on Audio, Speech and Language Processing, 2006, vol. 14 (6 [0078] • The E-model, a coirputational model for use in transmission planning. ITU-T Recommendation G.107. 2005 [0078] • A. CLARK. Description of VQMON algorithm. ITUT del. cont. COM12-D105, 2003 [0078] • S. BROCM. VoIP: quality assessment: Taking account of the edge-device. IEEE Trans. Audio Speech Language Process, 2006, vol. 14 (6 [0078] • A. CLARK. Modeling the effects of burst packet loss and recency on subjective voice quality. Internet Telephony Workshop (IPtel, 2001 [0078] • A. RAAKE. Short-and long-term packet loss behaviour: Towards speech quality prediction for arbitrary loss distributions. IEEE Trans. Audio, Speech Language Process, 2006, vol. 14 (6 [0078] 28 ΕΡ2525353Β1 • M. GRAURNER; Ρ. MOGRE; Τ. LORENZEN. QoE Assessment for Audio Contribution over IP (ACIP. AES 38th International Conference on Sound Quality Evaluation, 2010 [0078] • N. EGI; T. HAYASHI; A. TAKAHASHI. Parametric Packet-Layer Model for Evaluation Audio Quality in Multimedia Streaming Services. IEICE Transactions on Communications, 2010, vol. E93.B, 1359-1366 [0078] • B. FEITEN; A. RAAKE; M.-N. GARCIA; U. WUSTENHAGEN; J. KRDLL.
Subjective Quality Evaluation of Audio Streaming Applications on Absolute and Paired Rating Scales. Pro. of 126th AES Convention, 2009 [0078] • M-N. GARCIA; A. RAAKE. Normalization Of Subjective Video Test Results Using A Reference Test And Anchor Conditions For Efficient Model Development. Proc. of Second International Workshop on Quality of Multimedia Experience (QoMEX'10, 2010 [0078] • ITU-T Recommendation P.800: Methods for Subjective Determination of Transmission Quality, 1996 [0078] • ITU-T Recommendation P. 910: Subjective video quality assessment methods for multimedia applications, 1999 [0078] • A. RAAKE; M.N. GARCIA; S. MDELLER; J. BERGER; F. KLING; P. LIST; J. JOHANN; C. HEIDEMANN. T-V-MODEL: Parameter-based prediction of IPTV quality. Proc. of ICASSP, 2008 [0078] • M-N. GARCIA; A. RAAKE. Irnpairment-factor based audio-visual quality model for IPTV. Proc. of QCMEX, 2009 [0078]
Lisboa, 14 de Novembro de 2013 29

Claims (12)

  1. ΕΡ2525353Β1 REIVINDICAÇÕES 1. Método para estimar a qualidade de percepção de um sinal áudio descodificado que é descodificado de um sinal áudio codificado, ou de um sinal áudio encriptado, ou de um sinal áudio codificado e encriptado, o método que compreende a etapa de: a) estimar o impacto de qualidade de compressão IcodA devido a compressão de áudio; e caracterizado por a etapa de: b) estimar o impacto de qualidade de perda de trama ItraA devido a perda de trama de áudio, que usa o impacto de qualidade de compressão estimado IcodA, em que a etapa de estimar o impacto de qualidade de perda de trama ItraA usa pelo menos um de: um ou mais coeficientes, a taxa de perda de trama média Pfl, preferencialmente em percentagem, o número médio de tramas perdidas numa linha μ; e em que a etapa de estimar o impacto de qualidade de perda de trama ItraA é executada em conformidade com a equação ItraA — (60 - IcodA) Pfl((61 -// + 62) + ^/7) ’ em que bO, bl, e b2 sao coeficientes; e c) estimar a qualidade de percepção QA do sinal áudio descodificado que usa as estimações obtidas nas etapas anteriores. 1 ΕΡ2525353Β1 2. 0 método da reivindicação 1, em que a etapa a) de estimar o impacto de qualidade de compressão IcodA usa um ou mais coeficientes ou a taxa de bits ou um ou mais coeficientes e a taxa de bits, em que o um ou mais coeficientes dependem do tipo do sinal áudio codificado, ou sinal áudio encriptado, ou sinal áudio codificado e encriptado. 3. 0 método da reivindicação 2, em que a etapa a) de estimar o impacto de qualidade de compressão IcodA é executada em conformidade com a equação ícodA = al * exp(a2 · bitrate) + a3 , em que al, a2, e a3 são coeficientes que dependem de pelo menos um de: o tipo do sinal áudio codificado, o tipo do sinal áudio comprimido, o tipo do sinal áudio encriptado, e em que bitrate representa a taxa de bits. 4. 0 método de qualquer das reivindicações 1 a 3, em que etapa b) é executada que usa a equação Qa = Qoa - Icod/i , em que QoA representa uma qualidade de base fixa, e em que preferencialmente QoA = 100.
  2. 5. O método de qualquer das reivindicações 1 a 4, em que etapa c) é executada que usa uma das equações Qa =f(QoA , IcodA , ItraA) com uma função adequada f ; ou 2 ΕΡ2525353Β1 Qa = Qoa - a IcodA-β ItraA com 0 ^α,β^Ι; ou Qa = Qoa ~ IcodA ~ ltraA , em que QoA representa uma qualidade de base fixa, e em que preferencialmente QoA = 100.
  3. 6. O método de qualquer das reivindicações 1 a 5, em que os coeficientes são obtidos aplicando um procedimento de ajuste de curva de mínimo quadrado que usa as taxas de testes de percepção como valores alvo.
  4. 7. O método de qualquer das reivindicações anteriores, em que o sinal áudio é codificado/descodifiçado, ou encriptado/desencriptado, ou codificado/descodifiçado, e encriptado/desencriptado de acordo com um ou mais dos seguintes tipos de codec: MPEG-1 Camada II (mp2), MPEG-1 Camada III (mp3), MPEG-2 AAC LC (aac), MPEG-4 HE-AACv2 (heaac), e AC-3 (ac3).
  5. 8. O método de qualquer das reivindicações anteriores, em que o sinal áudio é pelo menos uma parte de um fluxo de dados não interactivo, preferencialmente um fluxo de áudio ou audiovisual não interactivo, ou pelo menos uma parte de um fluxo de dados interactivo, preferencialmente um fluxo de áudio ou audiovisual interactivo.
  6. 9. O método de qualquer das reivindicações anteriores, em que pelo menos uma parte dos coeficientes estão ainda a depender do conteúdo do sinal áudio. 3 ΕΡ2525353Β1
  7. 10. O método de qualquer das reivindicações anteriores, em que pelo menos um dos seguintes são computados da informação de cabeçalho de pacote extraída do fluxo de bit do sinal áudio e/ou derivada de informação de lado: pelo menos uma parte dos coeficientes, a taxa de bits, a taxa de perda de trama média Pfl, o número médio de tramas perdidas numa linha μ. 11. 0 método de qualquer das reivindicações anteriores, em que o método é combinado com um ou mais outros métodos para estimar o impacto na qualidade por outras degradações de que codificação, ou encriptação, ou codificação e encriptação de um sinal áudio, em que o um ou mais outros métodos cada compreendem pelo menos uma etapa de estimar uma qualidade de percepção do sinal áudio descodificado. 12. 0 método da reivindicação 11, em que a combinação do método das reivindicações 1 a 10 e o um ou mais outros métodos é uma função linear destes métodos ou uma função multiplicativa destes métodos.
  8. 13. O método de qualquer das reivindicações anteriores, em que o método é combinado com um método para estimar a qualidade de percepção de um sinal video descodificado que é descodificado de um sinal video codificado, ou um encriptado, ou um codificado e encriptado.
  9. 14. Método para monitorizar a qualidade de um sinal áudio transmitido com as etapas: A) transmitir o sinal áudio de um servidor ao cliente; 4 ΕΡ2525353Β1 B) lado de cliente que executa o método para estimar a qualidade de percepção do sinal áudio transmitido de acordo com qualquer das reivindicações 1 a 13; C) transferir o resultado da estimação de etapa B) ao servidor; D) lado de servidor que monitoriza a qualidade do sinal áudio transmitido. 15. 0 método para monitorizar a qualidade de um sinal áudio transmitido da reivindicação 14 com as etapas adicionais: E) analisar a qualidade monitorizada do sinal áudio transmitido, preferencialmente em dependência de parâmetros de transmissão; e opcionalmente F) mudar os parâmetros de transmissão com base na análise de etapa E) para aumentar a qualidade do sinal áudio transmitido.
  10. 16. Aparelho para estimar a qualidade de percepção de um sinal áudio descodificado que é descodificado de um sinal áudio codificado, ou um sinal áudio encriptado, ou um sinal áudio encriptado e codificado, o aparelho que compreende: um estimador de qualidade de compressão configurado para estimar o impacto de qualidade de compressão IcodA devido a compressão de áudio; e caracterizado por: 5 ΕΡ2525353Β1 o estimador de qualidade de compressão que é configurado para estimar o impacto de qualidade de perda de trama ItraA devido a perda de trama de áudio, que usa o impacto de qualidade de compressão estimado IcodA, em que estimar a qualidade de perda de trama ItraA usa pelo menos um de: um ou mais coeficientes, a taxa de perda de trama média Pfl, preferencialmente em percentagem, o número médio de tramas perdidas numa linha μ; e em que a estimação do impacto de qualidade de perda de trama ItraA é executada em conformidade com a equação ΕΡ2525353Β1 ItraA = (60 - IcodA ) pflm ·μ+ό2) + Ρ/1) * em que bO, bl, e b2 são coeficientes; e um ajustador configurado para ajustar a qualidade de percepção QA do sinal áudio descodificado. 17. 0 aparelho da reivindicação 16, em que o estimador de qualidade de compressão é configurado para estimar a qualidade de compressão usando a equação IcodA =al · exp(a2 bitrate) + a3 , em que al, a2, e a3 são coeficientes que dependem de pelo menos um de: o tipo do sinal áudio codificado, o tipo do sinal áudio comprimido, o tipo do sinal áudio encriptado, e em que bitrate representa a taxa de bits. 6 ΕΡ2525353Β1 18. 0 aparelho da reivindicação 16 ou 17, em que o ajustador é configurado para ajustar a qualidade de percepção QA do sinal áudio descodificado que usa a equação Qa = Qoa - IcodA - ItraA\ em que QoA representa uma qualidade de base fixa, e em que preferencialmente QoA = 100.
  11. 19. Aparelho para estimar a qualidade de percepção de um sinal áudio descodificado que é descodificado de um sinal áudio codificado e/ou encriptado, o aparelho que compreende um computador ou microchip configurado para executar o método de acordo com as reivindicações 1 a 15.
  12. 20. Descodificador ligável a um receptor para receber um sinal áudio codificado e/ou encriptado, em que o descodificador compreende o aparelho de acordo com qualquer das reivindicações 16 a 18. Lisboa, 14 de Novembro de 2013 7
PT121666440T 2011-05-16 2012-05-03 Modelo de qualidade de áudio paramétrico para serviços iptv PT2525353E (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP11004036 2011-05-16
EP11004037 2011-05-16

Publications (1)

Publication Number Publication Date
PT2525353E true PT2525353E (pt) 2013-11-22

Family

ID=45999725

Family Applications (1)

Application Number Title Priority Date Filing Date
PT121666440T PT2525353E (pt) 2011-05-16 2012-05-03 Modelo de qualidade de áudio paramétrico para serviços iptv

Country Status (5)

Country Link
EP (1) EP2525353B1 (pt)
ES (1) ES2435673T3 (pt)
HR (1) HRP20131043T1 (pt)
PL (1) PL2525353T3 (pt)
PT (1) PT2525353E (pt)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104517613A (zh) * 2013-09-30 2015-04-15 华为技术有限公司 语音质量评估方法及装置
CN105100508B (zh) 2014-05-05 2018-03-09 华为技术有限公司 一种网络语音质量评估方法、装置和系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102057634B (zh) * 2008-06-11 2015-01-28 日本电信电话株式会社 音频质量估计方法以及音频质量估计设备
EP2413604B1 (en) 2010-07-30 2014-09-10 Deutsche Telekom AG Assessing the quality of a video signal during encoding or compressing of the video signal

Also Published As

Publication number Publication date
ES2435673T3 (es) 2013-12-20
EP2525353A1 (en) 2012-11-21
EP2525353B1 (en) 2013-10-16
HRP20131043T1 (hr) 2014-01-17
PL2525353T3 (pl) 2014-02-28

Similar Documents

Publication Publication Date Title
Chinen et al. ViSQOL v3: An open source production ready objective speech and audio metric
Hines et al. ViSQOLAudio: An objective audio quality metric for low bitrate codecs
US8625451B2 (en) Methods, systems, and computer readable media for non intrusive mean opinion score (MOS) estimation based on packet loss pattern
Hines et al. Perceived audio quality for streaming stereo music
Martinez et al. Combining audio and video metrics to assess audio-visual quality
PT2525353E (pt) Modelo de qualidade de áudio paramétrico para serviços iptv
US20150269952A1 (en) Method, an apparatus and a computer program for creating an audio composition signal
Jelassi et al. A study of artificial speech quality assessors of VoIP calls subject to limited bursty packet losses
Garcia et al. Impairment-factor-based audio-visual quality model for IPTV
JP4761391B2 (ja) 受聴品質評価方法および装置
Diallo et al. A hybrid contextual user perception model for streamed video quality assessment
Polacký et al. An analysis of the impact of packet loss, codecs and type of voice on internal parameters of P. 563 model
Zach et al. Quality of experience of voice services in corporate network
Hoene et al. Predicting performance of PESQ in case of single frame losses
Garcia et al. Parametric audio quality model for IPTV services-ITU-T P. 1201.2 audio
Filippov et al. Feasibility analysis of ITU-T P. 1201 Amd. 2 standard for video on demand services
Garcia et al. Audio Quality Model
Orosz et al. A no-reference voice quality estimation method for Opus-based VoIP services
Lee et al. Speech quality estimation of voice over internet protocol codec using a packet loss impairment model
Orosz et al. A new application-aware no-reference quality assessment method for IP voice services
Jelassi et al. Single-ended parametric voicing-aware models for live assessment of packetized VoIP conversations
Sun et al. Voip quality of experience (QoE)
Hosek et al. On predicting video quality expectations of mobile users
Feiten et al. Audio transmission
Issing et al. Flexible playout adaptation for low delay AAC RTP communication