BRPI0808965A2 - Medição de intensidade sonora com modificações espectrais - Google Patents

Medição de intensidade sonora com modificações espectrais Download PDF

Info

Publication number
BRPI0808965A2
BRPI0808965A2 BRPI0808965-5A BRPI0808965A BRPI0808965A2 BR PI0808965 A2 BRPI0808965 A2 BR PI0808965A2 BR PI0808965 A BRPI0808965 A BR PI0808965A BR PI0808965 A2 BRPI0808965 A2 BR PI0808965A2
Authority
BR
Brazil
Prior art keywords
spectral
representation
audio signal
shape
sound intensity
Prior art date
Application number
BRPI0808965-5A
Other languages
English (en)
Inventor
Alan Jeffrey Seefeldt
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Publication of BRPI0808965A2 publication Critical patent/BRPI0808965A2/pt
Publication of BRPI0808965B1 publication Critical patent/BRPI0808965B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

Relatório Descritivo da Patente de Invenção para "MEDIÇÃO DE INTENSIDADE SONORA COM MODIFICAÇÕES ESPECTRAIS".
Campo da Técnica
A presente invenção refere-se a um processamento de sinal de 5 áudio. Em particular, a presente invenção se refere-se à medição da intensidade sonora percebida de um sinal de áudio por meio da modificação da representação espectral de um sinal de áudio como uma função de sua forma espectral de referência de modo que a representação espectral do sinal de áudio conforme-se de uma forma mais estrita à forma espectral de refe10 rência, e por meio do cálculo da intensidade sonora percebida da representação espectral modificada do sinal de áudio.
Referências e Incorporação por Referência
Certas técnicas para medir objetivamente uma intensidade sonora (psicoacústica) percebida, úteis para um melhor entendimento dos aspectos da presente invenção são descritas na Publicação Internacional WO 2004/111994 A2, de Alan Jeffrey Seefeldt et al., apresentada em 23 de dezembro de 2004, intitulada "Method, Apparatus and Computer Program for Calculating and Adjusting the Perceived Loudness of an Audio Signal", no Pedido de Patente resultante US N. 2007/0092089, depositado em 26 de abril de 2007, e no documento "A New Objective Measure of Perceived Loudness", de Alan Seefeldt et al., Audio Engineering Society Convention Paper 6236, San Francisco, de 28 de outubro de 2004. A dita Publicação WO 2004/11 1994 A2 e dito Pedido de Patente U.S. N. 2007/0092089 e o dito documento imediatamente acima são incorporados ao presente relatório descritivo a título de referência em suas totalidades.
Antecedentes da Técnica
Existem muitos métodos para medir objetivamente a intensidade sonora percebida de sinais de áudio. Exemplos destes métodos incluem as medidas de força ponderadas A, B, e C, bem como os modelos psicoacústi30 cos de intensidade sonora, como descritos no documento "Acoustics - Method for calculating Ioundness levei," ISO 532 (1975) e a dita publicação WO 2004/111994 A2 e Pedido de Patente U.S. N. 2007/0092089. As medidas de força ponderadas operam ao considerar um sinal de entrada de áudio, aplicar um filtro conhecido que enfatiza as frequências mais perceptivelmente sensíveis e desconsidera as frequências perceptivelmente menos sensíveis, e, em seguida, calcular a potência do sinal filtrado por uma extensão de 5 tempo predeterminada. Os métodos psicoacústicos são normalmente mais complexos e visam modelar melhor o trabalho do ouvido humano. Tais métodos psicoacústicos dividem o sinal em faixas de frequência que imitam a resposta de frequência e a sensibilidade do ouvido e, em seguida, manipulam e integram as bandas, levando em consideração fenômenos psicoacús10 ticos, tais como a frequência e o mascaramento temporal, bem como a percepção não-linear, com variadas intensidades de sinal. O objetivo de todos estes métodos é obter uma medida numérica que corresponda mais proximamente à impressão subjetiva do sinal de áudio.
O inventor descobriu que as medições de uma intensidade sonora objetiva descrita não encontram uma correspondência precisa às impressões subjetivas para determinados tipos de sinais de áudio. Na dita publicação WO 2004/111994 e Pedido de Patente U.S. N. 2007/0092089, estes sinais problemáticos são descritos como "banda estreita", significando que a maior parte da potência do sinal fica concentrada em uma ou várias pequenas porções do espectro sonoro. Nos ditos pedidos, é apresentado um método para lidar com esses sinais, envolvendo a modificação de um modelo psicoacústico tradicional de percepção de intensidade sonora a fim de incorporar dois aumentos de funções de intensidade sonora: um para os sinais de "banda larga" e outro para os sinais de "banda estreita". A publicação WO 2004/111994 A2 e Pedido de Patente U.S. N. 2007/0092089 descrevem uma interpolação entre as duas funções com base em uma medida da "estreiteza de banda" do sinal.
Embora tal método de interpolação melhore o desempenho da medição da intensidade sonora objetiva com relação às impressões subjetivas, o inventor, desde então, desenvolveu um modelo psicoacústico alternativo de percepção da intensidade sonora que, ele acredita, explica e resolve de uma maneira melhor as diferenças entre as medições da intensidade sonora objetiva e subjetiva para os sinais problemáticos de "banda estreita". A aplicação de tal modelo alternativo à medição da intensidade sonora objetiva constitui um aspecto da presente invenção.
Descrição dos Desenhos A figura 1 mostra um diagrama em blocos esquemático simplifi
cado de aspectos da presente invenção.
As figuras 2A, B, e C mostram, de uma maneira conceituai, um exemplo de aplicação de modificações espectrais, de acordo com os aspectos da invenção, a um espectro de áudio idealizado que contém frequências predominantemente graves.
As figuras 3A, B, e C mostram, de uma forma conceituai, um exemplo de aplicação de modificações espectrais, de acordo com os aspectos da presente invenção, a um espectro de áudio idealizado similar a um espectro de referência.
A figura 4 mostra um conjunto de respostas críticas de filtro de
banda, úteis na computação de um sinal de excitação para um modelo de intensidade sonora psicoacústica.
A figura 5 mostra os contornos de uma intensidade sonora igual de acordo com o ISO 226. A escala horizontal é a frequência em Hertz (escala logarítmica de base 10) e a escala vertical é o nível de pressão sonora em decibéis.
A figura 6 é um gráfico que compara as medidas de intensidade sonora objetiva a partir de um modelo psicoacústico não-modificado às medidas de intensidade sonora subjetiva para um banco de dados de gravações de áudio.
A figura 7 é um gráfico que compara as medidas de intensidade sonora objetiva a partir de um modelo psicoacústico, empregando aspectos da presente invenção, às medidas de intensidade sonora subjetiva para o mesmo banco de dados de gravações de áudio.
Descrição da Invenção
De acordo com os aspectos da presente invenção, o método para medir a intensidade sonora percebida de um sinal de áudio inclui a obtenção de uma representação espectral do sinal de áudio, a modificação da representação espectral como uma função da forma espectral de referência de modo que a representação espectral do sinal de áudio conforme-se mais estritamente a uma forma espectral de referência, e o cálculo da intensidade sonora percebida da representação espectral modificada do sinal de áudio. A modificação da representação espectral como uma função da forma espectral de referência pode incluir a minimização da função das diferenças entre a representação espectral e a forma espectral de referência, e a definição de um nível para a forma espectral de referência em resposta à minimização. A minimizando da função das diferenças poderá minimizar a média ponderada das diferenças entre a representação espectral e a forma espectral de referência. A minimização da função das diferenças poderá ainda incluir a aplicação de um deslocamento de modo a alterar as diferenças entre a representação espectral e a forma espectral de referência. O deslocamento pode ser um deslocamento fixo. A modificação da representação espectral como uma função da forma espectral de referência poderá ainda incluir a tomada do nível máximo da representação espectral do sinal de áudio e da forma espectral da referência definida em níveis. A representação espectral do sinal de áudio pode ser um sinal de excitação que aproxima a distribuição de potência ao longo da membrana basilar do ouvido interno.
De acordo com outros aspectos da presente invenção, o método de medição da intensidade sonora percebida de um sinal de áudio inclui a obtenção de uma representação de sinal de áudio, a comparação da representação de sinal de áudio a uma representação de referência a fim de de25 terminar quão próximo a representação de sinal de áudio está da representação de referência, a modificação de, pelo menos, uma parte da representação de sinal de áudio de modo que a representação modificada resultante do sinal de áudio corresponda mais proximamente à representação de referência, e a determinação da intensidade sonora percebida do sinal de áudio 30 a partir da representação modificada do sinal de áudio. A modificação de pelo menos uma parte da representação de sinal de áudio poderá incluir o ajuste do nível da representação de referência no que diz respeito ao nível da representação de sinal de áudio. O nível da representação de referência pode ser ajustado de modo a minimizar a função das diferenças entre o nível da representação de referência e o nível da representação de sinal de áudio. A modificação de pelo menos uma parte da representação de sinal de áudio 5 pode incluir o aumento do nível de partes do sinal de áudio.
De acordo com ainda com outros aspectos da presente invenção, um método para determinar a intensidade sonora percebida de um sinal de áudio inclui a obtenção de uma representação de sinal de áudio, a comparação da forma espectral da representação de sinal de áudio a uma forma 10 espectral de referência, o ajuste do nível da forma espectral de referência de modo a corresponder à forma espectral da representação de sinal de áudio para que as diferenças entre a forma espectral da representação de sinal de áudio e a forma espectral de referência sejam reduzidas, a designação de uma forma espectral modificada de representação de sinal de áudio através 15 do aumento de porções da forma espectral da representação de sinal de áudio a fim de acentuar ainda mais a correspondência entre a forma espectral da representação de sinal de áudio e a forma espectral de referência, e a determinação de uma intensidade sonora percebida do sinal de áudio com base na forma espectral modificada da representação de sinal de áudio. O 20 ajuste pode incluir a minimização da função das diferenças entre a forma espectral da representação de sinal de áudio e a forma espectral de referência, e a definição de um nível para a forma espectral de referência em resposta à minimização. A minimização da função das diferenças poderá minimizar a média ponderada das diferenças entre a forma espectral da repre25 sentação de sinal de áudio e a forma espectral de referência. A minimização da função das diferenças pode ainda incluir a aplicação de um deslocamento de modo a alterar as diferenças entre a forma espectral da representação de sinais de áudio e a forma espectral de referência. O deslocamento pode ser um deslocamento fixo. A modificação da representação espectral como uma 30 função da forma espectral de referência poderá ainda incluir a tomada do nível máximo da representação espectral do sinal de áudio e da forma espectral de referência definida em níveis. De acordo com outros aspectos da presente invenção, a representação de sinal de áudio pode ser um sinal de excitação que se aproxima da distribuição de potência ao longo da membrana basilar do ouvido interno.
Outros aspectos da presente invenção incluem aparelhos para a 5 realização de qualquer um dos métodos acima e um programa de computador, armazenado em um meio legível em computador de modo a fazer com que um computador execute qualquer um dos métodos acima citados.
Melhor Modo para se Executar a Invenção
De um modo geral, todas as medições de intensidade sonora objetiva anteriormente mencionadas (tanto as medições de potência ponderada como os modelos psicoacústicos) podem ser vistas como a integração através de frequência de uma representação do espectro do sinal de áudio. No caso de medições de potência ponderada, este espectro é o espectro de potência do sinal multiplicado pelo espectro de potência do filtro de ponderação escolhido. No caso de um modelo psicoacústico, este espectro pode ser uma função não-linear da potência dentro de uma série de bandas críticas consecutivas. Conforme mencionado acima, acredita-se que as medidas objetivas de intensidade sonora provenham um desempenho reduzido para os sinais de áudio que possuem um espectro anteriormente descrito como "banda estreita".
Ao invés de visualizar tais sinais como banda estreita, o inventor desenvolveu uma explicação mais simples e intuitiva baseada na premissa de que esses sinais sejam diferentes para a forma espectral média de sons simples. Pode-se argumentar que a maioria dos sons encontrados na vida 25 cotidiana, particularmente a fala, possui uma forma espectral que não se afasta muito significativamente de uma forma espectral média "esperada". Esta forma espectral média apresenta uma diminuição geral na potência com a frequência crescente, que é passada em banda entre a maior e a menor frequências audíveis. Quando se avalia a intensidade acústica de um 30 som que possui um espectro que se desvia significativamente de tal forma espectral média, é uma hipótese do presente inventor de se poder cognitivamente "preencher" até certo grau as áreas do espectro que não tem a potência esperada. A impressão geral da intensidade sonora é, então, obtida por meio da integração através da frequência de um espectro modificado que inclui uma porção espectral cognitivamente "preenchida" do que pelo espectro de sinal em questão. Por exemplo, se alguém estiver ouvindo uma música com apenas um baixista tocando, é de se esperar que, de modo geral, outros instrumentos, eventualmente, se juntem ao baixo e preencha o espectro. Em vez de julgar a intensidade sonora geral do solo do baixo, a partir de seu espectro sozinho, o presente inventor acredita que uma parte da percepção geral da intensidade sonora é atribuída às frequências ausentes que se espera acompanhar o baixo. Uma analogia pode ser feita com o conhecido efeito "fundamental ausente" na psicoacústica. Quando alguém ouve uma série de tons harmonicamente relacionados, mas a frequência fundamental da série encontra-se ausente, esta pessoa poderá ainda perceber a série como tendo um passo correspondente à frequência da fundamental ausente.
De acordo com os aspectos da presente invenção, o hipotético fenômeno subjetivo acima é integrado a uma medida objetiva da intensidade sonora percebida. A figura 1 ilustra uma visão geral dos aspectos da presente invenção que se aplica a qualquer uma das medidas objetivas já mencio20 nadas (isto é, tanto aos modelos de potência ponderada como aos modelos psicoacústicos). Como uma primeira etapa, um sinal de áudio x pode ser transformado em uma representação espectral X compatível com a medida de intensidade sonora objetiva em especial utilizada. Um espectro de referência fixa Y representa a forma espectral média esperada, hipotética acima 25 apresentada. Este espectro de referência pode ser pré-computado, por exemplo, ao calcular-se os espectros de um banco de dados representativo de sons simples. Como uma etapa seguinte, um espectro de referência Y pode "corresponder" ao espectro de sinal X de modo a gerar um espectro de referência definido em níveis Ym- A correspondência significa que Ym é gera30 do como uma escala de nível de Y de modo que o nível do espectro de referência correspondente Ym fique alinhado ao sinal X, o alinhamento sendo uma função da diferença de nível entre X e Ym através da frequência. O alinhamento de níveis pode incluir uma minimização de uma diferença ponderada ou não-ponderada entre X e Ym através da frequência. Essa ponderação pode ser definida de várias maneiras, mas pode ser escolhida de modo que as porções do espectro X que se desviam mais do espectro de referência Y sejam ponderadas mais fortemente. Desta forma, as porções mais "incomuns" do espectro de sinal X ficam alinhadas mais próximas de Ym- Em seguida, um espectro de sinal modificado Xc é gerado ao modificar X de modo a ficar próximo do espectro de referência correlato Ym de acordo com um critério de modificação. Como será detalhada abaixo, esta modificação pode assumir a forma de uma seleção simples do máximo de X e Ym através da frequência, o que simula o "preenchimento" cognitivo acima descrito. Finalmente, o espectro de sinal modificado Xc pode ser processado de acordo com a medida de intensidade sonora objetiva selecionada (isto é, algum tipo de integração através de frequência) de modo a produzir um valor de intensidade sonora objetiva L.
As figuras 2A a 2C e 3A a 3C ilustram, respectivamente, exemplos da computação dos espectros de sinal modificados Xc para dois espectros de sinal originais diferentes X. Na figura 2A, o espectro de sinal original X, representado pela linha cheia, contém a maior parte da sua potência nas 20 frequências graves. Em comparação a um espectro de referência Y ilustrado, representado pelas linhas tracejadas, a forma do espectro de sinal X é considerada "incomum". Na figura 2A, o espectro de referência é inicialmente mostrado em um nível de partida arbitrário (a linha tracejada superior), acima do espectro de sinal X. O espectro de referência pode ser reduzido 25 em níveis de modo a coincidir com o espectro de sinal X, criando um espectro de referência correspondente Ym (a linha tracejada inferior). Pode-se notar que Ym correlaciona-se mais estritamente às frequências graves de X, o que pode ser considerado a parte "incomum" parte do espectro de sinal em relação ao espectro de referência. Na figura 2B, as partes do espectro de 30 sinal X abaixo ao espectro de referência correspondente Ym são iguais a Ym, modelando, assim, o processo de "preenchimento" cognitivo. Na figura 2C, vê-se o resultado de que o espectro de sinal modificado Xe, representado pela linha pontilhada, é igual ao número máximo de X e Ym através da frequência. Neste caso, a aplicação da modificação espectral adicionou uma quantidade significativa de potência ao espectro de sinal original nas frequências mais altas. Como resultado, a intensidade sonora computada a 5 partir do espectro de sinal modificado Xc é maior do que teria sido computada a partir do espectro de sinal original X, que vem a ser o efeito desejado.
Nas figuras 3A a 3C, o espectro de sinal X é similar ao espectro de referência Y. Como resultado, um espectro de referência correspondente Ym pode ser inferior ao espectro de sinal X em todas as frequências, e o es10 pectro de sinal Xc pode ser igual ao espectro de sinal X original. Neste exemplo, a alteração de forma alguma afetará a medição de intensidade sonora subsequente. Para a maioria dos sinais, os seus espectros ficam suficientemente próximos do espectro modificado, como nas figuras 3A a 3C, de tal modo que nenhuma modificação é aplicada e, portanto, não ocorre ne15 nhuma alteração à computação da intensidade sonora. De preferência, apenas os espectros "incomuns", como os das figuras 2A a 2C, são modificados.
Na dita publicação WO 2004/111994 e Pedido de Patente U.S. N. 2007/0092089, Seefeldt et al. apresentam, entre outras coisas, uma me20 dida objetiva da intensidade sonora percebida com base em um modelo psicoacústico. A modalidade preferida da presente invenção pode aplicar a modificação espectral descrita a tal modelo psicoacústico. O modelo, sem a modificação, é primeiramente revisado e, em seguida, são apresentados os detalhes da aplicação da modificação.
A partir de um sinal de áudio, x[n], o modelo psicoacústico pri
meiramente calcula um sinal de excitação E[b,t] que se aproxima da distribuição de potência ao longo da membrana basilar do ouvido interno em uma banda crítica B durante o bloco de tempo t. Essa excitação pode ser calculada a partir da Transformada de Fourier Discreta de Curto Prazo (Short-time
Discrete Fourier Transform) (STDFT) do sinal de áudio, como segue:
E[b,t]=XbE[b,t-\] + (l-Aè)^ITO2 I Cb[kf \X[k,t]\2 (1)
k
na qual X[k,tj representa a transformada STDFT de x[n] no bloco de tempo t e no binário k, onde k é o índice binário de frequência na transformada, T[k] representa a resposta de frequência de um filtro que simula a transmissão de áudio através do ouvido externo e médio, e Cb[k] representa a resposta de frequência da membrana basilar em um local correspondente 5 à banda crítica b. A figura 4 apresenta um conjunto adequado de respostas críticas de filtro de banda nas quais quarenta bandas são espaçadas uniformemente ao longo da escala de Largura de Banda Retangular Equivalente (Equivalent Rectangular Bandwidth) (ERB), conforme definida por Moore e Glasberg (Moore B.C.J., B. Glasberg, T. Baer1 no documento "A Model for 10 the Prediction of Thresholds, Loudness, and Partial Loudness", Journal of the Audio Engineering Society, Vol. 45, N. 4, abril de 1997, pp. 224-240). Cada forma de filtro é descrita por uma função exponencial arredondada e as bandas são distribuídas usando um espaçamento de 1 ERB. Por fim, o aplainamento da constante de tempo λb em (I) pode ser vantajosamente es15 colhido proporcional ao tempo de integração da percepção de intensidade sonora humana dentro da faixa B.
Ao se usar contornos iguais de intensidade sonora, tais como os ilustrados na figura 5, a excitação em cada faixa é transformada em um nível de excitação que gera a mesma intensidade sonora a 1 kHz. A intensidade 20 sonora específica, uma medida da intensidade sonora perceptiva distribuída através de frequência e tempo, é em seguida computada a partir da excitação transformada, E|kHz[b,t], através de uma não-linearidade compressiva. Tal função adequada para computar a intensidade sonora específica N[b,t] é dada por:
E\kHz[b,t]
-1
(2)
na qual TQikHz é o limite em silêncio a 1 kHz e β e α são escolhidos de modo a corresponder à impressão subjetiva do aumento da intensidade sonora para um tom de IkHz. Embora um valor de 0,24 para β e um valor de 0,045 para α tenham sido considerados adequados, esses valores 30 não vêm a ser uma questão importante. Finalmente, a intensidade sonora total, L[t], representada em unidades de som, é calculada por meio da soma da intensidade sonora específica através das bandas:
m=YjNibj] (3)
b
Neste modelo psicoacústico, existem duas representações espectrais intermediárias do áudio antes da computação da intensidade sonora 5 total: a excitação E[b,t] e a intensidade sonora específica N[b,t]. Para a presente invenção, a modificação espectral pode ser aplicada a ambas, mas a aplicação da modificação à excitação ao invés da intensidade sonora específica simplifica os cálculos. Isso se deve ao fato de a forma da excitação através da frequência ser invariável ao nível geral do sinal de áudio. Isso se re10 flete na maneira na qual os espectros mantêm a mesma forma em diferentes níveis, conforme mostrado nas figuras 2A a 2C e 3A a 3C. Sendo assim, os exemplos aqui oferecidos aplicam-se às modificações espectrais para uma representação espectral de excitação.
Continuando com a aplicação da modificação espectral à excita15 ção, pressupõe-se existir uma excitação Y[b] de referência fixa. Na prática, Y[b] pode ser criada ao se calcular as excitações computadas a partir de um banco de dados de sons contendo um grande número de sinais de fala. A fonte de um espectro de excitação de referência Y[b] não vem a ser uma questão crítica para a presente invenção. Ao se aplicar a modificação, é útil 20 se trabalhar com as representações de decibéis da excitação de sinal E[b,t] e com a excitação de referência Y[b]:
EdB[b, t] = IOloglO (E[b, tj) (4a)
YdB[b] = IOloglO(YfbJ) (4b)
Como urna primeira etapa, a excitação de referência em decibéis YdB[b] poderá ser correlacionada à excitação de sinal em decibéis EdB [b,t] de modo a gerar a excitação de referência em decibéis correspondente YdBMÍb], na qual YdBM[b] é representada como um escalonamento (ou deslocamento aditivo ao se usardB) da excitação de referência:
YdBMfbJ = YdB [b] + A (5)
O deslocamento correspondente Δμ é computado como uma
função da diferença, A[b], entre EdB[b, t] e YdB[b]:
A[b] = EdB[b, t] - YdB[b] (6) A partir desta excitação de diferença, A[b], uma ponderação, W[b], é calculada como a excitação de diferença normalizada de modo a apresentar um mínimo de zero e, em seguida, elevada a uma potência γ:
W[b] = (A[b]-mmb{A[b]}Y (7)
Na prática, a definição de γ = 2 funciona bem, embora este valor
não é crítico e outras ponderações poderão ser empregadas ou nenhum tipo de ponderação (isto é, γ = 1) deverá ser empregada. O deslocamento correspondente Δμ é então calculado como a média ponderada da excitação de diferença, A[b], mais um deslocamento de tolerância, Δτ0ι:
Y_W[b]A[b]
Λ"-'ίΣ*ί»Γ+Δ’" <8>
b
A ponderação da equação 7, quando superior a um, faz com que as partes da excitação de sinal EdB[b,t] sejam diferentes da maior parte da excitação de referência YdB[b] de modo a contribuir ainda mais para o deslocamento correspondente Δμ. O deslocamento de tolerância Δχ0ι afeta a 15 quantidade de "preenchimento" que ocorre quando uma modificação é aplicada. Na prática, a definição de Δχ0ι = -12dB funciona bem, resultando no fato de a maioria dos espectros de áudio ser deixada inalterada através da aplicação da modificação. (Nas figuras 3A a 3C, é esse valor negativo de Δχοΐ que faz com que o espectro de referência correspondente caia comple20 tamente, ao invés de ser comensurado ao espectro de sinal e, portanto, não resultando em nenhum ajuste do espectro de sinal).
Quando a excitação de referência correspondente é calculada, a modificação é aplicada de modo a gerar uma excitação de sinal modificada ao considerar o máximo de EdB[b, t] e de YdBM[b] através das bandas:
EdBc[b,t] = (max {EdB[b,t], YdBM [b]} (9)
A representação em decibéis da excitação modificada é em seguida convertida novamente a uma representação linear:
Ec [b, t] = 10 EdBC[b't]/w (10)
Esta excitação de sinal modificada Ec[b,t], em seguida, substitui a excitação de sinal original E[b,t] nas etapas restantes de computação de uma intensidade sonora de acordo com um modelo psicoacústico (ou seja, ao se computar uma intensidade sonora específica e somar a intensidade sonora específica através das faixas, como consta nas Equações 2 e 3).
A fim de demonstrar a utilidade prática da presente invenção, as figuras 6 e 7 ilustram dados que mostram como os modelos psicoacústicos 5 modificados e não-modificados, respectivamente, provêm a intensidade sonora subjetivamente avaliada de um banco de dados de gravações de áudio. Em cada gravação de teste no banco de dados, pede-se que as pessoas ajustem o volume do áudio de modo a corresponder à intensidade sonora de alguma gravação de referência fixa. Em cada gravação de teste, as pessoas 10 poderiam instantaneamente alternar para frente e para trás entre a gravação de teste e a gravação de referência a fim de avaliar a diferença de intensidade sonora. Para cada pessoa, o ganho de volume ajustado final em dB era armazenado em cada gravação de teste, e esses ganhos foram, em seguida, medidos por muitas pessoas a fim de gerar uma medida de intensidade 15 sonora subjetiva em cada gravação de teste. Ambos os modelos psicoacústicos não-modificados e modificados foram em seguida usados para gerar uma medida objetiva da intensidade sonora de cada uma das gravações no banco de dados, e estas medidas objetivas são comparadas às medidas subjetivas das figuras 6 e 7. Em ambas as figuras, o eixo geométrico hori20 zontal representa a medida subjetiva, em dB, e o eixo geométrico vertical representa a medida objetiva em dB. Cada ponto na figura representa uma gravação no banco de dados e, quando a medida objetiva coincide perfeitamente com a medida subjetiva, cada ponto, neste caso, irá cair exatamente sobre a linha diagonal.
Para o modelo psicoacústico não-modificado na figura 6, nota-se
que a maior parte dos pontos de dados cai próxima à linha diagonal, mas existe um número significativo de casos anômalos acima da linha. Estes valores discrepantes representam os sinais problemáticos apresentados acima, e o modelo psicoacústico não-modificado classifica os mesmos como baixos 30 demais em comparação com classificação média subjetiva. No banco de dados como um todo, o Erro Médio Absoluto (AAE) entre as medidas objetiva e subjetiva é de 2,12 dB, o que é bastante baixo, mas o Erro Máximo Absoluto (MAE) atinge um resultado elevado de 10,2 dB.
A figura 7 apresenta os mesmos dados para o modelo psicoacústico modificado. Neste caso, a maior parte dos pontos de dados é igual aos dos pontos da figura 6, com exceção dos valores discrepantes coloca5 dos alinhados com outros pontos agrupados em torno da diagonal. Em comparação com o modelo psicoacústico não-modificado, o erro médio AAE é ligeiramente reduzido para 1,43 dB, e o erro máximo MAE é significativamente reduzido para 4dB. Sendo assim, o benefício da modificação espectral dos sinais previamente discrepantes torna-se facilmente aparente.
Implementação
Embora em princípio a presente invenção possa ser praticada tanto no domínio analógico como no domínio digital (ou em alguma combinação dos dois), nas modalidades práticas da presente invenção, os sinais de áudio são representados por amostras em blocos de dados e o processarnento é feito no domínio digital.
A presente invenção pode ser implementada em um hardware ou em um software, ou em uma combinação de ambos (por exemplo, em dispositivos lógicos programáveis). Salvo disposição em contrário, os algoritmos e processos incluídos como parte da presente invenção não dizem 20 respeito intrinsecamente a nenhum computador específico ou outro aparelho. Em particular, em geral várias máquinas de uso geral podem ser utilizadas com programas escritos de acordo com os presentes ensinamentos, ou poderá ser mais conveniente construir aparelhos mais especializados (por exemplo, circuitos integrados) para a execução de etapas metodológicas 25 específicas. Deste modo, a presente invenção pode ser implementada em um ou mais programas de computador em execução em um ou mais sistemas de computador programáveis, cada qual compreendendo pelo menos um processador, pelo menos um sistema de armazenamento de dados (incluindo elementos de armazenamento e/ou de memória voláteis e não30 voláteis), pelo menos um dispositivo ou porta de entrada, e pelo menos um dispositivo ou porta de saída. Um código programático é aplicado de modo a entrar dados no sentido de executar as funções descritas no presente documento e gerar informações de saída. As informações produzidas são aplicadas a um ou mais dispositivos de saída, de uma forma conhecida.
Cada programa pode ser implementado em qualquer linguagem de computador desejada (incluindo as linguagens de máquina, de monta5 gem, ou as linguagens de alto nível procedural, lógicas ou de programação orientadas a objeto) a fim de comunicar-se com um sistema de computador. Em qualquer caso, a linguagem pode ser uma linguagem compilada ou interpretada.
Cada programa de computador é de preferência armazenado em ou transferido para um meio ou dispositivo de armazenamento (por exemplo, uma memória ou meio de estado sólido, ou um meio magnético ou óptico) legível por um computador programável de uso geral ou especial para a configuração e utilização do computador quando o meio ou dispositivo de armazenamento é lido pelo sistema de computador a fim de executar os procedimentos descritos no presente documento. Pode-se ainda considerar a implementação do sistema da presente invenção como um meio de armazenamento legível em computador, configurado com um programa de computador, sendo que o meio de armazenamento assim configurado faz com que o sistema de computador opere em uma forma específica ou predefinida para a execução das funções descritas no presente documento.
Foram descritas diversas modalidades da presente invenção. No entanto, ficará entendido que várias modificações podem ser feitas sem se afastar do espírito e escopo de aplicação da presente invenção. Por exemplo, algumas etapas descritas no presente documento podem ser de uma 25 ordem independente, podendo, portanto, ser executadas em uma ordem diferente da descrita.

Claims (20)

1. Método para medir a intensidade sonora percebida de um sinal de áudio, compreendendo as etapas de: - obter uma representação espectral do sinal de áudio, - modificar a dita representação espectral como uma função de uma forma espectral de referência de modo que a representação espectral do sinal de áudio conforma-se mais estritamente a uma forma espectral de referência, e - calcular a intensidade sonora percebida da representação espectral modificada do sinal de áudio.
2. Método, de acordo com a reivindicação 1, no qual a etapa de modificar a dita representação espectral como uma função de uma forma espectral de referência inclui a minimização da função das diferenças entre a dita representação espectral e a dita forma espectral de referência e a definição de um nível para a forma espectral de referência em resposta à dita minimização.
3. Método, de acordo com a reivindicação 2, no qual a minimização da função das diferenças minimiza a média ponderada das diferenças entre a dita representação espectral e a dita forma espectral de referência.
4. Método, de acordo com a reivindicação 2 ou 3, no qual a minimização da função das diferenças inclui ainda a aplicação de um deslocamento de modo a alterar as diferenças entre a dita representação espectral e a dita forma espectral de referência.
5. Método, de acordo com a reivindicação 4, no qual o dito desIocamento é um deslocamento fixo.
6. Método, de acordo com qualquer uma das reivindicações 2 a5, no qual a etapa de modificar a dita representação espectral como uma função de uma forma espectral de referência inclui ainda a tomada do nível máximo da representação espectral do sinal de áudio e da forma espectral de referência definida em níveis.
7. Método, de acordo com qualquer uma das reivindicações 1 a6, no qual a representação espectral do sinal de áudio é um sinal de excitação que se aproxima da distribuição de potência ao longo da membrana basilar do ouvido interno.
8. Método para medir a intensidade sonora percebida de um sinal de áudio, compreendendo as etapas de: obter uma representação de sinal de áudio, comparar a representação de sinal de áudio a uma representação de referência de modo a determinar quão estritamente a representação de sinal de áudio correlaciona-se à representação de referência, modificar, pelo menos, uma parte da representação de sinal de áudio para que a representação modificada resultante do sinal de áudio correlacione-se mais estritamente à representação de referência, e - determinar uma intensidade sonora percebida do sinal de áudio a partir da representação modificada do sinal de áudio.
9. Método, de acordo com a reivindicação 8, no qual a etapa de modificar pelo menos uma parte da representação de sinal de áudio inclui o ajuste do nível da representação de referência com relação ao nível da representação de sinal de áudio.
10. Método, de acordo com a reivindicação 9, no qual o nível da representação de referência é ajustado de modo a minimizar uma função das diferenças entre o nível da representação de referência e o nível da representação de sinal de áudio.
11. Método, de acordo com qualquer uma das reivindicações 8 a10, no qual a etapa de modificar pelo menos uma parte da representação de sinal de áudio inclui o aumento do nível de partes do sinal de áudio.
12. Método para determinar a intensidade sonora percebida de um sinal de áudio, compreendendo as etapas de: obter uma representação de sinal de áudio, comparar a forma espectral da representação de sinal de áudio a uma forma espectral de referência, ajustar o nível da forma espectral de referência de modo a corresponder à forma espectral da representação de sinal de áudio de modo que as diferenças entre a forma espectral da representação de sinal de áudio e a forma espectral de referência sejam reduzidas, designar uma forma espectral modificada da representação de sinal de áudio por meio do aumento de partes da forma espectral da representação de sinal de áudio de modo a aumentar ainda mais a correlação entre a forma espectral da representação de sinal de áudio e a forma espectral de referência, e - determinar uma intensidade sonora percebida do sinal de áudio com base na forma espectral modificada da representação de sinal de áudio.
13. Método, de acordo com a reivindicação 12, no qual o dito ajuste inclui as etapas de minimizar uma função das diferenças entre a dita forma espectral da representação de sinal de áudio e a dita forma espectral de referência, e de estabelecer um nível de referência para a forma espectral de referência em resposta à dita etapa de minimizar.
14. Método, de acordo com a reivindicação 13, no qual a minimização de uma função das diferenças minimiza a média ponderada das diferenças entre a dita forma espectral da representação de sinal de áudio e a dita forma espectral de referência.
15. Método, de acordo com a reivindicação 13 ou 14, no qual a minimização de uma função das diferenças inclui ainda a etapa de aplicar um deslocamento de modo a alterar as diferenças entre a dita forma espectral da representação de sinal de áudio e a dita forma espectral de referência.
16. Método, de acordo com a reivindicação 15, no qual o dito deslocamento é um deslocamento fixo.
17. Método, de acordo com qualquer uma das reivindicações 13 a 16, no qual a etapa de modificar a dita representação espectral como uma função de uma forma espectral de referência inclui ainda a tomada do nível máximo da representação espectral do sinal de áudio e da forma espectral de referência definida em níveis.
18. Método, de acordo com qualquer uma das reivindicações 12 a 17, no qual a representação de sinal de áudio é um sinal de excitação que se aproxima da distribuição de potência ao longo da membrana basilar do ouvido interno.
19. Aparelho adaptado para executar os métodos como definido em qualquer uma das reivindicações 1 a 18.
20. Programa de computador, armazenado em um meio legível em computador de modo a fazer com que um computador execute os métodos como definido em qualquer uma das reivindicações 1 a 18.
BRPI0808965-5A 2007-06-19 2008-06-18 Método e aparelho para medir a intensidade sonora percebida de um sinal de áudio e meio legível por computador BRPI0808965B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US93635607P 2007-06-19 2007-06-19
US60/936,356 2007-06-19
PCT/US2008/007570 WO2008156774A1 (en) 2007-06-19 2008-06-18 Loudness measurement with spectral modifications

Publications (2)

Publication Number Publication Date
BRPI0808965A2 true BRPI0808965A2 (pt) 2014-08-26
BRPI0808965B1 BRPI0808965B1 (pt) 2020-03-03

Family

ID=39739933

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0808965-5A BRPI0808965B1 (pt) 2007-06-19 2008-06-18 Método e aparelho para medir a intensidade sonora percebida de um sinal de áudio e meio legível por computador

Country Status (18)

Country Link
US (1) US8213624B2 (pt)
EP (1) EP2162879B1 (pt)
JP (1) JP2010521706A (pt)
KR (1) KR101106948B1 (pt)
CN (1) CN101681618B (pt)
AU (1) AU2008266847B2 (pt)
BR (1) BRPI0808965B1 (pt)
CA (1) CA2679953C (pt)
DK (1) DK2162879T3 (pt)
HK (1) HK1141622A1 (pt)
IL (1) IL200585A (pt)
MX (1) MX2009009942A (pt)
MY (1) MY144152A (pt)
PL (1) PL2162879T3 (pt)
RU (1) RU2434310C2 (pt)
TW (1) TWI440018B (pt)
UA (1) UA95341C2 (pt)
WO (1) WO2008156774A1 (pt)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2007005027A (es) 2004-10-26 2007-06-19 Dolby Lab Licensing Corp Calculo y ajuste de la sonoridad percibida y/o el balance espectral percibido de una senal de audio.
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
RU2417514C2 (ru) 2006-04-27 2011-04-27 Долби Лэборетериз Лайсенсинг Корпорейшн Регулировка усиления звука с использованием основанного на конкретной громкости обнаружения акустических событий
MY144271A (en) 2006-10-20 2011-08-29 Dolby Lab Licensing Corp Audio dynamics processing using a reset
CN101790758B (zh) 2007-07-13 2013-01-09 杜比实验室特许公司 用于控制音频信号的信号处理的设备和方法
CN102017402B (zh) 2007-12-21 2015-01-07 Dts有限责任公司 用于调节音频信号的感知响度的系统
WO2010127024A1 (en) 2009-04-30 2010-11-04 Dolby Laboratories Licensing Corporation Controlling the loudness of an audio signal in response to spectral localization
CN102422349A (zh) * 2009-05-14 2012-04-18 夏普株式会社 增益控制装置和增益控制方法、声音输出装置
US9055374B2 (en) * 2009-06-24 2015-06-09 Arizona Board Of Regents For And On Behalf Of Arizona State University Method and system for determining an auditory pattern of an audio segment
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
TWI525987B (zh) 2010-03-10 2016-03-11 杜比實驗室特許公司 在單一播放模式中組合響度量測的系統
EP2649742A4 (en) 2010-12-07 2014-07-02 Empire Technology Dev Llc DIFFERENCES OF DIGITAL AUDIO IMPRESSIONS FOR MEASURING EXPERIENCE QUALITY FROM END TO END
US8965756B2 (en) * 2011-03-14 2015-02-24 Adobe Systems Incorporated Automatic equalization of coloration in speech recordings
CN104221284B (zh) 2012-04-12 2017-05-24 杜比实验室特许公司 用于调平音频信号的响度变化的系统及方法
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
US9391575B1 (en) * 2013-12-13 2016-07-12 Amazon Technologies, Inc. Adaptive loudness control
US9503803B2 (en) 2014-03-26 2016-11-22 Bose Corporation Collaboratively processing audio between headset and source to mask distracting noise
CN105100787B (zh) * 2014-05-20 2017-06-30 南京视威电子科技股份有限公司 响度显示装置及显示方法
US10842418B2 (en) 2014-09-29 2020-11-24 Starkey Laboratories, Inc. Method and apparatus for tinnitus evaluation with test sound automatically adjusted for loudness
EP4060661B1 (en) 2014-10-10 2024-04-24 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness
US9590580B1 (en) 2015-09-13 2017-03-07 Guoguang Electric Company Limited Loudness-based audio-signal compensation
DE102015217565A1 (de) * 2015-09-15 2017-03-16 Ford Global Technologies, Llc Verfahren und Vorrichtung zur Verarbeitung von Audio-Signalen
CN106792346A (zh) * 2016-11-14 2017-05-31 广东小天才科技有限公司 一种教学视频中的音频调整方法及装置
CN110191396B (zh) * 2019-05-24 2022-05-27 腾讯音乐娱乐科技(深圳)有限公司 一种音频处理方法、装置、终端及计算机可读存储介质

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2808475A (en) * 1954-10-05 1957-10-01 Bell Telephone Labor Inc Loudness indicator
US4953112A (en) 1988-05-10 1990-08-28 Minnesota Mining And Manufacturing Company Method and apparatus for determining acoustic parameters of an auditory prosthesis using software model
US5274711A (en) * 1989-11-14 1993-12-28 Rutledge Janet C Apparatus and method for modifying a speech waveform to compensate for recruitment of loudness
GB2272615A (en) 1992-11-17 1994-05-18 Rudolf Bisping Controlling signal-to-noise ratio in noisy recordings
US5812969A (en) * 1995-04-06 1998-09-22 Adaptec, Inc. Process for balancing the loudness of digitally sampled audio waveforms
FR2762467B1 (fr) * 1997-04-16 1999-07-02 France Telecom Procede d'annulation d'echo acoustique multi-voies et annuleur d'echo acoustique multi-voies
JP3448586B2 (ja) * 2000-08-29 2003-09-22 独立行政法人産業技術総合研究所 聴覚障害を考慮した音の測定方法およびシステム
US7454331B2 (en) * 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
DE10308483A1 (de) * 2003-02-26 2004-09-09 Siemens Audiologische Technik Gmbh Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät
US7089176B2 (en) * 2003-03-27 2006-08-08 Motorola, Inc. Method and system for increasing audio perceptual tone alerts
BRPI0410740A (pt) 2003-05-28 2006-06-27 Dolby Lab Licensing Corp método, aparelho e programa de computador para calcular e ajustar o volume percebido de um sinal de áudio
US20050113147A1 (en) * 2003-11-26 2005-05-26 Vanepps Daniel J.Jr. Methods, electronic devices, and computer program products for generating an alert signal based on a sound metric for a noise signal
US7574010B2 (en) * 2004-05-28 2009-08-11 Research In Motion Limited System and method for adjusting an audio signal
US20080095385A1 (en) * 2004-06-30 2008-04-24 Koninklijke Philips Electronics, N.V. Method of and System for Automatically Adjusting the Loudness of an Audio Signal
RU2279759C2 (ru) 2004-07-07 2006-07-10 Гарри Романович Аванесян Психоакустический процессор
MX2007005027A (es) 2004-10-26 2007-06-19 Dolby Lab Licensing Corp Calculo y ajuste de la sonoridad percibida y/o el balance espectral percibido de una senal de audio.
US20070291960A1 (en) * 2004-11-10 2007-12-20 Adc Technology Inc. Sound Electronic Circuit and Method for Adjusting Sound Level Thereof
JP2006333396A (ja) * 2005-05-30 2006-12-07 Victor Co Of Japan Ltd 音声信号拡声装置
US8566086B2 (en) * 2005-06-28 2013-10-22 Qnx Software Systems Limited System for adaptive enhancement of speech signals
JP2008176695A (ja) 2007-01-22 2008-07-31 Nec Corp サーバ、これを用いた質問回答システム、端末、サーバの動作方法、及びその動作プログラム

Also Published As

Publication number Publication date
DK2162879T3 (da) 2013-07-22
TW200912893A (en) 2009-03-16
RU2434310C2 (ru) 2011-11-20
AU2008266847B2 (en) 2011-06-02
US8213624B2 (en) 2012-07-03
HK1141622A1 (en) 2010-11-12
CN101681618A (zh) 2010-03-24
EP2162879A1 (en) 2010-03-17
BRPI0808965B1 (pt) 2020-03-03
EP2162879B1 (en) 2013-06-05
IL200585A0 (en) 2010-05-17
JP2010521706A (ja) 2010-06-24
IL200585A (en) 2013-07-31
KR20100013308A (ko) 2010-02-09
MX2009009942A (es) 2009-09-24
MY144152A (en) 2011-08-15
PL2162879T3 (pl) 2013-09-30
WO2008156774A1 (en) 2008-12-24
CA2679953A1 (en) 2008-12-24
AU2008266847A1 (en) 2008-12-24
CA2679953C (en) 2014-01-21
RU2009135056A (ru) 2011-03-27
UA95341C2 (ru) 2011-07-25
TWI440018B (zh) 2014-06-01
US20100067709A1 (en) 2010-03-18
KR101106948B1 (ko) 2012-01-20
CN101681618B (zh) 2015-12-16

Similar Documents

Publication Publication Date Title
BRPI0808965A2 (pt) Medição de intensidade sonora com modificações espectrais
ES2290764T3 (es) Metodo, aparato y programa de ordenador para calcular y ajustar la sonoridad percibida de una señal de audio.
US8504181B2 (en) Audio signal loudness measurement and modification in the MDCT domain
ES2526761T3 (es) Aparato y método para modificar una señal de audio de entrada
JP4202090B2 (ja) スムージングフィルタを用いた音声合成システム及びその方法並びにスムージングフィルタ特性制御装置及びその方法
TWI653626B (zh) 用以使用補償值編碼音訊信號之裝置及方法
ES2531556T3 (es) Método, producto de programa de ordenador y sistema para determinar una calidad percibida de un sistema de audio
BRPI0911587B1 (pt) Sistema de manipulação de gama dinâmica e método para compensação de ruído ambiente em uma localização de reprodução
US9659579B2 (en) Method of and apparatus for evaluating intelligibility of a degraded speech signal, through selecting a difference function for compensating for a disturbance type, and providing an output signal indicative of a derived quality parameter
BRPI0510014B1 (pt) Dispositivo de codificação, dispositivo de decodificação e método do mesmo
BRPI0910523A2 (pt) aparelho e método para gerar dados de saída de extensão de largura de banda
US20150340047A1 (en) Method of and apparatus for evaluating intelligibility of a degraded speech signal
BR112021007807A2 (pt) analisador, avaliador de similaridade, codificador e decodificador de áudio, conversor de formato, renderizador, métodos e representação de áudio
Beerends Audio quality determination based on perceptual measurement techniques
Huber Objective assessment of audio quality using an auditory processing model
Ferguson et al. Using psychoacoustical models for information sonification
US20140324419A1 (en) Method of and apparatus for evaluating intelligibility of a degraded speech signal
Alku et al. Parameterization of the voice source by combining spectral decay and amplitude features of the glottal flow
Newman et al. Pitch effects on vowel roughness and spectral noise for subjects in four musical voice classifications
JP2004294444A (ja) 音響評価方法およびそのシステム
Coretto et al. Nonparametric estimation of the dynamic range of music signals
Mendonça Noise perception, psychoacoustic indicators and traffic noise
Nieuwenhuizen Quantifying Sound Quality in Loudspeaker Reproduction
Vickers Metrics for quantifying loudness and dynamics
Sen et al. A new auditory masking model for speech and audio coders

Legal Events

Date Code Title Description
B15K Others concerning applications: alteration of classification

Ipc: G10L 25/69 (2013.01)

B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 03/03/2020, OBSERVADAS AS CONDICOES LEGAIS.