BRPI0813723B1 - método para controlar o nível de intensidade do som de eventos auditivos, memória legível por computador não transitória, sistema de computador e aparelho - Google Patents

método para controlar o nível de intensidade do som de eventos auditivos, memória legível por computador não transitória, sistema de computador e aparelho Download PDF

Info

Publication number
BRPI0813723B1
BRPI0813723B1 BRPI0813723A BRPI0813723A BRPI0813723B1 BR PI0813723 B1 BRPI0813723 B1 BR PI0813723B1 BR PI0813723 A BRPI0813723 A BR PI0813723A BR PI0813723 A BRPI0813723 A BR PI0813723A BR PI0813723 B1 BRPI0813723 B1 BR PI0813723B1
Authority
BR
Brazil
Prior art keywords
audio signal
auditory
asymmetry
fact
signal
Prior art date
Application number
BRPI0813723A
Other languages
English (en)
Inventor
Jeffrey Seefeldt Alan
John Smithers Michael
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=39776994&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BRPI0813723(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of BRPI0813723A2 publication Critical patent/BRPI0813723A2/pt
Publication of BRPI0813723B1 publication Critical patent/BRPI0813723B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/12Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
    • H03G9/18Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for tone control and volume expansion or compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Holo Graphy (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

método para controlar o nível de intensidade do som de eventos auditivos, memória legível por computador não transitória, sistema de computador e aparelho a presente invenção refere-se a um método para controlar o nível de intensidade do som de eventos auditivos em um sinal de áudio. em uma modalidade, o método inclui a ponderação dos eventos auditivos (um evento auditivo que tem um espectro e um nível de intensidade do som), usando a assimetria no espectro e controlando o nível de intensidade do som dos eventos auditivos, usando as ponderações. diversas modalidades da invenção ocorrem da seguinte maneira: a ponderação sendo proporcional à medida de assimetria no espectro; a medida de assimetria é uma medida de assimetria suavizada; a ponderação é insensível à amplitude do sinal de áudio; a ponderação é insensível à potência; a ponderação é insensível ao nível de intensidade do som; e qualquer relação entre a medida de sinal e o nível de reprodução absoluta não é conhecida no momento da ponderação; a ponderação inclui a ponderação da importância de limite de evento auditivo, usando a assimetria no espectro.

Description

Relatório Descritivo da Patente de Invenção para MÉTODO PARA CONTROLAR O NÍVEL DE INTENSIDADE DO SOM DE EVENTOS AUDITIVOS, MEMÓRIA LEGÍVEL POR COMPUTADOR NÃO TRANSITÓRIA, SISTEMA DE COMPUTADOR E APARELHO.
Campo da Técnica [0001] A invenção refere-se, em geral, ao processamento de áudio e à análise de cena auditiva e assimetria espectral, in particular. Referências e Incorporação por Referência [0002] A seguir, os documentos são incorporados no presente documento por referência em sua totalidade:
[0003] Crockett e Seefeldt, pedido internacional sob o Tratado de
Cooperação de Patentes, S.N. PCT/US2007/008313, intitulado, Controlling Dynamic Gain Parameters of Audio using Auditory Scene Analysis and Specific-Loudness-Based Detection of Auditory Events, que designa Brett Graham Crockett e Alan Jeffrey Seefeldt como inventores, depositado em 30 de março de 2007, com a súmula do procurador DOL186 PCT, e publicado em 8 de novembro de 2007 como WO 2007/127023;
[0004] Seefeldt et al., pedido internacional sob o Tratado de
Cooperação de Patentes, S.N. PCT/US 2004/016964, intitulado, Method, Apparatus and Computer Program for Calculating and Adjusting the Perceived Loudness of an Audio Signal que designa Alan Jeffrey Seefeldt et al. como inventores, depositado em 27 de maio de 2004, com a súmula do procurador No DOL119 PCT, e publicado em 23 de dezembro de 2004 como WO 2004/111994 A2;
[0005] Seefeldt, pedido internacional sob o Tratado de
Cooperação de Patentes, S.N. PCT/US2005/038579, intitulado Calculating and Adjusting the Perceived Loudness and/or the Perceived Spectral Balance of an Audio Signal, que designa Alan
Petição 870190113071, de 05/11/2019, pág. 4/26
2/16
Jeffrey Seefeldt como o inventor, depositado em 25 de outubro de 2005, com a súmula do procurador No. DOL15202 PCT, e publicado em 4 de maio de 2006 como WO 2006/047600;
[0006] Crockett, pedido de patente U.S. S.N. 10/474.387, intitulado, High Quality Time-Scaling and Pitch-Scaling of Audio Signals, que designa Brett Graham Crockett como o inventor, depositado em 10 de outubro de 2003, com a súmula do procurador número DOL07503, e publicado em 24 de junho de 2004 como US 2004/0122662 A1;
[0007] Crockett et al., pedido de patente U.S. S.N. 10/478.398, intitulado, Method for Time Aligning Audio Signals Using Characterizations Based on Auditory Events, que designa Brett G. Crockett et al. como inventores, depositado em 20 de novembro de 2003, com a súmula do procurador número DOL09201, e publicado em 29 de julho de 2004 como US 2004/0148159 A1;
[0008] Crockett, pedido de patente U.S. S.N. 10/478.538, intitulado, Segmenting Audio Signals Into Auditory Events, que designa Brett G. Crockett como o inventor, depositado em 20 de novembro de 2003, com a súmula do procurador número DOL098, e publicado em August 26, 2004 as US 2004/0165730 A1;
[0009] Crockett et AL., pedido de patente U.S. S.N. 10/478.397, intitulado, Comparing Audio Using Characterizations Based on Auditory Events, que designa Brett G. Crockett et al. como inventores, depositado em 20 de novembro de 2003, com a súmula do procurador número DOL092, e publicado em 2 de setembro de 2004 como US 2004/0172240 A1;
[00010] Smithers, pedido internacional sob o Tratado de Cooperação de Patentes S.N. PCT/US 05/24630, intitulado, Method for Combining Audio Signals Using Auditory Scene Analysis, que designa Michael John Smithers como o inventor, depositado em 13 de
Petição 870190113071, de 05/11/2019, pág. 5/26
3/16 julho de 2005, com a súmula do procurador número DOL148 PCT, e publicado em 9 de março de 2006 como WO 2006/026161;
[00011] Crockett, B. e Smithers, M., A Method for Characterizing and Identifying Audio Based on Auditory Scene Analysis, Audio Engineering Society Convention Paper 6416, 118th Convention,
Barcelona, 28 a 31 de maio de 2005;
[00012] Crockett, B., High Quality Multichannel Time Scaling and Pitch-Shifting using Auditory Scene Analysis, Audio Engineering Society Convention Paper 5948, New York, outubro de 2003; e [00013] Seefeldt et al., A New Objective Measure of Perceived Loudness, Audio Engineering Society Convention Paper 6236, San Francisco, 28 de outubro de 2004.
Antecedentes da Invenção
Eventos Auditivos e Detecção de Evento Auditivo [00014] A divisão de sons nas unidades ou segmentos percebidos como separados e distintos algumas vezes é referida como análise de evento auditivo ou análise de cena auditiva (ASA). Os segmentos algumas vezes são referidos como eventos auditivos ou eventos de áudio. Albert S. Bregman, Auditory Scene Analysis-The Perceptual Organization of Sound (Massachusetts Institute of Technology, 1991, Quarta impressão, 2001, Second MIT Press paperback edition) discutem extensivamente a análise de cena auditiva. Além disso, Bhadkamkar et al., patente U.S. número 6.002.776 (14 de dezembro de 1999) cita as publicações que datam de 1976 como técnica relacionada à separação de som por análise de cena auditiva. Entretanto, Bhadkamkar et al. desencoraja o uso prático de análise de cena auditiva, que conclui que técnicas que envolvem análise de cena auditiva, embora interessantes a partir de um ponto de vista científico como modelos de processamento auditivo humano, estão atualmente muito longe da demanda computacional e especializada para serem
Petição 870190113071, de 05/11/2019, pág. 6/26
4/16 consideradas técnicas práticas para a separação de som até o progresso fundamental ser obtido.
[00015] Crockett e Crocket et al. nos diversos pedidos de patente e documentos listados acima identifica eventos auditivos. Estes documentos ensinam a divisão de um sinal de áudio em eventos auditivos (sendo que cada um tende a ser percebido como separado e distinto) ao detectar as alterações na composição espectral (amplitude como uma função de frequência) em relação ao tempo. Isto pode ser feito, por exemplo, através do cálculo do conteúdo espectral de sucessivos blocos de tempo do sinal de áudio, que compara o conteúdo espectral entre sucessivos blocos de tempo e identifica um limite de evento auditivo como o limite entre os blocos onde a diferença no conteúdo espectral excede um limítrofe. Alternativamente, as alterações na amplitude em relação ao tempo podem ser calculadas em vez de ou, além das alterações na composição espectral em relação ao tempo.
[00016] Os marcadores de limite de evento auditivo são frequentemente dispostos em um sinal de controle temporal, de modo que a faixa, tipicamente de zero a um, indique a intensidade do limite de evento. Além disso, o sinal de controle é muitas vezes filtrado, de modo que a intensidade do limite de evento permaneça, e os intervalos de tempo entre os limites de eventos sejam calculados como valores de decaimento do limite de evento precedente. Esta intensidade de evento auditivo filtrado é, então, usada por outros métodos de processamento de áudio que incluem controle de ganho automático e controle de faixa dinâmica.
Processamento de Dinâmica de Áudio [00017] As técnicas de controle de ganho automático (AGC) e controle de faixa dinâmica (DRC) são bem conhecidas e comuns em muitas trajetórias de sinal de áudio. Em um sentido abstrato, ambas as
Petição 870190113071, de 05/11/2019, pág. 7/26
5/16 técnicas medem o nível de um sinal de áudio e, então, modificam por ganho o sinal através de uma quantidade que é uma função do nível medido. Em uma linear, sistema de processamento de dinâmica 1:1, o áudio de entrada não é processado e o sinal de áudio de saída de modo ideal é compatível com o sinal de áudio de entrada. Adicionalmente, imagine um sistema de processamento de dinâmica de áudio que mede automaticamente o sinal de entrada e controla o sinal de saída com aquela medida. Se o sinal de entrada se eleva no nível em 6 dB e o sinal de saída processado se eleva no nível em apenas 3 dB, então, o sinal de saída foi compactado por uma razão de 2:1 em relação ao sinal de entrada.
[00018] Em Crockett e Seefeldt, a análise de cena auditiva aperfeiçoa o desempenho de métodos AGC e DRC ao minimizar a alteração no ganho entre os limites de evento auditivo, e confina muito da alteração de ganho na região de um limite de evento. Isto ocorre ao modificar o comportamento de liberação de processamento de dinâmica. Deste modo, os eventos auditivos soam coerentes e naturais. [00019] As notas tocadas em um piano são um exemplo. Com os métodos AGC ou DRC convencionais, o ganho aplicado ao sinal de áudio aumenta durante a cauda de cada nota, fazendo com que cada nota cresça anormalmente. Com a análise de cena auditiva, o ganho de AGC ou DRC é mantido constante em cada nota e altera apenas próximo ao início de cada nota onde um limite de evento auditivo é detectado. O sinal de áudio ajustado por ganho resultante soa natural à medida que a cauda de cada nota desaparece.
[00020] As implementações típicas de análise de cena auditiva (como nas referências acima) têm nível deliberadamente invariável. Ou seja, elas detectam os limites de evento auditivo independente do nível de sinal absoluto. Embora a invariância de nível seja útil em muitos pedidos, algumas análises de cena auditiva se beneficiam de
Petição 870190113071, de 05/11/2019, pág. 8/26
6/16 alguma dependência de nível.
[00021] Tal caso é o método descrito em Crockett e Seefeldt. O controle ASA de AGC e DRC evita grandes alterações de ganho entre limites de evento auditivo. Entretanto, as alterações de ganho de período mais longo ainda podem ser indesejáveis em alguns tipos de sinais de áudios. Quando um sinal de áudio parte de uma seção mais alta para uma mais silenciosa, o ganho de AGC ou DRC, restrito à alteração apenas próxima aos limites de evento, pode permitir que o nível do sinal de áudio de processamento eleve de maneira indesejável e anormal durante a seção silenciosa. Esta situação ocorre frequentemente em filmes onde o diálogo esporádico alterna com os sons de fundo silenciosos. Devido ao fato de o sinal de áudio de fundo silencioso também conter eventos auditivos, o ganho de AGC ou DRC é alterado próximo a estes limites de evento, e o nível de sinal de áudio total se eleva.
[00022] A simples ponderação da importância de eventos auditivos através de uma medida do nível, potência ou nível de intensidade do som de sinal de áudio é indesejável. Em muitas situações a relação entre a medida de sinal e o nível de reprodução absoluta não é conhecida. De maneira ideal, uma medida que discrimina ou detecta os sinais de áudio perceptivelmente mais silenciosos independente do nível absoluto do sinal de áudio pode ser útil. Aqui, perceptivelmente mais silencioso não se refere aos mais silenciosos em uma medida de nível de intensidade do som objetivo (como em Seefeldt et al. e Seefeldt), mas, em vez disso, mais silencioso se baseia no nível de intensidade do som esperado do conteúdo. Por exemplo, a experiência humana indica que um sussurro é um som silencioso. Se um sistema de processamento de dinâmica mede isto como silencioso e consequentemente aumenta o ganho de AGC para obter algum nível de intensidade do som ou nível de saída nominal, o sussurro ajustado
Petição 870190113071, de 05/11/2019, pág. 9/26
7/16 por ganho resultante pode ser mais alto do que a experiência considera.
Descrição da Invenção [00023] No presente documento são ensinados métodos e aparelhos para controlar o nível de intensidade do som de eventos auditivos em um sinal de áudio. Em uma modalidade, o método inclui uma ponderação dos eventos auditivos (um evento auditivo que tem um espectro e um nível de intensidade do som), que usa assimetria no espectro e controla o nível de intensidade do som dos eventos auditivos, usando as ponderações. Diversas modalidades da invenção ocorrem da seguinte maneira: a ponderação sendo proporcional à medida de assimetria no espectro; a medida de assimetria é uma medida de assimetria suavizada; a ponderação é insensível à amplitude do sinal de áudio; a ponderação é insensível à potência; a ponderação é insensível ao nível de intensidade do som; e qualquer relação entre a medida de sinal e o nível de reprodução absoluta não é conhecida no momento da ponderação; a ponderação inclui a ponderação da importância de limite de evento auditivo, usando a assimetria no espectro; e a redução da inchação de nível de processamento de AGC ou DRC durante os segmentos perceptivelmente mais silenciosos do sinal de áudio quando comparados com os métodos que não realizam a ponderação reivindicada.
[00024] Em outras modalidades, a invenção é uma memória legível por computador que contém um programa de computador para realizar qualquer um dos métodos acima.
[00025] Ainda em outras modalidades, a invenção é um sistema de computador que inclui uma CPU, uma das memórias mencionadas acima e um barramento que acopla de maneira comunicativa a CPU e a memória.
Petição 870190113071, de 05/11/2019, pág. 10/26
8/16 [00026] Ainda em outra modalidade, a invenção é um método para controlar o nível de intensidade do som de eventos auditivos em um sinal de áudio, que inclui o cálculo de medidas de assimetria de espectro de sucessivos eventos auditivos de um sinal de áudio, gerar ponderações para os eventos auditivos baseados nas medidas de assimetria, que derivam um sinal de controle a partir das ponderações e controlam o nível de intensidade do som dos eventos auditivos que usam o sinal de controle.
[00027] Os diversos recursos da presente invenção e suas modalidades preferidas podem ser mais bem entendidos referindo-se à seguinte discussão e os desenhos em anexo, em que as referências numéricas similares se referem a elementos similares.
Descrição dos Desenhos [00028] A Figura 1 ilustra um dispositivo para realizar dois métodos de Crockett e Seefeldt para analisar cenas auditivas e controlar parâmetros de ganho de dinâmica.
[00029] A Figura 2 ilustra um processador de áudio para identificar eventos auditivos e calcular a assimetria para modificar os eventos auditivos que, por sua vez, modificam os parâmetros de processamento de dinâmica, de acordo com uma modalidade da presente invenção.
[00030] A Figura 3 é uma série de gráficos que ilustra o uso de eventos auditivos para controlar o tempo de liberação em uma implementação digital de um Controlador de Faixa Dinâmica (DRC), de acordo com uma modalidade da invenção.
[00031] Figura 4 é uma resposta de característica idealizada de um filtro linear adequado como um filtro de transmissão, de acordo com uma modalidade da invenção.
[00032] A Figura 5 mostra um conjunto de respostas de característica de filtro auditivo idealizadas que aproximam a banda
Petição 870190113071, de 05/11/2019, pág. 11/26
9/16 crítica na escala de ERB.
Melhor Modo para Realizar a Invenção [00033] A Figura 1 ilustra um dispositivo 1 para analisar cenas auditivas e controlar parâmetros de ganho de dinâmica, de acordo com Crockett e Seefeldt. O dispositivo inclui um identificador de eventos auditivos 10, um identificador de características de eventos auditivos opcional 11 e um modificador de parâmetros de dinâmica 12. O identificador de eventos auditivos 10 recebe áudio como entrada e produz uma entrada para o modificador de parâmetros de dinâmica 12 (e uma entrada para o identificador de características de eventos auditivos 11, se presente). O modificador de parâmetros de dinâmica 12 recebe a saída do identificador de eventos auditivos 10 (e o identificador de características de eventos auditivos 11, se presente) e produz uma saída.
[00034] O identificador de eventos auditivos 10 analisa o espectro e a partir dos resultados identifica a localizações dos eventos de áudio perceptíveis que servem para controlar os parâmetros de ganho de dinâmica. Alternativamente, o identificador de eventos auditivos 10 transforma o áudio em um domínio de nível de intensidade do som perceptivo (que pode proporcionar informações mais físicoacusticamente relevantes que o primeiro método) e no domínio de nível de intensidade do som perceptivo identifica a localização de eventos auditivos que servem para controlar os parâmetros de ganho de dinâmica. (Nesta alternativa, o processamento de áudio está ciente dos níveis de reprodução acústica absolutos).
[00035] O modificador de parâmetros de dinâmica 12 modifica os parâmetros de dinâmica baseados na saída do identificador de eventos auditivos 10 (e identificador de características de eventos auditivos 11, se presente).
[00036] Em ambas as alternativas, um sinal de áudio digital x[n] é
Petição 870190113071, de 05/11/2019, pág. 12/26
10/16 segmentado em blocos, e para cada bloco t, D[f] representa a diferença espectral entre o bloco atual e o bloco anterior.
[00037] Para a primeira alternativa, D[f] é a soma, ao longo de todos os coeficientes espectrais, da magnitude da diferença entre os coeficientes espectrais de log normalizados (em dB) para o bloco atual t e o bloco anterior t
- 1. Nesta alternativa D[f] é proporcional às diferenças absolutas no espectro (o mesmo em dB). Para a segunda alternativa, D[f] é a soma, ao longo de todos os coeficientes de nível de intensidade do som específicos, da magnitude da diferença entre os coeficientes de nível de intensidade do som específicos normalizados para o bloco atual t e o bloco anterior t - 1. Nesta alternativa, D[f] é proporcional às diferenças absolutas no nível de intensidade do som específico (em soneto).
[00038] Em ambas as alternativas, se D[f] excede um limítrofe Dmin, então, o evento é considerado como ocorrido. O evento pode ter uma intensidade, entre zero e um, baseado na razão de D[f] menos Dmin para a diferença entre D max Θ Dmin- A intensidade A[t] pode ser computada como:
[00039] 0 op]<ümin 4f]= ü[/]-Dlm D mm<D[t]<D^ max mm 1 £)[/]> Draas (1) Os limites máximo e mínimo são diferentes para cada
alternativa, devido às suas unidades diferentes. O resultado, entretanto, a partir de ambas é uma intensidade de evento na faixa de 0 a 1. Outras alternativas podem calcular uma intensidade de evento, porém, a alternativa expressa na equação (1) provou a si mesma em inúmeras áreas, incluindo o controle do processamento de dinâmica. Designar uma intensidade (proporcional à quantidade de alteração
Petição 870190113071, de 05/11/2019, pág. 13/26
11/16 espectral associada a este evento) ao evento auditivo permite o maior controle sobre o processamento de dinâmica, comparado a uma decisão de evento binário. Alterações de ganho maiores são aceitáveis durante eventos mais fortes, e o sinal na equação (1) permite tal controle variável.
[00040] O sinal A[f] é um sinal impulsivo com um impulso que ocorre na localização de um limite de evento. Para os propósitos de controlar o tempo de liberação, alguém pode suavizar adicionalmente o sinal A[f], de modo que o mesmo decaia suavemente até zero após a detecção de um limite de evento. O sinal de controle de evento suavizado Ã[f] pode ser computado a partir de A[f] de acordo com:
^Íd>«e,.ra/J[r-1] otherwise (2) [00041]
Aqui Qevent controla o tempo de decaimento do sinal de controle de evento.
[00042] A Figura 3 é uma sequência de gráficos que ilustra a operação e o efeito da invenção, de acordo com uma modalidade, b) na Figura 3 mostra o sinal de controle de evento Ã[f] para o sinal de áudio correspondente de a) na Figura 3, com o meio tempo de decaimento do suavizador ajustado em 250 ms. O sinal de áudio contém três rajadas de diálogo, espalhadas com sons de estalo de fogueira de fundo silenciosos. O sinal de controle de evento mostra muitos eventos auditivos tanto nos sons de diálogo como nos sons de fundo.
[00043] Na Figura 3, c) mostra o sinal de ganho de DRC, onde o sinal de controle de evento A[f] é usado para variar a constante de tempo de liberação para a suavização de ganho de DRC. Como Crocket e Seefeldt descrevem, quando o sinal de controle é igual a um, o coeficiente de suavização de liberação não é afetado, e as
Petição 870190113071, de 05/11/2019, pág. 14/26
12/16 alterações de ganho suavizadas, de acordo com o valor da constante de tempo. Quando o sinal de controle é igual a zero, evita-se que o ganho suavizado seja alterado. Quando o sinal de controle fica entre zero e um, permite-se que o ganho suavizado altere - porém, em uma taxa reduzida em proporção ao sinal de controle.
[00044] No c da Figura 3, o ganho de DRC se eleva durante os sons de fundo silenciosos devido ao número de eventos detectado no fundo. O sinal de áudio modificado por DRC resultante no d) da Figura 3 tem inchação audível e indesejável do nível de intensidade do som de fundo entre as rajadas de diálogo. Para reduzir a alteração de ganho durante os sons de fundo silenciosos, uma modalidade da invenção modifica ou pondera a intensidade auditiva A[í] usando uma medida da assimetria do sinal de áudio espectro. Uma modalidade da invenção calcula a assimetria espectral da excitação do sinal de áudio. [00045] A assimetria é uma medida estatística da assimetria de uma distribuição de probabilidade. Uma distribuição simétrica sobre a média tem distorção zero. Uma distribuição com seu volume ou massa concentrada acima da média e com uma cauda longa que tende a ser mais baixa que a média que tem uma distorção negativa. Uma distribuição concentrada abaixo da média e com uma cauda longa que tende a ser mais alta que a média que tem uma distorção positiva. O espectro de magnitude ou potência de um sinal de áudio típico tem distorção positiva. Ou seja, o volume da energia no espectro é concentrado mais baixo no espectro, e o espectro tem uma cauda longa em direção à parte superior do espectro.
[00046] A Figura 2 ilustra um processador de áudio 2, de acordo com uma modalidade da invenção. O processador de áudio 2 inclui o modificador de parâmetros de dinâmica 12 e o identificador de características de eventos auditivos opcional 11 da Figura 1, assim como, um identificador de eventos auditivos 20 e um calculador de
Petição 870190113071, de 05/11/2019, pág. 15/26
13/16 assimetria 21. Tanto o calculador de assimetria 21, como o identificador de eventos auditivos 20 recebem o sinal de áudio 13, e o calculador de assimetria 21 produz a entrada para o identificador de eventos auditivos 20. O identificador de eventos auditivos 20, identificador de características de eventos auditivos 11 e o modificador de parâmetros de dinâmica 12 são, de outro modo, conectados como suas reproduções na Figura 1.
[00047] Na Figura 2, o calculador de assimetria 21 calcula a assimetria a partir de uma representação espectral do sinal de áudio 13, e o identificador de eventos auditivos 20 calcula a análise de cena auditiva a partir da mesma representação espectral. O sinal de áudio 13 pode ser agrupado em 50% dos blocos sobrepostos de amostras M, e a Transformada Discreta de Fourier pode ser computada da seguinte maneira:
ΛΪ — 1 :2nkn
ΑΛ[Α:,/] = J^x[n,r]g Λ/ »=o (3) em que M = amostras 2*N e x[n,f] denota um bloco de amostras.
[00048] Presume-se que o tamanho de bloco para a transformada é o mesmo que para o cálculo do sinal de evento auditivo. Entretanto, este não precisa ser o caso. Onde existir diferentes taxas de bloco, os sinais em uma taxa de bloco podem ser interpelados ou a taxa convertida na mesma escala de tempo que os sinais na outra taxa de bloco.
[00049] O sinal de excitação E[b,t] que aproxima a distribuição de energia ao longo da membrana basilar do ouvido interno na banda crítica b enquanto o bloco de tempo té computado:
£[M=SMT.wlW.T * (4)
Petição 870190113071, de 05/11/2019, pág. 16/26
14/16 em que T[k] representa a resposta de frequência de um filtro que simula a transmissão de áudio através do ouvido externo e médio e Cb[k] representa a resposta de frequência da membrana basilar em uma localização que corresponde à banda crítica b.
[00050] A Figura 4 mostra a resposta de frequência de um filtro de transmissão adequado T[k], A Figura 5 mostra um conjunto adequado de respostas de filtro de banda crítica, que correspondem a Cb[k], em que 40 bandas são uniformemente separadas ao longo da escala de largura de Banda Retangular Equivalente de Moore e Glasberg (ERB), para uma taxa de amostra de 48 kHz e tamanho de transformada de M = 2048. Uma função exponencial arredondada descreve cada formato de filtro, e 1 ERB separa as bandas.
[00051] Se os limites de evento auditivo forem computados a partir do espectro de nível de intensidade do som específico, por Crocket e Seefeldt, então, o sinal de excitação E[b,t] já existe como parte do cálculo de nível de intensidade do som específico.
[00052] Finalmente, a assimetria espectral é computada a partir do sinal de excitação E[b,t] como:
(5) em que μ é a média aritmética da excitação:
(6) e σ é a variância do sinal de excitação:
[00053] O sinal de assimetria SK[f] da equação (5) flutua
Petição 870190113071, de 05/11/2019, pág. 17/26
15/16 consideravelmente e requer a suavização deste para evitar artefatos quando modifica o sinal de controle de evento e os parâmetros de processamento de dinâmica subsequentes. Uma modalidade usa um único suavizador de polo com uma constante de decaimento osk que tem um meio tempo de decaimento de aproximadamente 6,5 ms:
SK'[/] = aSKSK’[t - 1] + (1 - a5A ) W] (8) [00054] A limitação da assimetria em SKmax e SKmin máxima e mínima, respectivamente, pode ser útil. Uma assimetria restrita SK[f] pode ser computada como:
5Χ·[Ζ] =
-^rain ££[/]>
(7) [00055]
Valores baixos (valore próximos a 0,0) do sinal de assimetria SK[f] correspondem de maneira típica aos sinais caracteristicamente mais silenciosos, enquanto os valores de assimetria altos (valores próximos a 1,0) correspondem de maneira típica aos sinais caracteristicamente mais altos. Na Figura 3, o gráfico e) mostra o sinal de assimetria que corresponde ao sinal de áudio no
a) da Figura 3. A assimetria é alta para as rajadas de diálogo mais altas e baixa para os sons de fundo.
[00056] O sinal de assimetria SK[f] passa para o identificador de eventos auditivos 20 da Figura 2 que pondera a medida de diferença espectral D[f] como:
OsJ/] = 5Á/[/]£>[/] (8) [00057] O sinal de intensidade auditivo modificado por assimetria
Ask[í] é computado do mesmo modo que A[f] na equação (1):
Petição 870190113071, de 05/11/2019, pág. 18/26
16/16
D -D max min
I
Dm <DSK[t\<D, &SK [(] - -^mix (9) [00058] O sinal de intensidade auditivo modificado por assimetria
Ask[í] é suavizado do mesmo modo que A[f] na equação (2):
à í'-Π otherwise [00059] Na Figura 3, f) mostra o sinal de controle de evento modificado por assimetria Ask[í] para o sinal de áudio correspondente em a) na Figura 3. Menos eventos auditivos aparecem durante os sons de fundo, enquanto os eventos que correspondem ao diálogo mais alto permanecem. Na Figura 3, g) mostra o sinal de DRC controlado por evento modificado por assimetria. Com menos eventos auditivos nos sons de fundo, o ganho de DRC fica relativamente constante e se move apenas para as seções de diálogo mais altas, h) na Figura 3 mostra o sinal de áudio modificado por DRC resultante.
[00060] O sinal de áudio modificado por DRC não tem nenhuma inchação indesejável no nível durante os sons de fundo.
[00061] O sinal de assimetria SK[f] reduz algumas vezes de forma perceptiva para os sinais mais altos. Para estes sinais altos, o valor da medida de diferença espectral D[f] é grande o bastante, que mesmo após a ponderação através do sinal de assimetria SK[f] na equação 8, a medida de diferença espectral ponderada Dsk[í] ainda é tipicamente grande o bastante para indicar um limite de evento auditivo. O sinal de controle de evento Ãsk[í] não é adversamente afetado.

Claims (10)

1/2
REIVINDICAÇÕES
1. Método para controlar o nível de intensidade do som de eventos auditivos em um sinal de áudio para controlar as alterações de ganho em um sinal de áudio em um controle de ganho automático ou um processamento de sinal de controle de faixa dinâmica, caracterizado pelo fato de que compreende as etapas de:
dividir o sinal de áudio em eventos auditivos, sendo que cada um tende a ser percebido de modo separado e distinto, ao detectar alterações na composição espectral em relação ao tempo, a divisão que inclui a detecção da localização e da intensidade dos limites de evento auditivo no sinal de áudio, obter uma medida de alteração dinâmica da assimetria espectral do sinal de áudio, em que a assimetria espectral é uma medida estatística da assimetria da distribuição de probabilidade do espectro de sinal de áudio, modificar a intensidade dos limites do evento auditivo em resposta à medida, de modo que quanto menos o espectro estiver distorcido na localização de um limite de evento auditivo, mais reduzida será a intensidade do limite do evento auditivo, e controlar o nível de intensidade do som de eventos auditivos em resposta à localização e à intensidade modificada por assimetria dos limites do evento auditivo, de modo que a redução da intensidade do limite do evento auditivo reduz a mudança de ganho do sinal de áudio durante sons de fundo silencioso.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a divisão do sinal de áudio em eventos auditivos inclui a análise do espectro do sinal de áudio.
3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a obtenção de uma medida de alteração dinâmica da assimetria espectral do sinal de áudio inclui o cálculo da assimetria de
Petição 870190113071, de 05/11/2019, pág. 24/26
2/2 uma representação espectral do sinal de áudio.
4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que o cálculo da assimetria inclui o cálculo de um sinal de excitação que se aproxima da distribuição de energia ao longo da membrana basilar do ouvido interno.
5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a divisão do sinal de áudio em eventos auditivos inclui transformar o sinal de áudio em um domínio de nível de intensidade do som perceptivo, a transformação inclui o cálculo de um sinal de excitação que se aproxima da distribuição de energia ao longo da membrana basilar do ouvido interno.
6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que a obtenção de uma medida de alteração dinâmica da assimetria espectral do sinal de áudio inclui o cálculo da assimetria do sinal de excitação.
7. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a medida da assimetria espectral é uma medida suavizada.
8. Memória legível por computador não transitória caracterizada pelo fato de que contém um programa de computador para executar o método conforme definido na reivindicação 1.
9. Sistema de computador caracterizado pelo fato de que compreende:
uma CPU;
a memória de acordo com a reivindicação 8; e um barramento que acopla de maneira comunicativa a CPU e a memória.
10. Aparelho caracterizado pelo fato de que compreende meios adaptados para executar o método conforme definido na reivindicação 1.
BRPI0813723A 2007-07-13 2008-07-11 método para controlar o nível de intensidade do som de eventos auditivos, memória legível por computador não transitória, sistema de computador e aparelho BRPI0813723B1 (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US95946307P 2007-07-13 2007-07-13
PCT/US2008/008592 WO2009011827A1 (en) 2007-07-13 2008-07-11 Audio processing using auditory scene analysis and spectral skewness

Publications (2)

Publication Number Publication Date
BRPI0813723A2 BRPI0813723A2 (pt) 2017-07-04
BRPI0813723B1 true BRPI0813723B1 (pt) 2020-02-04

Family

ID=39776994

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0813723A BRPI0813723B1 (pt) 2007-07-13 2008-07-11 método para controlar o nível de intensidade do som de eventos auditivos, memória legível por computador não transitória, sistema de computador e aparelho

Country Status (10)

Country Link
US (1) US8396574B2 (pt)
EP (1) EP2168122B1 (pt)
JP (1) JP5192544B2 (pt)
CN (1) CN101790758B (pt)
AT (1) ATE535906T1 (pt)
BR (1) BRPI0813723B1 (pt)
ES (1) ES2377719T3 (pt)
RU (1) RU2438197C2 (pt)
TW (1) TWI464735B (pt)
WO (1) WO2009011827A1 (pt)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8315398B2 (en) 2007-12-21 2012-11-20 Dts Llc System for adjusting perceived loudness of audio signals
US8938313B2 (en) 2009-04-30 2015-01-20 Dolby Laboratories Licensing Corporation Low complexity auditory event boundary detection
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
US8510361B2 (en) * 2010-05-28 2013-08-13 George Massenburg Variable exponent averaging detector and dynamic range controller
TW202339510A (zh) 2011-07-01 2023-10-01 美商杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
US9633667B2 (en) 2012-04-05 2017-04-25 Nokia Technologies Oy Adaptive audio signal filtering
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
EP2898510B1 (en) * 2012-09-19 2016-07-13 Dolby Laboratories Licensing Corporation Method, system and computer program for adaptive control of gain applied to an audio signal
US9979829B2 (en) 2013-03-15 2018-05-22 Dolby Laboratories Licensing Corporation Normalization of soundfield orientations based on auditory scene analysis
CN104078050A (zh) 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
CN104079247B (zh) 2013-03-26 2018-02-09 杜比实验室特许公司 均衡器控制器和控制方法以及音频再现设备
CN104080024B (zh) 2013-03-26 2019-02-19 杜比实验室特许公司 音量校平器控制器和控制方法以及音频分类器
US9947335B2 (en) 2013-04-05 2018-04-17 Dolby Laboratories Licensing Corporation Companding apparatus and method to reduce quantization noise using advanced spectral extension
JP6224850B2 (ja) 2014-02-28 2017-11-01 ドルビー ラボラトリーズ ライセンシング コーポレイション 会議における変化盲を使った知覚的連続性
WO2017079334A1 (en) 2015-11-03 2017-05-11 Dolby Laboratories Licensing Corporation Content-adaptive surround sound virtualization
US9372881B1 (en) 2015-12-29 2016-06-21 International Business Machines Corporation System for identifying a correspondence between a COBOL copybook or PL/1 include file and a VSAM or sequential dataset
WO2017147325A1 (en) 2016-02-25 2017-08-31 Dolby Laboratories Licensing Corporation Multitalker optimised beamforming system and method
US11894006B2 (en) 2018-07-25 2024-02-06 Dolby Laboratories Licensing Corporation Compressor target curve to avoid boosting noise
CN113015059B (zh) * 2021-02-23 2022-10-18 歌尔科技有限公司 音频优化方法、装置、设备及可读存储介质

Family Cites Families (136)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2808475A (en) 1954-10-05 1957-10-01 Bell Telephone Labor Inc Loudness indicator
US4281218A (en) 1979-10-26 1981-07-28 Bell Telephone Laboratories, Incorporated Speech-nonspeech detector-classifier
US4624009A (en) 1980-05-02 1986-11-18 Figgie International, Inc. Signal pattern encoder and classifier
DE3314570A1 (de) 1983-04-22 1984-10-25 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und anordnung zur einstellung der verstaerkung
US4594561A (en) * 1984-10-26 1986-06-10 Rg Dynamics, Inc. Audio amplifier with resistive damping for minimizing time displacement distortion
US4739514A (en) 1986-12-22 1988-04-19 Bose Corporation Automatic dynamic equalizing
US4887299A (en) 1987-11-12 1989-12-12 Nicolet Instrument Corporation Adaptive, programmable signal processing hearing aid
US5027410A (en) 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
JPH02118322U (pt) 1989-03-08 1990-09-21
US5097510A (en) 1989-11-07 1992-03-17 Gs Systems, Inc. Artificial intelligence pattern-recognition-based noise reduction system for speech processing
US5369711A (en) 1990-08-31 1994-11-29 Bellsouth Corporation Automatic gain control for a headset
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
SG49883A1 (en) 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
EP0517233B1 (en) 1991-06-06 1996-10-30 Matsushita Electric Industrial Co., Ltd. Music/voice discriminating apparatus
US5278912A (en) 1991-06-28 1994-01-11 Resound Corporation Multiband programmable compression system
JPH0566795A (ja) * 1991-09-06 1993-03-19 Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho 雑音抑圧装置とその調整装置
US5363147A (en) 1992-06-01 1994-11-08 North American Philips Corporation Automatic volume leveler
DE4335739A1 (de) 1992-11-17 1994-05-19 Rudolf Prof Dr Bisping Verfahren zur Steuerung des Signal-/Rausch-Abstandes bei rauschbehafteten Tonaufnahmen
US5457769A (en) 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5706352A (en) 1993-04-07 1998-01-06 K/S Himpp Adaptive gain and filtering circuit for a sound reproduction system
US5434922A (en) 1993-04-08 1995-07-18 Miller; Thomas E. Method and apparatus for dynamic sound optimization
BE1007355A3 (nl) 1993-07-26 1995-05-23 Philips Electronics Nv Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling.
IN184794B (pt) 1993-09-14 2000-09-30 British Telecomm
JP2986345B2 (ja) 1993-10-18 1999-12-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声記録指標化装置及び方法
US5530760A (en) 1994-04-29 1996-06-25 Audio Products International Corp. Apparatus and method for adjusting levels between channels of a sound system
US5500902A (en) 1994-07-08 1996-03-19 Stockham, Jr.; Thomas G. Hearing aid device incorporating signal processing techniques
GB9419388D0 (en) 1994-09-26 1994-11-09 Canon Kk Speech analysis
US5548538A (en) 1994-12-07 1996-08-20 Wiltron Company Internal automatic calibrator for vector network analyzers
US5682463A (en) 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
CA2167748A1 (en) 1995-02-09 1996-08-10 Yoav Freund Apparatus and methods for machine learning hypotheses
ATE229729T1 (de) 1995-03-13 2002-12-15 Phonak Ag Verfahren zur anpassung eines hörgerätes, vorrichtung hierzu und hörgerät
DE19509149A1 (de) 1995-03-14 1996-09-19 Donald Dipl Ing Schulz Codierverfahren
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
WO1996032710A1 (en) 1995-04-10 1996-10-17 Corporate Computer Systems, Inc. System for compression and decompression of audio signals for digital transmission
US6301555B2 (en) 1995-04-10 2001-10-09 Corporate Computer Systems Adjustable psycho-acoustic parameters
US5601617A (en) 1995-04-26 1997-02-11 Advanced Bionics Corporation Multichannel cochlear prosthesis with flexible control of stimulus waveforms
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
US5663727A (en) 1995-06-23 1997-09-02 Hearing Innovations Incorporated Frequency response analyzer and shaping apparatus and digital hearing enhancement apparatus and method utilizing the same
US5712954A (en) 1995-08-23 1998-01-27 Rockwell International Corp. System and method for monitoring audio power level of agent speech in a telephonic switch
US6002776A (en) * 1995-09-18 1999-12-14 Interval Research Corporation Directional acoustic signal processor and method therefor
US5907622A (en) 1995-09-21 1999-05-25 Dougherty; A. Michael Automatic noise compensation system for audio reproduction equipment
US6108431A (en) 1996-05-01 2000-08-22 Phonak Ag Loudness limiter
US6327366B1 (en) 1996-05-01 2001-12-04 Phonak Ag Method for the adjustment of a hearing device, apparatus to do it and a hearing device
US6430533B1 (en) 1996-05-03 2002-08-06 Lsi Logic Corporation Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation
JPH09311696A (ja) * 1996-05-21 1997-12-02 Nippon Telegr & Teleph Corp <Ntt> 自動利得調整装置
JPH09312540A (ja) 1996-05-23 1997-12-02 Pioneer Electron Corp ラウドネスボリュームコントロール装置
JP3765622B2 (ja) 1996-07-09 2006-04-12 ユナイテッド・モジュール・コーポレーション オーディオ符号化復号化システム
EP0820212B1 (de) 1996-07-19 2010-04-21 Bernafon AG Lautheitsgesteuerte Verarbeitung akustischer Signale
JP2953397B2 (ja) 1996-09-13 1999-09-27 日本電気株式会社 ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器
JP3367592B2 (ja) * 1996-09-24 2003-01-14 日本電信電話株式会社 自動利得調整装置
US6570991B1 (en) 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
US5862228A (en) 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
US6125343A (en) 1997-05-29 2000-09-26 3Com Corporation System and method for selecting a loudest speaker by comparing average frame gains
US6272360B1 (en) 1997-07-03 2001-08-07 Pan Communications, Inc. Remotely installed transmitter and a hands-free two-way voice terminal device using same
US6185309B1 (en) 1997-07-11 2001-02-06 The Regents Of The University Of California Method and apparatus for blind separation of mixed and convolved sources
KR100261904B1 (ko) 1997-08-29 2000-07-15 윤종용 헤드폰 사운드 출력장치
US6088461A (en) 1997-09-26 2000-07-11 Crystal Semiconductor Corporation Dynamic volume control system
US6233554B1 (en) 1997-12-12 2001-05-15 Qualcomm Incorporated Audio CODEC with AGC controlled by a VOCODER
US6298139B1 (en) 1997-12-31 2001-10-02 Transcrypt International, Inc. Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control
US6182033B1 (en) 1998-01-09 2001-01-30 At&T Corp. Modular approach to speech enhancement with an application to speech coding
US6353671B1 (en) 1998-02-05 2002-03-05 Bioinstco Corp. Signal processing circuit and method for increasing speech intelligibility
US6311155B1 (en) 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
US6498855B1 (en) 1998-04-17 2002-12-24 International Business Machines Corporation Method and system for selectively and variably attenuating audio data
JP2002518912A (ja) 1998-06-08 2002-06-25 コックレア リミティド 聴覚装置
EP0980064A1 (de) 1998-06-26 2000-02-16 Ascom AG Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen
GB2340351B (en) 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
US6351731B1 (en) 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US6823303B1 (en) 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6411927B1 (en) 1998-09-04 2002-06-25 Matsushita Electric Corporation Of America Robust preprocessing signal equalization system and method for normalizing to a target environment
FI113935B (fi) 1998-09-25 2004-06-30 Nokia Corp Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä
DE19848491A1 (de) 1998-10-21 2000-04-27 Bosch Gmbh Robert Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger
US6314396B1 (en) 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
DE69933929T2 (de) 1999-04-09 2007-06-06 Texas Instruments Inc., Dallas Bereitstellen von digitalen Audio- und Videoprodukten
WO2000065872A1 (en) 1999-04-26 2000-11-02 Dspfactory Ltd. Loudness normalization control for a digital hearing aid
US6263371B1 (en) 1999-06-10 2001-07-17 Cacheflow, Inc. Method and apparatus for seaming of streaming content
US6985594B1 (en) 1999-06-15 2006-01-10 Hearing Enhancement Co., Llc. Voice-to-remaining audio (VRA) interactive hearing aid and auxiliary equipment
US6442278B1 (en) 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
US7027981B2 (en) 1999-11-29 2006-04-11 Bizjak Karl M System output control method and apparatus
FR2802329B1 (fr) 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
US7058572B1 (en) 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
US6351733B1 (en) 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
DE10018666A1 (de) 2000-04-14 2001-10-18 Harman Audio Electronic Sys Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals
US6889186B1 (en) 2000-06-01 2005-05-03 Avaya Technology Corp. Method and apparatus for improving the intelligibility of digitally compressed speech
AUPQ952700A0 (en) 2000-08-21 2000-09-14 University Of Melbourne, The Sound-processing strategy for cochlear implants
JP3448586B2 (ja) 2000-08-29 2003-09-22 独立行政法人産業技術総合研究所 聴覚障害を考慮した音の測定方法およびシステム
US6625433B1 (en) 2000-09-29 2003-09-23 Agere Systems Inc. Constant compression automatic gain control circuit
US6807525B1 (en) 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
ATE333751T1 (de) 2000-11-09 2006-08-15 Koninkl Kpn Nv Messen einer übertragungsqualität einer telefonverbindung in einem fernmeldenetz
US7457422B2 (en) 2000-11-29 2008-11-25 Ford Global Technologies, Llc Method and implementation for detecting and characterizing audible transients in noise
FR2820573B1 (fr) 2001-02-02 2003-03-28 France Telecom Methode et dispositif de traitement d'une pluralite de flux binaires audio
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
DE10107385A1 (de) 2001-02-16 2002-09-05 Harman Audio Electronic Sys Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken
US6915264B2 (en) 2001-02-22 2005-07-05 Lucent Technologies Inc. Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding
AU2001244029A1 (en) 2001-04-10 2001-07-09 Phonak Ag Method for adjustment of a hearing aid to suit an individual
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7610205B2 (en) * 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7283954B2 (en) 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
ATE318062T1 (de) 2001-04-18 2006-03-15 Gennum Corp Mehrkanal hörgerät mit übertragungsmöglichkeiten zwischen den kanälen
KR100400226B1 (ko) * 2001-10-15 2003-10-01 삼성전자주식회사 음성 부재 확률 계산 장치 및 방법과 이 장치 및 방법을이용한 잡음 제거 장치 및 방법
US7177803B2 (en) 2001-10-22 2007-02-13 Motorola, Inc. Method and apparatus for enhancing loudness of an audio signal
US20040037421A1 (en) 2001-12-17 2004-02-26 Truman Michael Mead Parital encryption of assembled bitstreams
US7068723B2 (en) 2002-02-28 2006-06-27 Fuji Xerox Co., Ltd. Method for automatically producing optimal summaries of linear media
US7155385B2 (en) 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
FR2842576B1 (fr) 2002-07-17 2004-10-08 Skf Ab Dispositif de palier a roue libre et poulie a roue libre
JP4257079B2 (ja) 2002-07-19 2009-04-22 パイオニア株式会社 周波数特性調整装置および周波数特性調整方法
JP4321049B2 (ja) * 2002-07-29 2009-08-26 パナソニック電工株式会社 自動利得制御装置
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7454331B2 (en) 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
WO2004073178A2 (en) 2003-02-06 2004-08-26 Dolby Laboratories Licensing Corporation Continuous backup audio
DE10308483A1 (de) 2003-02-26 2004-09-09 Siemens Audiologische Technik Gmbh Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät
US7551745B2 (en) 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
ES2290764T3 (es) 2003-05-28 2008-02-16 Dolby Laboratories Licensing Corporation Metodo, aparato y programa de ordenador para calcular y ajustar la sonoridad percibida de una señal de audio.
US20050071154A1 (en) * 2003-09-30 2005-03-31 Walter Etter Method and apparatus for estimating noise in speech signals
US6923684B2 (en) 2003-10-10 2005-08-02 O'sullivan Industries, Inc. Power harness having multiple upstream USB ports
KR101079066B1 (ko) 2004-03-01 2011-11-02 돌비 레버러토리즈 라이쎈싱 코오포레이션 멀티채널 오디오 코딩
GB2413906A (en) 2004-04-21 2005-11-09 Imagination Tech Ltd Radio volume control system
US7617109B2 (en) 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
TWI497485B (zh) 2004-08-25 2015-08-21 Dolby Lab Licensing Corp 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法
WO2006033570A1 (en) * 2004-09-20 2006-03-30 Nederlandse Organisatie Voor Toegepast- Natuurwetenschappelijk Onderzoek Tno Frequency compensation for perceptual speech analysis
WO2006047600A1 (en) 2004-10-26 2006-05-04 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI397901B (zh) * 2004-12-21 2013-06-01 Dolby Lab Licensing Corp 控制音訊信號比響度特性之方法及其相關裝置與電腦程式
US8265295B2 (en) 2005-03-11 2012-09-11 Rane Corporation Method and apparatus for identifying feedback in a circuit
TWI397903B (zh) 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
GB2428168A (en) 2005-07-06 2007-01-17 Motorola Inc A transmitter splits a signal into a plurality of sub-signals, each containing a plurality of sub-carriers, and amplifies each sub-signal separately.
CN101410892B (zh) 2006-04-04 2012-08-08 杜比实验室特许公司 改进的离散余弦变换域中的音频信号响度测量及修改
CN101421781A (zh) 2006-04-04 2009-04-29 杜比实验室特许公司 音频信号的感知响度和/或感知频谱平衡的计算和调整
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
CN102684628B (zh) 2006-04-27 2014-11-26 杜比实验室特许公司 修正音频动态处理器的参数的方法以及执行该方法的设备
KR101137715B1 (ko) 2006-10-20 2012-04-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 리셋을 사용하는 오디오 다이내믹스 프로세싱
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
JP4938862B2 (ja) 2007-01-03 2012-05-23 ドルビー ラボラトリーズ ライセンシング コーポレイション ハイブリッドデジタル/アナログラウドネス補償音量調節
US8560320B2 (en) 2007-03-19 2013-10-15 Dolby Laboratories Licensing Corporation Speech enhancement employing a perceptual model
MY144152A (en) 2007-06-19 2011-08-15 Dolby Lab Licensing Corp Loudness measurement with spectral modifications

Also Published As

Publication number Publication date
CN101790758B (zh) 2013-01-09
US20100198378A1 (en) 2010-08-05
EP2168122B1 (en) 2011-11-30
ES2377719T3 (es) 2012-03-30
EP2168122A1 (en) 2010-03-31
US8396574B2 (en) 2013-03-12
RU2010105052A (ru) 2011-08-20
JP5192544B2 (ja) 2013-05-08
ATE535906T1 (de) 2011-12-15
BRPI0813723A2 (pt) 2017-07-04
TW200915301A (en) 2009-04-01
WO2009011827A1 (en) 2009-01-22
TWI464735B (zh) 2014-12-11
CN101790758A (zh) 2010-07-28
JP2010534030A (ja) 2010-10-28
RU2438197C2 (ru) 2011-12-27

Similar Documents

Publication Publication Date Title
BRPI0813723B1 (pt) método para controlar o nível de intensidade do som de eventos auditivos, memória legível por computador não transitória, sistema de computador e aparelho
US10523169B2 (en) Audio control using auditory event detection
CN109616142B (zh) 用于音频分类和处理的装置和方法

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 04/02/2020, OBSERVADAS AS CONDICOES LEGAIS.