BRPI0813723B1 - método para controlar o nível de intensidade do som de eventos auditivos, memória legível por computador não transitória, sistema de computador e aparelho - Google Patents
método para controlar o nível de intensidade do som de eventos auditivos, memória legível por computador não transitória, sistema de computador e aparelho Download PDFInfo
- Publication number
- BRPI0813723B1 BRPI0813723B1 BRPI0813723A BRPI0813723A BRPI0813723B1 BR PI0813723 B1 BRPI0813723 B1 BR PI0813723B1 BR PI0813723 A BRPI0813723 A BR PI0813723A BR PI0813723 A BRPI0813723 A BR PI0813723A BR PI0813723 B1 BRPI0813723 B1 BR PI0813723B1
- Authority
- BR
- Brazil
- Prior art keywords
- audio signal
- auditory
- asymmetry
- fact
- signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000015654 memory Effects 0.000 title claims description 8
- 230000001052 transient effect Effects 0.000 title 1
- 230000005236 sound signal Effects 0.000 claims abstract description 55
- 238000001228 spectrum Methods 0.000 claims abstract description 21
- 230000003595 spectral effect Effects 0.000 claims description 25
- 238000004458 analytical method Methods 0.000 claims description 16
- 230000008859 change Effects 0.000 claims description 10
- 230000005284 excitation Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 8
- 238000005259 measurement Methods 0.000 claims description 7
- 210000000721 basilar membrane Anatomy 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 210000003027 ear inner Anatomy 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 2
- 238000013459 approach Methods 0.000 claims 1
- 230000009466 transformation Effects 0.000 claims 1
- 230000001131 transforming effect Effects 0.000 claims 1
- 239000003607 modifier Substances 0.000 description 6
- 238000009499 grossing Methods 0.000 description 4
- 230000033458 reproduction Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008961 swelling Effects 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 206010011376 Crepitations Diseases 0.000 description 1
- 208000037656 Respiratory Sounds Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 210000000883 ear external Anatomy 0.000 description 1
- 210000000959 ear middle Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/12—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
- H03G9/18—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for tone control and volume expansion or compression
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Holo Graphy (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
método para controlar o nível de intensidade do som de eventos auditivos, memória legível por computador não transitória, sistema de computador e aparelho a presente invenção refere-se a um método para controlar o nível de intensidade do som de eventos auditivos em um sinal de áudio. em uma modalidade, o método inclui a ponderação dos eventos auditivos (um evento auditivo que tem um espectro e um nível de intensidade do som), usando a assimetria no espectro e controlando o nível de intensidade do som dos eventos auditivos, usando as ponderações. diversas modalidades da invenção ocorrem da seguinte maneira: a ponderação sendo proporcional à medida de assimetria no espectro; a medida de assimetria é uma medida de assimetria suavizada; a ponderação é insensível à amplitude do sinal de áudio; a ponderação é insensível à potência; a ponderação é insensível ao nível de intensidade do som; e qualquer relação entre a medida de sinal e o nível de reprodução absoluta não é conhecida no momento da ponderação; a ponderação inclui a ponderação da importância de limite de evento auditivo, usando a assimetria no espectro.
Description
Relatório Descritivo da Patente de Invenção para MÉTODO PARA CONTROLAR O NÍVEL DE INTENSIDADE DO SOM DE EVENTOS AUDITIVOS, MEMÓRIA LEGÍVEL POR COMPUTADOR NÃO TRANSITÓRIA, SISTEMA DE COMPUTADOR E APARELHO.
Campo da Técnica [0001] A invenção refere-se, em geral, ao processamento de áudio e à análise de cena auditiva e assimetria espectral, in particular. Referências e Incorporação por Referência [0002] A seguir, os documentos são incorporados no presente documento por referência em sua totalidade:
[0003] Crockett e Seefeldt, pedido internacional sob o Tratado de
Cooperação de Patentes, S.N. PCT/US2007/008313, intitulado, Controlling Dynamic Gain Parameters of Audio using Auditory Scene Analysis and Specific-Loudness-Based Detection of Auditory Events, que designa Brett Graham Crockett e Alan Jeffrey Seefeldt como inventores, depositado em 30 de março de 2007, com a súmula do procurador DOL186 PCT, e publicado em 8 de novembro de 2007 como WO 2007/127023;
[0004] Seefeldt et al., pedido internacional sob o Tratado de
Cooperação de Patentes, S.N. PCT/US 2004/016964, intitulado, Method, Apparatus and Computer Program for Calculating and Adjusting the Perceived Loudness of an Audio Signal que designa Alan Jeffrey Seefeldt et al. como inventores, depositado em 27 de maio de 2004, com a súmula do procurador No DOL119 PCT, e publicado em 23 de dezembro de 2004 como WO 2004/111994 A2;
[0005] Seefeldt, pedido internacional sob o Tratado de
Cooperação de Patentes, S.N. PCT/US2005/038579, intitulado Calculating and Adjusting the Perceived Loudness and/or the Perceived Spectral Balance of an Audio Signal, que designa Alan
Petição 870190113071, de 05/11/2019, pág. 4/26
2/16
Jeffrey Seefeldt como o inventor, depositado em 25 de outubro de 2005, com a súmula do procurador No. DOL15202 PCT, e publicado em 4 de maio de 2006 como WO 2006/047600;
[0006] Crockett, pedido de patente U.S. S.N. 10/474.387, intitulado, High Quality Time-Scaling and Pitch-Scaling of Audio Signals, que designa Brett Graham Crockett como o inventor, depositado em 10 de outubro de 2003, com a súmula do procurador número DOL07503, e publicado em 24 de junho de 2004 como US 2004/0122662 A1;
[0007] Crockett et al., pedido de patente U.S. S.N. 10/478.398, intitulado, Method for Time Aligning Audio Signals Using Characterizations Based on Auditory Events, que designa Brett G. Crockett et al. como inventores, depositado em 20 de novembro de 2003, com a súmula do procurador número DOL09201, e publicado em 29 de julho de 2004 como US 2004/0148159 A1;
[0008] Crockett, pedido de patente U.S. S.N. 10/478.538, intitulado, Segmenting Audio Signals Into Auditory Events, que designa Brett G. Crockett como o inventor, depositado em 20 de novembro de 2003, com a súmula do procurador número DOL098, e publicado em August 26, 2004 as US 2004/0165730 A1;
[0009] Crockett et AL., pedido de patente U.S. S.N. 10/478.397, intitulado, Comparing Audio Using Characterizations Based on Auditory Events, que designa Brett G. Crockett et al. como inventores, depositado em 20 de novembro de 2003, com a súmula do procurador número DOL092, e publicado em 2 de setembro de 2004 como US 2004/0172240 A1;
[00010] Smithers, pedido internacional sob o Tratado de Cooperação de Patentes S.N. PCT/US 05/24630, intitulado, Method for Combining Audio Signals Using Auditory Scene Analysis, que designa Michael John Smithers como o inventor, depositado em 13 de
Petição 870190113071, de 05/11/2019, pág. 5/26
3/16 julho de 2005, com a súmula do procurador número DOL148 PCT, e publicado em 9 de março de 2006 como WO 2006/026161;
[00011] Crockett, B. e Smithers, M., A Method for Characterizing and Identifying Audio Based on Auditory Scene Analysis, Audio Engineering Society Convention Paper 6416, 118th Convention,
Barcelona, 28 a 31 de maio de 2005;
[00012] Crockett, B., High Quality Multichannel Time Scaling and Pitch-Shifting using Auditory Scene Analysis, Audio Engineering Society Convention Paper 5948, New York, outubro de 2003; e [00013] Seefeldt et al., A New Objective Measure of Perceived Loudness, Audio Engineering Society Convention Paper 6236, San Francisco, 28 de outubro de 2004.
Antecedentes da Invenção
Eventos Auditivos e Detecção de Evento Auditivo [00014] A divisão de sons nas unidades ou segmentos percebidos como separados e distintos algumas vezes é referida como análise de evento auditivo ou análise de cena auditiva (ASA). Os segmentos algumas vezes são referidos como eventos auditivos ou eventos de áudio. Albert S. Bregman, Auditory Scene Analysis-The Perceptual Organization of Sound (Massachusetts Institute of Technology, 1991, Quarta impressão, 2001, Second MIT Press paperback edition) discutem extensivamente a análise de cena auditiva. Além disso, Bhadkamkar et al., patente U.S. número 6.002.776 (14 de dezembro de 1999) cita as publicações que datam de 1976 como técnica relacionada à separação de som por análise de cena auditiva. Entretanto, Bhadkamkar et al. desencoraja o uso prático de análise de cena auditiva, que conclui que técnicas que envolvem análise de cena auditiva, embora interessantes a partir de um ponto de vista científico como modelos de processamento auditivo humano, estão atualmente muito longe da demanda computacional e especializada para serem
Petição 870190113071, de 05/11/2019, pág. 6/26
4/16 consideradas técnicas práticas para a separação de som até o progresso fundamental ser obtido.
[00015] Crockett e Crocket et al. nos diversos pedidos de patente e documentos listados acima identifica eventos auditivos. Estes documentos ensinam a divisão de um sinal de áudio em eventos auditivos (sendo que cada um tende a ser percebido como separado e distinto) ao detectar as alterações na composição espectral (amplitude como uma função de frequência) em relação ao tempo. Isto pode ser feito, por exemplo, através do cálculo do conteúdo espectral de sucessivos blocos de tempo do sinal de áudio, que compara o conteúdo espectral entre sucessivos blocos de tempo e identifica um limite de evento auditivo como o limite entre os blocos onde a diferença no conteúdo espectral excede um limítrofe. Alternativamente, as alterações na amplitude em relação ao tempo podem ser calculadas em vez de ou, além das alterações na composição espectral em relação ao tempo.
[00016] Os marcadores de limite de evento auditivo são frequentemente dispostos em um sinal de controle temporal, de modo que a faixa, tipicamente de zero a um, indique a intensidade do limite de evento. Além disso, o sinal de controle é muitas vezes filtrado, de modo que a intensidade do limite de evento permaneça, e os intervalos de tempo entre os limites de eventos sejam calculados como valores de decaimento do limite de evento precedente. Esta intensidade de evento auditivo filtrado é, então, usada por outros métodos de processamento de áudio que incluem controle de ganho automático e controle de faixa dinâmica.
Processamento de Dinâmica de Áudio [00017] As técnicas de controle de ganho automático (AGC) e controle de faixa dinâmica (DRC) são bem conhecidas e comuns em muitas trajetórias de sinal de áudio. Em um sentido abstrato, ambas as
Petição 870190113071, de 05/11/2019, pág. 7/26
5/16 técnicas medem o nível de um sinal de áudio e, então, modificam por ganho o sinal através de uma quantidade que é uma função do nível medido. Em uma linear, sistema de processamento de dinâmica 1:1, o áudio de entrada não é processado e o sinal de áudio de saída de modo ideal é compatível com o sinal de áudio de entrada. Adicionalmente, imagine um sistema de processamento de dinâmica de áudio que mede automaticamente o sinal de entrada e controla o sinal de saída com aquela medida. Se o sinal de entrada se eleva no nível em 6 dB e o sinal de saída processado se eleva no nível em apenas 3 dB, então, o sinal de saída foi compactado por uma razão de 2:1 em relação ao sinal de entrada.
[00018] Em Crockett e Seefeldt, a análise de cena auditiva aperfeiçoa o desempenho de métodos AGC e DRC ao minimizar a alteração no ganho entre os limites de evento auditivo, e confina muito da alteração de ganho na região de um limite de evento. Isto ocorre ao modificar o comportamento de liberação de processamento de dinâmica. Deste modo, os eventos auditivos soam coerentes e naturais. [00019] As notas tocadas em um piano são um exemplo. Com os métodos AGC ou DRC convencionais, o ganho aplicado ao sinal de áudio aumenta durante a cauda de cada nota, fazendo com que cada nota cresça anormalmente. Com a análise de cena auditiva, o ganho de AGC ou DRC é mantido constante em cada nota e altera apenas próximo ao início de cada nota onde um limite de evento auditivo é detectado. O sinal de áudio ajustado por ganho resultante soa natural à medida que a cauda de cada nota desaparece.
[00020] As implementações típicas de análise de cena auditiva (como nas referências acima) têm nível deliberadamente invariável. Ou seja, elas detectam os limites de evento auditivo independente do nível de sinal absoluto. Embora a invariância de nível seja útil em muitos pedidos, algumas análises de cena auditiva se beneficiam de
Petição 870190113071, de 05/11/2019, pág. 8/26
6/16 alguma dependência de nível.
[00021] Tal caso é o método descrito em Crockett e Seefeldt. O controle ASA de AGC e DRC evita grandes alterações de ganho entre limites de evento auditivo. Entretanto, as alterações de ganho de período mais longo ainda podem ser indesejáveis em alguns tipos de sinais de áudios. Quando um sinal de áudio parte de uma seção mais alta para uma mais silenciosa, o ganho de AGC ou DRC, restrito à alteração apenas próxima aos limites de evento, pode permitir que o nível do sinal de áudio de processamento eleve de maneira indesejável e anormal durante a seção silenciosa. Esta situação ocorre frequentemente em filmes onde o diálogo esporádico alterna com os sons de fundo silenciosos. Devido ao fato de o sinal de áudio de fundo silencioso também conter eventos auditivos, o ganho de AGC ou DRC é alterado próximo a estes limites de evento, e o nível de sinal de áudio total se eleva.
[00022] A simples ponderação da importância de eventos auditivos através de uma medida do nível, potência ou nível de intensidade do som de sinal de áudio é indesejável. Em muitas situações a relação entre a medida de sinal e o nível de reprodução absoluta não é conhecida. De maneira ideal, uma medida que discrimina ou detecta os sinais de áudio perceptivelmente mais silenciosos independente do nível absoluto do sinal de áudio pode ser útil. Aqui, perceptivelmente mais silencioso não se refere aos mais silenciosos em uma medida de nível de intensidade do som objetivo (como em Seefeldt et al. e Seefeldt), mas, em vez disso, mais silencioso se baseia no nível de intensidade do som esperado do conteúdo. Por exemplo, a experiência humana indica que um sussurro é um som silencioso. Se um sistema de processamento de dinâmica mede isto como silencioso e consequentemente aumenta o ganho de AGC para obter algum nível de intensidade do som ou nível de saída nominal, o sussurro ajustado
Petição 870190113071, de 05/11/2019, pág. 9/26
7/16 por ganho resultante pode ser mais alto do que a experiência considera.
Descrição da Invenção [00023] No presente documento são ensinados métodos e aparelhos para controlar o nível de intensidade do som de eventos auditivos em um sinal de áudio. Em uma modalidade, o método inclui uma ponderação dos eventos auditivos (um evento auditivo que tem um espectro e um nível de intensidade do som), que usa assimetria no espectro e controla o nível de intensidade do som dos eventos auditivos, usando as ponderações. Diversas modalidades da invenção ocorrem da seguinte maneira: a ponderação sendo proporcional à medida de assimetria no espectro; a medida de assimetria é uma medida de assimetria suavizada; a ponderação é insensível à amplitude do sinal de áudio; a ponderação é insensível à potência; a ponderação é insensível ao nível de intensidade do som; e qualquer relação entre a medida de sinal e o nível de reprodução absoluta não é conhecida no momento da ponderação; a ponderação inclui a ponderação da importância de limite de evento auditivo, usando a assimetria no espectro; e a redução da inchação de nível de processamento de AGC ou DRC durante os segmentos perceptivelmente mais silenciosos do sinal de áudio quando comparados com os métodos que não realizam a ponderação reivindicada.
[00024] Em outras modalidades, a invenção é uma memória legível por computador que contém um programa de computador para realizar qualquer um dos métodos acima.
[00025] Ainda em outras modalidades, a invenção é um sistema de computador que inclui uma CPU, uma das memórias mencionadas acima e um barramento que acopla de maneira comunicativa a CPU e a memória.
Petição 870190113071, de 05/11/2019, pág. 10/26
8/16 [00026] Ainda em outra modalidade, a invenção é um método para controlar o nível de intensidade do som de eventos auditivos em um sinal de áudio, que inclui o cálculo de medidas de assimetria de espectro de sucessivos eventos auditivos de um sinal de áudio, gerar ponderações para os eventos auditivos baseados nas medidas de assimetria, que derivam um sinal de controle a partir das ponderações e controlam o nível de intensidade do som dos eventos auditivos que usam o sinal de controle.
[00027] Os diversos recursos da presente invenção e suas modalidades preferidas podem ser mais bem entendidos referindo-se à seguinte discussão e os desenhos em anexo, em que as referências numéricas similares se referem a elementos similares.
Descrição dos Desenhos [00028] A Figura 1 ilustra um dispositivo para realizar dois métodos de Crockett e Seefeldt para analisar cenas auditivas e controlar parâmetros de ganho de dinâmica.
[00029] A Figura 2 ilustra um processador de áudio para identificar eventos auditivos e calcular a assimetria para modificar os eventos auditivos que, por sua vez, modificam os parâmetros de processamento de dinâmica, de acordo com uma modalidade da presente invenção.
[00030] A Figura 3 é uma série de gráficos que ilustra o uso de eventos auditivos para controlar o tempo de liberação em uma implementação digital de um Controlador de Faixa Dinâmica (DRC), de acordo com uma modalidade da invenção.
[00031] Figura 4 é uma resposta de característica idealizada de um filtro linear adequado como um filtro de transmissão, de acordo com uma modalidade da invenção.
[00032] A Figura 5 mostra um conjunto de respostas de característica de filtro auditivo idealizadas que aproximam a banda
Petição 870190113071, de 05/11/2019, pág. 11/26
9/16 crítica na escala de ERB.
Melhor Modo para Realizar a Invenção [00033] A Figura 1 ilustra um dispositivo 1 para analisar cenas auditivas e controlar parâmetros de ganho de dinâmica, de acordo com Crockett e Seefeldt. O dispositivo inclui um identificador de eventos auditivos 10, um identificador de características de eventos auditivos opcional 11 e um modificador de parâmetros de dinâmica 12. O identificador de eventos auditivos 10 recebe áudio como entrada e produz uma entrada para o modificador de parâmetros de dinâmica 12 (e uma entrada para o identificador de características de eventos auditivos 11, se presente). O modificador de parâmetros de dinâmica 12 recebe a saída do identificador de eventos auditivos 10 (e o identificador de características de eventos auditivos 11, se presente) e produz uma saída.
[00034] O identificador de eventos auditivos 10 analisa o espectro e a partir dos resultados identifica a localizações dos eventos de áudio perceptíveis que servem para controlar os parâmetros de ganho de dinâmica. Alternativamente, o identificador de eventos auditivos 10 transforma o áudio em um domínio de nível de intensidade do som perceptivo (que pode proporcionar informações mais físicoacusticamente relevantes que o primeiro método) e no domínio de nível de intensidade do som perceptivo identifica a localização de eventos auditivos que servem para controlar os parâmetros de ganho de dinâmica. (Nesta alternativa, o processamento de áudio está ciente dos níveis de reprodução acústica absolutos).
[00035] O modificador de parâmetros de dinâmica 12 modifica os parâmetros de dinâmica baseados na saída do identificador de eventos auditivos 10 (e identificador de características de eventos auditivos 11, se presente).
[00036] Em ambas as alternativas, um sinal de áudio digital x[n] é
Petição 870190113071, de 05/11/2019, pág. 12/26
10/16 segmentado em blocos, e para cada bloco t, D[f] representa a diferença espectral entre o bloco atual e o bloco anterior.
[00037] Para a primeira alternativa, D[f] é a soma, ao longo de todos os coeficientes espectrais, da magnitude da diferença entre os coeficientes espectrais de log normalizados (em dB) para o bloco atual t e o bloco anterior t
- 1. Nesta alternativa D[f] é proporcional às diferenças absolutas no espectro (o mesmo em dB). Para a segunda alternativa, D[f] é a soma, ao longo de todos os coeficientes de nível de intensidade do som específicos, da magnitude da diferença entre os coeficientes de nível de intensidade do som específicos normalizados para o bloco atual t e o bloco anterior t - 1. Nesta alternativa, D[f] é proporcional às diferenças absolutas no nível de intensidade do som específico (em soneto).
[00038] Em ambas as alternativas, se D[f] excede um limítrofe Dmin, então, o evento é considerado como ocorrido. O evento pode ter uma intensidade, entre zero e um, baseado na razão de D[f] menos Dmin para a diferença entre D max Θ Dmin- A intensidade A[t] pode ser computada como:
[00039] | 0 op]<ümin 4f]= ü[/]-Dlm D mm<D[t]<D^ max mm 1 £)[/]> Draas (1) Os limites máximo e mínimo são diferentes para cada |
alternativa, devido às suas unidades diferentes. O resultado, entretanto, a partir de ambas é uma intensidade de evento na faixa de 0 a 1. Outras alternativas podem calcular uma intensidade de evento, porém, a alternativa expressa na equação (1) provou a si mesma em inúmeras áreas, incluindo o controle do processamento de dinâmica. Designar uma intensidade (proporcional à quantidade de alteração
Petição 870190113071, de 05/11/2019, pág. 13/26
11/16 espectral associada a este evento) ao evento auditivo permite o maior controle sobre o processamento de dinâmica, comparado a uma decisão de evento binário. Alterações de ganho maiores são aceitáveis durante eventos mais fortes, e o sinal na equação (1) permite tal controle variável.
[00040] O sinal A[f] é um sinal impulsivo com um impulso que ocorre na localização de um limite de evento. Para os propósitos de controlar o tempo de liberação, alguém pode suavizar adicionalmente o sinal A[f], de modo que o mesmo decaia suavemente até zero após a detecção de um limite de evento. O sinal de controle de evento suavizado Ã[f] pode ser computado a partir de A[f] de acordo com:
^Íd>«e,.ra/J[r-1] otherwise (2) [00041]
Aqui Qevent controla o tempo de decaimento do sinal de controle de evento.
[00042] A Figura 3 é uma sequência de gráficos que ilustra a operação e o efeito da invenção, de acordo com uma modalidade, b) na Figura 3 mostra o sinal de controle de evento Ã[f] para o sinal de áudio correspondente de a) na Figura 3, com o meio tempo de decaimento do suavizador ajustado em 250 ms. O sinal de áudio contém três rajadas de diálogo, espalhadas com sons de estalo de fogueira de fundo silenciosos. O sinal de controle de evento mostra muitos eventos auditivos tanto nos sons de diálogo como nos sons de fundo.
[00043] Na Figura 3, c) mostra o sinal de ganho de DRC, onde o sinal de controle de evento A[f] é usado para variar a constante de tempo de liberação para a suavização de ganho de DRC. Como Crocket e Seefeldt descrevem, quando o sinal de controle é igual a um, o coeficiente de suavização de liberação não é afetado, e as
Petição 870190113071, de 05/11/2019, pág. 14/26
12/16 alterações de ganho suavizadas, de acordo com o valor da constante de tempo. Quando o sinal de controle é igual a zero, evita-se que o ganho suavizado seja alterado. Quando o sinal de controle fica entre zero e um, permite-se que o ganho suavizado altere - porém, em uma taxa reduzida em proporção ao sinal de controle.
[00044] No c da Figura 3, o ganho de DRC se eleva durante os sons de fundo silenciosos devido ao número de eventos detectado no fundo. O sinal de áudio modificado por DRC resultante no d) da Figura 3 tem inchação audível e indesejável do nível de intensidade do som de fundo entre as rajadas de diálogo. Para reduzir a alteração de ganho durante os sons de fundo silenciosos, uma modalidade da invenção modifica ou pondera a intensidade auditiva A[í] usando uma medida da assimetria do sinal de áudio espectro. Uma modalidade da invenção calcula a assimetria espectral da excitação do sinal de áudio. [00045] A assimetria é uma medida estatística da assimetria de uma distribuição de probabilidade. Uma distribuição simétrica sobre a média tem distorção zero. Uma distribuição com seu volume ou massa concentrada acima da média e com uma cauda longa que tende a ser mais baixa que a média que tem uma distorção negativa. Uma distribuição concentrada abaixo da média e com uma cauda longa que tende a ser mais alta que a média que tem uma distorção positiva. O espectro de magnitude ou potência de um sinal de áudio típico tem distorção positiva. Ou seja, o volume da energia no espectro é concentrado mais baixo no espectro, e o espectro tem uma cauda longa em direção à parte superior do espectro.
[00046] A Figura 2 ilustra um processador de áudio 2, de acordo com uma modalidade da invenção. O processador de áudio 2 inclui o modificador de parâmetros de dinâmica 12 e o identificador de características de eventos auditivos opcional 11 da Figura 1, assim como, um identificador de eventos auditivos 20 e um calculador de
Petição 870190113071, de 05/11/2019, pág. 15/26
13/16 assimetria 21. Tanto o calculador de assimetria 21, como o identificador de eventos auditivos 20 recebem o sinal de áudio 13, e o calculador de assimetria 21 produz a entrada para o identificador de eventos auditivos 20. O identificador de eventos auditivos 20, identificador de características de eventos auditivos 11 e o modificador de parâmetros de dinâmica 12 são, de outro modo, conectados como suas reproduções na Figura 1.
[00047] Na Figura 2, o calculador de assimetria 21 calcula a assimetria a partir de uma representação espectral do sinal de áudio 13, e o identificador de eventos auditivos 20 calcula a análise de cena auditiva a partir da mesma representação espectral. O sinal de áudio 13 pode ser agrupado em 50% dos blocos sobrepostos de amostras M, e a Transformada Discreta de Fourier pode ser computada da seguinte maneira:
ΛΪ — 1 :2nkn
ΑΛ[Α:,/] = J^x[n,r]g Λ/ »=o (3) em que M = amostras 2*N e x[n,f] denota um bloco de amostras.
[00048] Presume-se que o tamanho de bloco para a transformada é o mesmo que para o cálculo do sinal de evento auditivo. Entretanto, este não precisa ser o caso. Onde existir diferentes taxas de bloco, os sinais em uma taxa de bloco podem ser interpelados ou a taxa convertida na mesma escala de tempo que os sinais na outra taxa de bloco.
[00049] O sinal de excitação E[b,t] que aproxima a distribuição de energia ao longo da membrana basilar do ouvido interno na banda crítica b enquanto o bloco de tempo té computado:
£[M=SMT.wlW.T * (4)
Petição 870190113071, de 05/11/2019, pág. 16/26
14/16 em que T[k] representa a resposta de frequência de um filtro que simula a transmissão de áudio através do ouvido externo e médio e Cb[k] representa a resposta de frequência da membrana basilar em uma localização que corresponde à banda crítica b.
[00050] A Figura 4 mostra a resposta de frequência de um filtro de transmissão adequado T[k], A Figura 5 mostra um conjunto adequado de respostas de filtro de banda crítica, que correspondem a Cb[k], em que 40 bandas são uniformemente separadas ao longo da escala de largura de Banda Retangular Equivalente de Moore e Glasberg (ERB), para uma taxa de amostra de 48 kHz e tamanho de transformada de M = 2048. Uma função exponencial arredondada descreve cada formato de filtro, e 1 ERB separa as bandas.
[00051] Se os limites de evento auditivo forem computados a partir do espectro de nível de intensidade do som específico, por Crocket e Seefeldt, então, o sinal de excitação E[b,t] já existe como parte do cálculo de nível de intensidade do som específico.
[00052] Finalmente, a assimetria espectral é computada a partir do sinal de excitação E[b,t] como:
(5) em que μ é a média aritmética da excitação:
(6) e σ é a variância do sinal de excitação:
[00053] O sinal de assimetria SK[f] da equação (5) flutua
Petição 870190113071, de 05/11/2019, pág. 17/26
15/16 consideravelmente e requer a suavização deste para evitar artefatos quando modifica o sinal de controle de evento e os parâmetros de processamento de dinâmica subsequentes. Uma modalidade usa um único suavizador de polo com uma constante de decaimento osk que tem um meio tempo de decaimento de aproximadamente 6,5 ms:
SK'[/] = aSKSK’[t - 1] + (1 - a5A ) W] (8) [00054] A limitação da assimetria em SKmax e SKmin máxima e mínima, respectivamente, pode ser útil. Uma assimetria restrita SK[f] pode ser computada como:
5Χ·[Ζ] =
-^rain ££[/]>
(7) [00055]
Valores baixos (valore próximos a 0,0) do sinal de assimetria SK[f] correspondem de maneira típica aos sinais caracteristicamente mais silenciosos, enquanto os valores de assimetria altos (valores próximos a 1,0) correspondem de maneira típica aos sinais caracteristicamente mais altos. Na Figura 3, o gráfico e) mostra o sinal de assimetria que corresponde ao sinal de áudio no
a) da Figura 3. A assimetria é alta para as rajadas de diálogo mais altas e baixa para os sons de fundo.
[00056] O sinal de assimetria SK[f] passa para o identificador de eventos auditivos 20 da Figura 2 que pondera a medida de diferença espectral D[f] como:
OsJ/] = 5Á/[/]£>[/] (8) [00057] O sinal de intensidade auditivo modificado por assimetria
Ask[í] é computado do mesmo modo que A[f] na equação (1):
Petição 870190113071, de 05/11/2019, pág. 18/26
16/16
D -D max min
I
Dm <DSK[t\<D, &SK [(] - -^mix (9) [00058] O sinal de intensidade auditivo modificado por assimetria
Ask[í] é suavizado do mesmo modo que A[f] na equação (2):
à í'-Π otherwise [00059] Na Figura 3, f) mostra o sinal de controle de evento modificado por assimetria Ask[í] para o sinal de áudio correspondente em a) na Figura 3. Menos eventos auditivos aparecem durante os sons de fundo, enquanto os eventos que correspondem ao diálogo mais alto permanecem. Na Figura 3, g) mostra o sinal de DRC controlado por evento modificado por assimetria. Com menos eventos auditivos nos sons de fundo, o ganho de DRC fica relativamente constante e se move apenas para as seções de diálogo mais altas, h) na Figura 3 mostra o sinal de áudio modificado por DRC resultante.
[00060] O sinal de áudio modificado por DRC não tem nenhuma inchação indesejável no nível durante os sons de fundo.
[00061] O sinal de assimetria SK[f] reduz algumas vezes de forma perceptiva para os sinais mais altos. Para estes sinais altos, o valor da medida de diferença espectral D[f] é grande o bastante, que mesmo após a ponderação através do sinal de assimetria SK[f] na equação 8, a medida de diferença espectral ponderada Dsk[í] ainda é tipicamente grande o bastante para indicar um limite de evento auditivo. O sinal de controle de evento Ãsk[í] não é adversamente afetado.
Claims (10)
1/2
REIVINDICAÇÕES
1. Método para controlar o nível de intensidade do som de eventos auditivos em um sinal de áudio para controlar as alterações de ganho em um sinal de áudio em um controle de ganho automático ou um processamento de sinal de controle de faixa dinâmica, caracterizado pelo fato de que compreende as etapas de:
dividir o sinal de áudio em eventos auditivos, sendo que cada um tende a ser percebido de modo separado e distinto, ao detectar alterações na composição espectral em relação ao tempo, a divisão que inclui a detecção da localização e da intensidade dos limites de evento auditivo no sinal de áudio, obter uma medida de alteração dinâmica da assimetria espectral do sinal de áudio, em que a assimetria espectral é uma medida estatística da assimetria da distribuição de probabilidade do espectro de sinal de áudio, modificar a intensidade dos limites do evento auditivo em resposta à medida, de modo que quanto menos o espectro estiver distorcido na localização de um limite de evento auditivo, mais reduzida será a intensidade do limite do evento auditivo, e controlar o nível de intensidade do som de eventos auditivos em resposta à localização e à intensidade modificada por assimetria dos limites do evento auditivo, de modo que a redução da intensidade do limite do evento auditivo reduz a mudança de ganho do sinal de áudio durante sons de fundo silencioso.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a divisão do sinal de áudio em eventos auditivos inclui a análise do espectro do sinal de áudio.
3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a obtenção de uma medida de alteração dinâmica da assimetria espectral do sinal de áudio inclui o cálculo da assimetria de
Petição 870190113071, de 05/11/2019, pág. 24/26
2/2 uma representação espectral do sinal de áudio.
4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que o cálculo da assimetria inclui o cálculo de um sinal de excitação que se aproxima da distribuição de energia ao longo da membrana basilar do ouvido interno.
5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a divisão do sinal de áudio em eventos auditivos inclui transformar o sinal de áudio em um domínio de nível de intensidade do som perceptivo, a transformação inclui o cálculo de um sinal de excitação que se aproxima da distribuição de energia ao longo da membrana basilar do ouvido interno.
6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que a obtenção de uma medida de alteração dinâmica da assimetria espectral do sinal de áudio inclui o cálculo da assimetria do sinal de excitação.
7. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a medida da assimetria espectral é uma medida suavizada.
8. Memória legível por computador não transitória caracterizada pelo fato de que contém um programa de computador para executar o método conforme definido na reivindicação 1.
9. Sistema de computador caracterizado pelo fato de que compreende:
uma CPU;
a memória de acordo com a reivindicação 8; e um barramento que acopla de maneira comunicativa a CPU e a memória.
10. Aparelho caracterizado pelo fato de que compreende meios adaptados para executar o método conforme definido na reivindicação 1.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US95946307P | 2007-07-13 | 2007-07-13 | |
PCT/US2008/008592 WO2009011827A1 (en) | 2007-07-13 | 2008-07-11 | Audio processing using auditory scene analysis and spectral skewness |
Publications (2)
Publication Number | Publication Date |
---|---|
BRPI0813723A2 BRPI0813723A2 (pt) | 2017-07-04 |
BRPI0813723B1 true BRPI0813723B1 (pt) | 2020-02-04 |
Family
ID=39776994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BRPI0813723A BRPI0813723B1 (pt) | 2007-07-13 | 2008-07-11 | método para controlar o nível de intensidade do som de eventos auditivos, memória legível por computador não transitória, sistema de computador e aparelho |
Country Status (10)
Country | Link |
---|---|
US (1) | US8396574B2 (pt) |
EP (1) | EP2168122B1 (pt) |
JP (1) | JP5192544B2 (pt) |
CN (1) | CN101790758B (pt) |
AT (1) | ATE535906T1 (pt) |
BR (1) | BRPI0813723B1 (pt) |
ES (1) | ES2377719T3 (pt) |
RU (1) | RU2438197C2 (pt) |
TW (1) | TWI464735B (pt) |
WO (1) | WO2009011827A1 (pt) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8315398B2 (en) | 2007-12-21 | 2012-11-20 | Dts Llc | System for adjusting perceived loudness of audio signals |
US8938313B2 (en) | 2009-04-30 | 2015-01-20 | Dolby Laboratories Licensing Corporation | Low complexity auditory event boundary detection |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
US8510361B2 (en) * | 2010-05-28 | 2013-08-13 | George Massenburg | Variable exponent averaging detector and dynamic range controller |
TW202339510A (zh) | 2011-07-01 | 2023-10-01 | 美商杜比實驗室特許公司 | 用於適應性音頻信號的產生、譯碼與呈現之系統與方法 |
US9633667B2 (en) | 2012-04-05 | 2017-04-25 | Nokia Technologies Oy | Adaptive audio signal filtering |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
EP2898510B1 (en) * | 2012-09-19 | 2016-07-13 | Dolby Laboratories Licensing Corporation | Method, system and computer program for adaptive control of gain applied to an audio signal |
US9979829B2 (en) | 2013-03-15 | 2018-05-22 | Dolby Laboratories Licensing Corporation | Normalization of soundfield orientations based on auditory scene analysis |
CN104078050A (zh) | 2013-03-26 | 2014-10-01 | 杜比实验室特许公司 | 用于音频分类和音频处理的设备和方法 |
CN104079247B (zh) | 2013-03-26 | 2018-02-09 | 杜比实验室特许公司 | 均衡器控制器和控制方法以及音频再现设备 |
CN104080024B (zh) | 2013-03-26 | 2019-02-19 | 杜比实验室特许公司 | 音量校平器控制器和控制方法以及音频分类器 |
US9947335B2 (en) | 2013-04-05 | 2018-04-17 | Dolby Laboratories Licensing Corporation | Companding apparatus and method to reduce quantization noise using advanced spectral extension |
JP6224850B2 (ja) | 2014-02-28 | 2017-11-01 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 会議における変化盲を使った知覚的連続性 |
WO2017079334A1 (en) | 2015-11-03 | 2017-05-11 | Dolby Laboratories Licensing Corporation | Content-adaptive surround sound virtualization |
US9372881B1 (en) | 2015-12-29 | 2016-06-21 | International Business Machines Corporation | System for identifying a correspondence between a COBOL copybook or PL/1 include file and a VSAM or sequential dataset |
WO2017147325A1 (en) | 2016-02-25 | 2017-08-31 | Dolby Laboratories Licensing Corporation | Multitalker optimised beamforming system and method |
US11894006B2 (en) | 2018-07-25 | 2024-02-06 | Dolby Laboratories Licensing Corporation | Compressor target curve to avoid boosting noise |
CN113015059B (zh) * | 2021-02-23 | 2022-10-18 | 歌尔科技有限公司 | 音频优化方法、装置、设备及可读存储介质 |
Family Cites Families (136)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2808475A (en) | 1954-10-05 | 1957-10-01 | Bell Telephone Labor Inc | Loudness indicator |
US4281218A (en) | 1979-10-26 | 1981-07-28 | Bell Telephone Laboratories, Incorporated | Speech-nonspeech detector-classifier |
US4624009A (en) | 1980-05-02 | 1986-11-18 | Figgie International, Inc. | Signal pattern encoder and classifier |
DE3314570A1 (de) | 1983-04-22 | 1984-10-25 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Verfahren und anordnung zur einstellung der verstaerkung |
US4594561A (en) * | 1984-10-26 | 1986-06-10 | Rg Dynamics, Inc. | Audio amplifier with resistive damping for minimizing time displacement distortion |
US4739514A (en) | 1986-12-22 | 1988-04-19 | Bose Corporation | Automatic dynamic equalizing |
US4887299A (en) | 1987-11-12 | 1989-12-12 | Nicolet Instrument Corporation | Adaptive, programmable signal processing hearing aid |
US5027410A (en) | 1988-11-10 | 1991-06-25 | Wisconsin Alumni Research Foundation | Adaptive, programmable signal processing and filtering for hearing aids |
JPH02118322U (pt) | 1989-03-08 | 1990-09-21 | ||
US5097510A (en) | 1989-11-07 | 1992-03-17 | Gs Systems, Inc. | Artificial intelligence pattern-recognition-based noise reduction system for speech processing |
US5369711A (en) | 1990-08-31 | 1994-11-29 | Bellsouth Corporation | Automatic gain control for a headset |
US5632005A (en) | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
SG49883A1 (en) | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
EP0517233B1 (en) | 1991-06-06 | 1996-10-30 | Matsushita Electric Industrial Co., Ltd. | Music/voice discriminating apparatus |
US5278912A (en) | 1991-06-28 | 1994-01-11 | Resound Corporation | Multiband programmable compression system |
JPH0566795A (ja) * | 1991-09-06 | 1993-03-19 | Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho | 雑音抑圧装置とその調整装置 |
US5363147A (en) | 1992-06-01 | 1994-11-08 | North American Philips Corporation | Automatic volume leveler |
DE4335739A1 (de) | 1992-11-17 | 1994-05-19 | Rudolf Prof Dr Bisping | Verfahren zur Steuerung des Signal-/Rausch-Abstandes bei rauschbehafteten Tonaufnahmen |
US5457769A (en) | 1993-03-30 | 1995-10-10 | Earmark, Inc. | Method and apparatus for detecting the presence of human voice signals in audio signals |
US5706352A (en) | 1993-04-07 | 1998-01-06 | K/S Himpp | Adaptive gain and filtering circuit for a sound reproduction system |
US5434922A (en) | 1993-04-08 | 1995-07-18 | Miller; Thomas E. | Method and apparatus for dynamic sound optimization |
BE1007355A3 (nl) | 1993-07-26 | 1995-05-23 | Philips Electronics Nv | Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling. |
IN184794B (pt) | 1993-09-14 | 2000-09-30 | British Telecomm | |
JP2986345B2 (ja) | 1993-10-18 | 1999-12-06 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 音声記録指標化装置及び方法 |
US5530760A (en) | 1994-04-29 | 1996-06-25 | Audio Products International Corp. | Apparatus and method for adjusting levels between channels of a sound system |
US5500902A (en) | 1994-07-08 | 1996-03-19 | Stockham, Jr.; Thomas G. | Hearing aid device incorporating signal processing techniques |
GB9419388D0 (en) | 1994-09-26 | 1994-11-09 | Canon Kk | Speech analysis |
US5548538A (en) | 1994-12-07 | 1996-08-20 | Wiltron Company | Internal automatic calibrator for vector network analyzers |
US5682463A (en) | 1995-02-06 | 1997-10-28 | Lucent Technologies Inc. | Perceptual audio compression based on loudness uncertainty |
CA2167748A1 (en) | 1995-02-09 | 1996-08-10 | Yoav Freund | Apparatus and methods for machine learning hypotheses |
ATE229729T1 (de) | 1995-03-13 | 2002-12-15 | Phonak Ag | Verfahren zur anpassung eines hörgerätes, vorrichtung hierzu und hörgerät |
DE19509149A1 (de) | 1995-03-14 | 1996-09-19 | Donald Dipl Ing Schulz | Codierverfahren |
US5727119A (en) | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
WO1996032710A1 (en) | 1995-04-10 | 1996-10-17 | Corporate Computer Systems, Inc. | System for compression and decompression of audio signals for digital transmission |
US6301555B2 (en) | 1995-04-10 | 2001-10-09 | Corporate Computer Systems | Adjustable psycho-acoustic parameters |
US5601617A (en) | 1995-04-26 | 1997-02-11 | Advanced Bionics Corporation | Multichannel cochlear prosthesis with flexible control of stimulus waveforms |
JPH08328599A (ja) | 1995-06-01 | 1996-12-13 | Mitsubishi Electric Corp | Mpegオーディオ復号器 |
US5663727A (en) | 1995-06-23 | 1997-09-02 | Hearing Innovations Incorporated | Frequency response analyzer and shaping apparatus and digital hearing enhancement apparatus and method utilizing the same |
US5712954A (en) | 1995-08-23 | 1998-01-27 | Rockwell International Corp. | System and method for monitoring audio power level of agent speech in a telephonic switch |
US6002776A (en) * | 1995-09-18 | 1999-12-14 | Interval Research Corporation | Directional acoustic signal processor and method therefor |
US5907622A (en) | 1995-09-21 | 1999-05-25 | Dougherty; A. Michael | Automatic noise compensation system for audio reproduction equipment |
US6108431A (en) | 1996-05-01 | 2000-08-22 | Phonak Ag | Loudness limiter |
US6327366B1 (en) | 1996-05-01 | 2001-12-04 | Phonak Ag | Method for the adjustment of a hearing device, apparatus to do it and a hearing device |
US6430533B1 (en) | 1996-05-03 | 2002-08-06 | Lsi Logic Corporation | Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation |
JPH09311696A (ja) * | 1996-05-21 | 1997-12-02 | Nippon Telegr & Teleph Corp <Ntt> | 自動利得調整装置 |
JPH09312540A (ja) | 1996-05-23 | 1997-12-02 | Pioneer Electron Corp | ラウドネスボリュームコントロール装置 |
JP3765622B2 (ja) | 1996-07-09 | 2006-04-12 | ユナイテッド・モジュール・コーポレーション | オーディオ符号化復号化システム |
EP0820212B1 (de) | 1996-07-19 | 2010-04-21 | Bernafon AG | Lautheitsgesteuerte Verarbeitung akustischer Signale |
JP2953397B2 (ja) | 1996-09-13 | 1999-09-27 | 日本電気株式会社 | ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器 |
JP3367592B2 (ja) * | 1996-09-24 | 2003-01-14 | 日本電信電話株式会社 | 自動利得調整装置 |
US6570991B1 (en) | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
US5862228A (en) | 1997-02-21 | 1999-01-19 | Dolby Laboratories Licensing Corporation | Audio matrix encoding |
US6125343A (en) | 1997-05-29 | 2000-09-26 | 3Com Corporation | System and method for selecting a loudest speaker by comparing average frame gains |
US6272360B1 (en) | 1997-07-03 | 2001-08-07 | Pan Communications, Inc. | Remotely installed transmitter and a hands-free two-way voice terminal device using same |
US6185309B1 (en) | 1997-07-11 | 2001-02-06 | The Regents Of The University Of California | Method and apparatus for blind separation of mixed and convolved sources |
KR100261904B1 (ko) | 1997-08-29 | 2000-07-15 | 윤종용 | 헤드폰 사운드 출력장치 |
US6088461A (en) | 1997-09-26 | 2000-07-11 | Crystal Semiconductor Corporation | Dynamic volume control system |
US6233554B1 (en) | 1997-12-12 | 2001-05-15 | Qualcomm Incorporated | Audio CODEC with AGC controlled by a VOCODER |
US6298139B1 (en) | 1997-12-31 | 2001-10-02 | Transcrypt International, Inc. | Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control |
US6182033B1 (en) | 1998-01-09 | 2001-01-30 | At&T Corp. | Modular approach to speech enhancement with an application to speech coding |
US6353671B1 (en) | 1998-02-05 | 2002-03-05 | Bioinstco Corp. | Signal processing circuit and method for increasing speech intelligibility |
US6311155B1 (en) | 2000-02-04 | 2001-10-30 | Hearing Enhancement Company Llc | Use of voice-to-remaining audio (VRA) in consumer applications |
US6498855B1 (en) | 1998-04-17 | 2002-12-24 | International Business Machines Corporation | Method and system for selectively and variably attenuating audio data |
JP2002518912A (ja) | 1998-06-08 | 2002-06-25 | コックレア リミティド | 聴覚装置 |
EP0980064A1 (de) | 1998-06-26 | 2000-02-16 | Ascom AG | Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen |
GB2340351B (en) | 1998-07-29 | 2004-06-09 | British Broadcasting Corp | Data transmission |
US6351731B1 (en) | 1998-08-21 | 2002-02-26 | Polycom, Inc. | Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor |
US6823303B1 (en) | 1998-08-24 | 2004-11-23 | Conexant Systems, Inc. | Speech encoder using voice activity detection in coding noise |
US6411927B1 (en) | 1998-09-04 | 2002-06-25 | Matsushita Electric Corporation Of America | Robust preprocessing signal equalization system and method for normalizing to a target environment |
FI113935B (fi) | 1998-09-25 | 2004-06-30 | Nokia Corp | Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä |
DE19848491A1 (de) | 1998-10-21 | 2000-04-27 | Bosch Gmbh Robert | Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger |
US6314396B1 (en) | 1998-11-06 | 2001-11-06 | International Business Machines Corporation | Automatic gain control in a speech recognition system |
DE69933929T2 (de) | 1999-04-09 | 2007-06-06 | Texas Instruments Inc., Dallas | Bereitstellen von digitalen Audio- und Videoprodukten |
WO2000065872A1 (en) | 1999-04-26 | 2000-11-02 | Dspfactory Ltd. | Loudness normalization control for a digital hearing aid |
US6263371B1 (en) | 1999-06-10 | 2001-07-17 | Cacheflow, Inc. | Method and apparatus for seaming of streaming content |
US6985594B1 (en) | 1999-06-15 | 2006-01-10 | Hearing Enhancement Co., Llc. | Voice-to-remaining audio (VRA) interactive hearing aid and auxiliary equipment |
US6442278B1 (en) | 1999-06-15 | 2002-08-27 | Hearing Enhancement Company, Llc | Voice-to-remaining audio (VRA) interactive center channel downmix |
US7027981B2 (en) | 1999-11-29 | 2006-04-11 | Bizjak Karl M | System output control method and apparatus |
FR2802329B1 (fr) | 1999-12-08 | 2003-03-28 | France Telecom | Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames |
US7058572B1 (en) | 2000-01-28 | 2006-06-06 | Nortel Networks Limited | Reducing acoustic noise in wireless and landline based telephony |
US6351733B1 (en) | 2000-03-02 | 2002-02-26 | Hearing Enhancement Company, Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
DE10018666A1 (de) | 2000-04-14 | 2001-10-18 | Harman Audio Electronic Sys | Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals |
US6889186B1 (en) | 2000-06-01 | 2005-05-03 | Avaya Technology Corp. | Method and apparatus for improving the intelligibility of digitally compressed speech |
AUPQ952700A0 (en) | 2000-08-21 | 2000-09-14 | University Of Melbourne, The | Sound-processing strategy for cochlear implants |
JP3448586B2 (ja) | 2000-08-29 | 2003-09-22 | 独立行政法人産業技術総合研究所 | 聴覚障害を考慮した音の測定方法およびシステム |
US6625433B1 (en) | 2000-09-29 | 2003-09-23 | Agere Systems Inc. | Constant compression automatic gain control circuit |
US6807525B1 (en) | 2000-10-31 | 2004-10-19 | Telogy Networks, Inc. | SID frame detection with human auditory perception compensation |
ATE333751T1 (de) | 2000-11-09 | 2006-08-15 | Koninkl Kpn Nv | Messen einer übertragungsqualität einer telefonverbindung in einem fernmeldenetz |
US7457422B2 (en) | 2000-11-29 | 2008-11-25 | Ford Global Technologies, Llc | Method and implementation for detecting and characterizing audible transients in noise |
FR2820573B1 (fr) | 2001-02-02 | 2003-03-28 | France Telecom | Methode et dispositif de traitement d'une pluralite de flux binaires audio |
WO2004019656A2 (en) | 2001-02-07 | 2004-03-04 | Dolby Laboratories Licensing Corporation | Audio channel spatial translation |
DE10107385A1 (de) | 2001-02-16 | 2002-09-05 | Harman Audio Electronic Sys | Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken |
US6915264B2 (en) | 2001-02-22 | 2005-07-05 | Lucent Technologies Inc. | Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding |
AU2001244029A1 (en) | 2001-04-10 | 2001-07-09 | Phonak Ag | Method for adjustment of a hearing aid to suit an individual |
US7711123B2 (en) | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
US7610205B2 (en) * | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
US7283954B2 (en) | 2001-04-13 | 2007-10-16 | Dolby Laboratories Licensing Corporation | Comparing audio using characterizations based on auditory events |
US7461002B2 (en) | 2001-04-13 | 2008-12-02 | Dolby Laboratories Licensing Corporation | Method for time aligning audio signals using characterizations based on auditory events |
ATE318062T1 (de) | 2001-04-18 | 2006-03-15 | Gennum Corp | Mehrkanal hörgerät mit übertragungsmöglichkeiten zwischen den kanälen |
KR100400226B1 (ko) * | 2001-10-15 | 2003-10-01 | 삼성전자주식회사 | 음성 부재 확률 계산 장치 및 방법과 이 장치 및 방법을이용한 잡음 제거 장치 및 방법 |
US7177803B2 (en) | 2001-10-22 | 2007-02-13 | Motorola, Inc. | Method and apparatus for enhancing loudness of an audio signal |
US20040037421A1 (en) | 2001-12-17 | 2004-02-26 | Truman Michael Mead | Parital encryption of assembled bitstreams |
US7068723B2 (en) | 2002-02-28 | 2006-06-27 | Fuji Xerox Co., Ltd. | Method for automatically producing optimal summaries of linear media |
US7155385B2 (en) | 2002-05-16 | 2006-12-26 | Comerica Bank, As Administrative Agent | Automatic gain control for adjusting gain during non-speech portions |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
FR2842576B1 (fr) | 2002-07-17 | 2004-10-08 | Skf Ab | Dispositif de palier a roue libre et poulie a roue libre |
JP4257079B2 (ja) | 2002-07-19 | 2009-04-22 | パイオニア株式会社 | 周波数特性調整装置および周波数特性調整方法 |
JP4321049B2 (ja) * | 2002-07-29 | 2009-08-26 | パナソニック電工株式会社 | 自動利得制御装置 |
DE10236694A1 (de) | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7454331B2 (en) | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
WO2004073178A2 (en) | 2003-02-06 | 2004-08-26 | Dolby Laboratories Licensing Corporation | Continuous backup audio |
DE10308483A1 (de) | 2003-02-26 | 2004-09-09 | Siemens Audiologische Technik Gmbh | Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät |
US7551745B2 (en) | 2003-04-24 | 2009-06-23 | Dolby Laboratories Licensing Corporation | Volume and compression control in movie theaters |
ES2290764T3 (es) | 2003-05-28 | 2008-02-16 | Dolby Laboratories Licensing Corporation | Metodo, aparato y programa de ordenador para calcular y ajustar la sonoridad percibida de una señal de audio. |
US20050071154A1 (en) * | 2003-09-30 | 2005-03-31 | Walter Etter | Method and apparatus for estimating noise in speech signals |
US6923684B2 (en) | 2003-10-10 | 2005-08-02 | O'sullivan Industries, Inc. | Power harness having multiple upstream USB ports |
KR101079066B1 (ko) | 2004-03-01 | 2011-11-02 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 멀티채널 오디오 코딩 |
GB2413906A (en) | 2004-04-21 | 2005-11-09 | Imagination Tech Ltd | Radio volume control system |
US7617109B2 (en) | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
US7508947B2 (en) | 2004-08-03 | 2009-03-24 | Dolby Laboratories Licensing Corporation | Method for combining audio signals using auditory scene analysis |
TWI497485B (zh) | 2004-08-25 | 2015-08-21 | Dolby Lab Licensing Corp | 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法 |
WO2006033570A1 (en) * | 2004-09-20 | 2006-03-30 | Nederlandse Organisatie Voor Toegepast- Natuurwetenschappelijk Onderzoek Tno | Frequency compensation for perceptual speech analysis |
WO2006047600A1 (en) | 2004-10-26 | 2006-05-04 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
TWI397901B (zh) * | 2004-12-21 | 2013-06-01 | Dolby Lab Licensing Corp | 控制音訊信號比響度特性之方法及其相關裝置與電腦程式 |
US8265295B2 (en) | 2005-03-11 | 2012-09-11 | Rane Corporation | Method and apparatus for identifying feedback in a circuit |
TWI397903B (zh) | 2005-04-13 | 2013-06-01 | Dolby Lab Licensing Corp | 編碼音訊之節約音量測量技術 |
GB2428168A (en) | 2005-07-06 | 2007-01-17 | Motorola Inc | A transmitter splits a signal into a plurality of sub-signals, each containing a plurality of sub-carriers, and amplifies each sub-signal separately. |
CN101410892B (zh) | 2006-04-04 | 2012-08-08 | 杜比实验室特许公司 | 改进的离散余弦变换域中的音频信号响度测量及修改 |
CN101421781A (zh) | 2006-04-04 | 2009-04-29 | 杜比实验室特许公司 | 音频信号的感知响度和/或感知频谱平衡的计算和调整 |
TWI517562B (zh) | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
CN102684628B (zh) | 2006-04-27 | 2014-11-26 | 杜比实验室特许公司 | 修正音频动态处理器的参数的方法以及执行该方法的设备 |
KR101137715B1 (ko) | 2006-10-20 | 2012-04-25 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 리셋을 사용하는 오디오 다이내믹스 프로세싱 |
US8521314B2 (en) | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
JP4938862B2 (ja) | 2007-01-03 | 2012-05-23 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ハイブリッドデジタル/アナログラウドネス補償音量調節 |
US8560320B2 (en) | 2007-03-19 | 2013-10-15 | Dolby Laboratories Licensing Corporation | Speech enhancement employing a perceptual model |
MY144152A (en) | 2007-06-19 | 2011-08-15 | Dolby Lab Licensing Corp | Loudness measurement with spectral modifications |
-
2008
- 2008-07-11 US US12/668,741 patent/US8396574B2/en active Active
- 2008-07-11 EP EP08780174A patent/EP2168122B1/en active Active
- 2008-07-11 JP JP2010517000A patent/JP5192544B2/ja active Active
- 2008-07-11 BR BRPI0813723A patent/BRPI0813723B1/pt active IP Right Grant
- 2008-07-11 WO PCT/US2008/008592 patent/WO2009011827A1/en active Application Filing
- 2008-07-11 RU RU2010105052/08A patent/RU2438197C2/ru active
- 2008-07-11 CN CN2008800245251A patent/CN101790758B/zh active Active
- 2008-07-11 AT AT08780174T patent/ATE535906T1/de active
- 2008-07-11 ES ES08780174T patent/ES2377719T3/es active Active
- 2008-07-14 TW TW097126643A patent/TWI464735B/zh active
Also Published As
Publication number | Publication date |
---|---|
CN101790758B (zh) | 2013-01-09 |
US20100198378A1 (en) | 2010-08-05 |
EP2168122B1 (en) | 2011-11-30 |
ES2377719T3 (es) | 2012-03-30 |
EP2168122A1 (en) | 2010-03-31 |
US8396574B2 (en) | 2013-03-12 |
RU2010105052A (ru) | 2011-08-20 |
JP5192544B2 (ja) | 2013-05-08 |
ATE535906T1 (de) | 2011-12-15 |
BRPI0813723A2 (pt) | 2017-07-04 |
TW200915301A (en) | 2009-04-01 |
WO2009011827A1 (en) | 2009-01-22 |
TWI464735B (zh) | 2014-12-11 |
CN101790758A (zh) | 2010-07-28 |
JP2010534030A (ja) | 2010-10-28 |
RU2438197C2 (ru) | 2011-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BRPI0813723B1 (pt) | método para controlar o nível de intensidade do som de eventos auditivos, memória legível por computador não transitória, sistema de computador e aparelho | |
US10523169B2 (en) | Audio control using auditory event detection | |
CN109616142B (zh) | 用于音频分类和处理的装置和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B06U | Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 04/02/2020, OBSERVADAS AS CONDICOES LEGAIS. |