BRPI0910522A2 - preenchedor de ruídos, calculador do parâmetro de preenchimento de ruído, método para prover um parâmetro de preenchimento de ruído, método para prover uma representação espectral com preenchimento de ruído de um sinal de áudio, correspondente programa de computador e sinal codificado de áudio - Google Patents
preenchedor de ruídos, calculador do parâmetro de preenchimento de ruído, método para prover um parâmetro de preenchimento de ruído, método para prover uma representação espectral com preenchimento de ruído de um sinal de áudio, correspondente programa de computador e sinal codificado de áudio Download PDFInfo
- Publication number
- BRPI0910522A2 BRPI0910522A2 BRPI0910522-0A BRPI0910522A BRPI0910522A2 BR PI0910522 A2 BRPI0910522 A2 BR PI0910522A2 BR PI0910522 A BRPI0910522 A BR PI0910522A BR PI0910522 A2 BRPI0910522 A2 BR PI0910522A2
- Authority
- BR
- Brazil
- Prior art keywords
- spectral
- noise
- quantized
- representation
- zero
- Prior art date
Links
- 230000003595 spectral effect Effects 0.000 title claims abstract description 531
- 230000005236 sound signal Effects 0.000 title claims abstract description 107
- 239000000945 filler Substances 0.000 title claims abstract description 55
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000004590 computer program Methods 0.000 title claims abstract description 15
- 238000013139 quantization Methods 0.000 claims description 51
- 238000001228 spectrum Methods 0.000 claims description 36
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000002146 bilateral effect Effects 0.000 claims description 5
- 230000011664 signaling Effects 0.000 abstract 2
- 238000004422 calculation algorithm Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 2
- 241000260732 Buteo regalis Species 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
Abstract
PREENCHEDOR DE RUÍDOS, CALCULADORA DO PARÂMETRO DE PREENCHIMENTO DE RUÍDO, MÉTODO PARA PROVER UM PARÂMETRO DE PREENCHIMENTO DE RUÍDO, MÉTODO PARA PROVER UMA REPRESENTAÇÃO ESPECTRAL COM PREENCHIMENTO DE RUÍDO DE UM SINAL DE ÁUDIO, CORRESPONDENTE PROGRAMA DE COMPUTADOR E SINAL CODIFICADO DE ÁUDIO.
Preenchedor de ruídos para prover uma representação espectral com preenchimento de ruído de um sinal de áudio com base em uma representação espectral de entrada do sinal de áudio, com um calculador do parâmetro de preenchimento de ruído para prover um parâmetro de preenchimento de ruído com base em uma representação espectral quantizada de um sinal de áudio, com uma representação do sinal de áudio codificado representando um sinal de áudio, com um método para prover uma representação espectral com preenchimento de ruído de um sinal de áudio, com um método para prover um parâmetro de preenchimento de ruído com base em uma representação espectral quantizada de um sinal de áudio, e com programas de computadores para a implementação dos referidos métodos .
Description
2. | 7? rs “PREENCHEDOR DE RUÍDOS, CALCULADOR DO PARÂMETRO DE PREENCHIMENTO DE RUÍDO, MÉTODO PARA PROVER UM PARÂMETRO DE PREENCHIMENTO DE RUÍDO, MÉTODO PARA PROVER UMA REPRESENTAÇÃO ESPECTRAL COM PREENCHIMENTO DE RUÍDO DE UM SINAL DE ÁUDIO, CORRESPONDENTE PROGRAMA DE COMPUTADOR E SINAL CODIFICADO DE ÁUDIO”
HISTÓRICO DA INVENÇÃO As configurações se relacionam de acordo com a ' invenção com um preenchedor de ruídos para prover uma ç representação espectral com preenchimento de ruído de um sinal de áudio com base em uma representação espectral de entrada do sinal de áudio, com um calculador do parâmetro de preenchimento de ruído s para prover um parâmetro de preenchimento de ruído com base em uma = representação espectral quantizada de um sinal-de-áudio, com uma -——- representação do sinal de áudio codificado representando um sinal de áudio, com um método para prover uma representação espectral com presnohimento de ruído de um sinal de áudio, com um método s para prover um parâmetro de preenchimento de ruído com base em uma ? representação espectral quantizada de um sinal de áudio, e com programas de computadores para a implementação dos referidos métodos. A seguir, serão descritos alguns cenários em que podem ser aplicadas com vantagens as configurações de acordo com a invenção. Muitos codificadores de sinal de áudio no domínio da frequência se baseiam na ideia que algumas regiões de frequência ou regiões espectrais (ex., linhas de frequência ou linhas espectrais providas por uma conversão do domínio do tempo para o domínio da frequência), são mais importantes que outras regiões espectrais. Assim, regiões espectrais de alta relevância
+ A 2 é psicoacústica são tipicamente codificadas com maior precisão que regiões espectrais de baixa relevância psicoacústica.
A relevância psicoacústica das diferentes regiões espectrais pode, por exemplo, ser calculada usando um modelo psicoacústico que leva em conta o mascaramento de regiões espectrais mais fracas por meio de fortes picos espectrais adjacentes.
Caso for desejado reduzir a taxa de bits de um ' sinal codificado de áudio para um baixo nível, algumas regiões : espectrais são quantizadas com muito baixa precisão (ex., com precisão de somente um bit, ou precisão de dois bits). Assim, muitas das regiões espectrais quantizadas com baixa precisão são R quantizadas para zero.
Assim, em baixas taxas de bits, * codificadores-de áudio baseados em transformadas estão propensos a - diferentes problemas e especialmente a problemas que se originam 15º das linhas de frequência quantizadas em zero.
Realmente, a quantização grosseira de valores espectrais em codificação de . áudio com baixa taxa de bits pode conduzir a espectros muito esparsos após a quantização inversa, já que muitas linhas e espectrais podem ter sido quantizadas para zero.
Esses buracos de frequência no sinal reconstruído produzem indesejáveis problemas sonoros.
Podem tornar o som reproduzido muito agudo ou instável (birdies) quando os buracos de frequência nos espectros se movem de quadro a quadro.
O preenchimento de ruído é um meio para mascarar esses problemas por meio do preenchimento, no lado do decodificador, com coeficientes ou bandas quantizadas em zero ou bandas com um ruído randômico.
A energia do ruído inserido é um parâmetro computado e transmitido pelo codificador.
« a 3 São conhecidos diferentes conceitos de preenchimento de ruído. Por exemplo, o denominado AMR-WR+ combina o preenchimento de ruído e uma Transformada Discreta de Fourier (DFT), como descrita, por exemplo, na referência [1]. Além disso, o Padrão Internacional ITU-T G.729.1 define um conceito que combina o preenchimento de ruído com a transformada discreta de cosseno “modificada (MDCT). Os detalhes são descritos na : referência [2]. : Outros aspectos referentes ao preenchimento de ruído são descritos no Pedido Internacional de Patente PCT/IB2002/001388 por Koninklijke Philips Electronics N.V. (ver 2 referência [3])' ee Não obstante, os -conceitos -de- preenchiménto — convencional de ruído resultam em distorções audíveis. Com vista nesta discussão, existe o desejo de ' criar um conceito de DrGSNCNiMADTO de ruído que proporcione uma . melhor impressão auditiva.
SUMÁRIO DA INVENÇÃO Uma configuração de acordo com a invenção cria um preenchedor de ruídos para prover uma representação espectral com preenchimento de ruído de um sinal de áudio com base em uma representação espectral de entrada do sinal de áudio. o preenchedor de ruídos compreende um identificador de região espectral configurado para identificar regiões espectrais (ex., linhas espectrais, ou bins espectrais) da representação espectral de entrada espaçada das regiões espectrais diferentes de zero (ex., linhas espectrais ou bins espectrais) da representação espectral de entrada por pelo menos uma região espectral e 4 é intermediária, para obter regiões espectrais identificadas. O preenchedor de ruídos também compreende um insersor de ruído configurado para seletivamente introduzir ruído nas regiões espectrais identificadas (ex., linhas espectrais ou bins espectrais) para obter a representação espectral com preenchimento de ruído do sinal de áudio.
Esta configuração da presente invenção se baseia ' no achado que componentes tonais da representação espectral de um : sinal de áudio são tipicamente degradadas, em termos da impressão auditiva, caso um preenchimento de ruído seja aplicado na vizinhança imediata dessas componentes .“tonais. Assim, foi R determinado que uma melhor impressão auditiva de um sinal de - e — áudio . com. preenchimento de ruídos pode >-ser obtida” se” o” preenchimento de ruído for somente aplicado às regiões espectrais que forem espaçadas dessas regiões espectrais tonais diferentes - de zero. Assim, as componentes tonais do espectro do sinal de . áudio (que não são quantizadas em zero na entrada da representação espectral quantizada no preenchedor de ruídos) º permanecem audíveis (isto é, não se tornam contaminadas pelo ruído adjacente próximo), enquanto a presença de grandes buracos espectrais é ainda evitada de maneira eficiente.
Em uma configuração preferida, o identificador de região espectral é configurado para identificar linhas espectrais da representação espectral de entrada, que são quantizadas em zero e que compreendem pelo menos um primeiro número predeterminado de linhas espectrais vizinhas de menor frequência quantizadas em zero e pelo menos um segundo número predeterminado de linhas espectrais de maior frequência
+ é 5 quantizadas em zero, como regiões espectrais identificadas, onde o primeiro número predeterminado é maior ou igual a um e onde o segundo número predeterminado é maior ou igual a um. Nesta configuração, o insersor de ruído é configurado para seletivamente introduzir ruído nas linhas espectrais identificadas, enquanto deixa as linhas espectrais quantizadas em um valor diferente de zero e linhas espectrais quantizadas em : zero, mas não tendo o primeiro número predeterminado de linhas s espectrais vizinhas de menor frequência quantizadas em zero, ou o segundo número predeterminado de linhas espectrais vizinhas de maior frequência quantizadas em zero não afetadas pelo . preenchimento de ruído. Assim, o preenchimento de ruído é co Seletivo, já .que. o ruído -é- somente “introduzido nãs Tinhaãs = espectrais que são quantizadas em zero e que são espaçadas das linhas quantizadas em um valor diferente de zero, ambas em uma direção espectral para cima e uma direção espectral para baixo, s por exemplo, pelo primeiro número predeterminado de linhas espectrais vizinhas de menor frequência quantizadas em zero e
E pelo segundo número predeterminado de linhas espectrais vizinhas de maior frequência quantizadas em zero.
Em uma configuração preferida, o primeiro número predeterminado é igual ao segundo número predeterminado, de maneira que um espaçamento mínimo na direção da frequência superior das linhas quantizadas para um valor diferente de zero seja igual a um espaçamento mínimo na direção da frequência inferior das linhas quantizadas para um valor diferente de zero.
Em uma configuração preferida, o preenchedor de ruídos é configurado para introduzir somente ruído nas regiões
+ é $ espectrais em uma porção superior da representação espectral do sinal de áudio, deixando não afetada uma porção inferior da representação espectral do sinal de áudio pelo preenchimento de ruído.
Esse conceito é útil, já que normalmente maiores frequências são menos perceptualmente importantes que as baixas frequências.
Os valores quantizados em zero também ocorrem principalmente na segunda metade dos espectros (isto é, para : altas frequências). Também a adição de ruído nas altas : frequências tem menos possibilidade de obter uma restituição final sonora ruidosa.
Em uma configuração preferida, o identificador R de região espectral é configurado para somar valores quantizados — , e intensidade (ex., valores de energia-ou valores de âmpiitude) de regiões espectrais em uma vizinhança espectral predeterminada 15º bilateral de uma dada região espectral (isto é, uma vizinhança espectral que se estende tanto na direção das frequências mais “ baixas como das mais altas), para obter um valor somado, e avaliar o valor somado para decidir se a dada região espectral é uma : região espectral identificada ou não.
Foi determinado que o valor : somado das energias de um espectro quantizado com relação a uma vizinhança espectral bilateral de uma dada região espectral é uma quantidade significativa para a decisão de se o preenchimento de ruído deve ser aplicado a uma dada região espectral.
Em outra configuração preferida, o identificador de região espectral é configurado para varrer uma faixa de regiões espectrais da representação espectral de entrada para detectar sequências contíguas de regiões espectrais quantizadas em zero, € reconhecer uma ou mais regiões espectrais centrais (isto éÉ,
Õ regiões espectrais não divisórias) dessas sequências contíguas detectadas como regiões espectrais identificadas.
Foi determinado que uma detecção de um determinado "comprimento de operação" das regiões espectrais quantizadas em zero, é uma tarefa que pode ser implementada com complexidade computacional particularmente baixa. Para identificar essa sequência contígua de regiões espectrais, é possível decidir ' se todas as regiões espectrais dentro desta sequência de regiões ? espectrais são quantizadas em zero, o que pode ser feito usando um algoritmo ou circuito relativamente simples. Caso seja determinado que esta sequência contígua de regiões espectrais é quantizada em . zero, uma ou mais das regiões espectrais internas da sequência o (que são espaçadas suficientemente longe dãs regiões espectrais = fora da presente sequência de regiões espectrais) são tratadas como regiões espectrais identificadas. Assim, varrendo .uma faixa de regiões espectrais (ex., selecionando subsequentemente . diferentes sequências deslocadas de regiões espectrais), pode ser feita uma eficiente análise da representação espectral, para ' identificar regiões espectrais quantizadas em zero e espaçadas das regiões espectrais quantizadas em um valor diferente de zero por uma distância mínima predeterminada.
Outra configuração de acordo com a invenção cria um calculador do parâmetro de preenchimento de ruído para prover um parâmetro de preenchimento de ruído com base em uma representação espectral quantizada de um sinal de áudio. O calculador do parâmetro de preenchimento de ruído compreende um identificador de região espectral configurado para identificar regiões espectrais da representação espectral quantizada espaçada sé 8 de regiões espectrais diferentes de zero da representação espectral “quantizada por pelo menos uma região espectral intermediária, para obter regiões espectrais identificadas.
O calculador do parâmetro de preenchimento de ruído também compreende um calculador de valor de ruído configurado para considerar seletivamente os erros de quantização das regiões espectrais identificadas para o cálculo do parâmetro de ' preenchimento de ruído.
O calculador do parâmetro de preenchimento r de ruído se baseia na ideia principal de que é desejável restringir um preenchimento de ruído do lado do decodificador nas regiões espectrais que são espaçadas das regiões espectrais tonais . (quantizadas em um valor diferente de zero), e que como BR consequência o, parâmetro de ruído deve ser calêulado no lado do | codificador, levando em consideração este conceito.
Assim, é 15º obtido um parâmetro de preenchimento de ruído particularmente bem “adaptado para o conceito de decodificador supramencionado.
Foi . também determinado que regiões espectrais que são quantizadas em zero, mas que são muito próximas às regiões espectrais quantizadas ó em um valor diferente de zero, geralmente não refletem a um teor de áudio verdadeiramente tipo ruído, mas fortemente correlacionado com a região espectral tonal adjacente (quantizada para um valor diferente de zero). Assim, foi determinado ser geralmente indesejável “considerar o erro de quantização das regiões espectrais, que estiverem próximas às regiões espectrais quantizadas em um valor diferente de zero para o cálculo de um parâmetro de preenchimento de ruído, porque isto resultaria normalmente em uma forte superestimativa do ruído, resultando assim em uma representação espectral reconstruída muito ruidosa.
s 9 é Assim, o conceito de cálculo do parâmetro de preenchimento de ruído descrito na presente pode ser usado em combinação com o conceito de preenchimento de ruído supramencionado e até em combinação com conceitos convencionais de preenchimento de ruído. Em configurações preferidas, o conceito para a identificação de regiões espectrais que tiver sido discutido com ' relação ao preenchedor de ruídos, também pode ser aplicado em v combinação com o calculador do parâmetro de preenchimento de ruído. Em ainda outra configuração preferida, o . calculador de valor de ruído é configurado para considerar uma energia real do erro de. quantização "das" Fegides Espectrais identificadas para o cálculo do parâmetro de preenchimento de 15º ruído. Foi determinado que a consideração , de, um .erro .real. de -- VU quantização tao invés de um erro de quantização estimado ou de um . erro médio de quantização) traz normalmente consigo melhores resultados, porque o erro real de quantização normalmente se i desvia do erro de quantização estatisticamente esperado.
Em ainda outra configuração preferida, o calculador de valor de ruído é configurado para realçar uma energia não tonal do erro de quantização distribuída em uma pluralidade de regiões espectrais identificadas em relação à uma energia tonal do erro de quantização concentrada em uma única região espectral. Este conceito se baseia no achado que um ruído não tonal de banda larga, uma energia média a qual se situa abaixo um limite de quantização e que é, portanto, quantizada em zero, é perceptualmente muito mais relevante para o preenchedor de ruídos
. 10 + que uma única componente tonal de áudio, uma intensidade que se situa abaixo do limite de quantização, mesmo se o ruído não tonal de banda larga quantizado em zero e a componente tonal quantizada em zero fossem ambas quantizadas em zero. O motivo é que O preenchedor de ruídos pela geração de um ruído randômico no decodificador possa modelar o ruído não tonal de banda larga faltante na representação espectral quantizada, mas não as ' componentes .“tonais faltantes. Assim, uma ênfase sobre as " componentes não tonais de ruído quantizadas em zero com relação às componentes tonais quantizadas em zero, traz consigo uma reconstrução sonora mais realista. Isto também se deve ao fato . que a impressão auditiva humana é muito mais degradada pela presença de um buraco .espectral -(ex.,' na forma de ausência de um o ruído de banda larga quantizado em zero) que pela ausência de um pequeno pico espectral quantizado em Zero. . Uma componente -tonal - * - OS o pode ser concentrada em uma simples linha espectral, ou pode se . espalhar por várias linhas espectrais contíguas (por exemplo, i,i+tl). A região espectral pode, por exemplo, compreender uma ou : mais linhas espectrais.
Em uma configuração preferida, o calculador de valor de ruído é configurado para calcular a soma de energias logaritmizadas de erros de quantização das regiões espectrais identificadas para obter o parâmetro de preenchimento de ruído. Calculando a soma das energias logaritmizadas de erros de quantização das regiões espectrais identificadas, a ênfase relativa supramencionada das regiões espectrais não tonais quantizadas em zero com relação às regiões tonais quantizadas em zero, pode ser obtida de maneira eficiente.
“ Outra configuração de acordo com a invenção cria uma representação do sinal de áudio codificado, para a representação de um sinal de áudio.
A representação do sinal de áudio codificado compreende uma representação do domínio espectral quantizado codificado do sinal de áudio e um parâmetro de preenchimento de ruído codificado. o parâmetro de preenchimento de ruído representa um erro de quantização das ' regiões espectrais da representação no domínio espectral + quantizado em zero e espaçado das regiões espectrais da representação no domínio espectral quantizadas em um valor diferente de zero por pelo menos um número predeterminado de . regiões espectrais intermediárias.
A representação do sinal de 20 .- áudio -codificado supramencionada é “usada pelo T“preenchedor de o ruídos supramencionado e pode ser obtida usando o calculador do parâmetro de — preenchimento de ruído acima discutido.
A RSS representação do sinal de áudio codificado permite a reconstrução . do sinal de áudio com qualidade de áudio particularmente boa, porque o parâmetro de preenchimento de ruído seletivamente i reflete o erro de quantização da representação quantizada no domínio espectral dessas regiões espectrais em que existem significativas informações de ruído e que devem ser seletivamente consideradas para o preenchimento de ruídos no lado do decodificador.
Outra configuração de acordo com a invenção cria um método para prover uma representação com preenchimento de ruídos de um sinal de áudio.
Ainda outra configuração de acordo com a invenção cria um método para prover um parâmetro de preenchimento
« 12 de ruídos com base em uma representação espectral quantizada de um sinal de áudio. ' Ainda outra configuração de acordo com a invenção cria um programa de computador para a implementação dos métodos supramencionados.
BREVE DESCRIÇÃO DAS FIGURAS Serão subsequentemente descritas configurações de " acordo com a invenção, com referência às figuras anexas, onde: . A Fig. l1 mostra um diagrama esquemático de blocos de um preenchedor de ruídos, de acordo com uma configuração da invenção; . A Fig. 2 mostra um diagrama esquemático de 1 . blocos. de um decodificador de sinal de áúdio que compreende o o preenchedor de ruídos de acordo com a presente invenção; A Fig. 3 mostra um pseudo-código.de “programas - " para a implementação da funcionalidade do preenchedor de ruídos . da Fig. 1; A Fig. 4 mostra uma representação gráfica de uma identificação de regiões espectrais, que pode ser feita no preenchedor de ruídos de acordo com a Fig. 1; A Fig. 5 mostra um diagrama esquemático de blocos de um calculador do parâmetro de preenchimento de ruído de acordo com uma configuração da invenção; A Fig. 6 mostra um pseudo-código de programas para à implementação da funcionalidade do calculador do parâmetro de preenchimento de ruído de acordo com a Fig. 5; A Fig. 7 mostra um fluxograma de um método para prover uma representação espectral com preenchimento de ruído de
: 13 um sinal de áudio com base em uma representação espectral de entrada do sinal de áudio; A Fig. 8 mostra um fluxograma de um método para prover um parâmetro de preenchimento de ruídos com base em uma representação espectral quantizada de um sinal de áudio; e A Fig. 9 mostra a representação gráfica de uma representação de sinal de áudio, de acordo com uma configuração : da invenção. + Preenchedor de ruídos de acordo com as Figs. 1-4 A Fig. 1 mostra um diagrama esquemático de blocos de um preenchedor de ruídos 100, de acordo com uma R configuração da invenção. O preenchedor de ruídos 100 é - — configurado .para receber uma- representação Eéspectral de entrada o 110 de um sinal de áudio, por exemplo, na forma de coeficientes espectrais decodificados (que podem, por exemplo, ser quantizados o ou quantizados inversamente). O preenchedor de ruídos 100 é . também “configurado prover uma representação espectral com preenchimento de ruído 112 do sinal de áudio com base na : representação espectral de entrada 110.
O preenchedor de ruídos 100 compreende um identificador de região espectral 120, que é configurado para identificar regiões espectrais da representação espectral de entrada 110 espaçadas das regiões espectrais da representação espectral de entrada diferente de zero 110 por pelo menos uma região espectral intermediária, para obter uma informação 122 indicando as regiões espectrais identificadas. O preenchedor de ruídos 100 também compreende um insersor de ruído 130, que é configurado para seletivamente introduzir ruído nas regiões
-» . 14 espectrais identificadas (descritas na informação 122), para obter a representação espectral com preenchimento de ruído 112 do sinal de áudio.
Com relação à funcionalidade do preenchedor de ruídos 100, pode ser geralmente dito que o preenchedor de ruídos 100 seletivamente preenche regiões espectrais (ex., linhas espectrais ou bins espectrais) da representação espectral de : entrada 110 com ruído, por exemplo, substituindo os valores . espectrais das linhas espectrais quantizadas em zero com a substituição dos valores espectrais que descrevem um ruído.
Dessa forma, podem ser preenchidos os buracos espectrais ou vãos - espectrais dentro da representação espectral de entrada 110, o o que. pode, -por- exemplo, " surgir “da duantização grosseira da representação espectral de entrada 110. Entretanto, o preenchedor 15º de ruídos 100 não introduz ruído em todas as linhas- espectrais SS quantizadas em zero (isto é, linhas espectrais, os valores . espectrais que são quantizados em zero). Ao invés disso, o preenchedor de ruídos 100 somente introduz ruído nessas linhas i espectrais quantizadas em zero, o que compreende uma distância suficiente a partir das linhas espectrais quantizadas em um valor diferente de zero.
Dessa forma, o preenchimento de ruído não preenche totalmente os buracos espectrais ou vãos espectrais, mas mantém uma distância espectral de pelo menos uma região espectral (ou de pelo menos qualquer outro número predeterminado de regiões espectrais) entre essas linhas espectrais em que é introduzido um ruído e linhas espectrais quantizadas em um valor diferente de zero.
Assim, é mantida a distância espectral entre o ruído de preenchimento, introduzido na representação espectral e linhas
. 15 espectrais quantizadas em um valor diferente de zero, de maneira que as linhas espectrais psicoacusticamente relevantes (que não são quantizadas em zero na representação espectral de entrada do sinal de áudio) podem ser claramente distintas (devido à distância espectral do número predeterminado de uma ou mais regiões espectrais) do ruído de preenchimento introduzido no espectro pelo preenchedor de ruídos.
Assim, pode ser claramente percebido o ' conteúdo de áudio mais psicoacusticamente relevante (representado + por valores de linhas espectrais diferentes de zero na representação espectral de entrada 110), enquanto grandes buracos espectrais são evitados.
Isto se deve ao fato que o preenchimento
2 de ruído é seletivamente omitido na proximidade das linhas
" . espectrais-da representação" espectral de entrada quantizadas em Ns um valor diferente de zero, enquanto o preenchimento de ruído é feito nas regiões centrais de buracos espectrais. ou- vãos 7 Ns SspbCtrais,
. A seguir, será descrito um ambiente de aplicação para o preenchedor de ruídos 100 com referência à Fig. 2. A Fig. 2 mostra um diagrama esquemático de blocos de um decodificador de sinal de áudio 200, de acordo com uma configuração da invenção.
O decodificador de sinal de áudio 200 compreende, como uma componente principal, o preenchedor de ruídos 100. O decodificador de sinal de áudio 200 também compreende um decodificador do coeficiente espectral 210, que é configurado para receber uma representação do sinal de áudio codificado 212 e prover uma representação decodificada e opcionalmente quantizada inversamente 214 dos coeficientes espectrais do sinal codificado de áudio.
O decodificador do coeficiente espectral 210 pode, por exemplo,
. 16 compreender um decodificador de entropia (ex., decodificador aritmético ou decodificador de comprimento de operação) e, opcionalmente, um quantizador inverso para obter a representação decodificada 214 dos coeficientes espectrais (ex., sob a forma de coeficientes inversamente quantizados) da representação do sinal de áudio codificado 212. O preenchedor de ruídos 100 é configurado para receber a representação decodificada 214 de coeficientes ' espectrais (que é, opcionalmente, quantizada inversamente) como a
: representação espectral de entrada 110 do sinal de áudio.
O decodificador de sinal de áudio 200 também compreende um extrator de fator de ruído 220, que é configurado 2 para extrair uma informação do fator de ruído 222 da representação
- -do sinal de-áudio codificado 212 e próvêr a informação do fator de Na ruído extraída 222 ao preenchedor de ruídos 100. O decodificador de sinal de áudio 200 também compreende um. reformatador de espectro 230, que é configurado para receber uma representação do . espectro reconstruído 232 do preenchedor de ruídos 100. A representação do espectro reconstruído 232 pode, por exemplo, ser igual à representação espectral com preenchimento de ruído 112 provida pelo preenchedor de ruídos.
O reformatador de espectro 230, que pode ser considerado como opcional, é configurado para prover as informações de espectro 234 com base na representação do espectro reconstruído 232. O decodificador de sinal de áudio 200 ainda compreende um conversor do domínio espectral para o domínio do tempo 240, que recebe a representação do espectro 234 fornecida pelo reformatador de espectro 230, ou, na ausência do reformatador de espectro 230, a representação do espectro reconstruído 232, e prover com base nesta, uma representação do sinal de áudio no
. 17 domínio do tempo 242. O conversor do domínio espectral para o domínio do tempo 240 pode, por exemplo, ser configurado para fazer uma transformada inversa de cosseno discreta modificada (IMDCT).
Em uma configuração preferida, o preenchimento de ruído no lado do decodificador compreende as seguintes etapas (ou acompanha as seguintes etapas):
1. Decodificar o patamar de ruído; ' 2. Decodificar os valores quantizados das linhas . de frequência; '
3. Detectar as regiões espectrais na parte selecionada dos espectros em que um comprimento de operação de . zeros é maior que um tamanho mínimo de comprimento de operação; Ee A AO 7 7 - “4. Aplicar um sinal de geração randômica ao patamar de ruído decodificado para cada uma das linhas dentro das regiões selecionadas. ||| Le 2 eee eee - . O patamar de ruído é decodificado como segue: . nf decoded = 0.0625* (8-index) . As regiões espectrais detectadas são, por exemplo, selecionadas da mesma forma feita no lado do codificador (que será descrito abaixo).
É gerado um ruído Gaussiano sem memória no domínio MDCT por um espectro com a mesma amplitude para todas as linhas, mas com sinais randômicos. Assim, para cada uma das linhas dentro das regiões selecionadas, o decodificador gera um sinal randômico (-1 ou +1) e o aplica ao patamar de ruído decodificado. Entretanto, também podem ser aplicados outros métodos para prover uma contribuição de ruído.
A seguir, serão descritos alguns detalhes com
: 18 referência às Figs. 1, 2, 3 e 4, em que a Fig. 3 mostra um pseudo- código de programas de um algoritmo para o preenchimento de ruído no lado do decodificador, que pode ser feito pelo preenchedor de ruídos 100, e em que a Fig. 4 mostra uma representação gráfica do preenchimento de ruído. Para iniciar, a decodificação do patamar de ruído pode ser feita pelo extrator de fator de ruído 220, que recebe, ' por exemplo, um índice de fator de ruído (também brevemente + denominado de "índice") e prover com base nisso o valor do fator de ruído decodificado 222 (também denominado por "nf decoded"). O índice de fator de ruído pode, por exemplo, ser codificado usando 2 três ou quatro bits, e pode, por exemplo, ser um valor inteiro — = = “entre 0 e7, ou um valor inteiro entre 0 e 15. me TT TO Os valores quantizados das linhas de frequência : : 15 (também denominadas de "linhas espectrais"-ou-"bins-espectrais")- " podem ser providos pelo decodificador do coeficiente espectral . 210. Assim, são obtidos valores de linhas espectrais quantizadas (ou opcionalmente, inversamente quantizadas) (também denominadas de "coeficientes espectrais"), que são denominadas de "quantizadas (x(i))". Aqui, i indica um índice de frequência dos valores da linha espectral.
Subsequentemente, são detectadas regiões espectrais pelo preenchedor de ruídos 100 em uma parte selecionada dos espectros (ex., em uma porção superior do espectro iniciando a partir de um índice de frequência predeterminado de linha espectral i) onde o comprimento de operação de zeros (isto é, de valores de linhas espectrais quantizadas e quantizadas em zero) é maior que o tamanho mínimo de comprimento de operação. A detecção
. 19 dessas regiões espectrais é feita por uma primeira porção 310 do algoritmo 300 da Fig. 3. Como pode ser visto na primeira porção 310 do algoritmo 300, um conjunto R de regiões detectadas é inicializado como sendo um conjunto vazio no início do algoritmo (R = ();).
No exemplo do algoritmo da Fig. 3, é estabelecido um comprimento de operação mínimo em um valor fixo ' de 8, mas naturalmente pode ser escolhido qualquer outro valor. + Subsequentemente, foi determinado para uma pluralidade de linhas espectrais em consideração (indicadas pela variável corrente "line index") se cada uma dessas linhas . espectrais em consideração compreende um ambiente bilateral de = “= - - linhas espectrais quantizádas êm zero (e “se a própria Minha espectral em consideração é quantizada em zero). Por exemplo, : 15 todas as linhas na segunda metade .dos espectros. podem ser sucessivamente consideradas como linhas em consideração, quando . uma linha que estiver atualmente em consideração for indicada por um índice de frequência "line index". Para uma linha em consideração indicada pelo "line index", é computada a soma de coeficientes espectrais quantizados "quantized(x(i))" em um ambiente que vai de um índice de frequência de linha espectral de "line index - (MinimalRunLength)/2" até um índice de frequência de linha espectral de "line index + MinimalRunLength)/2". Se for determinado que a soma dos valores da linha espectral no referido ambiente da linha espectral atualmente em consideração (tendo índice de frequência de linha espectral "line index") é zero, então a linha espectral atualmente em consideração (ou, mais precisamente, seu índice de frequência de linha espectral "line
. . 20 index") é adicionada ao conjunto R das regiões detectadas (ou linhas espectrais detectadas). Como consequência, se um índice de frequência de linha espectral de uma linha espectral for adicionado ao conjunto R, isto significa que as linhas espectrais com índices de linha entre "line index - MinimalRunLength)/2" e "line index + MinimalRunLength)/2" todas compreendem valores da linha espectral quantizadas em zero. : Assim, na primeira porção 310 do pseudo-código + de programas 310, é obtido um conjunto R de índices de frequência de linha espectral "line index", que enumera aquelas (e somente aquelas) linhas espectrais da porção espectral em consideração . que são "suficientemente" espaçadas (isto é, por pelo menos e.
MinimalRunLengthl2. linhas) -de- quaisquer "linhas " espectrais o quantizadas em um valor diferente de zero.
A detecção dessa região está ilustrada na Fig. - Ú ' 4, que ostra uma representação gráfica 400 de um espectro.
Uma . abscissa 410 descreve uma frequência de linhas espectrais em termos de um índice de frequência de linha espectral "line index". Uma ordenada 412 descreve uma intensidade (ex., amplitude ou energia) das linhas espectrais.
Como pode ser visto, a porção do espectro ilustrada na representação gráfica 400 compreende quatro linhas espectrais 420a, 420b, 420c e 420d, quantizadas em um valor diferente de zero.
Além disso, entre as linhas espectrais 420c e 420d existem 11 linhas espectrais 422a-422k quantizadas em zero.
Também, é suposto que uma linha espectral é somente considerada como sendo suficientemente espaçada de uma linha espectral quantizada em um valor diferente de zero se houver pelo menos quatro linhas espectrais quantizadas em zero entre a linha
. . 21 espectral atualmente em consideração e qualquer outra linha espectral quantizada em um valor diferente de zero (e naturalmente, se a própria linha espectral atualmente em consideração for quantizada em zero). Entretanto, ao considerar a linha espectral 422a, será achado que a linha espectral 422a é imediatamente adjacente à linha espectral 422c, que não é quantizada em zero, de maneira que O índice de frequência de linha
* espectral da linha espectral 422a não será parte do conjunto R
. computado de acordo com à primeira parte 310 do algoritmo 300. De forma similar, será achado que as linhas espectrais 422b, 422c, e
422d não são espaçadas de maneira suficiente de qualquer das
. linhas espectrais quantizadas em um valor diferente de zero, de maneira que os índices de. frequência de -kinha espectral das linhas i
Ú espectrais 422b a 422d também não farão parte do conjunto R.
Em 15º contraste, será visto que a linha espectral 422e é suficientemente o - “espaáçada de qualquer das Linhas espectrais quantizadas em um valor . diferente de zero, porque à linha espectral 422e é uma linha de centro (ou, mais geralmente, uma linha central), de uma sequência de 9 linhas espectrais contíguas, todas quantizadas em zero. aAssimy o índice de frequência de linha espectral da linha espectral 422e fará parte do conjunto R computado na primeira porção 310 do algoritmo 300. O mesmo também vale para as linhas espectrais 422f e 422g, de maneira que os índices de frequência de linha espectral das linhas espectrais 422f e 422g farão parte do conjunto R determinado na primeira porção 310 do algoritmo 300, como as linhas espectrais 422f, 422g são suficientemente espaçadas
| de quaisquer linhas espectrais de baixa frequência 420a, 420b, e 420c, quantizadas em um valor diferente de zero e de quaisquer
. 22 linhas espectrais de maior frequência quantizadas em um valor diferente de zero. Por outro lado, as linhas espectrais 422h, 422i, 422j, e 422k não farão parte do conjunto R, porque as referidas linhas espectrais estão localizadas muito perto, em termos de frequência, além da linha espectral 420d quantizada em um valor diferente de zero.
Assim, o conjunto R não compreenderá índices de ' frequência de linha espectral das linhas espectrais 420a, 420b, z 420c, 420d, porque as referidas linhas espectrais são quantizadas em um valor diferente de zero. Além disso, os índices de frequência de linha espectral das linhas espectrais 422a, 422b, . 422c, 422d, 422h, 422i, 4223, e 422k, não farão parte do conjunto R,. porque as referidas linhas espectrais. se. localizam “muitó " OO “próximas do 1ado das linhas espectrais 420a, 420b, 420c, e 420d. Em contraste, os índices de frequência de linha espectral das o .-.. linhas espectrais 4226, 422f, 1229, Serão incluídos no conjunto R, . porque as próprias referidas linhas espectrais são quantizadas em zero e espaçadas o suficiente de quaisquer linhas espectrais adjacentes diferentes de zero.
O algoritmo 300 também compreende uma segunda porção 320 de decodificação do patamar de ruído, onde um índice de valor de ruído ("index" na porção de código do programa 320) é convertido em um valor de figura do ruído decodificado ("nf decoded" no código do programa 300).
O código do programa 300 também compreende uma terceira porção 330 de preenchimento das linhas espectrais identificadas, isto é, linhas espectrais dos índices de frequência de linha espectral i que estão no conjunto R, com ruído. Para
. 23 tanto, os valores espectrais das linhas espectrais identificadas (indicados, por exemplo, por x(i), onde a variável operacional i subsequentemente toma todos os índices de frequência de linha espectral incluídos no conjunto R) são estabelecidos para oS valores de preenchimento de ruído.
Os valores de preenchimento de ruído são, por exemplo, obtidos multiplicando o valor de preenchimento de ruído decodificado (nf decoded) com um número ' randômico ou pseudo número randômico (indicado por "random(-1, . +1)"), onde o número randômico ou pseudo-randômico pode, por exemplo, randomicamente ou pseudo-randomicamente tomar os números —1 e +1. Entretanto, a provisão diferente de um ruído randômico ou R pseudo-randômico é naturalmente possível. - : . - = — ... = O preenchimento- de=-ruído é também ilustrado na ” Fig. 4. Como pode ser visto na Fig. 4, os valores espectrais zero - 15º das linhas espectrais 422e, 422f, e 4229g são substituídos pelos Store de preenchimento de ruído (ilustrados pelas linhas . pontilhadas na Fig. 4). Calculador do parâmetro de preenchimento de ruído de acordo com as Figs. 5 e 6 A Fig. 5 mostra um diagrama esquemático de blocos de um calculador do parâmetro de preenchimento de ruído 500. O calculador do parâmetro de preenchimento de ruído é configurado para obter uma representação espectral quantizada 510 de um sinal de áudio e prover, com base nela, um parâmetro de preenchimento de ruído 512. O calculador do parâmetro de preenchimento de ruído 500 compreende um identificador de região espectral 520, que é configurado para receber a representação espectral quantizada 510 do sinal de áudio e para identificar regiões espectrais (ex.,
” 24 linhas espectrais) da representação espectral quantizada 510 espaçada das regiões espectrais diferentes de zero da representação espectral quantizada 510 por pelo menos uma região espectral intermediária (ex., linha espectral), para obter uma informação 522 descrevendo as regiões espectrais identificadas (ex., linhas espectrais identificadas). O calculador do parâmetro de preenchimento de ruído 500 ainda compreende um calculador de : valor de ruído 530 configurado para receber informações do erro de . quantização 532 e prover o parâmetro de preenchimento de ruído
512. Para tanto, o calculador de valor de ruído é configurado para considerar seletivamente os erros de quantização das regiões . espectrais identificadas, descritos pelas informações 522, para um cálculo do parâmetro de preenchimento de .ruído .512.- - - == — = . ' As informações do erro de quantização 532 podem, por exemplo, ser idênticas a uma informação de energia (ou NS informação de | intensidade) | aus descreva energias (ou . intensidades) dessas linhas espectrais que são quantizadas em zero na representação espectral quantizada 510. O calculador do parâmetro de preenchimento de ruído 500 pode opcionalmente compreender um quantizador 540, que é configurado para receber uma representação espectral não quantizada 542 de um sinal de áudio e prover a representação espectral quantizada 510 do sinal de áudio. O quantizador 540 pode ter uma resolução de quantização ajustável, que pode, por exemplo, ser individualmente ajustável por linha espectral, Ou por banda espectral (ex., na dependência de uma relevância psicoacústica das linhas espectrais ou das bandas espectrais, obtidas usando um modelo psicoacústico). A funcionalidade do
. | 25 quantizador de resolução variável pode ser igual à funcionalidade descrita em International Standards ISO/IEC 13818-7 e ISO/IEC 14496-3. Em particular, o quantizador 540 pode ser ajustado de maneira que existam vãos espectrais ou buracos espectrais na representação espectral quantizada 510 do sinal de áudio, isto é, regiões contíguas de linhas espectrais adjacentes quantizadas em zero.
. Além disso, a representação espectral não . quantizada 542 pode servir como informações do erro de quantização 532, ou as informações do erro de quantização 532 podem ser obtidas da representação espectral não quantizada 542.
. A seguir, será descrita em detalhes a funcionalidade da computação do parâmetro de preenchimento: de -— ruído, que pode ser formado pelo calculador do parâmetro de 15º preenchimento de ruído 500. Na computação do parâmetro de preenchimento de ruído no lado do codificador, o preenchimento de . ruído se aplica preferivelmente no domínio da quantização. Dessa forma, o ruído introduzido é conformado posteriormente pelo filtro inverso psicoacústico relevante. A energia do ruído introduzido pelo decodificador é calculada e codificada no lado do codificador seguindo as próximas etapas:
1. Obter os valores quantizados das linhas de frequência;
2. Selecionar somente uma parte dos espectros; '
3. Detectar as regiões espectrais na parte selecionada dos espectros onde oO comprimento de operação dos zeros é maior que o tamanho mínimo de comprimento de operação;
4. Calcular a média geométrica do erro de
. i 26 quantização com relação às regiões previamente detectadas; e
5. Quantizar uniformemente a média geométrica com 3 bits. Com relação à primeira etapa, os valores quantizados das linhas de frequência podem ser obtidos usando o quantizador 540. Os valores quantizados das linhas de frequência . são, portanto, representados pela representação espectral ei quantizada 510. 2 Com relação à segunda etapa, que pode ser considerada como opcional, deve ser notado que a computação do preenchimento de ruído é feita, de preferência, com base na . porção de alta frequência dos espectros. Em uma configuração preferida, a energia do ruído (denominada patamar de ruído) é somente calculada na segunda metade dos espectros, isto é, para as altas frequências (mas não para as menores frequências). Realmente, normalmente as altas frequências (a parte superior do . espectro) são menos perceptualmente importantes que as baixas frequências, e os valores quantizados em zero ocorrem principalmente na segunda metade dos espectros. Além disso, somar o ruído nas altas frequências é menos propenso a obter uma restituição final sonora ruidosa. Com relação à terceira etapa, restringindo o preenchimento de ruído nas regiões espectrais em que ocorre o comprimento de operação de valores quantizados em zero, é evitado que o preenchimento de ruído afete muito os valores não zerados. Dessa forma, o preenchimento de ruído não se aplica na vizinhança dos valores não zerados, e a tonalidade original dessas linhas é assim melhor preservada. O tamanho mínimo de comprimento de
E 27 operação é fixado em 8 em uma configuração preferida.
Isto significa que as 8 linhas que circundam um valor não zerado não são afetadas pelo preenchimento de ruído (e não são, como consequência, consideradas para o cálculo de um valor de ruído). Com relação à quarta etapa, oO erro de quantização no domínio quantizado está na faixa de [-0,5; 0,5], e é suposto uniformemente distribuído.
A energia dos erros de quantização das : regiões detectadas é média no domínio logarítmico (isto é, média ç geométrica). O patamar de ruído, nf, é, então, calculado como segue: nf = power (10, sum(logl10(E(x(i))))/(2*n)). . Acima, sum() é a soma das energias logarítmicas, - — logl0(E()), das. linhas .individuais x(i).—dentro -das regiões detectadas, e n o número de linhas dentro dessas regiões.
O patamar de ruído, nf, está entre O e 0,5. Esse cálculo permite " levar sm DONT & original planicidade espectral dos valores . zerados, e então obter as informações sobre suas características de tonalidade/ruídos. ' Se os valores zerados forem muito tonais, o patamar de ruído (computador no equipamento 500) irá para zero, e um baixo patamar de ruído será adicionado ao decodificador (ex., no decodificador 100, 200 acima descrito). Se os valores zerados forem realmente ruidosos, oO patamar de ruído será alto, e o preenchimento de ruídos pode ser visto como uma codificação altamente paramétrica das linhas espectrais zeradas, como PNS (Substituição do Ruído Perceptual) (ver também a referência [4]). Com relação à quinta etapa, é então calculado como segue O índice de quantização ("index") do patamar de ruído:
. 28 index=max(O0,min(7, int(8-16*nf))). O índice é transmitido, por exemplo, em 3 bits.
A seguir, será descrito o algoritmo para a computação do parâmetro de preenchimento de ruído, com referência à Fig. 6, que mostra um pseudo-código de programas 600 desse algoritmo para a obtenção do parâmetro de preenchimento de ruído, de acordo com uma configuração da invenção.
O algoritmo 600 ' compreende uma primeira porção 610 de regiões de detecção que + devem ser consideradas para a computação do parâmetro de preenchimento de ruído.
São descritas regiões identificadas (ex., linhas espectrais) pelo conjunto R, que pode, por exemplo, . compreender índices de frequência de linha espectral ("line . index") de linhas espectrais identificadas: As linhas espectrãis” - podem ser identificadas, sendo as mesmas quantizadas em zero e 155 que são mais espaçadas, o suficiente, de quaisquer outras linhas Ú espectrais quantizadas em um valor diferente de zero. . A primeira porção 610 do programa 600 pode ser idêntica à primeira porção 310 do programa 300. Assim, a i representação espectral quantizada ("quantized (x(i))") usada no algoritmo 600 pode, por exemplo, ser idêntica à representação espectral quantizada ("quantized x(i))") usada no algoritmo 300 no lado do decodificador.
Em outras palavras, a representação espectral quantizada usada no lado do codificador pode ser transmitida, de forma codificada, para o decodificador em um sistema de transmissão que compreende um codificador e um decodificador.
O algoritmo 600 compreende uma segunda porção 620 de computação do patamar de ruído.
Na computação do patamar
. 29 de ruído, somente são consideradas as regiões espectrais (ou linhas espectrais) descritas pelo conjunto R computado na primeira porção 610 do algoritmo 600. Como pode ser visto, oO valor de preenchimento de ruído é primeiro inicializado em zero.
O número de linhas espectrais consideradas (n) é também primeiro inicializado em zero.
Subsequentemente, as energias de todas as linhas espectrais, índices de linha que são incluídos no conjunto : R, são somadas, onde as energias das linhas espectrais são . logaritmizadas antes da soma.
Por exemplo, pode ser somado um logaritmo na base 10 (log 10) das energias (E(x(i))) das linhas espectrais.
Deve ser aqui notado que a energia real das linhas . espectrais antes da quantização (indicada por "E ou energy = - = x(i)-)") é-somada sob forma logaritmizada.
O “número de linhas " espectrais considerado é também contado.
Assim, após a execução 15º da segunda porção 620 do algoritmo 600, a variável nf indica uma soma logarítmica das energias das linhas espectrais identificadas . antes da quantização, e a variável n descreve o número de linhas espectrais identificadas.
O algoritmo 600 também compreende uma terceira porção 630 de quantização do valor nf, isto é, a soma logarítmica das linhas espectrais identificadas.
Pode ser usada uma equação de mapeamento como descrita acima ou como mostrada na Fig. 6. Método de acordo com a Fig. 7 A Fig. 7 mostra um fluxograma de um método para prover uma representação espectral com preenchimento de ruído de um sinal de áudio com base em uma representação espectral de entrada do sinal de áudio.
O método 700 da Fig. 7 compreende uma etapa 710 de identificação das regiões espectrais de uma
. | 30 representação espectral de entrada de um sinal de áudio espaçadas das regiões espectrais da representação espectral de entrada diferente "de zero por pelo menos uma região espectral intermediária, para obter regiões espectrais identificadas. O método 700 também compreende uma etapa 720 de introduzir seletivamente ruído nas regiões espectrais identificadas, para obter uma representação espectral com preenchimento de ruído do " sinal de áudio. : O método 700 pode ser suplementado por qualquer das características e funcionalidades descritas na presente com referência ao preenchedor de ruídos do invento.
. Método de acordo com a Fig. 8 ' o — - - e - A Fig.-8 mostra um fluxograma de um Método pára = prover um parâmetro de preenchimento de ruído com base em uma 15º representação espectral quantizada de um sinal de áudio. O método 800 compreende uma etapa 810 de identificação das regiões . espectrais da representação espectral quantizada de um sinal de áudio espaçado das regiões espectrais diferentes de zero da representação espectral quantizada por pelo menos uma região espectral intermediária, para obter regiões espectrais identificadas. O método 800 também compreende uma etapa 820 de considerar seletivamente erros de quantização das regiões espectrais identificadas para o cálculo do parâmetro de preenchimento.
O método 800 pode ser suplementado por quaisquer das características e funcionalidades descritas na presente com relação ao calculador do parâmetro de preenchimento de ruído.
Representação do sinal de áudio de acordo com a
« . 31 Fig. 9.
A Fig. 9 mostra uma representação gráfica de uma representação de sinal de áudio, de acordo com uma configuração da invenção. A representação do sinal de áudio 900 pode, por exemplo, formar a base para a representação espectral de entrada
110. A representação do sinal de áudio 900 pode também tomar a funcionalidade da representação do sinal de áudio codificado 212.
' A representação do sinal de áudio 900 pode ser obtida usando oO * calculador do parâmetro de preenchimento de ruído 500, em que a representação do sinal de áudio 900 pode, por exemplo, compreender a representação espectral quantizada 510 do sinal de . áudio e o parâmetro de preenchimento de ruído 512, por exemplo, — ambos sob forma codificada. - = + - som om o mom omom SD TOS Em outras palavras, a representação do sinal de 15º áudio 900 pode representar um sinal de áudio. A representação do : Sinai de áudio codificado 900 compreende uma representação do J domínio espectral quantizado codificado do sinal de áudio e também um parâmetro de preenchimento de ruído codificado. O : parâmetro de preenchimento de ruído representa um erro de quantização das regiões espectrais da representação no domínio espectral quantizada em zero e espaçadas das regiões espectrais da representação no domínio espectral quantizado em um valor diferente de zero por pelo menos uma região espectral intermediária.
Naturalmente, a representação do sinal de áudio 900 pode ser suplementada por qualquer das informações acima descritas.
. 32 Dependendo de determinados requisitos de implementação, as configurações da invenção podem ser implementadas em hardware ou em software.
A implementação pode ser feita usando um meio digital de armazenagem, por exemplo, um disquete, um DVD, CD, ROM, PROM, EPROM, EEPROM ou uma memória FLASH, tendo "armazenados sinais de controle de leitura eletrônica, que cooperam (ou são capazes de cooperar) com um ' sistema programável de computador, de maneira a ser realizado o + respectivo método.
Algumas configurações de acordo com a invenção compreendem um portador de dados tendo sinais de controle de . leitura eletrônica, que são capazes de cooperar com um sistema - programável de computador, de maneira- que--seja realizado úm dos o métodos descritos na presente.
Em geral, as configurações da presente invenção podem ser implementadas como um produto de programa de computador ' . com um código do programa, o código do programa sendo operacional para realizar um dos métodos quando o produto de programa de | computador opera em um computador.
O código do programa pode, por exemplo, ser armazenado em um portador de leitura por máquina.
Outras configurações compreendem o programa de computador para realizar um dos métodos descritos na presente, armazenados em um portador de leitura por máquina.
Portanto, em outras palavras, uma configuração do método do invento é um programa de computador tendo um código do programa para realizar um dos métodos descritos na presente, quando o programa de computador opera em um computador.
Portanto, outra configuração dos métodos do
. 33 invento é um portador de dados (ou um meio digital de armazenagem) compreendendo o programa de computador para realizar um dos métodos descritos na presente.
Portanto, outra configuração do método do invento é um fluxo de dados ou uma sequência de sinais representando o programa de computador para realizar os métodos descritos na presente. O fluxo de dados ou a sequência de sinais * pode, por exemplo, ser configurado para transferência pela . conexão de comunicação de dados, por exemplo, via Internet.
Outra configuração compreende um meio de processamento, por exemplo, um computador, ou um dispositivo lógico programável, configurado ou adaptado para realizar um dos métodos descritos na presente. 2 oe AR e e + e E Eos tp ee A TT OT NS Outra configuração compreende um computador tendo instalado o programa de computador para realizar um dos ' métodos descritos na presente. o . Em algumas configurações, um dispositivo lógico programável (por exemplo, um gate array programável de campo) pode ser usado para realizar algumas ou todas as funcionalidades dos métodos descritos na presente. Em algumas configurações, um gate array programável de campo pode cooperar com um microprocessador para realizar um dos métodos descritos na presente.
CONCLUSÃO Para resumir O que foi dito acima, a presente invenção amplia a ferramenta de codificação de áudio "preenchimento de ruído" considerando o sinal de entrada e as características do sinal decodificado tanto ao fazer a computação
. 34 do parâmetro de preenchimento de ruídos no lado do codificador como a aplicação do ruído no lado do decodificador. Em uma configuração da invenção, a tonalidade/ruídos das linhas espectrais quantizadas em zero é estimada e usada para a estimativa do patamar de ruídos. Este patamar de ruído é então transmitido para o decodificador, que aplica o preenchimento de ruído aos valores quantizados em zero que ocorrem em regiões ' específicas dos espectros. Essas regiões são selecionadas com . base nas características dos espectros decodificados.
Com relação ao contexto da invenção, pode-se notar que a invenção foi aplicada a uma codificação baseada em transformada, que usa uma quantização escalar em MDCT. Os 0 L . coeficientes .MDCT são- previamente- normalizados Por” uma Curva | calculada com base em avisos perceptuais. A curva é deduzida a 15º partir de um estágio de análise LPC prévia (Linear Prediction o Ú Coding) ponderando os coeficientes LPC, como é feito no modo TCX . de AMR-WB+ (ver referência [1]). A partir dos coeficientes ponderados, é projetado um filtro de ponderação perceptual e aplicado antes da MDCT. O filtro inverso é também aplicado no lado do decodificador após a MDCT inversa. Este filtro inverso de ponderação perceptual conforma os ruídos de quantização de forma a minimizar ou mascarar o ruído percebido.
Em configurações de acordo com a invenção, são Superadas as desvantagens da técnica anterior. O preenchimento de ruído é aplicado de forma convencional de maneira sistemática aos valores quantizados em zero, considerando somente um limite espectral baseado em envelope, um limite de mascaramento Ou um limite energético. A técnica anterior não considera nem as
. 35 características do sinal de entrada nem as características do sinal decodificado. Assim, o equipamento convencional pode introduzir outros problemas indesejáveis, especialmente problemas de ruídos e cancela as vantagens dessa ferramenta.
Em contraste, configurações de acordo com a invenção permitem um melhor preenchimento de ruído com redução de problemas, como é discutido abaixo.
' Referências: + [1] "Extended Adaptive Multi-Rate - MWideband (AMR-WB+) codec", 3GPP TS 26.290 V6.3.0, 2005-06, Technical Specification.
. [2] Ragot et al, "ITU-T G.729.1: AN 8-32 Kbit/S
2. Scalable Coder Interoperable- with G.729- for Widebáfid Telephony | and Voice Over IP", Vol. 4, ICASSP 07, 15-20 April 2007.
[3] "AUDIO CODING", International Application : No. PCT/IB2002/001388, Applicant: KONINKLIJKE PHILIPS . ELECTRONICS N.V. [NL/NL]; Groenewoudseweg 1 NL-5621 BA Eindhoven (NL). Inventors: TAORI, Rakesh; Prof Holstlaan 6 NL-5656 AA Eindhoven (NL) and VAN DE PAR, Steven, L., J., D., E.; Prof. Holstlaan 6 NL-5656 AA Eindhoven (NL).
[4] Generic Coding of Moving Pictures and Associated Audio: Advanced Audio Coding. International Standard 13818-7, ISO/IEC JTC1/SC29/WG11 Moving 10 Pictures Expert Group,
1997. .
Claims (15)
1. “PREENCHEDOR DE RUÍDOS,CALCULADOR DO PARÂMETRO DE PREENCHIMENTO DE RUÍDO,MÉTODO PARA PROVER UM PARÂMETRO DE PREENCHIMENTO DE RUÍDO,MÉTODO PARA PROVER UMA REPRESENTAÇÃO
ESPECTRAL COM PREENCHIMENTO DE RUÍDO DE UM SINAL DE ÁUDIO ,CORRESPONDENTE PROGRAMA DE COMPUTADOR E SINAL CODIFICADO DE ÁUDIO”, onde o preenchedor de ruídos (100) para prover uma representação espectral com preenchimento de ruído (112) de um sinal de áudio com base em uma representação espectral de entrada (110) do sinal de áudio, é caracterizado por compreender: um identificador de região espectral (120) e configurado para identificar regiões espectrais (422e, 422f, 4229) Ã da representação espectral de entrádã (110) que são quantizadás em zero e espaçadas das regiões espectrais diferentes de zero (420a, 420b, 420c, 420d) da representação espectral de entrada (110) por. pelo menos uma região espectral intermediária (422a, 422b, 422c, 422d, 422h, 422i, 4223, 422Kk), para obter regiões espectrais identificadas (422e, 422f, 4229); e um insersor de ruído (130) configurado para nn 20 introduzir seletivamente o ruído nas regiões espectrais a identificadas (422e, 422f, 422g) e obter a representação espectral o com preenchimento de ruído (112) do sinal de áudio.
2. Preenchedor de ruídos (100), de acordo com a reivindicação 1, caracterizado pelo fato de que o identificador de região espectral (120) é configurado para identificar, como as regiões espectrais identificadas, linhas espectrais (422e, 422f, 4229) da representação espectral de entrada (110), que são quantizadas em zero e que compreendem pelo menos um primeiro s ' º 2 número predeterminado (4) de linhas espectrais vizinhas de menor frequência (422a, 422b, 422d; 422b, 422c, 422d, 422e, 422c, 422d, 422e, 422f) quantizadas em zero e pelo menos um segundo número predeterminado (4) de linhas espectrais vizinhas de maior frequência (422f, 422g, 422h, 422i; 422g, 422h, 422i, 422j3; 422h, 422i, 4223, 422K) quantizadas em zero, como regiões espectrais identificadas; onde o primeiro número predeterminado (4) é maior ou igual a 1, e onde o segundo número predeterminado (4) é maior ou igual a 1; e onde o insersor de ruído (130) é configurado para e introduzir seletivamente o ruído nas linhas espectrais à identificadas (422e, 422f, 4229) engúánito deixa as linhas " espectrais (420a, 420b, 420c, 420d) quantizadas em um valor diferente- de zero e linhas espectrais (422a, 422b, 422c, 4220, .— 422h, 422i, 4223, 422Kk) quantizadas em zero, mas não tendo O primeiro número predeterminado (4) de linhas espectrais vizinhas de menor frequência quantizadas em zero, Ou oO segundo número predeterminado (4) de linhas espectrais vizinhas de maior * 20 frequência quantizadas em zero não afetadas pelo preenchimento de UH ruído.
"a 3. Preenchedor de ruído (100), de acordo com a reivindicação 2, caracterizado pelo fato de que o primeiro número predeterminado (4) é igual ao segundo número predeterminado (4).
4. Preenchedor de ruído (100), de acordo com uma das reivindicações de 1 a 3, caracterizado pelo fato de que oO preenchedor de ruídos é configurado para introduzir ruído somente nas regiões espectrais em uma porção superior da representação
, $ 3 espectral de entrada (110) do sinal de áudio, deixando uma porção inferior da representação espectral de entrada (110) do sinal de áudio não afetada pelo preenchimento de ruído.
5. Preenchedor de ruído (100), de acordo com uma das reivindicações de ]1 a 4, caracterizado pelo fato de que O identificador de região espectral (120) é configurado para somar valores quantizados de intensidade (quantizados (x(i))) das regiões espectrais na vizinhança espectral predeterminada bilateral de uma dada região espectral (i), para obter um valor somado (E), e avaliar o valor somado (E) e decidir se a determinada região espectral (1) é uma região espectral c identificada ou não. 3 - =. 6. Preenchedôr de ruído (100), de âcordo com uma : das reivindicações de 1 a 5, caracterizado pelo fato de que O identificador de região espectral (120). é configurado para-varrer- - uma faixa de regiões espectrais da representação espectral de entrada (110) e detectar sequências contíguas (422a a 422i; 422b a 422); 422c a 422k) de regiões espectrais quantizadas em zero, e reconhecer uma ou mais regiões espectrais centrais (422e, 422f,
FÉ 1* 20 4229) das sequências contíguas detectadas como regiões espectrais ê identificadas.
7. Calculador do parâmetro de preenchimento de | | ruído (500) para prover um parâmetro de preenchimento de ruído (512) com base em uma representação espectral quantizada (510) de um sinal de áudio, é caracterizado por compreender: um identificador de região espectral (520) configurado para identificar regiões espectrais (422e, 422f, 4229) da representação espectral quantizada (510) espaçadas das
. ' 4 regiões espectrais diferentes de zero (420a, 420b, 420c, 420d) da representação espectral quantizada (510) por pelo menos uma região espectral intermediária (422a, 422b, 422c, 422d, 422h, 422i, 4223, 422Kk), para obter regiões espectrais identificadas (422e, 422f, 4229); e um calculador de valor de ruído (530) configurado para considerar seletivamente erros de quantização (energy (x(i))) das regiões espectrais identificadas (i) para o cálculo do parâmetro de preenchimento de ruído (512, nf).
8. Calculador do parâmetro de preenchimento de ruído (500), de acordo com a reivindicação 7, caracterizado pelo [G fato de que o identificador de região espectral (520) é 7 - —-configurado para identificãr linhas espectrais (422e, 422f, 1229) i da representação espectral de entrada (510), que sejam quantizadas em zero, e que compreendam .pelo menos um primeiro - número predeterminado (4) de linhas espectrais vizinhas de menor frequência (422a, 422b, 422c, 422d; 422b, 422c, 422d, 422e, 422c, 422d, 422e, 422f) quantizadas em zero e pelo menos um segundo número predeterminado (4) de linhas espectrais vizinhas de maior 4 120 frequência (422f, 422g, 422h, 422i; 4229, 422h, 422i, 4223; 422h, is; 422i, 422j, 422kK) quantizadas em zero, como regiões espectrais identificadas; | onde o primeiro número predeterminado (4) é maior ou igual a l, e onde o segundo número predeterminado (4) é maior ou igual a 1; e onde o calculador de valor de ruído (520) é configurado para considerar seletivamente os erros de quantização das regiões espectrais identificadas (1) para o cálculo do
. ' 5 parâmetro de preenchimento de ruído, deixando as linhas espectrais (420a, 420b, 420c, 420d) quantizadas em um valor diferente de zero e linha espectral (422a, 422b, 422c, 422d, 422h, 422i, 42253, 422k) quantizada em zero, mas não tendo o primeiro número predeterminado (4) de linhas espectrais vizinhas de menor frequência quantizadas em zero, ou o segundo número predeterminado (4) de linhas espectrais vizinhas de maior frequência quantizadas em zero fora de consideração para oO cálculo do parâmetro de preenchimento de ruído.
9. Calculador do parâmetro de preenchimento de ruído (500), de acordo com qualquer uma das reivindicações de 7 a [G 8, caracterizado pelo fato de que o calculador de valor de ruído ; - 41530) “é configurado para — Considerar uma energia real : (energy(x(i))) dos erros de quantização das regiões espectrais identificadas (i) para o cálculo do parâmetro .de preenchimento: de- — — ruído (512, nf, nf index).
10. Calculador do parâmetro de preenchimento de ruído (500), de acordo com qualquer uma das reivindicações de 7 a 9, caracterizado pelo fato de que o calculador de valor de ruído & 120 (530) é configurado para realçar a energia não tonal do erro de is quantização (energy (x(i))) distribuída em uma pluralidade de regiões espectrais identificadas com relação à energia tonal do Na erro de quantização concentrada em uma única região espectral ou em uma pluralidade de linhas espectrais.
11. Calculador do parâmetro de preenchimento de ruído (500), de acordo com uma das reivindicações de 7 a 10, caracterizado pelo fato de que o calculador de valor de ruído (530) é configurado para calcular a soma das energias
. ' 6 logaritmizadas dos erros de quantização (loglO0(energy(x(i)))) das regiões espectrais identificadas (i), para obter o parâmetro de preenchimento de ruído (512, nf, nf index).
12. Representação do sinal de áudio codificado (900) representando um sinal de áudio, caracterizado por compreender uma representação do domínio espectral quantizado codificado do sinal de áudio; e um parâmetro de preenchimento de ruído codificado; onde o parâmetro de preenchimento de ruído representa um erro de quantização das regiões espectrais da ç representação no domínio espectral quantizada em zero e espaçada das regiões espectrais da répresentação no domínio espectral : quantizada em um valor diferente de zero por pelo menos uma região espectral intermediária. . - " oe eee e
13. Método (700) para prover uma representação espectral com preenchimento de ruído de um sinal de áudio com base em uma representação espectral de entrada do sinal de áudio, caracterizado por compreender: 1 20 identificação (710) das regiões espectrais da E) representação espectral espaçadas de regiões espectrais diferentes “de zero por pelo menos uma região espectral | intermediária, para obter regiões espectrais identificadas; e seletivamente introduzir (720) ruído nas regiões espectrais identificadas para obter a representação espectral com preenchimento de ruído do sinal de áudio.
14. Método (800) para prover um parâmetro de preenchimento de ruído com base na representação espectral
. , 7 quantizada de um sinal de áudio, caracterizado por compreender: identificar (810) regiões espectrais da representação espectral quantizada espaçadas das regiões espectrais diferentes de zero da representação espectral quantizada por pelo menos uma região espectral intermediária para obter regiões espectrais identificadas; e considerar seletivamente (820) erros de quantização das regiões espectrais identificadas para um cálculo do parâmetro de preenchimento de ruído.
15. Programa de computador, caracterizado por realizar o método, de acordo com a reivindicação 13 ou 14, quando [A executado em um computador. t & (E
NR ” a :
REIVINDICAÇÕES
1. “PREENCHEDOR DE RUÍDOS,CALCULADOR DO PARÂMETRO DE PREENCHIMENTO DE RUÍDO,MÉTODO PARA PROVER UM PARÂMETRO DE PREENCHIMENTO DE RUÍDO , MÉTODO PARA PROVER UMA REPRESENTAÇÃO
ESPECTRAL COM PREENCHIMENTO DE RUÍDO DE UM SINAL DE ÁUDIO,CORRESPONDENTE PROGRAMA DE COMPUTADOR E SINAL CODIFICADO DE ÁUDIO”, onde o preenchedor de ruídos (100) para prover uma representação espectral com preenchimento de ruído (112) de um sinal de áudio com base em uma representação espectral de entrada (110) do sinal de áudio, é caracterizado por compreender: um identificador de região espectral (120) s configurado para identificar regiões espectrais (422e, 422f, 4229) da representação espectral de entrada (110) que são quantizadas em ? zero e espaçadas das regiões espectrais diferentes de zero (420a, —420b, 420c, 420d) da representação .espectral. de--entrada -(110)- por- pelo menos uma região espectral intermediária (422a, 422b, 422c, 422d, 422h, 422i, 422j3, 422k), para obter regiões espectrais identificadas (422e, 422f, 4229); e um insersor de ruído (130) configurado para ss t 20 introduzir seletivamente o ruído nas regiões espectrais E identificadas (422e, 422f, 422g) e obter a representação espectral com preenchimento de ruído (112) do sinal de áudio.
2. Preenchedor de ruídos (100), de acordo com a reivindicação 1, caracterizado pelo fato de que o identificador de região espectral (120) é configurado para identificar, como as regiões espectrais identificadas, linhas espectrais (422e, 422f, 4229) da representação espectral de entrada (110), que são quantizadas em zero e que compreendem pelo menos um primeiro
' 2 número predeterminado (4) de linhas espectrais vizinhas de menor frequência (422a, 422b, 422d; 422b, 422c, 422d, 422e, 422c, 422d, 422e, 422f) quantizadas em zero e pelo menos um segundo número predeterminado (4) de linhas espectrais vizinhas de maior frequência (422f, 422g, 422h, 422i; 4229, 422h, 422i, 422); 422h, 422i, 422j, 422k) quantizadas em zero, como regiões espectrais identificadas; onde o primeiro número predeterminado (4) é maior ou igual a 1, e onde o segundo número predeterminado (4) é maior ou igual a 1; e onde o insersor de ruído (130) é configurado para * introduzir seletivamente o ruído nas linhas espectrais - identificadas (4226, 422f; 422d) enduanto déixa as linhas + espectrais (420a, 420b, 420c, 420d) quantizadas em um valor diferente de zero e linhas, espectrais .(422a,-422b,-422c,-422d,- - 422h, 422i, 4223, 422Kk) quantizadas em zero, mas não tendo o primeiro número predeterminado (4) de linhas espectrais vizinhas de menor frequência quantizadas em zero, Ou oO segundo número predeterminado (4) de linhas espectrais vizinhas de maior es Vo frequência quantizadas em zero não afetadas pelo preenchimento de G ruído.
3. Preenchedor de ruído (100), de acordo com a l reivindicação 2, caracterizado pelo fato de que o primeiro número predeterminado (4) é igual ao segundo número predeterminado (4).
4. Preenchedor de ruído (100), de acordo com uma das reivindicações de 1 a 3, caracterizado pelo fato de que O preenchedor de ruídos é configurado para introduzir ruído somente nas regiões espectrais em uma porção superior da representação
' 3 espectral de entrada (110) do sinal de áudio, deixando uma porção inferior da representação espectral de entrada (110) do sinal de áudio não afetada pelo preenchimento de ruído.
5. Preenchedor de ruído (100), de acordo com uma das reivindicações de 1 a 4, caracterizado pelo fato de que o identificador de região espectral (120) é configurado para somar valores quantizados de intensidade (quantizados (x(i))) das regiões espectrais na vizinhança espectral predeterminada bilateral de uma dada região espectral (i), para obter um valor somado (E), e avaliar o valor somado (E) e decidir se a determinada região espectral (i) é uma região espectral + identificada ou não. | - - “6. Preenchedor de ruído (100), de acordo com uma = Ú das reivindicações de 1 a 5, caracterizado pelo fato de que o identificador de região espectral .(120) é .configurado. para varrer - uma faixa de regiões espectrais da representação espectral de entrada (110) e detectar sequências contíguas (422a a 422i; 422b a 4223; 422c a 422Kk) de regiões espectrais quantizadas em zero, e reconhecer uma ou mais regiões espectrais centrais (422e, 422f, : 20 422g) das sequências contíguas detectadas como regiões espectrais Gu identificadas.
7. Calculador do parâmetro de preenchimento de ruído (500) para prover um parâmetro de preenchimento de ruído (512) com base em uma representação espectral quantizada (510) de um sinal de áudio, é caracterizado por compreender: um identificador de região espectral (520) configurado para identificar regiões espectrais (422e, 422f, 422g) da representação espectral quantizada (510) espaçadas das
' | 4 regiões espectrais diferentes de zero (420a, 420b, 420c, 420d) da representação espectral quantizada (510) por pelo menos uma região espectral intermediária (422a, 422b, 422c, 422d, 422h, 422i, 4225, 422Kk), para obter regiões espectrais identificadas (422e, 422f, 4229); e um calculador de valor de ruído (530) configurado para considerar seletivamente erros de quantização (energy (x(i))) das regiões espectrais identificadas (1) para o cálculo do parâmetro de preenchimento de ruído (512, nf).
8. Calculador do parâmetro de preenchimento de ruído (500), de acordo com a reivindicação 7, caracterizado pelo + fato de que o identificador de região espectral (520) é configurado Para identificar linhas espéctrais (422e, 422f, 4229) | : da representação espectral de entrada (510), que sejam 15— quantizadas .em zero e que. compreendam—pelo menos -um- primeiro - -— número predeterminado (4) de linhas espectrais vizinhas de menor frequência (422a, 422b, 422c, 422d; 422b, 422c, 422d, 422e, 422c, 422d, 422e, 422f) quantizadas em zero e pelo menos um segundo número predeterminado (4) de linhas espectrais vizinhas de maior 2 frequência (422f, 422g, 422h, 422i; 422g, 422h, 422i, 4223; 422h, & 422i, 4223, 422k) quantizadas em zero, como regiões espectrais — identificadas; onde o primeiro número predeterminado (4) é maior ou igual a 1, e onde o segundo número predeterminado (4) é maior ou igual a 1; e onde o calculador de valor de ruído (520) é configurado para considerar seletivamente os erros de quantização das regiões espectrais identificadas (i) para o cálculo do
À : 5 parâmetro de preenchimento de ruído, deixando as linhas espectrais (420a, 420b, 420c, 420d) quantizadas em um valor diferente de zero e linha espectral (422a, 422b, 422c, 422d, 422h, 422i, 4223, 422k) quantizada em zero, mas não tendo o primeiro número predeterminado (4) de linhas espectrais vizinhas de menor frequência quantizadas em zero, ou o segundo número predeterminado (4) de linhas espectrais vizinhas de maior frequência quantizadas em zero fora de consideração para oO cálculo do parâmetro de preenchimento de ruído.
9. Calculador' do parâmetro de preenchimento de ruído (500), de acordo com qualquer uma das reivindicações de 7 a +? 8, caracterizado pelo fato de que o calculador de valor de ruído : (530) é Configurado Fara considerar uma energia real (energy(x(1))) dos erros de quantização das regiões espectrais identificadas .(i) para o cálculo do parâmetro de preenchimento de --— ruído (512, nf, nf index).
10. Calculador do parâmetro de preenchimento de ruído (500), de acordo com qualquer uma das reivindicações de 7 a 9, caracterizado pelo fato de que o calculador de valor de ruído (530) é configurado para realçar a energia não tonal do erro de a quantização (energy (x(i))) distribuída em uma pluralidade de ' — regiões espectrais identificadas com relação à energia tonal do erro de quantização concentrada em uma única região espectral ou em uma pluralidade de linhas espectrais.
11. Calculador do parâmetro de preenchimento de ruído (500), de acordo com uma das reivindicações de 7 a 10, caracterizado pelo fato de que o calculador de valor de ruído (530) é configurado para calcular a soma das energias logaritmizadas dos erros de quantização (loglO0(energy(x(i)))) das regiões espectrais identificadas (i), para obter o parâmetro de preenchimento de ruído (512, nf, nf index).
12. Representação do sinal de áudio codificado (900) representando um sinal de áudio, caracterizado por compreender uma representação do domínio espectral quantizado codificado do sinal de áudio; e um parâmetro de preenchimento de ruído codificado; onde o parâmetro de preenchimento de ruído representa um erro de quantização das regiões espectrais da + representação no domínio espectral quantizada em zero e espaçada ; Ú das regiões espectrais da representação no domínio espectral quantizada em um valor diferente de zero por pelo menos uma 15º região-espectral-intermediária. — = =—
13. Método (700) para prover uma representação espectral com preenchimento de ruído de um sinal de áudio com base em uma representação espectral de entrada do sinal de áudio, caracterizado por compreender: identificação (710) das regiões espectrais da a representação espectral espaçadas de regiões espectrais ' - diferentes de zero por pelo menos uma região espectral intermediária, para obter regiões espectrais identificadas; e seletivamente introduzir (720) ruído nas regiões espectrais identificadas para obter a representação espectral com preenchimento de ruído do sinal de áudio.
14. Método (800) para prover um parâmetro de preenchimento de ruído com base na representação espectral a. . 7 quantizada de um sinal de áudio, caracterizado por compreender: identificar (810) regiões espectrais da representação espectral quantizada espaçadas das regiões espectrais diferentes de zero da representação espectral quantizada por pelo menos uma região espectral intermediária para obter regiões espectrais identificadas; e considerar seletivamente (820) erros de quantização das regiões espectrais identificadas para um cálculo do parâmetro de preenchimento de ruído.
15. Programa de computador, caracterizado por realizar o método, de acordo com a reivindicação 13 ou 14, quando e executado em um computador. , o é
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US7987208P | 2008-07-11 | 2008-07-11 | |
US61/079,872 | 2008-07-11 | ||
US10382008P | 2008-10-08 | 2008-10-08 | |
US61/103,820 | 2008-10-08 | ||
PCT/EP2009/004653 WO2010003565A1 (en) | 2008-07-11 | 2009-06-26 | Noise filler, noise filling parameter calculator, method for providing a noise filling parameter, method for providing a noise-filled spectral representation of an audio signal, corresponding computer program and encoded audio signal |
Publications (1)
Publication Number | Publication Date |
---|---|
BRPI0910522A2 true BRPI0910522A2 (pt) | 2020-10-20 |
Family
ID=40941986
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR122021003726-4A BR122021003726B1 (pt) | 2008-07-11 | 2009-06-25 | Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio. |
BR122021003142-8A BR122021003142B1 (pt) | 2008-07-11 | 2009-06-25 | Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio, e fluxo de áudio |
BRPI0910811-4A BRPI0910811B1 (pt) | 2008-07-11 | 2009-06-25 | Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio. |
BR122021003097-9A BR122021003097B1 (pt) | 2008-07-11 | 2009-06-25 | Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio, e fluxo de áudio |
BR122021003752-3A BR122021003752B1 (pt) | 2008-07-11 | 2009-06-25 | Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio. |
BRPI0910522-0A BRPI0910522A2 (pt) | 2008-07-11 | 2009-06-26 | preenchedor de ruídos, calculador do parâmetro de preenchimento de ruído, método para prover um parâmetro de preenchimento de ruído, método para prover uma representação espectral com preenchimento de ruído de um sinal de áudio, correspondente programa de computador e sinal codificado de áudio |
Family Applications Before (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR122021003726-4A BR122021003726B1 (pt) | 2008-07-11 | 2009-06-25 | Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio. |
BR122021003142-8A BR122021003142B1 (pt) | 2008-07-11 | 2009-06-25 | Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio, e fluxo de áudio |
BRPI0910811-4A BRPI0910811B1 (pt) | 2008-07-11 | 2009-06-25 | Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio. |
BR122021003097-9A BR122021003097B1 (pt) | 2008-07-11 | 2009-06-25 | Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio, e fluxo de áudio |
BR122021003752-3A BR122021003752B1 (pt) | 2008-07-11 | 2009-06-25 | Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio. |
Country Status (22)
Country | Link |
---|---|
US (9) | US9043203B2 (pt) |
EP (7) | EP4372745A1 (pt) |
JP (2) | JP5622726B2 (pt) |
KR (4) | KR101582057B1 (pt) |
CN (2) | CN102089808B (pt) |
AR (2) | AR072482A1 (pt) |
AT (1) | ATE535903T1 (pt) |
AU (2) | AU2009267459B2 (pt) |
BR (6) | BR122021003726B1 (pt) |
CA (2) | CA2730361C (pt) |
CO (2) | CO6341671A2 (pt) |
EG (1) | EG26480A (pt) |
ES (5) | ES2422412T3 (pt) |
HK (2) | HK1157045A1 (pt) |
MX (2) | MX2011000382A (pt) |
MY (2) | MY178597A (pt) |
PL (3) | PL3246918T3 (pt) |
PT (1) | PT2304719T (pt) |
RU (2) | RU2519069C2 (pt) |
TW (2) | TWI417871B (pt) |
WO (2) | WO2010003556A1 (pt) |
ZA (2) | ZA201100091B (pt) |
Families Citing this family (83)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR122021003726B1 (pt) | 2008-07-11 | 2021-11-09 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio. |
EP2182513B1 (en) * | 2008-11-04 | 2013-03-20 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
US8553897B2 (en) * | 2009-06-09 | 2013-10-08 | Dean Robert Gary Anderson | Method and apparatus for directional acoustic fitting of hearing aids |
US8879745B2 (en) * | 2009-07-23 | 2014-11-04 | Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust | Method of deriving individualized gain compensation curves for hearing aid fitting |
US9101299B2 (en) * | 2009-07-23 | 2015-08-11 | Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust | Hearing aids configured for directional acoustic fitting |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
US9117458B2 (en) * | 2009-11-12 | 2015-08-25 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US8924222B2 (en) | 2010-07-30 | 2014-12-30 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coding of harmonic signals |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US9208792B2 (en) * | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
WO2012037515A1 (en) | 2010-09-17 | 2012-03-22 | Xiph. Org. | Methods and systems for adaptive time-frequency resolution in digital data coding |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
WO2012053150A1 (ja) * | 2010-10-18 | 2012-04-26 | パナソニック株式会社 | 音声符号化装置および音声復号化装置 |
WO2012122303A1 (en) | 2011-03-07 | 2012-09-13 | Xiph. Org | Method and system for two-step spreading for tonal artifact avoidance in audio coding |
US9015042B2 (en) * | 2011-03-07 | 2015-04-21 | Xiph.org Foundation | Methods and systems for avoiding partial collapse in multi-block audio coding |
US9009036B2 (en) | 2011-03-07 | 2015-04-14 | Xiph.org Foundation | Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding |
JP5820487B2 (ja) | 2011-03-18 | 2015-11-24 | フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | オーディオコンテントを表すビットストリームのフレームにおけるフレーム要素位置決め |
EP2705516B1 (en) * | 2011-05-04 | 2016-07-06 | Nokia Technologies Oy | Encoding of stereophonic signals |
AU2012276367B2 (en) * | 2011-06-30 | 2016-02-04 | Samsung Electronics Co., Ltd. | Apparatus and method for generating bandwidth extension signal |
US9875748B2 (en) * | 2011-10-24 | 2018-01-23 | Koninklijke Philips N.V. | Audio signal noise attenuation |
US8942397B2 (en) * | 2011-11-16 | 2015-01-27 | Dean Robert Gary Anderson | Method and apparatus for adding audible noise with time varying volume to audio devices |
JP5942463B2 (ja) * | 2012-02-17 | 2016-06-29 | 株式会社ソシオネクスト | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
US9305567B2 (en) | 2012-04-23 | 2016-04-05 | Qualcomm Incorporated | Systems and methods for audio signal processing |
CN103778918B (zh) * | 2012-10-26 | 2016-09-07 | 华为技术有限公司 | 音频信号的比特分配的方法和装置 |
CN103854653B (zh) * | 2012-12-06 | 2016-12-28 | 华为技术有限公司 | 信号解码的方法和设备 |
AU2014211539B2 (en) * | 2013-01-29 | 2017-04-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Low-complexity tonality-adaptive audio signal quantization |
MX346927B (es) | 2013-01-29 | 2017-04-05 | Fraunhofer Ges Forschung | Énfasis de bajas frecuencias para codificación basada en lpc (codificación de predicción lineal) en el dominio de frecuencia. |
RU2631988C2 (ru) * | 2013-01-29 | 2017-09-29 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Заполнение шумом при аудиокодировании с перцепционным преобразованием |
BR112015019176B1 (pt) * | 2013-04-05 | 2021-02-09 | Dolby Laboratories Licensing Corporation | método e aparelho de expansão de um sinal de áudio, método e aparelho de compressão de um sinal de áudio, e mídia legível por computador |
EP2981961B1 (en) | 2013-04-05 | 2017-05-10 | Dolby International AB | Advanced quantizer |
EP2992605B1 (en) * | 2013-04-29 | 2017-06-07 | Dolby Laboratories Licensing Corporation | Frequency band compression with dynamic thresholds |
EP4290510A3 (en) | 2013-05-24 | 2024-02-14 | Dolby International AB | Audio encoder |
BR112015032013B1 (pt) * | 2013-06-21 | 2021-02-23 | Fraunhofer-Gesellschaft zur Förderung der Angewandten ForschungE.V. | Método e equipamento para a obtenção de coeficientes do espectropara um quadro de substituição de um sinal de áudio, descodificador de áudio,receptor de áudio e sistema para transmissão de sinais de áudio |
WO2014210284A1 (en) * | 2013-06-27 | 2014-12-31 | Dolby Laboratories Licensing Corporation | Bitstream syntax for spatial voice coding |
EP2830064A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
EP2830058A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frequency-domain audio coding supporting transform length switching |
EP2830060A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise filling in multichannel audio coding |
CN105531762B (zh) | 2013-09-19 | 2019-10-01 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
AU2014329890B2 (en) | 2013-10-03 | 2017-10-26 | Dolby Laboratories Licensing Corporation | Adaptive diffuse signal generation in an upmixer |
CN111580772B (zh) * | 2013-10-22 | 2023-09-26 | 弗劳恩霍夫应用研究促进协会 | 用于音频设备的组合动态范围压缩和引导截断防止的构思 |
EP3285254B1 (en) | 2013-10-31 | 2019-04-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal |
PL3336839T3 (pl) | 2013-10-31 | 2020-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem maskowania błędów modyfikującego sygnał pobudzenia w dziedzinie czasu |
WO2015081699A1 (zh) | 2013-12-02 | 2015-06-11 | 华为技术有限公司 | 一种编码方法及装置 |
KR20230042410A (ko) | 2013-12-27 | 2023-03-28 | 소니그룹주식회사 | 복호화 장치 및 방법, 및 프로그램 |
EP4109445A1 (en) * | 2014-03-14 | 2022-12-28 | Telefonaktiebolaget LM Ericsson (PUBL) | Audio coding method and apparatus |
CN111710342B (zh) * | 2014-03-31 | 2024-04-16 | 弗朗霍弗应用研究促进协会 | 编码装置、解码装置、编码方法、解码方法及程序 |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
EP2980801A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals |
EP2980792A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
JPWO2016052191A1 (ja) * | 2014-09-30 | 2017-07-20 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
US20160173808A1 (en) | 2014-12-16 | 2016-06-16 | Psyx Research, Inc. | System and method for level control at a receiver |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
TWI771266B (zh) * | 2015-03-13 | 2022-07-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
WO2016162283A1 (en) * | 2015-04-07 | 2016-10-13 | Dolby International Ab | Audio coding with range extension |
US9454343B1 (en) | 2015-07-20 | 2016-09-27 | Tls Corp. | Creating spectral wells for inserting watermarks in audio signals |
US9311924B1 (en) | 2015-07-20 | 2016-04-12 | Tls Corp. | Spectral wells for inserting watermarks in audio signals |
US9626977B2 (en) | 2015-07-24 | 2017-04-18 | Tls Corp. | Inserting watermarks into audio signals that have speech-like properties |
US10115404B2 (en) | 2015-07-24 | 2018-10-30 | Tls Corp. | Redundancy in watermarking audio signals that have speech-like properties |
IL276591B2 (en) | 2015-10-08 | 2023-09-01 | Dolby Int Ab | Layered coding for voice or compressed sound field representations |
CA3228629A1 (en) | 2015-10-08 | 2017-04-13 | Dolby International Ab | Layered coding and data structure for compressed higher-order ambisonics sound or sound field representations |
US10142743B2 (en) | 2016-01-01 | 2018-11-27 | Dean Robert Gary Anderson | Parametrically formulated noise and audio systems, devices, and methods thereof |
EP3208800A1 (en) * | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
AU2017219696B2 (en) * | 2016-02-17 | 2018-11-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing |
US10146500B2 (en) | 2016-08-31 | 2018-12-04 | Dts, Inc. | Transform-based audio codec and method with subband energy smoothing |
EP3382703A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and methods for processing an audio signal |
EP3396670B1 (en) * | 2017-04-28 | 2020-11-25 | Nxp B.V. | Speech signal processing |
WO2019081070A1 (en) * | 2017-10-27 | 2019-05-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | APPARATUS, METHOD, OR COMPUTER PROGRAM PRODUCT FOR GENERATING ENHANCED BANDWIDTH AUDIO SIGNAL USING NEURAL NETWORK PROCESSOR |
WO2019091576A1 (en) * | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
US11694708B2 (en) * | 2018-09-23 | 2023-07-04 | Plantronics, Inc. | Audio device and method of audio processing with improved talker discrimination |
US11264014B1 (en) * | 2018-09-23 | 2022-03-01 | Plantronics, Inc. | Audio device and method of audio processing with improved talker discrimination |
WO2020073148A1 (en) * | 2018-10-08 | 2020-04-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Transmission power determination for an antenna array |
WO2020164751A1 (en) * | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment |
EP3939035A4 (en) * | 2019-03-10 | 2022-11-02 | Kardome Technology Ltd. | LANGUAGE IMPROVEMENT USING CLUSTERING OF HINTS |
WO2020207593A1 (en) * | 2019-04-11 | 2020-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program |
US20200402522A1 (en) * | 2019-06-24 | 2020-12-24 | Qualcomm Incorporated | Quantizing spatial components based on bit allocations determined for psychoacoustic audio coding |
US11361776B2 (en) | 2019-06-24 | 2022-06-14 | Qualcomm Incorporated | Coding scaled spatial components |
US11538489B2 (en) | 2019-06-24 | 2022-12-27 | Qualcomm Incorporated | Correlating scene-based audio data for psychoacoustic audio coding |
CN112037802B (zh) * | 2020-05-08 | 2022-04-01 | 珠海市杰理科技股份有限公司 | 基于语音端点检测的音频编码方法及装置、设备、介质 |
US11545172B1 (en) * | 2021-03-09 | 2023-01-03 | Amazon Technologies, Inc. | Sound source localization using reflection classification |
CN114900246B (zh) * | 2022-05-25 | 2023-06-13 | 中国电子科技集团公司第十研究所 | 噪声基底估计方法、装置、设备及存储介质 |
Family Cites Families (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4703505A (en) * | 1983-08-24 | 1987-10-27 | Harris Corporation | Speech data encoding scheme |
US4956871A (en) * | 1988-09-30 | 1990-09-11 | At&T Bell Laboratories | Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands |
JPH0934493A (ja) | 1995-07-20 | 1997-02-07 | Graphics Commun Lab:Kk | 音響信号符号化装置、音響信号復号装置および音響信号処理装置 |
US6092041A (en) | 1996-08-22 | 2000-07-18 | Motorola, Inc. | System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder |
US5797120A (en) * | 1996-09-04 | 1998-08-18 | Advanced Micro Devices, Inc. | System and method for generating re-configurable band limited noise using modulation |
US5924064A (en) * | 1996-10-07 | 1999-07-13 | Picturetel Corporation | Variable length coding using a plurality of region bit allocation patterns |
US5960389A (en) * | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
US6167133A (en) * | 1997-04-02 | 2000-12-26 | At&T Corporation | Echo detection, tracking, cancellation and noise fill in real time in a communication system |
US6240386B1 (en) | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
US7124079B1 (en) | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
RU2237296C2 (ru) * | 1998-11-23 | 2004-09-27 | Телефонактиеболагет Лм Эрикссон (Пабл) | Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения |
JP3804902B2 (ja) | 1999-09-27 | 2006-08-02 | パイオニア株式会社 | 量子化誤差補正方法及び装置並びにオーディオ情報復号方法及び装置 |
FI116643B (fi) * | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
DE60233032D1 (de) * | 2001-03-02 | 2009-09-03 | Panasonic Corp | Audio-kodierer und audio-dekodierer |
US6876968B2 (en) | 2001-03-08 | 2005-04-05 | Matsushita Electric Industrial Co., Ltd. | Run time synthesizer adaptation to improve intelligibility of synthesized speech |
KR100871999B1 (ko) * | 2001-05-08 | 2008-12-05 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
JP4506039B2 (ja) | 2001-06-15 | 2010-07-21 | ソニー株式会社 | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
KR100462611B1 (ko) * | 2002-06-27 | 2004-12-20 | 삼성전자주식회사 | 하모닉 성분을 이용한 오디오 코딩방법 및 장치 |
JP4218271B2 (ja) * | 2002-07-19 | 2009-02-04 | ソニー株式会社 | データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体 |
DE10236694A1 (de) | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
KR100477699B1 (ko) * | 2003-01-15 | 2005-03-18 | 삼성전자주식회사 | 양자화 잡음 분포 조절 방법 및 장치 |
WO2005004113A1 (ja) * | 2003-06-30 | 2005-01-13 | Fujitsu Limited | オーディオ符号化装置 |
ATE391988T1 (de) * | 2003-10-10 | 2008-04-15 | Agency Science Tech & Res | Verfahren zum codieren eines digitalen signals in einen skalierbaren bitstrom, verfahren zum decodieren eines skalierbaren bitstroms |
US7723474B2 (en) | 2003-10-21 | 2010-05-25 | The Regents Of The University Of California | Molecules that selectively home to vasculature of pre-malignant dysplastic lesions or malignancies |
US7436786B2 (en) * | 2003-12-09 | 2008-10-14 | International Business Machines Corporation | Telecommunications system for minimizing the effect of white noise data packets for the generation of required white noise on transmission channel utilization |
JP2005202248A (ja) * | 2004-01-16 | 2005-07-28 | Fujitsu Ltd | オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路 |
DE102004007200B3 (de) | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
US7613306B2 (en) * | 2004-02-25 | 2009-11-03 | Panasonic Corporation | Audio encoder and audio decoder |
ES2291877T3 (es) | 2004-05-17 | 2008-03-01 | Nokia Corporation | Codificacion de audio con diferentes modelos de codificacion. |
US7649988B2 (en) | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US7873515B2 (en) * | 2004-11-23 | 2011-01-18 | Stmicroelectronics Asia Pacific Pte. Ltd. | System and method for error reconstruction of streaming audio information |
KR100707173B1 (ko) | 2004-12-21 | 2007-04-13 | 삼성전자주식회사 | 저비트율 부호화/복호화방법 및 장치 |
US7885809B2 (en) * | 2005-04-20 | 2011-02-08 | Ntt Docomo, Inc. | Quantization of speech and audio coding parameters using partial information on atypical subsequences |
RU2419171C2 (ru) * | 2005-07-22 | 2011-05-20 | Франс Телеком | Способ переключения скорости передачи битов при аудиодекодировании с масштабированием скорости передачи битов и масштабированием полосы пропускания |
JP4627737B2 (ja) * | 2006-03-08 | 2011-02-09 | シャープ株式会社 | デジタルデータ復号化装置 |
WO2007122614A2 (en) * | 2006-04-21 | 2007-11-01 | Galtronics Ltd. | Twin ground antenna |
JP4380669B2 (ja) * | 2006-08-07 | 2009-12-09 | カシオ計算機株式会社 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム |
US7275936B1 (en) * | 2006-09-22 | 2007-10-02 | Lotes Co., Ltd. | Electrical connector |
US8275611B2 (en) * | 2007-01-18 | 2012-09-25 | Stmicroelectronics Asia Pacific Pte., Ltd. | Adaptive noise suppression for digital speech signals |
EP2116997A4 (en) * | 2007-03-02 | 2011-11-23 | Panasonic Corp | AUDIO DECODING DEVICE AND AUDIO DECODING METHOD |
ES2858423T3 (es) | 2007-08-27 | 2021-09-30 | Ericsson Telefon Ab L M | Método y dispositivo para el llenado de huecos espectrales |
US9269372B2 (en) | 2007-08-27 | 2016-02-23 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive transition frequency between noise fill and bandwidth extension |
US8554550B2 (en) * | 2008-01-28 | 2013-10-08 | Qualcomm Incorporated | Systems, methods, and apparatus for context processing using multi resolution analysis |
BR122021003726B1 (pt) * | 2008-07-11 | 2021-11-09 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio. |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
WO2012053150A1 (ja) | 2010-10-18 | 2012-04-26 | パナソニック株式会社 | 音声符号化装置および音声復号化装置 |
-
2009
- 2009-06-25 BR BR122021003726-4A patent/BR122021003726B1/pt active IP Right Grant
- 2009-06-25 JP JP2011516991A patent/JP5622726B2/ja active Active
- 2009-06-25 CN CN200980127118.8A patent/CN102089808B/zh active Active
- 2009-06-25 BR BR122021003142-8A patent/BR122021003142B1/pt active IP Right Grant
- 2009-06-25 RU RU2011104006/08A patent/RU2519069C2/ru active
- 2009-06-25 EP EP24167780.6A patent/EP4372745A1/en active Pending
- 2009-06-25 BR BRPI0910811-4A patent/BRPI0910811B1/pt active IP Right Grant
- 2009-06-25 MY MYPI2011000098A patent/MY178597A/en unknown
- 2009-06-25 KR KR1020147004791A patent/KR101582057B1/ko active IP Right Grant
- 2009-06-25 ES ES11157188T patent/ES2422412T3/es active Active
- 2009-06-25 WO PCT/EP2009/004602 patent/WO2010003556A1/en active Application Filing
- 2009-06-25 PL PL17175883.2T patent/PL3246918T3/pl unknown
- 2009-06-25 PL PL09776839T patent/PL2304719T3/pl unknown
- 2009-06-25 PT PT97768394T patent/PT2304719T/pt unknown
- 2009-06-25 KR KR1020117000768A patent/KR101518532B1/ko active IP Right Grant
- 2009-06-25 EP EP24167758.2A patent/EP4372744A1/en active Pending
- 2009-06-25 EP EP24167799.6A patent/EP4375998A1/en active Pending
- 2009-06-25 ES ES11157204.6T patent/ES2526767T3/es active Active
- 2009-06-25 EP EP23178772.2A patent/EP4235660A3/en active Pending
- 2009-06-25 MX MX2011000382A patent/MX2011000382A/es active IP Right Grant
- 2009-06-25 BR BR122021003097-9A patent/BR122021003097B1/pt active IP Right Grant
- 2009-06-25 KR KR1020157036527A patent/KR101706009B1/ko active IP Right Grant
- 2009-06-25 EP EP17175883.2A patent/EP3246918B1/en active Active
- 2009-06-25 ES ES09776839.4T patent/ES2642906T3/es active Active
- 2009-06-25 AU AU2009267459A patent/AU2009267459B2/en active Active
- 2009-06-25 ES ES17175883T patent/ES2955669T3/es active Active
- 2009-06-25 CA CA2730361A patent/CA2730361C/en active Active
- 2009-06-25 EP EP09776839.4A patent/EP2304719B1/en active Active
- 2009-06-25 BR BR122021003752-3A patent/BR122021003752B1/pt active IP Right Grant
- 2009-06-26 KR KR1020117000435A patent/KR101251790B1/ko active IP Right Grant
- 2009-06-26 CA CA2730536A patent/CA2730536C/en active Active
- 2009-06-26 MY MYPI2011000076A patent/MY155785A/en unknown
- 2009-06-26 BR BRPI0910522-0A patent/BRPI0910522A2/pt not_active Application Discontinuation
- 2009-06-26 WO PCT/EP2009/004653 patent/WO2010003565A1/en active Application Filing
- 2009-06-26 AT AT09776859T patent/ATE535903T1/de active
- 2009-06-26 PL PL09776859T patent/PL2304720T3/pl unknown
- 2009-06-26 JP JP2011516997A patent/JP5307889B2/ja active Active
- 2009-06-26 ES ES09776859T patent/ES2374640T3/es active Active
- 2009-06-26 CN CN2009801270908A patent/CN102089806B/zh active Active
- 2009-06-26 MX MX2011000359A patent/MX2011000359A/es active IP Right Grant
- 2009-06-26 RU RU2011102410/08A patent/RU2512103C2/ru active
- 2009-06-26 AU AU2009267468A patent/AU2009267468B2/en active Active
- 2009-06-26 EP EP09776859A patent/EP2304720B1/en active Active
- 2009-06-30 TW TW098122013A patent/TWI417871B/zh active
- 2009-07-02 TW TW098122400A patent/TWI492223B/zh active
- 2009-07-07 AR ARP090102551 patent/AR072482A1/es active IP Right Grant
- 2009-07-13 AR ARP090102626A patent/AR072497A1/es active IP Right Grant
-
2011
- 2011-01-04 ZA ZA2011/00091A patent/ZA201100091B/en unknown
- 2011-01-04 ZA ZA2011/00085A patent/ZA201100085B/en unknown
- 2011-01-07 CO CO11001536A patent/CO6341671A2/es active IP Right Grant
- 2011-01-10 EG EG2011010058A patent/EG26480A/en active
- 2011-01-11 US US13/004,508 patent/US9043203B2/en active Active
- 2011-01-11 US US13/004,493 patent/US8983851B2/en active Active
- 2011-01-13 CO CO11003109A patent/CO6280569A2/es active IP Right Grant
- 2011-10-03 HK HK11110436.8A patent/HK1157045A1/xx unknown
-
2012
- 2012-01-19 HK HK12100643.7A patent/HK1160285A1/xx unknown
-
2014
- 2014-01-16 US US14/157,185 patent/US9449606B2/en active Active
- 2014-12-24 US US14/582,828 patent/US9711157B2/en active Active
-
2016
- 2016-09-15 US US15/266,862 patent/US10629215B2/en active Active
-
2017
- 2017-07-07 US US15/643,908 patent/US11024323B2/en active Active
-
2021
- 2021-05-17 US US17/322,656 patent/US11869521B2/en active Active
-
2023
- 2023-11-29 US US18/522,732 patent/US20240096337A1/en active Pending
- 2023-11-29 US US18/522,762 patent/US20240096338A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BRPI0910522A2 (pt) | preenchedor de ruídos, calculador do parâmetro de preenchimento de ruído, método para prover um parâmetro de preenchimento de ruído, método para prover uma representação espectral com preenchimento de ruído de um sinal de áudio, correspondente programa de computador e sinal codificado de áudio | |
ES2612516T3 (es) | Método y dispositivo de codificación y decodificación de señal de audio | |
KR101341246B1 (ko) | 수정된 이산 코사인 변환 오디오 코더에 대한 대역폭 확장 방법 및 장치 | |
RU2631988C2 (ru) | Заполнение шумом при аудиокодировании с перцепционным преобразованием | |
ES2942867T3 (es) | Procesamiento de señales de audio durante la reconstrucción de alta frecuencia | |
TWI415115B (zh) | 用以產生帶寬擴展輸出資料之裝置與方法 | |
US8831959B2 (en) | Transform audio codec and methods for encoding and decoding a time segment of an audio signal | |
US11521628B2 (en) | Apparatus and method for encoding an audio signal using compensation values between three spectral bands | |
BRPI0715516A2 (pt) | sistemas, mÉtodos e equipamentos para limitar fator de ganho | |
BR112014021054A2 (pt) | controle de coerência de fase para sinais harmônicos nos codecs de áudio perceptuais | |
US20100250260A1 (en) | Encoder | |
JP2008518264A (ja) | 振幅の包絡線を有するパラメトリックオーディオコーディング | |
US20100280830A1 (en) | Decoder | |
Chiu et al. | Quad‐band excitation for low bit rate speech coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06U | Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette] | ||
B06A | Patent application procedure suspended [chapter 6.1 patent gazette] | ||
B09B | Patent application refused [chapter 9.2 patent gazette] | ||
B12B | Appeal against refusal [chapter 12.2 patent gazette] | ||
B350 | Update of information on the portal [chapter 15.35 patent gazette] |