BRPI0910522A2 - preenchedor de ruídos, calculador do parâmetro de preenchimento de ruído, método para prover um parâmetro de preenchimento de ruído, método para prover uma representação espectral com preenchimento de ruído de um sinal de áudio, correspondente programa de computador e sinal codificado de áudio - Google Patents

preenchedor de ruídos, calculador do parâmetro de preenchimento de ruído, método para prover um parâmetro de preenchimento de ruído, método para prover uma representação espectral com preenchimento de ruído de um sinal de áudio, correspondente programa de computador e sinal codificado de áudio Download PDF

Info

Publication number
BRPI0910522A2
BRPI0910522A2 BRPI0910522-0A BRPI0910522A BRPI0910522A2 BR PI0910522 A2 BRPI0910522 A2 BR PI0910522A2 BR PI0910522 A BRPI0910522 A BR PI0910522A BR PI0910522 A2 BRPI0910522 A2 BR PI0910522A2
Authority
BR
Brazil
Prior art keywords
spectral
noise
quantized
representation
zero
Prior art date
Application number
BRPI0910522-0A
Other languages
English (en)
Inventor
Nikolaus Rettelbach
Jens. Hirschfeld
Bernhard. Grill
Guillaume. Fuchs
Stefan. Geyersberger
Markus. Multrus
Harald. Popp
Jürgen. Herre
Stefan. Wabnik
Gerald. Schuller
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=40941986&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BRPI0910522(A2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Publication of BRPI0910522A2 publication Critical patent/BRPI0910522A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Abstract

PREENCHEDOR DE RUÍDOS, CALCULADORA DO PARÂMETRO DE PREENCHIMENTO DE RUÍDO, MÉTODO PARA PROVER UM PARÂMETRO DE PREENCHIMENTO DE RUÍDO, MÉTODO PARA PROVER UMA REPRESENTAÇÃO ESPECTRAL COM PREENCHIMENTO DE RUÍDO DE UM SINAL DE ÁUDIO, CORRESPONDENTE PROGRAMA DE COMPUTADOR E SINAL CODIFICADO DE ÁUDIO. Preenchedor de ruídos para prover uma representação espectral com preenchimento de ruído de um sinal de áudio com base em uma representação espectral de entrada do sinal de áudio, com um calculador do parâmetro de preenchimento de ruído para prover um parâmetro de preenchimento de ruído com base em uma representação espectral quantizada de um sinal de áudio, com uma representação do sinal de áudio codificado representando um sinal de áudio, com um método para prover uma representação espectral com preenchimento de ruído de um sinal de áudio, com um método para prover um parâmetro de preenchimento de ruído com base em uma representação espectral quantizada de um sinal de áudio, e com programas de computadores para a implementação dos referidos métodos .

Description

2. | 7? rs “PREENCHEDOR DE RUÍDOS, CALCULADOR DO PARÂMETRO DE PREENCHIMENTO DE RUÍDO, MÉTODO PARA PROVER UM PARÂMETRO DE PREENCHIMENTO DE RUÍDO, MÉTODO PARA PROVER UMA REPRESENTAÇÃO ESPECTRAL COM PREENCHIMENTO DE RUÍDO DE UM SINAL DE ÁUDIO, CORRESPONDENTE PROGRAMA DE COMPUTADOR E SINAL CODIFICADO DE ÁUDIO”
HISTÓRICO DA INVENÇÃO As configurações se relacionam de acordo com a ' invenção com um preenchedor de ruídos para prover uma ç representação espectral com preenchimento de ruído de um sinal de áudio com base em uma representação espectral de entrada do sinal de áudio, com um calculador do parâmetro de preenchimento de ruído s para prover um parâmetro de preenchimento de ruído com base em uma = representação espectral quantizada de um sinal-de-áudio, com uma -——- representação do sinal de áudio codificado representando um sinal de áudio, com um método para prover uma representação espectral com presnohimento de ruído de um sinal de áudio, com um método s para prover um parâmetro de preenchimento de ruído com base em uma ? representação espectral quantizada de um sinal de áudio, e com programas de computadores para a implementação dos referidos métodos. A seguir, serão descritos alguns cenários em que podem ser aplicadas com vantagens as configurações de acordo com a invenção. Muitos codificadores de sinal de áudio no domínio da frequência se baseiam na ideia que algumas regiões de frequência ou regiões espectrais (ex., linhas de frequência ou linhas espectrais providas por uma conversão do domínio do tempo para o domínio da frequência), são mais importantes que outras regiões espectrais. Assim, regiões espectrais de alta relevância
+ A 2 é psicoacústica são tipicamente codificadas com maior precisão que regiões espectrais de baixa relevância psicoacústica.
A relevância psicoacústica das diferentes regiões espectrais pode, por exemplo, ser calculada usando um modelo psicoacústico que leva em conta o mascaramento de regiões espectrais mais fracas por meio de fortes picos espectrais adjacentes.
Caso for desejado reduzir a taxa de bits de um ' sinal codificado de áudio para um baixo nível, algumas regiões : espectrais são quantizadas com muito baixa precisão (ex., com precisão de somente um bit, ou precisão de dois bits). Assim, muitas das regiões espectrais quantizadas com baixa precisão são R quantizadas para zero.
Assim, em baixas taxas de bits, * codificadores-de áudio baseados em transformadas estão propensos a - diferentes problemas e especialmente a problemas que se originam 15º das linhas de frequência quantizadas em zero.
Realmente, a quantização grosseira de valores espectrais em codificação de . áudio com baixa taxa de bits pode conduzir a espectros muito esparsos após a quantização inversa, já que muitas linhas e espectrais podem ter sido quantizadas para zero.
Esses buracos de frequência no sinal reconstruído produzem indesejáveis problemas sonoros.
Podem tornar o som reproduzido muito agudo ou instável (birdies) quando os buracos de frequência nos espectros se movem de quadro a quadro.
O preenchimento de ruído é um meio para mascarar esses problemas por meio do preenchimento, no lado do decodificador, com coeficientes ou bandas quantizadas em zero ou bandas com um ruído randômico.
A energia do ruído inserido é um parâmetro computado e transmitido pelo codificador.
« a 3 São conhecidos diferentes conceitos de preenchimento de ruído. Por exemplo, o denominado AMR-WR+ combina o preenchimento de ruído e uma Transformada Discreta de Fourier (DFT), como descrita, por exemplo, na referência [1]. Além disso, o Padrão Internacional ITU-T G.729.1 define um conceito que combina o preenchimento de ruído com a transformada discreta de cosseno “modificada (MDCT). Os detalhes são descritos na : referência [2]. : Outros aspectos referentes ao preenchimento de ruído são descritos no Pedido Internacional de Patente PCT/IB2002/001388 por Koninklijke Philips Electronics N.V. (ver 2 referência [3])' ee Não obstante, os -conceitos -de- preenchiménto — convencional de ruído resultam em distorções audíveis. Com vista nesta discussão, existe o desejo de ' criar um conceito de DrGSNCNiMADTO de ruído que proporcione uma . melhor impressão auditiva.
SUMÁRIO DA INVENÇÃO Uma configuração de acordo com a invenção cria um preenchedor de ruídos para prover uma representação espectral com preenchimento de ruído de um sinal de áudio com base em uma representação espectral de entrada do sinal de áudio. o preenchedor de ruídos compreende um identificador de região espectral configurado para identificar regiões espectrais (ex., linhas espectrais, ou bins espectrais) da representação espectral de entrada espaçada das regiões espectrais diferentes de zero (ex., linhas espectrais ou bins espectrais) da representação espectral de entrada por pelo menos uma região espectral e 4 é intermediária, para obter regiões espectrais identificadas. O preenchedor de ruídos também compreende um insersor de ruído configurado para seletivamente introduzir ruído nas regiões espectrais identificadas (ex., linhas espectrais ou bins espectrais) para obter a representação espectral com preenchimento de ruído do sinal de áudio.
Esta configuração da presente invenção se baseia ' no achado que componentes tonais da representação espectral de um : sinal de áudio são tipicamente degradadas, em termos da impressão auditiva, caso um preenchimento de ruído seja aplicado na vizinhança imediata dessas componentes .“tonais. Assim, foi R determinado que uma melhor impressão auditiva de um sinal de - e — áudio . com. preenchimento de ruídos pode >-ser obtida” se” o” preenchimento de ruído for somente aplicado às regiões espectrais que forem espaçadas dessas regiões espectrais tonais diferentes - de zero. Assim, as componentes tonais do espectro do sinal de . áudio (que não são quantizadas em zero na entrada da representação espectral quantizada no preenchedor de ruídos) º permanecem audíveis (isto é, não se tornam contaminadas pelo ruído adjacente próximo), enquanto a presença de grandes buracos espectrais é ainda evitada de maneira eficiente.
Em uma configuração preferida, o identificador de região espectral é configurado para identificar linhas espectrais da representação espectral de entrada, que são quantizadas em zero e que compreendem pelo menos um primeiro número predeterminado de linhas espectrais vizinhas de menor frequência quantizadas em zero e pelo menos um segundo número predeterminado de linhas espectrais de maior frequência
+ é 5 quantizadas em zero, como regiões espectrais identificadas, onde o primeiro número predeterminado é maior ou igual a um e onde o segundo número predeterminado é maior ou igual a um. Nesta configuração, o insersor de ruído é configurado para seletivamente introduzir ruído nas linhas espectrais identificadas, enquanto deixa as linhas espectrais quantizadas em um valor diferente de zero e linhas espectrais quantizadas em : zero, mas não tendo o primeiro número predeterminado de linhas s espectrais vizinhas de menor frequência quantizadas em zero, ou o segundo número predeterminado de linhas espectrais vizinhas de maior frequência quantizadas em zero não afetadas pelo . preenchimento de ruído. Assim, o preenchimento de ruído é co Seletivo, já .que. o ruído -é- somente “introduzido nãs Tinhaãs = espectrais que são quantizadas em zero e que são espaçadas das linhas quantizadas em um valor diferente de zero, ambas em uma direção espectral para cima e uma direção espectral para baixo, s por exemplo, pelo primeiro número predeterminado de linhas espectrais vizinhas de menor frequência quantizadas em zero e
E pelo segundo número predeterminado de linhas espectrais vizinhas de maior frequência quantizadas em zero.
Em uma configuração preferida, o primeiro número predeterminado é igual ao segundo número predeterminado, de maneira que um espaçamento mínimo na direção da frequência superior das linhas quantizadas para um valor diferente de zero seja igual a um espaçamento mínimo na direção da frequência inferior das linhas quantizadas para um valor diferente de zero.
Em uma configuração preferida, o preenchedor de ruídos é configurado para introduzir somente ruído nas regiões
+ é $ espectrais em uma porção superior da representação espectral do sinal de áudio, deixando não afetada uma porção inferior da representação espectral do sinal de áudio pelo preenchimento de ruído.
Esse conceito é útil, já que normalmente maiores frequências são menos perceptualmente importantes que as baixas frequências.
Os valores quantizados em zero também ocorrem principalmente na segunda metade dos espectros (isto é, para : altas frequências). Também a adição de ruído nas altas : frequências tem menos possibilidade de obter uma restituição final sonora ruidosa.
Em uma configuração preferida, o identificador R de região espectral é configurado para somar valores quantizados — , e intensidade (ex., valores de energia-ou valores de âmpiitude) de regiões espectrais em uma vizinhança espectral predeterminada 15º bilateral de uma dada região espectral (isto é, uma vizinhança espectral que se estende tanto na direção das frequências mais “ baixas como das mais altas), para obter um valor somado, e avaliar o valor somado para decidir se a dada região espectral é uma : região espectral identificada ou não.
Foi determinado que o valor : somado das energias de um espectro quantizado com relação a uma vizinhança espectral bilateral de uma dada região espectral é uma quantidade significativa para a decisão de se o preenchimento de ruído deve ser aplicado a uma dada região espectral.
Em outra configuração preferida, o identificador de região espectral é configurado para varrer uma faixa de regiões espectrais da representação espectral de entrada para detectar sequências contíguas de regiões espectrais quantizadas em zero, € reconhecer uma ou mais regiões espectrais centrais (isto éÉ,
Õ regiões espectrais não divisórias) dessas sequências contíguas detectadas como regiões espectrais identificadas.
Foi determinado que uma detecção de um determinado "comprimento de operação" das regiões espectrais quantizadas em zero, é uma tarefa que pode ser implementada com complexidade computacional particularmente baixa. Para identificar essa sequência contígua de regiões espectrais, é possível decidir ' se todas as regiões espectrais dentro desta sequência de regiões ? espectrais são quantizadas em zero, o que pode ser feito usando um algoritmo ou circuito relativamente simples. Caso seja determinado que esta sequência contígua de regiões espectrais é quantizada em . zero, uma ou mais das regiões espectrais internas da sequência o (que são espaçadas suficientemente longe dãs regiões espectrais = fora da presente sequência de regiões espectrais) são tratadas como regiões espectrais identificadas. Assim, varrendo .uma faixa de regiões espectrais (ex., selecionando subsequentemente . diferentes sequências deslocadas de regiões espectrais), pode ser feita uma eficiente análise da representação espectral, para ' identificar regiões espectrais quantizadas em zero e espaçadas das regiões espectrais quantizadas em um valor diferente de zero por uma distância mínima predeterminada.
Outra configuração de acordo com a invenção cria um calculador do parâmetro de preenchimento de ruído para prover um parâmetro de preenchimento de ruído com base em uma representação espectral quantizada de um sinal de áudio. O calculador do parâmetro de preenchimento de ruído compreende um identificador de região espectral configurado para identificar regiões espectrais da representação espectral quantizada espaçada sé 8 de regiões espectrais diferentes de zero da representação espectral “quantizada por pelo menos uma região espectral intermediária, para obter regiões espectrais identificadas.
O calculador do parâmetro de preenchimento de ruído também compreende um calculador de valor de ruído configurado para considerar seletivamente os erros de quantização das regiões espectrais identificadas para o cálculo do parâmetro de ' preenchimento de ruído.
O calculador do parâmetro de preenchimento r de ruído se baseia na ideia principal de que é desejável restringir um preenchimento de ruído do lado do decodificador nas regiões espectrais que são espaçadas das regiões espectrais tonais . (quantizadas em um valor diferente de zero), e que como BR consequência o, parâmetro de ruído deve ser calêulado no lado do | codificador, levando em consideração este conceito.
Assim, é 15º obtido um parâmetro de preenchimento de ruído particularmente bem “adaptado para o conceito de decodificador supramencionado.
Foi . também determinado que regiões espectrais que são quantizadas em zero, mas que são muito próximas às regiões espectrais quantizadas ó em um valor diferente de zero, geralmente não refletem a um teor de áudio verdadeiramente tipo ruído, mas fortemente correlacionado com a região espectral tonal adjacente (quantizada para um valor diferente de zero). Assim, foi determinado ser geralmente indesejável “considerar o erro de quantização das regiões espectrais, que estiverem próximas às regiões espectrais quantizadas em um valor diferente de zero para o cálculo de um parâmetro de preenchimento de ruído, porque isto resultaria normalmente em uma forte superestimativa do ruído, resultando assim em uma representação espectral reconstruída muito ruidosa.
s 9 é Assim, o conceito de cálculo do parâmetro de preenchimento de ruído descrito na presente pode ser usado em combinação com o conceito de preenchimento de ruído supramencionado e até em combinação com conceitos convencionais de preenchimento de ruído. Em configurações preferidas, o conceito para a identificação de regiões espectrais que tiver sido discutido com ' relação ao preenchedor de ruídos, também pode ser aplicado em v combinação com o calculador do parâmetro de preenchimento de ruído. Em ainda outra configuração preferida, o . calculador de valor de ruído é configurado para considerar uma energia real do erro de. quantização "das" Fegides Espectrais identificadas para o cálculo do parâmetro de preenchimento de 15º ruído. Foi determinado que a consideração , de, um .erro .real. de -- VU quantização tao invés de um erro de quantização estimado ou de um . erro médio de quantização) traz normalmente consigo melhores resultados, porque o erro real de quantização normalmente se i desvia do erro de quantização estatisticamente esperado.
Em ainda outra configuração preferida, o calculador de valor de ruído é configurado para realçar uma energia não tonal do erro de quantização distribuída em uma pluralidade de regiões espectrais identificadas em relação à uma energia tonal do erro de quantização concentrada em uma única região espectral. Este conceito se baseia no achado que um ruído não tonal de banda larga, uma energia média a qual se situa abaixo um limite de quantização e que é, portanto, quantizada em zero, é perceptualmente muito mais relevante para o preenchedor de ruídos
. 10 + que uma única componente tonal de áudio, uma intensidade que se situa abaixo do limite de quantização, mesmo se o ruído não tonal de banda larga quantizado em zero e a componente tonal quantizada em zero fossem ambas quantizadas em zero. O motivo é que O preenchedor de ruídos pela geração de um ruído randômico no decodificador possa modelar o ruído não tonal de banda larga faltante na representação espectral quantizada, mas não as ' componentes .“tonais faltantes. Assim, uma ênfase sobre as " componentes não tonais de ruído quantizadas em zero com relação às componentes tonais quantizadas em zero, traz consigo uma reconstrução sonora mais realista. Isto também se deve ao fato . que a impressão auditiva humana é muito mais degradada pela presença de um buraco .espectral -(ex.,' na forma de ausência de um o ruído de banda larga quantizado em zero) que pela ausência de um pequeno pico espectral quantizado em Zero. . Uma componente -tonal - * - OS o pode ser concentrada em uma simples linha espectral, ou pode se . espalhar por várias linhas espectrais contíguas (por exemplo, i,i+tl). A região espectral pode, por exemplo, compreender uma ou : mais linhas espectrais.
Em uma configuração preferida, o calculador de valor de ruído é configurado para calcular a soma de energias logaritmizadas de erros de quantização das regiões espectrais identificadas para obter o parâmetro de preenchimento de ruído. Calculando a soma das energias logaritmizadas de erros de quantização das regiões espectrais identificadas, a ênfase relativa supramencionada das regiões espectrais não tonais quantizadas em zero com relação às regiões tonais quantizadas em zero, pode ser obtida de maneira eficiente.
“ Outra configuração de acordo com a invenção cria uma representação do sinal de áudio codificado, para a representação de um sinal de áudio.
A representação do sinal de áudio codificado compreende uma representação do domínio espectral quantizado codificado do sinal de áudio e um parâmetro de preenchimento de ruído codificado. o parâmetro de preenchimento de ruído representa um erro de quantização das ' regiões espectrais da representação no domínio espectral + quantizado em zero e espaçado das regiões espectrais da representação no domínio espectral quantizadas em um valor diferente de zero por pelo menos um número predeterminado de . regiões espectrais intermediárias.
A representação do sinal de 20 .- áudio -codificado supramencionada é “usada pelo T“preenchedor de o ruídos supramencionado e pode ser obtida usando o calculador do parâmetro de — preenchimento de ruído acima discutido.
A RSS representação do sinal de áudio codificado permite a reconstrução . do sinal de áudio com qualidade de áudio particularmente boa, porque o parâmetro de preenchimento de ruído seletivamente i reflete o erro de quantização da representação quantizada no domínio espectral dessas regiões espectrais em que existem significativas informações de ruído e que devem ser seletivamente consideradas para o preenchimento de ruídos no lado do decodificador.
Outra configuração de acordo com a invenção cria um método para prover uma representação com preenchimento de ruídos de um sinal de áudio.
Ainda outra configuração de acordo com a invenção cria um método para prover um parâmetro de preenchimento
« 12 de ruídos com base em uma representação espectral quantizada de um sinal de áudio. ' Ainda outra configuração de acordo com a invenção cria um programa de computador para a implementação dos métodos supramencionados.
BREVE DESCRIÇÃO DAS FIGURAS Serão subsequentemente descritas configurações de " acordo com a invenção, com referência às figuras anexas, onde: . A Fig. l1 mostra um diagrama esquemático de blocos de um preenchedor de ruídos, de acordo com uma configuração da invenção; . A Fig. 2 mostra um diagrama esquemático de 1 . blocos. de um decodificador de sinal de áúdio que compreende o o preenchedor de ruídos de acordo com a presente invenção; A Fig. 3 mostra um pseudo-código.de “programas - " para a implementação da funcionalidade do preenchedor de ruídos . da Fig. 1; A Fig. 4 mostra uma representação gráfica de uma identificação de regiões espectrais, que pode ser feita no preenchedor de ruídos de acordo com a Fig. 1; A Fig. 5 mostra um diagrama esquemático de blocos de um calculador do parâmetro de preenchimento de ruído de acordo com uma configuração da invenção; A Fig. 6 mostra um pseudo-código de programas para à implementação da funcionalidade do calculador do parâmetro de preenchimento de ruído de acordo com a Fig. 5; A Fig. 7 mostra um fluxograma de um método para prover uma representação espectral com preenchimento de ruído de
: 13 um sinal de áudio com base em uma representação espectral de entrada do sinal de áudio; A Fig. 8 mostra um fluxograma de um método para prover um parâmetro de preenchimento de ruídos com base em uma representação espectral quantizada de um sinal de áudio; e A Fig. 9 mostra a representação gráfica de uma representação de sinal de áudio, de acordo com uma configuração : da invenção. + Preenchedor de ruídos de acordo com as Figs. 1-4 A Fig. 1 mostra um diagrama esquemático de blocos de um preenchedor de ruídos 100, de acordo com uma R configuração da invenção. O preenchedor de ruídos 100 é - — configurado .para receber uma- representação Eéspectral de entrada o 110 de um sinal de áudio, por exemplo, na forma de coeficientes espectrais decodificados (que podem, por exemplo, ser quantizados o ou quantizados inversamente). O preenchedor de ruídos 100 é . também “configurado prover uma representação espectral com preenchimento de ruído 112 do sinal de áudio com base na : representação espectral de entrada 110.
O preenchedor de ruídos 100 compreende um identificador de região espectral 120, que é configurado para identificar regiões espectrais da representação espectral de entrada 110 espaçadas das regiões espectrais da representação espectral de entrada diferente de zero 110 por pelo menos uma região espectral intermediária, para obter uma informação 122 indicando as regiões espectrais identificadas. O preenchedor de ruídos 100 também compreende um insersor de ruído 130, que é configurado para seletivamente introduzir ruído nas regiões
-» . 14 espectrais identificadas (descritas na informação 122), para obter a representação espectral com preenchimento de ruído 112 do sinal de áudio.
Com relação à funcionalidade do preenchedor de ruídos 100, pode ser geralmente dito que o preenchedor de ruídos 100 seletivamente preenche regiões espectrais (ex., linhas espectrais ou bins espectrais) da representação espectral de : entrada 110 com ruído, por exemplo, substituindo os valores . espectrais das linhas espectrais quantizadas em zero com a substituição dos valores espectrais que descrevem um ruído.
Dessa forma, podem ser preenchidos os buracos espectrais ou vãos - espectrais dentro da representação espectral de entrada 110, o o que. pode, -por- exemplo, " surgir “da duantização grosseira da representação espectral de entrada 110. Entretanto, o preenchedor 15º de ruídos 100 não introduz ruído em todas as linhas- espectrais SS quantizadas em zero (isto é, linhas espectrais, os valores . espectrais que são quantizados em zero). Ao invés disso, o preenchedor de ruídos 100 somente introduz ruído nessas linhas i espectrais quantizadas em zero, o que compreende uma distância suficiente a partir das linhas espectrais quantizadas em um valor diferente de zero.
Dessa forma, o preenchimento de ruído não preenche totalmente os buracos espectrais ou vãos espectrais, mas mantém uma distância espectral de pelo menos uma região espectral (ou de pelo menos qualquer outro número predeterminado de regiões espectrais) entre essas linhas espectrais em que é introduzido um ruído e linhas espectrais quantizadas em um valor diferente de zero.
Assim, é mantida a distância espectral entre o ruído de preenchimento, introduzido na representação espectral e linhas
. 15 espectrais quantizadas em um valor diferente de zero, de maneira que as linhas espectrais psicoacusticamente relevantes (que não são quantizadas em zero na representação espectral de entrada do sinal de áudio) podem ser claramente distintas (devido à distância espectral do número predeterminado de uma ou mais regiões espectrais) do ruído de preenchimento introduzido no espectro pelo preenchedor de ruídos.
Assim, pode ser claramente percebido o ' conteúdo de áudio mais psicoacusticamente relevante (representado + por valores de linhas espectrais diferentes de zero na representação espectral de entrada 110), enquanto grandes buracos espectrais são evitados.
Isto se deve ao fato que o preenchimento
2 de ruído é seletivamente omitido na proximidade das linhas
" . espectrais-da representação" espectral de entrada quantizadas em Ns um valor diferente de zero, enquanto o preenchimento de ruído é feito nas regiões centrais de buracos espectrais. ou- vãos 7 Ns SspbCtrais,
. A seguir, será descrito um ambiente de aplicação para o preenchedor de ruídos 100 com referência à Fig. 2. A Fig. 2 mostra um diagrama esquemático de blocos de um decodificador de sinal de áudio 200, de acordo com uma configuração da invenção.
O decodificador de sinal de áudio 200 compreende, como uma componente principal, o preenchedor de ruídos 100. O decodificador de sinal de áudio 200 também compreende um decodificador do coeficiente espectral 210, que é configurado para receber uma representação do sinal de áudio codificado 212 e prover uma representação decodificada e opcionalmente quantizada inversamente 214 dos coeficientes espectrais do sinal codificado de áudio.
O decodificador do coeficiente espectral 210 pode, por exemplo,
. 16 compreender um decodificador de entropia (ex., decodificador aritmético ou decodificador de comprimento de operação) e, opcionalmente, um quantizador inverso para obter a representação decodificada 214 dos coeficientes espectrais (ex., sob a forma de coeficientes inversamente quantizados) da representação do sinal de áudio codificado 212. O preenchedor de ruídos 100 é configurado para receber a representação decodificada 214 de coeficientes ' espectrais (que é, opcionalmente, quantizada inversamente) como a
: representação espectral de entrada 110 do sinal de áudio.
O decodificador de sinal de áudio 200 também compreende um extrator de fator de ruído 220, que é configurado 2 para extrair uma informação do fator de ruído 222 da representação
- -do sinal de-áudio codificado 212 e próvêr a informação do fator de Na ruído extraída 222 ao preenchedor de ruídos 100. O decodificador de sinal de áudio 200 também compreende um. reformatador de espectro 230, que é configurado para receber uma representação do . espectro reconstruído 232 do preenchedor de ruídos 100. A representação do espectro reconstruído 232 pode, por exemplo, ser igual à representação espectral com preenchimento de ruído 112 provida pelo preenchedor de ruídos.
O reformatador de espectro 230, que pode ser considerado como opcional, é configurado para prover as informações de espectro 234 com base na representação do espectro reconstruído 232. O decodificador de sinal de áudio 200 ainda compreende um conversor do domínio espectral para o domínio do tempo 240, que recebe a representação do espectro 234 fornecida pelo reformatador de espectro 230, ou, na ausência do reformatador de espectro 230, a representação do espectro reconstruído 232, e prover com base nesta, uma representação do sinal de áudio no
. 17 domínio do tempo 242. O conversor do domínio espectral para o domínio do tempo 240 pode, por exemplo, ser configurado para fazer uma transformada inversa de cosseno discreta modificada (IMDCT).
Em uma configuração preferida, o preenchimento de ruído no lado do decodificador compreende as seguintes etapas (ou acompanha as seguintes etapas):
1. Decodificar o patamar de ruído; ' 2. Decodificar os valores quantizados das linhas . de frequência; '
3. Detectar as regiões espectrais na parte selecionada dos espectros em que um comprimento de operação de . zeros é maior que um tamanho mínimo de comprimento de operação; Ee A AO 7 7 - “4. Aplicar um sinal de geração randômica ao patamar de ruído decodificado para cada uma das linhas dentro das regiões selecionadas. ||| Le 2 eee eee - . O patamar de ruído é decodificado como segue: . nf decoded = 0.0625* (8-index) . As regiões espectrais detectadas são, por exemplo, selecionadas da mesma forma feita no lado do codificador (que será descrito abaixo).
É gerado um ruído Gaussiano sem memória no domínio MDCT por um espectro com a mesma amplitude para todas as linhas, mas com sinais randômicos. Assim, para cada uma das linhas dentro das regiões selecionadas, o decodificador gera um sinal randômico (-1 ou +1) e o aplica ao patamar de ruído decodificado. Entretanto, também podem ser aplicados outros métodos para prover uma contribuição de ruído.
A seguir, serão descritos alguns detalhes com
: 18 referência às Figs. 1, 2, 3 e 4, em que a Fig. 3 mostra um pseudo- código de programas de um algoritmo para o preenchimento de ruído no lado do decodificador, que pode ser feito pelo preenchedor de ruídos 100, e em que a Fig. 4 mostra uma representação gráfica do preenchimento de ruído. Para iniciar, a decodificação do patamar de ruído pode ser feita pelo extrator de fator de ruído 220, que recebe, ' por exemplo, um índice de fator de ruído (também brevemente + denominado de "índice") e prover com base nisso o valor do fator de ruído decodificado 222 (também denominado por "nf decoded"). O índice de fator de ruído pode, por exemplo, ser codificado usando 2 três ou quatro bits, e pode, por exemplo, ser um valor inteiro — = = “entre 0 e7, ou um valor inteiro entre 0 e 15. me TT TO Os valores quantizados das linhas de frequência : : 15 (também denominadas de "linhas espectrais"-ou-"bins-espectrais")- " podem ser providos pelo decodificador do coeficiente espectral . 210. Assim, são obtidos valores de linhas espectrais quantizadas (ou opcionalmente, inversamente quantizadas) (também denominadas de "coeficientes espectrais"), que são denominadas de "quantizadas (x(i))". Aqui, i indica um índice de frequência dos valores da linha espectral.
Subsequentemente, são detectadas regiões espectrais pelo preenchedor de ruídos 100 em uma parte selecionada dos espectros (ex., em uma porção superior do espectro iniciando a partir de um índice de frequência predeterminado de linha espectral i) onde o comprimento de operação de zeros (isto é, de valores de linhas espectrais quantizadas e quantizadas em zero) é maior que o tamanho mínimo de comprimento de operação. A detecção
. 19 dessas regiões espectrais é feita por uma primeira porção 310 do algoritmo 300 da Fig. 3. Como pode ser visto na primeira porção 310 do algoritmo 300, um conjunto R de regiões detectadas é inicializado como sendo um conjunto vazio no início do algoritmo (R = ();).
No exemplo do algoritmo da Fig. 3, é estabelecido um comprimento de operação mínimo em um valor fixo ' de 8, mas naturalmente pode ser escolhido qualquer outro valor. + Subsequentemente, foi determinado para uma pluralidade de linhas espectrais em consideração (indicadas pela variável corrente "line index") se cada uma dessas linhas . espectrais em consideração compreende um ambiente bilateral de = “= - - linhas espectrais quantizádas êm zero (e “se a própria Minha espectral em consideração é quantizada em zero). Por exemplo, : 15 todas as linhas na segunda metade .dos espectros. podem ser sucessivamente consideradas como linhas em consideração, quando . uma linha que estiver atualmente em consideração for indicada por um índice de frequência "line index". Para uma linha em consideração indicada pelo "line index", é computada a soma de coeficientes espectrais quantizados "quantized(x(i))" em um ambiente que vai de um índice de frequência de linha espectral de "line index - (MinimalRunLength)/2" até um índice de frequência de linha espectral de "line index + MinimalRunLength)/2". Se for determinado que a soma dos valores da linha espectral no referido ambiente da linha espectral atualmente em consideração (tendo índice de frequência de linha espectral "line index") é zero, então a linha espectral atualmente em consideração (ou, mais precisamente, seu índice de frequência de linha espectral "line
. . 20 index") é adicionada ao conjunto R das regiões detectadas (ou linhas espectrais detectadas). Como consequência, se um índice de frequência de linha espectral de uma linha espectral for adicionado ao conjunto R, isto significa que as linhas espectrais com índices de linha entre "line index - MinimalRunLength)/2" e "line index + MinimalRunLength)/2" todas compreendem valores da linha espectral quantizadas em zero. : Assim, na primeira porção 310 do pseudo-código + de programas 310, é obtido um conjunto R de índices de frequência de linha espectral "line index", que enumera aquelas (e somente aquelas) linhas espectrais da porção espectral em consideração . que são "suficientemente" espaçadas (isto é, por pelo menos e.
MinimalRunLengthl2. linhas) -de- quaisquer "linhas " espectrais o quantizadas em um valor diferente de zero.
A detecção dessa região está ilustrada na Fig. - Ú ' 4, que ostra uma representação gráfica 400 de um espectro.
Uma . abscissa 410 descreve uma frequência de linhas espectrais em termos de um índice de frequência de linha espectral "line index". Uma ordenada 412 descreve uma intensidade (ex., amplitude ou energia) das linhas espectrais.
Como pode ser visto, a porção do espectro ilustrada na representação gráfica 400 compreende quatro linhas espectrais 420a, 420b, 420c e 420d, quantizadas em um valor diferente de zero.
Além disso, entre as linhas espectrais 420c e 420d existem 11 linhas espectrais 422a-422k quantizadas em zero.
Também, é suposto que uma linha espectral é somente considerada como sendo suficientemente espaçada de uma linha espectral quantizada em um valor diferente de zero se houver pelo menos quatro linhas espectrais quantizadas em zero entre a linha
. . 21 espectral atualmente em consideração e qualquer outra linha espectral quantizada em um valor diferente de zero (e naturalmente, se a própria linha espectral atualmente em consideração for quantizada em zero). Entretanto, ao considerar a linha espectral 422a, será achado que a linha espectral 422a é imediatamente adjacente à linha espectral 422c, que não é quantizada em zero, de maneira que O índice de frequência de linha
* espectral da linha espectral 422a não será parte do conjunto R
. computado de acordo com à primeira parte 310 do algoritmo 300. De forma similar, será achado que as linhas espectrais 422b, 422c, e
422d não são espaçadas de maneira suficiente de qualquer das
. linhas espectrais quantizadas em um valor diferente de zero, de maneira que os índices de. frequência de -kinha espectral das linhas i
Ú espectrais 422b a 422d também não farão parte do conjunto R.
Em 15º contraste, será visto que a linha espectral 422e é suficientemente o - “espaáçada de qualquer das Linhas espectrais quantizadas em um valor . diferente de zero, porque à linha espectral 422e é uma linha de centro (ou, mais geralmente, uma linha central), de uma sequência de 9 linhas espectrais contíguas, todas quantizadas em zero. aAssimy o índice de frequência de linha espectral da linha espectral 422e fará parte do conjunto R computado na primeira porção 310 do algoritmo 300. O mesmo também vale para as linhas espectrais 422f e 422g, de maneira que os índices de frequência de linha espectral das linhas espectrais 422f e 422g farão parte do conjunto R determinado na primeira porção 310 do algoritmo 300, como as linhas espectrais 422f, 422g são suficientemente espaçadas
| de quaisquer linhas espectrais de baixa frequência 420a, 420b, e 420c, quantizadas em um valor diferente de zero e de quaisquer
. 22 linhas espectrais de maior frequência quantizadas em um valor diferente de zero. Por outro lado, as linhas espectrais 422h, 422i, 422j, e 422k não farão parte do conjunto R, porque as referidas linhas espectrais estão localizadas muito perto, em termos de frequência, além da linha espectral 420d quantizada em um valor diferente de zero.
Assim, o conjunto R não compreenderá índices de ' frequência de linha espectral das linhas espectrais 420a, 420b, z 420c, 420d, porque as referidas linhas espectrais são quantizadas em um valor diferente de zero. Além disso, os índices de frequência de linha espectral das linhas espectrais 422a, 422b, . 422c, 422d, 422h, 422i, 4223, e 422k, não farão parte do conjunto R,. porque as referidas linhas espectrais. se. localizam “muitó " OO “próximas do 1ado das linhas espectrais 420a, 420b, 420c, e 420d. Em contraste, os índices de frequência de linha espectral das o .-.. linhas espectrais 4226, 422f, 1229, Serão incluídos no conjunto R, . porque as próprias referidas linhas espectrais são quantizadas em zero e espaçadas o suficiente de quaisquer linhas espectrais adjacentes diferentes de zero.
O algoritmo 300 também compreende uma segunda porção 320 de decodificação do patamar de ruído, onde um índice de valor de ruído ("index" na porção de código do programa 320) é convertido em um valor de figura do ruído decodificado ("nf decoded" no código do programa 300).
O código do programa 300 também compreende uma terceira porção 330 de preenchimento das linhas espectrais identificadas, isto é, linhas espectrais dos índices de frequência de linha espectral i que estão no conjunto R, com ruído. Para
. 23 tanto, os valores espectrais das linhas espectrais identificadas (indicados, por exemplo, por x(i), onde a variável operacional i subsequentemente toma todos os índices de frequência de linha espectral incluídos no conjunto R) são estabelecidos para oS valores de preenchimento de ruído.
Os valores de preenchimento de ruído são, por exemplo, obtidos multiplicando o valor de preenchimento de ruído decodificado (nf decoded) com um número ' randômico ou pseudo número randômico (indicado por "random(-1, . +1)"), onde o número randômico ou pseudo-randômico pode, por exemplo, randomicamente ou pseudo-randomicamente tomar os números —1 e +1. Entretanto, a provisão diferente de um ruído randômico ou R pseudo-randômico é naturalmente possível. - : . - = — ... = O preenchimento- de=-ruído é também ilustrado na ” Fig. 4. Como pode ser visto na Fig. 4, os valores espectrais zero - 15º das linhas espectrais 422e, 422f, e 4229g são substituídos pelos Store de preenchimento de ruído (ilustrados pelas linhas . pontilhadas na Fig. 4). Calculador do parâmetro de preenchimento de ruído de acordo com as Figs. 5 e 6 A Fig. 5 mostra um diagrama esquemático de blocos de um calculador do parâmetro de preenchimento de ruído 500. O calculador do parâmetro de preenchimento de ruído é configurado para obter uma representação espectral quantizada 510 de um sinal de áudio e prover, com base nela, um parâmetro de preenchimento de ruído 512. O calculador do parâmetro de preenchimento de ruído 500 compreende um identificador de região espectral 520, que é configurado para receber a representação espectral quantizada 510 do sinal de áudio e para identificar regiões espectrais (ex.,
” 24 linhas espectrais) da representação espectral quantizada 510 espaçada das regiões espectrais diferentes de zero da representação espectral quantizada 510 por pelo menos uma região espectral intermediária (ex., linha espectral), para obter uma informação 522 descrevendo as regiões espectrais identificadas (ex., linhas espectrais identificadas). O calculador do parâmetro de preenchimento de ruído 500 ainda compreende um calculador de : valor de ruído 530 configurado para receber informações do erro de . quantização 532 e prover o parâmetro de preenchimento de ruído
512. Para tanto, o calculador de valor de ruído é configurado para considerar seletivamente os erros de quantização das regiões . espectrais identificadas, descritos pelas informações 522, para um cálculo do parâmetro de preenchimento de .ruído .512.- - - == — = . ' As informações do erro de quantização 532 podem, por exemplo, ser idênticas a uma informação de energia (ou NS informação de | intensidade) | aus descreva energias (ou . intensidades) dessas linhas espectrais que são quantizadas em zero na representação espectral quantizada 510. O calculador do parâmetro de preenchimento de ruído 500 pode opcionalmente compreender um quantizador 540, que é configurado para receber uma representação espectral não quantizada 542 de um sinal de áudio e prover a representação espectral quantizada 510 do sinal de áudio. O quantizador 540 pode ter uma resolução de quantização ajustável, que pode, por exemplo, ser individualmente ajustável por linha espectral, Ou por banda espectral (ex., na dependência de uma relevância psicoacústica das linhas espectrais ou das bandas espectrais, obtidas usando um modelo psicoacústico). A funcionalidade do
. | 25 quantizador de resolução variável pode ser igual à funcionalidade descrita em International Standards ISO/IEC 13818-7 e ISO/IEC 14496-3. Em particular, o quantizador 540 pode ser ajustado de maneira que existam vãos espectrais ou buracos espectrais na representação espectral quantizada 510 do sinal de áudio, isto é, regiões contíguas de linhas espectrais adjacentes quantizadas em zero.
. Além disso, a representação espectral não . quantizada 542 pode servir como informações do erro de quantização 532, ou as informações do erro de quantização 532 podem ser obtidas da representação espectral não quantizada 542.
. A seguir, será descrita em detalhes a funcionalidade da computação do parâmetro de preenchimento: de -— ruído, que pode ser formado pelo calculador do parâmetro de 15º preenchimento de ruído 500. Na computação do parâmetro de preenchimento de ruído no lado do codificador, o preenchimento de . ruído se aplica preferivelmente no domínio da quantização. Dessa forma, o ruído introduzido é conformado posteriormente pelo filtro inverso psicoacústico relevante. A energia do ruído introduzido pelo decodificador é calculada e codificada no lado do codificador seguindo as próximas etapas:
1. Obter os valores quantizados das linhas de frequência;
2. Selecionar somente uma parte dos espectros; '
3. Detectar as regiões espectrais na parte selecionada dos espectros onde oO comprimento de operação dos zeros é maior que o tamanho mínimo de comprimento de operação;
4. Calcular a média geométrica do erro de
. i 26 quantização com relação às regiões previamente detectadas; e
5. Quantizar uniformemente a média geométrica com 3 bits. Com relação à primeira etapa, os valores quantizados das linhas de frequência podem ser obtidos usando o quantizador 540. Os valores quantizados das linhas de frequência . são, portanto, representados pela representação espectral ei quantizada 510. 2 Com relação à segunda etapa, que pode ser considerada como opcional, deve ser notado que a computação do preenchimento de ruído é feita, de preferência, com base na . porção de alta frequência dos espectros. Em uma configuração preferida, a energia do ruído (denominada patamar de ruído) é somente calculada na segunda metade dos espectros, isto é, para as altas frequências (mas não para as menores frequências). Realmente, normalmente as altas frequências (a parte superior do . espectro) são menos perceptualmente importantes que as baixas frequências, e os valores quantizados em zero ocorrem principalmente na segunda metade dos espectros. Além disso, somar o ruído nas altas frequências é menos propenso a obter uma restituição final sonora ruidosa. Com relação à terceira etapa, restringindo o preenchimento de ruído nas regiões espectrais em que ocorre o comprimento de operação de valores quantizados em zero, é evitado que o preenchimento de ruído afete muito os valores não zerados. Dessa forma, o preenchimento de ruído não se aplica na vizinhança dos valores não zerados, e a tonalidade original dessas linhas é assim melhor preservada. O tamanho mínimo de comprimento de
E 27 operação é fixado em 8 em uma configuração preferida.
Isto significa que as 8 linhas que circundam um valor não zerado não são afetadas pelo preenchimento de ruído (e não são, como consequência, consideradas para o cálculo de um valor de ruído). Com relação à quarta etapa, oO erro de quantização no domínio quantizado está na faixa de [-0,5; 0,5], e é suposto uniformemente distribuído.
A energia dos erros de quantização das : regiões detectadas é média no domínio logarítmico (isto é, média ç geométrica). O patamar de ruído, nf, é, então, calculado como segue: nf = power (10, sum(logl10(E(x(i))))/(2*n)). . Acima, sum() é a soma das energias logarítmicas, - — logl0(E()), das. linhas .individuais x(i).—dentro -das regiões detectadas, e n o número de linhas dentro dessas regiões.
O patamar de ruído, nf, está entre O e 0,5. Esse cálculo permite " levar sm DONT & original planicidade espectral dos valores . zerados, e então obter as informações sobre suas características de tonalidade/ruídos. ' Se os valores zerados forem muito tonais, o patamar de ruído (computador no equipamento 500) irá para zero, e um baixo patamar de ruído será adicionado ao decodificador (ex., no decodificador 100, 200 acima descrito). Se os valores zerados forem realmente ruidosos, oO patamar de ruído será alto, e o preenchimento de ruídos pode ser visto como uma codificação altamente paramétrica das linhas espectrais zeradas, como PNS (Substituição do Ruído Perceptual) (ver também a referência [4]). Com relação à quinta etapa, é então calculado como segue O índice de quantização ("index") do patamar de ruído:
. 28 index=max(O0,min(7, int(8-16*nf))). O índice é transmitido, por exemplo, em 3 bits.
A seguir, será descrito o algoritmo para a computação do parâmetro de preenchimento de ruído, com referência à Fig. 6, que mostra um pseudo-código de programas 600 desse algoritmo para a obtenção do parâmetro de preenchimento de ruído, de acordo com uma configuração da invenção.
O algoritmo 600 ' compreende uma primeira porção 610 de regiões de detecção que + devem ser consideradas para a computação do parâmetro de preenchimento de ruído.
São descritas regiões identificadas (ex., linhas espectrais) pelo conjunto R, que pode, por exemplo, . compreender índices de frequência de linha espectral ("line . index") de linhas espectrais identificadas: As linhas espectrãis” - podem ser identificadas, sendo as mesmas quantizadas em zero e 155 que são mais espaçadas, o suficiente, de quaisquer outras linhas Ú espectrais quantizadas em um valor diferente de zero. . A primeira porção 610 do programa 600 pode ser idêntica à primeira porção 310 do programa 300. Assim, a i representação espectral quantizada ("quantized (x(i))") usada no algoritmo 600 pode, por exemplo, ser idêntica à representação espectral quantizada ("quantized x(i))") usada no algoritmo 300 no lado do decodificador.
Em outras palavras, a representação espectral quantizada usada no lado do codificador pode ser transmitida, de forma codificada, para o decodificador em um sistema de transmissão que compreende um codificador e um decodificador.
O algoritmo 600 compreende uma segunda porção 620 de computação do patamar de ruído.
Na computação do patamar
. 29 de ruído, somente são consideradas as regiões espectrais (ou linhas espectrais) descritas pelo conjunto R computado na primeira porção 610 do algoritmo 600. Como pode ser visto, oO valor de preenchimento de ruído é primeiro inicializado em zero.
O número de linhas espectrais consideradas (n) é também primeiro inicializado em zero.
Subsequentemente, as energias de todas as linhas espectrais, índices de linha que são incluídos no conjunto : R, são somadas, onde as energias das linhas espectrais são . logaritmizadas antes da soma.
Por exemplo, pode ser somado um logaritmo na base 10 (log 10) das energias (E(x(i))) das linhas espectrais.
Deve ser aqui notado que a energia real das linhas . espectrais antes da quantização (indicada por "E ou energy = - = x(i)-)") é-somada sob forma logaritmizada.
O “número de linhas " espectrais considerado é também contado.
Assim, após a execução 15º da segunda porção 620 do algoritmo 600, a variável nf indica uma soma logarítmica das energias das linhas espectrais identificadas . antes da quantização, e a variável n descreve o número de linhas espectrais identificadas.
O algoritmo 600 também compreende uma terceira porção 630 de quantização do valor nf, isto é, a soma logarítmica das linhas espectrais identificadas.
Pode ser usada uma equação de mapeamento como descrita acima ou como mostrada na Fig. 6. Método de acordo com a Fig. 7 A Fig. 7 mostra um fluxograma de um método para prover uma representação espectral com preenchimento de ruído de um sinal de áudio com base em uma representação espectral de entrada do sinal de áudio.
O método 700 da Fig. 7 compreende uma etapa 710 de identificação das regiões espectrais de uma
. | 30 representação espectral de entrada de um sinal de áudio espaçadas das regiões espectrais da representação espectral de entrada diferente "de zero por pelo menos uma região espectral intermediária, para obter regiões espectrais identificadas. O método 700 também compreende uma etapa 720 de introduzir seletivamente ruído nas regiões espectrais identificadas, para obter uma representação espectral com preenchimento de ruído do " sinal de áudio. : O método 700 pode ser suplementado por qualquer das características e funcionalidades descritas na presente com referência ao preenchedor de ruídos do invento.
. Método de acordo com a Fig. 8 ' o — - - e - A Fig.-8 mostra um fluxograma de um Método pára = prover um parâmetro de preenchimento de ruído com base em uma 15º representação espectral quantizada de um sinal de áudio. O método 800 compreende uma etapa 810 de identificação das regiões . espectrais da representação espectral quantizada de um sinal de áudio espaçado das regiões espectrais diferentes de zero da representação espectral quantizada por pelo menos uma região espectral intermediária, para obter regiões espectrais identificadas. O método 800 também compreende uma etapa 820 de considerar seletivamente erros de quantização das regiões espectrais identificadas para o cálculo do parâmetro de preenchimento.
O método 800 pode ser suplementado por quaisquer das características e funcionalidades descritas na presente com relação ao calculador do parâmetro de preenchimento de ruído.
Representação do sinal de áudio de acordo com a
« . 31 Fig. 9.
A Fig. 9 mostra uma representação gráfica de uma representação de sinal de áudio, de acordo com uma configuração da invenção. A representação do sinal de áudio 900 pode, por exemplo, formar a base para a representação espectral de entrada
110. A representação do sinal de áudio 900 pode também tomar a funcionalidade da representação do sinal de áudio codificado 212.
' A representação do sinal de áudio 900 pode ser obtida usando oO * calculador do parâmetro de preenchimento de ruído 500, em que a representação do sinal de áudio 900 pode, por exemplo, compreender a representação espectral quantizada 510 do sinal de . áudio e o parâmetro de preenchimento de ruído 512, por exemplo, — ambos sob forma codificada. - = + - som om o mom omom SD TOS Em outras palavras, a representação do sinal de 15º áudio 900 pode representar um sinal de áudio. A representação do : Sinai de áudio codificado 900 compreende uma representação do J domínio espectral quantizado codificado do sinal de áudio e também um parâmetro de preenchimento de ruído codificado. O : parâmetro de preenchimento de ruído representa um erro de quantização das regiões espectrais da representação no domínio espectral quantizada em zero e espaçadas das regiões espectrais da representação no domínio espectral quantizado em um valor diferente de zero por pelo menos uma região espectral intermediária.
Naturalmente, a representação do sinal de áudio 900 pode ser suplementada por qualquer das informações acima descritas.
ALTERNATIVAS DE IMPLEMENTAÇÃO
. 32 Dependendo de determinados requisitos de implementação, as configurações da invenção podem ser implementadas em hardware ou em software.
A implementação pode ser feita usando um meio digital de armazenagem, por exemplo, um disquete, um DVD, CD, ROM, PROM, EPROM, EEPROM ou uma memória FLASH, tendo "armazenados sinais de controle de leitura eletrônica, que cooperam (ou são capazes de cooperar) com um ' sistema programável de computador, de maneira a ser realizado o + respectivo método.
Algumas configurações de acordo com a invenção compreendem um portador de dados tendo sinais de controle de . leitura eletrônica, que são capazes de cooperar com um sistema - programável de computador, de maneira- que--seja realizado úm dos o métodos descritos na presente.
Em geral, as configurações da presente invenção podem ser implementadas como um produto de programa de computador ' . com um código do programa, o código do programa sendo operacional para realizar um dos métodos quando o produto de programa de | computador opera em um computador.
O código do programa pode, por exemplo, ser armazenado em um portador de leitura por máquina.
Outras configurações compreendem o programa de computador para realizar um dos métodos descritos na presente, armazenados em um portador de leitura por máquina.
Portanto, em outras palavras, uma configuração do método do invento é um programa de computador tendo um código do programa para realizar um dos métodos descritos na presente, quando o programa de computador opera em um computador.
Portanto, outra configuração dos métodos do
. 33 invento é um portador de dados (ou um meio digital de armazenagem) compreendendo o programa de computador para realizar um dos métodos descritos na presente.
Portanto, outra configuração do método do invento é um fluxo de dados ou uma sequência de sinais representando o programa de computador para realizar os métodos descritos na presente. O fluxo de dados ou a sequência de sinais * pode, por exemplo, ser configurado para transferência pela . conexão de comunicação de dados, por exemplo, via Internet.
Outra configuração compreende um meio de processamento, por exemplo, um computador, ou um dispositivo lógico programável, configurado ou adaptado para realizar um dos métodos descritos na presente. 2 oe AR e e + e E Eos tp ee A TT OT NS Outra configuração compreende um computador tendo instalado o programa de computador para realizar um dos ' métodos descritos na presente. o . Em algumas configurações, um dispositivo lógico programável (por exemplo, um gate array programável de campo) pode ser usado para realizar algumas ou todas as funcionalidades dos métodos descritos na presente. Em algumas configurações, um gate array programável de campo pode cooperar com um microprocessador para realizar um dos métodos descritos na presente.
CONCLUSÃO Para resumir O que foi dito acima, a presente invenção amplia a ferramenta de codificação de áudio "preenchimento de ruído" considerando o sinal de entrada e as características do sinal decodificado tanto ao fazer a computação
. 34 do parâmetro de preenchimento de ruídos no lado do codificador como a aplicação do ruído no lado do decodificador. Em uma configuração da invenção, a tonalidade/ruídos das linhas espectrais quantizadas em zero é estimada e usada para a estimativa do patamar de ruídos. Este patamar de ruído é então transmitido para o decodificador, que aplica o preenchimento de ruído aos valores quantizados em zero que ocorrem em regiões ' específicas dos espectros. Essas regiões são selecionadas com . base nas características dos espectros decodificados.
Com relação ao contexto da invenção, pode-se notar que a invenção foi aplicada a uma codificação baseada em transformada, que usa uma quantização escalar em MDCT. Os 0 L . coeficientes .MDCT são- previamente- normalizados Por” uma Curva | calculada com base em avisos perceptuais. A curva é deduzida a 15º partir de um estágio de análise LPC prévia (Linear Prediction o Ú Coding) ponderando os coeficientes LPC, como é feito no modo TCX . de AMR-WB+ (ver referência [1]). A partir dos coeficientes ponderados, é projetado um filtro de ponderação perceptual e aplicado antes da MDCT. O filtro inverso é também aplicado no lado do decodificador após a MDCT inversa. Este filtro inverso de ponderação perceptual conforma os ruídos de quantização de forma a minimizar ou mascarar o ruído percebido.
Em configurações de acordo com a invenção, são Superadas as desvantagens da técnica anterior. O preenchimento de ruído é aplicado de forma convencional de maneira sistemática aos valores quantizados em zero, considerando somente um limite espectral baseado em envelope, um limite de mascaramento Ou um limite energético. A técnica anterior não considera nem as
. 35 características do sinal de entrada nem as características do sinal decodificado. Assim, o equipamento convencional pode introduzir outros problemas indesejáveis, especialmente problemas de ruídos e cancela as vantagens dessa ferramenta.
Em contraste, configurações de acordo com a invenção permitem um melhor preenchimento de ruído com redução de problemas, como é discutido abaixo.
' Referências: + [1] "Extended Adaptive Multi-Rate - MWideband (AMR-WB+) codec", 3GPP TS 26.290 V6.3.0, 2005-06, Technical Specification.
. [2] Ragot et al, "ITU-T G.729.1: AN 8-32 Kbit/S
2. Scalable Coder Interoperable- with G.729- for Widebáfid Telephony | and Voice Over IP", Vol. 4, ICASSP 07, 15-20 April 2007.
[3] "AUDIO CODING", International Application : No. PCT/IB2002/001388, Applicant: KONINKLIJKE PHILIPS . ELECTRONICS N.V. [NL/NL]; Groenewoudseweg 1 NL-5621 BA Eindhoven (NL). Inventors: TAORI, Rakesh; Prof Holstlaan 6 NL-5656 AA Eindhoven (NL) and VAN DE PAR, Steven, L., J., D., E.; Prof. Holstlaan 6 NL-5656 AA Eindhoven (NL).
[4] Generic Coding of Moving Pictures and Associated Audio: Advanced Audio Coding. International Standard 13818-7, ISO/IEC JTC1/SC29/WG11 Moving 10 Pictures Expert Group,
1997. .

Claims (15)

% : REIVINDICAÇÕES
1. “PREENCHEDOR DE RUÍDOS,CALCULADOR DO PARÂMETRO DE PREENCHIMENTO DE RUÍDO,MÉTODO PARA PROVER UM PARÂMETRO DE PREENCHIMENTO DE RUÍDO,MÉTODO PARA PROVER UMA REPRESENTAÇÃO
ESPECTRAL COM PREENCHIMENTO DE RUÍDO DE UM SINAL DE ÁUDIO ,CORRESPONDENTE PROGRAMA DE COMPUTADOR E SINAL CODIFICADO DE ÁUDIO”, onde o preenchedor de ruídos (100) para prover uma representação espectral com preenchimento de ruído (112) de um sinal de áudio com base em uma representação espectral de entrada (110) do sinal de áudio, é caracterizado por compreender: um identificador de região espectral (120) e configurado para identificar regiões espectrais (422e, 422f, 4229) Ã da representação espectral de entrádã (110) que são quantizadás em zero e espaçadas das regiões espectrais diferentes de zero (420a, 420b, 420c, 420d) da representação espectral de entrada (110) por. pelo menos uma região espectral intermediária (422a, 422b, 422c, 422d, 422h, 422i, 4223, 422Kk), para obter regiões espectrais identificadas (422e, 422f, 4229); e um insersor de ruído (130) configurado para nn 20 introduzir seletivamente o ruído nas regiões espectrais a identificadas (422e, 422f, 422g) e obter a representação espectral o com preenchimento de ruído (112) do sinal de áudio.
2. Preenchedor de ruídos (100), de acordo com a reivindicação 1, caracterizado pelo fato de que o identificador de região espectral (120) é configurado para identificar, como as regiões espectrais identificadas, linhas espectrais (422e, 422f, 4229) da representação espectral de entrada (110), que são quantizadas em zero e que compreendem pelo menos um primeiro s ' º 2 número predeterminado (4) de linhas espectrais vizinhas de menor frequência (422a, 422b, 422d; 422b, 422c, 422d, 422e, 422c, 422d, 422e, 422f) quantizadas em zero e pelo menos um segundo número predeterminado (4) de linhas espectrais vizinhas de maior frequência (422f, 422g, 422h, 422i; 422g, 422h, 422i, 422j3; 422h, 422i, 4223, 422K) quantizadas em zero, como regiões espectrais identificadas; onde o primeiro número predeterminado (4) é maior ou igual a 1, e onde o segundo número predeterminado (4) é maior ou igual a 1; e onde o insersor de ruído (130) é configurado para e introduzir seletivamente o ruído nas linhas espectrais à identificadas (422e, 422f, 4229) engúánito deixa as linhas " espectrais (420a, 420b, 420c, 420d) quantizadas em um valor diferente- de zero e linhas espectrais (422a, 422b, 422c, 4220, .— 422h, 422i, 4223, 422Kk) quantizadas em zero, mas não tendo O primeiro número predeterminado (4) de linhas espectrais vizinhas de menor frequência quantizadas em zero, Ou oO segundo número predeterminado (4) de linhas espectrais vizinhas de maior * 20 frequência quantizadas em zero não afetadas pelo preenchimento de UH ruído.
"a 3. Preenchedor de ruído (100), de acordo com a reivindicação 2, caracterizado pelo fato de que o primeiro número predeterminado (4) é igual ao segundo número predeterminado (4).
4. Preenchedor de ruído (100), de acordo com uma das reivindicações de 1 a 3, caracterizado pelo fato de que oO preenchedor de ruídos é configurado para introduzir ruído somente nas regiões espectrais em uma porção superior da representação
, $ 3 espectral de entrada (110) do sinal de áudio, deixando uma porção inferior da representação espectral de entrada (110) do sinal de áudio não afetada pelo preenchimento de ruído.
5. Preenchedor de ruído (100), de acordo com uma das reivindicações de ]1 a 4, caracterizado pelo fato de que O identificador de região espectral (120) é configurado para somar valores quantizados de intensidade (quantizados (x(i))) das regiões espectrais na vizinhança espectral predeterminada bilateral de uma dada região espectral (i), para obter um valor somado (E), e avaliar o valor somado (E) e decidir se a determinada região espectral (1) é uma região espectral c identificada ou não. 3 - =. 6. Preenchedôr de ruído (100), de âcordo com uma : das reivindicações de 1 a 5, caracterizado pelo fato de que O identificador de região espectral (120). é configurado para-varrer- - uma faixa de regiões espectrais da representação espectral de entrada (110) e detectar sequências contíguas (422a a 422i; 422b a 422); 422c a 422k) de regiões espectrais quantizadas em zero, e reconhecer uma ou mais regiões espectrais centrais (422e, 422f,
FÉ 1* 20 4229) das sequências contíguas detectadas como regiões espectrais ê identificadas.
7. Calculador do parâmetro de preenchimento de | | ruído (500) para prover um parâmetro de preenchimento de ruído (512) com base em uma representação espectral quantizada (510) de um sinal de áudio, é caracterizado por compreender: um identificador de região espectral (520) configurado para identificar regiões espectrais (422e, 422f, 4229) da representação espectral quantizada (510) espaçadas das
. ' 4 regiões espectrais diferentes de zero (420a, 420b, 420c, 420d) da representação espectral quantizada (510) por pelo menos uma região espectral intermediária (422a, 422b, 422c, 422d, 422h, 422i, 4223, 422Kk), para obter regiões espectrais identificadas (422e, 422f, 4229); e um calculador de valor de ruído (530) configurado para considerar seletivamente erros de quantização (energy (x(i))) das regiões espectrais identificadas (i) para o cálculo do parâmetro de preenchimento de ruído (512, nf).
8. Calculador do parâmetro de preenchimento de ruído (500), de acordo com a reivindicação 7, caracterizado pelo [G fato de que o identificador de região espectral (520) é 7 - —-configurado para identificãr linhas espectrais (422e, 422f, 1229) i da representação espectral de entrada (510), que sejam quantizadas em zero, e que compreendam .pelo menos um primeiro - número predeterminado (4) de linhas espectrais vizinhas de menor frequência (422a, 422b, 422c, 422d; 422b, 422c, 422d, 422e, 422c, 422d, 422e, 422f) quantizadas em zero e pelo menos um segundo número predeterminado (4) de linhas espectrais vizinhas de maior 4 120 frequência (422f, 422g, 422h, 422i; 4229, 422h, 422i, 4223; 422h, is; 422i, 422j, 422kK) quantizadas em zero, como regiões espectrais identificadas; | onde o primeiro número predeterminado (4) é maior ou igual a l, e onde o segundo número predeterminado (4) é maior ou igual a 1; e onde o calculador de valor de ruído (520) é configurado para considerar seletivamente os erros de quantização das regiões espectrais identificadas (1) para o cálculo do
. ' 5 parâmetro de preenchimento de ruído, deixando as linhas espectrais (420a, 420b, 420c, 420d) quantizadas em um valor diferente de zero e linha espectral (422a, 422b, 422c, 422d, 422h, 422i, 42253, 422k) quantizada em zero, mas não tendo o primeiro número predeterminado (4) de linhas espectrais vizinhas de menor frequência quantizadas em zero, ou o segundo número predeterminado (4) de linhas espectrais vizinhas de maior frequência quantizadas em zero fora de consideração para oO cálculo do parâmetro de preenchimento de ruído.
9. Calculador do parâmetro de preenchimento de ruído (500), de acordo com qualquer uma das reivindicações de 7 a [G 8, caracterizado pelo fato de que o calculador de valor de ruído ; - 41530) “é configurado para — Considerar uma energia real : (energy(x(i))) dos erros de quantização das regiões espectrais identificadas (i) para o cálculo do parâmetro .de preenchimento: de- — — ruído (512, nf, nf index).
10. Calculador do parâmetro de preenchimento de ruído (500), de acordo com qualquer uma das reivindicações de 7 a 9, caracterizado pelo fato de que o calculador de valor de ruído & 120 (530) é configurado para realçar a energia não tonal do erro de is quantização (energy (x(i))) distribuída em uma pluralidade de regiões espectrais identificadas com relação à energia tonal do Na erro de quantização concentrada em uma única região espectral ou em uma pluralidade de linhas espectrais.
11. Calculador do parâmetro de preenchimento de ruído (500), de acordo com uma das reivindicações de 7 a 10, caracterizado pelo fato de que o calculador de valor de ruído (530) é configurado para calcular a soma das energias
. ' 6 logaritmizadas dos erros de quantização (loglO0(energy(x(i)))) das regiões espectrais identificadas (i), para obter o parâmetro de preenchimento de ruído (512, nf, nf index).
12. Representação do sinal de áudio codificado (900) representando um sinal de áudio, caracterizado por compreender uma representação do domínio espectral quantizado codificado do sinal de áudio; e um parâmetro de preenchimento de ruído codificado; onde o parâmetro de preenchimento de ruído representa um erro de quantização das regiões espectrais da ç representação no domínio espectral quantizada em zero e espaçada das regiões espectrais da répresentação no domínio espectral : quantizada em um valor diferente de zero por pelo menos uma região espectral intermediária. . - " oe eee e
13. Método (700) para prover uma representação espectral com preenchimento de ruído de um sinal de áudio com base em uma representação espectral de entrada do sinal de áudio, caracterizado por compreender: 1 20 identificação (710) das regiões espectrais da E) representação espectral espaçadas de regiões espectrais diferentes “de zero por pelo menos uma região espectral | intermediária, para obter regiões espectrais identificadas; e seletivamente introduzir (720) ruído nas regiões espectrais identificadas para obter a representação espectral com preenchimento de ruído do sinal de áudio.
14. Método (800) para prover um parâmetro de preenchimento de ruído com base na representação espectral
. , 7 quantizada de um sinal de áudio, caracterizado por compreender: identificar (810) regiões espectrais da representação espectral quantizada espaçadas das regiões espectrais diferentes de zero da representação espectral quantizada por pelo menos uma região espectral intermediária para obter regiões espectrais identificadas; e considerar seletivamente (820) erros de quantização das regiões espectrais identificadas para um cálculo do parâmetro de preenchimento de ruído.
15. Programa de computador, caracterizado por realizar o método, de acordo com a reivindicação 13 ou 14, quando [A executado em um computador. t & (E
NR ” a :
REIVINDICAÇÕES
1. “PREENCHEDOR DE RUÍDOS,CALCULADOR DO PARÂMETRO DE PREENCHIMENTO DE RUÍDO,MÉTODO PARA PROVER UM PARÂMETRO DE PREENCHIMENTO DE RUÍDO , MÉTODO PARA PROVER UMA REPRESENTAÇÃO
ESPECTRAL COM PREENCHIMENTO DE RUÍDO DE UM SINAL DE ÁUDIO,CORRESPONDENTE PROGRAMA DE COMPUTADOR E SINAL CODIFICADO DE ÁUDIO”, onde o preenchedor de ruídos (100) para prover uma representação espectral com preenchimento de ruído (112) de um sinal de áudio com base em uma representação espectral de entrada (110) do sinal de áudio, é caracterizado por compreender: um identificador de região espectral (120) s configurado para identificar regiões espectrais (422e, 422f, 4229) da representação espectral de entrada (110) que são quantizadas em ? zero e espaçadas das regiões espectrais diferentes de zero (420a, —420b, 420c, 420d) da representação .espectral. de--entrada -(110)- por- pelo menos uma região espectral intermediária (422a, 422b, 422c, 422d, 422h, 422i, 422j3, 422k), para obter regiões espectrais identificadas (422e, 422f, 4229); e um insersor de ruído (130) configurado para ss t 20 introduzir seletivamente o ruído nas regiões espectrais E identificadas (422e, 422f, 422g) e obter a representação espectral com preenchimento de ruído (112) do sinal de áudio.
2. Preenchedor de ruídos (100), de acordo com a reivindicação 1, caracterizado pelo fato de que o identificador de região espectral (120) é configurado para identificar, como as regiões espectrais identificadas, linhas espectrais (422e, 422f, 4229) da representação espectral de entrada (110), que são quantizadas em zero e que compreendem pelo menos um primeiro
' 2 número predeterminado (4) de linhas espectrais vizinhas de menor frequência (422a, 422b, 422d; 422b, 422c, 422d, 422e, 422c, 422d, 422e, 422f) quantizadas em zero e pelo menos um segundo número predeterminado (4) de linhas espectrais vizinhas de maior frequência (422f, 422g, 422h, 422i; 4229, 422h, 422i, 422); 422h, 422i, 422j, 422k) quantizadas em zero, como regiões espectrais identificadas; onde o primeiro número predeterminado (4) é maior ou igual a 1, e onde o segundo número predeterminado (4) é maior ou igual a 1; e onde o insersor de ruído (130) é configurado para * introduzir seletivamente o ruído nas linhas espectrais - identificadas (4226, 422f; 422d) enduanto déixa as linhas + espectrais (420a, 420b, 420c, 420d) quantizadas em um valor diferente de zero e linhas, espectrais .(422a,-422b,-422c,-422d,- - 422h, 422i, 4223, 422Kk) quantizadas em zero, mas não tendo o primeiro número predeterminado (4) de linhas espectrais vizinhas de menor frequência quantizadas em zero, Ou oO segundo número predeterminado (4) de linhas espectrais vizinhas de maior es Vo frequência quantizadas em zero não afetadas pelo preenchimento de G ruído.
3. Preenchedor de ruído (100), de acordo com a l reivindicação 2, caracterizado pelo fato de que o primeiro número predeterminado (4) é igual ao segundo número predeterminado (4).
4. Preenchedor de ruído (100), de acordo com uma das reivindicações de 1 a 3, caracterizado pelo fato de que O preenchedor de ruídos é configurado para introduzir ruído somente nas regiões espectrais em uma porção superior da representação
' 3 espectral de entrada (110) do sinal de áudio, deixando uma porção inferior da representação espectral de entrada (110) do sinal de áudio não afetada pelo preenchimento de ruído.
5. Preenchedor de ruído (100), de acordo com uma das reivindicações de 1 a 4, caracterizado pelo fato de que o identificador de região espectral (120) é configurado para somar valores quantizados de intensidade (quantizados (x(i))) das regiões espectrais na vizinhança espectral predeterminada bilateral de uma dada região espectral (i), para obter um valor somado (E), e avaliar o valor somado (E) e decidir se a determinada região espectral (i) é uma região espectral + identificada ou não. | - - “6. Preenchedor de ruído (100), de acordo com uma = Ú das reivindicações de 1 a 5, caracterizado pelo fato de que o identificador de região espectral .(120) é .configurado. para varrer - uma faixa de regiões espectrais da representação espectral de entrada (110) e detectar sequências contíguas (422a a 422i; 422b a 4223; 422c a 422Kk) de regiões espectrais quantizadas em zero, e reconhecer uma ou mais regiões espectrais centrais (422e, 422f, : 20 422g) das sequências contíguas detectadas como regiões espectrais Gu identificadas.
7. Calculador do parâmetro de preenchimento de ruído (500) para prover um parâmetro de preenchimento de ruído (512) com base em uma representação espectral quantizada (510) de um sinal de áudio, é caracterizado por compreender: um identificador de região espectral (520) configurado para identificar regiões espectrais (422e, 422f, 422g) da representação espectral quantizada (510) espaçadas das
' | 4 regiões espectrais diferentes de zero (420a, 420b, 420c, 420d) da representação espectral quantizada (510) por pelo menos uma região espectral intermediária (422a, 422b, 422c, 422d, 422h, 422i, 4225, 422Kk), para obter regiões espectrais identificadas (422e, 422f, 4229); e um calculador de valor de ruído (530) configurado para considerar seletivamente erros de quantização (energy (x(i))) das regiões espectrais identificadas (1) para o cálculo do parâmetro de preenchimento de ruído (512, nf).
8. Calculador do parâmetro de preenchimento de ruído (500), de acordo com a reivindicação 7, caracterizado pelo + fato de que o identificador de região espectral (520) é configurado Para identificar linhas espéctrais (422e, 422f, 4229) | : da representação espectral de entrada (510), que sejam 15— quantizadas .em zero e que. compreendam—pelo menos -um- primeiro - -— número predeterminado (4) de linhas espectrais vizinhas de menor frequência (422a, 422b, 422c, 422d; 422b, 422c, 422d, 422e, 422c, 422d, 422e, 422f) quantizadas em zero e pelo menos um segundo número predeterminado (4) de linhas espectrais vizinhas de maior 2 frequência (422f, 422g, 422h, 422i; 422g, 422h, 422i, 4223; 422h, & 422i, 4223, 422k) quantizadas em zero, como regiões espectrais — identificadas; onde o primeiro número predeterminado (4) é maior ou igual a 1, e onde o segundo número predeterminado (4) é maior ou igual a 1; e onde o calculador de valor de ruído (520) é configurado para considerar seletivamente os erros de quantização das regiões espectrais identificadas (i) para o cálculo do
À : 5 parâmetro de preenchimento de ruído, deixando as linhas espectrais (420a, 420b, 420c, 420d) quantizadas em um valor diferente de zero e linha espectral (422a, 422b, 422c, 422d, 422h, 422i, 4223, 422k) quantizada em zero, mas não tendo o primeiro número predeterminado (4) de linhas espectrais vizinhas de menor frequência quantizadas em zero, ou o segundo número predeterminado (4) de linhas espectrais vizinhas de maior frequência quantizadas em zero fora de consideração para oO cálculo do parâmetro de preenchimento de ruído.
9. Calculador' do parâmetro de preenchimento de ruído (500), de acordo com qualquer uma das reivindicações de 7 a +? 8, caracterizado pelo fato de que o calculador de valor de ruído : (530) é Configurado Fara considerar uma energia real (energy(x(1))) dos erros de quantização das regiões espectrais identificadas .(i) para o cálculo do parâmetro de preenchimento de --— ruído (512, nf, nf index).
10. Calculador do parâmetro de preenchimento de ruído (500), de acordo com qualquer uma das reivindicações de 7 a 9, caracterizado pelo fato de que o calculador de valor de ruído (530) é configurado para realçar a energia não tonal do erro de a quantização (energy (x(i))) distribuída em uma pluralidade de ' — regiões espectrais identificadas com relação à energia tonal do erro de quantização concentrada em uma única região espectral ou em uma pluralidade de linhas espectrais.
11. Calculador do parâmetro de preenchimento de ruído (500), de acordo com uma das reivindicações de 7 a 10, caracterizado pelo fato de que o calculador de valor de ruído (530) é configurado para calcular a soma das energias logaritmizadas dos erros de quantização (loglO0(energy(x(i)))) das regiões espectrais identificadas (i), para obter o parâmetro de preenchimento de ruído (512, nf, nf index).
12. Representação do sinal de áudio codificado (900) representando um sinal de áudio, caracterizado por compreender uma representação do domínio espectral quantizado codificado do sinal de áudio; e um parâmetro de preenchimento de ruído codificado; onde o parâmetro de preenchimento de ruído representa um erro de quantização das regiões espectrais da + representação no domínio espectral quantizada em zero e espaçada ; Ú das regiões espectrais da representação no domínio espectral quantizada em um valor diferente de zero por pelo menos uma 15º região-espectral-intermediária. — = =—
13. Método (700) para prover uma representação espectral com preenchimento de ruído de um sinal de áudio com base em uma representação espectral de entrada do sinal de áudio, caracterizado por compreender: identificação (710) das regiões espectrais da a representação espectral espaçadas de regiões espectrais ' - diferentes de zero por pelo menos uma região espectral intermediária, para obter regiões espectrais identificadas; e seletivamente introduzir (720) ruído nas regiões espectrais identificadas para obter a representação espectral com preenchimento de ruído do sinal de áudio.
14. Método (800) para prover um parâmetro de preenchimento de ruído com base na representação espectral a. . 7 quantizada de um sinal de áudio, caracterizado por compreender: identificar (810) regiões espectrais da representação espectral quantizada espaçadas das regiões espectrais diferentes de zero da representação espectral quantizada por pelo menos uma região espectral intermediária para obter regiões espectrais identificadas; e considerar seletivamente (820) erros de quantização das regiões espectrais identificadas para um cálculo do parâmetro de preenchimento de ruído.
15. Programa de computador, caracterizado por realizar o método, de acordo com a reivindicação 13 ou 14, quando e executado em um computador. , o é
BRPI0910522-0A 2008-07-11 2009-06-26 preenchedor de ruídos, calculador do parâmetro de preenchimento de ruído, método para prover um parâmetro de preenchimento de ruído, método para prover uma representação espectral com preenchimento de ruído de um sinal de áudio, correspondente programa de computador e sinal codificado de áudio BRPI0910522A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US7987208P 2008-07-11 2008-07-11
US61/079,872 2008-07-11
US10382008P 2008-10-08 2008-10-08
US61/103,820 2008-10-08
PCT/EP2009/004653 WO2010003565A1 (en) 2008-07-11 2009-06-26 Noise filler, noise filling parameter calculator, method for providing a noise filling parameter, method for providing a noise-filled spectral representation of an audio signal, corresponding computer program and encoded audio signal

Publications (1)

Publication Number Publication Date
BRPI0910522A2 true BRPI0910522A2 (pt) 2020-10-20

Family

ID=40941986

Family Applications (6)

Application Number Title Priority Date Filing Date
BR122021003726-4A BR122021003726B1 (pt) 2008-07-11 2009-06-25 Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio.
BR122021003142-8A BR122021003142B1 (pt) 2008-07-11 2009-06-25 Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio, e fluxo de áudio
BRPI0910811-4A BRPI0910811B1 (pt) 2008-07-11 2009-06-25 Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio.
BR122021003097-9A BR122021003097B1 (pt) 2008-07-11 2009-06-25 Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio, e fluxo de áudio
BR122021003752-3A BR122021003752B1 (pt) 2008-07-11 2009-06-25 Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio.
BRPI0910522-0A BRPI0910522A2 (pt) 2008-07-11 2009-06-26 preenchedor de ruídos, calculador do parâmetro de preenchimento de ruído, método para prover um parâmetro de preenchimento de ruído, método para prover uma representação espectral com preenchimento de ruído de um sinal de áudio, correspondente programa de computador e sinal codificado de áudio

Family Applications Before (5)

Application Number Title Priority Date Filing Date
BR122021003726-4A BR122021003726B1 (pt) 2008-07-11 2009-06-25 Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio.
BR122021003142-8A BR122021003142B1 (pt) 2008-07-11 2009-06-25 Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio, e fluxo de áudio
BRPI0910811-4A BRPI0910811B1 (pt) 2008-07-11 2009-06-25 Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio.
BR122021003097-9A BR122021003097B1 (pt) 2008-07-11 2009-06-25 Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio, e fluxo de áudio
BR122021003752-3A BR122021003752B1 (pt) 2008-07-11 2009-06-25 Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio.

Country Status (22)

Country Link
US (9) US9043203B2 (pt)
EP (7) EP4372745A1 (pt)
JP (2) JP5622726B2 (pt)
KR (4) KR101582057B1 (pt)
CN (2) CN102089808B (pt)
AR (2) AR072482A1 (pt)
AT (1) ATE535903T1 (pt)
AU (2) AU2009267459B2 (pt)
BR (6) BR122021003726B1 (pt)
CA (2) CA2730361C (pt)
CO (2) CO6341671A2 (pt)
EG (1) EG26480A (pt)
ES (5) ES2422412T3 (pt)
HK (2) HK1157045A1 (pt)
MX (2) MX2011000382A (pt)
MY (2) MY178597A (pt)
PL (3) PL3246918T3 (pt)
PT (1) PT2304719T (pt)
RU (2) RU2519069C2 (pt)
TW (2) TWI417871B (pt)
WO (2) WO2010003556A1 (pt)
ZA (2) ZA201100091B (pt)

Families Citing this family (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR122021003726B1 (pt) 2008-07-11 2021-11-09 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio.
EP2182513B1 (en) * 2008-11-04 2013-03-20 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
US8553897B2 (en) * 2009-06-09 2013-10-08 Dean Robert Gary Anderson Method and apparatus for directional acoustic fitting of hearing aids
US8879745B2 (en) * 2009-07-23 2014-11-04 Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust Method of deriving individualized gain compensation curves for hearing aid fitting
US9101299B2 (en) * 2009-07-23 2015-08-11 Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust Hearing aids configured for directional acoustic fitting
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
WO2012053150A1 (ja) * 2010-10-18 2012-04-26 パナソニック株式会社 音声符号化装置および音声復号化装置
WO2012122303A1 (en) 2011-03-07 2012-09-13 Xiph. Org Method and system for two-step spreading for tonal artifact avoidance in audio coding
US9015042B2 (en) * 2011-03-07 2015-04-21 Xiph.org Foundation Methods and systems for avoiding partial collapse in multi-block audio coding
US9009036B2 (en) 2011-03-07 2015-04-14 Xiph.org Foundation Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding
JP5820487B2 (ja) 2011-03-18 2015-11-24 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. オーディオコンテントを表すビットストリームのフレームにおけるフレーム要素位置決め
EP2705516B1 (en) * 2011-05-04 2016-07-06 Nokia Technologies Oy Encoding of stereophonic signals
AU2012276367B2 (en) * 2011-06-30 2016-02-04 Samsung Electronics Co., Ltd. Apparatus and method for generating bandwidth extension signal
US9875748B2 (en) * 2011-10-24 2018-01-23 Koninklijke Philips N.V. Audio signal noise attenuation
US8942397B2 (en) * 2011-11-16 2015-01-27 Dean Robert Gary Anderson Method and apparatus for adding audible noise with time varying volume to audio devices
JP5942463B2 (ja) * 2012-02-17 2016-06-29 株式会社ソシオネクスト オーディオ信号符号化装置およびオーディオ信号符号化方法
US9305567B2 (en) 2012-04-23 2016-04-05 Qualcomm Incorporated Systems and methods for audio signal processing
CN103778918B (zh) * 2012-10-26 2016-09-07 华为技术有限公司 音频信号的比特分配的方法和装置
CN103854653B (zh) * 2012-12-06 2016-12-28 华为技术有限公司 信号解码的方法和设备
AU2014211539B2 (en) * 2013-01-29 2017-04-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Low-complexity tonality-adaptive audio signal quantization
MX346927B (es) 2013-01-29 2017-04-05 Fraunhofer Ges Forschung Énfasis de bajas frecuencias para codificación basada en lpc (codificación de predicción lineal) en el dominio de frecuencia.
RU2631988C2 (ru) * 2013-01-29 2017-09-29 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Заполнение шумом при аудиокодировании с перцепционным преобразованием
BR112015019176B1 (pt) * 2013-04-05 2021-02-09 Dolby Laboratories Licensing Corporation método e aparelho de expansão de um sinal de áudio, método e aparelho de compressão de um sinal de áudio, e mídia legível por computador
EP2981961B1 (en) 2013-04-05 2017-05-10 Dolby International AB Advanced quantizer
EP2992605B1 (en) * 2013-04-29 2017-06-07 Dolby Laboratories Licensing Corporation Frequency band compression with dynamic thresholds
EP4290510A3 (en) 2013-05-24 2024-02-14 Dolby International AB Audio encoder
BR112015032013B1 (pt) * 2013-06-21 2021-02-23 Fraunhofer-Gesellschaft zur Förderung der Angewandten ForschungE.V. Método e equipamento para a obtenção de coeficientes do espectropara um quadro de substituição de um sinal de áudio, descodificador de áudio,receptor de áudio e sistema para transmissão de sinais de áudio
WO2014210284A1 (en) * 2013-06-27 2014-12-31 Dolby Laboratories Licensing Corporation Bitstream syntax for spatial voice coding
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
EP2830058A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
EP2830060A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling in multichannel audio coding
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
AU2014329890B2 (en) 2013-10-03 2017-10-26 Dolby Laboratories Licensing Corporation Adaptive diffuse signal generation in an upmixer
CN111580772B (zh) * 2013-10-22 2023-09-26 弗劳恩霍夫应用研究促进协会 用于音频设备的组合动态范围压缩和引导截断防止的构思
EP3285254B1 (en) 2013-10-31 2019-04-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
PL3336839T3 (pl) 2013-10-31 2020-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem maskowania błędów modyfikującego sygnał pobudzenia w dziedzinie czasu
WO2015081699A1 (zh) 2013-12-02 2015-06-11 华为技术有限公司 一种编码方法及装置
KR20230042410A (ko) 2013-12-27 2023-03-28 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
EP4109445A1 (en) * 2014-03-14 2022-12-28 Telefonaktiebolaget LM Ericsson (PUBL) Audio coding method and apparatus
CN111710342B (zh) * 2014-03-31 2024-04-16 弗朗霍弗应用研究促进协会 编码装置、解码装置、编码方法、解码方法及程序
US9685166B2 (en) 2014-07-26 2017-06-20 Huawei Technologies Co., Ltd. Classification between time-domain coding and frequency domain coding
EP2980801A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
EP2980792A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
JPWO2016052191A1 (ja) * 2014-09-30 2017-07-20 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
US20160173808A1 (en) 2014-12-16 2016-06-16 Psyx Research, Inc. System and method for level control at a receiver
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI771266B (zh) * 2015-03-13 2022-07-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
WO2016162283A1 (en) * 2015-04-07 2016-10-13 Dolby International Ab Audio coding with range extension
US9454343B1 (en) 2015-07-20 2016-09-27 Tls Corp. Creating spectral wells for inserting watermarks in audio signals
US9311924B1 (en) 2015-07-20 2016-04-12 Tls Corp. Spectral wells for inserting watermarks in audio signals
US9626977B2 (en) 2015-07-24 2017-04-18 Tls Corp. Inserting watermarks into audio signals that have speech-like properties
US10115404B2 (en) 2015-07-24 2018-10-30 Tls Corp. Redundancy in watermarking audio signals that have speech-like properties
IL276591B2 (en) 2015-10-08 2023-09-01 Dolby Int Ab Layered coding for voice or compressed sound field representations
CA3228629A1 (en) 2015-10-08 2017-04-13 Dolby International Ab Layered coding and data structure for compressed higher-order ambisonics sound or sound field representations
US10142743B2 (en) 2016-01-01 2018-11-27 Dean Robert Gary Anderson Parametrically formulated noise and audio systems, devices, and methods thereof
EP3208800A1 (en) * 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
AU2017219696B2 (en) * 2016-02-17 2018-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing
US10146500B2 (en) 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
EP3382703A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and methods for processing an audio signal
EP3396670B1 (en) * 2017-04-28 2020-11-25 Nxp B.V. Speech signal processing
WO2019081070A1 (en) * 2017-10-27 2019-05-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. APPARATUS, METHOD, OR COMPUTER PROGRAM PRODUCT FOR GENERATING ENHANCED BANDWIDTH AUDIO SIGNAL USING NEURAL NETWORK PROCESSOR
WO2019091576A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
US11694708B2 (en) * 2018-09-23 2023-07-04 Plantronics, Inc. Audio device and method of audio processing with improved talker discrimination
US11264014B1 (en) * 2018-09-23 2022-03-01 Plantronics, Inc. Audio device and method of audio processing with improved talker discrimination
WO2020073148A1 (en) * 2018-10-08 2020-04-16 Telefonaktiebolaget Lm Ericsson (Publ) Transmission power determination for an antenna array
WO2020164751A1 (en) * 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment
EP3939035A4 (en) * 2019-03-10 2022-11-02 Kardome Technology Ltd. LANGUAGE IMPROVEMENT USING CLUSTERING OF HINTS
WO2020207593A1 (en) * 2019-04-11 2020-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program
US20200402522A1 (en) * 2019-06-24 2020-12-24 Qualcomm Incorporated Quantizing spatial components based on bit allocations determined for psychoacoustic audio coding
US11361776B2 (en) 2019-06-24 2022-06-14 Qualcomm Incorporated Coding scaled spatial components
US11538489B2 (en) 2019-06-24 2022-12-27 Qualcomm Incorporated Correlating scene-based audio data for psychoacoustic audio coding
CN112037802B (zh) * 2020-05-08 2022-04-01 珠海市杰理科技股份有限公司 基于语音端点检测的音频编码方法及装置、设备、介质
US11545172B1 (en) * 2021-03-09 2023-01-03 Amazon Technologies, Inc. Sound source localization using reflection classification
CN114900246B (zh) * 2022-05-25 2023-06-13 中国电子科技集团公司第十研究所 噪声基底估计方法、装置、设备及存储介质

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4703505A (en) * 1983-08-24 1987-10-27 Harris Corporation Speech data encoding scheme
US4956871A (en) * 1988-09-30 1990-09-11 At&T Bell Laboratories Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands
JPH0934493A (ja) 1995-07-20 1997-02-07 Graphics Commun Lab:Kk 音響信号符号化装置、音響信号復号装置および音響信号処理装置
US6092041A (en) 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
US5797120A (en) * 1996-09-04 1998-08-18 Advanced Micro Devices, Inc. System and method for generating re-configurable band limited noise using modulation
US5924064A (en) * 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
US6167133A (en) * 1997-04-02 2000-12-26 At&T Corporation Echo detection, tracking, cancellation and noise fill in real time in a communication system
US6240386B1 (en) 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US7124079B1 (en) 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
RU2237296C2 (ru) * 1998-11-23 2004-09-27 Телефонактиеболагет Лм Эрикссон (Пабл) Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения
JP3804902B2 (ja) 1999-09-27 2006-08-02 パイオニア株式会社 量子化誤差補正方法及び装置並びにオーディオ情報復号方法及び装置
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
DE60233032D1 (de) * 2001-03-02 2009-09-03 Panasonic Corp Audio-kodierer und audio-dekodierer
US6876968B2 (en) 2001-03-08 2005-04-05 Matsushita Electric Industrial Co., Ltd. Run time synthesizer adaptation to improve intelligibility of synthesized speech
KR100871999B1 (ko) * 2001-05-08 2008-12-05 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
JP4506039B2 (ja) 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
KR100462611B1 (ko) * 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
JP4218271B2 (ja) * 2002-07-19 2009-02-04 ソニー株式会社 データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
KR100477699B1 (ko) * 2003-01-15 2005-03-18 삼성전자주식회사 양자화 잡음 분포 조절 방법 및 장치
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
ATE391988T1 (de) * 2003-10-10 2008-04-15 Agency Science Tech & Res Verfahren zum codieren eines digitalen signals in einen skalierbaren bitstrom, verfahren zum decodieren eines skalierbaren bitstroms
US7723474B2 (en) 2003-10-21 2010-05-25 The Regents Of The University Of California Molecules that selectively home to vasculature of pre-malignant dysplastic lesions or malignancies
US7436786B2 (en) * 2003-12-09 2008-10-14 International Business Machines Corporation Telecommunications system for minimizing the effect of white noise data packets for the generation of required white noise on transmission channel utilization
JP2005202248A (ja) * 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路
DE102004007200B3 (de) 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7613306B2 (en) * 2004-02-25 2009-11-03 Panasonic Corporation Audio encoder and audio decoder
ES2291877T3 (es) 2004-05-17 2008-03-01 Nokia Corporation Codificacion de audio con diferentes modelos de codificacion.
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US7873515B2 (en) * 2004-11-23 2011-01-18 Stmicroelectronics Asia Pacific Pte. Ltd. System and method for error reconstruction of streaming audio information
KR100707173B1 (ko) 2004-12-21 2007-04-13 삼성전자주식회사 저비트율 부호화/복호화방법 및 장치
US7885809B2 (en) * 2005-04-20 2011-02-08 Ntt Docomo, Inc. Quantization of speech and audio coding parameters using partial information on atypical subsequences
RU2419171C2 (ru) * 2005-07-22 2011-05-20 Франс Телеком Способ переключения скорости передачи битов при аудиодекодировании с масштабированием скорости передачи битов и масштабированием полосы пропускания
JP4627737B2 (ja) * 2006-03-08 2011-02-09 シャープ株式会社 デジタルデータ復号化装置
WO2007122614A2 (en) * 2006-04-21 2007-11-01 Galtronics Ltd. Twin ground antenna
JP4380669B2 (ja) * 2006-08-07 2009-12-09 カシオ計算機株式会社 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
US7275936B1 (en) * 2006-09-22 2007-10-02 Lotes Co., Ltd. Electrical connector
US8275611B2 (en) * 2007-01-18 2012-09-25 Stmicroelectronics Asia Pacific Pte., Ltd. Adaptive noise suppression for digital speech signals
EP2116997A4 (en) * 2007-03-02 2011-11-23 Panasonic Corp AUDIO DECODING DEVICE AND AUDIO DECODING METHOD
ES2858423T3 (es) 2007-08-27 2021-09-30 Ericsson Telefon Ab L M Método y dispositivo para el llenado de huecos espectrales
US9269372B2 (en) 2007-08-27 2016-02-23 Telefonaktiebolaget L M Ericsson (Publ) Adaptive transition frequency between noise fill and bandwidth extension
US8554550B2 (en) * 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multi resolution analysis
BR122021003726B1 (pt) * 2008-07-11 2021-11-09 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio.
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
WO2012053150A1 (ja) 2010-10-18 2012-04-26 パナソニック株式会社 音声符号化装置および音声復号化装置

Also Published As

Publication number Publication date
KR101582057B1 (ko) 2015-12-31
CA2730536A1 (en) 2010-01-14
CA2730361A1 (en) 2010-01-14
AU2009267459B2 (en) 2014-01-23
BR122021003097B1 (pt) 2021-11-03
US20110170711A1 (en) 2011-07-14
US11869521B2 (en) 2024-01-09
AR072482A1 (es) 2010-09-01
ZA201100091B (en) 2011-10-26
ES2422412T3 (es) 2013-09-11
CA2730536C (en) 2014-12-02
BR122021003142B1 (pt) 2021-11-03
EP2304719B1 (en) 2017-07-26
ES2642906T3 (es) 2017-11-20
EP3246918A1 (en) 2017-11-22
KR20140036042A (ko) 2014-03-24
HK1160285A1 (en) 2012-08-10
EG26480A (en) 2013-12-02
KR20160004403A (ko) 2016-01-12
KR101518532B1 (ko) 2015-05-07
US20240096337A1 (en) 2024-03-21
EP4235660A2 (en) 2023-08-30
EP4372744A1 (en) 2024-05-22
US20150112693A1 (en) 2015-04-23
US9449606B2 (en) 2016-09-20
ES2955669T3 (es) 2023-12-05
US20170004839A1 (en) 2017-01-05
ZA201100085B (en) 2011-10-26
KR20110039245A (ko) 2011-04-15
US9711157B2 (en) 2017-07-18
EP4372745A1 (en) 2024-05-22
RU2011102410A (ru) 2012-07-27
MY155785A (en) 2015-11-30
US20110173012A1 (en) 2011-07-14
BR122021003752B1 (pt) 2021-11-09
US20140236605A1 (en) 2014-08-21
AU2009267468B2 (en) 2012-03-15
HK1157045A1 (en) 2012-06-22
EP4375998A1 (en) 2024-05-29
CN102089806B (zh) 2012-12-05
TW201007696A (en) 2010-02-16
BRPI0910811A2 (pt) 2020-11-03
JP2011527455A (ja) 2011-10-27
JP5622726B2 (ja) 2014-11-12
JP5307889B2 (ja) 2013-10-02
MX2011000382A (es) 2011-02-25
CO6341671A2 (es) 2011-11-21
PL2304720T3 (pl) 2012-04-30
CN102089808A (zh) 2011-06-08
KR20110040829A (ko) 2011-04-20
CA2730361C (en) 2017-01-03
BRPI0910811B1 (pt) 2021-09-21
ATE535903T1 (de) 2011-12-15
WO2010003556A1 (en) 2010-01-14
MY178597A (en) 2020-10-16
EP2304720A1 (en) 2011-04-06
KR101251790B1 (ko) 2013-04-08
US9043203B2 (en) 2015-05-26
RU2512103C2 (ru) 2014-04-10
BR122021003726B1 (pt) 2021-11-09
CN102089808B (zh) 2014-02-12
TW201007697A (en) 2010-02-16
EP2304719A1 (en) 2011-04-06
AU2009267459A1 (en) 2010-01-14
EP2304720B1 (en) 2011-11-30
PT2304719T (pt) 2017-11-03
MX2011000359A (es) 2011-02-25
PL2304719T3 (pl) 2017-12-29
US20170309283A1 (en) 2017-10-26
CN102089806A (zh) 2011-06-08
US10629215B2 (en) 2020-04-21
EP4235660A3 (en) 2023-09-13
RU2519069C2 (ru) 2014-06-10
US20210272577A1 (en) 2021-09-02
CO6280569A2 (es) 2011-05-20
US11024323B2 (en) 2021-06-01
RU2011104006A (ru) 2012-08-20
WO2010003565A1 (en) 2010-01-14
KR101706009B1 (ko) 2017-02-22
ES2374640T3 (es) 2012-02-20
EP3246918C0 (en) 2023-06-14
EP3246918B1 (en) 2023-06-14
ES2526767T3 (es) 2015-01-15
TWI492223B (zh) 2015-07-11
AR072497A1 (es) 2010-09-01
JP2011527451A (ja) 2011-10-27
US8983851B2 (en) 2015-03-17
AU2009267468A1 (en) 2010-01-14
PL3246918T3 (pl) 2023-11-06
TWI417871B (zh) 2013-12-01
US20240096338A1 (en) 2024-03-21

Similar Documents

Publication Publication Date Title
BRPI0910522A2 (pt) preenchedor de ruídos, calculador do parâmetro de preenchimento de ruído, método para prover um parâmetro de preenchimento de ruído, método para prover uma representação espectral com preenchimento de ruído de um sinal de áudio, correspondente programa de computador e sinal codificado de áudio
ES2612516T3 (es) Método y dispositivo de codificación y decodificación de señal de audio
KR101341246B1 (ko) 수정된 이산 코사인 변환 오디오 코더에 대한 대역폭 확장 방법 및 장치
RU2631988C2 (ru) Заполнение шумом при аудиокодировании с перцепционным преобразованием
ES2942867T3 (es) Procesamiento de señales de audio durante la reconstrucción de alta frecuencia
TWI415115B (zh) 用以產生帶寬擴展輸出資料之裝置與方法
US8831959B2 (en) Transform audio codec and methods for encoding and decoding a time segment of an audio signal
US11521628B2 (en) Apparatus and method for encoding an audio signal using compensation values between three spectral bands
BRPI0715516A2 (pt) sistemas, mÉtodos e equipamentos para limitar fator de ganho
BR112014021054A2 (pt) controle de coerência de fase para sinais harmônicos nos codecs de áudio perceptuais
US20100250260A1 (en) Encoder
JP2008518264A (ja) 振幅の包絡線を有するパラメトリックオーディオコーディング
US20100280830A1 (en) Decoder
Chiu et al. Quad‐band excitation for low bit rate speech coding

Legal Events

Date Code Title Description
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]
B12B Appeal against refusal [chapter 12.2 patent gazette]
B350 Update of information on the portal [chapter 15.35 patent gazette]