BR112013031816B1 - Método e codificador de transformada de áudio para codificar um segmento de tempo de um sinal de áudio, e método e decodificador de transformada de áudio para decodificar um segmento de tempo codificado de um sinal de áudio - Google Patents

Método e codificador de transformada de áudio para codificar um segmento de tempo de um sinal de áudio, e método e decodificador de transformada de áudio para decodificar um segmento de tempo codificado de um sinal de áudio Download PDF

Info

Publication number
BR112013031816B1
BR112013031816B1 BR112013031816-3A BR112013031816A BR112013031816B1 BR 112013031816 B1 BR112013031816 B1 BR 112013031816B1 BR 112013031816 A BR112013031816 A BR 112013031816A BR 112013031816 B1 BR112013031816 B1 BR 112013031816B1
Authority
BR
Brazil
Prior art keywords
audio
signal
residual vector
measure
time segment
Prior art date
Application number
BR112013031816-3A
Other languages
English (en)
Other versions
BR112013031816A2 (pt
Inventor
Volodya Grancharov
Sigurdur Sverrisson
Original Assignee
Telefonaktiebolaget Lm Ericsson
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget Lm Ericsson filed Critical Telefonaktiebolaget Lm Ericsson
Publication of BR112013031816A2 publication Critical patent/BR112013031816A2/pt
Publication of BR112013031816B1 publication Critical patent/BR112013031816B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01LMEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
    • G01L19/00Details of, or accessories for, apparatus for measuring steady or quasi-steady pressure of a fluent medium insofar as such details or accessories are not special to particular types of pressure gauges
    • G01L19/02Arrangements for preventing, or for compensating for, effects of inclination or acceleration of the measuring device; Zero-setting means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Abstract

codec de transformada de áudio e métodos para codificar e decodificar um segmento de tempo de um sinal de áudio a presente invenção se refere a métodos e dispositivos para codificação/decodificação eficiente de um segmento de tempo de um sinal áudio. os métodos compreendem derivar um indicador z de posição em uma escala de frequência de um vetor residual associado com o segmento de tempo do sinal de áudio e derivar uma medida, (f), relacionada à quantidade de estrutura do vetor residual. os métodos ainda compreendem determinar se um critério predefinido envolvendo a medida (f), o indicador z e um limite predefinido (teta), foi cumprido, o que corresponde a estimar se uma modificação do sinal de pelo menos alguns dos coeficientes diferentes de zero do vetor residual seria audível após reconstrução do segmento de tempo do sinal de áudio. a respectiva amplitude dos coeficientes do vetor residual é codificada e os sinais dos coeficientes do vetor residual são codificados somente quando é determinado que o critério é cumprido e, dessa forma, que uma modificação do sinal seria audível.

Description

CAMPO TÉCNICO
[001] A presente invenção se refere à codificação e à decodificação de um segmento de tempo de um sinal de áudio e especialmente à codificação e decodificação em um codec de transformada de áudio.
FUNDAMENTOS
[002] É previamente conhecido o uso de esquemas de codificação de domínio da transformada, por exemplo, como aquele descrito na [1]. Abaixo, um resumo de alto nível de tais esquemas de codificação de domínio da transformada será dado.
[003] Em uma base de bloco por bloco, a configuração de onda a ser codificada é transformada para o domínio da frequência. Uma transformada comumente usada com esta finalidade é a, assim chamada, Transformada Discreta de Cosseno Modificada (MDCT). O assim obtido vetor da transformada de domínio da frequência é dividido em espectro de envelope (energia lentamente variada) e espectro residual. O espectro residual é obtido normalizando o vetor de domínio da frequência obtido com o dito espectro de envelope. O espectro de envelope é quantizado e os índices de quantização são transmitidos ao decodificador. Após, o espectro de envelope quantizado é usado como uma entrada para um algoritmo de distribuição de bits e os bits para a codificação dos vetores residuais são distribuídos com base nas características do espectro de envelope. Como um resultado desta etapa, um certo número de bits é destinado a diferentes partes do resíduo (vetores residuais ou "subvetores"). Alguns vetores residuais não recebem nenhum bit e têm de ser preenchidos com ruído ou ter estendida sua largura de banda, o que é ilustrado, por exemplo, na figura 1. Tipicamente, a codificação de vetores residuais é um procedimento de duas etapas; primeiro, as amplitudes dos elementos do vetor são codificadas e, após, o sinal (que não deve ser confundido com "a fase", que é associada com, por exemplo, a Transformada de Fourier) dos elementos diferentes de zero é codificado, o que é ilustrado, por exemplo, na figura 2. Índices de quantização para a amplitude residual e sinais são transmitidos ao decodificador, onde o espectro de envelope e o residual são combinados, e, finalmente transformados de volta ao domínio do tempo.
[004] Entretanto, quando o número de bits disponíveis para a codificação é limitado, tal como. por exemplo. em taxas de bit baixas ou moderadas. o resultado da codificação pode ser insatisfatório.
SUMÁRIO
[005] Seria desejável atingir um melhorado esquema de codificação de domínio da transformada. É um objetivo da invenção permitir a codificação eficiente em um codificador de transformada de áudio e a decodificação correspondente em um decodificador de transformada de áudio.
[006] De acordo com um primeiro aspecto, um método é fornecido em um codificador de transformada de áudio para codificar um segmento de tempo de um sinal de áudio. O método compreende derivar um indicador, z, de posição em uma escala de frequência de um vetor residual, associado com o segmento de tempo do sinal de áudio e derivar uma medida, 1), relacionada à quantidade de estrutura do vetor residual. O método ainda compreende determinar se um critério predefinido envolvendo a medida O, o indicador z e um limite predefinido O, foi cumprido, o que corresponde a estimar se uma modificação do sinal de pelo menos alguns coeficientes diferentes de zero do vetor residual seria audível após a reconstrução do segmento de tempo do sinal de áudio. A respectiva amplitude dos coeficientes do vetor residual é codificada e os sinais dos coeficientes do vetor residual são codificados somente quando é determinado que o critério é cumprido e, dessa forma, que uma modificação do sinal seria audível.
[007] De acordo um segundo aspecto, um codificador de transformada de áudio é fornecido para codificar um segmento de tempo de um sinal de áudio. O codificador de transformada de áudio compreende uma unidade funcional, que é adaptada para derivar um indicador, z, de posição em uma escala de frequência de um vetor residual associado com o segmento de tempo do sinal de áudio e derivar uma medida, cl), que é relacionada à quantidade de estrutura do vetor residual. O codificador de transformada de áudio ainda compreende uma unidade funcional, que é adaptada para determinar se um critério predefinido envolvendo cl), o indicador z e um limite predefinido O, foi cumprido. O codificador de transformada de áudio ainda compreende uma unidade funcional, que é adaptada para codificar a amplitude dos coeficientes do vetor residual e codificar o respectivo sinal dos coeficientes do vetor residual somente quando é determinado que o critério é cumprido.
[008] O método acima e o codificador de transformada de áudio podem ser usados para permitir eficiente codificação de transformada de sinais áudio. Ao aplicar o acima descrito método e o codificador de transformada de áudio, menos bits podem ser requeridos para codificar um sinal de áudio, em comparação a quando são usados os previamente conhecidos codificadores de transformada de áudio. Embora menos bits sejam usados para a codificação, a qualidade percebida do sinal de áudio reconstruído não á degradada, em comparação a quando são usados os previamente conhecidos codificadores de transformada de áudio. Ao contrário, os bits que são economizados podem ser, em vez disso, usados para codificar partes do sinal de áudio cuja qualidade percebida pode ser aprimorada ao ter acesso a um aumentado orçamento de bits para codificação. Dessa forma, o método e o arranjo acima permitem um esquema de distribuição de bits mais eficiente para os codecs de áudio de domínio da transformada já que os bits podem ser deslocados em direção a parâmetros de sinal, no sinal de áudio, que são mais críticos para a qualidade percebida do sinal de áudio reconstruído. Dessa forma, uma melhora global da qualidade pode ser alcançada ao preservar um certo orçamento de bits.
[009] De acordo com uma terceira modalidade, um método é fornecido em um decodificador de transformada de áudio para decodificar um segmento de tempo codificado de um sinal de áudio. O método compreende decodificar as amplitudes dos coeficientes de um vetor residual de um segmento de um vetor de transformada associado com o segmento de tempo do sinal de áudio. O método ainda compreende derivar um indicador, z, de posição em uma escala de frequência do vetor residual e derivar uma medida Φ, O, relacionada à quantidade de estrutura do vetor residual. O método ainda compreende determinar se um critério predefinido envolvendo a medida Φ, o indicador z e um limite predefinido θ, está cumprido, o que corresponde a estimar se uma modificação de sinal de pelo menos alguns coeficientes diferentes de zero do vetor residual seria audível após a reconstrução do segmento de tempo do sinal de áudio. Quando é determinado que o critério é cumprido. o que corresponde a que uma modificação de sinal seria audível no sinal de áudio reconstruído, o sinal dos coeficientes do vetor residual são codificados. Quando é determinado que o critério não é cumprido, e, dessa forma, que uma modificação do sinal não seria audível no sinal de áudio reconstruído. um respectivo sinal aleatório dos coeficientes diferentes de zero do vetor residual é gerado.
[0010] De acordo com uma quarta modalidade, um decodificador de transformada de áudio é fornecido para decodificar um segmento de tempo codificado de um sinal de áudio. O decodificador de transformada de áudio compreende uma unidade funcional que é adaptada para decodificar a respectiva amplitude dos coeficientes de um vetor residual de um segmento de um vetor de transformada associado com o segmento de tempo do sinal de áudio. O decodificador de transformada de áudio ainda compreende uma unidade funcional que é adaptada para derivar um indicador, z, de posição em uma escala de frequência do vetor residual e para derivar uma medida, Φ, relacionada à quantidade de estrutura do vetor residual. O decodificador de transformada de áudio ainda compreende uma unidade funcional que é adaptada para determinar se um critério predefinido envolvendo a medida Φ, o indicador z e um limite predefinido θ, foi cumprido. O decodificador de transformada de áudio é ainda adaptado para decodificar o sinal dos coeficientes diferentes de zero do vetor residual somente quando o critério está determinado a ser cumprido. O decodificador de transformada de áudio ainda compreende uma unidade funcional que é adaptada para gerar um respectivo sinal aleatório para os coeficientes diferentes de zero do vetor residual quando é determinado que o critério não é cumprido.
[0011] O método acima em um decodificador e um codec/decodificador de transformada de áudio pode ser usado para decodificar sinais de áudio que são codificados usando o método e codificador de transformada de áudio descritos acima e, dessa forma, permite a eficiente codificação e melhorada distribuição dos bits discutida acima.
[0012] Os métodos acima e o codificador/decodificador de transformada de áudio, ou codec, podem ser implementados em modalidades diferentes. Em algumas modalidades, a medida, (1), é uma, assim chamada, medida de nivelamento espectral. O critério predefinido pode ser formulado como
Figure img0001
onde o.)| e co 2 são fatores de escala e o θ é um limite que depende da taxa de bits b do codec (codificador/decodificador), ®1 e co2 e θ, podem ser, pelo menos em parte, derivados de dados de percepção empírica.
[00|3] Ainda, o limite θ pode ser configurado para aumentar com o aumento da taxa de bits do codec. Isto dá a vantagem de que a codificação é adaptada para a quantidade de bits que estão disponíveis para a codificação. Por exemplo, em altas taxas de bits, o orçamento de bits pode permitir que os sinais dos coeficientes diferentes de zero da maioria, ou até mesmo de todos os vetores residuais, sejam codificados. Se o limite θ é configurado para aumentar com uma taxa de bits aumentada (e, dessa forma, o orçamento de bits), o limite θ pode ser configurado tal que o critério será cumprido para a maioria (ou todos) dos vetores residuais em altas taxas de bits, enquanto para taxas de bits mais baixas (e dessa forma orçamentos do bit mais restringidos), mais vetores residuais serão codificados pela amplitude, mas serão atribuídos sinais aleatórios no decodificador.
[0014] Ainda, a medida. Φ, pode ser derivada somente quando o indicador, Z, indica que o vetor residual está localizado em frequências acima de uma frequência de cruzamento predefinida Zc que depende da taxa de bits b do codec (codificador/decodificador). Com isso, o cálculo bastante complexo de Φ pode ser evitado para vetores residuais dos quais uma modificação do sinal de alguns dos coeficientes seria, mais provavelmente, audível em um sinal de áudio reconstruído. Dessa forma, os recursos computacionais podem ser economizados. Uma frequência de cruzamento que aumenta, com aumentada taxa de bits e orçamento de bits, assegura que os sinais de mais vetores residuais codificados pela amplitude serão codificados quando o orçamento de bits permitir.
[0015] Em modalidades onde um esquema de Codificação por Pulso Fatorial, FPC, é usado para codificar o vetor residual. a medida ΦFPC pode ser derivada de um modo muito computacionalmente eficiente de baixa complexidade, a saber:
Figure img0002
onde NNZP é o número de posições diferentes de zero no vetor residual, e NTP é o número total de pulsos no vetor residual.
[0016] As modalidades acima foram principalmente descritas quanto a um método. Entretanto, a descrição acima também é destinada a abranger modalidades do codificador e decodificador de transformada de áudio, adaptado para permitir o desempenho dos acima descritos atributos. Os diferentes atributos das modalidades exemplares acima podem ser combinados de maneiras diferentes, de acordo com a necessidade, as exigências ou a preferência.
BREVE DESCRIÇÃO DOS DESENHOS
[0017] A invenção será descrita agora em mais detalhes por meio de modalidades exemplificativas e com referência aos desenhos acompanhantes, em que: A figura 1 é um diagrama esquemático ilustrando um espectro de envelope e a codificação de um resíduo correspondente, de acordo com a técnica prévia.
[0018] A figura 2 é um diagrama ilustrando os dois estágios da quantização residual. O gráfico no topo ilustra o resultado da primeira etapa da quantização residual, onde a amplitude de cada elemento de vetor é codificada independente do sinal. O gráfico ao fundo ilustra a segunda etapa da quantização, onde o sinal é adicionado à amplitude já codificada. Adicionar o sinal é equivalente à multiplicação com +1 ou-1.
[0019] A figura 3 é um diagrama esquemático ilustrando um espectro de envelope e um resíduo correspondente, de acordo com uma modalidade exemplificativa da invenção.
[0020] A figura 4 é um fluxograma ilustrando as ações em um procedimento, em um codificador de transformada de áudio, de acordo com uma modalidade exemplificativa.
[0021] A figura 5 é um diagrama de blocos ilustrando um codificador de transformada de áudio, de acordo com uma modalidade exemplificativa.
[0022] A figura 6 é um fluxograma ilustrando as ações em um procedimento, em um decodificador de transformada de áudio, de acordo com uma modalidade exemplificativa.
[0023] A figura 7 é um diagrama de blocos ilustrando um decodificador de transformada de áudio, de acordo com uma modalidade exemplificativa.
[0024] A figura 8 é uni diagrama de blocos ilustrando um arranjo em um codificador de transformada de áudio transformar, de acordo com uma modalidade exemplificativa.
DESCRIÇÃO DETALHADA
[0025] Nos esquemas convencionais delineados acima, a distribuição de bits a vetores residuais diferentes é inteiramente baseada no espectro de envelope. O novo esquema para codificação da transformada descrito neste pedido permite a economia de bits com base na análise dos vetores residuais e o esquema pode ser aplicado em esquemas de codificação de domínio da transformada onde a amplitude e o sinal relacionados a vetores residuais são codificados sequencialmente. O novo esquema permite uma codificação mais eficiente de certas regiões de sinais de áudio, em comparação com métodos convencionais, permitindo a economia de bits que foram anteriormente usados na codificação de características, em particular, vetores residuais, cujas características não são, de fato, audíveis no original e/ou no sinal de áudio reconstruído.
[0026] Por "vetor residual", é neste pedido entendido uma parte ou segmento do resíduo de um vetor da transformada relacionado a um segmento de tempo de um sinal de áudio. Dessa forma, um vetor residual também pode ser denotado "subvetor residual", ou similar.
[0027] O termo "codec de transformada de áudio" ou "codec de transformada" abrange um par codificador-decodificador e é o termo que é comumente usado no campo. Dentro desta revelação, os termos "codificador de transformada de áudio" e "decodificador de transformada de áudio" são usados, a fim de, separadamente, descrever as funções/partes de um codec de transformada. Os termos "codificador de transformada de áudio" e "decodificador de transformada de áudio" poderiam, dessa forma, serem trocados para, ou interpretados como, o termo "codec de transformada de áudio" ou "codec de transformada". O codificador e o decodificador operam na mesma taxa de bits. Dessa forma, as expressões "a taxa de bits do codificador" ou "a taxa de bits do decodificador" poderiam ser trocadas para, ou interpretadas como, "a taxa de bits do codec".
[0028] A figura 1 ilustra o espectro de envelope de um vetor da transformada correspondendo a um segmento de tempo de um sinal de áudio. Ainda, na figura 1, a codificação de um resíduo correspondente é ilustrada pela linha 102. As partes sólidas da linha ilustram vetores residuais que são codificados e as partes pontilhadas da linha ilustram os vetores residuais que não são codificados, mas que são, em vez disso, preenchidos com ruído ou têm sua largura de banda estendida. As seções que são preenchidas com ruído ou têm sua largura de banda estendida, são tipicamente vetores residuais de baixa energia. Nenhum bit é usado na codificação destes vetores residuais, mas, em vez disso, o receptor/decodificador, por exemplo, preenche a "lacuna" do ruído ou copia outro, por exemplo. vetor residual vizinho, que é usado no lugar do não codificado e, portando, vetor residual "ausente".
[0029] A figura 2 ilustra a codificação de um vetor residual quantizado compreendendo oito elementos ou caixas de frequência. O gráfico superior mostra a amplitude dos elementos do vetor residual, que é codificado em uma primeira etapa da codificação. O gráfico inferior mostra a amplitude e também o sinal dos oito elementos. O sinal de cada elemento é codificado em uma segunda etapa da codificação. Um "vetor residual" poderia compreender quantidades diferentes de elementos dependendo, por exemplo, de que codec é usado ou de posição na frequência do vetor residual.
[0030] Como anteriormente mencionado, há regiões de sinais de áudio que podem ser mais eficientemente codificadas e, dessa forma, bits podem ser economizados, os quais podem ser melhor usados em outro lugar. Entretanto, de modo a tratar estas regiões de um modo especial, eles têm de ser identificados, o que não é um problema trivial. Abaixo, um esquema para identificar ou selecionar tais regiões em um sinal de áudio e para codificar estas regiões de uma maneira eficiente será descrito. Quanto mais regiões que poderiam ser mais eficientemente codificadas, mais bits podem ser economizados. Entretanto, os bits devem ser preferencialmente economizados sem causar qualquer degradação perceptiva do sinal de áudio reconstruído.
[0031] O sistema auditivo humano é muito sofisticado e tem certas propriedades que ainda são inexplicadas, apesar de numerosas tentativas feitas por pesquisadores, por exemplo, no campo da percepção, para encontrar uma explicação, por exemplo, através da execução de vários testes de escuta fundamentais. Uma tal propriedade ainda inexplicada é a significância da fase em sinais áudio. Entretanto, testes de escuta fundamentais onde diferentes estímulos de áudio construídos com fase variando tem sido apresentado a ouvintes, tem resultado em alguns conhecimentos básicos. Por exemplo, um atributo do sistema auditivo humano é que os segmentos de sinal "similares a um ruído" soam da mesma forma para um ouvinte, mesmo se a fase original dos segmentos de sinal for modificada. Em outras palavras, é muito difícil para um ouvinte humano perceber a diferença entre diferentes realizações do ruído. Ainda, quanto mais alta a frequência de um segmento de sinal de áudio, menos sensível o sistema auditivo humano é para diferenças de fase, que, dessa forma, ficam menos audíveis com a frequência aumentada.
[0032] No esquema sugerido neste pedido, para melhorar a eficiência da codificação da transformada de áudio, as acima descritas propriedades do sistema auditivo humano são exploradas e utilizadas para a codificação de um sinal de áudio. Na codificação da transformada de áudio, o sinal dos coeficientes da transformada é relacionado à fase do sinal de áudio. As propriedades são utilizadas de modo que, somente a amplitude e não o sinal dos elementos diferentes de zero, ou coeficientes, em um vetor residual e codificada quando é previsto que uma mudança no sinal de pelo menos alguns dos coeficientes diferentes de zero do vetor residual, não seria audível após a reconstrução do segmento de tempo do sinal de áudio. Isso também poderia ser expresso de modo, que tanto a amplitude e o sinal dos elementos, ou coeficientes, diferentes de zero em um vetor residual são codificados somente quando é previsto que uma mudança no sinal de pelo menos alguns dos coeficientes diferentes de zero do vetor residual seria audível após a reconstrução do segmento de tempo do sinal de áudio.
[0033] A identificação e a seleção de vetores residuais para os quais a codificação do sinal pode ser omitida sem perceptualmente degradar o sinal de áudio reconstruído e, de que vetores residuais, dessa forma, a amplitude, mas não o sinal, deve ser codificada, é baseada em dois parâmetros: • uma medida, Φ, que reflete a "estrutura" do vetor residual, por exemplo, uma assim chamada "medida de nivelamento" (onde "nivelamento" se refere à distribuição de energia sobre a frequência). Preferencialmente, a medida Φ deve ser possível de calcular ou derivar, com base em um vetor residual "codificado pela amplitude" em um decodificador, tal que nenhum bit tenha de ser usado na sinalização desta medida do codificador para o decodificador. Nesta descrição, a medida Φ é um valor entre 0 e 1 (Φ e (0.1)), onde os segmentos de sinal similares a um ruído tendo uma baixa quantidade de estrutura, tal como, por exemplo, no ruído branco, rendem um valor em direção a Φ = 1, e segmentos de sinal tendo uma alta quantidade de estrutura tal como, por exemplo, em um sinal compreendendo tons (sinusoides) em algumas frequências, rendem um valor em direção a Φ = 0.
[0034] • um índice de frequência, zi, do vetor residual particular i. O índice de frequência zi, deve indicar onde, em uma escala de frequência, o vetor residual i é posicionado. Na seguinte descrição, assume-se que os vetores residuais são ordenados, por exemplo. tais que: um vetor com o índice z=1 ocupa, por exemplo, frequências de 1- 200Hz, um vetor com o índice z=2 ocupa frequências, por exemplo, de 201-400Hz, e um vetor com o índice z=3 ocupa frequências, por exemplo, de 401-600Hz, etc. Deste modo, aqui, um maior valor do índice de frequência z, corresponde a um vetor residual i, que é centralizado em frequências mais altas (do que um vetor residual tendo uni índice de frequência menor).
[0035] Estes parâmetros, Φ e z, refletem as duas propriedades do sistema auditivo humano discutidas, em que: Φ indica quão similar a um ruído um sinal é, o que reflete a propriedade de que os segmentos de sinal "similares a um ruído" soam da mesma forma mesmo se sua fase original for substituída; z indica a posição em uma escala de frequência, o que reflete a propriedade de que as diferenças de fase são menos audíveis em frequências mais altas.
[0036] A assim chamada medida de nivelamento (1) é relacionada à distribuição de energia sobre a frequência e à quantidade de estrutura no vetor residual e é definida como:
Figure img0003
onde xn, é o vetor residual codificado pela amplitude (isto é, nenhum sinal é necessário, cf. primeiro gráfico na figura 2) da dimensão N = 8. Da definição da medida de nivelamento, segue que Φ θ (0, 1), e Φ —> 0 quando a quantidade de estrutura aumenta.
[0037] Uma vez que o sinal se torna mais importante com a redução do Φ (em direção à quantidade mais alta da estrutura) e a redução do z (em direção a frequências audíveis mais baixas). e vice-versa, a decisão sobre codificar o sinal ou não pode, ser feita em uma base de vetor por vetor, por exemplo, de acordo com (2), tal que o sinal é codificado quando certo critério é cumprido, e o sinal não é codificado quando o critério não é cumprido (ou vice-versa, dependendo de como o critério é formulado):
Figure img0004
[0038] Aqui, ®i e ®2 são fatores de escala que foram empiricamente encontrados. O limite θ(b), que também foi empiricamente encontrado, é, aqui, dependente da taxa de bits do codec, b, onde b, por exemplo, pode assumir os valores b G {24,32,64,96,128} kbit/s. Quando θ(b) é projetado para aumentar, com a taxa de bits do codec, menos vetores serão codificados com fase aleatória (isto é, amplitude codificada, mas não sinal) em taxas de bits mais altas.
[0039] O sinal é perceptualmente relevante em baixas frequências e, por isso, na prática o sinal vai, quase sem exceção, ser codificado abaixo de alguma determinada frequência. Consequentemente. uma redução de complexidade pode ser alcançada pela introdução de uma regra dizendo que a medida de nivelamento Φ não deve ser calculada para vetores residuais abaixo de uma certa frequência, Z. Por exemplo, a lógica em (2) pode ser usada somente para vetores residuais acima de uma frequência de "cruzamento" predefinida Zc(b); ao passo que, para vetores residuais abaixo da frequência de "cruzamento" Zc(b), a fase é "sempre" codificada, sem o cálculo de Φ. Isto pode ser formulado em um pseudocódigo como:
Figure img0005
[0040] No caso da utilização de um esquema de Codificação por Pulso Fatorial (FPC), descrito, por exemplo, na [2], para codificação residual, um cálculo de baixa complexidade de Φ é possível, pelo menos para baixas e moderadas taxas de bits de codecs. Uma vez que, na FPC, um vetor residual codificado pela amplitude consiste de pulsos de unidade adicionados a certas posições ou caixas de frequências/frequências (possivelmente uma no topo da outra), a quantidade de estrutura em tal vetor residual pode ser medida como:
Figure img0006
onde NNZP é o número de posições diferentes de zero no vetor e NTP é o número total de pulsos no vetor. A execução (4) envolve complexidade muito baixa, já que todos os parâmetros necessários (NNZP e NTP) estão prontamente disponíveis na codificação convencional FPC. Esta "aproximação" ou cálculo de baixa complexidade de Φ é válida quando um número moderado de pulsos é destinado a um vetor residual.
[0041] Dessa forma, para cada vetor residual para o qual somente a amplitude, e não o sinal, é codificada, tantos bits quantos coeficientes diferente de zero no vetor podem ser economizados, em comparação com métodos convencionais. Os bits economizados podem ser redistribuídos para o uso, por exemplo, na codificação de outros vetores residuais que se beneficiariam de um "orçamento de bits de codificação" aumentado, de acordo com os esquemas de distribuição de bits conhecidos. O esquema real para a redistribuição dos bits não é parte da invenção.
[0042] Na figura 3, os vetores residuais para os quais a amplitude, mas não o sinal, é codificada conforme uma modalidade de exemplificação são ilustrados por uma linha dupla. A linha única e a linha pontilhada representam a mesma codificação da figura 1, isto é. codificação tanto da amplitude quanto do sinal (linha única), e nenhuma codificação em absoluto (linha pontilhada). Dessa forma, pode ser visto na figura 3 que usar o esquema sugerido para codificação melhorada de vetores residuais resulta na economia de bits, em comparação com a codificação ilustrada na figura 1.
[0043] Uma modalidade exemplificativa do procedimento para codificação de um segmento de tempo de um sinal de áudio será descrita abaixo, com referência à figura 4. O procedimento é adequado para o uso em um codificador de transformada de áudio, tal como, por exemplo, um codificador MDCT ou outro codificador onde a amplitude do vetor residual, e o sinal, são codificados separadamente ou sequencialmente. O sinal de áudio é primariamente pensado para compreender a fala, mas pode também, ou alternativamente, compreender, por exemplo, música.
[0044] Inicialmente, um vetor residual é obtido em uma ação 402. O vetor residual é derivado usando qualquer método adequado para esse fim, por exemplo, um método em que são usados codecs MDCT convencionais, e é derivado de um segmento de um vetor da transformada associado com o segmento de tempo do sinal de áudio. É previamente sabido como derivar um vetor residual.
[0045] Então, um indicador, z, de posição em uma escala de frequência do vetor residual é derivado em uma ação 404. Como previamente descrito o, z pode ser um número inteiro, onde um valor mais alto de z indica que o vetor residual compreende frequências mais altas, tal como, por exemplo, z=1 indica as frequências 1-200Hz; z=2 indica as frequências 201400Hz etc. Outras alternativas de indexação são, também, possíveis, cujas alternativas seriam então, possivelmente requerer um ajuste correspondente de outros parâmetros descritos abaixo a fim de permitir a correta identificação de vetores residuais para os quais a amplitude. mas não o sinal, poderia ser codificada.
[0046] Ainda, a medida da estrutura, Φ, é derivada em uma ação 410. O Φ poderia ser derivado como, a assim chamada, medida de nivelamento, que é definida na equação (1) acima. No caso do FPC, o Φ pode ser derivado como definido na equação (4) acima. Ao aplicar uma frequência de cruzamento Zc, abaixo da qual, ambos, a amplitude e o sinal, devem ser codificados, pode ser determinado em uma ação 406, se o índice z do vetor residual indica frequências abaixo da frequência de cruzamento Zc ou não, e a ação pode ser tomada conforme o resultado da ação 406. Quando se determina que z indica frequências abaixo da frequência de cruzamento Zc tanto a amplitude quanto o sinal do vetor residual são codificados em uma ação 408; e quando se determina que z indica frequências acima da frequência de cruzamento Zc, a medida Φ é derivada na ação 410.
[0047] Ainda, quando Φ foi derivado, é determinado em uma ação 412 se um critério predefinido envolvendo a medida Φ, o indicador z e um limite predefinido θ, foi cumprido. O critério deve ser formulado de tal modo que determinar se o critério é cumprido corresponde a estimar se uma modificação do sinal de pelo menos alguns coeficientes diferentes de zero do vetor residual seria audível após a reconstrução do segmento de tempo do sinal de áudio.
[0048] Dessa forma, quando é determinado que o critério é cumprido, e como resultado que uma modificação do sinal seria audível, a amplitude e o sinal são codificados em uma ação 408. Quando é determinado que o critério não é cumprido, a amplitude, mas não o sinal, é codificada em uma ação 412. O critério pode ser alternativamente formulado tal que a amplitude e o sinal devem ser codificados quando o critério não é cumprido, e a amplitude, mas não o sinal, deve ser codificada quando o critério é cumprido. Esta alternativa é ilustrada pelo operador e resultados alternativos em parênteses, em associação com a ação 412 na figura 4 Considera-se que esta formulação alternativa do critério é coberta pela formulação das reivindicações independentes, embora sejam, por razões de legibilidade e clareza, direcionadas à primeira alternativa.
[0049] O critério poderia ser formulado como: ',J θ ' onde o.)| e w2 são fatores de escala; e θ é um limite que pode depender da taxa de bits b do codificador/codec. O limite θ é preferencialmente configurado para aumentar, com o aumento da taxa de bits, como anteriormente descrito.
[0050] Os fatores de escala ®1 e w2 podem ser empiricamente encontrados pela realização dos testes de escuta. Nos testes de escuta, os ouvintes podem instruí-los a indicar como um sinal de teste de áudio é percebido por exemplo, se qualquer degradação do sinal é percebida, usando sinais de teste derivados para valores diferentes de ®1 e w2. O limite θ pode ser derivado de um modo similar em testes de escuta, para esse fim projetados gerando dados de percepção empírica. Em uma particular implementação onde Φ e z são escalados para estar entre 0 e 1, os valores de exemplo de ®1 e w2 podem ser, por exemplo, ®1=0,2 e w2=0,8: e O pode ser um valor entre 0 <θ <2.
[0051] Abaixo, um codificador de transformada de áudio exemplificativo adaptado para realizar o acima descrito procedimento para codificar um segmento de tempo de um sinal de áudio, será descrito com referência à figura 5. O codificador de transformada de áudio pode ser. por exemplo, um codificador MDCT ou outro codificador, onde a amplitude do vetor residual e o sinal são codificados separadamente ou sequencialmente.
[0052] O codificador de transformada de áudio 501 é ilustrado com referência a como se comunica com outras entidades através de uma unidade de comunicação 502, que pode-se considerar compreender meios convencionais para entrada e saída de dados. A parte do codificador de transformada de áudio que é adaptada para habilitar o desempenho do acima mencionado procedimento descrito é ilustrada como o arranjo 500, circundado por uma linha tracejada. O codificador de transformada de áudio pode compreender ainda outras unidades funcionais 514, como, por exemplo, unidades funcionais que fornecem funções de codificador regulares, e pode compreender, ainda, uma ou mais unidades de armazenamento 512.
[0053] O codificador de transformada de áudio 501, e/ou o arranjo 500, podem ser implementados, por exemplo, por um ou mais de: um processador ou microprocessador e um programa adequado, Dispositivo Lógico Programável (PLD) ou outro(s) componente (s) eletrônico(s).
[0054] O codificador de transformada de áudio compreende uma unidade de obtenção 504, que é adaptada para derivar, receber ou recuperar um vetor residual de um segmento de um vetor da transformado associado com o segmento de tempo do sinal de áudio. Ainda, o codificador de transformada de áudio compreende uma unidade de derivação 506. que é adaptada para derivar um indicador, z, de posição em uma escala de frequência do vetor residual e uma medida, cl), relacionada à quantidade de estrutura do vetor residual. O codificador de transformada de áudio ainda compreende uma unidade de determinação 508, que é adaptada para determinar se um critério predefinido envolvendo a medida 1). o indicador z e um limite predefinido O, foi cumprido, dessa forma, estimando se uma modificação do sinal de pelo menos alguns dos coeficientes diferentes de zeros do vetor residual seria audível após a reconstrução do segmento de tempo do sinal de áudio, como anteriormente descrito. Ainda, o codificador de transformada de áudio compreende uma unidade de codificação 510, adaptada para codificar a amplitude dos coeficientes do vetor residual e codificar o sinal dos coeficientes do vetor residual somente quando é determinado que o critério é cumprido e. dessa forma, que uma modificação do sinal seria audível.
[0055] O codificador de transformada de áudio pode ser adaptado de modo que, uma ou mais das alternativas do procedimento descrito acima podem ser realizadas. Por exemplo, o codificador de transformada de áudio pode ser adaptado para derivar a medida, Φ. como uma, assim chamada, medida de nivelamento espectral, por exemplo, como N
Figure img0007
n=l ou, no caso da FPC, como: TP como anteriormente descrito.
[0056] O codificador de transformada de áudio pode ser ainda adaptado para derivar a medida, Φ, somente quando o indicador, z. indica que o vetor residual está associado com frequências acima de uma frequência de cruzamento predefinida Zc. A frequência de cruzamento Zc pode depender da taxa de bits b do codificador/codec.
[0057] O codificador de transformada de áudio pode ser ainda adaptado para aplicar o critério predefinido ; ,J ° ' (b) para estimar se uma modificação do sinal de pelo menos alguns dos coeficientes diferentes de zero do vetor residual seria audível após reconstrução do segmento de tempo do sinal áudio, onde m1 e m2 são fatores de escala que podem ser baseados em resultados experimentais empíricos; e θ é um limite que depende da taxa de bits b do codificador/codec Decodificador
[0058] Uma correspondente modalidade exemplificativa do procedimento para decodificar um segmento de tempo codificado de um sinal de áudio será descrita abaixo. com referência à figura 6. O procedimento é adequado para o uso em um decodificador de transformada de áudio, tal como, por exemplo, um codificador MDCT, ou outro codificador, onde a amplitude de vetor residual e o sinal são codificados separadamente ou sequencialmente.
[0059] O procedimento no decodificador de transformada de áudio é similar ao procedimento no codificador de transformada de áudio, mas adaptado à decodificação em alguns aspectos. É presumido que o codificador de transformada de áudio recebeu um sinal de áudio codificado, que foi codificado por um codificador de transformada de áudio. Um vetor residual codificado de um segmento de um vetor da transformada associado com um segmento de tempo do sinal de áudio é obtido em uma ação 602. (Esta ação também é realizada nos decodificadores de transformada de áudio convencionais). A respectiva amplitude dos coeficientes do vetor residual é decodificada em uma ação 603 (mas não ainda o sinal).
[0060] Um indicador, z, de posição em uma escala de frequência do vetor residual é derivado em uma ação 604; uma medida, Φ, relacionada à quantidade de estrutura do vetor residual é derivada em uma ação 610; e é determinado em uma ação 612, se um critério predefinido envolvendo a medida Φ, o indicador z e um limite predefinido θ, foi cumprido, dessa forma, estimando se uma modificação do sinal de pelo menos alguns dos coeficientes diferentes de zero do vetor residual seria audível após a reconstrução do segmento de tempo do sinal de áudio. As ações 604, 610 e 612 correspondem às ações previamente descritas 404, 410 e 412 no codificador, mas no decodificador estas ações são realizadas de modo a determinar se o sinal dos coeficientes foi codificado ou não.
[0061] Em correspondência com a ação 406 no codificador, pode ser determinado em uma ação 606, se o índice z do vetor residual indica frequências abaixo de uma frequência de cruzamento Zc, ou não. Quando se considera que z indica frequências abaixo da frequência de cruzamento Zc, os sinais dos coeficientes diferentes de zero no vetor residual são decodificados em uma ação 608; e quando se considera que z indica frequências acima da frequência de cruzamento Zc a medida Φ é derivada na ação 610.
[0062] Quando é determinado na ação 612 que o critério é cumprido e, dessa forma, determinou que uma modificação do sinal seria audível, os sinais dos coeficientes diferentes de zero do vetor residual são decodificados na ação 608. Quando é determinado na ação 612 que o critério não é cumprido e, dessa forma. determinado que uma modificação do sinal não seria audível, um respectivo sinal aleatório dos coeficientes diferentes de zero do vetor residual é gerado em uma ação 614.
[0063] Abaixo, uma codificação de transformada de áudio exemplificativa, adaptada para realizar o acima descrito procedimento para decodificar um segmento de tempo de um sinal de áudio será descrita com referência à figura 7. O decodificador de transformada de áudio pode ser, por exemplo, um decodificador MDCT ou outro decodificador, onde a amplitude do vetor residual e o sinal são decodificados separadamente ou sequencialmente.
[0064] O decodificador de transformada de áudio 701 é ilustrado com referência a como se comunica com outras entidades através de uma unidade de comunicação 702, que se pode considerar compreender meios convencionais de entrada e saída de dados. A parte do decodificador de transformada de áudio que é adaptada para habilitar o desempenho do acima mencionado procedimento descrito, é ilustrada como um arranjo 700, circundado por uma linha tracejada. O codificador de transformada de áudio pode compreender ainda outras unidades funcionais 716, como, por exemplo, unidades funcionais fornecendo funções de decodificação regulares e pode compreender, ainda, uma ou mais unidades de armazenamento 714.
[0065] O decodificador de transformada de áudio 701, e/ou o arranjo 700, poderiam ser implementados, por exemplo, por um ou mais de: um processador ou um microprocessador e um programa adequado, um Dispositivo Lógico Programável (PLD) ou outro(s) componente(s) eletrônico(s).
[0066] O decodificador de transformada de áudio compreende uma unidade de obtenção 704, que é adaptada para receber ou recuperar um vetor residual codificado de um segmento de um vetor da transformada associado com o segmento de tempo do sinal de áudio. Ainda, o decodificador de transformada de áudio compreende uma unidade de decodificação 710, que é adaptada para decodificar a respectiva amplitude dos coeficientes do vetor residual.
[0067] Ainda, o decodificador de transformada de áudio compreende uma unidade de derivação 706, que é adaptada para derivar um indicador, z. de posição em uma escala de frequência do vetor residual, e derivar uma medida, Φ, relacionada à quantidade de estrutura do vetor residual. O decodificador de transformada de áudio ainda compreende uma unidade de determinação 708, que é adaptada para determinar se um critério predefinido envolvendo a medida Φ, o indicador z e um limite predefinido θ, foi cumprido, dessa forma, estimando se uma modificação do sinal de pelo menos alguns dos coeficientes diferentes de zero vetor residual seria audível após a reconstrução do segmento de tempo do sinal de áudio, como anteriormente descrito. A unidade de decodificação 710 é, ainda, adaptada para decodificar o respectivo sinal dos coeficientes diferentes de zero do vetor residual quando é determinado que o critério é cumprido e, dessa forma, que uma modificação do sinal seria audível.
[0068] O decodificador de transformada de áudio ainda compreende um gerador de sinal 712, que é adaptado para gerar um respectivo sinal aleatório dos coeficientes diferentes de zero do vetor residual quando é determinado que o critério descrito acima não foi cumprido e. dessa forma. que uma modificação do sinal não seria audível.
[0069] O decodificador de transformada de áudio pode ser adaptado de modo que uma ou mais alternativas do procedimento descrito acima podem ser realizadas. Por exemplo, o codificador de transformada de áudio pode ser adaptado para derivar a medida, O, como uma, assim chamada, medida de nivelamento espectral. por exemplo. como
Figure img0008
ou, no caso da FPC, como:
Figure img0009
como anteriormente descrito.
[0070] O decodificador de transformada de áudio pode ser, ainda, adaptado para derivar a medida, Φ, somente quando o indicador, z, indica que o vetor residual está associado com frequências acima de uma frequência de cruzamento predefinida Zc. A frequência de cruzamento Zc, pode depender da taxa de bits b do decodificador/codec.
[0071] O decodificador de transformada de áudio pode ser ainda adaptado para aplicar o critério predefinido θ ' (b) para estimar se uma modificação do sinal de pelo menos alguns dos coeficientes diferentes de zero do vetor residual seria audível após a reconstrução do segmento de tempo do sinal de áudio, onde ®1 e w2 são fatores de escala que podem ser baseados em resultados experimentais empíricos e θ é um limite que depende da taxa de bits b do decodificador/codec.
[0072] A figura 8 esquematicamente mostra uma modalidade do arranjo 800 adequada para o uso em um codificador de transformada de áudio, que também pode ser um modo alternativo de descrever uma modalidade do arranjo para o uso em um codificador de transformada de áudio ilustrado na figura 5. Compreendidos no arranjo 800 estão, aqui, uma unidade de processamento 806, por exemplo, com um DSP (Processador de Sinal digital). A unidade de processamento 806 pode ser uma unidade única ou uma pluralidade de unidades para realizar etapas diferentes dos procedimentos descritos neste pedido. O arranjo 800 também compreende a unidade de entrada 802 para receber sinais, tais como um sinal de referência em uma versão limpa e uma versão degradada e a unidade de saída 804 para o(s) sinal(is) de saída, tal como uma estimativa de qualidade. A unidade de entrada 802 e a unidade de saída 804 podem ser arranjadas como uma no hardware do arranjo.
[0073] Além disso, o arranjo 800 compreende pelo menos um produto de programa de computador 808 na forma de uma memória não volátil, por exemplo, uma EEPROM, uma memória flash e uma unidade de disco rígido. O produto de programa de computador 808 compreende um programa de computador 810, que compreende os meios de código, que quando são executados na unidade de processamento 806, no arranjo 800, fazem com que o arranjo e/ou o codificador de transformada de áudio realizem as ações do procedimento descrito anteriormente em conjunto com a figura 4.
[0074] Assim, nas modalidades de exemplificação descritas, os meios de código no programa de computador 810 do arranjo 800 podem compreender um módulo de obtenção 810a, para obter um vetor residual associado com um segmento de tempo de um sinal de áudio. O programa de computador compreende um módulo de derivação 810b para derivar um indicador, z, de posição em uma escala de frequência do vetor residual, e derivar uma medida, Φ, relacionada à quantidade de estrutura do vetor residual. O programa de computador ainda compreende um módulo de determinação 810c, para determinar se um critério predefinido envolvendo a medida Φ, o indicador z e um limite predefinido θ foi cumprido. Ainda, o programa de computador compreende um módulo de codificação 810d, para codificar a respectiva amplitude dos coeficientes do vetor residual e para codificar o respectivo sinal dos coeficientes do vetor residual somente quando é determinado que o critério é cumprido.
[0075] O programa de computador 810 tem a forma de um código de programa de computador estruturado em módulos de programa de computador. Os módulos 810a-d essencialmente realizam as ações do fluxo ilustrado na figura 4, para emular o arranjo 500 ilustrado na figura 5. Em outras palavras, quando os diferentes módulos 810a-d são executados na unidade de processamento 806, correspondem às unidades 504-510 da figura 5.
[0076] Embora os meios de código na modalidade descrita acima, em conjunto com a figura 8, sejam implementados como módulos de programa de computador que, quando executados na unidade de processamento fazem com que o arranjo e/ou o codificador de transformada de áudio realizem as etapas descritas acima em conjunto com as figuras acima mencionadas, pelo menos um dos meios de código pode, em modalidades alternativas, ser implementado pelo menos parcialmente como circuitos de hardware.
[0077] De um modo similar, uma modalidade exemplificativa compreendendo módulos de programa de computador pode ser descrita para o arranjo correspondente em um decodificador de transformada de áudio ilustrado na figura 7.
[0078] Embora a invenção tenha sido descrita com referência a exemplos de modalidades específicos, a descrição em geral é, somente destinada a ilustrar o conceito inventivo e não deve ser tomada como limitação do escopo da invenção. Os atributos diferentes das modalidades exemplificativas acima podem ser combinados de maneiras diferentes, de acordo com a necessidade, as exigências ou a preferência. REFERÊNCIAS [1] ITU-T Rec. G.719. "Low-complexity full-band audio coding for high- quality conversational applications," 2008. [2] Mittal, J. Ashley, E. Cruz-Zeno, "Low Complexity Factorial Pulse Coding of MDCT Coefficients using Approximation of Combinatorial Functions," 2007 ICASSP. ABREVIATURAS FPC Codificação por pulso fatorial MDCT Transformada Discreta de Cosseno Modificada

Claims (18)

1. Método, em um codificador de transformada de áudio, para codificar um segmento de tempo de um sinal de áudio, o método caracterizado pelo fato de que compreende: - derivar (404) um indicador, z, da posição em uma escala de frequência de um vetor residual de um segmento de um vetor de transformada associado com o segmento de tempo do sinal de áudio; - derivar (406) uma medida, Φ, relacionada à distribuição de energia sobre frequência do vetor residual; - determinar (412) se um critério predefinido envolvendo a medida Φ, o indicador z e um limite predefinido θ, é cumprido, estimando, assim, se uma modificação de sinal de pelo menos alguns dos coeficientes diferentes de zero do vetor residual seria audível após a reconstrução do segmento de tempo do sinal de áudio; - codificar a amplitude dos coeficientes do vetor residual: e - codificar (408) o sinal dos coeficientes do vetor residual somente quando é determinado que o critério é cumprido, e, dessa forma, que uma modificação do sinal seria audível.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a medida Φ é uma medida de nivelamento espectral.
3. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que o critério predefinido é formulado como:
Figure img0010
onde o.)| e o.)2 são fatores de escala; e θ é um limite que depende da taxa de bits b do codificador.
4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que os fatores de escala ®1 e o.)2 são, pelo menos em parte, derivados de dados de percepção empírica.
5. Método, de acordo com qualquer uma das reivindicações 1 a 4, caracterizado pelo fato de que o limite θ é configurado para aumentar com o aumento da taxa de bits b do codificador.
6. Codificador de transformada de áudio para codificar um segmento de tempo de um sinal de áudio, caracterizado pelo fato de que compreende: - uma unidade de derivação (506), adaptada para derivar um indicador, z, da posição em uma escala de frequência de um vetor residual de um segmento de um vetor de transformada associado com o segmento de tempo do sinal de áudio, e para derivar uma medida, Φ, relacionada à distribuição de energia sobre frequência do vetor residual; - uma unidade de determinação (508), adaptada para determinar se um critério predefinido envolvendo a medida Φ, o indicador z e um limite predefinido θ, é cumprido, dessa forma, estimando se uma modificação de sinal de pelo menos alguns dos coeficientes diferentes de zero do vetor residual seria audível após a reconstrução do segmento de tempo do sinal de áudio; e - uma unidade de codificação (510), adaptada para codificar a amplitude dos coeficientes do vetor residual, e para codificar o sinal dos coeficientes do vetor residual somente quando é determinado que o critério é cumprido e, dessa forma, que uma modificação do sinal seria audível.
7. Codificador de transformada de áudio, de acordo com a reivindicação 6, caracterizado pelo fato de ser adaptado, ainda, para derivar a medida, Φ, como uma medida de nivelamento espectral.
8. Codificador de transformada de áudio, de acordo com a reivindicação 6 ou 7, caracterizado pelo fato de que o critério predefinido é formulado como:
Figure img0011
onde o.)| e o.)2 são fatores de escala e θ é um limite que depende da taxa de bits b do codificador.
9. Codificador de transformada de áudio, de acordo com qualquer uma das reivindicações 6 a 8, caracterizado pelo fato de que o limite θ é configurado para aumentar com o aumento da taxa de bits b do codificador.
10. Método, em um decodificador de transformada de áudio, para decodificar um segmento de tempo codificado de um sinal de áudio, caracterizado pelo fato de que compreende: - decodificar (603) as amplitudes dos coeficientes de um vetor residual de um segmento de um vetor da transformada associado com o segmento de tempo do sinal de áudio; - derivar (604) um indicador, z, de posição em uma escala de frequência do vetor residual; - derivar (606) uma medida, Φ, relacionada à distribuição de energia sobre frequência do vetor residual; - determinar (612) se um critério predefinido envolvendo a medida Φ, o indicador z e um limite predefinido θ é cumprido, dessa forma, estimando se uma modificação de sinal de pelo menos alguns dos coeficientes diferentes de zero do vetor residual seria audível após a reconstrução do segmento de tempo de sinal de áudio; - decodificar (608) o respectivo sinal dos coeficientes diferentes de zero do vetor residual somente quando é determinado que o critério é cumprido, e, dessa forma, que uma modificação de sinal seria audível; e - gerar um respectivo sinal aleatório para os coeficientes diferentes de zero do vetor residual quando é determinado que o critério não é cumprido e, dessa forma, que uma modificação de sinal não seria audível.
11. Método, de acordo com a reivindicação 10, caracterizado pelo fato de que a medida Φ é uma medida de nivelamento espectral.
12. Método de acordo com a reivindicação 10 ou 11, caracterizado pelo fato de que o critério predefinido é formulado como:
Figure img0012
onde o.)| e co2 são fatores de escala e θ é um limite que depende da taxa de bits b do decodificador.
13. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que os fatores de escala o1 e o.)2 são, pelo menos em parte, derivados de dados de percepção empírica.
14. Método, de acordo com qualquer uma das reivindicações 10 a 13, caracterizado pelo fato de que o limite θ é configurado para aumentar com o aumento da taxa de bits b do decodificador.
15. Decodificador de transformada de áudio para decodificar um segmento de tempo codificado de um sinal de áudio, caracterizado pelo fato de que compreende: - uma unidade de decodificação (710), adaptada para decodificar as amplitudes dos coeficientes de um vetor residual de um segmento de um vetor de transformada associado com o segmento de tempo do sinal áudio; - uma unidade de derivação (706), adaptada para derivar um indicador, z, da posição em uma escala de frequência do vetor residual, e derivar uma medida Φ relacionada à distribuição de energia sobre frequência do vetor residual; - uma unidade de determinação (708), adaptada para determinar se um critério predefinido envolvendo a medida Φ, o indicador z e um limite predefinido θ, é cumprido, dessa forma, estimando se uma modificação de sinal de pelo menos algum dos coeficientes diferentes de zero do vetor residual seria audível após a reconstrução do segmento de tempo de sinal de áudio; - a unidade de decodificação (710) sendo ainda adaptada para decodificar o sinal dos coeficientes diferentes de zero do vetor residual somente quando é determinado que o critério é cumprido, e, dessa forma, que uma modificação de sinal seria audível; e - um gerador de sinal (712), adaptado para gerar um respectivo sinal aleatório para os coeficientes diferentes de zero do vetor residual. quando é determinado que o critério não é cumprido, e, dessa forma, que uma modificação de sinal não seria audível.
16. Decodificador de transformada de áudio de acordo com a reivindicação 15, caracterizado pelo fato de ser ainda adaptado para derivar a medida, Φ, como uma medida de nivelamento espectral.
17. Decodificador de transformada de áudio, de acordo com a reivindicação 15 ou 16, caracterizado pelo fato de que o critério predefinido é formulado como:
Figure img0013
onde o.)| e o.)2 são fatores de escala e θ é um limite que depende da taxa de bits b do decodificador.
18. Decodificador de transformada de áudio, de acordo com qualquer uma das reivindicações 15 a 17, caracterizado pelo fato de que o limite, θ é configurado para aumentar com o aumento da taxa de bits b do decodificador.
BR112013031816-3A 2011-06-30 2011-06-30 Método e codificador de transformada de áudio para codificar um segmento de tempo de um sinal de áudio, e método e decodificador de transformada de áudio para decodificar um segmento de tempo codificado de um sinal de áudio BR112013031816B1 (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/SE2011/050889 WO2013002696A1 (en) 2011-06-30 2011-06-30 Transform audio codec and methods for encoding and decoding a time segment of an audio signal

Publications (2)

Publication Number Publication Date
BR112013031816A2 BR112013031816A2 (pt) 2016-12-13
BR112013031816B1 true BR112013031816B1 (pt) 2021-03-30

Family

ID=47391479

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112013031816-3A BR112013031816B1 (pt) 2011-06-30 2011-06-30 Método e codificador de transformada de áudio para codificar um segmento de tempo de um sinal de áudio, e método e decodificador de transformada de áudio para decodificar um segmento de tempo codificado de um sinal de áudio

Country Status (5)

Country Link
US (2) US9546924B2 (pt)
EP (1) EP2727105B1 (pt)
CN (1) CN103620674B (pt)
BR (1) BR112013031816B1 (pt)
WO (1) WO2013002696A1 (pt)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9546924B2 (en) 2011-06-30 2017-01-17 Telefonaktiebolaget Lm Ericsson (Publ) Transform audio codec and methods for encoding and decoding a time segment of an audio signal
CN103714821A (zh) * 2012-09-28 2014-04-09 杜比实验室特许公司 基于位置的混合域数据包丢失隐藏
MX343673B (es) * 2013-04-05 2016-11-16 Dolby Int Ab Codificador y decodificador de audio.
BR112016020988B1 (pt) * 2014-03-14 2022-08-30 Telefonaktiebolaget Lm Ericsson (Publ) Método e codificador para codificação de um sinal de áudio, e, dispositivo de comunicação
MX2017010593A (es) * 2015-02-26 2018-05-07 Fraunhofer Ges Forschung Aparato y método para procesar una señal de audio para obtener una señal de audio procesada usando una envolvente en el dominio del tiempo objetivo.
US10504525B2 (en) * 2015-10-10 2019-12-10 Dolby Laboratories Licensing Corporation Adaptive forward error correction redundant payload generation
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10573331B2 (en) 2018-05-01 2020-02-25 Qualcomm Incorporated Cooperative pyramid vector quantizers for scalable audio coding
US10580424B2 (en) 2018-06-01 2020-03-03 Qualcomm Incorporated Perceptual audio coding as sequential decision-making problems
US10734006B2 (en) 2018-06-01 2020-08-04 Qualcomm Incorporated Audio coding based on audio pattern recognition

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6735249B1 (en) * 1999-08-11 2004-05-11 Nokia Corporation Apparatus, and associated method, for forming a compressed motion vector field utilizing predictive motion coding
US6728669B1 (en) 2000-08-07 2004-04-27 Lucent Technologies Inc. Relative pulse position in celp vocoding
US6735339B1 (en) 2000-10-27 2004-05-11 Dolby Laboratories Licensing Corporation Multi-stage encoding of signal components that are classified according to component value
ATE527654T1 (de) * 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US7242328B1 (en) * 2006-02-03 2007-07-10 Cisco Technology, Inc. Variable length coding for sparse coefficients
US8712766B2 (en) * 2006-05-16 2014-04-29 Motorola Mobility Llc Method and system for coding an information signal using closed loop adaptive bit allocation
US8345899B2 (en) * 2006-05-17 2013-01-01 Creative Technology Ltd Phase-amplitude matrixed surround decoder
US7461106B2 (en) * 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US20080243518A1 (en) * 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
US8055085B2 (en) * 2007-07-12 2011-11-08 Intellectual Ventures Fund 44 Llc Blocking for combinatorial coding/decoding for electrical computers and digital data processing systems
ATE518224T1 (de) * 2008-01-04 2011-08-15 Dolby Int Ab Audiokodierer und -dekodierer
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US7978101B2 (en) * 2009-10-28 2011-07-12 Motorola Mobility, Inc. Encoder and decoder using arithmetic stage to compress code space that is not fully utilized
US8149144B2 (en) 2009-12-31 2012-04-03 Motorola Mobility, Inc. Hybrid arithmetic-combinatorial encoder
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
PL2633521T3 (pl) 2010-10-25 2019-01-31 Voiceage Corporation Kodowanie zwykłych sygnałów audio przy małych przepływnościach bitowych i małym opóźnieniu
US9546924B2 (en) 2011-06-30 2017-01-17 Telefonaktiebolaget Lm Ericsson (Publ) Transform audio codec and methods for encoding and decoding a time segment of an audio signal

Also Published As

Publication number Publication date
US20140114667A1 (en) 2014-04-24
EP2727105A1 (en) 2014-05-07
RU2014102965A (ru) 2015-08-10
US8831959B2 (en) 2014-09-09
CN103620674B (zh) 2016-02-24
WO2013002696A1 (en) 2013-01-03
US20130006646A1 (en) 2013-01-03
CN103620674A (zh) 2014-03-05
US9546924B2 (en) 2017-01-17
BR112013031816A2 (pt) 2016-12-13
EP2727105B1 (en) 2015-08-12

Similar Documents

Publication Publication Date Title
BR112013031816B1 (pt) Método e codificador de transformada de áudio para codificar um segmento de tempo de um sinal de áudio, e método e decodificador de transformada de áudio para decodificar um segmento de tempo codificado de um sinal de áudio
RU2519069C2 (ru) Устройство аудио кодирования, устройство аудио декодирования, методы кодирования и декодирования аудио-сигнала, аудио поток и компьютерная программа
CA2871268C (en) Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
ES2545053T3 (es) Aparato y método para codificación y decodificación de audio que emplea sustitución sinusoidal
BRPI0822236B1 (pt) sistema de codificação de áudio, decodificador de áudio, método de codificação de áudio e método de decodificação de áudio
BR112016001248B1 (pt) Decodificador de áudio de múltiplos canais e método para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada
AU2013329734B2 (en) Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns
BR112012011084B1 (pt) decodificador para gerar um sinal de áudio multicanal, codificador para gerar uma representação codificada de um sinal de áudio multicanal, método de gerar um sinal de áudio multicanal e método de gerar uma representação codificada de um sinal de áudio multicanal
BR112012026324B1 (pt) Codificador de aúdio ou vídeo, decodificador de aúdio ou vídeo e métodos relacionados para o processamento do sinal de aúdio ou vídeo de múltiplos canais usando uma direção de previsão variável
BR112019009318A2 (pt) aparelho e método para codificar ou decodificar um sinal multicanal com o uso de um ganho lateral e um ganho residual
BR122023025300A2 (pt) Aparelho e método para carregamento estéreo em conversão em código multicanal e sistema
BRPI1007050B1 (pt) Sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequênciaalta
AU2016231220A1 (en) Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
BR112015017222B1 (pt) Método e decodificador configurado para ocultar um quadro de áudio perdido de um sinal de áudio recebido, receptor, e, meio legível por computador
BR112019014125A2 (pt) integração retrocompatível de transpositor harmônico para reconstrução de alta frequência de sinais de áudio
BR112015018050B1 (pt) Quantização de sinal de áudio de tonalidade adaptativa de baixacomplexidade
KR20100114450A (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
RU2574851C2 (ru) Аудиокодек с преобразованием и способы кодирования и декодирования временного сегмента аудиосигнала
BR112017026724B1 (pt) Decodificação em escala reduzida
BR112015025009B1 (pt) Unidades de quantização e quantização inversa, codificador e decodificador, métodos para quantizar e dequantizar
BR122020021690B1 (pt) Decodificação em escala reduzida
BR122020021881B1 (pt) Decodificação em escala reduzida

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 30/06/2011, OBSERVADAS AS CONDICOES LEGAIS.