BR122021011692B1 - Processo e dispositivo de decodificação por transformada de um sinal áudio-digital, utilizando janelas de ponderação de síntese aplicadas a tramas de amostras - Google Patents
Processo e dispositivo de decodificação por transformada de um sinal áudio-digital, utilizando janelas de ponderação de síntese aplicadas a tramas de amostras Download PDFInfo
- Publication number
- BR122021011692B1 BR122021011692B1 BR122021011692-0A BR122021011692A BR122021011692B1 BR 122021011692 B1 BR122021011692 B1 BR 122021011692B1 BR 122021011692 A BR122021011692 A BR 122021011692A BR 122021011692 B1 BR122021011692 B1 BR 122021011692B1
- Authority
- BR
- Brazil
- Prior art keywords
- window
- size
- transform
- decimation
- coefficients
- Prior art date
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 49
- 238000003786 synthesis reaction Methods 0.000 title claims abstract description 49
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000008569 process Effects 0.000 title claims abstract description 18
- 238000005070 sampling Methods 0.000 claims abstract description 26
- 230000001788 irregular Effects 0.000 claims abstract description 17
- 230000002123 temporal effect Effects 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000000295 complement effect Effects 0.000 claims description 7
- 230000001131 transforming effect Effects 0.000 claims description 2
- 230000009466 transformation Effects 0.000 description 21
- 230000015654 memory Effects 0.000 description 18
- 230000004044 response Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 5
- 238000011002 quantification Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- OVOUKWFJRHALDD-UHFFFAOYSA-N 2-[2-(2-acetyloxyethoxy)ethoxy]ethyl acetate Chemical compound CC(=O)OCCOCCOCCOC(C)=O OVOUKWFJRHALDD-UHFFFAOYSA-N 0.000 description 1
- 229940064452 artec Drugs 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3002—Conversion to or from differential modulation
- H03M7/3044—Conversion to or from differential modulation with several bits only, i.e. the difference between successive samples being coded by more than one bit, e.g. differential pulse code modulation [DPCM]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
A presente invenção refere-se a processo de codificação ou de decodificação por transformada de um sinal áudio- numérico, utilizando janelas de ponderação de análise (ha) ou de síntese (hs) aplicadas a tramas de amostras. O processo é tal que comporta uma amostragem irregular (E10) de uma janela inicial prevista para uma transformada de tamanho inicial N determinada, para aplicar uma transformada secundária de tamanho M diferente de N. A invenção se refere também a um dispositivo apto para aplicar o processo acima.
Description
[001] A presente invenção refere-se a um tratamento de sinal, no- tadamente um sinal áudio (tal como um sinal de palavra) e/ou de vídeo, sob a forma de uma sucessão de amostras. Ela se refere, em particular, à codificação e à decodificação de um sinal áudio-digital por transformada e adaptação das janelas de análise ou de síntese ao tamanho da transformada.
[002] A codificação por transformada consiste em codificar sinais temporais no domínio transformado (frequencial). Essa transformação permite notadamente utilizar as características frequenciais dos sinais áudio, a fim de otimizar e de melhorar os desempenhos de codificação. Utiliza-se, por exemplo, o fato de um som harmônico estar representado no domínio frequencial por um número reduzido de riscos espectrais que podem assim ser codificados de maneira concisa. Utilizam-se também, por exemplo, vantajosamente, os efeitos de ocultação frequenciais para enformar o ruído de codificação, de maneira que seja o menos audível possível.
[003] Classicamente, a codificação e a decodificação por transfor mada é feita por aplicação de cinco etapas: • o fluxo áudio digital (amostrado a uma frequência de amos-tragem Fs determinada) a codificar é seccionado em tramas de número de amostras finitas (por exemplo, 2N). Cada trama abrange classicamente 50% com a trama precedente; • uma etapa de transformação é aplicada ao sinal. No caso da transformação denominada MDCT (para "Modified Discrete Cosine Transform" em Inglês), uma janela de ponderação ha (denominada janela de análise) de tamanho L = 2N é aplicada a cada trama.
[004] A trama ponderada é "duplicada" segundo uma transforma ção 2N para N. A "duplicação" da trama T2N de tamanho 2N ponderada por ha para a trama TN de tamanho N pode, por exemplo, ser feita da seguinte maneira:
[005] uma DCT IV é aplicada à trama duplicada TN, a fim de se obter uma trama de tamanho N no domínio transformado. Ela se expressa da seguinte forma: • a trama no domínio transformado é então quantificada utilizando um quantificador adaptado. A quantificação permite reduzir o tamanho dos dados a transmitir, mas introduz um ruído (audível ou não) à trama original. Quanto mais elevada for a razão, mais reduzido será o ruído e mais a trama quantificada estará próxima da trama original; • uma transformação MDCT inversa é aplicada à decodifica- ção na trama quantificada. Ela comporta duas etapas: a trama quantificada de tamanho N é convertida em trama de tamanho N no domínio temporal TN* utilizando-se uma DCT IV inversa (que se expressa como uma transformação direta).
[006] Uma segunda etapa de duplicação de N para 2N é então aplicada à trama temporal TN* de tamanho N. Janelas de ponderação hs ditas de síntese são aplicadas às tramas T2N* de tamanhos 2N, de acordo com a seguinte equação: • o fluxo áudio decodificado é então sintetizado, somando-se as partes em abrangência de duas tramas consecutivas.
[007] Anotamos que esse esquema se estende a transformações que têm uma abrangência mais importante, tais como as ELT para as quais os filtros de análise e de síntese têm um comprimento L = 2KN para uma abrangência de (2K-1)N. A MDCT é assim um caso particular do ELT com K=1.
[008] Para uma transformada e uma abrangência determinada, de terminam-se janelas de análise e de síntese que permitem obter uma reconstrução dita "perfeita" do sinal a codificar (na ausência de quantificação).
[009] A reconstrução pode também ser de reconstrução "quase perfeita", quando a diferença entre os sinais de origem X e reconstrói pode ser considerado desprezível. Por exemplo, em codificação áudio uma diferença que tem uma potência de erro 50dB menor que a potência do sinal X tratado pode ser considerado como desprezível.
[0010] Por exemplo, no caso em que as janelas de análise e de sín tese não mudam sobre duas tramas consecutivas, elas devem respeitar as condições de reconstrução perfeitas a seguir:
[0011] Assim, compreende-se facilmente que, na maior parte dos codecs, as janelas de análise e de síntese são armazenadas na memória, elas são seja calculadas antes e armazenadas na memória ROM, seja inicializadas com o auxílio de fórmulas, e, todavia, armazenadas na memória RAM.
[0012] Na maior parte do tempo, as janelas de análise e de síntese são idênticas (hs(k)=ha(k)), às vezes, a um retorno de índice pronto (hs(k)=ha(2N-1-k)), e necessitam então apenas de um único espaço memória de tamanho 2N para sua armazenagem na memória.
[0013] Os novos codecs funcionam com tamanhos de trama N dife rentes, quer seja para gerar várias frequências de amostragem, ou para adaptar o tamanho das janelas de análise (e, portanto, de síntese) ao conteúdo áudio (por exemplo, no caso de transições). Nesses codecs, encontram-se em memória ROM ou em RAM tantas janelas de análise e/ou de síntese quantos forem os tamanhos de tramas diferentes.
[0014] Os coeficientes (denominados também amostras) das jane las de análise ou de síntese, do codificador ou do decodificador devem ser armazenados na memória, a fim de realizar a transformada de análise ou de síntese. Naturalmente, em um sistema particular que utiliza transformadas de tamanhos diferentes, a de ponderação para cada um dos tamanhos utilizados deve ser representada na memória.
[0015] No caso favorável, no qual as janelas são simétricas, só L/2 coeficientes têm necessidade de serem armazenados, os L/2 outros de-duzindo-se sem operação aritmética desses coeficientes armazenados. Assim, para uma MDCT (k = 1), caso se tenha necessidade de uma transformada de tamanho M e 2.M, então será preciso armazenar (M+2M)=3M coeficientes, caso as janelas sejam simétricas e (2M+4M)=6M se não. Um exemplo típico para a codificação áudio é M=320 ou M=1024. Assim, para o caso assimétrico isto impõe a armazenagem de 1920 e 6144 coeficientes respectivamente.
[0016] Segundo a precisão desejada para a representação dos co eficientes, 16 bits até mesmo 24 bits para cada coeficiente são neces- sários. Isto implica um espaço memória não desprezível para calculadoras de baixo custo.
[0017] Técnicas de decimação de janela de análise ou de síntese existem.
[0018] Uma decimação simples de janela, por exemplo, quando se quer passar de N amostras a M (N sendo um múltiplo de M), consiste em tomar uma amostra sobre N/N com N/N um inteiro > 1.
[0019] Esse cálculo não permite respeitar a equação de reconstru ção perfeita dada na equação (3).
[0020] Por exemplo, no caso em que a janela de síntese é o retornado temporal da janela de análise, tem-se : hs(2N-k-1)=ha(k) = h(k) para k ε [0;2N-1] (4)
[0021] A condição de reconstrução perfeita se torna: h(N+k)h(N- k – 1) + h(k)/ (2N-k-1)= 1 para k ε [0;2N-1] (5)
[0022] Uma janela classicamente utilizada em codificação para responder a essa condição é a janela sinusoidal de Malvar: h(k) = sem (π/2N (k + 0.5)) para k ε [0;2N-1] (6)
[0023] Se a janela h(k) for decimada, tomando-se uma amostra sobre N/M, essa janela tornar-se-á: para k ε [0;2N-1]
[0024] Para que h*(k) de tamanho 2M verifica a condição de reconstrução perfeita (na equação (3)), para k ε [0; M-1]
[0025] N/M deve ser igual a 1; ora N/M é definido como um inteiro > 1, portanto, para essa decimação, a condição de reconstrução perfeita não pode ser verificada.
[0026] O exemplo ilustrativo considerado aqui se generaliza facil mente. Assim, por decimação direta de uma janela de base para se obter uma janela reduzida, a propriedade de reconstrução perfeita não pode ser assegurada.
[0027] Técnicas de interpolação de janelas de ponderação existem também. Essa técnica é, por exemplo, descrita no pedido de patente publicado EP 2319039. Essa técnica permite reduzir o tamanho de janelas armazenadas em ROM, quando se tem a necessidade de uma janela de tamanho mais considerável.
[0028] Assim, ao invés de armazenar uma janela de tamanho 2N e uma janela de tamanho 4N o pedido de patente propõe afetar as amostras da janela 2N a uma amostra em duas da janela 4N e armazenar em ROM unicamente as 2N amostras que faltam. O tamanho de armazenagem em ROM é assim reduzido de 4N + 2N a 2N + 2N.
[0029] Todavia, essa técnica necessita também de um pré-cálculo de janela de análise e de síntese, antes de aplicar a transformada pro-priamente dita.
[0030] Existe, portanto, uma necessidade de armazenar apenas um número reduzido de janelas, de análise e de janelas de síntese em me-mória para aplicar transformadas de diferentes tamanhos, respeitando as condições de reconstrução perfeita. Além disso, a necessidade de evitar as etapas de pré-cálculo dessas janelas antes da codificação por transformada é também ressentida.
[0031] A presente invenção vem melhorar a situação.
[0032] Ela propõe para isso um processo de codificação ou de de- codificação por transformada de um sinal áudio-digital, utilizando janelas de ponderação de análise (ha) ou de síntese (hs) aplicadas a tramas de amostras. O processo é tal que comporta uma amostragem irregular (E10) de uma janela inicial prevista para uma transformada de tamanho inicial N determinada, para aplicar uma transformada secundária de ta-manho M diferente de N.
[0033] Assim, a partir de uma janela inicial armazenada, prevista para uma transformada de tamanho N, é possível aplicar uma transfor-mação de tamanho diferente sem que pré-cálculos sejam feitos e sem que outras janelas de tamanhos diferentes sejam armazenadas.
[0034] Uma única janela de tamanho qualquer pode assim bastar para adaptá-la a transformadas de tamanhos diferentes.
[0035] A amostragem irregular permite respeitar as condições de reconstrução dita "perfeita" ou "quase perfeita", quando da decodifica- ção.
[0036] Os diferentes modos particulares de realização mencionados a seguir podem ser acrescentados independentemente ou em combinação uns com os outros, nas etapas do processo de codificação ou de decodificação definido acima.
[0037] De acordo com um modo de realização privilegiado, a etapa de amostragem comporta a seleção, a partir de um primeiro coeficiente d da janela inicial (com 0<d<N/M), de um conjunto definido de coeficientes N-d-1, N+d, 2N-d-1, respeitando uma condição pré-determinada de reconstrução perfeita.
[0038] Assim, é possível partir de um conjunto de coeficientes de determinar janelas adaptadas a transformadas secundárias de tamanhos diferentes, respeitando as condições de reconstrução perfeitas.
[0039] Vantajosamente, quando N é superior a M, uma decimação da janela inicial é feita, conservando no mínimo os coeficientes do con-junto definido para se obter uma janela decimada.
[0040] Assim, a partir de uma janela de análise ou de síntese arma zenada de tamanho superior, é possível obter uma janela de dimensão inferior que respeita também às condições de reconstrução perfeita na decodificação.
[0041] Em um exemplo particular de realização, o processo com porta a seleção de um segundo conjunto de coeficientes espaçados de um desvio constante com os coeficientes do conjunto definido e pelo fato de a decimação ser feita conservando-se, além disso, os coeficientes do segundo conjunto para se obter a janela decimada.
[0042] Assim, uma decimação adaptada ao tamanho de transfor mada desejada pode ser obtida. Isto permite conservar ao máximo a resposta em frequência das janelas obtidas.
[0043] Em um modo particular de realização, a decimação de uma janela de tamanho 2N em uma janela de tamanho 2M é feita, de acordo com as seguintes equações:
[0044] na qual h* é a janela de análise ou de síntese decimada, h é a janela de análise ou de síntese inicial [X] é o inteiro o mais próximo < X, [X], é o inteiro o mais próximo > X, e d é o valor do primeiro coeficiente do conjunto definido.
[0045] Assim, é possível obter janelas de tamanhos diferentes, a partir de uma janela de tamanho superior, mesmo quando o número de coeficientes entre a janela inicial e a janela obtida não é múltipla.
[0046] Quando N é inferior a M, uma interpolação é feita, inserindo se um coeficiente entre cada um dos coeficientes do conjunto de coefi-cientes definidos e cada um dos coeficientes de um conjunto de coefici-ente adjacentes para se obter uma janela interpolada.
[0047] A janela interpolada respeita também uma reconstrução per feita e pode ser calculada no roubo, a partir de uma janela armazenada de tamanho inferior.
[0048] Em um modo particular de realização, o processo comporta a seleção de um segundo conjunto de coeficientes espaçados de um desvio constante com os coeficientes do conjunto definido e pelo fato de a interpolação ser feita, inserindo-se, além disso, um coeficiente entre cada um dos coeficientes do segundo conjunto e cada um dos coeficientes de um conjunto de coeficientes adjacentes para se obter a janela interpolada.
[0049] Assim, uma interpolação adaptada ao tamanho da transfor mada desejada pode ser obtida. Isto permite conservar ao máximo a resposta em frequência das janelas obtidas.
[0050] De forma a otimizar a resposta em frequência da janela in terpolada, em um modo de realização particular, o processo comporta o cálculo de uma janela complementar comportando coeficientes calculados a partir dos coeficientes do conjunto definidos e coeficientes adjacentes, para interpolar essa janela.
[0051] Em um modo privilegiado de realização, a etapa de amostra gem irregular e uma decimação ou interpolação da janela inicial são re-alizadas quando da etapa de utilização da duplicação ou do desdobra-mento temporal utilizado para o cálculo da transformada secundária.
[0052] Assim, a decimação ou a interpolação de uma janela de aná lise ou de síntese é efetuada ao mesmo tempo que a etapa de transfor-mada propriamente dita, portanto, ao roubo. Não é, portanto, mais útil efetuar etapas de pré-cálculos, antes da codificação, a obtenção de ja-nelas adaptadas ao tamanho da transformada efetuando-se, quando da codificação.
[0053] Em um exemplo de realização, ao mesmo tempo uma deci- mação e uma interpolação da janela inicial são efetuadas quando da etapa de utilização da duplicação ou do desdobramento temporal utilizado para o cálculo da transformada secundária.
[0054] Isto permite oferecer mais possibilidades de obtenção de ja nelas de diferentes tamanhos, a partir de uma única janela armazenada na memória.
[0055] Em um caso particular de realização para a decimação, quando da duplicação temporal é feita segundo a equação a seguir:
[0056] com TM uma trama de M amostras, T2M, uma trama de 2M amostras e a decimação, quando do desdobramento temporal é feita, conforme a seguinte equação:
[0057] com T*M uma trama de M amostras, T*2M, uma trama de 2M amostras.
[0058] Em um exemplo de realização particularmente adaptado, quando a transformada secundária é de tamanho M = 3/2N, uma deci- mação da janela inicial, depois uma interpolação é realizada, quando da duplicação temporal, conforme as seguintes equações:
[0059] com TM uma trama de M amostras, T2M, uma trama de 2M amostras, hcomp a janela complementar e quando a transformada se- cundária é de tamanho M = 3/2N, uma decimação da janela inicial, depois uma interpolação é realizada, quando da duplicação temporal, conforme as seguintes equações:
[0060] com TM uma trama de M amostras, TM uma trama de 2M amostras, hcomp a janela complementar.
[0061] A presente invenção visa também um dispositivo de codifi cação ou de decodificação por transformada de um sinal áudio-digital utilizando janelas de ponderação de análise ou de síntese aplicadas a tramas de amostras. O dispositivo é tal que ele comporta um modo de amostragem apto a amostrar, de forma irregular, uma janela inicial pre-vista para uma transformada de tamanho inicial N dada, para aplicar uma transformada secundária de tamanho M diferente de N.
[0062] Esse dispositivo apresenta as mesmas vantagens que o pro cesso descrito anteriormente, que ele aplica.
[0063] Ela visa um programa informático, comportando instruções de codificação para a utilização das etapas do processo de codificação ou de decodificação, tal como descrito, quando essas instruções são executadas por um processo.
[0064] Enfim, a invenção se refere a um suporte de armazenagem, legível por um processador, integrado ou não ao dispositivo de codifica-ção ou de decodificação, eventualmente amovível, memorizando um programa informático, aplicando um processo de codificação ou de de- codificação, tal como descrito anteriormente.
[0065] Outras características e vantagens da invenção aparecerão mais claramente com a leitura da descrição seguinte, dada unicamente a título de exemplo não limitativo e feita com referência aos desenhos anexados, nos quais : - a figura 1 ilustra um exemplo de sistema de codificação e de decodificação, aplicando a invenção em um modo de realização ; - a figura 2 ilustra um exemplo de decimação de janela de análise e de síntese, de acordo com a invenção : - a figura 3 ilustra uma amostragem irregular de uma janela de análise ou de sistema para a obtenção de uma janela, conforme um modo de realização da invenção ; - as figuras 4(a) e 4(b) ilustram uma amostragem irregular de uma janela de análise ou de síntese de um fator racional (2/3) em um modo de realização da invenção. A figura 4(a) ilustra uma sub etapa de decimação, enquanto que 4(b) apresenta uma sub etapa ded interpolação, e - a figura 5 ilustra um exemplo de realização material de um dispositivo de codificação ou de decodificação, de acordo com a inven-ção,
[0066] A figura 1 ilustra um sistema de codificação e de decodifica- ção por transformada, no qual uma única janela de análise e uma única janela de síntese do tamanho 2N são armazenadas na memória.
[0067] O fluxo áudio-digital X(t) é amostrado pelo módulo de amos tragem 101 a uma frequência de amostragem Fs, tramas T2M(t) de 2M amostras sendo assim obtidas. Cada trama se recobre classicamente a 50% com a trama precedente.
[0068] Uma etapa de transformação é em seguida aplicada ao sinal pelo blocos 102 e 103. O bloco 102 efetua uma amostragem da janela inicial armazenada prevista para uma transformada de tamanho N para aplicar uma transformada secundária de tamanho M diferente de N. Uma amostragem da janela de análise ha de 2N coeficientes é então efetuada para adaptá-lo às tramas de 2M amostras do sinal.
[0069] No caso em que N é um múltiplo M, trata-se de uma decima- ção e no caso em que N é um submúltiplo de M, trata-se de uma inter-polação. É previsto o caso em que N/M é qualquer um.
[0070] As etapas utilizadas pelo bloco 102 serão detalhadas poste riormente com referência às figuras 2 e 3.
[0071] O bloco 102 efetua também uma duplicação sobre a trama ponderada, segundo uma transformação 2M para M. Vantajosamente, essa etapa de duplicação é efetuada em combinação com a etapa irre-gular e de uma decimação ou de interpolação, conforme apresentado posteriormente.
[0072] Assim, no final do bloco 102, o sinal está sob a forma de trama TM(t) de M amostras. Uma transformada de tipo DCT IV, por exemplo, é, em seguida, aplicada pelo bloco 103 para serem obtidas tramas TM de tamanho M no domínio transformado, isto é, no caso do domínio frequencial.
[0073] Essas tramas são em seguida quantificadas pelo módulo de quantificação 104 para serem transmitidas a um decodificador sob a forma de índice de quantificação IQ.
[0074] O decodificador efetua uma quantificação inversa pelo mó dulo 114 para serem obtidas tramas ’ * no domínio transformado. O módulo de transformação inversa 113 efetua, por exemplo, uma DCT IV inversa para serem obtidas tramas ’ * no domínio temporal.
[0075] Uma duplicação de M para 2M amostras é, em seguida, efe-tuada pelo bloco 112 sobre a trama Uma janela de ponderação de síntese de tamanho 2M é obtida pelo bloco 112 por decimação ou interpolação, a partir de uma janela hs de tamanho 2N.
[0076] No caso em que N é superior a M, trata-se de uma decima- ção e no caso em que N é inferior a M, trata-se de uma interposição.
[0077] As etapas aplicadas pelo bloco 112 serão detalhadas poste- riomente com referência às figuras 2 e 3.
[0078] Conforme para a codificação, vantajosamente, essa etapa de duplicação é efetuada em combinação com a etapa de amostragem irregular e de decimação ou de interpolação e será apresentada poste-riormente. í ÍH
[0079] O fluxo áudio decodificado é então sintetizado, so mando-se as partes em abrangência no bloco 111.
[0080] O bloco 102, assim como o bloco 112 são então descritos mais em detalhes.
[0081] Esses blocos realizam as etapas de amostragem, irregular E10 para definir uma janela adaptada ao tamanho M de uma transformada secundária.
[0082] Assim, a partir de um primeiro coeficiente d (com 0 < d <N/M) da janela armazenada (ha ou hs) de tamanho 2N, de um conjunto definido de coeficientes N-d-1, 2N-d-1, respeitando uma condição pré-determinada de reconstrução perfeita é selecionada.
[0083] A partir desse conjunto, uma decimação ou uma interpolação dessas janelas é efetuada em E11, segundo o fato de N ser superior ou inferior a M, para passar de uma janela de 2N amostras a uma janela de 2M amostras.
[0084] Uma condição pré-determinada de reconstrução perfeita é buscada. Para isto a amostragem deve ser efetuada, de tal modo que as seguintes equações sejam respeitadas (assegurando que os coeficientes escolhidos para a síntese e a análise permitem a reconstrução perfeita para uma transformação de tamanho N) :
[0085] Assim, para que uma janela decimada respeite as condições de reconstrução perfeita da equação (3), a partir de um ponto ha(k) (para k ε [0 ; 2N-1]) sobre a janela de análise, só a seção suplementar dos pontos ha (N+k) sobre a janela de análise e dos pontos hs(k), hs(N+k), hs(2N-1-k) e hs(N-1-k) sobre a janela de síntese condicionam a reconstrução perfeita.
[0086] Todavia, conservando-se apenas esses 6 pontos, observa- se que existe então uma disparidade, a janela de análise é decimada por N e a janela de síntese por N/2.
[0087] De forma análoga, observa-se que se a decimação implica em selecionar o ponto N-k-1 sobre a janela de análise ha (N-k-1), só a seleção dos pontos ha (2N-1-k) sobre a janela de análise e dos 4 mesmos pontos hs(k), hs(N+k), hs(2N-1-k) e hs(N-1-k) sobre a janela de síntese permite respeitar a condição de reconstrução perfeita.
[0088] Assim, quando de uma decimação tal como ilustrado com referência à figura 2, para respeitar as condições de reconstrução perfeita em (3), a partir de um coeficiente d considerado para 0<d<N/M, é preciso obrigatoriamente que os coeficientes a seguir N-d-1, N+d, 2N- 1-d sobre a janela de análise e d, N+d, 2N-1-d e N-1-d sobre a janela de síntese sejam também selecionados para ter uma decimação de mesmo tamanho entre a janela de análise e a janela de síntese.
[0089] Com efeito, a condição de reconstrução perfeita só se aplica a subconjuntos de 8 pontos independentemente, conforme ilustrado na figura 2.
[0090] A seleção do conjunto definido de coeficientes d, N-d-1, N+d, 2N-1-d sobre a janela de análise e sobre a janela de síntese é assim efetuada.
[0091] A decimação é feita, então, conservando-se no mínimo os coeficientes do conjunto definido para se obter a janela decimada, os outros coeficientes podendo ser suprimidos. Obtém-se assim a menor janela decimada que respeita as condições de reconstrução perfeita.
[0092] Assim, para se obter a menor janela de análise decimada só os pontos ha(k), ha (N+k), ha (2N-1-k) e ha (N-1-k) são mantidos, con-forme ilustrado no exemplo referenciado na figura 2.
[0093] Para a janela de síntese, o mesmo exemplo de coeficientes é selecionado e a decimação é feita, conservando-se no mínimo os co-eficientes do conjunto definido para se obter a janela decimada.
[0094] Assim, para se obter a menor janela de síntese decimada, só os pontos hs(k), hs(N+k), hs(2N-1-k) e hs(N-1-k) são mantidos conforme ilustrado no exemplo referenciado na figura 2.
[0095] Considerando-se simetrias entre os pontos, no caso em que a janela de síntese é o retornado temporal da janela de análise, só um subconjunto de 4 pontos (h(k), h(N+k), h(2N-1-k) e h(N-1-k)) é necessário à decimação.
[0096] Assim, selecionando-se o conjunto definido acima, é possí vel decimar uma janela de análise e/ou de síntese escolhendo-se quais-quer valores de k compreendidos entre 0 e N-1, conservando as propri-edades de reconstrução perfeita.
[0097] Uma decimação adaptada permite conservar ao máximo a resposta em frequência da janela a decimar.
[0098] No caso de uma decimação adaptada, a um tamanho M de transformada, um coeficiente sobre N/M sobre o primeiro quarto da janela de análise (ou de síntese) é tomado em um segundo conjunto de coeficientes espaçados de um desvio constante (de N/M) com os coefi-cientes do conjunto definido, é selecionado. Assim, a decimação é feita, conservando, além disso, coeficientes d, N-1-d, N+d, 2N-1-d, os coefi-cientes do segundo conjunto para se obter a janela decimada.
[0099] A figura 3 ilustra um exemplo de amostragem irregular adap tada a um tamanho M de transformada. A janela representada sendo separada em quatro quartos.
[00100] Considerando-se condições de reconstrução perfeita, são obtidas as equações a seguir para a obtenção da janela decimada de tamanho 2M :
[00101] nas quais h* é a janela de análise ou de síntese interpolada ou decimada, h é a janela de análise ou de síntese inicial, [X] é o inteiro o mais próximo de < x, [X] é o inteiro o mais próximo > x. d é a defasa- gem.
[00102] A defasagem é função da amostra de partida d sobre o primeiro quarto da janela.
[00103] Assim, a etapa E10 do bloco 102 comporta a seleção de um segundo conjunto de coeficientes espaçados de um desvio constante (no caso de N/M) a partir dos coeficientes do conjunto definido (d, N-d- 1, N+d, 2N-d-1). O mesmo desvio constante pode ser aplicado para se-lecionar um terceiro conjunto de coeficientes.
[00104] Com efeito, por exemplo, caso se decime a janela por 3, isto é, que N/M=3, o desvio é, portanto, de 3 em cada parte de janela, se d=0 for o primeiro coeficiente do conjunto definido, os coeficientes de um segundo ou terceiro conjunto espaçados de um desvio constante são então 3 e 6, etc...
[00105] Da mesma forma, se d = 1, os primeiros coeficientes dos se-gundo ou terceiro conjuntos espaçados de um desvio constante são 1, 4, 7 ... ou ainda os coeficientes 2, 5, 8 ... para d = 2.
[00106] « d » na equação 7 pode, portanto, assumir os valores 0, 1 ou 2 (compreendidos entre 0 e N/M-1 inclusive).
[00107] A figura 3 representa o caso no qual o primeiro coeficiente escolhido no primeiro quarto da janela é d = 1.
[00108] Os coeficientes do segundo e do terceiro conjuntos espaçados de um desvio constante são então 4 e 7.
[00109] Ilustra-se na tabela 1 segundo os pontos retidos para a pas- sagem de uma transformada de tamanho N = 48 para transformadas de tamanho inferior (M = 24, 16, 12 e 8). Vê-se assim que para implementar a transformação de tamanho M=8, as amostras 0, 6, 12, 18, 29, 35, 41, 47, 48, 54, 60, 66, 77, 83, 89 e 95 são considerados na janela de análise ou de síntese, mostrando assim a amostragem irregular.
[00110] Ilustra-se na tabela 2 abaixo um modo de realização para passar de uma janela inicial prevista para uma transformada de tamanho N=48 a uma janela adaptada para a realização de uma transformada de tamanho N=6. Têm-se então uma decimação de N/M=8 e 7 possibilidades para o valor de d :0...7. Indicam-se na tabela os índices correspondentes aos valores retidos na janela inicial. índice Tabela 2
[00111] De maneira a ter uma resposta em frequência mais próxima da janela original, a invenção propõe fixar o valor com d = max . Essa condição não é limitativa.
[00113] Em cada parte pode-se também, para efetuar a transformação de tamanho M, escolher arbitrariamente os pontos na janela inicial de tamanho 2N. A partir de um primeiro coeficiente (h(d)) podem-se destacar M/2-1 coeficientes arbitrariamente no primeiro quarto da janela, com índices dk à condição de selecionar nas três outras partes, os coe-ficientes de índice 2N-1-dk, N-1-dk e N+dk. Isto é particularmente van-tajoso para melhorar a continuidade ou a resposta frequencial da janela de tamanho 2M construída : as descontinuidades podem ser em particular limitadas por uma escolha judiciosa dos índices dk.
[00115] Em um modo de realização vantajoso, os blocos 102 e 112 efetuam as etapas de amostragem ao mesmo tempo que a etapa de duplicação ou de desdobramento das tramas de sinal.
[00116] No caso descrito aqui, uma janela de ponderação de análise ha de tamanho 2N é aplicada a cada trama de tamanho 2M, decimando- a ou interpolando-a no roubo no bloco 102.
[00117] Essa etapa é realizada, agrupando as equações (1) que des-crevem a etapa de duplicação e as equações (7) que descrevem uma decimação regular.
[00118] A trama ponderada é duplicada, segundo uma transformação 2M para M. A duplicação da trama T2M de tamanho 2M ponderada por ha (de tamanho 2N) para a trama TM de tamanho M pode ser, por exemplo, ser feita da seguinte maneira :
[00119] Assim, a etapa de decimação de uma janela de tamanho 2N para uma janela de tamanho 2M é feita ao mesmo tempo que a duplicação de uma trama de tamanho 2M para uma trama de tamanho M.
[00120] Os cálculos feitos são de mesma complexidade que aqueles utilizados para uma duplicação clássica, só os índices sendo mudados. Essa operação de decimação ao roubo não necessita, portanto, de com-plexidade suplementar.
[00121] Da mesma forma, na decodificação, uma janela de ponderação de síntese ha de tamanho 2N é decimada no roubo no bloco 112, em uma janela de tamanho 2M para ser aplicada a cada trama de tamanho 2M. Essa etapa é realizada, agrupando as equações (2) de duplicação com as equações (7) ou (8) de decimação.
[00123] Lá também, essas equações não acarretam complexidade suplementar em relação às equações de duplicação clássicas. Elas per-mitem obter uma decimação de janela no roubo sem ter pré-cálculos a efetuar e sem ter de armazenar janelas suplementares.
[00124] No caso em que a janela de síntese é o retornado temporal da janela de análise (hs (k)= ha(2N-1-k)) e que a relação N/M é um inteiro (portanto unicamente uma decimação) as equações 10 se tornam :
[00125] Esse modo de realização permite ter apenas na memória uma única janela utilizada, ao mesmo tempo, para a análise e a síntese.
[00126] Mostrou-se, portanto, que as etapas de duplicação / desdo-bramento e de decimação podem ser combinadas, a fim de realizar uma transformação de tamanho M, utilizando uma janela de análise / síntese prevista para um tamanho N. Obtém-se, graças à invenção, uma com-plexidade idêntica à aplicação de uma transformação de tamanho M com uma janela de análise / síntese prevista para um tamanho M, isto sem a utilização de memória complementar. Anotamos que esse efeito é revelado para uma implementação eficaz da transformação MDCT ba-seada em uma DCT IV (conforme sujerido em H, S. Malvar, Signal Pro-cessing with Lapped Transforms, Artec House, 1942), esse efeito pode- ria também ser mostrado com outras implementações eficazes, notada- mente aquela proposta por Duhamel et al. Em « A fast algorithm for the implementation of filter banks based on TDAC » apresentado na confe-rência ICASSP91).
[00127] Esse método não é limitativo, ela pode ser adaptada notada- mente no caso em que a janela de análise apresenta 0 e que ela se aplica à trama em defasagem (as amostras sonoras as mais recentes são ponderadas pela parte de janela exatamente antes da parte que apresenta zeros) para reduzir um prazo de codificação. Nesse caso, os índices ligados às tramas e aqueles ligados às janelas são defasados.
[00128] Em um modo de realização particular, descreve-se a presente um método de interpolação no caso em que se dispõe de uma janela h de tamanho 2N e que são tramas de tamanho M.
[00129] No caso em que N é inferior a M, uma mesma seleção de um conjunto de coeficientes, respeitando as condições de reconstrução per-feita é também efetuada. Um conjunto de coeficientes adjacentes aos coeficientes do conjunto definido é também determinado. A interpolação efetuando-se então, inserindo-se um coeficiente entre cada um dos co-eficientes do conjunto coeficientes definidos e cada um dos coeficientes de um conjunto de coeficientes adjacentes para se obter a janela inter-polada.
[00130] Assim, para respeitar as condições de reconstrução perfeita definidas pela equação (3), caso se queira inserir uma amostra entre as posições k e k+1, propõe-se inserir pontos entre as posições ha (k) e ha (k+1), ha (N-k-1) e ha (N-k-2), ha (N+k) e ha (N+k+1), ha (2N-1-k) e ha (2N-k-2) sobre a janela de análise e pontos entre as posições hs(k) e hs(k+1), hs(N+k) e hs(N+k+1), hs(2N-1-k) e hs(2N-k-2), hs(N-1-k) e hs(N-k-2) sobre a janela de síntese. Os 8 novos pontos inseridos res-peitam também as condições de reconstrução perfeita da equação (3).
[00131] Em um primeiro modo de realização, a interpolação é realizada pela repetição de um coeficiente do conjunto definido ou do conjunto de coeficientes adjacentes.
[00132] Em um segundo modo de realização, a interposição é realizada pelo cálculo de um coeficiente (hcomp), visando obter uma melhor resposta frequencial para a janela obtida.
[00133] Para isto, uma primeira etapa de cálculo de uma janela de complemento hinic de tamanho 2N é realizada. Essa janela que é uma versão interpolada entre os coeficientes de h de tamanho 2N, tal qual :
[00134] Em uma segunda etapa, a janela hcomp é calculada segundo EP 2319039 para que seja de reconstrução perfeita. Para isto, a janela é calculada sobre os coeficientes do conjunto definido conforme as seguintes equações :
[00135] Essa janela é seja calculada na inicialização, seja armazenada em ROM.
[00136] As etapas de interpolação e de decimação podem ser integradas para apresentar um modo de realização, no qual se aplica eficazmente uma transformação.
[00137] Com referência às figuras 4(a) e 4(b), esse modo de realização é ilustrado.
[00138] É decomposto em duas etapas : • em uma etapa ilustrada na figura 4(a), parte-se de uma ja-nela ha de tamanho 2N para se obter uma segunda janela h de tamanho 2N' (no caso 2N = 96 e 2N'= 32, isto é, que uma decimação de um fator 3 é realizado). Essa decimação é irregular e conforme a equação (7) ; • em uma segunda etapa ilustrada na figura 4(b), acrescenta- se aos 2N' coeficientes de h, um conjunto de coeficientes complemen-tares hcomp para se obter no total 2M coeficientes (no caso o número de coeficientes complementares é 2N', obtém-se portanto 2M=4N').
[00139] No exemplo particular às figuras 4(a) e 4(b), realizou-se a conversão de uma janela inicial de tamanho 2N=96 prevista para uma MDCT de tamanho N=48 para uma janela destinada a implementar uma MDCT de tamanho M=32, construindo uma janela de tamanho 2M=64.
[00140] No momento da transformação, no bloco 102, a janela h e a janela hcomp são aplicadas alternativamente, respeitando as seguintes equações :
[00141] Da mesma forma, no momento da transformação inversa no bloco 112, a janela h, depois a janela hcomp são aplicadas alternativamente segundo as equações:
[00142] Numerosas declinações são possíveis, de acordo com a in-venção. Assim, a partir de uma única janela armazenada na memória, é possível obter uma janela de tamanho diferente, seja por interpolação, seja por decimação ou seja por interpolação de uma janela decimada ou inversamente.
[00143] A flexibilidade da codificação e da decodificação é, portanto, grande, sem para tanto aumentar o local da memória ou os cálculos a efetuar.
[00144] A utilização da decimação ou da interpolação, quando da du-plicação ou do desdobramento da MDCT fornece um ganho suplementar em complexidade e em flexibilidade.
[00145] A figura 5 representa uma realização material de um dispositivo de codificação ou de decodificação, de acordo com a invenção. Esse dispositivo comporta um processador PROC cooperando com um bloco memória BM que comporta uma memória de armazenagem e/ou de trabalho MEM.
[00146] O bloco memória pode vantajosamente comportar um programa informático que comporta instruções de código para a utilização das etapas do processo de codificação ou de decodificação no sentido da invenção, quando essas instruções são executadas pelo processador PROC, e notadamente uma armostragem irregular de uma janela inicial prevista para uma transformada de tamanho inicial N determinada, para aplicar uma transformada secundária de tamanho M diferente de N.
[00147] Tipicamente, a descrição da figura 1 retoma as etapas de um algoritmo desse programa informático. O programa informático pode também ser armazenado sobre um suporte memória legível por uma leitora do dispositivo ou telecarregável no espaço memória deste.
[00148] Esse equipamento comporta um módulo de entrada apta a receber um fluxo áudio x(t) no caso do codificador ou índices de quanti-ficação IQ no caso de um decodificador.
[00149] O dispositivo comporta um módulo de saída apto a transmitir índices de quantificação IQ no caso de um codificador ou o fluxo deco-dificado no caso do decodificador.
[00150] Em um modo possível de realização, o dispositivo assim descrito pode comportar, ao mesmo tempo as funções de codificação ou de decodificação.
Claims (4)
1. Processo de decodificação por transformada de um sinal áudio-digital utilizando janelas de ponderação de síntese (hs) aplicadas a tramas de amostras, caracterizado pelo fato de que a janela é fornecida para aplicar uma transformada secundária de tamanho M diferente de N, sendo obtida a partir de uma amostragem irregular (E10) de uma janela inicial (hs(2N)) prevista para uma transformada de tamanho inicial N determinada, compreendendo realizar a amostragem irregular (E10) da janela inicial (hs(2N)) por pelo menos uma decimação (E11) da janela inicial (hs(2N)) durante a implementação de desdobramento temporal (E13) usada para o cálculo da transformada de tamanho M, em que a decimação (E11) durante o desdobramento temporal (E13), é realizada segundo a equação a seguir: com T*M sendo uma trama de M amostras, T*2M sendo uma trama de 2M amostras e d é uma defasagem.
2. Processo, de acordo com a reivindicação 1, caracterizado pelo fato de que ambas uma decimação (E11) e uma interpolação da janela inicial (hs(2N)) são feitas durante a etapa de implementação do desdobramento temporal (E13) usado para calcular a transformada de tamanho M.
3. Processo, de acordo com a reivindicação 2, caracterizado pelo fato de que quando a transformada secundária é de tamanho M=3/2N, uma decimação (E11) da janela inicial (hs(2N)) seguida de uma interpolação é efetuada durante o desdobramento temporal (E13), conforme as seguintes equações: com TM uma trama de M amostras, T2M sendo uma trama de 2M amostras, hcomp sendo a janela complementar.
4. Dispositivo de decodificação por transformada de um sinal áudio-digital, utilizando janelas de ponderação de síntese (hs) aplicadas a tramas de amostras, caracterizado pelo fato de que compreende um módulo de amostragem (112) combinado para amostragem irregular (E10) de uma janela inicial (hs(2N)) prevista para uma transformada de tamanho inicial N determinada, de modo a obter uma janela para aplicar uma transformada secundária de tamanho M diferente de N, em que a amostragem irregular da janela inicial por pelo menos uma decimação (E11) da janela inicial (hs(2N)) é realizada por meio da implementação de desdobramento temporal (E13) usado para cálculo da transformada de tamanho M, em que a decimação (E11) durante o desdobramento temporal (E13) é realizada segundo a equação a seguir: com T*M sendo uma trama de M amostras, T*2M sendo uma trama de 2M amostras e d é uma defasagem.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1156356 | 2011-07-12 | ||
FR1156356A FR2977969A1 (fr) | 2011-07-12 | 2011-07-12 | Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee |
BR112014000611-3A BR112014000611B1 (pt) | 2011-07-12 | 2012-07-09 | Processo e dispositivo de codificação ou de decodificação por transformada de um sinal áudio-numérico |
PCT/FR2012/051622 WO2013007943A1 (fr) | 2011-07-12 | 2012-07-09 | Adaptations de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee |
Publications (1)
Publication Number | Publication Date |
---|---|
BR122021011692B1 true BR122021011692B1 (pt) | 2022-03-22 |
Family
ID=46639596
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR122021011683-0A BR122021011683B1 (pt) | 2011-07-12 | 2012-07-09 | Processo e dispositivo de codificação por transformada de um sinal áudio-digital utilizando janelas de ponderação de análise aplicadas a tramas de amostras |
BR112014000611-3A BR112014000611B1 (pt) | 2011-07-12 | 2012-07-09 | Processo e dispositivo de codificação ou de decodificação por transformada de um sinal áudio-numérico |
BR122021011692-0A BR122021011692B1 (pt) | 2011-07-12 | 2012-07-09 | Processo e dispositivo de decodificação por transformada de um sinal áudio-digital, utilizando janelas de ponderação de síntese aplicadas a tramas de amostras |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR122021011683-0A BR122021011683B1 (pt) | 2011-07-12 | 2012-07-09 | Processo e dispositivo de codificação por transformada de um sinal áudio-digital utilizando janelas de ponderação de análise aplicadas a tramas de amostras |
BR112014000611-3A BR112014000611B1 (pt) | 2011-07-12 | 2012-07-09 | Processo e dispositivo de codificação ou de decodificação por transformada de um sinal áudio-numérico |
Country Status (12)
Country | Link |
---|---|
US (2) | US9368121B2 (pt) |
EP (1) | EP2732448B1 (pt) |
JP (1) | JP6177239B2 (pt) |
KR (3) | KR102089281B1 (pt) |
CN (1) | CN103814406B (pt) |
BR (3) | BR122021011683B1 (pt) |
CA (1) | CA2841303C (pt) |
ES (1) | ES2556268T3 (pt) |
FR (1) | FR2977969A1 (pt) |
MX (1) | MX2014000409A (pt) |
RU (1) | RU2607230C2 (pt) |
WO (1) | WO2013007943A1 (pt) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2980791A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483879A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5357594A (en) * | 1989-01-27 | 1994-10-18 | Dolby Laboratories Licensing Corporation | Encoding and decoding using specially designed pairs of analysis and synthesis windows |
AU671952B2 (en) * | 1991-06-11 | 1996-09-19 | Qualcomm Incorporated | Variable rate vocoder |
US5504833A (en) * | 1991-08-22 | 1996-04-02 | George; E. Bryan | Speech approximation using successive sinusoidal overlap-add models and pitch-scale modifications |
JPH06141351A (ja) * | 1992-10-26 | 1994-05-20 | Matsushita Electric Ind Co Ltd | 信号発生装置 |
US6269338B1 (en) * | 1996-10-10 | 2001-07-31 | U.S. Philips Corporation | Data compression and expansion of an audio signal |
US6240299B1 (en) * | 1998-02-20 | 2001-05-29 | Conexant Systems, Inc. | Cellular radiotelephone having answering machine/voice memo capability with parameter-based speech compression and decompression |
WO1999059139A2 (en) * | 1998-05-11 | 1999-11-18 | Koninklijke Philips Electronics N.V. | Speech coding based on determining a noise contribution from a phase change |
US6430529B1 (en) * | 1999-02-26 | 2002-08-06 | Sony Corporation | System and method for efficient time-domain aliasing cancellation |
US6748363B1 (en) * | 2000-06-28 | 2004-06-08 | Texas Instruments Incorporated | TI window compression/expansion method |
US6707869B1 (en) * | 2000-12-28 | 2004-03-16 | Nortel Networks Limited | Signal-processing apparatus with a filter of flexible window design |
US7516064B2 (en) * | 2004-02-19 | 2009-04-07 | Dolby Laboratories Licensing Corporation | Adaptive hybrid transform for signal analysis and synthesis |
FR2870352B1 (fr) * | 2004-05-14 | 2006-06-23 | Thales Sa | Procede de localisation d'un emetteur avec un reseau synthetique lacunaire d'antennes |
WO2006110975A1 (en) * | 2005-04-22 | 2006-10-26 | Logovision Wireless Inc. | Multimedia system for mobile client platforms |
CN1862969B (zh) * | 2005-05-11 | 2010-06-09 | 尼禄股份公司 | 自适应块长、常数变换音频解码方法 |
US8255207B2 (en) * | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
PL2076901T3 (pl) * | 2006-10-25 | 2017-09-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie i sposób do generowania wartości podpasm audio i urządzenie i sposób do generowania próbek audio w dziedzinie czasu |
US8214200B2 (en) * | 2007-03-14 | 2012-07-03 | Xfrm, Inc. | Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid |
ES2666719T3 (es) * | 2007-12-21 | 2018-05-07 | Orange | Codificación/decodificación por transformada, con ventanas adaptativas |
JP5420659B2 (ja) | 2008-07-29 | 2014-02-19 | オランジュ | フィルタ補間によってエンコーダを更新する方法 |
KR101061723B1 (ko) * | 2008-09-25 | 2011-09-02 | (주)제너시스템즈 | 사운드 신호의 실시간 보간 장치 및 방법 |
CN101694773B (zh) * | 2009-10-29 | 2011-06-22 | 北京理工大学 | 一种基于tda域的自适应窗切换方法 |
US9454511B2 (en) * | 2011-05-04 | 2016-09-27 | American University | Windowing methods and systems for use in time-frequency analysis |
-
2011
- 2011-07-12 FR FR1156356A patent/FR2977969A1/fr active Pending
-
2012
- 2012-07-09 WO PCT/FR2012/051622 patent/WO2013007943A1/fr active Application Filing
- 2012-07-09 US US14/232,564 patent/US9368121B2/en active Active
- 2012-07-09 KR KR1020197031510A patent/KR102089281B1/ko active IP Right Grant
- 2012-07-09 CN CN201280034844.7A patent/CN103814406B/zh active Active
- 2012-07-09 KR KR1020147003681A patent/KR20140050056A/ko active Application Filing
- 2012-07-09 KR KR1020197031511A patent/KR102089273B1/ko active IP Right Grant
- 2012-07-09 MX MX2014000409A patent/MX2014000409A/es active IP Right Grant
- 2012-07-09 ES ES12744070.9T patent/ES2556268T3/es active Active
- 2012-07-09 BR BR122021011683-0A patent/BR122021011683B1/pt active IP Right Grant
- 2012-07-09 EP EP12744070.9A patent/EP2732448B1/fr active Active
- 2012-07-09 BR BR112014000611-3A patent/BR112014000611B1/pt active IP Right Grant
- 2012-07-09 CA CA2841303A patent/CA2841303C/fr active Active
- 2012-07-09 RU RU2014104488A patent/RU2607230C2/ru active
- 2012-07-09 BR BR122021011692-0A patent/BR122021011692B1/pt active IP Right Grant
- 2012-07-09 JP JP2014519605A patent/JP6177239B2/ja active Active
-
2016
- 2016-05-04 US US15/146,362 patent/US10373622B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN103814406A (zh) | 2014-05-21 |
US20140142930A1 (en) | 2014-05-22 |
CA2841303C (fr) | 2021-01-19 |
WO2013007943A1 (fr) | 2013-01-17 |
BR112014000611A2 (pt) | 2017-02-14 |
KR20140050056A (ko) | 2014-04-28 |
CA2841303A1 (fr) | 2013-01-17 |
EP2732448B1 (fr) | 2015-09-09 |
CN103814406B (zh) | 2016-05-11 |
BR122021011683B1 (pt) | 2022-03-22 |
KR102089273B1 (ko) | 2020-03-16 |
JP2014524048A (ja) | 2014-09-18 |
MX2014000409A (es) | 2014-09-15 |
US20170011747A1 (en) | 2017-01-12 |
RU2607230C2 (ru) | 2017-01-10 |
JP6177239B2 (ja) | 2017-08-09 |
US9368121B2 (en) | 2016-06-14 |
RU2014104488A (ru) | 2015-08-20 |
KR20190124331A (ko) | 2019-11-04 |
KR20190124332A (ko) | 2019-11-04 |
FR2977969A1 (fr) | 2013-01-18 |
BR112014000611B1 (pt) | 2021-09-08 |
EP2732448A1 (fr) | 2014-05-21 |
KR102089281B1 (ko) | 2020-03-16 |
ES2556268T3 (es) | 2016-01-14 |
US10373622B2 (en) | 2019-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR122021011692B1 (pt) | Processo e dispositivo de decodificação por transformada de um sinal áudio-digital, utilizando janelas de ponderação de síntese aplicadas a tramas de amostras | |
TWI405185B (zh) | 用於5點離散餘弦轉換-ii(dct-ii),離散餘弦轉換-iv(dct-iv)及離散正弦轉換-iv(dst-iv)之計算的快速演算法與結構 | |
TWI398854B (zh) | 用於計算轉換值及執行定窗運算之方法、裝置、電路及電腦可讀媒體,及用於提供一解碼器之方法 | |
JP6125324B2 (ja) | 音声信号のタイムワープ処理改良変換符号化 | |
ES2928307T3 (es) | Remuestreo por interpolación de una señal de audio para una codificación/decodificación de bajo retardo | |
BR122021008239B1 (pt) | Codificador de áudio e decodificador de áudio | |
WO2009093714A1 (ja) | 符号化方法、復号化方法、それらの装置、及びそれらのプログラムと記録媒体 | |
BR122020020536B1 (pt) | Sistema configurado para gerar um sinal esticado no tempo e/ou transposto na frequência de um sinal de áudio de entrada | |
JP2007520748A (ja) | 複素値データを用いたオーディオ信号の復号 | |
KR20100007738A (ko) | 음성/오디오 통합 신호의 부호화/복호화 장치 | |
BR122020015614B1 (pt) | Método e dispositivo para interpolar parâmetros de filtro de predição linear em um quadro de processamento de sinal sonoro atual seguindo um quadro de processamento de sinal sonoro anterior | |
JP2004531151A (ja) | 時間離散オーディオサンプル値を処理する方法と装置 | |
BRPI0412166B1 (pt) | aparato e método para a conversão em uma representação transformada ou para a conversão inversa da representação transformada | |
BR112013033727B1 (pt) | Processo de codificação, processo de decodificação de um sinal digital, dispositivo de codificação e dispositivo de decodificação de um sinal | |
BR112016010522B1 (pt) | Processo de decodificação e processo de codificação de um sinal áudio digital, decodificador e codificador de um sinal áudio digital, e meio de armazenagem legível por um processador | |
JP7089079B2 (ja) | ダウンスケールされた復号化 | |
KR20110052677A (ko) | 필터 보간에 의해 인코더를 업데이트하는 방법 | |
Ahmed et al. | ECG signal compression using combined modified discrete cosine and discrete wavelet transforms | |
Guillemot et al. | Exact reconstruction filter banks using cosine modulation: matrix formalization for arbitrary length prototype filters | |
Krishnan | Fast integer MDCT for MPEG/audio coding | |
BR112017001630B1 (pt) | Processador e método para processamento de um sinal de áudio utilizando análise truncada ou partes de sobreposição da janela de síntese | |
BR122021006965B1 (pt) | Codificador de áudio e decodificador de áudio |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06A | Patent application procedure suspended [chapter 6.1 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 09/07/2012, OBSERVADAS AS CONDICOES LEGAIS. |