BRPI0718465A2 - Método e dispositivo para a transcodificação de sinais de áudio - Google Patents

Método e dispositivo para a transcodificação de sinais de áudio Download PDF

Info

Publication number
BRPI0718465A2
BRPI0718465A2 BRPI0718465-4A BRPI0718465A BRPI0718465A2 BR PI0718465 A2 BRPI0718465 A2 BR PI0718465A2 BR PI0718465 A BRPI0718465 A BR PI0718465A BR PI0718465 A2 BRPI0718465 A2 BR PI0718465A2
Authority
BR
Brazil
Prior art keywords
time
domain
parameter
audio signal
parameter domain
Prior art date
Application number
BRPI0718465-4A
Other languages
English (en)
Inventor
Peter Jax
Sven Kordon
Original Assignee
Thomson Licensing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing filed Critical Thomson Licensing
Publication of BRPI0718465A2 publication Critical patent/BRPI0718465A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

“MÉTODO E DISPOSITIVO PARA A TRANSCODIFICAÇÃO DE SINAIS DE ÁUDIO”
CAMPO DA INVENÇÃO
A presente invenção refere-se a um método e dispositivo para a transcodificação de sinais de áudio. A mesma é relevante ao campo da compactação de áudio, e mais especifi- camente ao campo da transcodificação entre diferentes formatos de codificação perceptiva de áudio. No entanto, pode ser também vantajosa a utilização do conceito básico da presen- te invenção em outras aplicações de processamento de áudio.
FUNDAMENTOS DA INVENÇÃO
O termo "transcodificação de áudio" geralmente denota a derivação de um fluxo de bits representando um sinal de áudio de acordo com um determinado formato de codificação de áudio de um outro fluxo de bits, que é organizado de acordo com um formato diferente de codificação de áudio. Nesse sentido, "transcodificação" indica o procedimento como um todo de obtenção, por exemplo, de um fluxo de bits compatível com o padrão MPEG AAC de um fluxo de bits compatível com a camada Ill do padrão MPEG 1 (mp3).
No presente documento, no entanto, o termo "transcodificação de áudio" é usado em um sentido mais técnico no sentido de descrever a conversão do sinal de áudio de uma sub-banda ou domínio de transformação para outro. Isto é, o termo descreve apenas uma etapa principal na conversão de uma representação para outra, em vez de todo um proce- dimento.
O princípio básico da codificação genérica perceptiva de áudio tal como é conheci- da na literatura (vide T. Painter e A. Spanias (2000): Perceptual Coding of Digital Audio, Proceedings ofthe IEEE, vol. 88) é mostrado na Figura I.
Os atuais métodos e formatos de compactação para sinais de áudio geralmente uti- lizam uma análise tempo - frequência 102, ou seja, um banco de filtro ou um transformador, para representar os parâmetros 110 do sinal de áudio 107. Estes parâmetros são sujeitos à quantização e codificação 104, à codificação por entropia 105 e a operações de fluxos de bits 106; todas essas etapas sendo controladas por meio de uma análise psicoacústica 101 do sinal de entrada de áudio. A Figura 2 mostra um decodificador de áudio genérico percep- tivo correspondente com operações de fluxos de bits 201, uma decodificação por entropia 202, uma alocação de bits 203, uma decodificação e uma dequantização 204 e, finalmente, uma síntese de tempo e frequência, que gera o sinal de domínio de tempo 214 a partir dos parâmetros 212.213.
As Figuras 1 e 2 ilustram e exemplificam o princípio básico de codecs de áudio per- ceptivo. No entanto, embora implementações específicas possam variar até certo ponto, as mesmas normalmente empregam uma análise tempo - frequência ou o seu inverso, uma síntese de tempo - frequência. Com enfoque, em seguida, sobre a análise e síntese de tempo - frequência, as eta- pas de codificação e decodificação intermediárias não serão consideradas em maiores deta- lhes.
Para a análise tempo - frequência 102, inúmeros algoritmos diferentes são utiliza- dos nos codecs de áudio atuais. Por exemplo, os padrões de codec de áudio MPEG incluem os codecs de camada I e Il de padrão MPEG-1 que usam um banco de filtro pseudo-QMF (filtro de quadratura espelhada) de 32 bandas, e uma camada Ill do padrão MPEG-1 (mp3) que emprega um banco de filtro híbrido, ou seja, uma cascata de um banco de filtro pseudo- QMF de 32 bandas seguido de um banco de filtro da MDCT (transformada DCT modificada). A filtragem da transformada MDCT (padrão de 18 bins, reduzido a 6 bins para transientes) conduz a uma resolução espectral de 576 ou 192 bins, respectivamente. O dispositivo codec de padrão MPEG AAC e seus derivados utilizam uma abordagem de transformada MDCT de banda inteira com uma resolução padrão de 1024 bins (reduzida para 256 bins para tran- sientes). Os quadros de áudio são muitas vezes sobrepostos temporalmente em certa medi- da, por exemplo, 50 %, o que define o assim chamado avanço de quadro (100% - over- lap)*frame_size.
Na seqüência, o domínio entre a saída da análise tempo - frequência 102 e a entra- da da síntese tempo - frequência 205 (no qual o sinal de saída 116 do codificador é a entra- da 206 para o decodificador) será denominado como "domínio de frequência" ou "domínio de parâmetro", independentemente se o formato específico de codificação de áudio utiliza um banco de filtros ou um transformador de blocos para a análise tempo - frequência.
Devido ao sempre crescente número de formatos de áudio existentes e emergen- tes, há a crescente necessidade de algoritmos para a transcodificação de conteúdo de áudio de um formato de fluxo de bits para outro. A Figura 3 mostra uma abordagem para uma 25 transcodificação de áudio que é normalmente utilizada hoje em dia, pois envolve apenas os módulos de padrões disponíveis já descritos nas Figuras 1 e 2. O fluxo de bits de entrada codificado em um formato de origem é decodificado DEC_A no sinal PCM de domínio de tempo contínuo TD. Um codificador independente ENC_B produz então um novo fluxo de bits de acordo com o formato de destino. A única interface entre os blocos de processamen- 30 to de sinal é o sinal de áudio de domínio de tempo TD que é transmitido do decodificador para o codificador.
Embora esta abordagem seja simples de se usar, ocorrem os seguintes problemas. Em primeiro lugar, uma vez que os dois blocos DEC_A, ENC_B não se conhecem entre si, os procedimentos de análise tempo - frequência podem ser dessincronízados: em geral, 35 ocorre uma série de operações para a decodificação (dequantização) e codificação (quanti- zação) que conduz a degradações da qualidade do sinal, os assim chamados erros tandem. Em segundo lugar, a complexidade computacional da abordagem é elevada, pelo que será conveniente reduzir a mesma de forma significativa. Um melhor resultado de transcodificação pode ser obtido quando uma informação lateral que seja, até certo ponto, comum aos formatos de origem e de destino é extraída pelo decodificador e reutilizada no codificador. A Figura 4a mostra um exemplo desta abor- dagem, que pode ser utilizada, por exemplo, para a transcodificação do formato Dolby AC-3 ao formato BSAC (Bit Sliced Arithmetic Coding) (Codificação Aritmética Fracionada em Bits) (vide Kyoung Ho Bang, Young Cheol Park, e Dae Hee Youn (2006). “Audio Transcodina Al- aorithm for Mobile Multimedia Application”. Proc. of ICASSP, vol. 3). Neste exemplo em par- ticular, a alocação de bits em AC-3 pode ser reutilizada no sentido de derivar ou controlar e uma nova alocação de bits 403 dentro do codificador BSAC. Além de reutilizar as informa- ções laterais SI do fluxo de bits de origem, os procedimentos de síntese e análise tempo - frequência são sincronizados temporalmente. Neste caso, o conceito avançado da Figura 4a reduz a complexidade computacional, em comparação ao esquema de transcodificação a- cima descrito, e pode conduzir a uma melhor qualidade do sinal de destino.
Se (e somente se) os formatos de codec do fluxo de bits de origem e destino forem idênticos em termos de seu domínio de análise tempo - frequência, ou seja, os blocos de análise e síntese forem totalmente complementares (por exemplo, a transcodificação de um fluxo de bits de mp3 a partir de uma dada taxa para uma menor taxa de dados), a transcodi- ficação poderá ser ainda mais simplificada, conforme mostrado na Figura 4b: os procedi- mentos de análise e síntese de tempo - frequência poderão ser omitidos, de modo que a modificação da taxa de dados ocorra diretamente no domínio de parâmetro DP, por exem- plo, por meio da re-quantização de determinados parâmetros. É também benéfica a reutili- zação de informações laterais, por exemplo, a alocação de bits, a partir do fluxo de bits de origem.
SUMÁRIO DA INVENÇÃO
Torna-se evidente, a partir da descrição acima, que um método simples e dispositi- vo para a transcodificação entre formatos de codificação com diferentes domínios de análise tempo - frequência são inexistentes. Um aspecto da presente invenção é prover tal método e dispositivo, especialmente para facilitar e acelerar a transcodificação entre os sinais de áudio com diferentes domínios de análise tempo - frequência.
A presente invenção utiliza um mapeamento linear a partir do domínio de parâmetro de origem para o domínio de parâmetro de destino, no qual os parâmetros de destino de- pendem dos parâmetros de origem de dois ou mais quadros de entrada. Isto permite uma transcodificação de baixa complexidade entre os diferentes domínios de análise tempo - frequência, e evita o problema da degradação do sinal em função de um processamento convencional.
Foi reconhecido que a síntese de tempo - frequência e a posterior análise tempo - freqüência da abordagem de transcodificação convencional podem ser expressas como o- perações lineares, que, no entanto, são geralmente variantes no tempo.
De acordo com um aspecto da invenção, um método de transcodificação de um si- nal de áudio a partir de um primeiro domínio de parâmetro de entrada (por oposição ao do- mínio de tempo) em um segundo domínio de parâmetro de saída compreende uma etapa de mapeamento de parâmetros do domínio de parâmetro de entrada aos parâmetros de domí- nio de parâmetro de saída, no qual pelo menos um parâmetro de saída depende linearmen- te de dois ou mais parâmetros de entrada (ou seja, o parâmetro de saída é uma combinação linear dos dois ou mais parâmetros de entrada). Os dois ou mais parâmetros de entrada são provenientes de dois ou mais quadros de entrada diferentes.
Em uma modalidade, o mapeamento ou transformação que descreve a relação en- tre o dito parâmetro de saída e os ditos dois ou mais parâmetros de entrada é variante no tempo. No entanto, para os formatos de quadro de entrada e/ou saída estruturados, o mes- mo é uma seqüência de uma pluralidade de relações invariantes no tempo. Esta vem a ser particularmente vantajoso quando os avanços de quadro (descrevendo uma sobreposição temporal dos quadros) da análise tempo - frequência do domínio de parâmetro de entrada e da síntese de tempo - frequência do domínio de parâmetro de saída se diferem.
Em uma modalidade, o mapeamento variante no tempo se repete periodicamente, ou seja, é uma repetição periódica dos mapeamentos invariantes no tempo.
Em uma modalidade, o mapeamento compreende as sub-etapas do mapeamento parcial dos vetores de entrada de diferentes quadros de origem, que são em seguida adicio- nados ou sobrepostos a um único quadro de saída.
Em uma modalidade, são criados super-quadros sobre um número inteiro de qua- dros de entrada correspondentes a um número inteiro de quadros de saída. Os números inteiros dependem dos tamanhos dos quadros e dos deslocamentos dos quadros dos forma- tos de entrada e saída. Um super-quadro pode corresponder a um ou mais períodos de re- petição do mapeamento variante no tempo.
Em uma modalidade, cada fase invariante no tempo da relação variante no tempo é expressa como uma operação linear que recebe entradas de uma pluralidade de quadros sucessivos de sinal de formato de entrada e produz uma saída para um quadro do sinal de formato de saída. Sendo assim, a partir desta repetição periódica resulta-se uma seqüência de operações lineares para um super-quadro.
Em uma modalidade, o mapeamento variante no tempo é implementado como uma seqüência de transformações lineares com o uso de tabelas de pesquisa para os coeficien- tes de transformação pré-calculados. Em outra modalidade, no entanto, as transformações lineares são expressões analíticas predefinidas, por exemplo, funções, que são aplicados aos parâmetros de entrada. Uma vantagem da presente invenção é que a complexidade computacional neces- sária para a transformação linear direta a partir de um domínio de parâmetro em um outro domínio sem passar o sinal de domínio de tempo contínuo é significativamente menor que o procedimento de transcodificação direta convencional através do sinal de domínio de tempo.
Uma outra vantagem é que a troca entre a qualidade da transcodificação e a com-
plexidade computacional pode ser adaptada às exigências da aplicação variante no tempo, mesmo em uma maneira seletiva em frequência.
Uma outra vantagem é que a transcodificação direta através de uma única trans- formação linear é numericamente mais bem condicionada do que o esquema de transcodifi- 10 cação convencional através do sinal de domínio de tempo. Uma vez que a influência de de- terminados bins de parâmetro do domínio de origem é limitada a uma pequena faixa de bins de parâmetro do domínio de destino, os efeitos abrangentes da quantização e de operações numéricas inexatas (como, por exemplo, comuns em uma implementação de ponto fixo de uma transcodificação convencional) são minimizados.
As modalidades vantajosas da presente invenção são mostradas nas reivindicações
dependentes, na descrição a seguir e nas figuras.
BREVE DESCRICÃO DOS DESENHOS
Modalidades exemplares da presente invenção são descritas com referência aos desenhos em anexo, nos quais:
A Figura I mostra a estrutura de um codificador de áudio genérico perceptivo;
A Figura 2 mostra a estrutura de um decodificador de áudio genérico perceptivo:
A Figura 3 mostra uma transcodificação direta convencional;
A Figura 4a mostra uma transcodificação convencional com a reutilização de uma alocação de bits;
A Figura 4b mostra uma transcodificação convencional entre formatos de áudio i-
dênticos;
A Figura 5 mostra uma transcodificação direta entre diferentes domínios de parâ- metro;
A Figura 6 mostra uma transcodificação entre diferentes domínios de tempo - fre- quência com diferentes avanços de quadro;
A Figura 7 mostra um codificador de mp3 híbrido mais um formato de áudio de ex- tensão sem perda;
A Figura 8 mostra um decodificador para um mp3 híbrido mais um formato de áudio de extensão sem perda;
A Figura 9 mostra os coeficientes de uma matriz de transformação exemplar;
A Figura 10 mostra detalhes da matriz de transformação exemplar; e
A Figura 11 mostra a estrutura de um transcodificador entre diferentes formatos de áudio no domínio de parâmetro.
DESCRIÇÃO DETALHADA DA INVENÇÃO
A Figura 5 mostra uma transcodificação direta no domínio de parâmetro entre dois formatos, com os dois formatos tendo diferentes domínios parâmetro PDa, PDb. Um deter- 5 minado número de quadros de parâmetro adjacentes 501, de acordo com um formato de origem A, por exemplo, um mp3, foi previamente derivado (não mostrado) a partir de um sinal de áudio de modulação PCM por meio de um esquema de análise tempo - frequência do formato de origem. Cada quadro m-l, m, m+l compreende uma série de parâmetros, po- dendo, assim, ser considerado como um vetor de parâmetro no domínio de parâmetro de 10 origem PDa. Uma matriz de transformação linear Tt é aplicada aos vetores de parâmetro de entrada 501, e provê um vetor de parâmetro de saída 502 correspondente a um quadro em um domínio de parâmetro de saída PD6 do formato de saída B.
Para um único quadro de saída n, a transformação ou mapeamento é invariante no tempo. Independentemente se a matriz de transformação matriz Tt é aplicado à pluralidade 15 de quadros de entrada em simultâneo, ou matrizes de transformação separadas são (simul- tânea ou sucessivamente) aplicadas aos respectivos quadros de entrada e os resultados parciais são em seguida adicionados, a matriz Tt resultante será a mesma em ambos os casos, uma vez que as etapas de transformação são lineares.
Em princípio, o mapeamento da transformação Tt abrange todas as sub-etapas do processamento convencional 510, onde cada vetor de parâmetro vetor PA(m), Pa (m+1)... é transformado nos segmentos de domínio de tempo correspondentes TDs por meio da multi- plicação com uma matriz de transformação linear TSa (Sa representando a síntese de acor- do com o formato de origem). Neste exemplo, os segmentos de tempo são sobrepostos, e alimentados para um procedimento de adicionar sobreposição 503 a fim de obter o sinal de áudio 504 do domínio de tempo contínuo decodificado TDc. Neste caso, a análise tempo - frequência de acordo com o formato de destino B se realiza no processo de transcodificação convencional. O sinal de domínio de tempo contínuo 504 é decomposto (normalmente) em uma série de segmentos de sobreposição, segundo o qual a sobreposição pode ser diferen- te da sobreposição empregada pelo formato A, e os vetores de segmento são em seguida transformados no domínio de parâmetro de destino PDe através da multiplicação pela matriz TAb (Ab representando a análise (A) de acordo com o formato B). Desde que o formato de destino B possa se aplicar a um diferente deslocamento de quadro com relação ao formato de origem A, um índice de quadro separado n é usado.
A descrição acima e a Figura 5 são genéricas no sentido de que abrangem todos os esquemas de análise tempo - frequência que são hoje em dia de relevância prática em uma codificação de áudio. As matrizes Tsa e Tab podem descrever exatamente qualquer esque- ma de síntese ou análise tempo - frequência que se baseie nas transformações de bloco lineares ou nos bancos de filtro de alimentação direta linear (FIR, resposta de impulso finito). As estruturas em cascata, por exemplo, do banco de filtro híbrido do dispositivo codec mp3, podem ser combinadas nas matrizes TSa e TAb- Da mesma forma, os bancos de filtro ou as transformações de reconstrução não perfeita são cobertas. Para os bancos de filtro de IIR (resposta de impulso infinito), uma representação suficientemente precisa poderá ser formu- lada ao aproximar as respostas de impulso infinito das respostas de impulso finito por meio da anexação de valores insignificantes.
O conceito de transcodificação, de acordo com a presente invenção, explora a line- aridade das etapas de síntese e análise tempo - frequência TSa, TAb, envolvidas no processo de transcodificação, e dos blocos de segmentação e adição de sobreposição 503, 505. A seqüência da síntese de tempo - frequência TSa, de adição de sobreposição 503, de seg- mentação 505 e de análise tempo - frequência Tab é substituída por uma única transforma- ção linear TT, de modo a vantajosamente não ser necessário gerar um sinal de domínio de tempo contínuo 504.
A seguir, algumas propriedades da transformação linear Tt serão descritas.
Uma derivação exata da matriz de transformação Tt é possível, mas pode não ser trivial. Além do procedimento de derivação analítica, existe a possibilidade de treinar a ma- triz através da simulação e medição das contribuições lineares de cada elemento de parâ- metro (por exemplo, o bin espectral) do domínio de parâmetro de origem para um quadro de destino do domínio de parâmetro de destino. A matriz Tt pode, por exemplo, ser representa- da por expressões analíticas ou por tabelas de pesquisa.
Como conseqüência da adição de sobreposição 503 de vários segmentos de tempo consecutivos em uma trajetória de transcodificação convencional, a transformação linear TT, em geral, não será um mapeamento de um - para - um, mas sim um mapeamento de muitos
- para - um. Isso significa que pelo menos dois, normalmente três ou mais, quadros do do- mínio de origem têm influência sobre um quadro do domínio de destino. Vice-versa, cada quadro do domínio de origem afeta mais de um quadro do domínio de destino.
Embora os procedimentos de síntese e análise tempo - frequência que definem os domínios de parâmetro AeB sejam supostamente lineares, os mesmos são tipicamente variantes no tempo. Portanto, a transformação direta Tt depende da sincronização do domí- nio de tempo dos segmentos de tempo do domínio de origem versus os do domínio de des- tino. Em outras palavras, a modificação da diferença de sincronização entre os quadros para as representações A e B em geral produz uma outra matriz de transformação direta TT. Por conseguinte, quando os deslocamentos de quadro da síntese de tempo - frequência do for- mato de origem e a análise tempo - frequência do formato de destino são diferentes, a ma- triz Tt será, então, variante no tempo. Um exemplo é mostrado na Figura 6 para uma trans- codificação entre o padrão MPEG AAC (avanço de quadro de 1024 amostras) e o mp3 (a- vanço de quadro de 576 amostras). A transformação variante no tempo compreende uma seqüência dezesseis matrizes de transformação invariante no tempo Tt a ser empregada neste caso (desprezando os esquemas de comutação de janela). A Figura 6 mostra se- qüências de vetores de domínio de freqüência para AAC e mp3. Devido aos diferentes a- 5 vanços de quadro, o deslocamento de tempo entre os quadros varia com o tempo. Deslo- camentos de tempo idênticos entre os quadros de AAC e mp3 ocorrem após um período de nove quadros de AAC ou dezesseis quadros de mp3, respectivamente. Neste exemplo, este período é um super-quadro. Em cada super-quadro, dezesseis matrizes de transformação pré-determinadas diferentes (por exemplo, tabelas) são utilizadas para a transcodificação do 10 domínio de AAC para os dezesseis quadros de mp3. Essa seqüência de transformações se repete em cada super-quadro. Assim, a transformação (dentro de um super-quadro) é vari- ante no tempo.
Geralmente, o número de transformações na seqüência periódica dentro de um su- per-quadro corresponde ao número de quadros no formato de destino. Por exemplo, para a transcodificação de mp3 para AAC1 a transformação variante no tempo compreende nove transformações invariantes no tempo, uma para cada quadro do super-quadro 9m, 9m+l, ..., 9m+8. A relação entre os quadros é vice-versa, neste caso, em comparação à Figura 6, por
exemplo, o segundo quadro de AAC 9m+l depende de cinco quadros de mp3 16m.....
16m+4. No entanto, devido à linearidade das transformações, é igualmente possível efetuar transformações separadas de um quadro de formato de origem em um quadro de formato de destino, e adicionar os vetores de resultado necessário para a obtenção do quadro de destino. No presente exemplo, isso resulta em uma seqüência de quarenta transformações além da adição exigida por quadro de destino.
A expressão "avanço de quadro" descreve o mútuo deslocamento de sucessivos quadros de análise tempo - frequência. Isso depende da sobreposição temporal de sucessi- vos quadros, e é diferente da duração temporal de um quadro.
Quando os dois procedimentos de análise tempo - frequência apresentam uma boa separação de bins de parâmetros adjacentes e quando, além disso, as resoluções espec- trais são semelhantes, a matriz de transformação Tt fica geralmente esparsa e mais ou me- 30 nos diagonal. Ou seja, grande parte da transformação Tt fica igual a zero e não deve ser considerada na transformação. Sendo assim, a transcodificação por meio da transformação linear com a matriz Tt pode ser esperada para ser computacionalmente muito menos com- plexa do que o método de transcodificação convencional através do sinal de domínio de tempo contínuo.
Uma matriz de transformação exemplar é mostrada na Figura 9. O nível cinza indi-
ca a magnitude logarítmica dos coeficientes de uma matriz de transformação Tt para a transcodificação do banco de filtros híbrido de mp3 em uma transformada MDCT de banda inteira (com janelas longas para ambas). Exemplarmente, três quadros consecutivos de mp3 influenciam o quadro de transformada MDCT de destino. O valor dos coeficientes nas áreas escuras é superior ao das áreas claras. Neste exemplo, as magnitudes de 97,7 % dos coefi- cientes de transformação são inferiores a -60 dB. Esses coeficientes podem ser insignífican- 5 tes para a transcodificação, de modo que a multiplicação de matrizes pode ser realizada com muito pouco esforço computacional.
A Figura 10 mostra um detalhe da região central da Figura 9, ilustrado como um gráfico de barras tridimensional ao invés do código de níveis em tons de cinza. A partir dos coeficientes ilustrados 41*41=1681, a maior parte dos mesmos se encontra abaixo de -60dB 10 (cortado em -80dB), ou seja, insignificante. Em termos idéias, a apenas alguns coeficientes ao longo de uma região linear terão valores de um nível relevante. Neste exemplo analitica- mente derivado, outras regiões também que atravessam a região linear a distâncias periódi- cas de dezoito bins terão valores não negligenciáveis, causadas por um efeito de distorção por graduação gráfica no banco de filtro híbrido de mp3: uma quantidade significativa de 15 componentes de graduação gráfica permanecem apesar de uma correção da graduação gráfica ter sido aplicada no banco de filtro híbrido de mp3. Esta graduação gráfica não se encontra presente no caso de uma transformada MDCT de banda inteira.
Para as transformações variantes no tempo, a matriz de transformação Tt de acor- do com as Figuras 9 e 10 pode ser válida para apenas um quadro de saída (isto é, para um quadro em particular dentro de cada super-quadro), enquanto que, para outros quadros de saída, os coeficientes serão diferentes.
A complexidade computacional pode ser reduzida ainda mais ao se levar em consi- deração as exigências de precisão seletivas em frequência. Por exemplo, se o fluxo de bits de núcleo de mp3 tiver uma baixa taxa de bits, os bins de alta freqüência, geralmente, en- 25 tão, não serão codificados, sendo configurados em zero (ou seja, mascarados) no decodifi- cador. Neste caso, a parte de alta freqüência da transformação de transcodificação Tt pode- rá ser omitida. De modo geral, qualquer faixa de freqüência poderá ser facilmente mascara- da. O mascaramento também pode ser variante no tempo e/ou dependente de sinais, por exemplo, com base na alocação de bits que é incluído nas informações laterais. Este mas- 30 caramento fácil e flexível vem a ser uma vantagem em comparação à transcodificação con- vencional através do sinal de domínio de tempo contínuo.
À princípio, uma matriz de transformação Tt descreve a transformação para cada bin de freqüência do quadro de destino de uma maneira resumida. Devido à linearidade da transformação, a matriz de transformação pode ser decomposta em sub-matrizes, algumas 35 das quais podendo também ser negligenciadas (por exemplo, quando certos bins de fre- quência de destino não são necessários). Assim, uma fatia ou fração da transformação total é selecionada, sendo esta a que realmente precisa ser calculada. Com este propósito, por exemplo, as frequências predominantes ou as informações laterais, tais como a alocação de bits da origem e/ou os quadros de destino poderão ser avaliadas.
Quando a precisão requerida da transcodificação é seletiva em frequência, a utili- zação da matriz de transformação Tt poderá ser variante no tempo. Por exemplo, na trans- 5 codificação de um formato de áudio compactado em um outro, as exigências dependentes de frequência para a transcodificação, a precisão poderá ser determinada como uma função da alocação de bit do formato de áudio de origem ou de destino. Por exemplo, para os bins de frequência de destino que demandam uma precisão menor de transcodificação (sendo um motivo possível o de que o número de bits alocados é pequeno), os elementos não-zero 10 da matriz Tt devem ser considerados ao se computar uma transformação de transcodifica- ção. Deste modo, a complexidade computacional poderá ser ainda mais reduzida.
Com o esquema de transcodificação apresentado, a influência de cada bin de pa- râmetro do domínio de origem fica limitada a um conjunto muito pequeno de bins de parâ- metro no domínio de destino. Portanto, o comportamento numérico do esquema proposto é 15 muito mais condicionado do que uma transcodificação convencional através de um sinal de domínio de tempo. Na transcodificação convencional, os componentes de sinal forte em al- gumas partes do espectro de frequências poderão influenciar todo o espectro no domínio de parâmetro transcodificado, devido às imprecisões numéricas dos procedimentos de síntese e análise tempo - frequência.
Uma modalidade exemplar da presente invenção se refere à transcodificação do
domínio de parâmetro de acordo com o banco de filtros híbridos empregado na camada Ill do padrão MPEG-1 (mp3) em um domínio de parâmetro de destino, de acordo com uma transformada MDCT de banda inteira ou uma transformada MDCT de número inteiro com um avanço de quadro idêntico ou com uma quantidade idêntica de bins de freqüência. Um 25 exemplo de aplicação é uma codificação híbrida sem perda de amostras de modulação PCM de áudio no topo de um fluxo de bits de mp3 embutido. Neste caso, o esquema de transco- dificação rápida apresentado é usado para a predição dos bins de transformada MDCT de número inteiro de banda inteira a partir de bins de mp3 decodificados. No entanto, a trans- codificação pode envolver mais do que apenas o quadro em questão de bins de mp3.
Um respectivo sinal de fluxo de codificador é mostrado na Figura 8. A parte inferior
do fluxo de sinal do codificador representa um codificador de mp3 convencional, incluindo um banco de filtros polifásicos e uma decimação 701, uma segmentação e uma transforma- da MDCT 702, uma Transformação Rápida de Fourier (FFT) 704, uma análise psicoacústica 705, uma alocação de bits e um quantizador 703, um codificador de informação lateral 706 e 35 um multiplexador 707. Na trajetória de sinal superior do codificador híbrido sem perda, uma segmentação paralela e uma transformada MDCT de número inteiro de banda inteira 709 é aplicada. A segmentação e o controle para a transformada MDCT de banda inteira aplicam o mesmo esquema de comutação de janela adaptativo como o dispositivo codec de núcleo de mp3. Além disso, a resolução espectral da transformada MDCT de número inteiro de banda inteira é controlada de acordo com a resolução espectral variante no tempo do banco de filtros de mp3. Para uma sincronização concisa de dois procedimentos de análise tempo - frequência paralelos, principalmente quando uma transformação de transcodificação é utili- zada envolvendo mais de um quadro de mp3 (normalmente três ou mais), um atraso 708 das amostras de modulação PCM tem de ser introduzido antes da transformada MDCT de número inteiro e da segmentação correspondente 709.
O objetivo da transformada MDCT de número inteiro de banda inteira 709 e dos blocos de processamento de sinal subsequentes blocos é permitir, em termos matemáticos, a codificação sem perda das amostras de modulação PCM de domínio de tempo. Portanto, uma transformada MDCT de número inteiro reversível é usada. O conceito é comparável ao princípio aplicado no dispositivo codec de áudio do padrão MPEG SLS (escalável para sem perda) que, no entanto, se baseia na subtração dos bins de frequência mp3 "dequantizados" e arredondados dos bins de transformada MDCT de banda inteira. No entanto, devido às discrepâncias significativas entre o banco de filtros de mp3 e a transformada MDCT de ban- da inteira, a computação do sinal residual por meio da simples subtração destes bins de frequência de mp3 "dequantizados" e arredondados dos bins de transformada MDCT de banda inteira não resulta em uma redução suficiente da entropia de sinal, conforme exigido para uma codificação de baixa taxa sem perda. Por conseguinte, o esquema de transcodifí- cação apresentado de acordo com a presente invenção é usado no codificador e no decodi- ficador no sentido de determinar uma previsão mais precisa de todos os bins de transforma- da MDCT de banda inteira. Por esta razão, a transformação de transcodificação 711 (atra- vés da matriz TT) em geral leva pelo menos três quadros de mp3 em consideração, depois de dequantizar (quantização inversa 710) os seus coeficientes.
Uma vez que o banco de filtros de mp3 701 aplica uma comutação adaptativa a si- nais entre janelas curtas e longas de análise / síntese, a matriz de transformação Tt é vari- ante no tempo (não mostrado na Figura 7). Diferentes transformações são aplicadas nas janelas longas, nas janelas curtas e nas fases de transição. Por exemplo, duas ou mais transformações adjacentes podem ser intercaladas em uma transformação, ou uma trans- formação pode ser dividida em duas ou mais transformações, de modo que o número de diferentes transformações invariantes no tempo por super-quadro possa variar dentro de um fluxo.
Conforme descrito acima, a complexidade computacional pode ser ainda mais re- duzida por meio da seletividade em frequência, por exemplo, omitindo a parte da frequência alta e/ou baixa da transformação de transcodificação TT.
Um respectivo decodificador para a decodificação de mp3 sem perda é ilustrado na Figura 8. A transcodificação e o arredondamento 805 do decodificador são idênticos à trans- codificação e ao arredondamento 711 do codificador. Da mesma forma, o quantizador inver- so 710, 803 é idêntico no codificador e decodificador. O procedimento de decodificação sem perda 802 é complementar ao procedimento de codificação sem perda 713, e o decodifica- dor de informações laterais 804 é complementar ao codificador de informações laterais 706.
Uma outra modalidade abrange a transcodificação rápida entre diferentes formatos de áudio, relacionada, portanto, ao entendimento tradicional do termo "transcodificação", ou seja, a conversão de um conteúdo de áudio a partir de um formato de compactação para outro. De modo geral, a transcodificação pode se iniciar com qualquer quadro do formato de origem.
Um diagrama em blocos do sistema proposto que aplica uma transcodificação dire- ta no domínio de parâmetro é ilustrado na Figura 11. Comparada ao sistema de transcodifi- cação convencional da Figura 4, esta modalidade da presente invenção substitui a seqüên- cia de síntese de tempo - frequência para o decodificador DEC_A e a análise tempo - fre- 15 quência para o codificador ENC_B pela transcodificação direta Tt do domínio de parâmetro de origem PDa no domínio de parâmetro de destino PDb. Uma vantagem desta abordagem é a menor complexidade computacional, e, por conseguinte, uma eficiência maior e melhor comportamento numérico, significando menos distorção de sinal. Isto é válido especialmente para as implementações de ponto fixo com limitada precisão das operações matemáticas 20 geralmente empregadas em uma transcodificação. Sendo assim, a presente invenção per- mite uma transcodificação mais rápida de um formato de áudio de origem em um formato de áudio de destino, e uma melhor qualidade do resultado do que nos esquemas de transcodi- ficação convencionais. Além disso, as informações laterais SI' são usadas de maneira simi- lar às informações laterais dos sistemas de transcodificação convencionais.
A utilização dos algoritmos apresentados não se limita à conversão total de um for-
mato de codificação para outro; os mesmos podendo também ser usados como um bloco de construção de outros algoritmos relacionados ao áudio, assim como mostram exemplarmen- te algumas das modalidades acima.
As típicas aplicações exemplares da presente invenção vêm a ser uma previsão dos parâmetros de tempo - frequência para uma codificação sem perda, para uma transcodi- ficação de alta qualidade entre diferentes formatos de áudio, além de outros aspectos.

Claims (21)

1. Método para a transcodificação de um sinal de áudio enquadrado a partir de um primeiro domínio de parâmetro (PDA) em um segundo domínio de parâmetro (PDB), sendo que o sinal de áudio enquadrado é uma representação de domínio de parâmetro de um sinal de áudio de domínio de tempo, o método sendo CARACTERIZADO pelo fato de compreen- der a etapa de: - transformar linearmente (T1) dois ou mais parâmetros do primeiro domínio de pa- râmetro (PDa) em pelo menos um parâmetro do segundo domínio de parâmetro (PDb), sem criar o dito sinal de áudio de domínio de tempo, sendo que os dois ou mais parâmetros do primeiro domínio de parâmetro provêm de diferentes quadros do sinal de áudio do primeiro domínio de parâmetro e são obtidos por meio de uma transformação de tempo - frequência.
2. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que a dita etapa de transformar linearmente os ditos dois ou mais parâmetros de entrada no dito pelo menos um parâmetro de saída é variante no tempo.
3. Método, de acordo com a reivindicação 2, CARACTERIZADO pelo fato de que a transformação linear variante no tempo é uma repetição periódica de uma pluralidade de transformações lineares invariantes no tempo.
4. Método, de acordo com a reivindicação 2 ou 3, CARACTERIZADO pelo fato de que substancialmente todos os parâmetros do segundo domínio de parâmetro (PDB) são obtidos a partir dos parâmetros linearmente transformados do primeiro domínio de parâme- tro (PDA), a dita transformação linear sendo não trivial.
5. Método, de acordo com a reivindicação 3 ou 4, CARACTERIZADO pelo fato de que um período da repetição periódica abrange um número inteiro de quadros do primeiro domínio de parâmetro (PDA) correspondente a um número inteiro diferente de quadros do segundo domínio de parâmetro (PDB).
6. Método, de acordo com uma das reivindicações 2 a 5, CARACTERIZADO pelo fato de que o primeiro e o segundo domínios de parâmetro são baseados na análise tempo - frequência, utilizando janelas temporais de análise, e a análise tempo - frequência para o segundo domínio de parâmetro (PDB) utiliza janelas longas de análise e janelas curtas de análise, e pelo fato de que a dita transformação linear (TT) é diferente para as janelas lon- gas de análise e para as janelas curtas de análise.
7. Método, de acordo com uma das reivindicações 1 a 6, CARACTERIZADO pelo fato de que a dita etapa de transformar linearmente (TT) compreende as etapas de: - mapear vetores de entrada parciais de diferentes quadros de entrada para vetores de saída parciais; e - sobrepor os vetores de saída parciais de modo a gerar um quadro de saída.
8. Método, de acordo com uma das reivindicações 1 a 7, CARACTERIZADO pelo fato de que a etapa de transformar linearmente dois ou mais parâmetros do primeiro domí- nio de parâmetro compreende o uso de uma tabela de pesquisa com coeficientes de trans- formação.
9. Método, de acordo com uma das reivindicações 1 a 8, CARACTERIZADO pelo fato de que a etapa de transformar linearmente dois ou mais parâmetros do primeiro domí- nio de parâmetro compreende o uso de expressões analíticas predefinidas.
10. Dispositivo para a transcodificação de um sinal de áudio enquadrado a partir de um primeiro domínio de parâmetro (PDA) em um segundo domínio de parâmetro (PDB), sendo que o sinal de áudio enquadrado é uma representação de domínio de parâmetro de um sinal de áudio de domínio de tempo, o dispositivo sendo CARACTERIZADO pelo fato de compreender: - um meio para calcular, pelo menos, um parâmetro do segundo domínio de parâ- metro por meio da transformação linear (Tt) de dois ou mais parâmetros do primeiro domínio de parâmetro (PDa)1 sendo que os dois ou mais parâmetros do primeiro domínio de parâme- tro provêm de diferentes quadros do sinal de áudio do primeiro domínio de parâmetro e são obtidos por meio de uma transformação de tempo - frequência.
11. Dispositivo, de acordo com a reivindicação 10, CARACTERIZADO pelo fato de que a dita transformação linear dos ditos dois ou mais parâmetros de entrada no dito, pelo menos, um parâmetro de saída é variante no tempo.
12. Dispositivo, de acordo com a reivindicação 10 ou 11, CARACTERIZADO pelo fato de compreender ainda um ou mais meios de tabela de pesquisa para armazenar e re- cuperar coeficientes de transformação.
13. Dispositivo, de acordo com uma das reivindicações 10 a 12, CARACTERIZADO pelo fato de compreender ainda um meio para avaliar expressões analíticas predefinidas.
14. Método, de acordo com uma das reivindicações 1 a 9, ou dispositivo, de acordo com uma das reivindicações 10 a 13, CARACTERIZADO pelo fato de que os quadros de áudio (501) do primeiro domínio de parâmetro (PDA) têm um avanço de quadro diferente dos quadros de áudio do segundo domínio de parâmetro (PDB), sendo que o avanço de quadro descreve uma sobreposição temporal dos quadros.
15. Método, de acordo com uma das reivindicações 1 a 9, 14 ou dispositivo, de a- cordo com uma das reivindicações 10 a 14, CARACTERIZADO pelo fato de que os ditos parâmetros diferentes do primeiro e segundo domínios de parâmetro são parâmetros que se referem a uma análise tempo - frequência e a uma síntese de tempo - frequência, e pelo fato de que o primeiro e o segundo domínios de parâmetro utilizam uma diferente análise tempo - frequência e/ou uma diferente síntese de tempo - frequência.
16. Método, de acordo com uma das reivindicações 1 a 9, 14 e 15, ou dispositivo, de acordo com uma das reivindicações 10 a 15, CARACTERIZADO pelo fato de que a dita transformação linear descreve, pelo menos, uma síntese de tempo - frequência (TSA), de acordo com o primeiro domínio de parâmetro (PDA), uma adição de sobreposição (503), uma segmentação (505) e uma análise tempo - frequência (TAB), de acordo com o segundo domínio de parâmetro (PDB).
17. Método ou dispositivo, de acordo com a reivindicação 16, CARACTERIZADO pelo fato de que a análise (TAB) e/ou a síntese de tempo - frequência (TSA) correspondem às transformações de bloco lineares ou aos bancos de filtros de alimentação direta lineares.
18. Método, de acordo com uma das reivindicações 1 a 9, 14 a 17, ou dispositivo, de acordo com uma das reivindicações 10 a 17, CARACTERIZADO pelo fato de que os pa- râmetros de cada quadro (501) do primeiro domínio de parâmetro afetam mais de um qua- dro (502) do segundo domínio de parâmetro, e representam a forma de onda do sinal de áudio.
19. Método, de acordo com uma das reivindicações 1 a 9, 14 a 18, ou dispositivo, de acordo com uma das reivindicações 10 a 18, CARACTERIZADO pelo fato de que a dita transformação (TT) compreende a omissão de uma porção de freqüência específica do sinal de áudio.
20. Método ou dispositivo, de acordo com a reivindicação 19, CARACTERIZADO pelo fato de que a dita omissão de porção de freqüência específica do sinal de áudio é vari- ante no tempo e dependente da alocação de bits utilizada para o sinal de áudio do primeiro domínio de parâmetro.
21. Método, de acordo com uma das reivindicações 1 a 9, 14 a 20, ou dispositivo, de acordo com uma das reivindicações 10 a 20, CARACTERIZADO pelo fato de que o sinal de áudio enquadrado no dito primeiro domínio de parâmetro é adequado para a obtenção completa do sinal de áudio de domínio de tempo, e pelo fato de que o sinal de áudio enqua- drado no dito segundo domínio de parâmetro é adequado para a obtenção completa do sinal de áudio de domínio de tempo.
BRPI0718465-4A 2006-09-20 2007-09-06 Método e dispositivo para a transcodificação de sinais de áudio BRPI0718465A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP06120969A EP1903559A1 (en) 2006-09-20 2006-09-20 Method and device for transcoding audio signals
EP06120969.8 2006-09-20
PCT/EP2007/059349 WO2008034723A1 (en) 2006-09-20 2007-09-06 Method and device for transcoding audio signals

Publications (1)

Publication Number Publication Date
BRPI0718465A2 true BRPI0718465A2 (pt) 2013-12-03

Family

ID=37605771

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0718465-4A BRPI0718465A2 (pt) 2006-09-20 2007-09-06 Método e dispositivo para a transcodificação de sinais de áudio

Country Status (10)

Country Link
US (1) US9093065B2 (pt)
EP (2) EP1903559A1 (pt)
JP (1) JP5324450B2 (pt)
KR (1) KR101341317B1 (pt)
CN (1) CN101563726A (pt)
BR (1) BRPI0718465A2 (pt)
CA (1) CA2662910C (pt)
TW (1) TWI423251B (pt)
WO (1) WO2008034723A1 (pt)
ZA (1) ZA200901367B (pt)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8793738B2 (en) 1994-05-04 2014-07-29 Starsight Telecast Incorporated Television system with downloadable features
CH705207B1 (de) 2002-06-19 2012-11-30 Prospective Concepts Ag Pneumatisches Bauelement mit Knotenelementen.
CH704442B1 (de) 2005-12-23 2012-08-15 Prospective Concepts Ag Pneumatisches Bauelement.
CN101365854B (zh) 2005-12-23 2012-08-08 未来概念公司 气动结构构件
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
EP2099027A1 (en) * 2008-03-05 2009-09-09 Deutsche Thomson OHG Method and apparatus for transforming between different filter bank domains
CN101989429B (zh) * 2009-07-31 2012-02-01 华为技术有限公司 转码方法、装置、设备以及系统
EP2306456A1 (en) * 2009-09-04 2011-04-06 Thomson Licensing Method for decoding an audio signal that has a base layer and an enhancement layer
US8509329B2 (en) * 2009-11-06 2013-08-13 Samsung Electronics Co., Ltd. Data receiving apparatus for receiving data frame using constellation mapping scheme and data transmission apparatus for transmitting the date frame
KR101726205B1 (ko) * 2012-11-07 2017-04-12 돌비 인터네셔널 에이비 감소된 복잡성 변환기 snr 계산
EP2988433B1 (en) * 2013-04-18 2022-01-12 Mitsubishi Electric Corporation Demultiplexing device, multiplexing device, and relay device
RU2665281C2 (ru) 2013-09-12 2018-08-28 Долби Интернэшнл Аб Временное согласование данных обработки на основе квадратурного зеркального фильтра
TWI557724B (zh) 2013-09-27 2016-11-11 杜比實驗室特許公司 用於將 n 聲道音頻節目編碼之方法、用於恢復 n 聲道音頻節目的 m 個聲道之方法、被配置成將 n 聲道音頻節目編碼之音頻編碼器及被配置成執行 n 聲道音頻節目的恢復之解碼器
EP3616197A4 (en) 2017-04-28 2021-01-27 DTS, Inc. AUDIO ENCODER WINDOW SIZES AND TIME-FREQUENCY TRANSFORMATIONS
WO2022179406A1 (zh) * 2021-02-26 2022-09-01 腾讯科技(深圳)有限公司 音频转码方法、装置、音频转码器、设备以及存储介质
CN113689864B (zh) * 2021-10-27 2022-01-18 北京百瑞互联技术有限公司 一种音频数据处理方法、装置及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6260009B1 (en) * 1999-02-12 2001-07-10 Qualcomm Incorporated CELP-based to CELP-based vocoder packet translation
EP1080576B1 (en) 1999-03-25 2008-07-30 SAGEM Communication Speech detection device for detecting a speech signal in an input signal
JP2005515486A (ja) * 2002-01-08 2005-05-26 ディリチウム ネットワークス ピーティーワイ リミテッド Celpによる音声符号間のトランスコーディング・スキーム
JP4263412B2 (ja) 2002-01-29 2009-05-13 富士通株式会社 音声符号変換方法
KR20040104508A (ko) * 2002-03-12 2004-12-10 딜리시움 네트웍스 피티와이 리미티드 오디오 변환부호화기에서 적응 코드북 피치 지연 연산을위한 방법
DE10217297A1 (de) 2002-04-18 2003-11-06 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
US7363230B2 (en) * 2002-08-01 2008-04-22 Yamaha Corporation Audio data processing apparatus and audio data distributing apparatus
TW573293B (en) * 2002-09-13 2004-01-21 Univ Nat Central Nonlinear operation method suitable for audio encoding/decoding and an applied hardware thereof
US7630889B2 (en) * 2003-04-08 2009-12-08 Nec Corporation Code conversion method and device
WO2005078707A1 (en) * 2004-02-16 2005-08-25 Koninklijke Philips Electronics N.V. A transcoder and method of transcoding therefore
JP2008511852A (ja) * 2004-08-31 2008-04-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ トランスコードのための方法および装置
TWI270236B (en) * 2005-08-12 2007-01-01 Advanced Connectek Inc Loop antenna with capacitive structure

Also Published As

Publication number Publication date
TWI423251B (zh) 2014-01-11
WO2008034723A1 (en) 2008-03-27
CA2662910A1 (en) 2008-03-27
ZA200901367B (en) 2010-05-26
EP1903559A1 (en) 2008-03-26
EP2064700B1 (en) 2012-09-05
CA2662910C (en) 2015-12-15
JP5324450B2 (ja) 2013-10-23
US20090240507A1 (en) 2009-09-24
US9093065B2 (en) 2015-07-28
JP2010504544A (ja) 2010-02-12
KR20090055579A (ko) 2009-06-02
KR101341317B1 (ko) 2013-12-12
CN101563726A (zh) 2009-10-21
EP2064700A1 (en) 2009-06-03
TW200816167A (en) 2008-04-01

Similar Documents

Publication Publication Date Title
BRPI0718465A2 (pt) Método e dispositivo para a transcodificação de sinais de áudio
RU2557455C2 (ru) Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
US7876966B2 (en) Switching between coding schemes
KR101685860B1 (ko) 공간 오디오 객체 코딩에 있어서 신호 종속적인 줌 변환을 위한 인코더, 디코더 및 방법들
CA2887228C (en) Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
JP5400143B2 (ja) オーバーラッピング変換の2つのブロック変換への因数分解
BR112012025863B1 (pt) sistema decodificador e método de decodificação para codificação estéreo por predição complexa baseada em mdct
BRPI0514650B1 (pt) Métodos para codificação e decodificação de sinais de áudio, codificador e decodificador de sinais de áudio
EP2372706B1 (en) Method and apparatus for encoding excitation patterns from which the masking levels for an audio signal encoding are determined
KR101855021B1 (ko) 오디오 프레임 손실 은폐
CN103282958A (zh) 信号分析器、信号分析方法、信号合成器、信号合成方法、加窗工具、变换器和反向变换器
JP6911080B2 (ja) 変換長切替えをサポートする周波数ドメインオーディオ符号化
BRPI0415152B1 (pt) dispositivo e método para o processamento de pelo menos dois valores de entrada
US20100250260A1 (en) Encoder
JP5629319B2 (ja) スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法
US20240005931A1 (en) Downscaled decoding
JP6094322B2 (ja) 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置
CN102568489B (zh) 编码器

Legal Events

Date Code Title Description
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]
B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]
B15K Others concerning applications: alteration of classification

Free format text: PROCEDIMENTO AUTOMATICO DE RECLASSIFICACAO. AS CLASSIFICACOES IPC ANTERIORES ERAM: G10L 19/14; G10L 19/02.

Ipc: G10L 19/022 (2013.01), G10L 19/16 (2013.01), G06F

Ipc: G10L 19/022 (2013.01), G10L 19/16 (2013.01), G06F