BR122018007834B1 - Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador - Google Patents
Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador Download PDFInfo
- Publication number
- BR122018007834B1 BR122018007834B1 BR122018007834-0A BR122018007834A BR122018007834B1 BR 122018007834 B1 BR122018007834 B1 BR 122018007834B1 BR 122018007834 A BR122018007834 A BR 122018007834A BR 122018007834 B1 BR122018007834 B1 BR 122018007834B1
- Authority
- BR
- Brazil
- Prior art keywords
- audio signal
- stereo
- parametric stereo
- spectral band
- subband
- Prior art date
Links
- 230000010076 replication Effects 0.000 title claims description 29
- 238000000034 method Methods 0.000 title claims description 14
- 238000001228 spectrum Methods 0.000 title description 3
- 230000005236 sound signal Effects 0.000 claims abstract description 47
- 230000003595 spectral effect Effects 0.000 claims description 30
- 230000015572 biosynthetic process Effects 0.000 claims description 24
- 238000003786 synthesis reaction Methods 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000001914 filtration Methods 0.000 abstract description 23
- 230000004044 response Effects 0.000 description 14
- 238000005070 sampling Methods 0.000 description 11
- 238000012986 modification Methods 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 4
- 230000001364 causal effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0248—Filters characterised by a particular frequency response or filtering method
- H03H17/0264—Filter sets with mutual related characteristics
- H03H17/0266—Filter banks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Insulated Conductors (AREA)
Abstract
codificar um sinal de áudio é provido em que o sinal de áudio inclui um primeiro canal de áudio e um segundo canal de áudio, a codificação incluindo filtrar em sub-banda cada um do primeiro canal de áudio e do segundo canal de áudio em um banco de filtro modulado complexo para prover uma primeira pluralidade de sinais de sub-banda para o primeiro canal de áudio e uma segunda pluralidade de sinais de sub-banda para o segundo canal de áudio, sub-amostrar cada um dos sinais de sub-banda para prover uma primeira pluralidade de sinais de sub-banda sub-amostrados e uma segunda pluralidade de sinais de sub-banda sub-amostrados, adicionalmente filtrar em sub-banda pelo menos um dos sinais de sub-banda sub-amostrados em um banco de filtro adicional a fim de prover uma pluralidade de sinais de sub-sub-banda, derivar parâmetros espaciais dos sinais de sub-sub-banda e daqueles sinais de sub-banda sub-amostrados que não são adicionalmente filtrados em sub-banda, e derivar um sinal de áudio de canal único incluindo sinais de sub-banda derivados, derivados da primeira pluralidade de sinais de sub-banda sub-amostrados e da segunda pluralidade de sinais de sub-banda sub-amostrados. adicionalmente, decodificação é provida em que um sinal de áudio codificado incluindo um canal de áudio de canal único codificado e um conjunto de parâmetros espaciais é decodificado, decodificando o canal de áudio de canal único codificado para obter uma pluralidade de sinais de sub-banda sub-amostrados, adicionalmente filtrando em sub-banda pelo menos um dos sinais de sub-banda sub-amostrados em um banco de filtro adicional a fim de prover uma pluralidade de sinais de sub-sub-banda, e derivando dois canais de áudio dos parâmetros espaciais, dos sinais de sub-sub-banda e daqueles sinais de sub-banda sub-amostrados que não são adicionalmente filtrados em sub-banda.
Description
“CODIFICADOR E DECODIFICADOR DE ÁUDIO AVANÇADO DE ESTÉREO PARAMÉTRICO COMBINADO E DE REPLICAÇÃO DE BANDA ESPECTRAL, MÉTODO DE CODIFICAÇÃO AVANÇADA DE ÁUDIO DE ESTÉREO PARAMÉTRICO COMBINADO E DE REPLICAÇÃO DE BANDA ESPECTRAL, SINAL DE ÁUDIO AVANÇADO CODIFICADO DE ESTÉREO PARAMÉTRICO COMBINADO E DE REPLICAÇÃO DE BANDA ESPECTRAL, MÉTODO DE DECODIFICAÇÃO AVANÇADA DE ÁUDIO DE ESTÉREO PARAMÉTRICO COMBINADO E DE REPLICAÇÃO DE BANDA ESPECTRAL, E, MEIO DE ARMAZENAMENTO LEGÍVEL POR COMPUTADOR”
Dividido do PI0415951-9, depositado em 28/10/2004 [0001] A invenção relaciona-se a codificar um sinal de áudio ou decodificar um sinal de áudio codificado.
[0002] Erik Schuijers, Wemer Oomen, Bert den Brinker e Jeroen
Breebaart, Advances in Parametric Coding for High-Quality Audio, Préimpresão 5852, 114a Convenção de AES, Amsterdã, Holanda, 22-25 de março de 2003, expõe um esquema de codificação paramétrico usando uma representação paramétrica eficiente para a imagem estéreo. Dois sinais de entrada são fundidos em um sinal de áudio mono. Sugestões espaciais perceptivamente pertinentes são modeladas explicitamente como é mostrado na Figura 1. O sinal fundido é codificado usando um codificador paramétrico mono. Os parâmetros estéreo Diferença de Intensidade Inter-canal (IID), a Diferença de Tempo Inter-canal (ITD) e a Correlação Cruzada Inter-canal (ICC) são quantizados, codificados e multiplexados em um fluxo de bits junto com o sinal de áudio mono quantizado e codificado. No lado de decodificador, o fluxo de bits é desmultiplexado para um sinal mono codificado e aos parâmetros estéreo. O sinal de áudio mono codificado é decodificado a fim de obter um sinal de áudio mono decodificado m' (veja
Petição 870180163419, de 14/12/2018, pág. 11/36
2/22
Figura 2). Do sinal de domínio de tempo mono, um sinal descorrelatado é calculado usando um filtro D produzindo descorrelação perceptiva. Ambos o sinal de domínio de tempo mono m' e o sinal descorrelatado d são transformados ao domínio de frequência. Então o sinal estéreo de domínio de frequência é processado com os parâmetros IID, ITD e ICC através de graduação, modificações de fase e mistura, respectivamente, em uma unidade de processamento de parâmetro a fim de obter o par estéreo decodificado Γ e r'. As representações de domínio de frequência resultantes são transformadas de volta no domínio de tempo.
[0003] Um objetivo da invenção é prover codificação ou decodificação de áudio vantajosa usando parâmetros espaciais. Para este fim, a invenção provê um método de codificação, um codificador de áudio, um aparelho para transmitir ou armazenar, um método de decodificação, um decodificador de áudio, um aparelho de reprodução e um produto de programa de computação como definido nas reivindicações independentes. Concretizações vantajosas são definidas nas reivindicações dependentes.
[0004] De acordo com um primeiro aspecto da invenção, um sinal de áudio é codificado, o sinal de áudio incluindo um primeiro canal de áudio e um segundo canal de áudio, a codificação incluindo filtrar em sub-banda cada um do primeiro canal de áudio e do segundo canal de áudio em um banco de filtro modulado complexo para prover uma primeira pluralidade de sinais de sub-banda para o primeiro canal de áudio e uma segunda pluralidade de sinais de sub-banda para o segundo canal de áudio, sub-amostrar cada um dos sinais de sub-banda para prover uma primeira pluralidade de sinais de sub-banda sub-amostrados e uma segunda pluralidade de sinais de sub-banda subamostrados, adicionalmente filtrar em sub-banda pelo menos um dos sinais de sub-banda sub-amostrados em um banco de filtro adicional a fim de prover uma pluralidade de sinais de sub-sub-banda, derivar parâmetros espaciais dos sinais de sub-sub-banda e daqueles sinais de sub-banda sub-amostrados que
Petição 870180163419, de 14/12/2018, pág. 12/36
3/22 não estão filtrados em sub-banda adicionalmente, e derivar um sinal de áudio de canal único incluindo sinais de sub-banda derivados, derivados da primeira pluralidade de sinais de sub-banda sub-amostrados e da segunda pluralidade de sinais de sub-banda sub-amostrados. Provendo uma filtragem de sub-banda adicional em uma sub-banda, a resolução de freqüência de dita sub-banda é aumentada. Tal resolução de freqüência aumentada tem a vantagem que toma possível alcançar qualidade de áudio mais alta (a largura de banda de um único sinal de sub-banda é tipicamente muito mais alta do que aquela de bandas críticas no sistema auditivo humano) em uma implementação eficiente (porque só algumas bandas têm que ser transformadas). O codificador espacial paramétrico tenta modelar as sugestões biauriculares, que são percebidas em uma escala de freqüência não uniforme, se assemelhando à escala de Bandas Retangulares Equivalentes (ERB). O sinal de áudio de canal único pode ser derivado diretamente da primeira pluralidade de sinais de subbanda sub-amostrados e da segunda pluralidade de sinais de sub-banda subamostrados. Porém, o sinal de áudio de canal único é derivado vantajosamente de sinais de sub-sub-banda para aquelas sub-bandas amostradas abaixo que são adicionalmente filtradas em sub-banda, em qual caso os sinais de sub-sub-banda de cada sub-banda são adicionados juntos para formar novos sinais de sub-banda e em que o sinal de áudio de canal único é derivado destes novos sinais de sub-banda e das sub-bandas da primeira e segunda pluralidade de sub-bandas que não são filtradas adicionalmente.
[0005] De acordo com outro aspecto principal da invenção, decodificação de áudio de um sinal de áudio codificado é provida, o sinal de áudio codificado incluindo um canal de áudio de canal único codificado e um conjunto de parâmetros espaciais, a decodificação de áudio incluindo decodificar o canal de áudio de canal único codificado para obter uma pluralidade de sinais de sub-banda sub-amostrados, adicionalmente filtrar em
Petição 870180163419, de 14/12/2018, pág. 13/36
4/22 sub-banda pelo menos um dos sinais de sub-banda sub-amostrados em um banco de filtro adicional a fim de prover uma pluralidade de sinais de subsub-banda, e derivar dois canais de áudio dos parâmetros espaciais, os sinais de sub-sub-banda e os sinais de sub-banda sub-amostrados para aquelas subbandas que não são adicionalmente filtradas em sub-banda. Provendo uma filtragem de sub-banda adicional em uma sub-banda, a resolução de freqüência de dita sub-banda é aumentada e conseqüentemente decodificação de áudio de qualidade mais alta pode ser alcançada.
[0006] Uma das vantagens principais destes aspectos da invenção é que codificação espacial paramétrica pode ser combinada facilmente com técnicas de Reprodução de Banda Espectral (SBR). SBR é conhecida per se de Martin Dietz, Lars Liljeryd, Kristofer Kjõrling e Oliver Kunz, Spectral Band Replication, a novel approach in audio coding, Pré-impresão 5553, 112a Convenção de AES, Munique, Alemanha, 10-13 de maio de 2002, e de Per Ekstrand, Bandwidth extension of audio signals by spectral band replication, Proc. Io IEEE Benelux Seminário sobre Processamento baseado em Modelo e Codificação de Áudio (MPCA-2002), pp. 53-58, Leuven, Bélgica, 15, de novembro de 2002. Referência adicional é feita ao padrão de MPEG-4 ISO/IEC 14496-3:2001/FDAMl, JTC1/SC29/WG11, Codificação de Quadros Móveis e Áudio, Extensão de Largura de Banda, que descreve um codec de áudio usando SBR.
[0007] SBR é baseada na noção que há tipicamente uma grande correlação entre as freqüências baixas e altas em um sinal de áudio. Como tal, o processo de SBR consiste em copiar as partes mais baixas do espectro às partes mais altas depois do que o envelope espectral é ajustado para as partes mais altas do espectro usando pouca informação codificada no fluxo de bits. Um diagrama de bloco simplificado de um tal decodificador avançado de SBR é mostrado na Figura 3. O fluxo de bits é desmultiplexado e decodificado em dados de núcleo (por exemplo, Codificação de Áudio
Petição 870180163419, de 14/12/2018, pág. 14/36
5/22
Avançada (AAC) de MPEG-2/4)) e dados de SBR. Usando os dados de núcleo, o sinal é decodificado na metade da freqüência de amostragem do sinal de largura de banda completa. A saída do decodificador de núcleo é analisada por meio de um banco de Filtro de Espelho de Quadratura (QMF) complexo (Pseudo) de 32 bandas. Estas 32 bandas são então estendidas à largura de banda completa, isto é, 64 bandas, em que o conteúdo de Alta Freqüência (HF) é gerado por meio de copiar partes das bandas inferiores. O envelope das bandas para as quais o conteúdo de HF é gerado, é ajustado de acordo com os dados de SBR. Finalmente, por meio de um banco de síntese de QMF complexo de 64 bandas, o sinal de saída de PCM é reconstruído.
[0008] O decodificador de SBR como mostrado na Figura 3 é um denominado decodificador de taxa dual. Isto significa que o decodificador de núcleo corre à meia freqüência de amostragem e portanto só um banco de QMF de análise de 32 bandas é usado. Decodificadores de taxa única, onde o decodificador de núcleo corre à freqüência de amostragem completa e o banco de QMF de análise consiste em 64 bandas, também são possíveis. Na prática, a reconstrução é feita por meio de um banco de QMF (pseudo) complexo. Porque o banco de filtro de QMF complexo não é amostrado criticamente, nenhuma provisão extra precisa ser levada a fim de considerar 'aliasing'. Note que no decodificador de SBR como exposto por Ekstrand, o banco de QMF de análise consiste só de 32 bandas, enquanto o banco de QMF de síntese consiste em 64 bandas, como o decodificador de núcleo corre à meia freqüência de amostragem comparado ao decodificador de áudio inteiro. No codificador correspondente porém, um banco de QMF de análise de 64 bandas é usado para cobrir a faixa de freqüência inteira.
[0009] Embora a invenção seja especialmente vantajosa para codificação de áudio estéreo, a invenção também é de vantagem para codificar sinais com mais de dois canais de áudio.
[00010] Estes e outros aspectos da invenção são aparentes e serão
Petição 870180163419, de 14/12/2018, pág. 15/36
6/22 elucidados com referência às concretizações descritas em seguida.
[00011] Nos desenhos:
Figura 1 mostra um diagrama de bloco de uma unidade para extração de parâmetro estéreo como usada em um codificador de Estéreo Paramétrico (PS);
Figura 2 mostra um diagrama de bloco de uma unidade para a reconstrução de um sinal estéreo como usado em um decodificador de PS;
Figura 3 mostra um diagrama de bloco de um decodificador de Reprodução de Banda Espectral (SBR);
Figura 4 mostra um diagrama de bloco de PS combinado e codificador avançado de SBR de acordo com uma concretização da invenção;
Figura 5 mostra um diagrama de bloco de PS combinado e decodificador avançado de SBR de acordo com uma concretização da invenção;
Figura 6 mostra um banco de análise de QMF (esquerdo) e síntese (direito) complexo de M bandas amostradas abaixo;
Figura 7 mostra uma resposta de magnitude em dB de um filtro de protótipo;
Figura 8 mostra respostas de magnitude em dB dos primeiros quatro fora de 64 filtros de análise modulados complexos não subamostrados;
Figura 9 mostra um diagrama de bloco de um banco de filtro de Q bandas com síntese trivial;
Figura 10 mostra uma resposta de magnitude combinada em dB de um primeiro filtro de QMF modulado não sub-amostrado e banco de filtro modulado complexo de 8 bandas;
Figura 11 mostra uma resposta de magnitude estilizada de banco de filtro uniformemente empilhado de 4 bandas (topo) e banco de filtro não uniformemente empilhado (fundo) de acordo com uma concretização da
Petição 870180163419, de 14/12/2018, pág. 16/36
7/22 invenção;
Figura 12 mostra um banco de filtro de análise híbrida não uniforme de 77 bandas baseado em QMF de análise complexa de 64 bandas de acordo com uma concretização da invenção;
Figura 13 mostra um banco de filtro de análise híbrida não uniforme de 71 bandas baseado em QMF de análise complexa de 64 bandas para uso em um decodificador de áudio; e
Figura 14 mostra um diagrama de bloco de implementação eficiente do banco de filtro de análise modulada complexa.
[00012] Os desenhos só mostram aqueles elementos que são necessários para entender a invenção.
[00013] Combinar SBR com OS produz potencialmente um codec extremamente poderoso. Ambos SBR e PS são algoritmos de pósprocessamento em um decodificador consistindo em uma estrutura bastante semelhante, isto é, alguma forma de conversão de tempo para freqüência, processamento e finalmente conversão de freqüência para tempo. Ao combinar ambos os algoritmos, é requerido que ambos os algoritmos possam correr simultaneamente em por exemplo, um aplicativo de DSP. Consequentemente, é vantajoso reutilizar tanto quanto possível dos resultados intermediários calculados de um codec para o outro. No caso de combinar PS com SBR, isto conduz a reutilizar os sinais de sub-banda de QMF (Pseudo) complexo para processamento de PS. Em um codificador combinado (veja Figura 4), o sinal de entrada estéreo é analisado por meio de dois bancos de filtro de análise de 64 bandas. Usando a representação de domínio de subbanda complexa, uma unidade de cálculo de PS estima os parâmetros de estéreo e cria uma downmix mono (sub-banda). Esta downmix mono é então alimentada a uma unidade de estimação de parâmetro de SBR. Finalmente, a downmix mono é convertida de volta ao domínio de tempo por meio de um banco de filtro de síntese de 32 bandas, tal que possa ser codificado pelo
Petição 870180163419, de 14/12/2018, pág. 17/36
8/22 decodificador de núcleo (o decodificador de núcleo precisa só da metade da largura de banda).
[00014] No decodificador combinado como mostrado na Figura 5, indiferente se ou não um sistema de taxa dual ou taxa única está sendo usado, os sinais de domínio de sub-banda (64 bandas) de largura de banda completa depois de ajuste de envelope, são convertidos a um conjunto estéreo de sinais de domínio de sub-banda de acordo com os parâmetros de estéreo. Estes dois conjuntos de sinais de sub-banda são convertidos finalmente ao domínio de tempo por meio do banco de QMF de síntese de 64 bandas. Se alguém apenas combinasse PS com SBR, a largura de banda das bandas de frequência inferiores do filtro de QMF é maior do que o que é requerido para uma representação estéreo de alta qualidade. Assim, a fim de ser capaz de dar uma representação de alta qualidade da imagem estéreo, uma sub-divisão adicional dos sinais de sub-banda inferiores é executada de acordo com concretizações vantajosas da invenção.
[00015] Para um entendimento melhor de aspectos da invenção, a teoria por atrás de filtros de sub-banda de QMF complexos é explicada primeiro.
[00016] Filtros de sub-banda de QMF [00017] O filtro de sub-banda de análise de QMF pode ser descrito como o seguinte. Dado um filtro de protótipo de fase linear avaliado real p(v), um banco de filtro de análise modulado complexo de M bandas pode ser definido pelos filtros de análise:
hk(v) = p(v)exp{i-^-(k + l/2)(v - Θ)} (1) para k = 0, 1,..., M-l. O parâmetro de fase Θ não é importante para a análise que segue, mas uma escolha típica é (N + M)/2, onde N é a ordem de filtro de protótipo. Dado um sinal de tempo discreto avaliado real x(v), os sinais de sub-banda vk(n) são obtidos filtrando (convolução) x(v) com hk(v), e então amostrando abaixo o resultado por um fator M (veja lado
Petição 870180163419, de 14/12/2018, pág. 18/36
9/22 esquerdo da Figura 6).
[00018] Uma operação de síntese consiste em primeiro amostrar acima os sinais de sub-banda de QMF com um fator M, seguido por filtragem com filtros modulados complexos do tipo (1), adicionando os resultados e finalmente tomando duas vezes a parte real (veja lado direito da Figura 6). Então, reconstrução quase perfeita de sinais avaliados reais pode ser obtida por projeto adequado de um filtro de protótipo de fase linear avaliado real p(v). A resposta de magnitude do filtro de protótipo como usado no sistema de SBR do padrão de MPEG-4 (referido acima) no caso de 64 bandas é mostrada na Figura 7. As respostas de magnitude dos 64 filtros de análise modulados complexos são obtidas deslocando a resposta de magnitude do filtro de protótipo p(v) por — (k + 1/2).
M [00019] Parte destas respostas é mostrada na Figura 8. Note que só as frequências positivas são filtradas, exceto para k = 0 e k = M-l. Como resultado, os sinais de sub-banda antes de amostragem abaixo estão perto de serem analíticos, facilitando modificações fáceis de amplitude e fase de senóides avaliadas reais. Modificações de fase também são possíveis para a primeira e última banda contanto que as senóides residindo nestas bandas tenham uma freqüência que esteja acima de π/2Μ ou abaixo de π - π/2Μ, respectivamente. Para frequências fora desta região, o desempenho de modificação de fase se deteriora rapidamente por causa de interferência das frequências negativas.
[00020] Começando dos filtros de análise de QMF como descrito acima, em concretizações da invenção, uma resolução de freqüência mais fina é obtida filtrando adicionalmente cada sinal de sub-banda sub-amostrado vk(n) em Qk sub-sub-bandas. No seguinte, as propriedades da filtragem de sub-banda adicional serão derivadas.
[00021] Modificação de sinal no domínio de sub-banda de QMF complexo
Petição 870180163419, de 14/12/2018, pág. 19/36
10/22 [00022] No seguinte, deixe Ζ(ω) = z(n)exP(in(°) ser a transformada de Fourier de tempo discreto de um sinal de tempo discreto z(n). Assumindo a propriedade de reconstrução quase perfeita como mencionada acima e também um projeto onde Ρ(ω), a transformada de Fourier de p(v), essencialmente desaparece fora do intervalo de freqüência [-π/Μ, π/Μ], que é o caso para o filtro de protótipo p(v) como ilustrado acima, a próxima etapa aqui é considerar um sistema onde os sinais de sub-banda Vk(n) são modificados antes de síntese. Agora, deixe cada sub-banda k ser modificada por filtragem com um filtro Bk(tü). Com a definição estendida:
Bk(Cü)=B-i_k(-Cü)* para k < 0, (2) onde a estrela denota conjugação complexa, pode então ser mostrado (desprezando atraso global, assumindo uma entrada avaliada real e um sistema de taxa única) que o sistema resultante incluindo síntese de banco de filtro corresponde a uma filtragem com o filtro:
Β(ω) = £ ΜΜω) |P(co-Ti(k+ l/2)/M)|2 (3) k=~M [00023] De acordo com as hipóteses relativas às propriedades de Ρ(ω), inserindo Bk(co) = 1 para todo k em (3), conduz a Β(ω) = 1, e uma identidade de soma quadrada segue para as respostas de filtro de protótipo deslocadas. A característica atraente é que o sistema global é invariável em tempo, quer dizer, livre de 'aliasing', apesar do uso de amostragem abaixo e acima. Isto certamente só será verdadeiro até a quantidade de desvio para as hipóteses de filtro de protótipo declaradas.
[00024] A fim de derivar um sinal de áudio mono, sub-filtragem adicional dos sinais de sub-banda complexos não deveria só preservar estas propriedades, mas também estender estas propriedades para manipulação dos sinais de sub-banda filtrados. Sub-filtragem preservando estas propriedades pode ser executada usando uma modificação de denominados filtros de Mésima banda como conhecido per se de P. P. Vaidyanathan, Multirate systems and filter banks, Série de Processamento de Sinal Prentice Hall,
Petição 870180163419, de 14/12/2018, pág. 20/36
11/22
1993, seções 4.6.1-4.6.2 [00025] Bancos de Filtro Modulados com Síntese Trivial [00026] Um sinal de tempo discreto v(n) pode ser dividido em Q sinais diferentes por um banco de filtros com respostas a impulso gq(n), q = 0, 1,..., Q-l. Isto é ilustrado na Figura 9. Deixe as saídas de análise correspondentes serem yq(n), e considere a operação de síntese trivial:
y(n)=£yq(n) (4) q=0 [00027] Reconstrução perfeita, y(n) = v(n), é então obtida escolhendo os filtros tal que:
Σ?,(η) = δ(η) (5) ?=0 [00028] Onde δ(η) = 1 se n = 0, e δ(η) = 0 se η Φ 0. Para filtros causais, o lado direito de (5) teria que ser substituído com ô(n-d), onde d é um atraso positivo, mas esta modificação direta é omitida para clareza de exposição. Os filtros gq(n) podem ser escolhidos como modulações complexas de um filtro de protótipo g(n) por:
gq(n) = g(n)exp{ (q + l/2)n} (6) [00029] Nesta concretização preferida da invenção, os filtros são empilhados não uniformemente (o fator q + 1/2). Uma vantagem desta concretização preferida será explicada mais tarde. Reconstrução perfeita (5) é obtida se e somente se:
g(Qn) = Ô(n)/Q(7) [00030] Uma variação disto é a modulação de co-seno avaliado real como:
gq(n) = g(n)cos {(q + l/2)n}(8) [00031] Com um filtro de protótipo avaliado real g(m) satisfazendo:
g(2Qn) = S(n)/Q(9) (Isto é facilmente obtido por consideração de gq(n) + gQ_i_q(n)
Petição 870180163419, de 14/12/2018, pág. 21/36
12/22 em (6)).
[00032] Sub-filtragem com o banco de filtro modulado exponencial complexo [00033] Começando dos filtros de análise de QMF como descrito acima, uma resolução de freqüência mais fina é obtida adicionalmente filtrando cada sinal de sub-banda amostrada abaixo Vk(n) em Qk sub-subbandas usando uma das estruturas moduladas (6) ou (8) acima. Denote os sinais de saída resultantes ykq(n), e deixe gkq(n) descrever o banco de filtro aplicado dentro de sub-banda k. Se Qk = 1, não há nenhuma filtragem e gok(n) = δ(η). Um exemplo de aplicação típico é o caso onde M = 64, Qo = 8, Qk = 4 para k =1,2 e Qk = 1 para k > 2.
[00034] O efeito combinado dos dois bancos de filtro de x(v) para yq k (n) pode ser descrito como filtragem com filtros Fq k (ω) seguido por amostragem abaixo por um fator M onde:
Fq k (ω) = Hk(co)Gq k(Mco) (10) [00035] Se a resposta de filtro de protótipo P (ω) for essencialmente zero fora do intervalo [-π/Μ,π/Μ], que é o caso para os filtros de análise de SBR (veja Figura 7), então o filtro Fq k (ω) tem uma única freqüência central nominal definida no caso modulado complexo por:
G)k,q = 27i(q + Qks +l/2)/(MQk) (11) onde s é um inteiro escolhido tal que Qk(k-l/2) < 2(q +QkS) +1 < Qk(k+3/2). Por exemplo, como ilustrado na Figura 10, se k = 0 e Qo = 8, os valores de (ΰο,ο, Oo.i,.··» Wo,7 são:
π
8M(1,3,5, 7, 9,11,-3,-1).
[00036] Modificação de sinal com resolução de freqüência não uniforme [00037] A inserção de filtro de bancos de filtro de sub-sub-banda como descrito acima não introduz amostragem abaixo adicional, assim o desempenho livre de 'alias' de modificação de sinal como mostrado acima só
Petição 870180163419, de 14/12/2018, pág. 22/36
13/22 no caso de QMF complexo, é preservado. Considere a operação combinada geral de análise de M sub-bandas, filtragem de sub-banda adicional usando Qk sub-sub-bandas dentro de sub-banda k, filtragem de cada sinal de sub-subbanda yk q(n) por um filtro Ak,q(co), síntese dentro de cada sub-banda k através de soma, e finalmente síntese pelo banco de síntese de M bandas. A função de transferência global de tal sistema é dada por (3) com, para k > 0,
ΕΜω; = (12)
9=0 [00038] Para ω > π/(2Μ), isto dá:
M-l Qk-l
Β(ω) = Σ Σ Ak,q(Mm)Gq k(Mm) |Ρ(ω - 7t(k + l/2)/M)|2 (13) k=0 q=G assim a resposta de processamento da sub-sub-banda (k,q) é Gqk(Mcü)|P((O-7i:(k+l/2)/M)|2. Para |ω| < π/(2Μ), algum cuidado tem que ser tomado devido a (2). Nesta faixa de frequência se aplica que:
Β(ω) = Β0(Μω)|Ρ(ω - π/(2Μ))|2 + Β0(-Μω)*|Ρ(ω + π/(2Μ))|2 (14) e assumindo coeficientes de filtro de protótipo de sub-subbanda real se aplica aqui:
Gq°(-(0)* = G°Qo-i-q(ro), (15) assim se os filtros modificadores forem escolhidos tal que:
Ao,q(-(ü)* = A0,Q0-l-q(ro), (16) então Βο(-Μω)* = Βο(Μω) e a identidade de soma quadrada mencionada com relação a (3) conduz a:
Qk-l
Β(ω) = Βο(Μω) = £ A0,q(Mro)G°q(Mm) (17) q=0 para |ω| < π/(2Μ), correspondendo a uma resposta de processamento G°q(Mco) para sub-sub-banda (0,q).
[00039] Equações (15) até (17) indicam o desejo para discriminar entre freqüências positivas e negativas. Isto é a razão por que filtros empilhados não uniformemente (complexos) estão sendo usados para sub-filtrar os sinais de sub-banda de QMF em vez de filtros empilhados uniformemente
Petição 870180163419, de 14/12/2018, pág. 23/36
14/22 (complexos) (veja Figura 11). Para filtros empilhados uniformemente não é possível aplicar modificações de fase de senóides residindo no filtro central, isto é, o filtro com uma freqüência central de zero, como não há nenhuma discriminação entre freqüências positivas e negativas possíveis. Assumindo um filtro de protótipo com uma resposta G(ro)limitado em banda a [2π/ζ),2π/ζ)], com Q o número de bandas, para o caso empilhado uniformemente, o limite inferior ao qual modificações de fase podem ser aplicadas aproximadamente é 2π/ζ), enquanto para o caso empilhado não uniformemente, o limite inferior ao qual modificações de fase podem ser aplicadas aproximadamente é π/Q.
[00040] Como mencionado na introdução, para síntese de PS, casos especiais importantes do anterior são equalização e modificação de fase. Para equalização,
Ak.q(co) = ak,q > 0 e a condição (16) se reduz a ao,q = ao,oo-i-q (18) [00041] O caso de modificação de fase corresponde a Ak,q(co) = exp(iotk,q), em qual caso a condição (16) é satisfeita se:
<X0,Q0-l-q = OlO.q (19) [00042] Estimação de parâmetro de estéreo [00043] O banco de filtro complexo não uniforme, isto é, o banco de QMF seguido pela filtragem de sub-banda adicional, como descrito acima, pode ser aplicado para estimar os parâmetros de estéreo Diferenças de Intensidade Inter-canal (DD), Diferenças de Fase Inter-canal (IPD) e Correlação cruzada Inter-canal (ICC) como mostrado abaixo. Note que nesta concretização prática, IPD é usado como um substituto praticamente equivalente para o IID como usado no documento de Schuijers e outros. No codificador de PS combinado (veja Figura 4), os primeiros três canais de QMF complexos são sub-filtrados de forma que no total 77 sinais avaliados complexos sejam obtidos (veja Figura 12).
Petição 870180163419, de 14/12/2018, pág. 24/36
15/22 [00044] Deste ponto em diante, os 77 sinais de sub-sub-banda esquerdos e direitos alinhados em tempo avaliados complexos são denotados como lqk(n) e rqk(n) respectivamente, por conseguinte a indexação de yqk(n). [00045] Para estimar os parâmetros de estéreo em uma certa posição de amostra de sub-banda n’, a excitação de canal cruzado esquerda, direita e não normalizada são calculadas como:
[00046] Para todo bin estéreo b, h(n) é a janela de domínio de subbanda com comprimento L, ε um valor muito pequeno prevenindo divisão por zero (por exemplo, ε = le-10) e lq k(n) e rq k(n) os sinais de domínio de subsub-banda esquerdo e direito. No caso de 20 bins estéreo, a soma através de ki até e incluindo kh e q de qi até e incluindo qh vai como mostrado na Tabela. Note que as freqüências negativas” (por exemplo, k = 0 com q = 4... 7) não estão incluídas na estimação de parâmetro de (20).
Tabela 1: índices de começo e parada de adição através de k e q.
Petição 870180163419, de 14/12/2018, pág. 25/36
16/22
b | k-k | í; | Região de freqüência de passa-banda | ||
0 | 0 | 0 | 0 | 0 | 0-π/256 |
1 | 0 | 0 | 1 | 1 | «/256-2^/256 |
2 | 0 | 0 | 2 | 2 | 2«/256- 3«/256 |
3 | 0 | 0 | 3 | 3 | 3«/256-π/64 |
4 | 1 | 1 | 2 | 2 | «/64-3«/128 |
5 | 1 | 1 | 3 | 3 | 3«/128-2λ764 |
6 | 2 | 2 | 0 | 0 | 2«/64-5«/128 |
7 | 2 | 2 | 1 | 1 | 5«/128-3«/64 |
8 | 3 | 3 | 0 | 0 | /64-4«/64 |
9 | 4 | 4 | 0 | 0 | 4«/64-5«/64 |
10 | 5 | 5 | 0 | 0 | 5π/64-6«/64 |
11 | 6 | 6 | 0 | 0 | 6«/64-7«/64 |
12 | 7 | 7 | 0 | 0 | 7«/64-8«/64 |
13 | 8 | 8 | 0 | 0 | 8«/64-9π/64 |
14 | 9 | 10 | 0 | 0 | 9«/64-11«/64 |
15 | 11 | 13 | 0 | 0 | 11π/64-14«/64 |
16 | 14 | 17 | 0 | 0 | 14«764-18«/64 |
17 | 18 | 22 | 0 | 0 | 18π/64-23«/64 |
18 | 23 | 34 | 0 | 0 | 23π/64-35«·/64 |
19 | 35 | 63 | 0 | 0 | 35« / 64 - π |
[00047] As somas para calcular ei(b), er(b) e eR(b) são alinhadas tal que o ponto médio destes sinais na soma coincida com a posição de parâmetro, consequentemente o deslocamento por --^ + 1. Como está claro da Tabela 1, só sinais de sub- sub-banda e sinais de sub-banda com uma freqüência central positiva são usados para estimar parâmetros de estéreo. A IDD, denotada como I(b), a ICC, denotada como C(b) e a IPD, denotada como P(b) para cada bin estéreo b são calculadas como:
Petição 870180163419, de 14/12/2018, pág. 26/36
17/22
'w=101o4áí9
-Μ- (21)
^)=^, W [00048] O ângulo na equação P(b) = ZeR(b) é calculado usando a função de arco tangente de quatro quadrantes dando valores entre -π e π. Dependendo de taxa de bit visada e aplicação, estes parâmetros, ou um subconjunto destes parâmetros, são quantizados e codificados na parte de PS do fluxo de bits.
[00049] Síntese de sinal estéreo [00050] A fim de manter os custos computacionais (em termos de uso de RAM) no decodificador tão baixos quanto possível, uma estrutura de análise semelhante é usada. Porém a primeira banda é só parcialmente complexa (veja Figura 13). Isto é obtido por soma dos pares de banda mediana G°2(co) e G°s(ro) e G°3(co) e G°4(ro). Além disso, a segunda e terceira bandas são bancos de filtro avaliados reais de duas bandas que são obtidos por soma da saída de Gok(co) e G3k(to), e soma da saída de Gik(co)e G2 k((ü) (também veja a discussão na seção sobre bancos de filtro modulados). Usando esta simplificação da estrutura de banco de filtro de decodificador, ainda a característica discriminativa entre freqüências positivas e negativas é mantida por subdivisão do primeiro filtro de sub-banda. O banco de filtro de análise de decodificador é mostrado na Figura 13. Note que a indexação dos primeiros sinais de sub-sub-banda filtrados de QMF é escolhida de acordo com freqüência.
[00051] Os sinais de sub-sub-banda estéreo de um único quadro são construídos como:
lk(n) = AnSk(n) + A2idk(n) (22) rk(n) = Ai2sk(n) + A22dk(n) lk(n) = lk(n)dPrl (23)
Petição 870180163419, de 14/12/2018, pág. 27/36
18/22
Fk(n) = rk(n)ejPrl com Sk(n) os sinais de sub-sub-banda mono, e dk(n) os sinais de sub-sub-banda descorrelatados mono que são derivados dos sinais de sub-sub-banda mono Sk(n) a fim de considerar sintetização dos parâmetros de ICC, k = 0,..., K-l o índice de sub-banda (K é o número total de sub-bandas, isto é, K = 71), índice de amostra de subbanda de QMF n = 0,..., N-l com N o número de amostras de sub-banda de um quadro, An, Ài2, A2i, A22 as matrizes de manipulação de fator de escala e Prt a matriz de manipulação de rotação de fase. As matrizes de manipulação são definidas como função de tempo e freqüência e podem ser derivadas diretamente dos vetores de manipulação como descrito no padrão de MPEG-4 ISO/IEC 14496-3: 2001/FPDAM2,
JTC1/SC29/WG11, Codificação de Quadros Móveis e Áudio, Extensão
2.
sk(n) é definido de acordo com Figura 12 como resultando na Figura 13:
So(n) = y°6(n) si(n) = y°7(n) s2(n) = y°0(n) ss (n) = y°i(n) s4(n) = y°2(n) + y°5(n) s5(n) = y°3(n) + y°4(n) (24) s6(n) = y0\n) + yx3(n) s7 (n) = y/(n) + y2x(n) sg(n) = y02(n) + y32(n) s9(n) = yi2(n) + y22(n) Sk(n) = y0 k-7(n), k=10...70 [00052] Síntese dos parâmetros de estéreo acontece de acordo com a indexação da Tabela 1.
Petição 870180163419, de 14/12/2018, pág. 28/36
19/22
Tabela 1: Tabela de indexação de parâmetro
k | w | Região de frequência de passa-banda |
0 | r | -2*/256—π/256 |
1 | 0’ | »*/256-0 |
2 | 0 | 0-.-7256 |
3 | 1 | π/256-2π/256 |
4 | 2 | 2*/256-3*/256 |
5 | 3 | 3*725ó-*/64 |
6 | 5 | 3*/128-2*/64 |
7 | 4 | 2*/128-3*/128 |
8 | 6 | 4*7128-5*7128 |
9 | 7 | 5*/128-6*/128 |
10 | 8 | 3*/64-4*764 |
11 | 9 | 4*764 - 5*764 |
12 | 10 | 5*764—6*764 |
13 | 11 | 6*764-7*764 |
14 | 12 | Ίπ /64-8*/64 |
15 | 13 | 8*764-9*764 |
16-17 | 14 | 9/r/64-Htt/64 |
18-20 | 15 | 11*764-14*764 |
21-24 | 16 | 14*764-18*/64 |
25-29 | 17 | 18*/64 — 23*/64 |
30-41 | 18 | 23*764-35*/64 |
42-70 | 19 | 35*764-* |
[00053] As equações de síntese assim se parecem como:
lk(n) = An(i(k),n)sk(n) + A2i(i(k), n)dk(n) rk(n) = Ai2(i(k),n)sk(n) + A22(i(k), n)dk(n) lk(n) = lk(n)ejPrt(i(k)’n) (25) (26)
Petição 870180163419, de 14/12/2018, pág. 29/36
20/22 rk(n) = rk(n)e'-'Prt(1(k)’n) [00054] Note que o sinal de Prt muda nas equações acima se um * for encontrado na tabela. Isto está de acordo com equação (19), isto é, a rotação de fase inversa tem que ser aplicada para as freqüências negativas.
[00055] Implementação eficiente de bancos de filtro modulados com síntese trivial [00056] Dado um banco de filtro modulado com um filtro de protótipo de comprimento L, uma implementação de forma direta requerería QL operações por amostra de entrada, mas o fato que a modulação em (6) é antiperiódica com período Q pode ser usada para dividir a filtragem em uma colocação em janela polifásica de L operações seguidas por uma transformada de tamanho Q para cada amostra de entrada. Por favor note que uma representação polifásica como tal é conhecida de P. P. Vaidyanathan, Multirate systems and filter banks, Série de Processamento de Sinal Prentice Hall, 1993, seção 4.3). O seguinte provê uma aplicação vantajosa de uma tal representação polifásica de acordo com uma concretização preferida da invenção.
[00057] A transformada é uma DFT seguida por um giro de fase, que é da ordem de Qlog2Q, quando Q é uma potência de dois. Assim, uma grande economia é obtida em casos típicos onde L é muito maior do que log2Q. No caso modulado real (8), antiperiodicidade de período 2Q combinada com simetrias pares/ímpares ao redor den = 0en = Q pode ser usada novamente para colocação em janela polifásica, e o núcleo de transformada é uma DCT de tipo III. Uma descrição detalhada para o caso de modulação complexa é dada abaixo.
[00058] Uma implementação efetiva da sub-sub-filtragem, usando processamento de núcleo de FFT, pode ser realizada usando decomposição polifásica do filtro de protótipo seguida por modulação. Assuma um filtro de protótipo g(n) de ordem N, onde N = mQ e m é um inteiro positivo. Esta
Petição 870180163419, de 14/12/2018, pág. 30/36
21/22 condição não é restritiva, como um filtro de protótipo de ordem arbitrária pode ser enchido com zeros para satisfazer a sujeição. A transformada Z do filtro de protótipo projetado para uso em um sistema modulado complexo (6) ✓
e:
NI2
G(z)= Σ«(η)Ζ-“(27) n=-NI2 [00059] Isto pode ser expresso em notação polifásica como:
G(z)=^Ei(zV(28)
1=0 onde:
Υ/(2β)
Ei(z)= (Qn + l)z ”(29) n=-NI(2Q) [00060] Todos os filtros do banco de filtros são versões moduladas em freqüência do filtro de protótipo. A transformada Z do filtro gq(n) é dada por: Gq(z) = G(zWq+1/2) (30) onde:
W = e-j27t/Q(31) [00061] A expressão para a saída de um filtro é:
Yq(z) = Gq(z)V(z) = G(zWq+1/2)V(z) =
O^V^z1 W1/2W’ql =
1=0
Σ E i(-zQ)V(z)z1ei’l/Q1 eí27C/Qql (32)
1=0 [00062] Identificando os componentes da última soma, pode ser visto que os componentes polifásicos processam versões atrasadas do sinal de entrada, que subseqüentemente são multiplicados por uma exponencial complexa. Finalmente, todos os sinais de saída Yq(z), q = 0,..., Q-l, são achados aplicando uma FFT inversa (sem fator de graduação). Figura 14 mostra a disposição para o banco de filtro de análise. Desde que os filtros polifásicos em (29) são não causais, uma quantidade correta de atraso tem que ser adicionada a todos os componentes polifásicos.
Petição 870180163419, de 14/12/2018, pág. 31/36
22/22 [00063] Deveria ser notado que as concretizações acima mencionadas ilustram em lugar de limitar a invenção, e que aqueles qualificados na técnica serão capazes de projetar muitas concretizações alternativas sem partir da extensão das reivindicações anexas. Nas reivindicações, qualquer sinal de referência colocado entre parênteses não deverá ser interpretado como limitando a reivindicação. A palavra 'incluindo' não exclui a presença de outros elementos ou etapas diferentes daquelas listadas em uma reivindicação. A invenção pode ser implementada por meio de hardware incluindo vários elementos distintos, e por meio de um computador adequadamente programado. Em uma reivindicação de dispositivo enumerando vários meios, vários destes meios podem ser concretizados por um e o mesmo item de hardware. O mero fato que certas medidas são recitadas em reivindicações dependentes mutuamente diferentes não indica que uma combinação destas medidas não pode ser usada com vantagem.
Claims (7)
- REIVINDICAÇÕES1. Codificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, caracterizado por compreender:uma unidade de banco de filtro de análise para converter um sinal de entrada estéreo no domínio do tempo em um domínio de sub-banda;uma unidade de cálculo estéreo paramétrico para calcular parâmetros estéreo paramétricos para o sinal de entrada estéreo no domínio de sub-banda para obter um fluxo de bits estéreo paramétrico e para criar uma downmix mono no domínio de sub-banda;uma unidade de estimação de parâmetro de replicação de banda espectral para estimar parâmetros de replicação de banda espectral da downmix mono no domínio de sub-banda para obter um fluxo de bits de replicação de banda espectral;um conversor de frequência para tempo para converter a downmix mono do domínio de sub-banda para o domínio do tempo; e um codificador de núcleo para codificar a downmix mono no domínio do tempo para obter um fluxo de bits de núcleo.
- 2. Método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, caracterizado por compreender:converter, por meio de um banco de filtros de análise, um sinal de entrada estéreo no domínio do tempo em um domínio de sub-banda;calcular parâmetros estéreo paramétricos para o sinal de entrada estéreo no domínio de sub-banda para obter um fluxo de bits estéreo paramétrico;criar uma downmix mono no domínio de sub-banda;estimar parâmetros de replicação de banda espectral da downmix mono no domínio de sub-banda para obter um fluxo de bits de replicação de banda espectral;Petição 870180163419, de 14/12/2018, pág. 33/362/4 converter a downmix mono do domínio de sub-banda para o domínio do tempo; e codificar em núcleo a downmix mono no domínio do tempo para obter um fluxo de bits de núcleo.
- 3. Sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, caracterizado por compreender:um fluxo de bits de estéreo paramétrico compreendendo parâmetros de estéreo paramétricos derivado a partir de um sinal estéreo;um fluxo de bits de replicação de banda espectral compreendendo parâmetros de replicação de banda espectral de uma downmix mono derivado a partir de um sinal estéreo; e um fluxo de bits de núcleo representando uma downmix mono codificada de núcleo.
- 4. Decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral para decodificar um sinal de entrada estéreo codificado compreendendo um sinal de áudio codificado de núcleo, parâmetros de replicação de banda espectral e parâmetros estéreo paramétrico, o decodificador caracterizado por compreender:um decodificador de núcleo para decodificar um sinal de áudio codificado para obter um sinal de áudio decodificado;um banco de filtro de análise para converter o sinal de áudio decodificado de tempo para frequência em um domínio de sub-banda;um gerador de alta frequência e um ajustador de envelope para gerar um sinal de áudio de largura de banda total usando os parâmetros de replicação de banda espectral no domínio de sub-banda;uma unidade de sínteses estéreo paramétrico para converter o sinal de áudio de largura de banda total em um sinal de áudio estéreo no domínio de sub-banda usando os parâmetros estéreo paramétrico; e um banco de filtro de sínteses para converter o sinal de áudioPetição 870180163419, de 14/12/2018, pág. 34/363/4 de largura de banda total do domínio de sub-banda para o domínio de tempo.
- 5. Método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral de um sinal de entrada estéreo codificado compreendendo um sinal de áudio codificado de núcleo, parâmetros de replicação de banda espectral e parâmetros estéreo paramétrico, o método caracterizado por compreender:decodificar em núcleo um sinal de áudio codificado para obter um sinal de áudio decodificado;converter, por meio de um banco de filtros de análise, o sinal de áudio decodificado de tempo para frequência em um domínio de sub-banda;gerar, por meio de um gerador de alta frequência e um ajustador de envelope, um sinal de áudio de largura de banda total usando os parâmetros de replicação de banda espectral no domínio de sub-banda;converter o sinal de áudio de largura de banda total em um sinal de áudio estéreo no domínio de sub-banda usando os parâmetros estéreo paramétrico; e converter, por meio de um banco de filtro de síntese, o sinal de áudio de largura de banda total do domínio de sub-banda para o domínio de tempo.
- 6. Meio de armazenamento legível por computador, caracterizado por compreender instruções legíveis por computador, que quando executadas por um computador, executam o método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, compreendendo as etapas de:converter, por meio de um banco de filtros de análise, um sinal de entrada estéreo no domínio do tempo em um domínio de sub-banda;calcular parâmetros estéreo paramétricos para o sinal de entrada estéreo no domínio de sub-banda para obter um fluxo de bits estéreo paramétrico;Petição 870180163419, de 14/12/2018, pág. 35/364/4 criar uma downmix mono no domínio de sub-banda;estimar parâmetros de replicação de banda espectral da downmix mono no domínio de sub-banda para obter um fluxo de bits de replicação de banda espectral;converter a downmix mono do domínio de sub-banda para o domínio do tempo; e codificar em núcleo a downmix mono no domínio do tempo para obter um fluxo de bits de núcleo.
- 7. Meio de armazenamento legível por computador, caracterizado por compreender instruções legíveis por computador, que quando executadas por um computador, executam o método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral de um sinal de entrada estéreo codificado compreendendo um sinal de áudio codificado de núcleo, parâmetros de replicação de banda espectral e parâmetros estéreo paramétrico, o método compreendendo as etapas de:decodificar em núcleo um sinal de áudio codificado para obter um sinal de áudio decodificado;converter, por meio de um banco de filtros de análise, o sinal de áudio decodificado de tempo para frequência em um domínio de sub-banda;gerar, por meio de um gerador de alta frequência e um ajustador de envelope, um sinal de áudio de largura de banda total usando os parâmetros de replicação de banda espectral no domínio de sub-banda;converter o sinal de áudio de largura de banda total em um sinal de áudio estéreo no domínio de sub-banda usando os parâmetros estéreo paramétrico; e converter, por meio de um banco de filtro de síntese, o sinal de áudio de largura de banda total do domínio de sub-banda para o domínio de tempo.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP03104034 | 2003-10-30 | ||
EP03104034.8 | 2003-10-30 | ||
PCT/IB2004/052226 WO2005043511A1 (en) | 2003-10-30 | 2004-10-28 | Audio signal encoding or decoding |
BRPI0415951A BRPI0415951B1 (pt) | 2003-10-30 | 2004-10-28 | método e codificador de áudio para codificar um sinal de áudio, e, método e decodificador de áudio para decodificar um sinal de áudio codificado |
Publications (1)
Publication Number | Publication Date |
---|---|
BR122018007834B1 true BR122018007834B1 (pt) | 2019-03-19 |
Family
ID=34530779
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BRPI0415951A BRPI0415951B1 (pt) | 2003-10-30 | 2004-10-28 | método e codificador de áudio para codificar um sinal de áudio, e, método e decodificador de áudio para decodificar um sinal de áudio codificado |
BR122018007834-0A BR122018007834B1 (pt) | 2003-10-30 | 2004-10-28 | Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BRPI0415951A BRPI0415951B1 (pt) | 2003-10-30 | 2004-10-28 | método e codificador de áudio para codificar um sinal de áudio, e, método e decodificador de áudio para decodificar um sinal de áudio codificado |
Country Status (12)
Country | Link |
---|---|
US (3) | US7519538B2 (pt) |
EP (1) | EP1683133B1 (pt) |
JP (4) | JP4966013B2 (pt) |
KR (2) | KR101217649B1 (pt) |
CN (2) | CN101540171B (pt) |
AT (1) | ATE354160T1 (pt) |
BR (2) | BRPI0415951B1 (pt) |
DE (1) | DE602004004818T2 (pt) |
ES (1) | ES2282899T3 (pt) |
PL (1) | PL1683133T3 (pt) |
RU (1) | RU2374703C2 (pt) |
WO (1) | WO2005043511A1 (pt) |
Families Citing this family (109)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
JP4867914B2 (ja) | 2004-03-01 | 2012-02-01 | ドルビー ラボラトリーズ ライセンシング コーポレイション | マルチチャンネルオーディオコーディング |
JP4892184B2 (ja) * | 2004-10-14 | 2012-03-07 | パナソニック株式会社 | 音響信号符号化装置及び音響信号復号装置 |
WO2006048814A1 (en) * | 2004-11-02 | 2006-05-11 | Koninklijke Philips Electronics N.V. | Encoding and decoding of audio signals using complex-valued filter banks |
RU2007120056A (ru) * | 2004-11-30 | 2008-12-10 | Мацусита Электрик Индастриал Ко. | Устройство стереокодирования, устройство стереодекодирования и способы стереокодирования и стереодекодирования |
KR100657916B1 (ko) * | 2004-12-01 | 2006-12-14 | 삼성전자주식회사 | 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 |
US8214220B2 (en) * | 2005-05-26 | 2012-07-03 | Lg Electronics Inc. | Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal |
JP4988716B2 (ja) * | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
US8917874B2 (en) * | 2005-05-26 | 2014-12-23 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
EP1913576A2 (en) * | 2005-06-30 | 2008-04-23 | LG Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
JP2009500657A (ja) | 2005-06-30 | 2009-01-08 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 |
EP1908057B1 (en) * | 2005-06-30 | 2012-06-20 | LG Electronics Inc. | Method and apparatus for decoding an audio signal |
CN101248483B (zh) | 2005-07-19 | 2011-11-23 | 皇家飞利浦电子股份有限公司 | 多声道音频信号的生成 |
CA2620627C (en) * | 2005-08-30 | 2011-03-15 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US7987097B2 (en) * | 2005-08-30 | 2011-07-26 | Lg Electronics | Method for decoding an audio signal |
US7788107B2 (en) * | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
JP4859925B2 (ja) * | 2005-08-30 | 2012-01-25 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
US8068569B2 (en) * | 2005-10-05 | 2011-11-29 | Lg Electronics, Inc. | Method and apparatus for signal processing and encoding and decoding |
US7646319B2 (en) * | 2005-10-05 | 2010-01-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7696907B2 (en) * | 2005-10-05 | 2010-04-13 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7672379B2 (en) * | 2005-10-05 | 2010-03-02 | Lg Electronics Inc. | Audio signal processing, encoding, and decoding |
US7751485B2 (en) * | 2005-10-05 | 2010-07-06 | Lg Electronics Inc. | Signal processing using pilot based coding |
US7813380B2 (en) * | 2005-10-05 | 2010-10-12 | Lg Electronics Inc. | Method of processing a signal and apparatus for processing a signal |
KR100857112B1 (ko) * | 2005-10-05 | 2008-09-05 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7761289B2 (en) * | 2005-10-24 | 2010-07-20 | Lg Electronics Inc. | Removing time delays in signal paths |
JP4814344B2 (ja) | 2006-01-19 | 2011-11-16 | エルジー エレクトロニクス インコーポレイティド | メディア信号の処理方法及び装置 |
US8296155B2 (en) * | 2006-01-19 | 2012-10-23 | Lg Electronics Inc. | Method and apparatus for decoding a signal |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
WO2007091842A1 (en) | 2006-02-07 | 2007-08-16 | Lg Electronics Inc. | Apparatus and method for encoding/decoding signal |
KR100754220B1 (ko) | 2006-03-07 | 2007-09-03 | 삼성전자주식회사 | Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법 |
US7676374B2 (en) | 2006-03-28 | 2010-03-09 | Nokia Corporation | Low complexity subband-domain filtering in the case of cascaded filter banks |
RU2420814C2 (ru) | 2006-03-29 | 2011-06-10 | Конинклейке Филипс Электроникс Н.В. | Аудиодекодирование |
US7612275B2 (en) * | 2006-04-18 | 2009-11-03 | Nokia Corporation | Method, apparatus and computer program product for providing rhythm information from an audio signal |
US7818079B2 (en) * | 2006-06-09 | 2010-10-19 | Nokia Corporation | Equalization based on digital signal processing in downsampled domains |
US8682652B2 (en) | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US20080004866A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Artificial Bandwidth Expansion Method For A Multichannel Signal |
EP3447916B1 (en) * | 2006-07-04 | 2020-07-15 | Dolby International AB | Filter system comprising a filter converter and a filter compressor and method for operating the filter system |
US7876904B2 (en) | 2006-07-08 | 2011-01-25 | Nokia Corporation | Dynamic decoding of binaural audio signals |
WO2008035949A1 (en) * | 2006-09-22 | 2008-03-27 | Samsung Electronics Co., Ltd. | Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding |
JP2008076847A (ja) * | 2006-09-22 | 2008-04-03 | Matsushita Electric Ind Co Ltd | 復号器及び信号処理システム |
KR101434198B1 (ko) * | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
CA2672165C (en) | 2006-12-12 | 2014-07-29 | Ralf Geiger | Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream |
US7783478B2 (en) * | 2007-01-03 | 2010-08-24 | Alexander Goldin | Two stage frequency subband decomposition |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
JP5147851B2 (ja) * | 2007-10-26 | 2013-02-20 | 株式会社ディーアンドエムホールディングス | オーディオ信号補間装置及びオーディオ信号補間方法 |
EP2215629A1 (en) * | 2007-11-27 | 2010-08-11 | Nokia Corporation | Multichannel audio coding |
CN101903944B (zh) | 2007-12-18 | 2013-04-03 | Lg电子株式会社 | 用于处理音频信号的方法和装置 |
DE602008005250D1 (de) * | 2008-01-04 | 2011-04-14 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
RU2473140C2 (ru) * | 2008-03-04 | 2013-01-20 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен | Устройство для микширования множества входных данных |
KR101428487B1 (ko) * | 2008-07-11 | 2014-08-08 | 삼성전자주식회사 | 멀티 채널 부호화 및 복호화 방법 및 장치 |
CN101630509B (zh) * | 2008-07-14 | 2012-04-18 | 华为技术有限公司 | 一种编解码方法、装置及系统 |
AU2016262695B2 (en) * | 2009-02-18 | 2017-11-09 | Dolby International Ab | Low Delay Modulated Filter Bank |
TWI618352B (zh) * | 2009-02-18 | 2018-03-11 | 杜比國際公司 | 用於高頻重建或參數立體聲之複指數調變濾波器組 |
AU2012204076B2 (en) * | 2009-04-03 | 2013-12-12 | Ntt Docomo, Inc. | Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program |
JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
CN101556799B (zh) * | 2009-05-14 | 2013-08-28 | 华为技术有限公司 | 一种音频解码方法和音频解码器 |
JP5365363B2 (ja) * | 2009-06-23 | 2013-12-11 | ソニー株式会社 | 音響信号処理システム、音響信号復号装置、これらにおける処理方法およびプログラム |
US9055374B2 (en) * | 2009-06-24 | 2015-06-09 | Arizona Board Of Regents For And On Behalf Of Arizona State University | Method and system for determining an auditory pattern of an audio segment |
EP3998606B8 (en) | 2009-10-21 | 2022-12-07 | Dolby International AB | Oversampling in a combined transposer filter bank |
CN102667920B (zh) * | 2009-12-16 | 2014-03-12 | 杜比国际公司 | Sbr比特流参数缩混 |
BR122019025131B1 (pt) | 2010-01-19 | 2021-01-19 | Dolby International Ab | sistema e método para gerar um sinal transposto de frequência e/ou estendido no tempo a partir de um sinal de áudio de entrada e meio de armazenamento |
CN102157149B (zh) * | 2010-02-12 | 2012-08-08 | 华为技术有限公司 | 立体声信号下混方法、编解码装置和编解码系统 |
KR102011793B1 (ko) | 2010-04-09 | 2019-08-19 | 돌비 인터네셔널 에이비 | Mdct-기반의 복소수 예측 스테레오 코딩 |
BR112012026502B1 (pt) | 2010-04-16 | 2022-10-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Aparelho, método para gerar um sinal de banda larga usando extensão de largura de guiada e extensão de largura de banda cega |
CA2770287C (en) | 2010-06-09 | 2017-12-12 | Panasonic Corporation | Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus |
US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
ES2712304T3 (es) * | 2010-07-19 | 2019-05-10 | Dolby Int Ab | Procesamiento de señales de audio durante la reconstrucción de alta frecuencia |
MY156027A (en) | 2010-08-12 | 2015-12-31 | Fraunhofer Ges Forschung | Resampling output signals of qmf based audio codecs |
KR102073544B1 (ko) | 2010-09-16 | 2020-02-05 | 돌비 인터네셔널 에이비 | 교차 곱 강화된 서브밴드 블록 기반 고조파 전위 |
KR20120038311A (ko) | 2010-10-13 | 2012-04-23 | 삼성전자주식회사 | 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법 |
EP2477188A1 (en) | 2011-01-18 | 2012-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding of slot positions of events in an audio signal frame |
RU2586838C2 (ru) | 2011-02-14 | 2016-06-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиокодек, использующий синтез шума в течение неактивной фазы |
ES2458436T3 (es) | 2011-02-14 | 2014-05-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Representación de señal de información utilizando transformada superpuesta |
MX2013009344A (es) * | 2011-02-14 | 2013-10-01 | Fraunhofer Ges Forschung | Aparato y metodo para procesar una señal de audio decodificada en un dominio espectral. |
CA2920964C (en) | 2011-02-14 | 2017-08-29 | Christian Helmrich | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
KR101698905B1 (ko) | 2011-02-14 | 2017-01-23 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법 |
TWI488176B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
BR112013020324B8 (pt) | 2011-02-14 | 2022-02-08 | Fraunhofer Ges Forschung | Aparelho e método para supressão de erro em fala unificada de baixo atraso e codificação de áudio |
EP3544006A1 (en) | 2011-11-11 | 2019-09-25 | Dolby International AB | Upsampling using oversampled sbr |
WO2013142723A1 (en) | 2012-03-23 | 2013-09-26 | Dolby Laboratories Licensing Corporation | Hierarchical active voice detection |
EP2862168B1 (en) * | 2012-06-14 | 2017-08-09 | Dolby International AB | Smooth configuration switching for multichannel audio |
EP4300488A3 (en) * | 2013-04-05 | 2024-02-28 | Dolby International AB | Stereo audio encoder and decoder |
CN105103224B (zh) | 2013-04-05 | 2019-08-02 | 杜比国际公司 | 用于交错波形编码的音频编码器和解码器 |
EP2830053A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
EP2830064A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
EP2830051A3 (en) * | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
TWI557726B (zh) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
KR102318581B1 (ko) * | 2014-06-10 | 2021-10-27 | 엠큐에이 리미티드 | 오디오 신호의 디지털 캡슐화 |
EP2963649A1 (en) * | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using horizontal phase correction |
WO2016040623A1 (en) * | 2014-09-12 | 2016-03-17 | Dolby Laboratories Licensing Corporation | Rendering audio objects in a reproduction environment that includes surround and/or height speakers |
US9837065B2 (en) | 2014-12-08 | 2017-12-05 | Ford Global Technologies, Llc | Variable bandwidth delayless subband algorithm for broadband active noise control system |
EP3067889A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for signal-adaptive transform kernel switching in audio coding |
TWI693594B (zh) | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
ES2956344T3 (es) | 2015-08-25 | 2023-12-19 | Dolby Laboratories Licensing Corp | Descodificador de audio y procedimiento de descodificación |
WO2017124007A1 (en) * | 2016-01-15 | 2017-07-20 | Dolby Laboratories Licensing Corporation | Audio signal processing with low latency |
EP3203472A1 (en) * | 2016-02-08 | 2017-08-09 | Oticon A/s | A monaural speech intelligibility predictor unit |
TWI752166B (zh) | 2017-03-23 | 2022-01-11 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
CN111316353B (zh) * | 2017-11-10 | 2023-11-17 | 诺基亚技术有限公司 | 确定空间音频参数编码和相关联的解码 |
CN107918710B (zh) * | 2017-11-22 | 2020-11-06 | 桂林电子科技大学 | 基于凸优化的非下采样图滤波器组的设计方法 |
CN108806705A (zh) * | 2018-06-19 | 2018-11-13 | 合肥凌极西雅电子科技有限公司 | 音频处理方法和处理系统 |
US11195543B2 (en) | 2019-03-22 | 2021-12-07 | Clear Peaks LLC | Systems, devices, and methods for synchronizing audio |
CN113314132B (zh) * | 2021-05-17 | 2022-05-17 | 武汉大学 | 交互式音频系统中的音频对象编码方法、解码方法及装置 |
CN117292694B (zh) * | 2023-11-22 | 2024-02-27 | 中国科学院自动化研究所 | 基于时不变编码的少令牌神经语音编解码方法和系统 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3211752C2 (de) * | 1982-03-30 | 1985-09-26 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zum selektiven Abscheiden von aus Siliziden hochschmelzender Metalle bestehenden Schichtstrukturen auf im wesentlichen aus Silizium bestehenden Substraten und deren Verwendung |
JPS621228A (ja) | 1985-06-26 | 1987-01-07 | Fujitsu Ltd | タングステンシリサイドの選択成長方法 |
US4692343A (en) * | 1985-08-05 | 1987-09-08 | Spectrum Cvd, Inc. | Plasma enhanced CVD |
US4737474A (en) * | 1986-11-17 | 1988-04-12 | Spectrum Cvd, Inc. | Silicide to silicon bonding process |
EP0305143B1 (en) * | 1987-08-24 | 1993-12-08 | Fujitsu Limited | Method of selectively forming a conductor layer |
EP0446037B1 (en) * | 1990-03-09 | 1997-10-08 | AT&T Corp. | Hybrid perceptual audio coding |
JPH0410429A (ja) | 1990-04-26 | 1992-01-14 | Matsushita Electron Corp | 半導体装置 |
JP2892451B2 (ja) | 1990-07-13 | 1999-05-17 | 住友重機械工業株式会社 | 電気―空気サーボアクチュエータ |
NL9100173A (nl) | 1991-02-01 | 1992-09-01 | Philips Nv | Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting. |
US5392037A (en) | 1991-05-21 | 1995-02-21 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for encoding and decoding |
JP2778324B2 (ja) * | 1992-01-24 | 1998-07-23 | 日本電気株式会社 | サブバンド分割方式 |
JPH05235701A (ja) * | 1992-02-25 | 1993-09-10 | Nippon Steel Corp | 環状畳み込みによるディジタルフィルタバンク処理方法及び装置 |
US5408580A (en) * | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
US5926791A (en) * | 1995-10-26 | 1999-07-20 | Sony Corporation | Recursively splitting the low-frequency band with successively fewer filter taps in methods and apparatuses for sub-band encoding, decoding, and encoding and decoding |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5852806A (en) * | 1996-03-19 | 1998-12-22 | Lucent Technologies Inc. | Switched filterbank for use in audio signal coding |
KR100261253B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US5890125A (en) * | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
US6016473A (en) * | 1998-04-07 | 2000-01-18 | Dolby; Ray M. | Low bit-rate spatial coding method and system |
KR100354531B1 (ko) | 1998-05-06 | 2005-12-21 | 삼성전자 주식회사 | 실시간 복호화를 위한 무손실 부호화 및 복호화 시스템 |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
US7260523B2 (en) * | 1999-12-21 | 2007-08-21 | Texas Instruments Incorporated | Sub-band speech coding system |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
JP2001339311A (ja) * | 2000-05-26 | 2001-12-07 | Yamaha Corp | オーディオ信号圧縮回路および伸長回路 |
US6996198B2 (en) * | 2000-10-27 | 2006-02-07 | At&T Corp. | Nonuniform oversampled filter banks for audio signal processing |
WO2003046891A1 (en) * | 2001-11-29 | 2003-06-05 | Coding Technologies Ab | Methods for improving high frequency reconstruction |
EP1595247B1 (en) * | 2003-02-11 | 2006-09-13 | Koninklijke Philips Electronics N.V. | Audio coding |
-
2004
- 2004-10-28 US US10/577,106 patent/US7519538B2/en active Active
- 2004-10-28 CN CN2009101286062A patent/CN101540171B/zh active Active
- 2004-10-28 KR KR1020117020710A patent/KR101217649B1/ko active IP Right Grant
- 2004-10-28 EP EP04770333A patent/EP1683133B1/en active Active
- 2004-10-28 AT AT04770333T patent/ATE354160T1/de not_active IP Right Cessation
- 2004-10-28 DE DE602004004818T patent/DE602004004818T2/de active Active
- 2004-10-28 WO PCT/IB2004/052226 patent/WO2005043511A1/en active IP Right Grant
- 2004-10-28 BR BRPI0415951A patent/BRPI0415951B1/pt active IP Right Grant
- 2004-10-28 PL PL04770333T patent/PL1683133T3/pl unknown
- 2004-10-28 BR BR122018007834-0A patent/BR122018007834B1/pt active IP Right Grant
- 2004-10-28 RU RU2006118682/09A patent/RU2374703C2/ru active
- 2004-10-28 JP JP2006537530A patent/JP4966013B2/ja active Active
- 2004-10-28 CN CN2004800323426A patent/CN1875402B/zh active Active
- 2004-10-28 ES ES04770333T patent/ES2282899T3/es active Active
- 2004-10-28 KR KR1020067008373A patent/KR101106026B1/ko active IP Right Grant
-
2009
- 2009-03-04 US US12/397,518 patent/US8073685B2/en active Active
- 2009-03-12 JP JP2009059145A patent/JP5192424B2/ja active Active
-
2011
- 2011-02-22 JP JP2011036288A patent/JP5335015B2/ja active Active
- 2011-03-30 US US13/076,335 patent/US8260607B2/en active Active
-
2013
- 2013-05-01 JP JP2013096490A patent/JP5889828B2/ja active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR122018007834B1 (pt) | Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador | |
RU2705007C1 (ru) | Устройство и способ для кодирования или декодирования многоканального сигнала с использованием сихронизации управления кадрами | |
JP4834539B2 (ja) | オーディオ信号合成 | |
BRPI0409327B1 (pt) | Dispositivo para gerar um sinal de áudio de saída com base em um sinal de aúdio de entrada, método para prover um sinal de áudio de saída com base em um sinal de áudio de entrada e aparelho para fornecer um sinal de áudio de saída | |
CN105378832B (zh) | 解码器、编码器、解码方法、编码方法和存储介质 | |
US9514759B2 (en) | Method and apparatus for performing an adaptive down- and up-mixing of a multi-channel audio signal | |
JP2011522472A (ja) | パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ | |
MX2008012324A (es) | Metodo mejorado para la modulacion de señales en la reconstruccion de audio multicanal. | |
Liutkus et al. | Informed audio source separation: A comparative study | |
BR112020001660A2 (pt) | Aparelho e método para decodificar um sinal multicanal codificado, descorrelacionador de sinal de áudio, método para descorrelacionar um sinal de entrada de áudio | |
JP2021507316A (ja) | オーディオ信号の高周波再構成技術の後方互換性のある統合 | |
BR112020015570A2 (pt) | codificador de cena de áudio, decodificador de cena de áudio e métodos relacionados com uso de análise espacial de codificador/decodificador híbrido |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06A | Patent application procedure suspended [chapter 6.1 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 19/03/2019, OBSERVADAS AS CONDICOES LEGAIS. |
|
B25G | Requested change of headquarter approved |
Owner name: DOLBY INTERNATIONAL AB (IE) ; KONINKLIJKE PHILIPS ELECTRONICS N.V. (NL) |