PT1774515E - Aparelho e processo para gerar um sinal de saída multicanal - Google Patents
Aparelho e processo para gerar um sinal de saída multicanal Download PDFInfo
- Publication number
- PT1774515E PT1774515E PT05740130T PT05740130T PT1774515E PT 1774515 E PT1774515 E PT 1774515E PT 05740130 T PT05740130 T PT 05740130T PT 05740130 T PT05740130 T PT 05740130T PT 1774515 E PT1774515 E PT 1774515E
- Authority
- PT
- Portugal
- Prior art keywords
- channel
- input
- channels
- transmission
- output
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 42
- 230000005540 biological transmission Effects 0.000 claims abstract description 123
- 230000002829 reductive effect Effects 0.000 claims abstract description 17
- 230000002194 synthesizing effect Effects 0.000 claims description 41
- 238000012545 processing Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- 230000001419 dependent effect Effects 0.000 claims description 3
- 108091006146 Channels Proteins 0.000 description 519
- 230000015572 biosynthetic process Effects 0.000 description 23
- 238000003786 synthesis reaction Methods 0.000 description 22
- 239000011159 matrix material Substances 0.000 description 19
- 238000010586 diagram Methods 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 9
- 230000005236 sound signal Effects 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 8
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000010365 information processing Effects 0.000 description 4
- 238000005192 partition Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000001934 delay Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 101000893493 Homo sapiens Protein flightless-1 homolog Proteins 0.000 description 1
- 102100040923 Protein flightless-1 homolog Human genes 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009365 direct transmission Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000006703 hydration reaction Methods 0.000 description 1
- -1 i.e. Proteins 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000013707 sensory perception of sound Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Mobile Radio Communication Systems (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Logic Circuits (AREA)
- Time-Division Multiplex Systems (AREA)
Description
DESCRIÇÃO
APARELHO E PROCESSO PARA GERAR UM SINAL DE SAÍDA
MULTICANAL A presente invenção refere-se a um descodificador multi-canal e, particularmente, a um descodificador multi-canal, em que pelo menos dois canais de transmissão estão presentes, isto é estéreo-compativel.
Nos últimos tempos, o multi-canal áudio de reprodução técnica está se tornando cada vez mais importante. Isto pode ser devido ao facto de técnicas áudio de compressão/codificação tais como a técnica bem conhecida mp3 terem tornado possível distribuir registos de áudio através da Internet ou outros canais de transmissão possuindo uma largura de banda limitada. A técnica de codificação mp3 tornou-se tão famosa devido ao fato de que permite a distribuição de todos os registros num formato estéreo, ou seja, numa representação digital da gravação de áudio, incluindo um primeiro ou canal esquerdo estéreo e um segundo ou canal direito estéreo.
No entanto, há lacunas básicas de sistemas convencionais de dois canais de som. Portanto, a técnica de som envolvente tem sido desenvolvida. Uma representação multi-canal-circundado recomendada inclui, para além dos dois canais estéreo L e R, um canal adicional central C e dois canais de som envolvente LS, RS. Este formato de som de referência, é também referido como três / dois estéreo, o que significa três canais frontais e dois canais circundados. Geralmente, cinco canais de transmissão são necessários. Num ambiente de reprodução, pelo menos cinco colunas nos respectivos cinco locais diferentes, são necessárias para obter um ponto optimal mais favorável numa certa distância a partir das cinco colunas bem colocadas. Várias técnicas são conhecidas na arte para a redução da quantidade de dados necessários para a transmissão de um sinal de áudio multi-canal. Tais técnicas são chamadas técnicas estéreo conjuntas. Para este fim, é feita referência à Fig. 10, que mostra um dispositivo estéreo de articulação 60. Este dispositivo pode ser por exemplo um dispositivo de aplicação de intensidade estéreo (IS) ou sinal binauricular (BCC). Tal dispositivo recebe geralmente - como uma entrada - pelo menos dois canais (CHI, CH2, ... CHn) , e gera um único canal portador e dados paramétricos. Os dados paramétricos são definidos de tal modo que, num descodificador, uma aproximação de um canal original (CHI, CH2, ... CHn) pode ser calculada. 1
Normalmente, o canal transportador irá incluir amostras de sub-banda, coeficientes espectrais, amostras domínio do tempo etc., que fornecem uma representação comparativamente fina do sinal subjacente, enquanto que os dados paramétricos não incluem tais amostras de coeficientes espectrais, mas incluem parâmetros de controlo para controlar um algoritmo reconstrução tal como ponderação por multiplicação, tempo de deslocamento, frequência deslocamento,.... Portanto, os dados paramétricos, incluem apenas uma representação comparativamente grosseira do sinal ou do canal associado. A quantidade de dados requeridos por um canal transportador em números, estará na gama de 60-70 kbit/s, enquanto que a quantidade de dados requeridos pela informação lateral paramétrica para um canal será na gama de 1,5 - 2,5 kbit/s. Um exemplo para os dados paramétricos são os fatores escala bem conhecidos, a informação de intensidade estéreo ou parâmetros de sinalização binauriculares como abaixo descrito. O documento HERRE J., FALLER C.: "MP3 Circundado: Efficient and Compatible Coding of Multi-Channel Audio" AES CONVENTION, 8 de Maio de 2004 (08-05-2004), páginas 1-14 divulga: um aparelho para gerar um sinal de saída multi-canal tendo canais de saída K, o sinal de saída multi-canal correspondente a um sinal de entrada multi-canal tendo canais de entrada C, utilizando os canais de transmissão E, os canais de transmissão E representam um resultado de uma operação sintetização tendo canais de entrada C, e utilizar a informação paramétrica relacionada para os canais de entrada, em que Eé2, Cé>E, eKé>le^C.
Codificação estéreo intensidade é descrita na AES preprint 3799, "Intensity Stereo Coding", J. Herre, K.H. Brandenburg, D. Lederer, Fevereiro 1994, Amsterdão. Geralmente, o conceito de intensidade estéreo baseia-se em transformar um eixo principal a ser aplicado aos dados de ambos os canais estereofónicos de áudio. Se a maioria dos pontos de dados estão concentrados em torno do primeiro eixo principal, um ganho de codificação pode ser conseguido pela rotação de ambos os sinais por um certo ângulo antes da codificação. Esta, porém, nem sempre é verdadeira para técnicas reais de produção estereofónicas. Portanto, esta técnica é modificada excluindo o segundo componente ortogonal de transmissão no fluxo de bits. Assim, os sinais reconstruídos para os canais esquerdo e direito consistem em versões diferentes ponderadas ou dimensionadas do mesmo sinal transmitido. No entanto, os sinais reconstruídos diferem na sua amplitude, mas são idênticos em relação à sua informação de fase. Os envelopes energia tempo de ambos os canais originais áudio, no entanto, são preservados por meio da operação de escalonamento selectiva, que opera tipicamente de uma forma selectiva de frequência. Isto está de acordo com a percepção humana do som em altas frequências, onde as pistas dominantes espaciais são determinadas pelos envelopes de energia. 2
Além disso, o sinal transmitido, ou seja, o canal portador é praticamente gerado em implementações a partir do sinal de soma do canal esquerdo e canal direito em vez de girarem ambos os componentes. Além disso, este processamento, isto é, gerando parâmetros de intensidade estéreo para executar a operação de escalonamento, é realizado de frequência seletiva, isto é, independente para cada banda factor de escala, isto é, a partição frequência do codificador. De preferência, ambos os canais são combinados para formar um combinado ou canal "portador", e, além disso para o canal combinado, a informação de intensidade estéreo é determinada a qual depende da energia do primeiro canal, a energia do segundo canal ou a energia do combinado ou canal. A técnica BBC está descrita em AES convention paper 5574, "Binaural cue coding applied to stereo and multi-channel áudio compression", C. Faller, F. Baumgarte, Maio 2002, Munique. Em codificação BCC, um número de canais de entrada de áudio são convertidos para uma representação espectral utilizando um DFT baseado transforma com janelas sobrepostas. O espectro uniforme resultante é dividido em partições não sobrepostas, cada uma tendo um indice. Cada partição tem uma largura de banda proporcional à largura de banda equivalente rectangular (ERB). O canal de diferenças inter-nivel (ICLD) e as diferenças de tempo do inter-canal (ICTD) são estimadas para cada partição quado k. O ICLD e ICTD são quantificados e codificados resultando num fluxo de bits BCC. O canal de diferenças inter-nivel e diferenças de canal inter-tempo são dados para cada canal em relação a um canal de referência. Em seguida, os parâmetros são calculados de acordo com fórmulas prescritas, que dependem de certas partições do sinal a ser processado.
Ao lado de um descodificador, o descodificador recebe um sinal de mono e do fluxo de bits de BCC. O sinal de mono é transformado no dominio da frequência e de entrada num bloco de síntese espacial, que também recebe valores descodificados ICLD e ICTD. No bloco síntese espacial, os valores parâmetro CBC (ICLD e ICTD) são utilizados para realizar uma operação de ponderação do sinal de mono, a fim de sintetizar o canal de multi-sinais, que, após uma conversão de frequência/hora, representa uma reconstrução do sinal de áudio multi-canal original.
No caso de BCC, o módulo de estéreo conjunto 60 é operativo para gerar a informação de canal lateral de tal modo que os dados do canal paramétrico são quantificados e os parâmetros codificados ICLD ou ICTD, em que um dos canais originais é usado como o canal de informações referência para a codificação lateral do canal. 3
Normalmente, o canal transportador é formado da soma dos canais participantes originais.
Naturalmente, as técnicas acima só proporcionam uma representação mono para um descodificador, que só pode processar o canal transportador, mas não é capaz de processar os dados paramétricos para a geração de um ou mais aproximações de mais do que um canal de entrada. A técnica de codificação de áudio conhecido como sinal binauricular de codificação (BCC) é também descrita nos pedidos de patente americanos publicados nos EUA em 2003, 0.219.130 Al, 2003/0.026.441 Al e 2003/0.035.553 Al. Referência adicional também pode ser feita para "Bínaural Cue Coding. Part II: Schemes and Applications", C. Faller and F. Baumgarte, IEEE Trans. Em Audio and Speech Proc. , Vol. 11, No. 6, Nov. 2993. Os citados pedidos de patente americana, publicados, e as duas publicações técnicas citadas sobre a autoria de BCC e Faller Baumgarte são aqui incorporadas por referência na sua totalidade.
No que se segue, um esquema genérico tipico BCC para codificação de áudio multi-canal é elaborado em maior detalhe com referência às Figuras 11 a 13. A Figura 11 mostra um tal esquema de sinalização, genérico binauricular para a codificação/transmissão de canais multi-sinais de áudio. O sinal multi-canal de entrada de áudio em uma entrada 110 de um codificador de BCC 112 é reconvertido num bloco sintetização 114. No presente exemplo, o sinal multi-canal inicial na entrada 110 é um canal-5 de sinal circundado tendo um canal frontal esquerdo, um canal frontal direito, um canal circundado esquerdo, um canal circundado direito e um canal central. Por exemplo, o bloco 114 sintetização produz um sinal de soma por uma simples adição destes cinco canais num sinal mono. Outros esquemas de sintetização são conhecidos na arte, tais como, usando um sinal de entrada multi-canal, pode ser obtido um sinal de sintetização tendo um único canal. Este canal individual é um sinal de saída a linha soma 115. A informação lateral obtida por um bloco de análise BCC 116 é a saída numa linha lateral de informação 117. No bloco de análise BCC, diferenças de nível inter-canal (ICLD), e diferenças inter-canais de tempo (ICTD) são calculados tal como foi descrito acima. Recentemente, o bloco de análise BCC 116 foi aprimorado para também calcular os valores do canal inter-correlação (valores de CCI) . O sinal de soma e as informações laterais é transmitido, de preferência numa forma quantificada e codificada, num descodificador 120 BCC. O descodificador BCC decompõe o sinal de soma transmitido para um número de sub-bandas e aplica-se os atrasos de processamento e outra escala para gerar as sub-bandas dos sinais de saída de áudio multicanal. Este processamento é realizado de tal modo que parâmetros (pistas) ICLD, ICTD e ICC de um sinal multicanal reconstituídas de uma saída 121 são semelhantes aos sinais respectivos para o sinal multicanal inicial na entrada 4 110 para o codificador 112 BCC. Para este fim, o descodif icador BCC 120 inclui um bloco de sintese BCC 122 e um bloco de processamento de informação lateral 123.
Seguidamente, a construção interna do bloco de sintese BCC 122 é explicada com referência à Fig. 12. O sinal de soma na linha 115 é a entrada num tempo/unidade de conversão de frequência ou banco de filtros FB 125. Na saida do bloco 125, existe um número N de sinais de sub-banda ou, num caso extremo, um bloco de coeficientes espectrais, quando o banco de áudio filtro 125 executa uma transformada de 1:1, ou seja, uma transformação que produz N coeficientes espectrais a partir de N amostras de tempo dominio. O bloco de síntese BCC 122 compreende ainda uma fase atraso 126, uma fase de nível modificação 127, uma fase de processamento de correlação 128 e um banco filtro de fase inversa IFB 129. Na saída da etapa 129, o sinal de áudio multicanal reconstituído tendo por exemplo cinco canais no caso de um sistema circundado 5-canal, pode ser saída para um conjunto de colunas 124, tal como ilustrado na Fig. 11.
Como mostrado na Fig. 12, a entrada do sinal s (n) é convertido para o domínio da frequência ou domínio banco de filtros por meio do elemento 125. O sinal de saída por elemento 125 é multiplicado de tal modo que várias versões do mesmo sinal são obtidas como ilustrado pelo nó de multiplicação 130. O número de versões do sinal original é igual ao número de canais de saída no sinal de saída, a ser reconstruído. Quando, em geral, cada versão do sinal original no nó 130 é submetida a um certo atraso di, d2, ..., di, .... dN. Os parâmetros de atraso são calculados pelo lado 123 do bloco de processamento de informação na Fig. 11 e são derivados das diferenças de tempo inter-canal como determinado pelo bloco análise BCC 116. O mesmo é verdadeiro para os parâmetros de multiplicação al7 a2, ...., a-j, ...., aN, que também são calculados pelo bloco de processamento de informação lateral 123 com base nas diferenças de nivel inter-canal tal como calculado pelo bloco análise BCC 116.
Os parâmetros de ICC calculados pelo bloco análise BCC 116 são utilizados para controlar a funcionalidade do bloco 128 de tal modo que certas correlações entre os sinais retardados e de nível manipulados são obtidos nas saídas de bloco 128. De notar aqui que a ordem de entre as fases 126, 127, 128 pode ser diferente do caso mostrado na Fig. 12.
De notar aqui que, num quadro transformação refletida de um sinal de áudio, a análise BCC é realizada quadro-refletivo, ou seja, variáveis no tempo, e também frequência refletida. Isto significa que, para cada banda espectral, são obtidos os parâmetros de BCC. Isto significa que, no caso em que o banco de 5 filtro áudio 125 decompõe o sinal de entrada, em por exemplo 32 sinais de passagem de banda, o bloco de análise BCC obtém um conjunto de parâmetros de BCC para cada um das 32 bandas. Naturalmente a sintese bloco 122 BCC da Fig. 11, a qual é mostrada em detalhe na Fig. 12, executa uma reconstrução que também é baseada nas 32 bandas do exemplo.
Seguidamente, é feita referência à Fig. 13 que mostra uma configuração para determinar certos parâmetros BCC. Normalmente, ICLD, ICTD e os parâmetros de ICC podem ser definidos entre os pares de canais. No entanto, é preferido para determinar os parâmetros ICLD e ICTD entre um canal de referência e cada um dos outros canais. Isto está ilustrado na Fig. 13A.
Parâmetros ICC podem ser definidos de diferentes maneiras. Geralmente, pode-se estimar os parâmetros de ICC no codificador entre todos os possiveis pares de canais, como indicado na Fig. 13. Neste caso, um descodificador que sintetiza ICC de modo que é aproximadamente o mesmo que no sinal multi-canal original entre todos os pares de canais possiveis. Foi, no entanto, proposto estimar parâmetros ICC apenas entre os dois canais mais fortes em cada tempo. Este esquema está ilustrado na Fig.l3C, onde é mostrado um exemplo, no qual, um parâmetro de ICC é estimado entre os canais 1 e 2, e, noutro exemplo o tempo, um parâmetro de ICC é calculado entre os canais 1 e 5. 0 descodificador, sintetiza em seguida, o canal correlação de interação entre os canais mais fortes no descodificador e aplica alguma regra heurística para calcular e sintetizar a coerência do canal interpares para os restantes canais.
Em relação ao cálculo de, por exemplo, a multiplicação parâmetros alr aN, com base em parâmetros transmitidos ICLD, é feita referência à AES convention paper 5574 acima citada. Os parâmetros ICLD representam uma distribuição de energia em um sinal de multicanal original. Sem perda de generalidade, é mostrado na Fig. 13A que existem quatro parâmetros ICLD mostrando a diferença de energia entre todos os outros canais e o canal dianteiro esquerdo. No bloco de processamento de informação lateral 123, os parâmetros de multiplicação alr ...., aN são derivados a partir dos parâmetros ICLD de modo que a energia total reconstruída de todos os canais de saída é a mesma que (ou proporcional a) a energia do sinal de soma transmitido. Uma maneira simples para a determinação destes parâmetros é um processo de duas fases, no qual, numa primeira fase, o factor de multiplicação para o canal dianteiro esquerdo está definido para a unidade, enquanto que os factores de multiplicação para os outros canais na Fig. 13 são definidos para os valores transmitidos ICLD. Em seguida, numa segunda etapa, a energia de todos os cinco canais é calculada e comparada com a energia do sinal de soma transmitido. Em seguida, todos os canais são reduzidos à escala utilizando um factor de redução de escala que é igual para todos os canais, em que o factor de redução de escala é selecionado de tal modo que a energia total de todos os 6 canais de saída reconstruído é, após redução de escala, igual ao total de energia do sinal de soma transmitido.
Naturalmente existem outros métodos para o cálculo dos factores de multiplicação, que não dependem do processo de etapa-2, mas que só precisa de um processo de etapa-1.
Em relação aos parâmetros de atraso, é de notar que os parâmetros de atraso ICTD, que são transmitidos a partir de um BCC codificado podem ser utilizados directamente, quando o atraso de parâmetros di para o canal frontal esquerdo é ajustado para zero. Tem de ser feito aqui o não reescalonamento, uma vez que um atraso não altera a energia do sinal.
Em relação ao canal inter-medida de coerência ICC transmitido a partir do codificador BCC para o descodificador BCC, é para ser notado aqui que uma manipulação coerência pode ser feita através da modificação dos factores de multiplicação ai, ...., an tais como multiplicando os factores de ponderação de todas as sub-bandas com números aleatórios com uma gama de [201ogl0 (-6) e 201ogl0(6)]. A sequência pseudoaleatória é de preferência escolhida de tal modo que a variância é aproximadamente constante para todas as bandas críticas, e a média é zero dentro de cada banda crítica. A mesma sequência é aplicada aos coeficientes espectrais para cada quadro diferente. Assim, a largura da imagem auditiva é controlada pela modificação da variância da sequência pseudoaleatória. Uma maior variância cria uma largura de imagem maior. A modificação de variância pode ser realizada em bandas individuais que são de banda crítica de largura. Isso permite a existência simultânea de vários objetos numa cena auditiva, cada objeto tem uma largura de imagem diferente. Uma distribuição de amplitude adequada para a sequência pseudoaleatória é uma distribuição uniforme sobre uma escala logarítmica, como está descrito na publicação do pedido de patente EUA de 2003/0.219.130 AI. No entanto, todo o processamento de síntese BCC está relacionado com um canal de entrada único transmitido como o sinal de soma BCC a partir do codificador para o descodificador BCC como mostrado na Fig. 11.
Para transmitir os cinco canais de uma maneira compatível, isto é, num formato de fluxo de bits, que é também compreensível para um descodificador estéreo normal, a técnica matrização assim chamada tem sido usada como descrito no "MUSICAM circundado: a universal multi-channel coding system compatible with ISO 11172-3", G. Theile e G. Stoll, AES preprint 3403, Outubro 1992 São Francisco. Os canais de entrada L, R, C, Ls, e Rs são alimentados num dispositivo matrização para executar uma operação de matrização para calcular os canais de base ou estéreo compatível Lo, Ro, a partir dos cinco canais de entrada. Em particular, esses canais estéreo básicos Lo/Ro são calculados conforme estabelecido a seguir: 7
Lo = L + xC + yLs Ro = R + xC + yRs x e y são constantes. Os outros três canais C, Ls, Rs são transmitidos como o são numa camada extensão, para além de uma camada de base estéreo, que inclui uma versão codificada dos sinais estéreo básicos Lo/Ro. Com respeito à corrente de bits, esta camada estéreo de base Lo/Ro inclui um cabeçalho de informações, tais como factores de escala e amostras da sub-banda. A camada multicanal extensão, isto é, o canal central e os dois canais de som envolvente estão incluidos no campo de extensão multi-canal, que é também chamado de campo de dados auxiliar.
Num descodificador lateral, uma operação de matrização inversa é realizada a fim de formar reconstruções dos canais esquerdo e direito na representação. Cinco canais usando os canais estéreo básicos Lo, Ro e os três canais adicionais. Além disso, os três canais adicionais são descodificados a partir da informação auxiliar, a fim de obter uma representação descodificada dos cinco canais do sinal de áudio original multicanal circundado.
Outra abordagem para multicanal de codificação está descrita na publicação "Improved MPEG-2 audio multi-channel encoding", B. Grill, J. Herre, K.H. Brandenburg, E. Eberlein, J. Koller, J. Mueller, AES preprint 3865, Fevereiro 1994, Amesterdão, em que, a fim de obter a compatibilidade, os modos posteriores compatíveis são considerados. Para este fim, uma matriz de compatibilidade é usada para obter dois canais de entrada a partir dos cinco canais sintetização LC, RC original. Além disso, é possível seleccionar de forma dinâmica os três canais auxiliares transmitidos como dados auxiliares. A fim de explorar irrelevância estéreo, uma técnica de articulação estéreo é aplicada a grupos de canais, por exemplo os três canais frontais, ou seja, para o canal esquerdo, canal direito e canal central. Para este fim, estes três canais são combinados para se obter um canal combinado. Este canal é quantificado, combinado e embalado dentro do fluxo de bits. Então, este canal combinado juntamente com a informação correspondente estéreo comum é a entrada num conjunto módulo estéreo de descodificação para obter conjuntos estéreo canais descodificados, ou seja, um aparelho de som comum descodificado canal esquerdo, um aparelho de som comum descodificado canal direito e um conjunto estéreo canal central descodificado. Estes conjuntos de canais estereofónicos descodificados são, juntamente com o canal de som envolvente esquerdo e de entrada do canal circundado direito para um bloco matriz de compatibilidade para formar o primeiro e o segundo canal sintetização LC, RC. Em seguida, as versões quantificadas de ambos os canais de sintetização e uma versão quantificada do 8 canal combinado são embalados para o fluxo de bits em conjunto com conjuntos parâmetros estéreo de codificação.
Portanto, usando codificação de intensidade estéreo, um grupo de sinais independentes dos canais originais é transmitido dentro de uma parcela única de "portador" de dados. 0 descodificador, reconstrói, em seguida, os sinais envolvidos como dados idênticos, que são escalonados de acordo com seus envelopes de tempo originais. Consequentemente, uma combinação linear dos canais transmitidos conduzirá a resultados, que são bastante diferentes da sintetização original. Isto aplica-se a qualquer tipo de codificação conjunta de estéreo baseado no conceito de intensidade do estéreo. Para um sistema de codificação proporcionar canais sintetização compativeis, não é uma consequência directa: A reconstrução por desmatrização, conforme descrita na publicação anterior, sofre de artefactos causados pela reconstrução imperfeita. Usando um assim chamado esquema pré-distorção estéreo conjunta, é realizada matrização no codificador em que um conjunto estéreo de codificação esquerdo, direito e os canais de centro, alivia este problema. Desta forma, a reconstrução regime desmatrização introduz menos artefactos, uma vez que, no codificador lateral, os conjuntos de sinais estéreo descodificados têm sido utilizados para gerar os canais sintetização. Assim, o processo de reconstrução imperfeita é deslocado para a sintetização compatível de canais Lc e Rc, onde é muito mais provável ser dissimulado pelo sinal de áudio em si.
Embora um tal sistema tenha resultado em menos artefactos pela desmatrização no descodificador-lateral, que, no entanto, tem alguns inconvenientes. Uma desvantagem é que os canais Lc e Rc a sintetização estéreo compatível são derivados não a partir dos canais originais, mas a partir de versões dos canais originais estéreo intensidade codificado/descodifiçado. Portanto, as perdas de dados devido ao sistema de estéreo intensidade de codificação estão incluídas nos canais sintetização compatíveis. Um descodificador estéreo, que apenas descodifica os canais compativeis em vez da intensidade do realce dos canais estéreo codificados, fornece portanto um sinal de saída, que é afetado pela intensidade estéreo da perda de dados induzidos.
Além disso, um canal adicional total tem que ser transmitido para além dos dois canais sintetização. Este canal é o canal combinado, que é formado por meio do conjunto estéreo de codificação do canal esquerdo, canal direito e canal central. Adicionalmente, a informação de intensidade do estéreo para reconstruir canais originais L, R, C a partir do canal combinado também tem de ser transmitida para o descodificador. No descodificador, uma matrização inversa, isto é, uma operação de desmatrização é realizada para derivar os canais de som envolvente dos dois canais sintetização. Além disso, os canais originais esquerdo, direito e centro são aproximados por conjunto estéreo descodificação utilizando o canal transmitido 9 combinado e transmitidos os parâmetros de som comuns. É de notar que os canais originais esquerdo, direito e centro, são derivados por estéreo descodificação do canal combinado comum.
Um aperfeiçoamento do regime de BCC mostrado na Figura 11 é um esquema de BCC com pelo menos dois canais de transmissão de áudio de modo a que uma transformação estéreo-compativel é obtida. No codificador, os canais de entrada C são mixados em E para transmitir canais de áudio. As pistas ICTD, ICLD e ICC entre certos pares de canais de entrada são estimados como uma função da frequência e tempo. As pistas estimadas são transmitidas para o descodificador como informação lateral. Um esquema de BCC com canais de entrada C e canais de transmissão é denotado C-2-E-CBC.
De um modo gerai de processamento, BCC é uma frequência selectiva, o tempo de processamento pós variante dos canais de transmissão. No que se segue, com a implicação desta, um indice de banda de frequência não vai ser introduzido. Sm vez disso, as variáveis como xn, Sn, yn, a*,, etc. são assumidos como sendo vectores com dimensão (1, f) , em que f denota o número de bandas de frequência, 0 chamado esquema BCC regular é descrito em C. Faller e F. Baumgarte, "Binaural Cue Coding applied to stereo and multi-channel áudio compression", em Preprint 112th Conv. Aud Engl. Soc., Maio 2002, F. Baumgarte e C. Faller, "Binaural Cue Coding - Part I: Psychoacoustic Fundamentais and design principies," IEEE Trans. Em Speech and Áudio Proc., vol. 11, no. 6, Nov. 2003, e C. Faller e F. Baumgarte, "Binaural Cue Coding - Part II; Esquemas e aplicações," IEEE Trans. Em Speech e Áudio Proc., vol. 11, no. 6, Nov. 2003. Aqui, tem-se uma única transmissão de canais de áudio, como mostrado na Figura. 11, é uma extensão compatível de sistemas mono existentes para reprodução de áudio estéreo ou multi-canal. Uma vez que o único canal de áudio transmitido é um sinal mono válido, ele é adequado para a reprodução por receptores antigos.
No entanto, a maior parte da infra-estrutura instalada a transmissão de áudio (analógico e digital de rádio, televisão, etc.) e sistemas de armazenamento de áudio (discos de vinil, cassetes compacto, disco compacto, VHS de video, armazenamento de som MP3, etc.) são baseados em dois canais estéreo. Por outro lado, "home theater Systems" confirmando o padrão 5.1 (Rec. ITU-R BS.775, Multi-Channel Stereophonic Sound System with or without Accompanying Picture, ITU, 1993, http://www,itu.org) está se tornando mais popular. Assim, BCC com dois canais de transmissão (C-to-2 BCC), como está descrito em J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, e C. Spenger, "MP3 Circundado: Efficient and compatible coding of multi-channel audio," em Preprint 116th Conv. Aud. Eng. Soc., Maio 2004, é particularmente interessante para o alargamento dos sistemas de som existentes para multicanal circundado. A este respeito, é 10 também feita referência ao pedido de patente americana "Apparatus and method for constructing a multi-channel output signal or for generating a sintetização signal", US pedido número 10/762,100, depositado em 20 de Janeiro de 2004.
No dominio analógico, algoritmos matrização tais como "Dolby Circundado", "Dolby Pro Logic", e "Dolby Pro Logic II" (J. Hull, "Circundado sound past, present, and future," Techn. Rep., Dolby Laboratories, 1999, www.dolby.com/tech/; R. Dressler, "Dolby Circundado Prologic II Decoder - Principies of operationTechn Rep., Dolby Laboratories, 2000, www.dolby.com/tech/) têm sido muito populares durante anos. Esses algoritmos "matrização" são aplicáveis para mapear os canais de áudio 5.1 a um par de canais estéreo compatíveis. No entanto, os algoritmos matrização apenas fornecem flexibilidade e qualidade significativamente reduzida em comparação com canais de áudio discretos, como é descrito em J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, e C. Spenger, "MP3 Circundado: Efficient and compatible coding of multi-channel áudio," em Preprint 116th Conv. Aud. Eng. Soc., Maio 2004. Se já são consideradas limitações de algoritmos matrização quando a mistura de sinais de áudio para 5.1 circundado, alguns dos efeitos da presente imperfeição podem ser reduzidos como é descrito em J. Hilson, "Mixing with Dolby Pro Logic II Technonoly," Tech. Rep., Dolby Laboratories, 2004, www,dolby.com/tech/FLII.Mixing,JlmHIison.html. C-to-2 BCC pode ser vista como um regime com funcionalidade semelhante à de um algoritmo de matrização com informação lateral auxiliar adicional. É, no entanto, mais geral, na sua natureza, uma vez que suporta o mapeamento a partir de quaisquer números de canais originais para quaisquer números de canais transmitidos. C-to-E BCC destina-se para o dominio digital e a sua baixa taxa de bits de informação adicional lateral geralmente podem ser incluídas na transmissão de dados existente de uma forma compatível. Isto significa que os receptores antigos irão ignorar a informação lateral adicional e jogar para a retaguarda os 2 canais transmitidos directamente, como é descrito em J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, e C. Spenger, "MP3 Circundado: Efficient and compatible coding of multi-channel audio," em Preprint 116th Conv. Aud. Eng. Soc., Maio 2004. O objetivo é conseguir uma qualidade sempre duradoura de áudio semelhante a uma transmissão discreta de todos os canais de áudio originais, isto é, a qualidade significativamente melhor do que o que se pode esperar a partir de um algoritmo de matrização convencional.
Seguidamente, é feita referência à Fig. 6a, a fim de ilustrar a operação sintetização codificador convencional para gerar dois canais de transmissão a partir de cinco canais de entrada, que são um canal esquerdo L ou xi, um canal direito R ou x2, um canal central c ou x3, um canal esquerdo circundado sL ou x4 e um canal direito circundado sR ou x5. A situação sintetização está esquematicamente mostrada na Fig. 6a. Torna-se claro que o 11 primeiro canal de transmissão yi é formado usando um canal esquerdo xlr um canal central x3, e o canal circundado esquerdo x4. Além disso, a fig. 6a deixa claro que o canal direito de transmissão y, é formado usando o canal direito x .. o canal, central x3 e o canal circundado direito x5. A regra geralmente preferida sintetização ou matriz sintetização é mostrada na Fig.6c. Torna-se claro que o canal central x3 é ponderado por um factor de ponderação 1/V2, o que significa que a primeira metade da energia do canal central x3 é colocada no canal de transmissão para o canal transmissão Lt esquerdo ou primeiro, enquanto a segunda metade da energia no canal central é introduzida no segundo canal de transmissão ou para o canal de transmissão direito Rt. Assim, a sintetização mapeia os canais de entrada para os canais de transmissão. A sintetização é convenientemente descrita por uma matriz (m, n) , o mapeamento de n amostras de entrada para amostras de saída m. Resumindo, as entradas desta matriz são os pesos relacionados antes aplicados aos canais correspondentes a partir do canal de saida.
Existem métodos sintetização diferentes que podem ser encontrados nas recomendações ITU (Rec. ITU-R-BS. 775, Multi-Channel Stereophonic Sound System com ou sem Accompanying Picture, ITU, 1993, http://www.itu.org). Além disso, referência é feita a J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, e C. Spenger, "MP3 Circundado: Efficient and compatible coding of multicanal áudio," em Preprint 116th Conv. Aud. Eng. Soc., Maio 2004, parágrafo 4.2 no que diz respeito a métodos sintetização diferentes. A sintetização pode ser realizada tanto no tempo ou dominio da frequência. Pode ser variando de uma maneira adaptativa, tempo ou sinal de frequência (banda) dependente. A atribuição de canal é mostrada pela matriz para a direita na Fig. 6a e é dada como se segue: esquerdo direito
centro esquerda - retaguarda direita - retaguarda “ um canal retaguarda esquerda, uma matriz
Assim, para o caso importante de 5-to-2 BCC, transmitido é calculado a partir da direita, direita e centro, e outro canal transmitido a partir da esquerda retaguarda e centro, o que corresponde a sintetização por exemplo, de 12 1 0 1 1 0 0 1 l 72 0 1 que também está mostrado na Fig.ôc.
Nesta matriz sintetização, os fatores de ponderação podem ser escolhidos de tal modo que a soma dos quadrados dos valores de cada coluna é, de tal modo que a potência de cada sinal de entrada contribui igualmente para os sinais misturados. Claro, outros regimes sintetização podem também ser usados.
Em particular, é feita referência à Fig. 6b ou 7b, que mostra uma implementação especifica de um regime de sintetização do codificador. Processamento para uma sub-banda é mostrado. Em cada sub-banda, os fatores de escala, ei e β2 são controlados para "equalizar" o volume dos componentes ficar disponível de sinal em sinal. Neste caso, a sintetização é realizada no domínio da frequência, com a variável n (Fig. 7b), que designa um domínio da frequência índice de tempo sub-banda e k sendo o índice do bloco transformado sinal de domínio de tempo. Particularmente é chamada a atenção para o dispositivo de ponderação para a ponderação do canal central antes da versão ponderada do canal central é introduzido no canal de transmissão esquerdo e direito do canal de transmissão pelos respetivos dispositivos de soma. A operação mixagem correspondente no descodificador é mostrada no que diz respeito às Figs. 7a, 7b e 7c. No descodif icador uma mixagem que mapeia o canal transmitido para os canais de saída, tem de ser calculada. A mixagem está convenientemente descrita por uma matriz (i,j) (linhas i,j colunas), amostras mapeamento i transmitidas para amostras de saída j. Mais uma vez, as entradas desta matriz são, resumindo, os pesos aplicados aos canais correspondentes, para formar o canal de saída relacionado. A mixagem pode ser realizada tanto no tempo como no domínio da frequência. Além disso, talvez seja variando num sinal adaptativo de tempo, forma ou frequência (banda) dependente. Em oposição à matriz sintetização, os valores absolutos das entradas da matriz não representam os pesos finais dos canais de saída, uma vez que estes canais mixagem são ainda modificados, no caso de processamento de BCC. Em particular, a modificação tem lugar utilizando a informação fornecida pelas pistas espaciais como ICLD, etc. Aqui, neste exemplo, todas as entradas são definidas para 0 ou 1. A Fig. 7a mostra a situação mixagem para um sistema colunas circundado 5. Além de cada alto-falante, é mostrado o canal de base utilizado para a síntese de BCC. Em particular, no que diz respeito ao canal esquerdo envolvente de saída, é usado um primeiro canal transmitido yi. 0 mesmo é verdade para o canal 13 esquerdo. Este canal é usado como um canal de base, também chamado de "canal esquerdo transmitido".
Como para o canal de saída direito e o canal de saída circundado direito, utiliza também o mesmo canal, isto é, o segundo canal direito transmitido y2, É de notar que tal como para o canal central, o canal síntese de base BCC é formado em conformidade com a matriz do canal central de mixagem na Fig. 7c, ou seja, por adição de ambos os canais de transmissão. 0 processo de gerar o sinal de saída canal-5, tendo em conta os dois canais de transmissão é mostrado na Fig.7b. Aqui, a mixagem é feita no domínio da frequência com uma frequência variável n denotando índice de domínio tempo sub-banda, transformado sinal de domínio de tempo e sendo k o índice do bloco. De notar aqui que a síntese ICTD e ICC é aplicada entre pares de canais para os quais o canal base utilizado é o mesmo, isto é, entre a esquerda e esquerda retaguarda, e entre a direita e direita retaguarda, respectivamente. Os dois blocos denotados A da Fig. 7b incluem esquemas para canais-2 síntese ICC. A informação lateral estimada no codificador, a qual é necessária para calcular todos os parâmetros para a síntese de sinal descodificador de saída inclui os sinais seguintes: AL12, ALi3, ALi4, ALis, ti4, τ25, C14, e C25 (ALij é a diferença de nível entre o canal i e j, iij é a diferença entre o canal I e J, e C±j é um coeficiente de correlação entre o canal i e j) . De notar aqui que outras diferenças de nível podem também ser utilizadas. 0 requisito de que existe informação suficiente disponível no descodificador para, por exemplo, computação, fatores de escala, atrasos, etc. para a síntese de BCC.
Seguidamente, é feita referência à Fig. 7d, a fim de ilustrar ainda mais o nível de modificação para cada canal, isto é, o cálculo de ai e a normalização global subsequente, o que não é mostrado na Fig. 7b. Preferivelmente, diferenças de nível inter-canal ALj são transmitidas como informação lateral, isto é, como ICLD. Aplicado a um sinal de canal, deve usar-se a relação exponencial entre o Fref canal de referência e um canal a ser calculado, ou seja, Fj. Isto é mostrado na parte superior da Fig. 7d. 0 que não é mostrado na Fig. 7b é a normalização global subsequente ou final, o que pode ter lugar antes que os blocos de uma correlação A ou depois dos blocos de correlação A. Quando os blocos de correlação afetarem a energia dos canais ponderados por a±, a normalização global deve ter lugar após a correlação dos blocos A. Para assegurar que a energia de todos os canais saída é igual à energia de todos os canais de transmissão, o canal de referência é dimensionado como mostrado na Fig. 7d. De preferência, o canal de referência é a raiz da soma dos quadrados dos canais transmitidos. 14 São em seguida descritos, os problemas associados com estes regimes sintetização/mixagem. Quando é considerado o esquema 5-to-2 BCC tal como ilustrado na Fig. 6 e Fig. 7, o seguinte torna-se claro. 0 canal de centro original é introduzido em ambos os canais de transmissão e, consequentemente, também para os canais de saida reconstruidos da esquerda e da direita.
Além disso, neste esquema, a contribuição centro comum tem a mesma amplitude, em ambos os canais de saida reconstruidos.
Além disso, o sinal central original é substituído durante a descodificação por um sinal central, que é derivado a partir dos canais de transmissão esquerdo e direito e, assim, não pode ser independente a partir (isto é, não correlacionados para) dos canais reconstruídos esquerdo e direito.
Este efeito tem consequências desfavoráveis sobre a qualidade do som percebido para sinais com uma imagem sonora muito larga, que é caracterizada por um elevado grau de correlação (isto é, baixa coerência) entre todos os canais de áudio. Um exemplo de tais sinais é o som de uma plateia aplaudindo, ao usar microfones diferentes, com um espaçamento largo o suficiente para gerar o sinal de multi-canal original. Para tais sinais, a imagem sonora do som descodificado torna-se mais estreita e a sua largura natural é reduzida.
Resumo da invenção É objecto da presente invenção proporcionar um conceito de reconstrução de maior qualidade multicanal que resulta num sinal de saída multicanal tendo uma percepção de som melhorada.
De acordo com o primeiro aspecto da presente invenção, este objetivo é atingido por um aparelho para gerar um sinal de saída multicanal tendo canais de saída de K, o canal de multi-sinal de saída correspondente a um sinal de entrada multicanal tendo canais de entrada C, utilizando canais de transmissão e, os canais de transmissão de E representam um resultado de uma operação sintetização tendo canais de entrada C como uma entrada, e utilizando a informação lateral paramétrica relacionada com os canais de entrada, em que E é ^ 2, Cé>E, e K é > 1 e ^ C, e em que a operação de sintetização é eficaz para introduzir um primeiro canal de entrada num primeiro canal de transmissão e num segundo canal de transmissão, e para adicionalmente introduzir um segundo canal de entrada no canal de transmissão pulso, compreendendo: uma calculadora canal de cancelamento para o cálculo de um canal de cancelamento usando informação relacionada com o primeiro canal de entrada incluído no canal de transmissão em primeiro lugar, o canal de transmissão ou em segundo a informação lateral paramétrica; um 15 combinador para combinar o canal cancelamento e do primeiro canal de transmissão ou uma versão processada do mesmo para obter um segundo canal de base, no qual uma influência do primeiro canal de entrada é reduzida em comparação com a influência do primeiro canal de entrada no primeiro canal de transmissão, e um canal de reconstrutor para reconstruir um segundo canal de saida correspondente ao segundo canal de entrada através do segundo canal de base e informação relacionada lateral paramétrica para o segundo canal de entrada, e para reconstruir um primeiro canal de saida utilizando um canal base pulso sendo diferente do segundo canal de base em que a influência do primeiro canal é superior em comparação com o segundo canal base, e informação lateral paramétrica relacionada com o primeiro canal de entrada.
De acordo com um segundo aspecto da presente invenção, este objetivo é atingido por um método de geração de um sinal de saida de multi-canal tendo canais de saida de K, o sinal de saida de multi-canal correspondente a um sinal de entrada multi-canal tendo canais de entrada C, utilizando os canais de transmissão de E, os canais de transmissão de E representam um resultado de uma operação sintetização tendo canais de entrada C como uma entrada, e utilizar a informação lateral paramétrica relacionada com os canais de entrada, em que E é b 2, Cé>E, e K é > 1 e ^ C, e em que a operação de sintetização é eficaz para introduzir um primeiro canal de entrada num primeiro canal de transmissão e num segundo canal de transmissão, e para além disso, introduzir um segundo canal de entrada no canal de transmissão em primeiro lugar, que compreende: o cálculo de um canal de cancelamento utilizando a informação relacionada com o primeiro canal de entrada incluído no canal de transmissão em primeiro lugar, o canal de transmissão ou a segunda informação lateral paramétrica; combinando o canal de cancelamento e o primeiro canal de transmissão ou uma versão processada do mesmo para obter um segundo canal base, em que uma influência do canal de entrada é reduzida em primeiro lugar em comparação com a influência do primeiro canal de entrada no canal de transmissão; e reconstruir um segundo canal de saída correspondente ao segundo canal de entrada através do segundo canal de base e paramétricos de informação secundários relacionados com o segundo canal de entrada, e um primeiro canal correspondente ao primeiro canal de entrada utilizando um primeiro canal de base do sendo diferente do segundo canal de base em que a influência do canal de pulso é superior em comparação com o segundo canal base, e informação lateral paramétrica relacionada com o canal de entrada em primeiro lugar.
De acordo com um terceiro aspecto da presente invenção, este objetivo é atingido por um programa de computador com um código de programa para realizar o método para gerar um sinal de saída de multi-canal, quando o programa é executado num computador. 16 É de notar aqui que, de preferência, K é igual a C. No entanto, também se poderia reconstruir canais de saida menores, tais como três canais de saída L, R, C e não reconstruir Ls e Rs. Neste caso, os canais de saída de K (=3) correspondem a três do original C (=5) de canais de entrada L, R, C. :onstatacão aaseia-se na ιθ que, para presente mvençac melhorar a qualidade de som do sinal de saída de multi-canal, um canal base é calculado pela combinação certa de um canal de transmissão e um canal de cancelamento, que é calculado para o recetor ou descodificador-final. 0 canal de cancelamento é calculado de tal modo que o canal de base modificado obtido por combinação do canal de cancelamento e do canal transmitido tem uma influência reduzida do canal centrai, isto é, o canal que é introduzido em ambos os canais de transmissão. Confirmado por outras palavras, a influência do canal central, isto é, o canal que é introduzido em ambos os canais de transmissão, que ocorre inevitavelmente quando são realizadas as operações de mixagem sintetização e subsequentes, é reduzida em comparação com uma situação em que tal cancelamento não é calculado e combinado para um canal de transmissão.
Em contraste com a. arte anterior, por exemplo o canal de transmissão esquerdo não é simplesmente usado como canal de base para reconstruir a esquerda ou canal, esquerdo de som envolvente. Em contraste, o canal esquerdo de transmissão é modificado pela combinação com o canal de cancelamento de modo que a influência do canal central original de entrada no canal de base para reconstruir o canal de saída esquerdo ou direito é reduzida ou mesmo completamente anulada.
Inventivamente, o canal de cancelamento é calculado no descodificador utilizando a informação sobre o canal central original que já está presente no descodificador ou multi-canal gerador de saída. Informação sobre o canal central está incluída no canal esquerdo transmitido, canal direito transmitido e as informações laterais paramétricas como diferenças de nível, diferenças de tempo ou parâmetros de correlação para o canal central. Certas concretizações, dependendo, toda esta. informação pode ser usada para obter uma elevada qualidade de cancelamento do canal central. Em outras formas de realização de nível mais baixo, no entanto, apenas uma parte desta informação sobre o canal central de entrada é usada. Esta informação pode ser o canal de transmissão esquerdo, o canal de transmissão direito ou a informação lateral paramétrica. Além disso, também, se pode utilizar a informação estimada no codificador e transmitida ao descodificador.
Assim, em ambiente 5-to-2, o canal esquerdo transmitido ou o canal direito transmitido não são utilizados directamente para a reconstrução do esquerdo e do direito, mas são modificados por serem combinados com o canal de cancelamento para se obter um canal de base modificado, que é diferente do canal 17 correspondente transmitido. De preferência, um factor de ponderação adicional, o qual dependerá da operação sintetização realizada α CoG-j.í.i.wauo^. paru gerar os canais de transmissão também está incluída no cálculo do canal de cancelamento. Num 5-to-2 an;bien i, pe.i-C· meros o.oid· canais de cance i emento são c u i cu 1 a d o s de modo que c. ada canai oe transirá ssao possa ser coiíbO-i-nado com ^m ^díiâi de o1 a n c o i a me n t o o e s i q ή a d o oara obter canais base modificados para reconstruir o esquerdo e” os canais esquerdos de saída circundados, e o direito e os canais direitos de saída circundados, respetivamente. A. presente i;iven.^ãu pod.e ser incorpoiaoa numa série de sistemas ou aplicações, iiiCiu^ndo, por exempro, leítQ^-aa de vídeo aigitci-i-S, i0x mres de auoio d.ígita.r, cormputa.Q.ores, receptores de Satélite, receptores, receptores de cabos cie transmissão terrestre, e sistemas de entretenimento.
Breve descrição dos desenhos ns concre L-1-i.avÕea preier^das da presente invenção sa.o subsequentemente descritas fazendo referência às figuras anexas, nas quais:
Fig. 1 é um d.iagrama de biocos de um codificador: de canal mui t i " canai s que proo-uz canais ae tra.nsmÍssâo e informação laterais paramétricas nos canais de entrada; E ig, 2 e um o_iagrama oe blocos esquemático do dispositivo preferido para gerar um sinal de salda multi-canal de acordo com a presente invenção;
Fig. o é um G.íaqrama de blocos esquemadico do dispositivo de acordo com uma primeira concretização da presente invenção;
Fig. 4 é uma implementação de circuito da forma de realização preferida da Fig. 3;
Fig. 5a é um diagrama de blocos do dispositivo da invenção em conformidade com uma segunda forma de realização da presente invenção;
Fig. 5b é uma representação matemática da mixagem dinâmica como mostrado na Fig. 5a;
Fig. 6a é um diagrama comum para ilustrar a operação de s i n t e t i z a ç ã o;
Fig. 6b é um diagrama de circuito para executar a operação de sintetização da fig. 6a; 18
Fig. 6c é uma representação matemática da operação de sintetização;
Fig, 7a é um. diagrama esquemático para indicação de canais de base, utilizado para a mixagem num ambiente de estéreo-compatível ;
Fig. 7b é um diagrama de circuito para a execução de uma reconstrução multicanal num ambiente estéreo-compatívez;
Fig. 7c é uma apresentação matemática da matriz mixagem utilizada na fig. 7b;
Fig. 7d é uma ilustração matemática do nivel de modificação para cada canal e da normalização global subsequente;
Fig, 8 ilustra um codificador;
Fig. 9 ilustra um descodificador;
Fig. 10 ilustra uma arte anterior codificador estéreo conjunto;
Fig. 11 é uma. representação em diagrama de blocos de um sistema da arte anterior BCG codificador/descodificador;
Fig. 12 é um diagrama de blocos de uma implementação da arte anterior de um bloco de síntese BCC da Fig. 11; e
Fig, 13 é uma representação de um regime bem conhecido para. a determinação ICLD, ICTD e os parâmetros de ICC.
Antes de ser dada uma descrição pormenorizada de formas de realização preferidas, o problema subjacente à invenção e a solução para o problema são descritas em termos gerais, A técnica inventiva para a melhoria da largura auditiva da imagem espacial para os canais de saída reconstruídos é aplicável a todos os casos, quando um canal de entrada é misturado em mais do que um dos canais de transmissão de um C-to-E paramétrico sistema multi-canal, A forma de realização preferida é a implementação da invenção num sistema (CBC) sinalização de codificação binauricular. Para simplicidade de discussão, mas sem perda de generalidade, a técnica inventiva é descrita para o caso específico de um. regime de BCC para codificação/descodificação de sinais circundados 5,1 de uma forma compatível. O problema auditivo antes mencionado de redução da largura da imagem ocorre principalmente para os sinais de áudio que contenham transientes repetitivos de diferentes direções rápidas independentes, como um sinal de aplausos de uma plateia em qualquer tipo de gravação ao vivo. Embora a redução da largura da imagem possa, em princípio, ser tratada usando uma maior 19 resolução de tempo para a síntese de ICLD, isto resultaria num aumento da percentagem lateral de informações e também requer uma mudança no tamanho da janela, utilizando o banco de filtros análise/síntese. Ê de notar aqui, que esta possibilidade, adicionalmente, resulta em efeitos negativos sobre componentes tonais, uma vez que um aumento de resolução de tempo automaticamente significa uma diminuição da resolução de frequência.
Sm vez disso, a invenção é um conceito simples que não tem estas desvantagens e visa reduzir a influência do componente de sinal de canal central nos canais laterais.
Como já foi discutido em associação com as Figs. 7a - 7d, os canais de base para os cinco canais de saída de reconstruídos de 5-to-2 BCC são: %(*) = &(*)“ +%(*)
^4
É de notar que o sinal original do canal central de componente X3 aparece 3 dB amplificado na base sub-banda s3 do canal central (fator de 1/V2) e de 3 dB atenuado nas restantes (canal lateral) sub-bandas canal base. A fim de atenuar ainda mais a influência componente do sinal de canal central nas sub-bandas laterais dos canais de base de acordo com esta invenção, a ideia geral seguinte é aplicada, tal como ilustrada na Fig. 2.
Uma estimativa do sinal de canal central descodificado é computada e escalonada para o nível alvo desejado, como descrito pelo nível da informação correspondente tal como um valor ICLD em ambientes BCC. De preferência, este sinal central descodificado é calculado no domínio espectral, a fim de economizar computação, isto é, aplicado sem processamento banco de filtros síntese.
Além disso, este sinal central descodificado ou sinal central reconstruído, o que corresponde ao canal de cancelamento, podem ser calculados e então combinados para ambos os sinais dos 20 canais de base dos outros canais de saída. Esta combinação é, de preferência uma subtracção. No entanto, quando os factores de ponderação tiverem um sinal diferente, uma adição também resulta, em seguida, na redução da influência do canal central no canal de base utilizado para reconstruir o canal esquerdo ou direito de saída. Este processamento resulta na formação de um canal base modificado para a reconstrução do esquerdo e esquerdo circundado ou para a reconstrução do direito ou direito circundado. De preferência, um factor de ponderação de -3 dB é preferido, mas também qualquer outro valor é possível.
Em vez de os sinais do canal base de transmissão original como utilizado na Fig. 7b, os sinais de canal base modificados são usados para o cálculo do canal de saída descodificado dos outros canais de saída, isto é, canais outros que o canal central.
Seguidamente, um diagrama de blocos do conceito inventivo será discutido por referência à Fig. 2. A Fig. 2 mostra um aparelho para gerar um sinal de saída multi-canal tendo canais de saída K, o sinal de saída multicanal correspondente a um sinal de entrada multi-canal tendo canais de entrada C, usando canais de transmissão E, os canais de transmissão de E representam um resultado de uma operação sintetização tendo os canais de entrada C como entrada, e utilizar a informação lateral paramétrica sobre os canais de entrada, em que C é á 2, C é > E, eKé>le^C. Além disso, a operação de sintetização é eficaz para introduzir um primeiro canal de entrada em um primeiro canal de transmissão e num segundo canal de transmissão. 0 dispositivo da invenção inclui o canal de cancelamento calculador 20 para calcular, pelo menos, um canal cancelamento 21, que é entrada para um combinador 22, o qual recebe, numa segunda entrada 23, o primeiro canal de transmissão direta ou em primeiro lugar uma versão processada do canal de transmissão. O processamento do primeiro canal de transmissão para obter a versão processada do canal de transmissão pulso é realizado por meio de um processador 24, que pode estar presente em algumas formas de realização, mas é, em geral, opcional. O combinador é operado para se obter um segundo canal base 25 por ser de entrada em um canal reconstrutor 26. O canal reconstrutor utiliza o segundo canal base 25 e informação lateral paramétrica no canal esquerdo de entrada original, que são inseridos no canal reconstrutor 26 em uma outra entrada 27, para gerar o segundo canal de saída. No canal de saída reconstrutor, obtém-se um segundo canal de saída 28, que pode ser o canal esquerdo de saída reconstituída, que é, em comparação com o cenário na Fig. 7b, gerado por um canal de base, que tem uma influência pequena ou mesmo uma influência totalmente nula do canal central de entrada original, comparado com a situação na Fig. 7b. 21
Embora o canal de saída esquerdo gerado como mostrado na Fig. 7b inclui uma certa influência como foi acima descrito, uma certa influência é reduzida no segundo canal base como gerado na Fig. 2, devido à combinação do canal de cancelamento e do primeiro canal de transmissão ou o primeiro canal de transmissão processada.
Conforme mostrado na Fig. 2, o canal calculador de cancelamento 20 calcula o canal de cancelamento utilizando a informação disponível sobre o canal central original como um descodificador de informação, isto é, para gerar o sinal de saída multicanal. Esta informação inclui informação latera paramétrica sobre a primeira entrada do canal 30, ou inclui o primeiro canal de transmissão 31, que também inclui alguma informação sobre o canal central devido à operação de sintetização, ou inclui a transmissão segundo canal 32, que também inclui informação sobre o canal central por causa da operação sintetização. De preferência, toda esta informação é utilizada para a reconstrução optimal do canal central para se obter o canal 21 de cancelamento.
Tal excelente forma de realização será subsequentemente descrita em relação à Fig.3 e Fig.4. Em contraste com a Fig. 2, a Fig. 3 mostra o dispositivo de dobra-2 a partir da Fig. 2, isto é, um dispositivo para cancelar a influência do canal central nas sl canal esquerdo de base, bem como o canal de base direito s2. O canal calculador de cancelamento 20 da Fig.2 inclui um canal central do dispositivo de reconstrução 20a e um dispositivo de ponderação 20b para obter o canal de cancelamento 21 na saída do dispositivo de ponderação. O combinador 22 na Fig.2 é um subtrator simples que está operativo para subtrair o canal 21 a partir do canal de cancelamento da primeira transmissão 21 para se obter - em termos da Fig. 2 - o segundo canal base 25 para reconstruir o segundo canal de saída. O canal central reconstruído X3(k) pode ser obtido na saída do canal central do dispositivo de reconstrução 20a. A Fig. 4 indica uma forma de realização preferida implementada como um diagrama de circuito, que utiliza a técnica que tem sido discutida em relação à Fig.3. Além disso, a Fig.4 mostra a frequência de processamento selectivo que é perfeitamente adaptada para ser integrada a um dispositivo para a frequência seletiva reconstrução frontal BCC. O canal central reconstrução 26 ocorre pela soma dos dois canais de transmissão num verão 40. Em seguida, a informação lateral paramétrica para as diferenças de nível de canal, ou o factor de a3 derivado a partir da diferença de nível inter-canal como discutido na Fig. 7d é usado para gerar uma versão modificada do primeiro canal de base (em termos de Fig. 2), que é a entrada para o canal reconstrutor 26 na primeira entrada base de canal 29 na Fig.2. O canal central reconstruído na saída do multiplicador 41 pode ser usado para o centro de reconstrução de 22 saída do canal (após a normalização geral que é descrita na Fig. 7d) .
Para confirmar a influência do canal central no canal esquerdo de base e para o direito reconstrução, um factor de ponderação 1/V2 é aplicado que é ilustrado por meio de um multiplicador 42 na Fig. 4. Em seguida, o canal central reconstruído e novamente ponderado são alimentados de volta para as versões 43a e 43b, que correspondem ao combinador 22 na Fig. 2.
Assim, o segundo canal de base Si ou S4 (ou S2 e S5) é diferente do canal de transmissão y1 em que a influência do canal central é reduzida em comparação com o caso na Fig. 7b.
As sub-bandas de canal de base resultantes são dadas em termos matemáticos, como segue: / v' 2
Assim, o dispositivo da Fig. 4 prevê uma subtração de uma sub-banda estimativa do canal central a partir dos canais de base para os canais laterais, a fim de melhorar a independência entre os canais e, portanto, fornecer uma melhor largura espacial do sinal multi-canal de saída, reconstruído.
De acordo com uma outra forma de realização da presente invenção, que será subsequentemente descrita em relação à Fig. 5a e Fig. 5b, é determinado um canal de cancelamento diferente do canal de cancelamento calculado na Fig. 3. Em contraste com a forma de realização da Fig.3/Fig.4, o canal de cancelamento 24 para o cálculo do segundo canal de base sl (k) não é derivado a partir do primeiro canal de transmissão, bem como o segundo canal de transmissão, mas é derivado a partir do segundo canal de transmissão y2(k) usando um determinado factor de ponderação x_lr, que é ilustrado pelo dispositivo de multiplicação 51 na Fig. 5a. Assim, o canal de cancelamento 21 na Fig. 5a é diferente do canal de cancelamento na Fig. 3, mas também contribui para uma redução da influência do canal central sobre o canal base sl(k) utilizado para reconstruir o segundo canal de saída, isto é, do canal de saída esquerdo xl(k). 23
Na forma de realização da Fig.5a, é também mostrada uma forma de realização preferida do processador 24. Em particular, o processador 24 é implementado como outro dispositivo de multiplicação 52, no qual se aplica uma multiplicação por fator de multiplicação (l-x_lr). De preferência, como é mostrado na Fig. la, o fator de multiplicação aplicado pelo processador 24 para o primeiro canal de transmissão depende do fator de multiplicação 51, que é usado para a multiplicação do canal de transmissão para se obter o segundo canal de cancelamento 21. Finalmente, a versão processada do primeiro canal de transmissão numa entrada 23 para o combinador 22 é usada para combinar, que consiste em subtrair o canal de cancelamento 21 a partir da versão processada do primeiro canal de transmissão. Novamente todos estes resultados no segundo canal de base 25, que tem uma influência completamente reduzida ou nula do canal central original de entrada.
Como está mostrado na Fig. 5a, o mesmo procedimento é repetido para obter o terceiro canal base s2(k) numa entrada do dispositivo de reconstrução direito/direito sintetização. No entanto, como é mostrado na Fig. 5a, o terceiro canal base s2 (k) é obtido através da combinação da versão processada do segundo canal de transmissão y(k) e um outro canal de cancelamento 53, que é derivado do primeiro canal de transmissão yl(k) através da multiplicação num dispositivo de multiplicação 54, que tem um fator de multiplicação x_rl, que pode ser idêntico a x_lr para um dispositivo 51, mas que também pode ser diferente a partir deste valor. 0 processador para o processamento do segundo canal de transmissão, tal como indicado na Fig. 5a é um dispositivo de multiplicação 55. 0 combinador para combinar o segundo canal cancelamento 53 e a versão processada do segundo canal de transmissão y2 (k) é ilustrado pelo número de referência 56 na Fig.5a. O canal calculador de cancelamento da Fig.2 inclui ainda um dispositivo para calcular os coeficientes de cancelamento, que é indicado pelo número de referência 57 na Fig.5a. O dispositivo 57 é operativo para obter informação sobre o lado paramétrico de entrada ou canal central original ou, como diferença de nível inter-canal, etc. 0 mesmo é verdadeiro para o dispositivo 20a na Fig.3, onde o canal central do dispositivo de reconstrução 20a inclui também uma entrada para receber informação lateral paramétrica, tais como valores de nível ou diferenças de nível inter-canal, etc. A seguinte equação 24 mostra a descrição matemática da Fig. 5a e a forma de realização ilustra, no lado direito da mesma, o processamento de cancelamento no canal calculador de cancelamento por um lado e os processadores (21, 24 na Fig. 2), por outro. Nesta forma de realização especifica, que é aqui ilustrada, os fatores x_lr e x_rl são idênticos um ao outro. A forma de realização acima deixa claro que a invenção inclui uma composição dos canais base de reconstrução como uma combinação sinal-adaptativo linear dos canais de transmissão esquerdo e direito. Tal topologia está ilustrada na Fig. 5a.
Quando visto de um ângulo diferente, o dispositivo da invenção pode também ser entendido como um processo de mixagem dinâmica, na qual é usada uma matriz de mixagem diferente para cada sub-banda, e cada instância de tempo k. Tal matriz dinâmica de mixagem está ilustrada na Fig.5b. É de notar que, para cada sub-banda, isto é, para cada saida do dispositivo de banco de filtros na Fig. 4, existe uma tal matriz de mixagem U. No que diz respeito ao modo dependente do tempo, é de notar que Fig. 5b inclui o indice de tempo k. Quando se tem informações de nível para cada índice de tempo, cada instância de tempo mudaria a matriz de mixagem para a próxima instância. Quando, no entanto, é utilizado o mesmo nível de informação a3 para um conceito bloco de valores transformado em uma representação frequência pela entrada banco de filtros FB, em seguida, um valor a3 estará presente para um bloco completo de por exemplo 1024 ou 2048 valores de amostragem. Neste caso, a matriz de mixagem mudaria na direção tempo de bloco em bloco, em vez de valor em valor. No entanto, as técnicas existentes para alisar os valores paramétricos de nível de modo que pode obter uma amplitude de fatores modificação a3 diferente durante a mixagem numa banda de frequências determinada.
Dito de forma geral, pode usar-se também diferentes fatores para o cálculo das sub-bandas de saída do canal central e os fatores de "mixagem dinâmica", resultando num fator a3, que é uma versão reduzida do a3, tal como acima calculado.
Numa concretização preferida, a força central de ponderação do cancelamento componente é adaptativamente controlada por meio de uma transmissão de informação explícita lateral a partir do codificador para o descodificador. Neste caso, o canal calculador de cancelamento 20 mostrado na Fig. 2 irá incluir uma entrada de controlo adicional, o qual recebe um sinal de controlo explícito que pôde ser calculado para indicar uma interdependência direta entre o lado esquerdo e o centro ou para o direito e o canal central. A este respeito, este sinal de controlo seria diferente a partir das diferenças de nível para o canal central e o canal esquerdo, porque estas diferenças de nível estão relacionadas com um tipo de canal de referência virtual, que poderia ser a soma da energia no primeiro canal de 25 transmissão e a soma da energia no segundo canal de transmissão, como é ilustrado na parte superior da Fig. 7d.
Tal parâmetro de controlo poderia, por exemplo, indicar que o canal central está abaixo de um limiar e se aproxima de zero, enquanto existe um sinal no canal lateral esquerdo ou direito, que está acima do limiar. Neste caso, uma reação adequada do canal calculador de cancelamento a um sinal de controlo correspondente seria para desligar o cancelamento de canal e para aplicar um esquema de mixagem normal como mostrado na Fig. 7b para evitar "cancelamento-superior" do canal central, que não está presente na entrada. A este respeito, este seria um tipo extremo de controlar a força de ponderação, conforme acima descrito.
De preferência, como se torna claro a partir da Fig. 4, no tempo de operação de processamento é realizada demora para o cálculo do canal central de reconstrução. Isto é vantajoso na medida em que o feedback funciona sem ter de levar em consideração quaisquer atrasos de tempo. No entanto, esta pode ser obtida sem perda de qualidade, quando o canal de centro original é usado como o canal de referência para o cálculo de diferenças de tempo d±. 0 mesmo é verdadeiro para qualquer medida de correlação. É preferido não realizar qualquer processamento de correlação para a reconstrução do canal central. Dependendo do tipo de cálculo de correlação, isto pode ser feito sem perda de qualidade, quando o canal central original é usado como referência para todos os parâmetros de correlação. É de notar que a invenção não depende de um esquema de sintetização determinado. Isto significa que se pode usar uma sintetização automática ou um esquema de sintetização manual feito por um engenheiro de som. Pode-se até mesmo usar informações paramétricas geradas automaticamente juntamente com os canais sintetização manualmente gerados.
Dependendo do ambiente de aplicação, os métodos da invenção para gerar a construção podem ser implementados em hardware ou em software. A aplicação pode ser um meio de armazenamento digital, tal como um disco ou um CD, ter sinais de controlo eletrónico formato digital, que pode cooperar com um sistema de computador programável de tal forma que os métodos da invenção são realizados. Geralmente indicado, a invenção por conseguinte, também se relaciona com um produto de programa de computador com um código de programa armazenado numa máquina portadora legivel, o código do programa seja adaptado para a realização dos métodos da invenção, quando o produto programa de computador é executado num computador. Por conseguinte, a invenção, por outras palavras, também se relaciona com um programa de computador com um código de programa para realizar os métodos, quando o programa de computador é executado num computador. 26 A presente invenção pode ser utilizada em conjunto ou incorporada em uma variedade de aplicações diferentes ou sistemas, incluindo sistemas de distribuição de televisão ou música eletrónica, de radiodifusão, transmissão e/ou receção. Estes sistemas inclusos para descodificação/codificação de transmissão através, por exemplo, terrestres, por satélite, cabo, internet, intranets, ou meios físicos (por exemplo discos compactos, discos versáteis digitais, chips semicondutores, discos rígidos, cartões de memória e afins). A presente invenção também pode ser empregue em sistemas de jogo, incluindo, por exemplo, os produtos de software interativos destinados a interagir com o usuário para o entretenimento (ação, atuação, aventura, estratégia, simulação, corrida, desportos, árcade, cartas e jogos de tabuleiro) e/ou educação que podem ser publicados por múltiplas máquinas, plataformas ou de mídia. Além disso, a presente invenção pode ser incorporada em leitores de áudio ou de sistemas de CD-ROM/DVD. A presente invenção também pode ser incorporada em aplicações de software de PC que incorporam descodificação digital (por ex. - jogador, descodificador) e aplicações de software que incorporam recursos de codificação digital (por exemplo - codificador, ríper, gravador e jukebox).
Lisboa 2 de Agosto de 2012. 27
Claims (21)
- REIVINDICAÇÕES 1. Aparelho para gerar um sinal multi-canal de saída tendo canais de saídas K, o sinal de saída multi-canal correspondente a um sinal de entrada multi-canal tendo canais de entrada C, utilizando os canais de transmissão E, os canais de transmissão E representam um resultado de uma operação sintetização tendo canais de entrada C como entrada, e utilizando a informação paramétrica relacionada para os canais de entrada, em que E é h 2, Cé>E, eKé>le^C, e em que a operação de sintetização é efetiva para introduzir um primeiro canal de entrada num primeiro canal de transmissão e num segundo canal de transmissão, e, adicionalmente, introduzir um segundo canal de entrada no canal de transmissão em primeiro lugar, que compreende: um canal de cancelamento calculador (20) para o cálculo de um canal de cancelamento (21) utilizando a informação relacionada com o primeiro canal de entrada incluídos no primeiro canal de transmissão, o segundo canal de transmissão ou a informação paramétrica; um combinador (23) para a combinação do canal de cancelamento (21) e do primeiro canal de transmissão (23) ou uma versão processada da mesma a obter um segundo canal base (25) , no qual uma influência do primeiro canal de entrada é reduzida em comparação com a influência do primeiro canal de entrada no primeiro canal de transmissão; e um canal reconstrutor (26) para reconstruir um segundo canal de saída correspondente ao segundo canal de entrada através do segundo canal de base e informação paramétrica relacionada com o segundo canal de entrada, e para reconstruir um primeiro canal de saída correspondente ao primeiro canal de entrada, utilizando um primeiro canal base sendo diferente do segundo canal de base em que a influência do primeiro canal é superior em comparação com segundo canal de base, e informação relacionada paramétrica para o primeiro canal de entrada.
- 2. Aparelho de acordo com a combinador (22) está operativo cancelamento do primeiro canal processada do mesmo. reivindicação 1, em que o para subtrair o canal de de transmissão ou a versão 1
- 3. Aparelho de acordo com a reivindicação 1 ou a reivindicação 2, em que o canal calculador de cancelamento (20) está operativo para calcular uma estimativa para o primeiro canal de entrada utilizando o primeiro canal de transmissão e o segundo canal de transmissão para se obter o canal de cancelamento (21) .
- 4. Aparelho de acordo com qualquer uma das reivindicações 1 - 3, em que a informação paramétrica inclui um parâmetro diferença entre o primeiro canal de entrada e um canal de referência, e em que o canal calculador de cancelamento (20) está operativo para calcular uma soma do primeiro canal de transmissão e do segundo canal de transmissão para ponderar a soma utilizando o parâmetro de diferença.
- 5. Aparelho de acordo com qualquer uma das reivindicações 1 - 4, na qual a operação sintetização é tal que o primeiro canal de entrada é introduzido no primeiro canal de transmissão depois de ser dimensionado por um fator de sintetização, e em que o canal calculador de cancelamento (20) é operatório para dimensionar a soma do primeiro e segundo canais de transmissão usando um fator de escala, o qual depende do fator de sintetização.
- 6. Aparelho de acordo com a reivindicação 5, no qual o fator de ponderação é igual ao fator de sintetização.
- 7. Aparelho de acordo com qualquer uma das reivindicações 1 - 6, em que o canal calculador de cancelamento (20) está operativo para determinar uma soma do primeiro e segundo canais de transmissão para se obter o primeiro canal de base.
- 8. Aparelho de acordo com qualquer uma das reivindicações 1 - 7, que compreende ainda um processador (24) que é operativo para processar o primeiro canal de transmissão por ponderação utilizando em primeiro lugar um fator de ponderação, e em que o canal calculador de cancelamento (20) está operativo para a carga do segundo canal de transmissão usando um segundo fator de ponderação.
- 9. Aparelho de acordo com a reivindicação 8, em que a informação paramétrica inclui o parâmetro diferença entre o primeiro canal de entrada e um canal de referência, e em que o canal calculador de cancelamento (20) está operativo para determinar o segundo fator de ponderação base num parâmetro diferença.
- 10. Aparelho de acordo com a reivindicação 8 ou 9, em que o primeiro fator de ponderação é igual a (1 —h) , em que h é um valor real, e no qual o segundo fator de ponderação é igual a h. 2
- 11. Aparelho de acordo com a reivindicação 10, no qual a informação paramétrica inclui um valor de diferença, em que H é derivado a partir do nivel paramétrico valor de diferença.
- 12. Aparelho de acordo com a reivindicação 11, em que h é iqual a um valor derivado da diferença de nivel dividida por um fator, dependendo da operação de sintetização.
- 13. Aparelho de acordo com a reivindicação 10, na qual a informação paramétrica inclui a diferença de nivel entre o primeiro canal e o canal de referência, e em que h é iqual a lV2xlOL/2°, onde L é a diferença de nivel.
- 14. Aparelho de acordo com qualquer uma das reivindicações 1 - 13, em que a informação adicional paramétrica inclui um sinal de controlo dependente da relação entre o primeiro canal de entrada e o segundo canal de entrada, e no qual o canal calculador de cancelamento (20) é controlado pelo sinal de controlo para ativamente aumentar ou diminuir uma energia do canal de cancelamento ou mesmo desativar todo o cálculo do canal de cancelamento.
- 15. Aparelho de acordo com qualquer uma das reivindicações 1 - 14, na qual a operação sintetização é ainda operativa para introduzir um terceiro canal de entrada para o segundo canal de transmissão, o aparelho compreende ainda um combinador para combinar o canal cancelamento e o segundo canal de transmissão ou uma versão processada do mesmo para obter um terceiro canal de base, em que uma influência do primeiro canal de entrada é reduzida em comparação com a influência do primeiro canal de entrada no segundo canal de transmissão, e um canal reconstrutor para reconstruir o terceiro canal de saida correspondente ao terceiro canal de entrada usando o terceiro canal base e informação paramétrica relacionada para o terceiro canal de entrada.
- 16. Aparelho de acordo com qualquer uma das reivindicações 1 - 15, em que a informação paramétrica inclui diferenças inter-canal de nivel, diferenças de tempo inter-canal, as diferenças inter-canal de fase ou de valores de canal inter-correlação, e em que o canal reconstrutor (26) está operativo para aplicar qualquer um dos parâmetros do grupo acima, em um canal de base para se obter um canal de saida em bruto.
- 17. Aparelho de acordo com a reivindicação 16, na qual o canal reconstrutor (26) está operativo para dimensionar o canal de saida em bruto de modo que a energia total no canal de saida final reconstruído é igual à energia total dos canais de transmissão E. 3
- 18. Aparelho de acordo com qualquer uma das reivindicações 1 -17, na qual a informação paramétrico é dada banda refletida, e em que o canal calculador de cancelamento (20), o combinador (22) e o canal reconstrutor (26) são operativos para processar a pluralidade de bandas que usam informações paramétricas banda refletida, e em que o aparelho compreende ainda uma unidade de conversão tempo/frequência (IFB) para converter os canais de transmissão para uma representação de frequência com bandas de frequência, e uma unidade de conversão de frequência/tempo para a conversão de bandas de frequências reconstruídas no domínio do tempo.
- 19. O aparelho segundo qualquer uma das reivindicações 1 a 18 compreendendo ainda: um sistema selecionado de entre o grupo consistindo de um leitor de vídeo digital, um leitor de áudio digital, um computador, um recetor de satélite, um recetor de cabo, um recetor de difusão terrestre, e um sistema de entretenimento; e em que o sistema compreende um canal calculador, um combinador, e um canal reconstrutor.
- 20. Método para formar um sinal multi-canal de saída tendo canais de saída K, o sinal multi-canal de saída correspondente a um sinal de entrada multi-canal tendo canais de entrada C, utilizando os canais de transmissão E, os canais de transmissão E representarem um resultado de uma operação de sintetização tendo como entrada um canal de entrada C, e utilizando a informação paramétrica relacionada com os canais de entrada, em que E é ^ 2, Cé>E, eKé>l e < C, e em que a operação de sintetização é eficaz para introduzir um primeiro canal de entrada num primeiro canal de transmissão e num segundo canal de transmissão, e para além disso, introduzindo em primeiro lugar um segundo canal de entrada no canal de transmissão, que compreende: cálculo (20) do canal de cancelamento utilizando a informação relacionada com o primeiro canal de entrada incluído no primeiro canal de transmissão, o segundo canal de transmissão ou a informação paramétrica; combinado (22) do canal de cancelamento e do primeiro canal de transmissão ou uma versão processada do mesmo para obter um segundo canal base, em que uma influência do primeiro canal de entrada é reduzida em comparação com a influência do primeiro canal de entrada no primeiro canal de transmissão; e reconstrução (26) um segundo canal de saída correspondente ao segundo canal de entrada através do canal de segunda base e informação paramétrica relacionada com o segundo canal de entrada, e um primeiro canal de saída correspondente ao primeiro canal de entrada utilizando um primeiro canal de base sendo diferente do segundo canal base em que a influência do primeiro canal é superior em comparação com o 4 segundo canal base, e informação paramétrica relacionada para o primeiro canal de entrada.
- 21. Programa de computador com um código de programa para implementação, quando executado por um computador, um método para gerar um sinal multi-canal de saida tendo canais de saida K, o canal multi-sinal de saida correspondente a um sinal de entrada multi-canal tendo canais de entrada C, utilizando canais de transmissão E, os canais de transmissão E representam um resultado de uma operação de mistura baixa tendo uma entrada canais de entrada C como entrada, e utilizando a informação paramétrica relacionada com os canais de entrada, em que E é ^ 2, Cé>E, eKé>le^C, e onde a operação de sintetização é eficaz para introduzir um primeiro canal de entrada em um primeiro canal de transmissão e num segundo canal de transmissão, e para além disso, introduzir um segundo canal de entrada no primeiro canal de transmissão, o método compreendendo: cálculo (20) do canal de cancelamento utilizando a informação relacionada com o primeiro canal de entrada incluido no primeiro canal de transmissão, o segundo canal de transmissão ou a informação paramétrica; combinado (22) do canal de cancelamento e do primeiro canal de transmissão ou uma versão processada do mesmo para obter um segundo canal base, em que uma influência do primeiro canal de entrada é reduzida em comparação com a influência do primeiro canal de entrada no primeiro canal de transmissão; e reconstrução (26) um segundo canal de saida correspondente ao segundo canal de entrada através do canal de segunda base e informação paramétrica relacionada com o segundo canal de entrada, e um primeiro canal de saída correspondente ao primeiro canal de entrada utilizando um primeiro canal de base sendo diferente do segundo canal base em que a influência do primeiro canal é superior em comparação com o segundo canal base, e informação paramétrica relacionada para o primeiro canal de entrada. Lisboa, 2 de Agosto de 2012. 5
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US58657804P | 2004-07-09 | 2004-07-09 | |
US10/935,061 US7391870B2 (en) | 2004-07-09 | 2004-09-07 | Apparatus and method for generating a multi-channel output signal |
Publications (1)
Publication Number | Publication Date |
---|---|
PT1774515E true PT1774515E (pt) | 2012-08-09 |
Family
ID=34966842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PT05740130T PT1774515E (pt) | 2004-07-09 | 2005-05-12 | Aparelho e processo para gerar um sinal de saída multicanal |
Country Status (16)
Country | Link |
---|---|
US (1) | US7391870B2 (pt) |
EP (1) | EP1774515B1 (pt) |
JP (1) | JP4772043B2 (pt) |
KR (1) | KR100908080B1 (pt) |
CN (1) | CN1985303B (pt) |
AT (1) | ATE556406T1 (pt) |
AU (1) | AU2005262025B2 (pt) |
BR (1) | BRPI0512763B1 (pt) |
CA (1) | CA2572989C (pt) |
ES (1) | ES2387248T3 (pt) |
HK (1) | HK1099901A1 (pt) |
NO (1) | NO338725B1 (pt) |
PT (1) | PT1774515E (pt) |
RU (1) | RU2361185C2 (pt) |
TW (1) | TWI305639B (pt) |
WO (1) | WO2006005390A1 (pt) |
Families Citing this family (80)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7711123B2 (en) * | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
SE0301273D0 (sv) * | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods |
US8027478B2 (en) * | 2004-04-16 | 2011-09-27 | Dublin Institute Of Technology | Method and system for sound source separation |
PL2175671T3 (pl) * | 2004-07-14 | 2012-10-31 | Koninl Philips Electronics Nv | Sposób, urządzenie, urządzenie kodujące, urządzenie dekodujące i system audio |
TWI497485B (zh) * | 2004-08-25 | 2015-08-21 | Dolby Lab Licensing Corp | 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法 |
BRPI0517949B1 (pt) * | 2004-11-04 | 2019-09-03 | Koninklijke Philips Nv | dispositivo de conversão para converter um sinal dominante, método de conversão de um sinal dominante, e meio não transitório legível por computador |
KR101183859B1 (ko) * | 2004-11-04 | 2012-09-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다중채널 오디오 신호들의 인코딩 및 디코딩 |
EP1817767B1 (en) * | 2004-11-30 | 2015-11-11 | Agere Systems Inc. | Parametric coding of spatial audio with object-based side information |
KR100682904B1 (ko) * | 2004-12-01 | 2007-02-15 | 삼성전자주식회사 | 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법 |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
CN101147191B (zh) * | 2005-03-25 | 2011-07-13 | 松下电器产业株式会社 | 语音编码装置和语音编码方法 |
DE602006002501D1 (de) * | 2005-03-30 | 2008-10-09 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
KR101271069B1 (ko) * | 2005-03-30 | 2013-06-04 | 돌비 인터네셔널 에이비 | 다중채널 오디오 인코더 및 디코더와, 인코딩 및 디코딩 방법 |
US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
WO2006126844A2 (en) * | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
EP1905004A2 (en) * | 2005-05-26 | 2008-04-02 | LG Electronics Inc. | Method of encoding and decoding an audio signal |
JP4988716B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
JP4896449B2 (ja) * | 2005-06-29 | 2012-03-14 | 株式会社東芝 | 音響信号処理方法、装置及びプログラム |
WO2007004831A1 (en) * | 2005-06-30 | 2007-01-11 | Lg Electronics Inc. | Method and apparatus for encoding and decoding an audio signal |
US8626503B2 (en) * | 2005-07-14 | 2014-01-07 | Erik Gosuinus Petrus Schuijers | Audio encoding and decoding |
US8019614B2 (en) * | 2005-09-02 | 2011-09-13 | Panasonic Corporation | Energy shaping apparatus and energy shaping method |
WO2007037613A1 (en) * | 2005-09-27 | 2007-04-05 | Lg Electronics Inc. | Method and apparatus for encoding/decoding multi-channel audio signal |
CN101278598B (zh) * | 2005-10-07 | 2011-05-25 | 松下电器产业株式会社 | 音频信号处理装置以及音频信号处理方法 |
KR101218776B1 (ko) | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
TWI329462B (en) * | 2006-01-19 | 2010-08-21 | Lg Electronics Inc | Method and apparatus for processing a media signal |
JP5054035B2 (ja) * | 2006-02-07 | 2012-10-24 | エルジー エレクトロニクス インコーポレイティド | 符号化/復号化装置及び方法 |
JP4997781B2 (ja) * | 2006-02-14 | 2012-08-08 | 沖電気工業株式会社 | ミックスダウン方法およびミックスダウン装置 |
ES2339888T3 (es) | 2006-02-21 | 2010-05-26 | Koninklijke Philips Electronics N.V. | Codificacion y decodificacion de audio. |
FR2899424A1 (fr) * | 2006-03-28 | 2007-10-05 | France Telecom | Procede de synthese binaurale prenant en compte un effet de salle |
FR2899423A1 (fr) | 2006-03-28 | 2007-10-05 | France Telecom | Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme. |
EP1853092B1 (en) * | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
US8027479B2 (en) | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
US20080004883A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Scalable audio coding |
CN101652810B (zh) * | 2006-09-29 | 2012-04-11 | Lg电子株式会社 | 用于处理混合信号的装置及其方法 |
EP2084901B1 (en) * | 2006-10-12 | 2015-12-09 | LG Electronics Inc. | Apparatus for processing a mix signal and method thereof |
DE602007013415D1 (de) * | 2006-10-16 | 2011-05-05 | Dolby Sweden Ab | Erweiterte codierung und parameterrepräsentation einer mehrkanaligen heruntergemischten objektcodierung |
WO2008046530A2 (en) * | 2006-10-16 | 2008-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for multi -channel parameter transformation |
JP5450085B2 (ja) | 2006-12-07 | 2014-03-26 | エルジー エレクトロニクス インコーポレイティド | オーディオ処理方法及び装置 |
CA2645915C (en) | 2007-02-14 | 2012-10-23 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
KR101100213B1 (ko) | 2007-03-16 | 2011-12-28 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
US8064624B2 (en) * | 2007-07-19 | 2011-11-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for generating a stereo signal with enhanced perceptual quality |
US8032085B2 (en) * | 2007-09-10 | 2011-10-04 | Technion Research & Development Foundation Ltd. | Spectrum-blind sampling and reconstruction of multi-band signals |
KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
US8930197B2 (en) * | 2008-05-09 | 2015-01-06 | Nokia Corporation | Apparatus and method for encoding and reproduction of speech and audio signals |
BRPI0908630B1 (pt) * | 2008-05-23 | 2020-09-15 | Koninklijke Philips N.V. | Aparelho de 'upmix' estéreo paramétrico, decodificador estéreo paramétrico, método para a geração de um sinal esquerdo e de um sinal direito a partir de um sinal de 'downmix' mono com base em parâmetros espaciais, dispositivo de execução de áudio, aparelho de 'downmix' estéreo paramétrico, codificador estéreo paramétrico, método para a geração de um sinal residual de previsão para um sinal de diferença a partir de um sinal esquerdo e de um sinal direito com base nos parâmetros espaciais, e, produto de programa de computador |
US8060042B2 (en) * | 2008-05-23 | 2011-11-15 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
BRPI0905069A2 (pt) * | 2008-07-29 | 2015-06-30 | Panasonic Corp | Aparelho de codificação de áudio, aparelho de decodificação de áudio, aparelho de codificação e de descodificação de áudio e sistema de teleconferência |
JP5635502B2 (ja) * | 2008-10-01 | 2014-12-03 | ジーブイビービー ホールディングス エス.エイ.アール.エル. | 復号装置、復号方法、符号化装置、符号化方法、及び編集装置 |
DE102008056704B4 (de) * | 2008-11-11 | 2010-11-04 | Institut für Rundfunktechnik GmbH | Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates |
WO2010095083A1 (en) | 2009-02-18 | 2010-08-26 | Technion Research & Development Foundation Ltd | Efficient sampling and reconstruction of sparse multi-band signals |
CN101556799B (zh) * | 2009-05-14 | 2013-08-28 | 华为技术有限公司 | 一种音频解码方法和音频解码器 |
JP2011002574A (ja) * | 2009-06-17 | 2011-01-06 | Nippon Hoso Kyokai <Nhk> | 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム |
JP5345024B2 (ja) * | 2009-08-28 | 2013-11-20 | 日本放送協会 | 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム |
TWI433137B (zh) | 2009-09-10 | 2014-04-01 | Dolby Int Ab | 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法 |
US8774417B1 (en) * | 2009-10-05 | 2014-07-08 | Xfrm Incorporated | Surround audio compatibility assessment |
EP2367293B1 (en) * | 2010-03-14 | 2014-12-24 | Technion Research & Development Foundation | Low-rate sampling of pulse streams |
DE102010015630B3 (de) * | 2010-04-20 | 2011-06-01 | Institut für Rundfunktechnik GmbH | Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates |
WO2011135472A2 (en) | 2010-04-27 | 2011-11-03 | Technion Research & Development Foundation Ltd. | Multi-channel sampling of pulse streams at the rate of innovation |
WO2012009851A1 (en) * | 2010-07-20 | 2012-01-26 | Huawei Technologies Co., Ltd. | Audio signal synthesizer |
BR122021003884B1 (pt) | 2010-08-12 | 2021-11-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Reamostrar sinais de saída de codecs de áudio com base em qmf |
BR112013004362B1 (pt) * | 2010-08-25 | 2020-12-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida |
WO2012049591A1 (en) | 2010-10-13 | 2012-04-19 | Technion Research & Development Foundation Ltd. | Sub-nyquist sampling of short pulses |
TWI462087B (zh) * | 2010-11-12 | 2014-11-21 | Dolby Lab Licensing Corp | 複數音頻信號之降混方法、編解碼方法及混合系統 |
US20120155650A1 (en) * | 2010-12-15 | 2012-06-21 | Harman International Industries, Incorporated | Speaker array for virtual surround rendering |
UA107771C2 (en) * | 2011-09-29 | 2015-02-10 | Dolby Int Ab | Prediction-based fm stereo radio noise reduction |
ITTO20120067A1 (it) * | 2012-01-26 | 2013-07-27 | Inst Rundfunktechnik Gmbh | Method and apparatus for conversion of a multi-channel audio signal into a two-channel audio signal. |
US9131313B1 (en) * | 2012-02-07 | 2015-09-08 | Star Co. | System and method for audio reproduction |
JP6248186B2 (ja) * | 2013-05-24 | 2017-12-13 | ドルビー・インターナショナル・アーベー | オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ |
US9338573B2 (en) | 2013-07-30 | 2016-05-10 | Dts, Inc. | Matrix decoder with constant-power pairwise panning |
WO2015036350A1 (en) * | 2013-09-12 | 2015-03-19 | Dolby International Ab | Audio decoding system and audio encoding system |
EP3444815B1 (en) | 2013-11-27 | 2020-01-08 | DTS, Inc. | Multiplet-based matrix mixing for high-channel count multichannel audio |
EP3067886A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
CN106997768B (zh) * | 2016-01-25 | 2019-12-10 | 电信科学技术研究院 | 一种语音出现概率的计算方法、装置及电子设备 |
EP3246923A1 (en) | 2016-05-20 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing a multichannel audio signal |
RU2628198C1 (ru) * | 2016-05-23 | 2017-08-15 | Самсунг Электроникс Ко., Лтд. | Способ межканального предсказания и межканальной реконструкции для многоканального видео, снятого устройствами с различными углами зрения |
CA3045847C (en) * | 2016-11-08 | 2021-06-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Downmixer and method for downmixing at least two channels and multichannel encoder and multichannel decoder |
JP6866679B2 (ja) | 2017-02-20 | 2021-04-28 | 株式会社Jvcケンウッド | 頭外定位処理装置、頭外定位処理方法、及び頭外定位処理プログラム |
US12100403B2 (en) * | 2020-03-09 | 2024-09-24 | Nippon Telegraph And Telephone Corporation | Sound signal downmixing method, sound signal coding method, sound signal downmixing apparatus, sound signal coding apparatus, program and recording medium |
JP7385531B2 (ja) * | 2020-06-17 | 2023-11-22 | Toa株式会社 | 音響通信システム、音響送信装置、音響受信装置、プログラムおよび音響信号送信方法 |
CN117476026A (zh) * | 2023-12-26 | 2024-01-30 | 芯瞳半导体技术(山东)有限公司 | 一种多路音频数据混音的方法、系统、装置及存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG49883A1 (en) | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
JP3577798B2 (ja) * | 1995-08-31 | 2004-10-13 | ソニー株式会社 | ヘッドホン装置 |
US5890125A (en) * | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
US6249578B1 (en) | 1998-04-06 | 2001-06-19 | Ameritech Corporation | Interactive electronic ordering for telecommunications products and services |
JP3657120B2 (ja) | 1998-07-30 | 2005-06-08 | 株式会社アーニス・サウンド・テクノロジーズ | 左,右両耳用のオーディオ信号を音像定位させるための処理方法 |
US7006636B2 (en) | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US20030035553A1 (en) | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
TW589815B (en) * | 2002-01-16 | 2004-06-01 | Winbond Electronics Corp | Control method for multi-channel data transmission |
KR101049751B1 (ko) * | 2003-02-11 | 2011-07-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
-
2004
- 2004-09-07 US US10/935,061 patent/US7391870B2/en active Active
-
2005
- 2005-05-12 CN CN2005800231310A patent/CN1985303B/zh active Active
- 2005-05-12 CA CA2572989A patent/CA2572989C/en active Active
- 2005-05-12 RU RU2007104933/09A patent/RU2361185C2/ru active
- 2005-05-12 JP JP2007519630A patent/JP4772043B2/ja active Active
- 2005-05-12 EP EP05740130A patent/EP1774515B1/en active Active
- 2005-05-12 BR BRPI0512763A patent/BRPI0512763B1/pt active IP Right Grant
- 2005-05-12 AU AU2005262025A patent/AU2005262025B2/en active Active
- 2005-05-12 ES ES05740130T patent/ES2387248T3/es active Active
- 2005-05-12 WO PCT/EP2005/005199 patent/WO2006005390A1/en active Application Filing
- 2005-05-12 PT PT05740130T patent/PT1774515E/pt unknown
- 2005-05-12 AT AT05740130T patent/ATE556406T1/de active
- 2005-05-12 KR KR1020077000404A patent/KR100908080B1/ko active IP Right Grant
- 2005-07-07 TW TW094122951A patent/TWI305639B/zh active
-
2007
- 2007-01-02 NO NO20070034A patent/NO338725B1/no unknown
- 2007-07-12 HK HK07107471.6A patent/HK1099901A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
ATE556406T1 (de) | 2012-05-15 |
TW200617884A (en) | 2006-06-01 |
CA2572989A1 (en) | 2006-01-19 |
EP1774515B1 (en) | 2012-05-02 |
JP2008505368A (ja) | 2008-02-21 |
HK1099901A1 (en) | 2007-08-24 |
CN1985303A (zh) | 2007-06-20 |
EP1774515A1 (en) | 2007-04-18 |
KR100908080B1 (ko) | 2009-07-15 |
US7391870B2 (en) | 2008-06-24 |
ES2387248T3 (es) | 2012-09-19 |
NO20070034L (no) | 2007-02-06 |
AU2005262025B2 (en) | 2008-10-09 |
TWI305639B (en) | 2009-01-21 |
BRPI0512763A (pt) | 2008-04-08 |
RU2007104933A (ru) | 2008-08-20 |
WO2006005390A1 (en) | 2006-01-19 |
BRPI0512763B1 (pt) | 2018-08-28 |
KR20070027692A (ko) | 2007-03-09 |
CN1985303B (zh) | 2011-06-15 |
NO338725B1 (no) | 2016-10-10 |
RU2361185C2 (ru) | 2009-07-10 |
AU2005262025A1 (en) | 2006-01-19 |
CA2572989C (en) | 2011-08-09 |
JP4772043B2 (ja) | 2011-09-14 |
US20060009225A1 (en) | 2006-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
PT1774515E (pt) | Aparelho e processo para gerar um sinal de saída multicanal | |
US7394903B2 (en) | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal | |
KR101215872B1 (ko) | 송신되는 채널들에 기초한 큐들을 갖는 공간 오디오의파라메트릭 코딩 | |
RU2383939C2 (ru) | Компактная дополнительная информация для параметрического кодирования пространственного звука | |
NO344091B1 (no) | Kompatibel flerkanal-koding/dekoding. | |
BRPI0812669B1 (pt) | método e processador de áudio para gerar um sinal estéreo com qualidade perceptual | |
BRPI0518507B1 (pt) | Informações auxiliares compactas para a codificação paramétrica de áudio espacial |