BR112019005983B1 - Método de processamento de sinal de áudio de multicanais, codificador, decodificador e sistema de codificação e decodificação - Google Patents
Método de processamento de sinal de áudio de multicanais, codificador, decodificador e sistema de codificação e decodificação Download PDFInfo
- Publication number
- BR112019005983B1 BR112019005983B1 BR112019005983-0A BR112019005983A BR112019005983B1 BR 112019005983 B1 BR112019005983 B1 BR 112019005983B1 BR 112019005983 A BR112019005983 A BR 112019005983A BR 112019005983 B1 BR112019005983 B1 BR 112019005983B1
- Authority
- BR
- Brazil
- Prior art keywords
- frame
- nth frame
- stereo parameter
- parameter set
- nth
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 254
- 238000003672 processing method Methods 0.000 title claims description 10
- 238000001514 detection method Methods 0.000 claims abstract description 73
- 238000000034 method Methods 0.000 claims abstract description 53
- 238000012545 processing Methods 0.000 claims abstract description 13
- 208000029523 Interstitial Lung disease Diseases 0.000 claims description 94
- 208000024875 Infantile dystonia-parkinsonism Diseases 0.000 claims description 63
- 208000001543 infantile parkinsonism-dystonia Diseases 0.000 claims description 63
- 238000013139 quantization Methods 0.000 claims description 28
- 230000009467 reduction Effects 0.000 claims description 15
- 230000014509 gene expression Effects 0.000 claims description 8
- 238000003780 insertion Methods 0.000 claims description 5
- 230000037431 insertion Effects 0.000 claims description 5
- 238000004891 communication Methods 0.000 abstract description 24
- 238000005516 engineering process Methods 0.000 abstract description 5
- 230000006835 compression Effects 0.000 description 14
- 238000007906 compression Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Abstract
A presente invenção proporciona um método, um aparelho e um sistema de processamento de sinal de áudio de multicanais e refere-se ao campo das tecnologias de codificação e decodificação de áudio, para resolver um problema na técnica anterior que um sinal de áudio não pode ser transmitido, descontinuamente, em um sistema de comunicação de áudio de multicanais. Um codificador inclui uma unidade de detecção de sinal e uma unidade de codificação de sinal.A unidade de codificação de sinal é configurada para: quando a unidade de detecção de sinal detecta que um sinal downmixed de Enésimo quadro inclui um sinal de voz, codificar o sinal downmixed de Enésimo quadro; ou quando a unidade de detecção de sinal detecta que o sinal downmixed de Enésimo quadro não inclui um sinal de voz; codificar o sinal downmixed de Enésimo quadro, se a unidade de detecção de sinal determina que o sinal downmixed de Enésimo quadro satisfaz uma condição de codificação de quadro de áudio predefinido, ou saltar a codificação do sinal downmixed de Enésimo quadro, se a unidade de detecção de sinal determina que o sinal downmixed de Enésimo quadro não satisfaz uma condição de codificação de quadro de áudio predefinido.(...).
Description
[001] A presente invenção refere-se ao campo das tecnologias de codificação e decodificação e, em particular, a um método, a um aparelho e a um sistema de processamento de sinal de áudio de multicanais.
[002] Durante a comunicação de áudio, para aumentar a capacidade de um sistema de comunicações, geralmente, uma extremidade de transmissão primeiro codifica cada quadro do sinal de áudio original a ser transmitido e depois transmite o sinal de áudio. O sinal de áudio é comprimido por meio de codificação. Depois de receber o sinal, uma extremidade de recepção decodifica o sinal recebido e restaura o sinal de áudio original. Para implementar a compactação máxima em um sinal de áudio, diferentes tipos de modos de codificação são usados para diferentes tipos de sinais de áudio. Na técnica anterior, quando um sinal de áudio é um sinal de fala, geralmente é usada uma maneira de codificação contínua, isto é, cada quadro de sinal de fala é codificado; quando um sinal de áudio é um sinal de ruído, uma maneira de codificação descontínua é geralmente usada para codificar o sinal de ruído, isto é, um quadro de sinal de ruído é codificado a cada vários quadros de sinais de ruído. Por exemplo, um sinal de ruído é codificado a cada seis quadros. Depois que o primeiro quadro de sinal de ruído é codificado, o segundo quadro de sinal de ruído para o sétimo quadro de sinal de ruído não é codificado, e o oitavo quadro de sinal de ruído é codificado. O segundo quadro para o sétimo quadro são seis quadros No_Data. Especificamente, o sinal de áudio é um sinal de áudio mono.
[003] Com o desenvolvimento de tecnologias de comunicações de áudio, um sistema de comunicações de áudio ainda tem uma maneira especial de comunicação: comunicação estéreo. A comunicação estéreo é comunicação dual channel e é usada como um exemplo. Os dois canais incluem um primeiro canal e um segundo canal. Uma extremidade de transmissão obtém, de acordo com um sinal de fala de nésimo quadro no primeiro canal e um sinal de fala de nésimo quadro no segundo canal, um parâmetro estéreo usado para misturar o sinal de fala de nésimo quadro no primeiro canal e no nésimo quadro sinal de fala no segundo canal em um quadro de sinal downmixed, onde o sinal downmixed é um sinal mono. Então, a extremidade de transmissão mistura os sinais de fala de nésimo quadro nos dois canais em um quadro de sinal downmixed, onde n é um número inteiro positivo maior do que 0, codifica o quadro de sinal downmixed e, finalmente, envia o sinal codificado downmixed e o parâmetro estéreo para uma extremidade de recepção. Depois de receber o sinal codificado downmixed e o parâmetro estéreo, a extremidade de recepção decodifica o sinal codificado downmixed e restaura o sinal downmixed para um sinal de canal duplo de acordo com o parâmetro estéreo. Comparado com uma maneira de transmissão na qual cada quadro de sinal de fala nos dois canais é codificado, nesta maneira de transmissão, uma quantidade de bits transmitidos é grandemente reduzida, implementando compressão.
[004] No entanto, quando um sinal de ruído é transmitido durante a comunicação estéreo, se uma mesma maneira de codificação é usada como para um sinal de fala, e uma maneira de codificação descontínua usada em mono é diretamente aplicada à comunicação estéreo, a extremidade de recepção não pode restaurar o sinal de ruído, levando a uma experiência subjetiva ruim de um usuário da extremidade de recebimento.
[005] A presente invenção fornece um método, um aparelho e um sistema de processamento de sinal de áudio de multicanais, para resolver um problema na técnica anterior de que um sinal de áudio não pode ser transmitido de forma descontínua em um sistema de comunicação de áudio multicanais.
[006] De acordo com um primeiro aspecto, um método de processamento de sinal de áudio de multicanais é fornecido, incluindo: detectar, por meio de um codificador, se um sinal downmixed de Nésimo quadro inclui um sinal de fala; e codificação do sinal downmixed de Nésimo quadro quando se detecta que o sinal downmixed de Nésimo quadro inclui o sinal de voz; ou quando detectando que o sinal downmixed de Nésimo quadro não inclui o sinal de fala: codificando o sinal downmixed de Nésimo quadro, se determinar que o sinal downmixed de Nésimo quadro satisfaz uma condição de codificação de quadro de áudio predefinida ou ignorando a codificação do sinal downmixed de Nésimo quadro se determinar que o sinal downmixed de Nésimo quadro não satisfaz uma condição de codificação de quadro de áudio predefinida, onde o sinal downmixed de Nésimo quadro é obtido após os sinais de áudio de Nésimo quadro em dois de múltiplos canais serem misturados com base em um primeiro algoritmo predeterminado, e N é um número inteiro positivo maior do que 0.
[007] O codificador codifica o sinal downmixed somente quando o sinal downmixed inclui o sinal de fala ou o sinal downmixed satisfaz a condição de codificação do quadro de áudio predefinido; caso contrário, o codificador não codifica o sinal downmixed, de modo que o codificador implemente a codificação descontínua no sinal downmixed, e a eficiência da compressão do sinal downmixed é melhorada.
[008] Deve-se notar que, nas modalidades da presente invenção, a condição de codificação de quadro de áudio predefinido inclui um sinal downmixed de quadro inicial. Ou seja, quando o sinal downmixed de primeiro quadro não inclui o sinal de fala, mas o sinal downmixed de primeiro quadro satisfaz a condição de codificação de quadro de áudio predefinida, o sinal downmixed de primeiro quadro é codificado.
[009] Baseado no primeiro aspecto, para melhorar a eficiência de compressão de sinal downmixed em maior extensão, opcionalmente, o codificador codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de quadro de voz pré-ajustada ao detectar que o sinal downmixed de Nésimo quadro inclui o sinal de fala; ou quando se detecta que o sinal downmixed de Nésimo quadro não inclui o sinal de voz: codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de quadro de voz pré-ajustada se determinar que o sinal downmixed de Nésimo quadro satisfaz uma condição de codificação predefinida codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação SID predefinida se determinar que o sinal downmixed de Nésimo quadro não satisfaz uma condição de codificação de quadro de voz predefinida, mas satisfaz uma condição de codificação SID predefinida, em que a taxa de codificação de SID é inferior à taxa de codificação do quadro de voz.
[0010] Deve ser entendido que durante a implementação específica, se for determinado que o sinal downmixed de Nésimo quadro não satisfaz a condição de codificação predefinida do quadro de voz, mas satisfaz a condição de codificação SID predefinida, a codificação SID é executada no sinal downmixed de Nésimo quadro de acordo com a taxa de codificação SID predefinida. Em comparação com a codificação do sinal de fala, isso melhora ainda mais a eficiência da compressão do sinal downmixed. Além disso, deve-se notar que, no primeiro aspecto e na solução técnica, para evitar que um decodificador não possa restaurar o sinal downmixed, um conjunto de parâmetros estéreos precisa ser codificado.
[0011] Com base no primeiro aspecto, para melhorar ainda mais a eficiência de compressão de um sistema de comunicações multicanais, opcionalmente, o codificador realiza a codificação descontínua em um conjunto de parâmetros estéreos. Especificamente, o codificador obtém um conjunto de parâmetros estéreo de Nésimo quadro de acordo com os sinais de áudio de Nésimo quadro; e codifica o conjunto de parâmetros estéreos de Nésimo quadro ao detectar que o sinal downmixed de Nésimo quadro inclui o sinal de fala; ou quando detectando que o sinal downmixed de Nésimo quadro não inclui o sinal de fala: se determinar que o conjunto de parâmetros estéreos de Nésimo quadro satisfaz uma condição de codificação de parâmetro estéreo predefinida, codifica pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro ou se determinar que o conjunto de parâmetros estéreo de Nésimo quadro não satisfaz uma condição de codificação de parâmetro estéreo predefinida, ignora a codificação do conjunto de parâmetros estéreo, onde o conjunto de parâmetros estéreo de Nésimo quadro inclui Z parâmetros estéreos, os Z parâmetros estéreos incluem um parâmetro que é usado quando o codificador mistura os sinais de áudio de Nésimo quadro com base em um algoritmo predeterminado, e Z é um número inteiro positivo maior do que 0.
[0012] Com base no primeiro aspecto, opcionalmente, para melhorar ainda mais a eficiência de compressão do sistema de comunicações multicanais, antes da codificação de pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro, o codificador obtém parâmetros estéreo alvo X de acordo com Z parâmetros estéreos no conjunto de parâmetros estéreos de Nésimo quadro com base em uma regra de redução de dimensão de parâmetro estéreo predefinida e codifica os parâmetros estéreos alvo X, em que X é um número inteiro positivo maior do que 0 e menor ou igual a Z.
[0013] A regra de redução de dimensão de parâmetro estéreo predefinida pode ser um tipo de parâmetro estéreo predefinido. Ou seja, os parâmetros estéreos alvo X que satisfazem o tipo de parâmetro estéreo predefinido são selecionados a partir do conjunto de parâmetros estéreos de Nésimo quadro. Como alternativa, a regra de redução de dimensão de parâmetros estéreo predefinida é uma quantidade predefinida de parâmetros estéreos. Ou seja, os parâmetros estéreos alvo X são selecionados do conjunto de parâmetros estéreos de Nésimo quadro. Como alternativa, a regra de redução de dimensão de parâmetro estéreo predefinida está reduzindo a resolução no domínio do tempo ou no domínio da frequência para pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro. Ou seja, os parâmetros estéreos alvo X são determinados com base nos Z parâmetros estéreos de acordo com a resolução reduzida do domínio do tempo ou do domínio da frequência de pelo menos um parâmetro estéreo.
[0014] Com base no primeiro aspecto, opcionalmente, o seguinte método pode ser usado ainda para melhorar a eficiência de compressão do sistema de comunicações multicanais:
[0015] ao detectar que os sinais de áudio de Nésimo quadro incluem o sinal de fala: o codificador obtém o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os sinais de áudio de Nésimo quadro baseados em uma primeira forma de geração de conjunto de parâmetros estéreo e codifica o conjunto de parâmetros estéreos de Nésimo quadro; ou ao detectar que os sinais de áudio de Nésimo quadro não incluem o sinal de fala: se determinar que os sinais de áudio de Nésimo quadro satisfazem a condição de codificação predefinida, o codificador obtém o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os sinais de áudio de Nésimo quadro com base em uma primeira forma de geração de conjunto de parâmetros estéreos e codifica o conjunto de parâmetros estéreos de Nésimo quadro; ou se a determinação de que os sinais de áudio de Nésimo quadro não satisfazem a condição de codificação de quadro de fala predefinida, o codificador obtém o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os sinais de áudio de Nésimo quadro baseados em uma segunda forma de geração de conjunto de parâmetros estéreos e codifica pelo menos um parâmetro estéreo no parâmetro estéreo de Nésimo quadro definido ao determinar que o conjunto de parâmetros estéreos de Nésimo quadro satisfaz uma condição de codificação de parâmetro estéreo predefinida ou o codificador não codifica o conjunto de parâmetros estéreos quando o conjunto de parâmetros estéreos de Nésimo quadro não satisfaz uma condição de codificação de parâmetros estéreos predefinida; onde
[0016] o primeiro modo de geração do conjunto de parâmetros estéreos e o segundo modo de geração do conjunto de parâmetros estéreos satisfazem pelo menos uma das seguintes condições:
[0017] - uma quantidade que é de tipos de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreos não é menor que uma quantidade que é dos tipos de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na segunda forma de geração de conjunto de parâmetros estéreos, uma quantidade que é de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreos não é menor que uma quantidade de parâmetros estéreos incluída em um parâmetro estéreo definido e estipulado na segunda forma de geração do conjunto de parâmetros estéreos, a resolução no domínio do tempo que é de um parâmetro estéreo e que é estipulado na primeira forma de geração do primeiro conjunto de parâmetros estéreos não é inferior à resolução no domínio do tempo que é de um parâmetro estéreo correspondente e que é estipulado na forma de geração de segundo conjunto de parâmetros estéreos ou resolução de domínio de frequência que é de um parâmetro estéreo e que é estipulado na maneira de geração de segundo conjunto de parâmetros estéreos.
[0018] Com base no primeiro aspecto, opcionalmente, quando o sinal downmixed de Nésimo quadro inclui o sinal de fala, o codificador codifica o conjunto de parâmetros estéreos Nésimo quadro de acordo com uma primeira maneira de codificação; e quando o sinal downmixed de Nésimo quadro satisfaz a condição de codificação do quadro de voz, o codificador codifica pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro de acordo com a primeira forma de codificação; ou quando o sinal downmixed de Nésimo quadro não satisfaz a condição de codificação de quadro de voz, o codificador codifica o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro de acordo com uma segunda maneira de codificação; onde
[0019] uma taxa de codificação estipulada na primeira maneira de codificação não é menor do que uma taxa de codificação estipulada na segunda maneira de codificação; e / ou para qualquer parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro a precisão de quantização estipulada na primeira maneira de codificação não é inferior à precisão de quantização estipulada na segunda maneira de codificação.
[0020] Por exemplo, o conjunto de parâmetros estéreos de Nésimo quadro inclui um IPD e um ITD. A precisão de quantização IPD estipulada na primeira maneira de codificação não é inferior à precisão de quantização IPD estipulada na segunda maneira de codificação, e a precisão de quantização ITD estipulada na primeira maneira de codificação não é inferior à precisão de quantização ITD estipulada na segunda maneira de codificação.
[0021] Baseado no primeiro aspecto, opcionalmente, geralmente, se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro inclui uma ILD de diferença de nível entre canais, a condição de codificação de parâmetro estéreo predefinida includes DL - Do,
[0022] Onde D representa um grau pelo qual o ILD se desvia de um primeiro padrão, o primeiro padrão é determinado com base em um segundo algoritmo predeterminado de acordo com os conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Nésimo quadro e T é um número inteiro positivo maior do que 0;
[0023] se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro incluir uma diferença de tempo entre canais ITD, a condição de codificação de parâmetro estéreo predefinida inclui D- D,
[0024] onde D representa um grau pelo qual a ITD se desvia de um segundo padrão, o segundo padrão é determinado com base em um terceiro algoritmo predeterminado de acordo com conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Nésimo quadro e T é um número inteiro positivo maior do que 0; ou
[0025] se pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro incluir uma IPD de diferença de fase entre canais, a condição de codificação de parâmetro estéreo predefinida inclui D- D
[0026] onde D representa um grau pelo qual a IPD se desvia de um terceiro padrão, o terceiro padrão é determinado com base em um quarto algoritmo predeterminado de acordo com os conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Nésimo quadro e T é um número inteiro positivo maior do que 0.
[0027] O segundo algoritmo, o terceiro algoritmo e o quarto algoritmo precisam ser pré-ajustados de acordo com uma situação real.
[0028] Opcionalmente, D , D e D respectivamente, satisfazem as seguintes expressões:
[0029] Onde ILD(m) é uma diferença de nível gerada quando os sinais de áudio de Nésimo quadro são transmitidos, respectivamente nos dois canais em uma mésima banda de subfrequências. M é uma quantidade total de banda de subfrequências ocupada para transmissão dos sinais de áudio de Nésimo quadro, é um valor médio de ILDs nos conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Nésimo quadro, ITD[-t] é uma diferença de tempo gerada quando os sinais de áudio de Nésimo quadro, precedendo os sinais de áudio de Nésimo quadro são transmitidos, respectivamente nos dois canais, IPD(m) [e uma diferença de fase gerada quando alguns dos sinais de áudio de Nésimo quadro são transmitidos, respectivamente, nos dois canais na mésima banda de subfrequências.
[0030] De acordo com um segundo aspecto, é fornecido um método de processamento de sinais de áudio multicanal, incluindo: recepção, por um decodificador, de um fluxo de bits, em que o fluxo de bits inclui pelo menos dois quadros, pelo menos dois quadros incluem pelo menos um quadro de primeiro tipo e pelo menos um quadro de segundo tipo, o quadro do primeiro tipo inclui um sinal downmixed, e o quadro do segundo tipo não inclui um sinal downmixed; e para um fluxo de bits Nésimo quadro, onde N é um número inteiro positivo maior do que 1, decodificação, pelo decodificador, fluxo de bits de Nésimo quadro se determinar que o fluxo de bits de Nésimo quadro é o primeiro tipo para obter um sinal downmixed de Nésimo quadro; ou se determinar que o fluxo de bits de Nésimo quadro é o segundo tipo de quadro, determinando, pelo decodificador de acordo com uma primeira regra predefinida, sinais downmixed de mésimo quadro em pelo menos um sinal downmixed de Nésimo quadro, e obtenção do sinal downmixed de Nésimo quadro de acordo com os sinais downmixed de mésimo quadro com base em um primeiro algoritmo predeterminado, onde m é um número inteiro positivo maior do que 0, e o sinal downmixed de Nésimo quadro é obtido por um codificador através de mistura de sinais em dois de múltiplos canais com base em um segundo algoritmo predeterminado.
[0031] O fluxo de bits recebido pelo decodificador inclui o quadro de primeiro tipo e o quadro de segundo tipo, o quadro de primeiro tipo inclui o sinal de downmixed e o quadro de segundo tipo não inclui o sinal de downmixed. Ou seja, o codificador não codifica cada quadro do sinal downmixed. Portanto, a transmissão descontínua no sinal downmixed é implementada, e a eficiência de compressão de sinal downmixed de um sistema de comunicações de áudio multicanais é melhorada.
[0032] Deve-se notar que, nas modalidades da presente invenção, o fluxo de bits do primeiro quadro é o quadro do primeiro tipo. Especificamente, para restaurar o sinal downmixed obtido para os sinais de áudio nos dois canais após a decodificação do fluxo de bits do primeiro quadro, o fluxo de bits do primeiro quadro precisa ainda incluir um conjunto de parâmetros estéreos. Especificamente, porque o quadro de primeiro tipo inclui o sinal downmixed e o quadro de segundo tipo não inclui o sinal downmixed, um tamanho do quadro de primeiro tipo é maior que um tamanho do quadro de segundo tipo. O decodificador pode determinar, de acordo com um tamanho do fluxo de bits do Nésimo quadro, se o fluxo de bits do Nésimo quadro é do primeiro tipo ou do segundo tipo. Além disso, um bit de sinalizador pode ser ainda mais encapsulado no fluxo de bits do Nésimo quadro. O decodificador decodifica parcialmente o fluxo de bits do Nésimo quadro, para obter o bit de sinalização. Se o bit de sinalizador indicar que o fluxo de bits do Nésimo quadro é o quadro de primeiro tipo, o decodificador decodificará o fluxo de bits de Nésimo quadro, para obter o sinal de down-mix do Nésimo quadro. Se o bit de sinalizador indicar que o fluxo de bits de Nésimo quadro é o quadro do segundo tipo, o decodificador obtém o sinal downmixed de Nésimo quadro de acordo com o primeiro algoritmo predeterminado.
[0033] Baseado no segundo aspecto, para restaurar o sinal downmixed para sinais de áudio nos dois canais e assegurar a qualidade de comunicação dos sinais de áudio, opcionalmente, o quadro de primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, e o quadro do segundo tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed; e, ao determinar que o fluxo de bits do Nésimo quadro é do primeiro tipo, após decodificar o fluxo de bits, o decodificador obtém o sinal downmixed de Nésimo quadro e um conjunto de parâmetros estéreos de Nésimo quadro e restaura o sinal para os sinais de áudio de Nésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos com Nésimo quadro baseado em um terceiro algoritmo predeterminado; ou se determinar que o fluxo de bits de Nésimo quadro é o quadro do segundo tipo, o decodificador decodifica o fluxo de bits de Nésimo quadro, para obter um conjunto de parâmetros estéreos de Nésimo quadro e obtém o sinal downmixed de Nésimo quadro com base no primeiro algoritmo predeterminado. Em seguida, o decodificador restaura o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base no terceiro algoritmo predeterminado.
[0034] Baseado no segundo aspecto, para restaurar o sinal downmixed para os sinais de áudio nos dois canais e assegurar a qualidade de comunicação, opcionalmente, o quadro de primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, e o quadro de segundo tipo não inclui nem um sinal downmixed nem um conjunto de parâmetros estéreos; e, se determinar que o fluxo de bits de Nésimo quadro é do primeiro tipo, o decodificador decodificará o fluxo de bits de Nésimo quadro, para obter o sinal de mixagem de Nésimo quadro e um conjunto de parâmetros estéreos de Nésimo quadro. sinal downmixed para os sinais de áudio de Nésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro baseado em um terceiro algoritmo; ou se determinar que o fluxo de bits do Nésimo quadro é o quadro de segundo tipo, o decodificador obtém o sinal downmixed de Nésimo quadro baseado no primeiro algoritmo predeterminado, determina, de acordo com uma segunda regra pré-definida, conjunto de parâmetros estéreos de quadro único precedendo um conjunto de parâmetros estéreos de Nésimo quadro, obtém o conjunto de parâmetros estéreos de de Nésimo quadro, de acordo com os conjuntos de parâmetros estéreos de quadro K com base em um quarto algoritmo predeterminado e restaura o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com pelo menos um conjunto de parâmetros estéreos de Nésimo quadro baseado em um terceiro algoritmo, em que k é um número inteiro positivo maior do que 0.
[0035] Baseado no segundo aspecto, para restaurar o sinal downmixed para os sinais de áudio nos dois canais e assegurar a qualidade de comunicação dos sinais de áudio, opcionalmente, o quadro de primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, um quadro de terceiro tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed, um quadro do quarto tipo não inclui um sinal downmixed nem um conjunto de parâmetros estéreos e cada um dos quadros de terceiro tipo e quarto tipo é um caso do quadro do segundo tipo; e
[0036] se determinar que o fluxo de bits da Nésimo quadro é do primeiro tipo, o decodificador decodificará o fluxo de bits do Nésimo quadro, para obter o sinal de downmixed de Nésimo quadro e um conjunto de parâmetros estéreos de Nésimo quadro e restaura para os sinais de áudio de Nésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base em um terceiro algoritmo; ou
[0037] se o decodificador determinar que o fluxo de bits do Nésimo quadro é um quadro do segundo tipo, os dois casos a seguir serão incluídos:
[0038] ao determinar que o fluxo de bits da Nésimo quadro é um quadro do terceiro tipo, o decodificador decodifica o fluxo de bits do Nésimo quadro, obtém um conjunto de parâmetros estéreos de Nésimo quadro, obtém o sinal downmixed de Nésimo quadro baseado no primeiro algoritmo predeterminado e restaura o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro baseado em um terceiro algoritmo; ou
[0039] quando o quadro de bits do Nésimo quadro é um quadro do quarto tipo, o decodificador determina, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de quadro único precedendo um conjunto de parâmetros estéreos de Nésimo quadro, obtém o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k baseado em um quarto algoritmo predeterminado, onde k é um número inteiro positivo maior do que 0, obtém o sinal de downmixed de Nésimo quadro baseado no primeiro algoritmo predeterminado, e restaura o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base em um terceiro algoritmo.
[0040] Baseado no segundo aspecto, para restaurar o sinal downmixed para os sinais de áudio nos dois canais e assegurar a qualidade de comunicação dos sinais de áudio, opcionalmente, um quadro do tipo quinto inclui um sinal downmixed e um conjunto de parâmetros estéreos, um quadro do sexto tipo inclui um sinal downmixed mas não inclui um conjunto de parâmetros estéreos, cada um dos quadros do tipo quinto e do sexto tipo é um caso do quadro do primeiro tipo, e o quadro do segundo tipo não inclui nem um sinal downmixed nem um conjunto de parâmetros estéreos; e
[0041] - se o decodificador determinar que o fluxo de bits de Nésimo quadro é do primeiro tipo, os dois casos a seguir serão incluídos:
[0042] - quando o fluxo de bits da Nésimo quadro é do quinto tipo, o decodificador decodifica o fluxo de bits da Nésimo quadro, para obter o sinal de downmixed de Nésimo quadro e um conjunto de parâmetros estéreos de Nésimo quadro e restaura o sinal downmixed de Nésimo quadro para sinais de áudio de Nésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base em um terceiro algoritmo; ou
[0043] - quando o fluxo de bits de Nésimo quadro é o quadro do sexto tipo, o decodificador decodifica o fluxo de bits de conjuntos de parâmetros estéreos de Nésimo quadro para determinar o sinal downmixed de Nésimo quadro, determina, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros precedendo um conjunto de parâmetros estéreos de Nésimo quadro, obtém o conjunto de parâmetros estéreo de Nésimo quadro definido de acordo com os conjuntos de parâmetros estéreos de quadro k baseados em um quarto algoritmo predeterminado e restaura o sinal downmixed de Nésimo quadro para os sinais de áudio de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base em um terceiro algoritmo; ou
[0044] - se o fluxo de bits de Nésimo quadro for do segundo tipo, o decodificador obterá o sinal downmixed do Nésimo quadro com base no primeiro algoritmo predeterminado, determina, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de quadro único que precede um conjunto de parâmetros estéreos de Nésimo quadro, obtém o conjunto de parâmetros estéreo Nésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado e restaura o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base em um terceiro algoritmo.
[0045] Baseado no segundo aspecto, para restaurar o sinal downmixed para os sinais de áudio nos dois canais e assegurar a qualidade de comunicação dos sinais de áudio, opcionalmente, um quadro do quinto tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, um quadro do sexto tipo inclui um sinal downmixed, mas não inclui um conjunto de parâmetros estéreos, cada quadro do quinto tipo e do quadro do sexto tipo é um caso do quadro de primeiro tipo, um quadro de terceiro tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed, um quadro de quarto tipo não inclui nem um sinal de downmixed nem um conjunto de parâmetros estéreo, e cada um dos quadros de terceiro tipo e de quarto tipo é um caso do quadro de segundo tipo; e
[0046] - se o decodificador determinar que o fluxo de bits de Nésimo quadro é do primeiro tipo, os dois casos a seguir serão incluídos:
[0047] - quando o fluxo de bits do Nésimo quadro é de quadro do quinto tipo, após decodificar o fluxo de bits de Nésimo quadro, o decodificador obtém o sinal downmixed de Nésimo quadro e um conjunto de parâmetros estéreos de Nésimo quadro e restaura o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base em um terceiro algoritmo; ou
[0048] - quando o fluxo de bits de Nésimo quadro é de um quadro do sexto tipo, após decodificar o fluxo de bits de Nésimo quadro, o decodificador obtém o sinal downmixed de Nésimo quadro, determina, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de quadro único precedendo um conjunto de parâmetros estéreos de Nésimo quadro, obtém o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado e restaura o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro, de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base em um terceiro algoritmo; ou
[0049] - se o decodificador determinar que o fluxo de bits de Nésimo quadro é um quadro do segundo tipo, os dois casos a seguir serão incluídos:
[0050] - quando o fluxo de bits de Nésimo quadro é um quadro do terceiro tipo, o decodificador decodifica o fluxo de bits de Nésimo quadro, obtém um conjunto de parâmetros estéreos de Nésimo quadro, obtém o sinal de downmixed de Nésimo quadro baseado no primeiro algoritmo predeterminado e restaura o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro, de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base em um terceiro algoritmo; ou
[0051] - quando o quadro de bits de Nésimo quadro é o quadro do quarto tipo, o decodificador determina, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de quadro único precedido por um conjunto de parâmetros estéreos de Nésimo quadro, obtém o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado, onde k é um número inteiro positivo maior do que 0, obtém o sinal downmixed de Nésimo quadro baseado no primeiro algoritmo predeterminado e restaura o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base em um terceiro algoritmo.
[0052] De acordo com um terceiro aspecto, é fornecido um codificador, incluindo: uma unidade de detecção de sinal e uma unidade de codificação de sinal. A unidade de detecção de sinal é configurada para detectar se um sinal downmixed de Nésimo quadro inclui um sinal de fala, onde o sinal downmixed de Nésimo quadro é obtido após os sinais de áudio de Nésimo quadro em dois de múltiplos canais serem misturados com base em um primeiro algoritmo predeterminado. N é um número inteiro positivo maior do que 0. A unidade de codificação de sinal é configurada para: codificar o sinal downmixed de Nésimo quadro quando a unidade de detecção de sinal detecta que o sinal downmixed de Nésimo quadro inclui o sinal de fala; ou quando a unidade de detecção de sinal detecta que o sinal downmixed de Nésimo quadro não inclui o sinal de voz: codificar o sinal downmixed de Nésimo quadro, se a unidade de detecção de sinal determinar que o sinal downmixed de Nésimo quadro satisfaz uma condição de codificação de quadro de áudio predefinida ou ignorar a codificação do sinal downmixed de Nésimo quadro, se a unidade de detecção de sinal determinar que o sinal down-mix de Nésimo quadro não satisfaz uma condição de codificação de quadro de áudio predefinida.
[0053] Baseado no terceiro aspecto, opcionalmente, a unidade de codificação de sinal inclui uma primeira unidade de codificação de sinal e uma segunda unidade de codificação de sinal. Quando a unidade de deteco de sinal detecta que o sinal downmixed inclui o sinal de voz, a unidade de detecção de sinal instrui a primeira unidade de codificação de sinal a codificar o sinal downmixed de Nésimo quadro. Em alternativa, se for determinado que o sinal downmixed de Nésimo quadro satisfaz uma condição de codificação de quadro de voz predefinida, a unidade de detecção de sinal instrui a primeira unidade de codificação de sinal para codificar o sinal downmixed de Nésimo quadro. Especificamente, a primeira unidade de codificação de sinal codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de quadro de voz pré-ajustada. Se determinar que o sinal downmixed de Nésimo quadro não satisfaz uma condição de codificação de quadro de voz pré-ajustada, mas satisfaz uma condição de codificação de quadro SID de descritor de inserção de silêncio predefinido, a unidade de detecção de sinal instrui a segunda unidade de codificação de sinal para codificar o sinal downmixed de Nésimo quadro. Especificamente, a segunda unidade de codificação de sinal codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de SID predefinida, em que a taxa de codificação de SID não é maior do que a taxa de codificação de quadro de voz.
[0054] Com base no terceiro aspecto, opcionalmente, o codificador inclui ainda uma unidade de geração de parâmetros, uma unidade de codificação de parâmetros e uma unidade de detecção de parâmetros. A unidade de geração de parâmetros é configurada para obter um conjunto de parâmetros estéreos de Nésimo quadro de acordo com os sinais de áudio de Nésimo quadro, onde o conjunto de parâmetros estéreos de Nésimo quadro inclui Z parâmetros estéreos, os Z parâmetros estéreos incluem um parâmetro usado quando o codificador mistura os sinais de áudio de Nésimo quadro com base no primeiro algoritmo predeterminado e Z é um número inteiro positivo maior do que 0. A unidade de codificação de parâmetros é configurada para: codificar o conjunto de parâmetros estéreos de Nésimo quadro quando a unidade de detecção de sinal detecta que o sinal downmixed de Nésimo quadro inclui o sinal de fala; ou quando a unidade de detecção de sinal detecta que o sinal downmixed de Nésimo quadro não inclui o sinal de fala, codifique pelo menos um parâmetro estéreo no parâmetro estéreo de Nésimo quadro, se a unidade de detecção de parâmetro determinar que o parâmetro estéreo Nésimo quadro satisfaz uma condição de codificação de parâmetro estéreo predefinida ou ignorar a codificação do conjunto de parâmetros estéreos, se a unidade de detecção de parâmetro determinar que o conjunto de parâmetros estéreos de Nésimo quadro não satisfaz uma condição de codificação de parâmetro estéreo predefinida.
[0055] Com base no terceiro aspecto, opcionalmente, a unidade de codificação de parâmetros é configurada para: obter X parâmetros estéreos alvo de acordo com os Z parâmetros estéreos no conjunto de parâmetros estéreos de Nésimo quadro com base em uma regra de redução de dimensão de parâmetro estéreo predefinida e codificar os parâmetros estéreos alvo X, em que X é um número inteiro positivo maior do que 0 e menor ou igual a Z.
[0056] Com base no terceiro aspecto, opcionalmente, a unidade de geração de parâmetros inclui uma primeira unidade de geração de parâmetros e uma segunda unidade de geração de parâmetros, onde
[0057] quando a unidade de detecção de sinal detecta que os sinais de áudio de Nésimo quadro incluem o sinal de voz, ou quando a unidade de detecção de sinal detecta que os sinais de áudio de Nésimo não incluem o sinal de voz e os sinais de áudio de Nésimo quadro satisfazem a condição de codificação de quadro de voz predefinida, a unidade de detecção de sinal instrui a primeira unidade de geração de parâmetros a gerar um conjunto de parâmetros estéreos de Nésimo quadro; especificamente, a primeira unidade de geração parâmetros obtém o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os sinais de áudio de Nésimo baseado em um primeiro modo de geração de conjunto de parâmetros estéreos, e a unidade de codificação de parâmetros estéreos codifica o conjunto de parâmetros estéreos de Nésimo quadro; especificamente, quando a unidade de codificação de parâmetros inclui uma primeira unidade de codificação de parâmetros e uma segunda unidade de codificação de parâmetros, a primeira unidade de codificação de parâmetros codifica o conjunto de parâmetros estéreos de Nésimo quadro, em que uma forma de codificação estipulada pela primeira unidade de codificação de parâmetros é uma primeira forma de codificação, uma maneira de codificação estipulada pela segunda unidade de codificação de parâmetros é uma segunda maneira de codificação; especificamente, uma taxa de codificação estipulada na primeira maneira de codificação não é menor do que uma taxa de codificação estipulada na segunda maneira de codificação; e / ou, para qualquer parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro, a precisão de quantização estipulada na primeira maneira de codificação não é inferior à precisão de quantização estipulada na segunda maneira de codificação; e
[0058] quando a unidade de detecção de sinal detecta que os sinais de áudio de Nésimo quadro não incluem o sinal de fala: a segunda unidade de geração de parâmetros obtém o parâmetro estéreo Nésimo quadro de acordo com os sinais de áudio de Nésimo quadro com base em uma segunda maneira de geração de conjunto de parâmetros estéreos de Nésimo quadro, e quando a unidade de detecção de parâmetro determina que o conjunto de parâmetros estéreos de Nésimo quadro satisfaz uma condição de codificação de parâmetros estéreos predefinida, a unidade de codificação de parâmetro codifica pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro e, especificamente, quando a unidade de codificação de parâmetros inclui a primeira unidade de codificação de parâmetros e a segunda unidade de codificação de parâmetros, a segunda unidade de codificação de parâmetros codifica o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro; ou
[0059] a unidade de codificação de parâmetros ignora a codificação do conjunto de parâmetros estéreos quando a unidade de detecção de parâmetros determina que o conjunto de parâmetros estéreos de Nésimo quadro não satisfaz uma condição de codificação de parâmetros estéreos predefinida; e
[0060] o primeiro modo de geração do conjunto de parâmetros estéreos e o segundo modo de geração do conjunto de parâmetros estéreos satisfazem pelo menos uma das seguintes condições:
[0061] uma quantidade que é de tipos de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreos não é menor que uma quantidade que é dos tipos de parâmetros estéreoss incluídos em um conjunto de parâmetros estéreo e que é estipulado na segunda forma de geração de conjunto de parâmetros estéreo, uma quantidade que é de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreos não é menor que uma quantidade de parâmetros estéreos incluída em um parâmetro estéreo definido e estipulado na segunda forma de geração do conjunto de parâmetros estéreos, a resolução no domínio do tempo que é de um parâmetro estéreo e que é estipulado na primeira forma de geração do conjunto de parâmetros estéreos não é inferior à resolução no domínio de tempo que é de um parâmetro estéreo correspondente e que é estipulado na segunda forma de geração de conjunto de parâmetros estéreos, ou resolução de domínio de frequência que é de um parâmetro estéreo e que é estipulado na primeira forma de geração do conjunto de parâmetros estéreos não é inferior à resolução de domínio de frequência que é de um parâmetro estéreo correspondente e que é estipulado na segunda forma de geração do conjunto de parâmetros estéreos.
[0062] Baseado no terceiro aspecto, opcionalmente, a unidade de codificação de parâmetros inclui uma primeira unidade de codificação de parâmetros e uma segunda unidade de codificação de parâmetros. Especificamente, a primeira unidade de codificação de parâmetros é configurada para codificar o conjunto de parâmetros estéreos de Nésimo quadro de acordo com uma primeira forma de codificação quando o sinal downmixed de Nésimo quadro inclui o sinal de voz e quando o sinal downmixed de Nésimo quadro não inclui o sinal de voz, mas satisfaz a condição de codificação do quadro de voz; e a segunda unidade de codificação de parâmetros é configurada para codificar pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro de acordo com uma segunda maneira de codificação quando o sinal downmixed de Nésimo quadro não satisfaz a condição de codificação de quadro de voz, onde
[0063] - uma taxa de codificação estipulada na primeira maneira de codificação não é menor do que uma taxa de codificação estipulada na segunda maneira de codificação; e / ou para qualquer parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro, a precisão de quantização estipulada na primeira maneira de codificação não é inferior à precisão de quantização estipulada na segunda maneira de codificação.
[0064] Baseado no terceiro aspecto, opcionalmente, se o pelo me nos um parâmetro estéreo no conjunto de parâmetros estéreo de Nésimo quadro incluir uma ILD de diferença de nível entre canais, a condição de codificação de parâmetro estéreo predefinida inclui DL ≥ Do ,
[0065] Onde D representa um grau pelo qual o ILD se desvia de um primeiro padrão, o primeiro padrão é determinado com base em um segundo algoritmo predeterminado de acordo com conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Nésimo quadro e T é um número inteiro positivo maior do que 0;
[0066] se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro incluir uma diferença de tempo entre canais ITD, a condição de codificação de parâmetro estéreo predefinida inclui D ≥D,
[0067] - onde D representa um grau pelo qual o ITD se desvia de um segundo padrão, o segundo padrão é determinado com base em um terceiro algoritmo predeterminado de acordo com conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Nésimo quadro e T é um número inteiro positivo maior do que 0; ou
[0068] - Se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro incluir uma IPD de diferença de fase entre canais, a condição de codificação de parâmetro estéreo predefinida inclui D≥ D,
[0069] - onde D representa um grau pelo qual o IPD se desvia de um terceiro padrão, o terceiro padrão é determinado com base em um quarto algoritmo predeterminado de acordo com os conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Nésimo quadro e T é um número inteiro positivo maior do que 0.
[0070] Baseado no terceiro aspecto, opcionalmente, D , D e D respectivamente, satisfazem as seguintes expressões:
[0071] onde ILD(m) é uma diferença de nível gerada quando os sinais de áudio de Nésimo quadro são transmitidos, respectivamente, nos dois canais em uma mésima banda de subfrequências, M é uma quantidade total de sub bandas de frequências ocupadas para 1T transmissão dos sinais de áudio de Nésimo quadro, é um valor médio de ILDs nos conjuntos de parâmetros estéreos de Nésimo quadro precedendo o conjunto de parâmetros estéreos de Nésimo quadro na mésima sub banda de frequências, T é um interior positivo maior do que 0, iLD[-t](m) é uma diferença de nível gerada quando os sinais de áudio de quadro-t que precedem os sinais de áudio de Nésimo quadro são transmitidos respectivamente nos dois canais na mésima banda de subfrequências, o ITD é uma diferença de tempo gerada quando os sinais de áudio de Nésimo quadro são transmitidos respectivamente nos dois canais, é um valor médio de ITDs nos conjuntos de parâmetros estéreos de quadro T que precedem o conjunto de parâmetros estéreos de Nésimo iTD[-t], é uma diferença de tempo gerada quando os sinais de áudio de quadro t que precedem os sinais de áudio de Nésimo quadro são transmitidos respectivamente nos 1T dois canais, é uma diferença de fase gerada quando alguns dos sinais de áudio Nésimo quadro são transmitidos respectivamente nos dois canais na mésima sub-banda de frequências, é um valor médio de IPDs nos conjuntos de parâmetros estéreos quadro T que precedem o conjunto d e parâmetros estéreos de Nésimo quadro ajustado na mésima sub-banda de frequências, e é uma diferença de fase gerada quando os sinais de áudio de quadro T precedendo os sinais de áudio de Nésimo quadro são transmitidos respectivamente nos dois canais da mésima sub banda de frequências
[0072] De acordo com um quarto aspecto, é fornecido um decodificador, incluindo: uma unidade receptora e uma unidade de decodificação. A unidade receptora é configurada para receber um fluxo de bits, onde o fluxo de bits inclui pelo menos dois quadros, os pelo menos dois quadros incluem pelo menos um quadro de primeiro tipo e pelo menos um quadro de segundo tipo, o quadro de primeiro tipo inclui um sinal downmixed e o quadro do segundo tipo não inclui um sinal downmixed; e a unidade de decodificação é configurada para: um fluxo de bits de Nésimo quadro, onde N é um número inteiro positivo maior do que 1, decodificar o fluxo de bits de Nésimo quadro, se for determinado que o fluxo de bits do Nésimo quadro é um sinal downmixed de Nésimo quadro; ou se for determinado que o fluxo de bits de Nésimo quadro é do segundo tipo, determinar, de acordo com uma primeira regra predefinida, sinais downmixed em quadro-m em pelo menos um sinal downmixed de quadro anterior e obtenha o sinal downmixed de Nésimo quadro de acordo com os sinais downmixed de quadro m baseado em um primeiro algoritmo predeterminado, onde m é um número inteiro positivo maior do que 0, e
[0073] o sinal downmixed de Nésimo quadro é obtido por um codificador misturando sinais de áudio de Nésimo quadro em dois de múltiplos canais com base em um segundo algoritmo predeterminado.
[0074] Com base no quarto aspecto, opcionalmente, o quadro de primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, e o quadro de segundo tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed;
[0075] a unidade de decodificação é ainda configurada para: se for determinado que o fluxo de bits do Nésimo quadro é o primeiro tipo de quadro, decodificar o fluxo de bits de Nésimo quadro, para obter tanto o sinal downmixed de Nésimo quadro quanto um conjunto de parâmetros estéreos de Nésimo quadro; ou se for determinado que o fluxo de bits de Nésimo quadro é do segundo tipo, decodificar o fluxo de bits de Nésimo quadro para obter um conjunto de parâmetros estéreos de Nésimo quadro, onde pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro é utilizado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base em um terceiro algoritmo predeterminado; e
[0076] - uma unidade de restauração de sinal é configurada para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro baseado no terceiro algoritmo.
[0077] Com base no quarto aspecto, opcionalmente, o quadro do primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, e o quadro de segundo tipo não inclui nem um sinal downmixed nem um conjunto de parâmetros estéreos:
[0078] - a unidade de decodificação é ainda configurada para: se for determinado que o fluxo de bits de Nésimo quadro é o quadro de primeiro tipo, decodificar o fluxo de bits de Nésimo quadro, para obter o sinal downmixed de Nésimo quadro e um conjunto de parâmetros estéreos de Nésimo quadro; ou se for determinado que o fluxo de bits de Nésimo quadro é o quadro de segundo tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de quadro único precedendo um conjunto de parâmetros estéreos de Nésimo quadro, e obter o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado, onde k é um número inteiro maior do que 0, e
[0079] pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed do Nésimo quadro para os sinais de áudio do Nésimo quadro com base em um terceiro algoritmo predeterminado; e
[0080] uma unidade de restauração de sinal é configurada para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base no terceiro algoritmo.
[0081] Com base no quarto aspecto, opcionalmente, o quadro de primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, um quadro de terceiro tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed, um quadro de quarto tipo não inclui nem um sinal downmixed nem um conjunto de parâmetros estéreos, e cada quadro de terceiro tipo e quadro de quarto tipo é um caso do quadro de segundo tipo;
[0082] - a unidade de decodificação é ainda configurada para: se for determinado que o fluxo de bits de Nésimo quadro é o quadro de primeiro tipo, decodificar o fluxo de bits de Nésimo quadro, para obter o sinal downmixed de Nésimo quadro e um conjunto de parâmetros estéreos de Nésimo quadro; ou se for determinado que o fluxo de bits de Nésimo quadro é o quadro de segundo tipo, quando o fluxo de bits de Nésimo quadro for o quadro de terceiro tipo, decodificar o fluxo de bits de Nésimo quadro para obter um conjunto de parâmetros estéreos de Nésimo quadro, ou quando o fluxo de bits de Nésimo quadro é o quadro de quarto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de quadro único precedendo um conjunto de parâmetros estéreos de Nésimo quadro, e obter o conjunto de parâmetros de Nésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado, onde k é um número inteiro positivo maios que 0, e
[0083] pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base em terceiro algoritmo predeterminado; e
[0084] uma unidade de restauração de sinal é configurada para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base no terceiro algoritmo.
[0085] Com base no quarto aspecto, opcionalmente, um quadro de quinto tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, um quadro de sexto tipo inclui um sinal downmixed, mas não inclui um conjunto de parâmetros estéreos, cada quadro de quinto tipo e quadro de sexto tipo é um caso do quadro de primeiro tipo, e o quadro de segundo tipo não inclui nem um sinal downmixed nem um conjunto de parâmetros estéreos;
[0086] - a unidade de decodificação é ainda configurada para: se for determinado que o fluxo de bits de Nésimo quadro é o quadro de primeiro tipo, quando o fluxo de bits de Nésimo quadro for um quadro de quinto tipo, decodificar o fluxo de bits de Nésimo quadro para obter o sinal downmixed e um conjunto de parâmetros estéreos de Nésimo quadro; ou quando o fluxo de bits de Nésimo quadro for o quadro de sexto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de quadro único precedendo um conjunto de parâmetros estéreos de Nésimo quadro, e obter o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado; ou se for determinado que o fluxo de bits de Nésimo quadro é o quadro de segundo tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de quadro único precedendo um conjunto de parâmetros estéreos de Nésimo quadro, e obter o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado, onde
[0087] pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base em um terceiro algoritmo predeterminado, e k é um número inteiro positivo maior do que 0; e
[0088] uma unidade de restauração de sinal é configurada para restaurar o sinal downmixed do Nésimo quadro para os sinais de áudio de Nésimo qaudro de acordo com o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base no terceiro algoritmo.
[0089] Com base no quarto aspecto, opcionalmente, um quadro do quinto tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, um quadro do terceiro tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed, um quadro de quarto tipo e não inclui nem um sinal downmixed nem um conjunto de parâmetros estéreos e cada um dentre o quadro de terceiro tipo e o quadro de quarto tipo é um caso do quadro de segundo tipo;
[0090] - a unidade de decodificação é ainda configurada para: se for determinado que o fluxo de bits de Nésimo quadro é do primeiro tipo, quando o fluxo de bits de Nésimo quadro é do quinto tipo, decodificar o fluxo de bits do Nésimo quadro para obter o sinal downmixed de Nésimo quadro e um conjunto de parâmetros estéreos de Nésimo quadro; ou quando o fluxo de bits de Nésimo quadro for do sexto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos precedido por um conjunto de parâmetros estéreos de Nésimo quadro e obtenha o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado; ou
[0091] - a unidade de decodificação é ainda configurada para: se for determinado que o fluxo de bits de Nésimo quadro
[0092] é um quadro do segundo tipo, quando o fluxo de bits de Nésimo quadro é um quadro do terceiro tipo, decodificar o fluxo de bits de Nésimo quadro, para obter um conjunto de parâmetros estéreos de Nésimo quadro, ou quando o fluxo de bits de Nésimo quadro é um quadro do quarto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos precedendo um conjunto de parâmetros estéreos de Nésimo quadro, e obter o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado, onde
[0093] pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base em um terceiro algoritmo predeterminado e k é um número inteiro positivo maior do que 0; e
[0094] o decodificador ainda inclui uma unidade de restauração de sinal, onde
[0095] uma unidade de restauração de sinal é configurada para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro baseado no terceiro algoritmo.
[0096] De acordo com um quinto aspecto, um sistema de codificação e de decodificação é proporcionado, incluindo qualquer codificador proporcionado no terceiro aspecto, e qualquer decodificador proporcionado no quarto aspecto.
[0097] De acordo com um sexto aspecto, uma modalidade da presente invenção fornece ainda um dispositivo terminal. O dispositivo terminal inclui um processador e uma memória. A memória é configurada para armazenar um programa de software, e o processador é configurado para ler o programa de software armazenado na memória e implementar o método fornecido no primeiro aspecto ou em qualquer implementação do primeiro aspecto.
[0098] De acordo com um sétimo aspecto, uma modalidade da presente invenção fornece ainda um meio de armazenamento de computador. O meio de armazenamento pode ser não volátil. Ou seja, o conteúdo não é perdido após o desligamento. O meio de armazenamento armazena um programa de software, e quando o programa de software é lido e executado por um ou mais processadores, o método fornecido no primeiro aspecto ou qualquer implementação do primeiro aspecto pode ser implementado.
[0099] A figura 1 é um fluxograma de um método de processamento de sinais de áudio de multicanais de acordo com a modalidade 1 da presente invenção;
[00100] As figuras 2A, 2B e 2C são um fluxograma esquemático de um método de processamento de sinal de áudio multicanal de acordo com a modalidade 2 da presente invenção;
[00101] As figuras 3a à 3d são diagramas esquemáticos de um codificador de acordo com uma modalidade da presente invenção;
[00102] A figura 4 é um diagrama esquemático de um decodificador de acordo com uma modalidade da presente invenção; e
[00103] A figura 5 é um diagrama esquemático de um sistema de codificação e decodificação de acordo com uma modalidade da presente invenção.
[00104] Para tornar os objetivos, soluções técnicas e vantagens da presente invenção mais claros, o seguinte descreve ainda a presente invenção em detalhes com referência aos desenhos em anexo.
[00105] Deve ser entendido que, em uma tecnologia de codificação e decodificação de áudio, um sinal de áudio é codificado ou decodificado em uma unidade de quadro. Especificamente, um sinal de áudio de Nésimo quadro é um Nésimo quadro de áudio. Quando o sinal de áudio de Nésimo quadro inclui um sinal de fala, o Nésimo quadro de áudio é um quadro de fala. Quando o sinal de áudio de Nésimo quadro não inclui um sinal de fala, mas inclui um sinal de ruído de fundo, o Nésimo quadro de áudio é um quadro de ruído. Aqui, N é um número inteiro positivo maior do que 0.
[00106] Além disso, em um sistema de comunicação mono, quando uma maneira de codificação descontínua é usada, a codificação é executada uma vez a cada vários quadros de ruído, para obter um quadro descritor de inserção de silêncio (Silence Insertion Descriptor, SID).
[00107] Um codificador e um decodificador nas modalidades da presente invenção são pacotes utilizados para processar um sinal de áudio multicanal. Os pacotes podem ser instalados em um dispositivo que suporte processamento de sinais de áudio multicanal, como um terminal (por exemplo, um telefone celular, um notebook ou um computador tablet) ou um servidor, de modo que o dispositivo, como o terminal ou o servidor, tem uma função de processar o sinal de áudio multicanal nas modalidades da presente invenção.
[00108] Nas modalidades da presente invenção, porque um sinal de áudio pode ser codificado usando um mecanismo de codificação descontínua em um sistema de comunicações multicanal, a eficiência de compressão de sinal de áudio é grandemente melhorada.
[00109] O seguinte descreve em detalhes um método de processamento de sinal de áudio multicanal nas modalidades da presente invenção utilizando um sinal downmixed de Nésimo quadro como exemplo, e N é um número inteiro positivo maior do que 0. Supõe-se que o sinal downmixed de Nésimo quadro é obtido após os sinais de áudio de Nésimo quadro em dois dos múltiplos canais serem misturados.
[00110] Quando os canais múltiplos são dois canais, e os dois canais são respectivamente um primeiro canal e um segundo canal, os dois dos múltiplos canais são o primeiro canal e o segundo canal, e um sinal down-mix de Nésimo quadro é obtido misturando um sinal de áudio de Nésimo quadro no primeiro canal e um sinal de áudio de Nésimo quadro no segundo canal. Quando os múltiplos canais são pelo menos três canais, um sinal downmixed é obtido pela mistura de sinais de áudio em dois canais emparelhados nos múltiplos canais. Especificamente, três canais são usados como exemplo, e os três canais são um primeiro canal, um segundo canal e um terceiro canal. Supondo que apenas o primeiro canal e o segundo canal estejam emparelhados de acordo com uma regra especificada, os dois dos múltiplos canais são o primeiro canal e o segundo canal, e um sinal downmixed de Nésimo quadro é obtido após downmixing ser realizado em sinais de áudio de Nésimo quadro no primeiro canal e um sinal de áudio de Nésimo quadro no segundo canal. Supondo que, nos três canais, o primeiro canal e o segundo canal estão emparelhados e o segundo canal e o terceiro canal estão emparelhados, os dois dos múltiplos canais podem ser o primeiro canal e o segundo canal, ou podem ser o segundo canal e o terceiro canal.
[00111] Como mostrado na figura 1, um método de processamento de sinal de áudio multicanal na modalidade 1 da presente invenção inclui as seguintes etapas:
[00112] Etapa 100: Um codificador gera um conjunto de parâmetros estéreos de Nésimo quadro de acordo com os sinais de áudio de Nésimo quadro em dois dos múltiplos canais, onde o conjunto de parâmetros estéreos inclui Z parâmetros estéreos.
[00113] Especificamente, os Z parâmetros estéreos incluem um parâmetro que é usado quando o codificador mistura os sinais de áudio de Nésimo quadro com base em um primeiro algoritmo predeterminado, e Z é um número inteiro positivo maior do que 0. Deve ser entendido que o primeiro algoritmo predeterminado é um algoritmo de geração de sinal downmixed predefinido no codificador.
[00114] Deve ser notado que os parâmetros estéreos estão incluídos no conjunto de parâmetros estéreos de Nésimo quadro usando o algoritmo de geração de parâmetros estéreos predefinido. Supondo que um dos dois canais é um canal esquerdo e o outro é um canal direito, o algoritmo de geração de parâmetros estéreos predefinido é como segue, e um parâmetro estéreo obtido de acordo com os sinais de áudio de Nésimo quadro é uma diferença de nível entre canais. (Diferença de nível entre canais, ILD):
[00115] Onde L(i) é um coeficiente de Transformação Distinta de Fourier (Discrete Fourier Transform, DFT) de um sinal de áudio de Nésimo quadro no canal esquerdo em uma iésima caixa de frequência, R(i) é um coeficiente DFT de um sinal de áudio de Nésimo quadro no canal direito na iésima caixa de frequência, Re L(i) é uma parte real de L(i), Im L(i) é uma parte imaginária de L(i), Re R(i) é uma parte real de R(i), Im R(i) é uma parte imaginária de R(i), PL(i) é um espectro de energia do sinal de áudio de Nésimo quadro no canal esquerdo na iésima caixa de frequência i, PR(i) é um espectro de energia do sinal de áudio de Nésimo quadro no canal direito na iésima caixa de frequência, EL(m) é energia de um sinal de áudio de Nésimo quadro em uma mésima sub-banda de frequência do canal esquerdo, é energia de um sinal de áudio de Nésimo quadro em uma mésima sub- banda de frequência do canal direito e uma quantidade total de sub-bandas de frequência para transmitir os sinais de áudio de Nésimo quadro é M.
[00116] No algoritmo de geração de parâmetros estéreos, um caso em que o sinal de áudio de Nésimo quadro é um componente direto ou um componente Nyquist, respectivamente, em caixas de frequência i = 0 ou não é considerado.
[00117] Quando o algoritmo de geração de parâmetros estéreos predefinido inclui ainda um algoritmo para calcular outros parâmetros estéreos, como uma diferença de tempo entre canais (diferença de tempo entre canais, ITD), uma diferença de fase entre canais (diferença de fase entre canais, IPD) e coerência entre canais (coerência entre canais, IC), o codificador pode obter ainda os parâmetros estéreos, como o ITD, o IPD e o IC, de acordo com o sinal de áudio com base no algoritmo de geração de parâmetros estéreos predefinido.
[00118] Deve ser entendido que o conjunto de parâmetros estéreos de Nésimo quadro inclui pelo menos um parâmetro estéreo. Por exemplo, o IPD, o ITD, o ILD e o IC são obtidos de acordo com os sinais de áudio de Nésimo quadro nos dois canais com base no algoritmo de geração de parâmetros estéreos predefinido, e o IPD, o ITD, o ILD e o IC formam o conjunto de parâmetros estéreos de Nésimo quadro.
[00119] Etapa 101: O codificador mistura os sinais de áudio de Nésimo quadro nos dois canais em um sinal downmixed de Nésimo quadro de acordo com pelo menos uma parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base em um primeiro algoritmo predeterminado,
[00120] Por exemplo, o conjunto de parâmetros estéreos de Nésimo quadro inclui o ITD, o ILD, o IPD e o IC. O sinal downmixed de Nésimo quadro é obtido de acordo com o ILD e o IPD baseado no primeiro algoritmo predeterminado. Especificamente, o sinal downmixed de Nésimo quadro satisfaz a seguinte expressão em uma caixa de frequência k:
[00121] Onde DMX (k) representa o sinal downmixed de Nésimo quadro na késima caixa de frequência, L(k) representa uma amplitude de um sinal de áudio de Nésimo quadro em um canal esquerdo em um késimo par de canais na késima caixa de frequência, representa uma amplitude de um sinal de áudio de Nésimo quadro em um canal direito em um késimo par de canais na késima caixa de frequência, representa um ângulo de fase de um sinal de áudio de Nésimo quadro no canal esquerdo na késima caixa de frequência, representa um ILD dos sinais de áudio de Nésimo quadro na késima caixa de frequência e IPD(k) representa um IPD dos sinais de áudio de Nésimo quadro na késima caixa de frequência.
[00122] Deve ser notado que, além do algoritmo para obter o sinal downmixed, esta modalidade da presente invenção não impõe qualquer limitação a outro algoritmo para obter o sinal downmixed.
[00123] Na modalidade 1 da presente invenção, o conjunto de parâmetros estéreos de Nésimo quadro é codificado, de modo que um decodificador pode restaurar o sinal downmixed de Nésimo quadro. Opcionalmente, para melhorar a eficiência de compressão durante a codificação, o codificador codifica um parâmetro estéreo usado para obter o sinal downmixed de Nésimo quadro no conjunto de parâmetros estéreos de Nésimo quadro. Por exemplo, o conjunto de parâmetros estéreos Nésimo quadro gerado inclui o ITD, o ILD, o IPD e o IC. Se o codificador mixar os sinais de áudio de Nésimo quadro nos dois canais no sinal downmixed de Nésimo quadro de acordo com apenas o ILD e o IPD no conjunto de parâmetros estéreos de Nésimo quadro baseado no algoritmo predeterminado, para melhorar a eficiência de compressão, o codificador pode codificar apenas o ILD e o IPD no conjunto de parâmetros estéreos de Nésimo quadro.
[00124] Etapa 102: O codificador detecta se o sinal downmixed de Nésimo quadro inclui um sinal de fala e se o sinal downmixed de Nésimo quadro inclui o sinal de fala, executa a etapa 103, ou se o sinal downmixed de Nésimo quadro não inclui o sinal de fala, executa a etapa 104.
[00125] Para facilitar a detecção, pelo codificador, se o sinal downmixed de Nésimo quadro inclui o sinal de fala, opcionalmente, o codificador detecta diretamente, por meio de detecção de atividade de voz (Voice Activity Detection, VAD), se o sinal downmixed de Nésimo quadro inclui o sinal de fala.
[00126] Opcionalmente, um método para detectar indiretamente, pelo codificador, se o sinal downmixed de Nésimo quadro inclui o sinal de fala é: O codificador detecta diretamente, por meio de VAD, se os sinais de áudio de Nésimo quadro incluem o sinal de fala. Especificamente, se detectar que um sinal de áudio em um dos dois canais inclui o sinal de fala, o codificador determina que um sinal downmixed, obtido pela mistura de sinais de áudio nos dois canais, inclui o sinal de fala. Apenas quando se determina que nenhum dos sinais de áudio nos dois canais inclui o sinal de fala, o codificador determina que o sinal downmixed obtido pela mistura dos sinais de áudio nos dois canais inclui o sinal de fala. Deve ser notado que, de uma forma indireta de detecção, uma sequência entre a etapa 102 e a etapa 100 ou a etapa 101 não é limitada, desde que a etapa 100 preceda a etapa 101.
[00127] Etapa 103: O codificador codifica o sinal downmixed de Nésimo quadro e realiza a etapa 107.
[00128] O codificador codifica o sinal downmixed de Nésimo quadro para obter um fluxo de bits de Nésimo quadro.
[00129] Como a codificação descontínua é realizada no sinal downmixed na modalidade 1 da presente invenção, um fluxo de bits inclui dois tipos de quadro: um quadro de primeiro tipo e um quadro de segundo tipo. O quadro do primeiro tipo inclui um sinal downmixed e o quadro do segundo tipo não inclui um sinal downmixed. O fluxo de bits do Nésimo quadro obtido na etapa 103 é o quadro do primeiro tipo.
[00130] Na etapa 103, porque o sinal downmixed de Nésimo quadro inclui o sinal de fala, opcionalmente, o codificador codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de quadro de voz pré-ajustada. De preferência, a taxa de codificação de quadro de voz predefinida pode ser definida para 13,2 kbps.
[00131] Além disso, opcionalmente, se codificando o sinal down-mix de Nésimo quadro, o codificador codifica o conjunto de parâmetros estéreos de Nésimo quadro.
[00132] Etapa 104: O codificador determina se o sinal downmixed de Nésimo quadro satisfaz uma condição de codificação de quadro de áudio predefinida e se o sinal downmixed de Nésimo quadro satisfaz a condição de codificação de quadro de áudio predefinida, executa a etapa 105 ou se o sinal downmixed de Nésimo quadro não satisfaz a condição de codificação do quadro de áudio predefinida, executa a etapa 106.
[00133] A condição de codificação de quadro de áudio predefinida é uma condição que é pré-configurada no codificador e que é usada para determinar se deve codificar o sinal downmixed de Nésimo quadro.
[00134] Deve ser notado que, para um sinal downmixed de primeiro quadro, se o sinal downmixed de primeiro quadro não incluir o sinal de fala, o sinal downmixed de primeiro quadro satisfaz a condição de codificação de quadro de áudio predefinida. Ou seja, o sinal downmixed de primeiro quadro é codificado, independentemente de o sinal downmixed de primeiro quadro incluir o sinal de fala.
[00135] Etapa 105: O codificador codifica o sinal downmixed de Nésimo quadro e executa a etapa 107.
[00136] Especificamente, o fluxo de bits de Nésimo quadro obtido na etapa 105 é também o quadro do primeiro tipo.
[00137] Deve ser notado que, opcionalmente, se codificando o sinal down-mix de Nésimo quadro, o codificador codifica o conjunto de parâmetros estéreos de Nésimo quadro.
[00138] Opcionalmente, para facilitar a simplificação de uma implementação de codificação do sinal downmixed, na modalidade 1 da presente invenção, o sinal downmixed de Nésimo quadro é codificado de uma mesma maneira na etapa 103 e na etapa 105.
[00139] Opcionalmente, porque o sinal downmixed de Nésimo quadro na etapa 105 não inclui o sinal de fala, quando o sinal downmixed de Nésimo quadro satisfaz uma condição de codificação de quadro de voz pré-ajustada, o codificador codifica o sinal downmixed de Nésimo quadro de acordo com a taxa de codificação do quadro de fala pré-definida. Alternativamente, quando o sinal downmixed de Nésimo quadro não satisfaz uma condição de codificação de quadro de fala pré-definida, mas satisfaz uma condição de codificação SID pré-ajustada, o codificador codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação SID pré-definida. A taxa de codificação SID predefinida pode ser definida para 2,8 kbps.
[00140] Deve ser notado que quando o sinal downmixed de Nésimo quadro não satisfaz a condição de codificação de quadro de voz pré- ajustada, mas satisfaz a condição de codificação SID pré-ajustada, o codificador codifica o sinal downmixed de Nésimo quadro de acordo com uma maneira de codificação SID. A forma de codificação SID estipula que uma taxa de codificação é a taxa de codificação SID predefinida e estipula um algoritmo usado para a codificação e um parâmetro usado para a codificação.
[00141] A condição de codificação de quadro de fala predefinida pode ser: a duração entre o sinal downmixed de Nésimo quadro e um sinal downmixed de Mésimo quadro não é maior que a duração predefinida. O sinal downmixed de Mésimo quadro inclui o sinal de fala e o sinal downmixed de Mésimo quadro é um quadro de sinal downmixed que inclui o sinal de fala e que está mais próximo do sinal downmixed de Nésimo quadro. A condição de codificação SID predefinida pode estar codificando um quadro de números ímpares. Quando N do sinal downmixed de Nésimo quadro é um número ímpar, o codificador determina que o sinal downmixed de Nésimo quadro satisfaz a condição de codificação SID pré-definida.
[00142] Etapa 106: O codificador pula a codificação do sinal downmixed de Nésimo quadro e executa a etapa 109.
[00143] Especificamente, o fluxo de bits de Nésimo quadro obtido na etapa 106 é o segundo tipo de quadro.
[00144] O codificador determina que o sinal downmixed de Nésimo quadro não satisfaz a condição de codificação de quadro de áudio predefinida. Especificamente, o codificador determina que o sinal downmixed de Nésimo quadro não satisfaz a condição de codificação de quadro de fala predefinida e não satisfaz a condição de codificação SID predefinida.
[00145] Nesta modalidade da presente invenção, o codificador não codifica o sinal downmixed de Nésimo quadro. Especificamente, o fluxo de bits de Nésimo quadro não inclui o sinal downmixed de Nésimo quadro.
[00146] Quando o codificador não codifica o sinal downmixed de Nésimo quadro, o codificador pode codificar o conjunto de parâmetros estéreos de Nésimo quadro ou pode não codificar o conjunto de parâmetros estéreos de Nésimo quadro.
[00147] Na modalidade 1 da presente invenção, é feita uma descrição usando um exemplo em que o codificador não codifica o sinal downmixed de Nésimo quadro, mas codifica o conjunto de parâmetros estéreod de Nésimo quadro. No entanto, opcionalmente, quando o codificador não codifica o sinal downmixed de Nésimo quadro, o codificador também não pode codificar o conjunto de parâmetros estéreos de Nésimo quadro. Especificamente, quando o codificador não codifica nem o parâmetro estéreo de Nésimo quadro nem o sinal downmixed de Nésimo quadro, para obter o sinal downmixed de Nésimo quadro e o parâmetro estéreo de Nésimo quadro definido pelo decodificador, consulte a modalidade 2 da presente invenção.
[00148] Etapa 107: O codificador envia um fluxo de bits de Nésimo quadro para um decodificador.
[00149] Para que o decodificador possa restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio Nésimo quadro nos dois canais depois de obter, por meio de decodificação, o sinal downmixed de Nésimo quadro, o fluxo de bits de Nésimo quadro inclui ambos, Conjunto de parâmetros estéreos de Nésimo quadro e sinal down-mix de Nésimo quadro.
[00150] Etapa 108: Se for determinado que o fluxo de bits de Nésimo quadro é um quadro de primeiro tipo, o decodificador decodifica o fluxo de bits de Nésimo quadro, para obter o sinal downmixed de Nésimo quadro e o conjunto de parâmetros estéreos de Nésimo quadro e realiza a etapa 111.
[00151] Deve ser notado que, como o quadro de primeiro tipo inclui um sinal downmixed e o segundo tipo de quadro não inclui um sinal downmixed, um tamanho do primeiro tipo de quadro é maior que um tamanho do segundo tipo de quadro. O decodificador pode determinar, de acordo com um tamanho do fluxo de bits do Nésimo quadro, se o fluxo de bits do Nésimo quadro é do primeiro tipo ou do segundo tipo. Além disso, opcionalmente, um bit de sinalizador pode ser ainda mais encapsulado no fluxo de bits de Nésimo quadro. O decodificador parcialmente decodifica o fluxo de bits de Nésimo quadro para obter o bit de sinalização e determina, de acordo com o bit de sinalizador, se o fluxo de bits de Nésimo quadro é do primeiro tipo ou do segundo. Por exemplo, quando o bit de sinalização é 1, indica que o fluxo de bits de Nésimo quadro é o quadro do primeiro tipo; quando o bit de sinalização é 0, indica que o fluxo de bits de Nésimo quadro é do segundo tipo de quadro.
[00152] Além disso, opcionalmente, o decodificador determina uma maneira de decodificação de acordo com uma taxa correspondente ao fluxo de bits de Nésimo quadro. Por exemplo, se a taxa do fluxo de bits do Nésimo quadro for 17,4 kbps, uma taxa de um fluxo de bits correspondente a um sinal downmixed é de 13,2 kbps, e uma taxa de fluxo de bits correspondente a um conjunto de parâmetros estéreos é de 4,2 kbps, o decodificador decodifica, de acordo com um modo de decodificação correspondente a 13,2 kbps, o fluxo de bits correspondendo ao sinal downmixed e decodifica, de acordo com um modo de decodificação correspondendo a 4,2 kbps, o fluxo de bits correspondendo ao conjunto de parâmetros estéreos.
[00153] Alternativamente, o decodificador determina uma maneira de codificação do fluxo de bits de Nésimo quadro de acordo com um bit de sinalização de modo de codificação no fluxo de bits de Nésimo quadro e decodifica o fluxo de bits de Nésimo quadro de acordo com uma maneira de decodificação correspondente à maneira de codificação.
[00154] Etapa 109: O codificador envia um fluxo de bits de Nésimo quadro para um decodificador, onde o fluxo de bits de Nésimo quadro inclui o conjunto de parâmetros estéreos de Nésimo quadro.
[00155] Etapa 110: Se determinar que o fluxo de bits de Nésimo quadro é um segundo tipo de quadro, o decodificador decodifica o fluxo de bits de Nésimo quadro, para obter o conjunto de parâmetros estéreos de Nésimo quadro, determina, de acordo com uma primeira regra pré-definida, sinais downmixed de mésimo quadro em sinal downmixed de pelo menos um quadro que precede o sinal downmixed de Nésimo quadro, e obtém o sinal downmixed de Nésimo quadro de acordo com os sinais downmixed de mésimo quadro baseado no primeiro algoritmo predeterminado, onde m é um número inteiro positivo maior do que 0.
[00156] Especificamente, um valor médio de um sinal downmixed de (N - 3) th-quadro, um sinal downmixed de (N - 2) th-quadro, e um sinal downmixed de (N - 1) th-quadro é usado como o sinal downmixed de Nésimo quadro, ou um sinal downmixed de quadro (N-1) th-frame é usado diretamente como o sinal downmixed, ou o sinal downmixed de Nésimo quadro é estimado de acordo com outro algoritmo.
[00157] Além disso, o sinal downmixed (N - 1) th- quadro pode ser usado diretamente como o sinal downmixed de Nésimo quadro, ou o sinal downmixed de Nésimo quadro é calculado de acordo com o sinal downmixed de (N - 1) th- quadro e um valor de compensação predefinido com base em um algoritmo predefinido.
[00158] Etapa 111: O decodificador restaura o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro nos dois canais de acordo com um parâmetro estéreo alvo no conjunto de parâmetros estéreos de Nésimo quadro, baseado em um segundo algoritmo predeterminado.
[00159] Deve ser entendido que o parâmetro estéreo alvo é pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro.
[00160] Especificamente, um processo de restauração, pelo decodificador, do sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro nos dois canais é um processo inverso de mixagem, pelo codificador, dos sinais de áudio de Nésimo quadro nos dois canais no sinal downmixed de Nésimo quadro. Supondo que o codificador obtém o sinal downmixed de Nésimo quadro de acordo com o IPD e o ILD no conjunto de parâmetros estéreos de Nésimo quadro, o decodificador restaura o sinal downmixed de Nésimo quadro para os sinais de Nésimo quadro nos canais do Kth par dos canais de acordo com o IPD e o ILD no conjunto de parâmetros estéreos de Nésimo quadro. Além disso, deve-se notar que um algoritmo que é pré- ajustado no decodificador e que é usado para restaurar um sinal downmixed pode ser um algoritmo inverso de um algoritmo de geração de sinal downmixed no codificador, ou pode ser um algoritmo independente de um algoritmo de geração de sinal downmixed no codificador.
[00161] Além disso, para melhorar a eficiência de compressão durante a codificação em um sistema de comunicações multicanais, ao implementar a codificação descontínua em um sinal downmixed, um codificador pode implementar ainda a codificação descontínua em um conjunto de parâmetros estéreos. Um sinal downmixed de Nésimo quadro é usado como um exemplo abaixo. Como mostrado na FIG. 2A, FIG. 2B e FIG. 2C, um método de processamento de sinal de áudio multicanais na modalidade 2 da presente invenção inclui as seguintes etapas.
[00162] Etapa 200: Um codificador gera um conjunto de parâmetros estéreos de Nésimo quadro de acordo com os sinais de áudio de Nésimo quadro em dois de múltiplos canais, onde o conjunto de parâmetros estéreos inclui Z parâmetros estéreos.
[00163] Especificamente, os Z parâmetros estéreos incluem um parâmetro que é usado quando o codificador mistura os sinais de áudio de Nésimo quadro com base em um primeiro algoritmo predeterminado, e Z é um número inteiro positivo maior do que 0. Deve ser entendido que o primeiro algoritmo é um algoritmo de geração de sinal downmixed predefinido no codificador.
[00164] Deve ser notado que os parâmetros estéreos incluídos no conjunto de parâmetros estéreos de Nésimo quadro são determinados utilizando um algoritmo de geração de parâmetros estéreos predefinido. Supondo que um dos dois canais é um canal esquerdo, e o outro é um canal direito, o algoritmo de geração de parâmetros estéreos predefinido é como segue, e um parâmetro estéreo obtido de acordo com os sinais de áudio de Nésimo quadro é um ITD:
[00165] Onde0 ≤ i≤ Tmax, N é um comprimento de quadro, l(j) representa um quadro de sinal de domínio de tempo no canal esquerdo em um momento j , r(j) representa um quadro de sinal de domínio de tempo no canal direito em um momento j e se,o ITD é um número oposto de um valor de índice correspondente a caso contrário, O ITD é um número oposto de um valor de indice correspondente a
[00166] Outro algoritmo para obtenção do ITD também é aplicável a esta modalidade da presente invenção.
[00167] Se o algoritmo de geração de parâmetro estéreo predefinido inclui ainda o seguinte algoritmo de geração de IPD, um IPD pode ser ainda obtido de acordo com o seguinte algoritmo. Especificamente, um IPD em uma bésima banda de frequência satisfaz a seguinte expressão:onde
[00168] B é uma quantidade total de bandas de subfrequências ocupadas por um sinal de áudio em um domínio de frequência, L(k) é um sinal de um sinal de áudio de Nésimo quadro no canal esquerdo em uma késima caixa de frequências e R* (k) é um sinal conjugado de sinais de áudio de Nésimo quadro no canal direito na késima caixa de frequências
[00169] Além disso, quando o algoritmo de geração de parâmetro estéreo predefinido ainda inclui um algoritmo de geração de ILD na modalidade 1 da presente invenção, um ILD ainda pode ser obtido.
[00170] Etapa 201: O codificador mistura os sinais de áudio de Nésimo quadro nos dois canais em um sinal downmixed de Nésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro baseado em um algoritmo predeterminado.
[00171] Especificamente, para o primeiro algoritmo predeterminado, referir-se ao método para obter um sinal downmixed de Nésimo quadro na modalidade 1 da presente invenção. No entanto, o primeiro algoritmo predeterminado não está limitado ao método para obtenção de um sinal downmixed de Nésimo quadro na modalidade 1 da presente invenção.
[00172] Etapa 202: O codificador detecta se o sinal downmixed de Nésimo quadro inclui um sinal de fala, e se o sinal downmixed de Nésimo quadro inclui o sinal de fala, realiza a etapa 203, ou se o sinal downmixed de Nésimo quadro não inclui o sinal de fala, executa a etapa 204.
[00173] Na modalidade 2 da presente invenção, para uma implementação específica de detecção, pelo codificador, se o sinal sinal downmixed de Nésimo quadro inclui o sinal de fala, refira-se à maneira de detectar, pelo codificador, se sinal downmixed de Nésimo quadro inclui o sinal de fala na modalidade 1 da presente invenção.
[00174] Etapa 203: O codificador codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de quadro de fala predefinida, codifica o conjunto de parâmetros estéreos de Nésimo quadro e executa a etapa 211.
[00175] Especificamente, quando o codificador inclui duas maneiras de codificar um conjunto de parâmetros estéreos: uma primeira maneira de codificação e uma segunda maneira de codificação, uma taxa de codificação estipulada na primeira maneira de codificação não é menor do que uma taxa de codificação estipulada na segunda maneira de codificação; e / ou, para qualquer parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro, a precisão de quantização estipulada na primeira maneira de codificação não é inferior à precisão de quantização estipulada na segunda maneira de codificação. Na etapa 203, o codificador codifica o conjunto de parâmetros estéreos de Nésimo quadro de acordo com a primeira maneira de codificação.
[00176] Por exemplo, o conjunto de parâmetros estéreos de Nésimo quadro inclui um IPD e um ITD. A precisão de quantização IPD estipulada na primeira maneira de codificação não é inferior à precisão de quantização IPD estipulada na segunda maneira de codificação, e a precisão de quantização ITD estipulada na primeira maneira de codificação não é inferior à precisão de quantização ITD estipulada na segunda maneira de codificação.
[00177] De preferência, a taxa de codificação do quadro de fala pode ser ajustada para 13,2 kbps.
[00178] Etapa 204: O codificador determina se o sinal downmixed de Nésimo quadro satisfaz uma condição de codificação de quadro de fala predefinida e se o sinal downmixed de Nésimo quadro satisfaz a condição de codificação de quadro de fala predefinida, executa a etapa 205 ou se o sinal downmixed de Nésimo quadro não satisfaz a condição de codificação do quadro de fala predefinida, executa a etapa 206.
[00179] Etapa 205: O codificador codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de quadro de fala predefinida, codifica o conjunto de parâmetros estéreos de Nésimo quadro e executa a etapa 211.
[00180] Especificamente, quando o codificador inclui duas maneiras de codificar um conjunto de parâmetros estéreos: uma primeira maneira de codificação e uma segunda maneira de codificação, uma taxa de codificação estipulada na primeira maneira de codificação não é menor do que uma taxa de codificação estipulada na segunda maneira de codificação; e / ou, para qualquer parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro, a precisão de quantização estipulada na primeira maneira de codificação não é inferior à precisão de quantização estipulada na segunda maneira de codificação. Na etapa 205, o codificador codifica o conjunto de parâmetros estéreos de Nésimo quadro de acordo com a primeira maneira de codificação.
[00181] Etapa 206: O codificador determina se o sinal downmixed de Nésimo quadro satisfaz uma condição de codificação SID predefinida e determina se o conjunto de parâmetros estéreos de Nésimo quadro satisfaz uma condição de codificação de parâmetro estéreo predefinida e se o sinal downmixed de Nésimo quadro satisfaz a condição de codificação SID predefinida e o conjunto de parâmetros estéreos de Nésimo quadro satisfaz a condição de codificação de parâmetros estéreos predefinida, realiza a etapa 207 ou se o sinal downmixed de Nésimo quadro satisfaz a condição de codificação SID predefinida, mas o conjunto de parâmetros estéreos de Nésimo quadro não satisfazer a condição de codificação de parâmetros estéreos predefinida, executar a etapa 208 ou se o sinal downmixed de Nésimo quadro não satisfaz a condição de codificação SID predefinida, mas o conjunto de parâmetros estéreos de Nésimo quadro satisfaz a condição de codificação de parâmetros estéreos predefinida, executa a etapa 209 ou se o sinal downmixed de Nésimo quadro não satisfaz a condição de codificação SID predefinida e o conjunto de parâmetros estéreos de Nésimo quadro não satisfaz a condição de codificação de parâmetros estéreos, realiza a etapa 210.
[00182] Especificamente, antes de codificar o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro, o codificador determina se um parâmetro estéreo no pelo menos um parâmetro estéreo satisfaz uma condição de codificação de parâmetro estéreo correspondente predefinida. Especificamente, se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro inclui uma ILD de diferença de nível entre canais, a condição de codificação de parâmetro estéreo predefinida inclui D ≥ D onde D representa um grau pelo qual a ILD se desvia de um primeiro padrão, o primeiro padrão é determinado com base em um terceiro algoritmo predeterminado de acordo com os conjuntos de parâmetros estéreos de quadro-T que precede o conjunto de parâmetros estéreos de Nésimo quadro e T é um número inteiro positivo maior do que 0.
[00183] Se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro inclui um ITD de diferença de tempo intercanais, a condição de codificação de parâmetro estéreo predefinida inclui D>D, onde D representa um grau pelo qual o ITD se desvia de um segundo padrão, o segundo padrão é determinado com base em um quarto algoritmo predefinido de acordo com conjuntos de parâmetros estéreos de quadro T, precedendo o conjunto de parâmetros estéreos de Nésimo quadro e T é um número inteiro positivo maior do que 0.
[00184] Se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro inclui um IPD de diferença de fase intercanais, a condição de codificação de parâmetros estéreos predefinida inclui D> D onde D representa um grau pelo qual IPD se desvia de um terceiro padrão, o terceiro padrão é determinado com base em um quinto algoritmo, de acordo com conjunto de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Nésimo quadro e T é um número inteiro positivo maior do que 0.
[00185] O terceiro algoritmo, o quarto algoritmo e o quinto algoritmo precisam ser predefinidos de acordo com a situação real.
[00186] Especificamente, quando o pelo menos um parâmetro estéreo de Nésimo quadro inclui apenas ITD, a condição de codificação de parâmetro estéreo predefinida inclui apenas D >D e quando ITD incluído no pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro satisfaz D>D, o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro é codificado. Quando o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro inclui apenas ITD e IPD, a condição de codificação de parâmetro estéreo predefinido inclui apenas D> De quando o ITD incluído no pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro satisfaz D>D, o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro é codificado. Contudo, quando o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro inclui apenas ITD e ILD, a condição de codificação de parâmetro estéreo predefinido inclui D> D e D≥ De o codificador codifica ITD e ILD apenas quando o ITD incluído no pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro satisfaz D≥D e ILD satisfaz D≥D.
[00187] Opcionalmente, D , D e D , respectivamente, satisfazem as seguintes expressões:
[00188] Onde ILD(m) é uma diferença de nível gerada quando os sinais de áudio de Nésimo quadro são transmitidos, respectivamente nos dois canais em uma mésima banda de subfrequências, M é uma quantidade total de bandas de subfrequências ocupadas para a transmissão dos sinais de áudio de Nésimo quadro,é um valor médio de ILDs nos conjuntos de parâmetros estéreos de quadro T, precedendo o conjunto de parâmetros estéreos de Nésimo quadro na mésima banda de subfrequências, T é um número inteiro positivo maior do que 0, iLD[-t](m) é uma diferença de nível gerada quando os sinais de áudio do quadro T, precedendo os sinais de áudio de Nésimo quadro são transmitidos, respectivamente, nos dois canais, na mésima banda de subfrequências, ITD é uma diferença de tempo gerada quando os sinais de áudio de Nésimo quadro são transmitidos, respectivamente, nos dois canais, é um valor médio de ITDs nos conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Nésimo quadro, iTD[-t] é uma diferença de tempo gerada quando os sinais de áudio de tésimo quadro, precedendo os sinais de áudio de Nésimo quadro são transmitidos, respectivamente, nos dois canais, iPD(m) é uma diferença de fase gerada quando alguns dos sinais de áudio de Nésimo quadro são transmitidos, respectivamente, nos dois canais na mésima banda de subfrequências, é um valor médio de IPDs nos conjuntos de parâmetros estéreos de quadro T, precedendo o conjunto de parâmetros estéreos de Nésimo quadro na mésima banda de subfrequências e iPD[-t](m) é uma diferença de fase gerada quando sinais de áudio de quadro T são transmitidos, respectivamente, nos dois canais na mésima banda de subfrequências
[00189] Etapa 207: O codificador codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação SID predefinida, codifica o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro e executa a etapa 211.
[00190] Especificamente, quando o codificador inclui duas maneiras de codificar um conjunto de parâmetros estéreo: uma primeira maneira de codificação e uma segunda maneira de codificação, uma taxa de codificação estipulada na primeira maneira de codificação não é menor que uma taxa de codificação estipulada na segunda maneira de codificação; e / ou, para qualquer parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro, a precisão de quantização estipulada na primeira maneira de codificação não é inferior à precisão de quantização estipulada na segunda maneira de codificação. O codificador codifica o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro, de acordo com a segunda maneira de codificação.
[00191] Por exemplo, na primeira maneira de codificação, o codificador codifica o conjunto de parâmetros estéreos de Nésimo quadro de acordo com 4,2 kbps e, na segunda forma de codificação, o codificador codifica o conjunto de parâmetros estéreos de Nésimo quadro de acordo com 1,2 kbps.
[00192] Para melhorar a eficiência de compressão do parâmetro estéreo definido pelo codificador, opcionalmente, o codificador obtém parâmetros estéreos alvo X de acordo com os Z parâmetros estéreos no conjunto de parâmetros estéreos de Nésimo quadro baseado em uma regra de redução de dimensão de parâmetro estéreo predefinida e codifica os parâmetros estéreo de alvo X. X é um número inteiro positivo maior do que 0 e menor ou igual a Z.
[00193] Especificamente, o conjunto de parâmetros estéreos de Nésimo quadro inclui três tipos de parâmetros estéreos: um IPD, um ITD e um ILD. O ILD inclui ILDs em 10 bandas de subfrequência: um ILD (0),... e um ILD (9), o IPD inclui IPDs em 10 bandas de subfrequência: um IPD (0),. e um IPD (9), e o ITD inclui ITDs em duas sub-bandas de domínio do tempo: um ITD (0) e um ITD (1). Assumindo que a regra de redução de dimensão de parâmetro estéreo predefinida é que o conjunto de parâmetros estéreos inclui apenas dois tipos de parâmetros estéreos o codificador seleciona quaisquer dois tipos de parâmetros estéreos do IPD, do ITD e do ILD. Assumindo que o IPD e o ILD são selecionados, o codificador codifica o IPD e o ILD. Alternativamente, se a regra de redução de dimensão de parâmetro estéreo predefinida é que apenas metade de cada tipo de parâmetros estéreos é reservada, cinco DPIs são selecionados a partir do ILD (0),... e do ILD (9), cinco IPDs são selecionados do IPD (0),., e o IPD (9), um ITD é selecionado do ITD (0) e do ITD (1), e os parâmetros selecionados são codificados. Alternativamente, a regra de redução de dimensão de parâmetro estéreo predefinida é que cinco ILDs e cinco IPDs sejam selecionados. Alternativamente, se a regra de redução de dimensão de parâmetros estéreo predefinida é aquela resolução de domínio de frequência dos ILDs, resolução de domínio de frequência dos IPDs e resolução de domínio de tempo dos ITDs são reduzidas, ILDs em bandas de subfrequência vizinhas no ILD (0 ),. E o ILD (9) são combinados. Por exemplo, um valor médio de ILD (0) e ILD (1) é calculado para obter um novo ILD (0), um valor médio do ILD (2) e o ILD (3) é calculado para obter um novo ILD (1),., e um valor médio da ILD (8) e da ILD (9) são calculados para obter uma nova DPI (4). Uma banda de subfrequência correspondente ao novo ILD (0) é igual às bandas de subfrequências correspondentes ao ILD original (0) e ao ILD original (1),., e uma banda de subfrequências correspondente ao novo ILD (4) é igual a bandas de subfrequências correspondentes ao ILD original (8) e ao ILD original (9). De acordo com o mesmo método, IPDs em bandas de subfrequências vizinhas no IPD (0),., e o IPD (9) são combinados, para obter um novo IPD (0),., e um novo IPD (4); e um valor médio do ITD (0) e do ITD (1) também é calculado e combinado para obter um novo ITD (0). Um sinal no domínio do tempo correspondente ao novo ITD (0) é o mesmo que os sinais no domínio do tempo correspondentes ao ITD original (0) e ao ITD original (1). O novo ILD (0),... e o novo ILD (4), o novo IPD (0),... e o novo IPD (4) e o novo ITD (0) são codificados. Alternativamente, se a regra de redução de dimensão de parâmetro estéreo predefinida é que a resolução de domínio de frequência dos ILDs é reduzida, os ILDs nas bandas de sub-frequência vizinhas no ILD (0),. e o ILD (9) são combinados. Por exemplo, um valor médio de ILD (0) e ILD (1) é calculado para obter um novo ILD (0), um valor médio do ILD (2) e o ILD (3) é calculado para obter um novo ILD (1),., e um valor médio da ILD (8) e da ILD (9) são calculados para obter uma nova DPI (4). Uma banda de subfrequências correspondente ao novo ILD (0) é igual às bandas de subfrequências correspondentes ao ILD original (0) e ao ILD original (1),., e uma banda de subfrequências correspondente ao novo ILD (4) é igual a bandas de subfrequências correspondentes ao ILD original (8) e ao ILD original (9). Então, o novo ILD (0),. e o novo ILD (4) são codificados.
[00194] Etapa 208: O codificador codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação SID predefinida, mas ignora a codificação de pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro e executa a etapa 211.
[00195] Etapa 209: O codificador codifica o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro, mas ignora a codificação do sinal downmixed de Nésimo quadro e executa a etapa 215.
[00196] Etapa 210: O codificador não codifica nem o sinal downmixed de Nésimo quadro nem o conjunto de parâmetros estéreos de Nésimo quadro, e realiza a etapa 217.
[00197] Na modalidade 2 da presente invenção, o codificador executa a codificação para obter um fluxo de bits. O fluxo de bits inclui quatro tipos diferentes de quadros, isto é, um quadro de terceiro tipo, um quadro de quarto tipo, um quadro de quinto tipo e um quadro de sexto tipo. O quadro do terceiro tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed; o quadro do quarto tipo não inclui um sinal downmixed nem um conjunto de parâmetros estéreos, o quadro do quinto tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos e o quadro do sexto tipo inclui um sinal downmixed, mas não inclui um conjunto de parâmetros estéreos. Cada um dos quadros do quinto tipo e do sexto tipo é um caso de um quadro tipo incluindo um sinal downmixed, e cada um dos quadros do terceiro tipo e do quarto tipo é um caso de um quadro de tipo não incluindo sinal downmixed algum.
[00198] Especificamente, um fluxo de bits de Nésimo quadro obtido na etapa 203, na etapa 205 ou na etapa 207 é o quadro de tipo quinto, um fluxo de bits de Nésimo quadro obtido na etapa 208 é o quadro de tipo sexto, um fluxo de bits de Nésimo quadro obtido na etapa 209 é um quadro do terceiro tipo e um fluxo de bits de Nésimo quadro obtido na etapa 211 é um quadro de quarto tipo.
[00199] Etapa 211: O codificador envia um fluxo de bits de Nésimo quadro para um decodificador, onde o fluxo de bits de Nésimo quadro inclui o sinal downmixed de Nésimo quadro e o conjunto de parâmetros estéreos de Nésimo quadro.
[00200] Etapa 212: O decodificador recebe o fluxo de bits de Nésimo quadro, decodifica o fluxo de bits dade Nésimo quadro e, se determinar que o fluxo de bits de Nésimo quadro é um quadro do quinto tipo, obtém o sinal downmixed de Nésimo quadro e o conjunto de parâmetros estéreos de Nésimo quadro e executa a etapa 218.
[00201] Para uma implementação específica de determinação, pelo decodificador, de qual tipo de quadro é o fluxo de bits de Nésimo quadro, consulte a modalidade 1 da presente invenção.
[00202] Especificamente, o decodificador decodifica o fluxo de bits de Nésimo quadro de acordo com uma taxa correspondente ao fluxo de bits de Nésimo quadro. Especificamente, se o codificador codifica o sinal downmixed de Nésimo quadro de acordo com 13,2 kbps, o decodificador decodifica um fluxo de bits do sinal downmixed de Nésimo quadro no fluxo de bits de Nésimo quadro de acordo com 13,2 kbps. Se o codificador codifica o conjunto de parâmetros estéreos de Nésimo quadro de acordo com 4,2 kbps, o decodificador decodifica um fluxo de bits do parâmetro estéreo de Nésimo quadro definido no fluxo de bits de Nésimo quadro de acordo com 4,2 kbps.
[00203] Etapa 213: O codificador envia um fluxo de bits de Nésimo quadro para um decodificador, onde o fluxo de bits de Nésimo quadro inclui o sinal downmixed de Nésimo quadro.
[00204] Etapa 214: O decodificador decodifica o fluxo de bits de Nésimo quadro, se determinar que o fluxo de bits de Nésimo quadro é um quadro do sexto tipo, para obter o sinal downmixed de Nésimo quadro, determina, de acordo com uma segunda regra pré-definida conjunto de parâmetros estéreos de quadro K em, pelo menos, um conjunto de parâmetros estéreos de quadro único precedendo o conjunto de parâmetros estéreos de Nésimo quadro, obtém o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um sexto algoritmo predeterminado e realiza a etapa 218.
[00205] Especificamente, usando um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro como exemplo, um conjunto de parâmetros estéreo estipulado na segunda regra predefinida é um quadro de conjunto de parâmetros estéreos mais próximo de P e que é obtido por meio de decodificação e um parâmetro estéreo de Nésimo quadro P é obtido de acordo com o seguinte algoritmo:
[00206] Onde P representa o parâmetro estéreo de Nésimo quadro, PH] representa um quadro de parâmetro estéreo que está mais próximo de P e que é obtido por meio de decodificação e δ representa um número aleatório cujo valor absoluto é relativamente pequeno. Por exemplo, δ pode ser um número aleatório entree.
[00207] Deve ser notado que esta modalidade da presente invenção não impõe limitação alguma ao método para estimar os parâmetros estéreos no conjunto de parâmetros estéreos de Nésimo quadro.
[00208] Etapa 215: O codificador envia um fluxo de bits de Nésimo quadro para um decodificador, onde o fluxo de bits de Nésimo quadro inclui o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro.
[00209] Etapa 216: O decodificador decodifica o fluxo de bits de Nésimo quadro, se determinar que o fluxo de bits de Nésimo quadro é um quadro do terceiro tipo, para obter o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro, determina, de acordo uma primeira regra predefinida, sinais downmixed de quadro m no pelo menos um sinal downmixed de quadro um precedendo o sinal downmixed de Nésimo quadro, obtém o sinal downmixed de Nésimo quadro de acordo com os sinais dm de quadro m com base em um segundo algoritmo predeterminado, onde m é um número inteiro positivo maior do que 0 e realiza a etapa 218.
[00210] Especificamente, um valor médio de sinal downmixed de (N-3)ésimo quadro, um sinal downmixed de (N-2)ésimo quadro e um sinal downmixed de (N-1)ésimo quadro é usado diretamente como o sinal downmixed de Nésimo quadro ou sinal downmixed de Nésimo quadro é estimado de acordo com outro algoritmo.
[00211] Além disso, o sinal downmixed de (N-l)ésimo quadro pode ser usado diretamente como o sinal downmixed de Nésimo quadro ou o sinal downmixed de Nésimo quadro é calculado de acordo com o sinal downmixed de (N-1)ésimo quadro e um valor de desvio predefinido com base em um algoritmo predefinido.
[00212] Etapa 217: Depois de receber um fluxo de bits de Nésimo quadro, um decodificador determina que o fluxo de bits de Nésimo quadro é um quadro de quarto tipo, determina, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos precedendo o conjunto de parâmetros estéreos de Nésimo quadro e obtém o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um sexto algoritmo predeterminado; e
[00213] determina, de acordo com uma primeira regra predefinida, sinais downmixed de quadro m em pelo menos um sinal downmixed de quadro um precedendo o sinal down-mix de Nésimo quadro e obtém o sinal downmixed de Nésimo quadro de acordo com os sinais downmixed de quadro m com base em um segundo algoritmo predeterminado, onde m é um número inteiro positivo maior do que 0.
[00214] Etapa 218: O decodificador restaura o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro nos dois canais de acordo com um parâmetro estéreo alvo no conjunto de parâmetros estéreos de Nésimo quadro com base em um sétimo algoritmo predeterminado.
[00215] Além disso, com base nesta modalidade da presente invenção, se o codificador detectar, usando os sinais de áudio de Nésimo quadro nos dois canais, que o sinal downmixed de Nésimo quadro inclui o sinal de fala, outra maneira de codificar um conjunto de parâmetros estéreos é fornecida adicionalmente. Especificamente, se for detectado que qualquer um dos sinais de áudio de Nésimo quadro nos dois canais inclui o sinal de fala, o codificador obtém o parâmetro estéreo de Nésimo quadro definido de acordo com os sinais de áudio de Nésimo quadro com base em uma primeira forma de geração de conjunto de parâmetros estéreos e codifica o conjunto de parâmetros estéreos de Nésimo quadro.
[00216] Quando o codificador determina que nenhum dos sinais de áudio de Nésimo quadro nos dois canais inclui o sinal de fala: se os sinais de áudio de Nésimo quadro satisfazem uma condição de codificação de quadro de fala predefinida, o codificador obtém o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os sinais de áudio de Nésimo quadro com base em um primeiro modo de geração de conjunto de parâmetros estéreos, e codifica o conjunto de parâmetros estéreos de Nésimo quadro ou se os sinais de áudio de Nésimo quadro não satisfazem uma condição de codificação de quadro de fala predefinida, o codificador obtém o conjunto de parâmetros estéreos de Nésimo quadro definido de acordo com os sinais de áudio de Nésimo quadro com base em uma segunda forma de geração de conjunto de parâmetros estéreos, e
[00217] codifica pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro ao determinar que o conjunto de parâmetros estéreos de Nésimo quadro satisfaz uma condição de codificação de parâmetro estéreo predefinida; ou ignora a codificação do conjunto de parâmetros estéreos ao determinar que o conjunto de parâmetros estéreos de Nésimo quadro não satisfaz uma condição de codificação de parâmetros estéreos predefinida.
[00218] O primeiro modo de geração de conjunto de parâmetros estéreos e o segundo modo de geração de conjunto de parâmetros estéreos satisfazem pelo menos uma das seguintes condições:
[00219] Uma quantidade que é de tipos de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreos não é menor que uma quantidade que é dos tipos de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na segunda forma de geração de conjunto de parâmetros estéreos uma quantidade que é de parâmetros estéreos incluídos em um conjunto de parâmetros estéreo e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreos não é menor que uma quantidade que é de parâmetros estéreos incluídos um conjunto de parâmetros estéreos e que é estipulado na segunda maneira de geração de conjunto de parâmetros estéreos, a resolução no domínio do tempo que é de um parâmetro estéreo e estipulada na primeira forma de geração do conjunto de parâmetros estéreos não é inferior à resolução no domínio do tempo que é de um parâmetro estéreo correspondente e que é estipulado na segunda forma de geração de conjunto de parâmetros estéreos, ou resolução de domínio de frequência que é de um parâmetro estéreo e que é estipulado na primeira forma de geração do conjunto de parâmetros estéreos não é inferior à resolução do domínio da frequência que é de um parâmetro estéreo correspondente e que é estipulado na segunda forma de geração do conjunto de parâmetros estéreos.
[00220] Especificamente, a precisão no domínio da frequência ou a precisão no domínio do tempo de um conjunto de parâmetros estéreos obtido na primeira forma de geração de conjunto estéreo é maior do que a de um conjunto de parâmetros estéreos obtido na segunda geração de conjunto estéreo.
[00221] Além disso, em um método de processamento de sinal de áudio multicanal na modalidade 3 da presente invenção, ao detectar que um sinal downmixed de Nésimo quadro inclui um sinal de fala, um codificador codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de voz. e codifica um conjunto de parâmetros estéreos de Nésimo quadro; ou quando um codificador detecta que um sinal downmixed de Nésimo quadro não inclui um sinal de fala: se o sinal downmixed de Nésimo quadro satisfaz uma condição de codificação de quadro de fala predefinida, o codificador codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de fala, e codifica um conjunto de parâmetros estéreos de Nésimo quadro ou se o sinal downmixed de Nésimo quadro não satisfaz uma condição de codificação predefinida, mas satisfaz uma condição de codificação SID predefinida, o codificador codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação SID e codifica pelo menos um parâmetro estéreo em um conjunto de parâmetros estéreos de Nésimo quadro ou se o sinal downmixed de Nésimo quadro não satisfizer nem uma condição de codificação de quadro de fala predefinida nem uma condição de codificação SID predefinida, o codificador não codifica sinal downmixed de Nésimo quadro nem um conjunto de parâmetros estéreos de Nésimo quadro.
[00222] Deve ser compreendido que uma diferença entre a modalidade 3 da presente invenção e a modalidade 1 da presente invenção ou entre a modalidade 3 da presente invenção e a modalidade 2 da presente invenção reside em: O codificador não realiza a determinação em um conjunto de parâmetros estéreos e codifica o conjunto de parâmetros estéreos independente de qual maneira é usada para codificar um sinal downmixed.
[00223] Na modalidade 3 da presente invenção, um fluxo de bits obtido após o codificador codificar o sinal downmixed inclui dois tipos de quadros: um quadro do primeiro tipo e um quadro de segundo tipo. O quadro do primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos e o quadro de segundo tipo não inclui nem um sinal downmixed, nem um conjunto de parâmetros estéreos. Especificamente, para um método para restaurar o fluxo de bits para sinais de áudio em dois canais por um decodificador após o recebimento do fluxo de bits, refira-se à modalidade 2 da presente invenção e à modalidade 1 da presente invenção.
[00224] Com base na modalidade 3 da presente invenção, opcionalmente, quando o sinal downmixed de Nésimo quadro não satisfaz nem a condição de codificação de quadro de fala predefinida, nem a condição de codificação de SID predefinida, o codificador determina se o conjunto de parâmetros estéreos de Nésimo quadro satisfaz uma condição de codificação de parâmetros estéreos predefinida e, se o conjunto de parâmetros estéreos de Nésimo quadro satisfaz a condição de codificação de parâmetros estéreos predefinida, o codificador não codifica o sinal downmixed de Nésimo quadro, mas codifica pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro, ou, se o conjunto de parâmetros estéreos de Nésimo quadro não satisfaz a condição de codificação de parâmetro estéreo predefinido, o codificador não codifica nem o sinal downmixed de Nésimo quadro nem o conjunto de parâmetros estéreos de Nésimo quadro.
[00225] Um fluxo de bits obtido com base no método de codificação precedente inclui três tipos de quadros: um quadro do primeiro tipo, um quadro do terceiro tipo e um quadro de quarto tipo. O quadro do primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, o quadro de terceiro tipo não inclui sinal downmixed, mas inclui um conjunto de parâmetros estéreos e o quadro de quarto tipo não inclui nem um sinal downmixed, nem um conjunto de parâmetros estéreos. Especificamente, para um método para restaurar o fluxo de bits para sinais de áudio em dois canais por um decodificador após o recebimento do fluxo de bits, refira-se à modalidade 2 da presente invenção e à modalidade 1 da presente invenção.
[00226] Uma diferença entre a solução técnica precedente e a modalidade 2 da presente invenção reside em: Quando o sinal downmixed de Nésimo quadro não satisfaz nem a condição de codificação de quadro de fala predefinida, nem a condição de codificação de SID predefinida, o codificador determina se o conjunto de parâmetros estéreos de Nésimo quadro satisfaz a condição de codificação de parâmetros estéreos predefinida.
[00227] Opcionalmente, em um método de processamento de sinal de áudio multicanais na modalidade 4 da presente invenção, quando detectando que um sinal downmixed de Nésimo quadro inclui um sinal de fala, um codificador codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de fala e codifica um conjunto de parâmetros estéreos de Nésimo quadro; ou, quando um codificador detecta que um sinal downmixed de Nésimo quadro não inclui um sinal de fala; se o sinal downmixed de Nésimo quadro satisfaz uma condição de codificação de quadro de fala predefinida, o codificador codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de fala e codifica um conjunto de parâmetros estéreos de Nésimo quadro ou se o sinal downmixed de Nésimo quadro não satisfaz uma condição de codificação de quadro de fala predefinida, mas satisfaz uma condição de codificação de SID predefinida, o codificador determina se um conjunto de parâmetros estéreos de Nésimo quadro satisfaz uma condição de codificação de parâmetros estéreos predefinidos e, quando o conjunto de parâmetros estéreos de Nésimo quadro satisfaz a condição de codificação de conjunto de parâmetros estéreos predefinida, o codificador codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de SID e codifica pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro ou, quando o conjunto de parâmetros estéreos de Nésimo quadro não satisfaz uma condição de codificação de conjunto de parâmetros estéreos predefinida, o codificador codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação SID, mas não codifica o conjunto de parâmetros estéreos de Nésimo quadro; ou, se o sinal downmixed de Nésimo quadro não satisfaz nem uma condição de codificação de quadro de fala predefinida, nem uma condição de codificação de SID predefinida, o codificador não codifica nem um sinal downmixed de Nésimo quadro, nem um conjunto de parâmetros estéreos de Nésimo quadro.
[00228] Um fluxo de bits obtido com base em um modo de codificação na modalidade 4 da presente invenção inclui três tipos de quadros: um quadro do quinto tipo, um quadro do sexto tipo e um quadro do segundo tipo. O quadro do quinto tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos: o quadro do sexto tipo inclui um sinal downmixed, mas não inclui um conjunto de parâmetros estéreos e o quadro do segundo tipo não inclui nem um sinal downmixed, nem um conjunto de parâmetros estéreos. Especificamente, para um método para restauração do fluxo de bits para sinais de áudio em dois canais por um decodificador após o recebimento do fluxo de bits, refira-se à modalidade 2 da presente invenção e à modalidade 1 da presente invenção.
[00229] Uma diferença entre a modalidade 4 da presente invenção e a modalidade 2 da presente invenção reside em: Quando o sinal downmixed de Nésimo quadro não satisfaz a condição de codificação de quadro de fala predefinida, mas satisfaz a condição de codificação de SID predefinida, o codificador determina se codifica o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro e, quando o sinal downmixed de Nésimo quadro não satisfaz nem a condição de codificação de quadro de fala predefinida, nem a condição de codificação de SID predefinida, salta a codificação do conjunto de parâmetros estéreos de Nésimo quadro.
[00230] Na modalidade 3 da presente invenção e na modalidade 4 da presente invenção, especificamente, para uma maneira de obtenção do sinal downmixed de Nésimo quadro e do conjunto de parâmetros estéreos de Nésimo quadro pelo decodificador, refira-se à modalidade 2 da presente invenção e à modalidade 1 da presente invenção e para implementação específica de codificação de um parâmetro estéreo e um sinal downmixed, refira-se à modalidade 2 da presente invenção e à modalidade 1 da presente invenção.
[00231] Em qualquer modalidade da presente invenção. primeiro e segundo no primeiro algoritmo predeterminado não têm significados especiais e são usados apenas para distinguir entre diferentes algoritmos, terceiro, quarto, quinto, sexto, sétimo e semelhantes são similares e detalhes não são descritos aqui.
[00232] Com base em um mesmo conceito da invenção, as modalidades da presente invenção proporcionam ainda um codificador, um decodificador e um sistema de codificação e decodificação. Como os métodos correspondentes ao codificador, ao decodificador e ao sistema de codificação e decodificação nas modalidades da presente invenção são o método de processamento de sinal de áudio multicanal nas modalidades da presente invenção, para implementações do codificador, do decodificador e do sistema de codificação e decodificação nas modalidades da presente invenção, refiram-se à implementação do método e os detalhes não são repetidos aqui.
[00233] Como mostrado na figura 3a, um codificador em uma modalidade da presente invenção inclui uma unidade de detecção de sinal 300 e uma unidade de codificação de sinal 310. A unidade de detecção de sinal 300 é configurada para detectar se um sinal downmixed de Nésimo quadro inclui um sinal de fala. O sinal downmixed de Nésimo quadro é obtido após os sinais de áudio de Nésimo quadro em dois dos múltiplos canais serem misturados com base em um primeiro algoritmo predeterminado, e N é um número inteiro positivo maior do que 0. A unidade de codificação de sinal 310 é configurada para: codificar o sinal downmixed de Nésimo quadro quando a unidade de detecção de sinal 300 detecta que o sinal downmixed de Nésimo quadro inclui o sinal de fala; ou quando a unidade de detecção de sinal 300 detecta que o sinal downmixed de Nésimo quadro não inclui o sinal de voz: codificar o sinal downmixed de Nésimo quadro se a unidade de detecção de sinal 300 determinar que o sinal downmixed de Nésimo quadro satisfaz uma condição de codificação de quadro de áudio predefinida; ou pular a codificação do sinal downmixed de Nésimo quadro, se a unidade de detecção de sinal 300 determinar que o sinal downmixed de Nésimo quadro não satisfaz uma condição de codificação de quadro de áudio predefinida.
[00234] Opcionalmente, como mostrado na figura 3b, a unidade de codificação de sinal 310 inclui uma primeira unidade de codificação de sinal 311 e uma segunda unidade de codificação de sinal 312. Quando a unidade de detecção de sinal 300 detecta que o sinal downmixed de Nésimo quadro inclui o sinal de voz, a unidade de detecção de sinal 300 instrui a primeira unidade de codificação de sinal 311 para codificar o sinal downmixed de Nésimo quadro.
[00235] Se for determinado que o sinal downmixed de Nésimo quadro satisfaz uma condição de codificação de quadro de fala predefinida, a unidade de detecção de sinal 300 instrui a primeira unidade de codificação de sinal 311 a codificar o sinal downmixed de Nésimo quadro.
[00236] Especificamente, estipula-se que a primeira unidade de codificação de sinal 311 codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de quadro de fala predefinida.
[00237] Se for determinado que o sinal downmixed de Nésimo quadro não satisfaz uma condição de codificação de quadro de fala predefinida, mas satisfaz uma condição de codificação de quadro SID de descritor de inserção de silêncio predefinida, a unidade de detecção de sinal 300 instrui a segunda unidade de codificação de sinal 312 a codificar o sinal downmixed de Nésimo quadro. Especificamente, estipula-se que a segunda unidade de codificação de sinal 312 codifica o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação SID predefinida. A taxa de codificação SID não é maior que a taxa de codificação do quadro de fala.
[00238] Opcionalmente, como mostrado na figura 3a e na figura 3b, o codificador inclui ainda uma unidade de geração de parâmetros 320, uma unidade de codificação de parâmetros 330 e uma unidade de detecção de parâmetros 340. A unidade de geração de parâmetros 320 é configurada para obter um conjunto de parâmetros estéreos de Nésimo quadro, de acordo com os sinais de áudio de Nésimo quadro. O conjunto de parâmetros estéreos de Nésimo quadro inclui Z parâmetros estéreos, os Z parâmetros estéreos incluem um parâmetro que é usado quando o codificador mistura os sinais de áudio de Nésimo quadro com base no primeiro algoritmo predeterminado, e Z é um número inteiro positivo maior do que 0. A unidade de codificação de parâmetros 330 é configurada para: codificar o conjunto de parâmetros estéreos de Nésimo quadro quando a unidade de detecção de sinal detecta que o sinal downmixed de Nésimo quadro inclui o sinal de fala; ou quando a unidade de detecção de sinal 300 detecta que o sinal downmixed de Nésimo quadro não inclui o sinal de fala, codificar pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro, se a unidade de detecção de sinal 300 determinar que o conjunto de parâmetros estéreos de Nésimo quadro satisfaz uma condição de codificação de parâmetros estéreos predefinida; ou pular a codificação do conjunto de parâmetros estéreos se a unidade de detecção de sinal 300 determinar que o conjunto de parâmetros estéreos de Nésimo quadro não satisfaz uma condição de codificação de parâmetros estéreos predefinida.
[00239] Opcionalmente, a unidade de codificação de parâmetros 330 é configurada para: obter X parâmetros estéreos alvo de acordo com os Z parâmetros estéreos no conjunto de parâmetros estéreos de Nésimo quadro com base em uma regra de redução de dimensão de parâmetro estéreo predefinida e codificar os x parâmetros estéreos alvo. X é um número inteiro positivo maior do que 0 e menor do que ou igual a Z.
[00240] Especificamente, quando a unidade de codificação de parâmetros 330 inclui uma unidade de codificação de primeiro parâmetro 331 e uma segunda unidade de codificação de parâmetro 332, a segunda unidade de codificação de parâmetro 332 é configurada para: obter os X parâmetros estéreo alvo de acordo com os Z parâmetros estéreos no conjunto de parâmetros estéreos de Nésimo quadro com base na regra de redução de dimensão do parâmetro estéreo predefinida e codificar os X parâmetros estéreos alvo.
[00241] Opcionalmente, com base na figura 3a e na figura 3b, como mostrado na figura 3c, a unidade de geração de parâmetros 320 do codificador inclui uma primeira unidade de geração de parâmetros 321 e uma segunda unidade de geração de parâmetros 322. Quando a unidade de detecção de sinal 300 detecta que os sinais de áudio de quadro de Nésimo quadro incluem o sinal de fala ou a unidade de detecção de sinal 300 detecta que os sinais de áudio de Nésimo quadro não incluem o sinal de fala e os sinais de áudio de Nésimo quadro satisfazem a condição de codificação de quadro de fala predefinida, a unidade de detecção de sinal 300 instrui a primeira unidade de geração de parâmetros 321 a gerar o conjunto de parâmetros estéreos de Nésimo quadro. Quando a unidade de detecção de sinal 300 detecta que os sinais de áudio de Nésimo quadro não incluem o sinal de fala e os sinais de áudio de Nésimo quadro não satisfazem a condição de codificação de quadro de fala predefinida, a unidade de detecção de sinal 300 instrui a segunda unidade de geração de parâmetros 322 para gerar o conjunto de parâmetros estéreos de Nésimo quadro. Especificamente, é pré-estipulado que a primeira unidade de geração de parâmetros 321 obtém o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os sinais de áudio de Nésimo quadro com base em uma primeira forma de geração de conjunto de parâmetros estéreos e a segunda unidade de geração de parâmetros 322 obtém o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os sinais de áudio de Nésimo quadro com base em uma segunda forma de geração de conjunto de parâmetros estéreos.
[00242] A primeira forma de geração de conjunto de parâmetros estéreos e a segunda forma de geração de conjunto de parâmetros estéreos satisfazem pelo menos uma das seguintes condições:
[00243] Uma quantidade que é de tipos de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreos não é menor que uma quantidade de tipos de parâmetros estéreos incluídos em um conjunto de parâmetros estéreo e que é estipulado na segunda forma de geração de conjunto de parâmetros estéreos, uma quantidade que é de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreo não é menor que uma quantidade que é de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado no segundo modo de geração de conjunto de parâmetros estéreos, a resolução no domínio do tempo que é de um parâmetro estéreo e que é estipulada na primeira forma de geração do conjunto de parâmetros estéreos não é inferior à resolução no domínio do tempo de um parâmetro estéreo correspondente e que é estipulado na segunda forma de geração de conjunto de parâmetros estéreos, ou resolução de domínio de frequência que é de um parâmetro estéreo e que é estipulada na primeira forma de geração do conjunto de parâmetros estéreos não é inferior à resolução do domínio da frequência que é de um parâmetro estéreo correspondente e que é estipulada na segunda forma de geração do conjunto de parâmetros estéreos.
[00244] Após a segunda unidade de geração de parâmetros 322 obter o conjunto de parâmetros estéreos de Nésimo quadro, a unidade de codificação de parâmetros 330 codifica o conjunto de parâmetros estéreos de Nésimo quadro. Especificamente, como mostrado na figura 3d, quando a unidade de codificação de parâmetros 330 inclui uma primeira unidade de codificação de parâmetros 331 e uma segunda unidade de codificação de parâmetros 332, a primeira unidade de codificação de parâmetros 331 codifica o conjunto de parâmetros estéreos de Nésimo quadro gerado pela primeira unidade de geração de parâmetros 321 e a segunda unidade de codificação de parâmetros 332 codifica o conjunto de parâmetros estéreos de Nésimo quadro gerado pela segunda unidade de geração de parâmetros 322. É pré- estipulado que uma maneira de codificação da primeira unidade de codificação de parâmetros 331 é uma primeira maneira de codificação, e é pré-estipulado que uma forma de codificação da segunda unidade de codificação de parâmetros 332 é uma segunda maneira de codificação. Uma maneira de codificação estipulada pela primeira unidade de codificação de parâmetros é a primeira forma de codificação, e uma maneira de codificação estipulada pela segunda unidade de codificação de parâmetros é a segunda maneira de codificação. Especificamente, uma taxa de codificação estipulada na primeira maneira de codificação não é menor do que uma taxa de codificação estipulada na segunda maneira de codificação; e / ou para qualquer parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro, a precisão de quantização estipulada na primeira maneira de codificação não é inferior à precisão de quantização estipulada na segunda maneira de codificação.
[00245] O conjunto de parâmetros estéreos não é codificado quando a unidade de detecção de parâmetros 340 determina que o conjunto de parâmetros estéreos de Nésimo quadro não satisfaz a condição de codificação de parâmetro estéreo predefinida.
[00246] Opcionalmente, a unidade de codificação de parâmetros 330 inclui uma primeira unidade de codificação de parâmetros 331 e uma segunda unidade de codificação de parâmetro 332. Especificamente, a primeira unidade de codificação de parâmetro 331 é configurada para codificar o conjunto de parâmetros estéreos de Nésimo quadro de acordo com uma primeira maneira de codificação quando o sinal downmixed de Nésimo quadro inclui o sinal de fala e quando o sinal downmixed de Nésimo quadro não inclui o sinal de fala, mas satisfaz a condição de codificação de quadro de fala. A segunda unidade de codificação de parâmetros 332 está configurada para codificar pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro de acordo com uma segunda forma de codificação quando o sinal downmixed de Nésimo quadro não satisfizer a condição de codificação de quadro de fala.
[00247] Uma taxa de codificação estipulada na primeira maneira de codificação não é menor do que uma taxa de codificação estipulada na segunda maneira de codificação; e / ou para qualquer parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro, a precisão de quantização estipulada na primeira maneira de codificação não é inferior à precisão de quantização estipulada na segunda maneira de codificação.
[00248] Opcionalmente, se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro incluir um ILD de diferença de nível intercanais, a condição de codificação de parâmetro estéreo predefinida inclui D > D, onde D representa um grau pelo qual ILD se desvia de um primeiro padrão, o primeiro padrão é determinado com base em um segundo algoritmo predeterminado de acordo com conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Nésimo quadro e T é um número inteiro positivo maior do que 0.
[00249] Se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro incluir um ITD de diferença de tempo intercanais, a condição de codificação de parâmetros estéreos predefinida incluir D> D, onde D representa um grau pelo qual ITD se desvia de um segundo padrão, o segundo padrão é determinado com base em um terceiro algoritmo predeterminado de acordo com conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Nésimo quadro e T é um número inteiro positivo maior do que 0.
[00250] Se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro incluir um IPD de diferença de fase intercanais, a condição de codificação de parâmetros estéreos predefinida incluir D> D, onde D representa um grau pelo qual IPD se desvia de um terceiro padrão, o terceiro padrão é determinado com base em um quarto algoritmo predeterminado de acordo com conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Nésimo quadro e T é um número inteiro positivo maior do que 0.
[00251] Opcionalmente, D , D e D satisfazem, respectivamente as seguintes expressões:
[00252] Onde ILD(m) é uma diferença de nível gerada quando sinais de áudio de Nésimo quadro são transmitidos, respectivamente, nos dois canais em uma mésima banda de subfrequências, M é uma quantidade total de bandas de subfrequências ocupadas para transmissão dos sinais de áudio de Nésimo quadro,é um valor médio de ILDs nos conjuntos de parâmetros estéreos de quadro T, precedendo o conjunto de parâmetros estéreos de Nésimo quadro na mésima banda de subfrequências, T é um número inteiro positivo maior do que 0, ILD[-t](m) é uma diferença de nível gerada quando sinais de áudio de quadro T precedendo os sinais de áudio de Nésimo quadro são transmitidos, respectivamente, nos dois canais na mésima banda de subfrequências, ITD é uma diferença de tempo gerada quando os sinais de áudio de Nésimo quadro são transmitidos, respectivamente, nos dois canais, é um valor médio de ITDs nos conjuntos de parâmetros estéreos de quadro T, precedendo o conjunto de parâmetros estéreos de Nésimo quadro, ITD[-t] é uma diferença de tempo gerada quando os sinais de áudio de quadro T precedendo os sinais de áudio de Nésimo quadro são transmitidos, respectivamente, nos dois canais, IPD(m) é uma diferença de fase gerada quando alguns dos sinais de áudio de Nésimo quadro são transmitidos, respectivamente, nos dois canais na mésima banda de subfrequências, é um valor médio de IPDs nos conjuntos de parâmetros estéreos de quadro T, precedendo o conjunto de parâmetros estéreos de Nésimo quadro na mésima banda de subfrequências e ipD[-t](m) é uma diferença de fase gerada quando os sinais de áudio de quadro t precedendo os sinais de áudio de Nésimo quadro são transmitidos, respectivamente, nos dois canais na mésima banda de subfrequências.
[00253] Deve ser notado que a unidade de detecção de parâmetros 340 na figura 3a até a figura 3d é opcional. Isto é, o codificador pode incluir a unidade de detecção de parâmetros 340 ou pode não incluir a unidade de detecção de parâmetros 340.
[00254] Quando a unidade de codificação de parâmetros 300 codifica cada quadro de conjunto de parâmetros estéreos da unidade de geração de parâmetros 320, o parâmetro estéreo não precisa ser detectado, mas é codificado diretamente.
[00255] Como mostrado na figura 4, um decodificador em uma modalidade da presente invenção inclui uma unidade receptora 400 e uma unidade de decodificação 410. A unidade receptora 400 está configurada para receber um fluxo de bits. O fluxo de bits inclui pelo menos dois quadros, os pelo menos dois quadros incluem pelo menos um quadro de primeiro tipo e pelo menos um quadro de segundo tipo, o quadro de primeiro tipo inclui um sinal downmixed e o quadro de segundo tipo não inclui sinal downmixed. Para um fluxo de bits Nésimo quadro, onde N é um número inteiro positivo maior do que 1, a unidade de decodificação 410 é configurada para: se for determinado que o fluxo de bits de Nésimo quadro é do primeiro tipo, decodificar o fluxo de bits de Nésimo quadro para obter um sinal downmixed de Nésimo quadro; ou se for determinado que o fluxo de bits de Nésimo quadro é do segundo tipo, determinar, de acordo com uma primeira regra predefinida, sinais downmixed em quadro-m em pelo menos um sinal downmixed de quadro um precedendo um sinal downmixed de Nésimo quadro e obter o sinal downmixed de Nésimo quadro de acordo com os sinais downmixed de quadro m com base em um primeiro algoritmo predeterminado. m é um número inteiro positivo maior do que 0.
[00256] O sinal downmixed de Nésimo quadro é obtido por um codificador através da mixagem de sinais de áudio de Nésimo quadro em dois de múltiplos canais com base em um segundo algoritmo predeterminado.
[00257] Opcionalmente, como mostrado na figura 4, o decodificador inclui ainda uma unidade de restabelecimento de sinal 420. O quadro do primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos e o quadro do segundo tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed.
[00258] Se for determinado que o fluxo de bits de Nésimo quadro é do primeiro tipo, a unidade de decodificação 410 decodifica o fluxo de bits de Nésimo quadro, para obter o sinal downmixed de Nésimo quadro e um conjunto de parâmetros estéreos de Nésimo quadro; ou se for determinado que o fluxo de bits de Nésimo quadro é um quadro do segundo tipo, a unidade de decodificação 410 decodifica o fluxo de bits de Nésimo quadro, para obter um conjunto de parâmetros estéreos de Nésimo quadro. Pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base em um terceiro algoritmo predeterminado.
[00259] A unidade de restauração de sinal 420 é configurada para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base no terceiro algoritmo.
[00260] Opcionalmente, o quadro de primeiro tipo inclui tanto um sinal downmixed quanto um conjunto de parâmetros estéreos e o quadro de segundo tipo não inclui nem um conjunto de parâmetros estéreos nem um sinal downmixed.
[00261] A unidade de decodificação 410 é ainda configurada para: se for determinado que o fluxo de bits de Nésimo quadro é um quadro de primeiro tipo, decodificar o fluxo de bits de Nésimo quadro, para obter tanto o sinal downmixed de Nésimo quadro quanto um conjunto de parâmetros estéreos de Nésimo quadro; ou, se for determinado que o fluxo de bits de Nésimo quadro é do segundo tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos precedendo um conjunto de parâmetros estéreos de Nésimo quadro e obter o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os conjuntos de parâmetros estéreos quadro k com base em um quarto algoritmo predeterminado. k é um número inteiro positivo maior do que 0.
[00262] Pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base em um terceiro algoritmo predeterminado.
[00263] Uma unidade de restauração de sinal 420 é configurada para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base no terceiro algoritmo.
[00264] Opcionalmente, o quadro do primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, um quadro de terceiro tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed, um quadro do quarto tipo não inclui um sinal downmixed nem um conjunto de parâmetros estéreo, e cada um dos quadros de terceiro tipo e de quarto tipo é um caso do quadro de segundo tipo.
[00265] A unidade de decodificação 410 é ainda configurada para: se for determinado que o fluxo de bits de Nésimo quadro é um quadro do primeiro tipo, decodificar o fluxo de bits de Nésimo quadro, para obter tanto o sinal downmixed de Nésimo quadro quanto um conjunto de parâmetros estéreos de Nésimo quadro; ou se for determinado que o fluxo de bits de Nésimo quadro é um quadro de segundo tipo, quando o fluxo de bits de Nésimo quadro é o quadro de terceiro tipo, decodificar o fluxo de bits de Nésimo quadro, para obter um conjunto de parâmetros estéreos de Nésimo quadro ou quando o fluxo de bits de Nésimo quadro é o quadro de quarto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de um quadro precedendo um conjunto de parâmetros estéreos de Nésimo quadro e obter o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado. k é um número inteiro positivo maior do que 0.
[00266] Pelo menos um parâmetro estéreo no conjunto de parâmetros estéreo de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base em um terceiro algoritmo predeterminado.
[00267] Uma unidade de restauração de sinal 420 é configurada para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base no terceiro algoritmo.
[00268] Opcionalmente, um quadro de quinto tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, um quadro do sexto tipo inclui um sinal downmixed, mas não inclui um conjunto de parâmetros estéreos, cada um dentre o quadro do quinto tipo e o do sexto tipo é um caso do quadro do primeiro tipo, e o quadro do segundo tipo não inclui um sinal downmixed nem um conjunto de parâmetros estéreos.
[00269] A unidade de decodificação 410 é ainda configurada para: se for determinado que o fluxo de bits de Nésimo quadro é o quadro de primeiro tipo, quando o fluxo de bits de Nésimo quadro é do quinto tipo, decodificar o fluxo de bits de Nésimo quadro, obter o sinal downmixed de Nésimo quadro e um conjunto de parâmetros estéreos de Nésimo quadro; ou quando o fluxo de bits de Nésimo quadro for um quadro do sexto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de um quadro precedendo um conjunto de parâmetros estéreos de Nésimo quadro e obter o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado.
[00270] A unidade de decodificação 410 está ainda configurada para: se for determinado que o fluxo de bits de Nésimo quadro é do segundo tipo de quadro, determinar, de acordo com uma segunda regra predefinida, conjuntos de parametros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de um quadro que precede um conjunto de parâmetros estéreos de Nésimo quadro, e obter o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado.
[00271] Pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base em um terceiro algoritmo predeterminado, e k é um número inteiro positivo maior do que 0.
[00272] Uma unidade de restauração de sinal 420 é configurada para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base no terceiro algoritmo.
[00273] Opcionalmente, um quadro de quinto tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, um quadro do sexto tipo inclui um sinal downmixed, mas não inclui um conjunto de parâmetros estéreos, cada um dentre o quadro do quinto tipo e o quadro de sexto tipo é um caso do quadro de primeiro tipo, um quadro de terceiro tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed, um quadro de quarto tipo não inclui um sinal downmixed ou um conjunto de parâmetros estéreos do quadro do terceiro tipo e do quadro do quarto tipo é um caso do quadro do segundo tipo.
[00274] A unidade de decodificação 410 é ainda configurada para: se for determinado que o fluxo de bits de Nésimo quadro é o quadro de primeiro tipo, quando o fluxo de bits de Nésimo quadro é o quadro do quinto tipo, decodificar o fluxo de bits de Nésimo quadro, obter o sinal downmixed de Nésimo quadro e um conjunto de parâmetros estéreos de Nésimo quadro; ou quando o fluxo de bits de Nésimo quadro for um quadro do sexto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de um quadro precedendo um conjunto de parâmetros estéreos de Nésimo quadro e obter o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os conjuntos de parâmetros estéreo de quadro k com base em um quarto algoritmo predeterminado.
[00275] A unidade de decodificação 410 é ainda configurada para: se for determinado que o fluxo de bits de Nésimo quadro é o quadro de segundo tipo, quando o fluxo de bits de Nésimo quadro é o quadro de terceiro tipo, decodificar o fluxo de bits de Nésimo quadro obter um conjunto de parâmetros estéreos de Nésimo quadro ou, quando o fluxo de bits de Nésimo quadro for o quadro de quarto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de um quadro precedendo um conjunto de parâmetros estéreos de Nésimo quadro e obter o conjunto de parâmetros estéreos de Nésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado.
[00276] Pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base em um terceiro algoritmo predeterminado, e k é um número inteiro positivo maior do que 0.
[00277] Uma unidade de restauração de sinal 420 é configurada para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Nésimo quadro com base no terceiro algoritmo.
[00278] Como mostrado na figura 5, uma modalidade da presente invenção proporciona um sistema de codificação e decodificação, incluindo qualquer codificador 500 mostrado na figura 3a e na figura 3b e o decodificador 510 mostrado na figura 4
[00279] Pessoas especializadas na técnica devem compreender que as modalidades da presente invenção podem ser fornecidas como um método, um sistema ou um produto de programa de computador. Por conseguinte, a presente invenção pode utilizar uma forma de apenas modalidades de hardware, apenas modalidades de software, ou modalidades com uma combinação de software e hardware. Além disso, a presente invenção pode usar uma forma de produto de programa de computador que é implementado em um ou mais meios de armazenamento utilizáveis por computador (incluindo mas não limitado a uma memória de disco, um CD-ROM, uma memória ótica e similares) que incluem código de programa utilizável por computador.
[00280] A presente invenção é descrita com referência aos fluxogramas e / ou diagramas de blocos do método, do dispositivo (sistema) e do produto de programa de computador de acordo com as modalidades da presente invenção. Deve ser entendido que as instruções do programa de computador podem ser usadas para implementar cada processo e / ou cada bloco nos fluxogramas e / ou nos diagramas de blocos e implementar uma combinação de um processo e / ou um bloco nos fluxogramas e / ou diagramas de blocos. Estas instruções de programas de computador podem ser fornecidas para um computador de uso geral, um computador dedicado, um processador incorporado ou um processador de outro dispositivo de processamento de dados programável para gerar uma máquina, de modo que as instruções executadas pelo computador ou processador de outro dispositivo de processamento de dados programável gerem um aparelho para implementar uma função específica em um ou mais processos nos fluxogramas e / ou em um ou mais blocos nos diagramas de blocos.
[00281] Estas instruções de programas de computador podem ser armazenadas em uma memória legível por computador que pode instruir o computador ou o outro dispositivo de processamento de dados programável para trabalhar de uma maneira específica, para que as instruções armazenadas na memória de computador gerem um artefato que inclua um aparelho de instrução. O aparelho de instrução implementa uma função específica em um ou mais processos nos fluxogramas e / ou em um ou mais blocos nos diagramas de bloco.
[00282] Estas instruções de programas de computador podem ser carregadas no computador ou no outro dispositivo de processamento de dados programável, de modo que uma série de operações e etapas sejam executadas no computador ou no outro dispositivo programável, para gerar processamento implementado por computador. Portanto, as instruções executadas no computador ou no outro dispositivo programável fornecem etapas para implementar uma função específica em um ou mais processos nos fluxogramas e / ou em um ou mais blocos nos diagramas de blocos.
[00283] Embora algumas modalidades preferidas da presente invenção tenham sido descritas, os habilitados na técnica podem fazer alterações e modificações nestas modalidades uma vez que aprendam o conceito inventivo básico. Por conseguinte, as concretizações que se seguem destinam-se a ser interpretadas de modo a abranger as modalidades preferidas e todas as alterações e modificações abrangidas pelo âmbito da presente invenção.
[00284] Obviamente, pessoas habilitadas na técnica podem fazer várias modificações e variações na presente invenção sem se afastar do espírito e escopo da presente invenção. A presente invenção destina-se a cobrir estas modificações e variações desde que elas caiam dentro do âmbito de proteção definido pelas seguintes concretizações e suas tecnologias equivalentes.
Claims (29)
1. Método de processamento de sinal de áudio de multicanais, caracterizado pelo fato de que compreende: detectar (102), por um codificador, se um sinal downmixed de Nésimo quadro compreende um sinal de voz, em que o sinal downmixed de Nésimo quadro é obtido após sinais de áudio de Nésimo quadro em dois dentre múltiplos canais serem mixados com base em um primeiro algoritmo predeterminado, e N é um número inteiro positivo maior do que 0; e codificar (103), pelo codificador, o sinal downmixed de Nésimo quadro quando detectar que o sinal downmixed de Nésimo quadro compreende o sinal de voz; ou quando o codificador detectar que o sinal downmixed de Nésimo quadro não compreende o sinal de voz: codificar (105), pelo codificador, o sinal downmixed de Nésimo quadro se determinar que o sinal downmixed de Nésimo quadro satisfaz uma condição de codificação de quadro de áudio predefinida, ou pular codificação (106) do sinal downmixed de Nésimo quadro se determinar que o sinal downmixed de Nésimo quadro não satisfaz uma condição de codificação de quadro de áudio predefinida.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a codificação (103), pelo codificador, do sinal downmixed de Nésimo quadro, quando detectar que o sinal downmixed de Nésimo quadro compreende o sinal de voz compreende: codificar, pelo codificador, o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de quadro de voz predefinida quando detectar que o sinal downmixed de Nésimo quadro compreende o sinal de voz; ou a codificação (105), pelo codificador, do sinal downmixed de Nésimo quadro se determinar que o sinal downmixed de Nésimo quadro satisfaz uma condição de codificação de quadro de áudio predefinida compreende: codificar, pelo codificador, o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de quadro de voz predefinida se determinar que o sinal downmixed de Nésimo quadro satisfaz uma condição de codificação de quadro de voz predefinida; ou codificar, pelo codificador, o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de quadro de descritor de inserção de silêncio SID predefinido se determinar que o sinal downmixed de Nésimo quadro não satisfaz a condição de codificação de quadro de voz predefinida, mas satisfaz uma condição de codificação de SID predefinida, em que a taxa de codificação de SID não é maior do que a taxa de codificação de quadro de voz.
3. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que o método ainda compreende: obter, pelo codificador, um conjunto de parâmetro estéreo de Nésimo quadro de acordo com os sinais de áudio de Nésimo quadro, em que o conjunto de parâmetro estéreo de Nésimo quadro compreende Z parâmetros estéreos, os Z parâmetros estéreos compreendem um parâmetro que usado quando o codificador mixa os sinais de áudio de Nésimo quadro com base no primeiro algoritmo predeterminado, e Z é um número inteiro positivo maior do que 0; e codificar, pelo codificador, o conjunto de parâmetro estéreo de Nésimo quadro quando detectar que o sinal downmixed de Nésimo quadro compreende o sinal de voz; ou quando o codificador detectar que o sinal downmixed de Nésimo quadro não compreende o sinal de voz: codificar, pelo codificador, pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro se determinar que o conjunto de parâmetro estéreo de Nésimo quadro satisfaz uma condição de codificação de parâmetro estéreo predefinida, ou pular codificação do conjunto de parâmetro estéreo se determinar que o conjunto de parâmetro estéreo de Nésimo quadro não satisfaz uma condição de codificação de parâmetro estéreo predefinida.
4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que a codificação, pelo codificador, de pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro compreende: obter, pelo codificador, X parâmetros estéreos alvo de acordo com os Z parâmetros estéreos no conjunto de parâmetro estéreo de Nésimo quadro com base em uma regra de redução de dimensão de parâmetro estéreo predefinida, em que X é um número inteiro positivo maior do que 0 e menor do que ou igual a Z; e codificar, pelo codificador, os X parâmetros estéreos alvo.
5. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que ainda compreende: quando o codificador detectar que os sinais de áudio de Nésimo quadro compreendem o sinal de voz: obter, pelo codificador, o conjunto de parâmetro estéreo de Nésimo quadro de acordo com os sinais de áudio de Nésimo quadro com base em uma primeira maneira de geração de conjunto de parâmetro estéreo, e codificar o conjunto de parâmetro estéreo de Nésimo quadro; ou quando o codificador detectar que os sinais de áudio de Nésimo quadro não compreendem o sinal de voz: se determinar que os sinais de áudio de Nésimo quadro satisfazem a condição de codificação de quadro de voz predefinida, obter, pelo codificador, o conjunto de parâmetro estéreo de Nésimo quadro de acordo com os sinais de áudio de Nésimo quadro com base em uma primeira maneira de geração de conjunto de parâmetro estéreo, e codificar o conjunto de parâmetro estéreo de Nésimo quadro; ou se determinar que os sinais de áudio de Nésimo quadro não satisfazem a condição de codificação de quadro de voz predefinida, obter, pelo codificador, o conjunto de parâmetro estéreo de Nésimo quadro de acordo com os sinais de áudio de Nésimo quadro com base em uma segunda maneira de geração de conjunto de parâmetro estéreo, e codificar pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro quando determinar que o conjunto de parâmetro estéreo de Nésimo quadro satisfaz uma condição de codificação de parâmetro estéreo predefinida, ou pular codificação do conjunto de parâmetro estéreo quando determinar que o conjunto de parâmetro estéreo de Nésimo quadro não satisfaz uma condição de codificação de parâmetro estéreo predefinida; em que a primeira maneira de geração de conjunto de parâmetro estéreo e a segunda maneira de geração de conjunto de parâmetro estéreo satisfazem pelo menos uma das seguintes condições: uma quantidade que é de tipos de parâmetros estéreos compreendidos em um conjunto de parâmetro estéreo e que é estipulada na primeira maneira de geração de conjunto de parâmetro estéreo não é menor do que uma quantidade que é de tipos de parâmetros estéreos compreendidos em um conjunto de parâmetro estéreo e que é estipulada na segunda maneira de geração de conjunto de parâmetro estéreo, uma quantidade que é de parâmetros estéreos compreendidos em um conjunto de parâmetro estéreo e que é estipulada na segunda maneira de geração de conjunto de parâmetro estéreo não é menor do que uma quantidade de parâmetros estéreos compreendidos em um conjunto de parâmetro estéreo e que é estipulada na primeira maneira de geração de conjunto de parâmetro estéreo, resolução em domínio de tempo que é de um parâmetro estéreo e que é estipulada na primeira maneira de geração de conjunto de parâmetro estéreo não é menor do que resolução em domínio de tempo que é de um parâmetro estéreo correspondente e que é estipulada na segunda maneira de geração de conjunto de parâmetro estéreo, ou resolução em domínio de frequência que é de um parâmetro estéreo e que é estipulada na primeira maneira de geração de conjunto de parâmetro estéreo não é menor do que resolução em domínio de frequência que é de um parâmetro estéreo correspondente e que é estipulada na segunda maneira de geração de conjunto de parâmetro estéreo.
6. Método, de acordo com qualquer uma das reivindicações 3 a 5, caracterizado pelo fato de que a codificação, pelo codificador, do conjunto de parâmetro estéreo de Nésimo quadro compreende: codificar, pelo codificador, o conjunto de parâmetro estéreo de Nésimo quadro de acordo com uma primeira maneira de codificação; e a codificação, pelo codificador, de pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro compreende: codificar, pelo codificador, o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro de acordo com a primeira maneira de codificação quando o sinal downmixed de Nésimo quadro satisfaz a condição de codificação de quadro de voz; ou codificar, pelo codificador, o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro de acordo com a segunda maneira de codificação quando o sinal downmixed de Nésimo quadro não satisfaz a condição de codificação de quadro de voz; em que uma taxa de codificação estipulada na primeira maneira de codificação não é menor do que uma taxa de codificação estipulada na segunda maneira de codificação; e/ou para qualquer parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro, precisão de quantização estipulada na primeira maneira de codificação não é menor do que precisão de quantização estipulada na segunda maneira de codificação.
7. Método, de acordo com qualquer uma das reivindicações 3 a 6, caracterizado pelo fato de que se o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro compreender uma diferença de nível intercanal ILD, a condição de codificação de parâmetro estéreo predefinida compreende DL > Do, em que D representa um grau pelo qual a ILD se desvia de um primeiro padrão, o primeiro padrão é determinado com base em um segundo algoritmo predeterminado de acordo com conjuntos de parâmetro estéreo de quadro T precedendo o conjunto de parâmetro estéreo de Nésimo quadro, e T é um número inteiro positivo maior do que 0; se o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro compreende uma diferença de tempo intercanal ITD, a condição de codificação de parâmetro estéreo predefinida compreende D > D, em que D representa um grau pelo qual a ITD se desvia de um segundo padrão, o segundo padrão é determinado com base em um terceiro algoritmo predeterminado de acordo com conjuntos de parâmetro estéreo de quadro T precedendo o conjunto de parâmetro estéreo de Nésimo quadro, e T é um número inteiro positivo maior do que 0; ou se o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro compreende uma diferença de fase intercanal IPD, a condição de codificação de parâmetro estéreo predefinida compreende D > D, em que D representa um grau pelo qual a IPD se desvia de um terceiro padrão, o terceiro padrão é determinado com base em um quarto algoritmo predeterminado de acordo com conjuntos de parâmetro estéreo de quadro T precedendo o conjunto de parâmetro estéreo de Nésimo quadro, e T é um número inteiro positivo maior do que 0.
8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que D , D , e D respectivamente satisfazerem as seguintes expressões: em que ILD(m) é uma diferença de nível gerada quando os sinais de áudio de Nésimo quadro são respectivamente transmitidos nos dois canais em uma mésima sub-banda de frequência, M é uma quantidade total de sub-bandas de frequência ocupadas para transmitir os sinais de áudio de Nésimo quadro, é um valor médio de ILDs nos conjuntos de parâmetro estéreo de quadro T precedendo o conjunto de parâmetro estéreo de Nésimo quadro na mésima sub-banda de frequência, T é um número inteiro positivo maior do que 0, ILD[-t](m) é uma diferença de nível gerada quando sinais de áudio de tésimo quadro precedendo os sinais de áudio de Nésimo quadro são respectivamente transmitidos nos dois canais na mésima sub-banda de frequência, a ITD é uma diferença de tempo gerada quando os sinais de áudio de Nésimo quadro são respectivamente transmitidos nos dois canais, é um valor médio de ITDs nos conjuntos de parâmetro estéreo de quadro T precedendo o conjunto de parâmetro estéreo de Nésimo quadro, iTD[-t] é uma diferença de tempo gerada quando os sinais de áudio de tésimo quadro precedendo os sinais de áudio de Nésimo quadro são respectivamente transmitidos nos dois canais, iPD(m) é uma diferença de fase gerada quando alguns dos sinais de áudio de Nésimo quadro são respectivamente transmitidos nos dois canais na mésima sub-banda de frequência, é um valor médio de IPDs nos conjuntos de parâmetro estéreo de quadro T precedendo o conjunto de parâmetro estéreo de Nésimo quadro na mésima sub-banda de frequência, e ipD[-t](m) é uma diferença de fase gerada quando os sinais de áudio de tésimo quadro precedendo os sinais de áudio de Nésimo quadro são respectivamente transmitidos nos dois canais na mésima sub-banda de frequência.
9. Método de processamento de sinal de áudio de multicanais, caracterizado pelo fato de que compreende: receber, por um decodificador, um fluxo de bits, em que o fluxo de bits compreende pelo menos dois quadros, os pelo menos dois quadros compreendem pelo menos um quadro de primeiro tipo e pelo menos um quadro de segundo tipo, o quadro de primeiro tipo compreende um sinal downmixed, e o quadro de segundo tipo não compreende um sinal downmixed; e para um fluxo de bits de Nésimo quadro, em que N é um número inteiro positivo maior do que 1, decodificar, pelo decodificador, o fluxo de bits de Nésimo quadro se determinar que o fluxo de bits de Nésimo quadro é o quadro de primeiro tipo, para obter um sinal downmixed de Nésimo quadro; ou se determinar que o fluxo de bits de Nésimo quadro é um quadro de segundo tipo, determinar, pelo decodificador de acordo com uma primeira regra predefinida, sinais downmixed de quadro m em pelo menos um sinal downmixed de quadro precedendo o sinal downmixed de Nésimo quadro, e obter o sinal downmixed de Nésimo quadro de acordo com os sinais downmixed de quadro m com base em um primeiro algoritmo predeterminado, em que m é um número inteiro positivo maior do que 0, e o sinal downmixed de Nésimo quadro é obtido por um codificador ao mixar sinais de áudio de Nésimo quadro em dois dentre múltiplos canais com base em um segundo algoritmo predeterminado.
10. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que o quadro de primeiro tipo compreende ambos um sinal downmixed e um conjunto de parâmetro estéreo, e o quadro de segundo tipo compreende um conjunto de parâmetro estéreo, mas não compreende um sinal downmixed; e após a decodificação, pelo decodificador, do fluxo de bits de Nésimo quadro se determinar que o fluxo de bits de Nésimo quadro é o quadro de primeiro tipo, o método ainda compreende: obter, pelo decodificador, um conjunto de parâmetro estéreo de Nésimo quadro; ou após o decodificador determinar que o fluxo de bits de Nésimo quadro é o quadro de segundo tipo, o método ainda compreende: decodificar, pelo decodificador, o fluxo de bits de Nésimo quadro, para obter um conjunto de parâmetro estéreo de Nésimo quadro, em que pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base no terceiro algoritmo predeterminado; e restaurar, pelo decodificador, o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro com base no terceiro algoritmo.
11. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que o quadro de primeiro tipo compreende ambos um sinal downmixed e um conjunto de parâmetro estéreo, e o quadro de segundo tipo não compreende nem um sinal downmixed nem um conjunto de parâmetro estéreo; e após a decodificação, pelo decodificador, o fluxo de bits de Nésimo quadro se determinar que o fluxo de bits de Nésimo quadro é o quadro de primeiro tipo, o método ainda compreende: obter, pelo decodificador, um conjunto de parâmetro estéreo de Nésimo quadro; ou após o decodificador determinar que o fluxo de bits de Nésimo quadro é o quadro de segundo tipo, o método ainda compreende: determinar, pelo decodificador de acordo com uma segunda regra predefinida, conjuntos de parâmetro estéreo de quadro k em pelo menos um conjunto de parâmetro estéreo de quadro precedendo o conjunto de parâmetro estéreo de Nésimo quadro, e obter o conjunto de parâmetro estéreo de Nésimo quadro de acordo com os conjuntos de parâmetro estéreo de quadro k com base em um quarto algoritmo predeterminado, em que k é um número inteiro positivo maior do que 0, e pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base no terceiro algoritmo predeterminado; e restaurar, pelo decodificador, o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro com base no terceiro algoritmo.
12. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que o quadro de primeiro tipo compreende ambos um sinal downmixed e um conjunto de parâmetro estéreo, um quadro de terceiro tipo compreende um conjunto de parâmetro estéreo, mas não compreende um sinal downmixed, um quadro de quarto tipo não compreende nem um sinal downmixed nem um conjunto de parâmetro estéreo, e cada um dentre o quadro de terceiro tipo e o quadro de quarto tipo é um caso do quadro de segundo tipo; e após a decodificação, pelo decodificador, do fluxo de bits de Nésimo quadro se determinar que o fluxo de bits de Nésimo quadro é o quadro de primeiro tipo, o método ainda compreende: obter, pelo decodificador, um conjunto de parâmetro estéreo de Nésimo quadro; ou após o decodificador determinar que o fluxo de bits de Nésimo quadro é o quadro de segundo tipo, o método ainda compreende: decodificar, pelo decodificador, o fluxo de bits de Nésimo quadro quando o fluxo de bits de Nésimo quadro é o quadro de terceiro tipo, para obter um conjunto de parâmetro estéreo de Nésimo quadro; ou quando o fluxo de bits de Nésimo quadro é o quadro de quarto tipo, determinar, pelo decodificador, de acordo com uma segunda regra predefinida, conjuntos de parâmetro estéreo de quadro k em pelo menos um conjunto de parâmetro estéreo de quadro precedendo o conjunto de parâmetro estéreo de Nésimo quadro, e obter o conjunto de parâmetro estéreo de Nésimo quadro de acordo com os conjuntos de parâmetro estéreo de quadro k com base em um quarto algoritmo predeterminado, em que k é um número inteiro positivo maior do que 0, e pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base no terceiro algoritmo predeterminado; e restaurar, pelo decodificador, o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro com base no terceiro algoritmo.
13. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que um quadro de quinto tipo compreende ambos um sinal downmixed e um conjunto de parâmetro estéreo, um quadro de sexto tipo compreende um sinal downmixed, mas não compreende um conjunto de parâmetro estéreo, cada um dentre o quadro de quinto tipo e o quadro de sexto tipo é um caso do quadro de primeiro tipo, e o quadro de segundo tipo não compreende nem um sinal downmixed nem um conjunto de parâmetro estéreo; e após o decodificador determinar que o fluxo de bits de Nésimo quadro é o quadro de primeiro tipo, o método ainda compreende: decodificar, pelo decodificador, o fluxo de bits de Nésimo quadro quando o fluxo de bits de Nésimo quadro é o quadro de quinto tipo, para obter um conjunto de parâmetro estéreo de Nésimo quadro; ou quando o fluxo de bits de Nésimo quadro é o quadro de sexto tipo, determinar, pelo decodificador de acordo com uma segunda regra predefinida, conjuntos de parâmetro estéreo de quadro k em pelo menos um conjunto de parâmetro estéreo de quadro precedendo o conjunto de parâmetro estéreo de Nésimo quadro, e obter o conjunto de parâmetro estéreo de Nésimo quadro de acordo com os conjuntos de parâmetro estéreo de quadro k com base em um quarto algoritmo predeterminado; ou após o decodificador determinar que o fluxo de bits de Nésimo quadro é o quadro de segundo tipo, o método ainda compreende: determinar, pelo decodificador de acordo com uma segunda regra predefinida, conjuntos de parâmetro estéreo de quadro k em pelo menos um conjunto de parâmetro estéreo de quadro precedendo o conjunto de parâmetro estéreo de Nésimo quadro, e obter o conjunto de parâmetro estéreo de Nésimo quadro de acordo com os conjuntos de parâmetro estéreo de quadro k com base em um quarto algoritmo predeterminado, em que pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base no terceiro algoritmo predeterminado, e k é um número inteiro positivo maior do que 0; e restaurar, pelo decodificador, o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro com base no terceiro algoritmo.
14. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que um quadro de quinto tipo compreende ambos um sinal downmixed e um conjunto de parâmetro estéreo, um quadro de sexto tipo compreende um sinal downmixed, mas não compreende um conjunto de parâmetro estéreo, cada um dentre o quadro de quinto tipo e o quadro de sexto tipo é um caso do quadro de primeiro tipo, um quadro de terceiro tipo compreende um conjunto de parâmetro estéreo, mas não compreende um sinal downmixed, um quadro de quarto tipo não compreende nem um sinal downmixed nem um conjunto de parâmetro estéreo, e cada um dentre o quadro de terceiro tipo e o quadro de quarto tipo é um caso do quadro de segundo tipo; e após o decodificador determinar que o fluxo de bits de Nésimo quadro é o quadro de primeiro tipo, o método ainda compreende: decodificar, pelo decodificador, o fluxo de bits de Nésimo quadro quando o fluxo de bits de Nésimo quadro é o quadro de quinto tipo, para obter um conjunto de parâmetro estéreo de Nésimo quadro; ou quando o fluxo de bits de Nésimo quadro é o quadro de sexto tipo, determinar, pelo decodificador de acordo com uma segunda regra predefinida, conjuntos de parâmetro estéreo de quadro K em pelo menos um conjunto de parâmetro estéreo de quadro precedendo o conjunto de parâmetro estéreo de Nésimo quadro, e obter o conjunto de parâmetro estéreo de Nésimo quadro de acordo com os conjuntos de parâmetro estéreo de quadro k com base em um quarto algoritmo predeterminado; ou após o decodificador determinar que o fluxo de bits de Nésimo quadro é o quadro de segundo tipo, o método ainda compreende: decodificar, pelo decodificador, o fluxo de bits de Nésimo quadro quando o fluxo de bits de Nésimo quadro é o quadro de terceiro tipo, para obter um conjunto de parâmetro estéreo de Nésimo quadro; ou quando o fluxo de bits de Nésimo quadro é o quadro de quarto tipo, determinar, pelo decodificador de acordo com uma segunda regra predefinida, conjuntos de parâmetro estéreo de quadro k em pelo menos um conjunto de parâmetro estéreo de quadro precedendo o conjunto de parâmetro estéreo de Nésimo quadro, e obter o conjunto de parâmetro estéreo de Nésimo quadro de acordo com os conjuntos de parâmetro estéreo de quadro k com base em um quarto algoritmo predeterminado, em que pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base no terceiro algoritmo predeterminado, e k é um número inteiro positivo maior do que 0; e restaurar, pelo decodificador, o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro com base no terceiro algoritmo.
15. Codificador, caracterizado pelo fato de que compreende: uma unidade de detecção de sinal (300), configurada para detectar se um sinal downmixed de Nésimo quadro compreende um sinal de voz, em que o sinal downmixed de Nésimo quadro é obtido após sinais de áudio de Nésimo quadro em dois dentre múltiplos canais serem mixados com base em um primeiro algoritmo predeterminado, e N é um número inteiro positivo maior do que 0; e uma unidade de codificação de sinal (310), configurada para codificar o sinal downmixed de Nésimo quadro quando a unidade de detecção de sinal (300) detectar que o sinal downmixed de Nésimo quadro compreende o sinal de voz, em que a unidade de codificação de sinal (310) é ainda configurada para: quando a unidade de detecção de sinal (300) detectar que o sinal downmixed de Nésimo quadro não compreende o sinal de voz, codificar o sinal downmixed de Nésimo quadro se a unidade de detecção de sinal (300) determinar que o sinal downmixed de Nésimo quadro satisfaz uma condição de codificação de quadro de áudio predefinida, ou pular codificação do sinal downmixed de Nésimo quadro se a unidade de detecção de sinal (300) determinar que o sinal downmixed de Nésimo quadro não satisfaz uma condição de codificação de quadro de áudio predefinida.
16. Codificador, de acordo com a reivindicação 15, caracterizado pelo fato de que a unidade de codificação de sinal (310) compreende uma primeira unidade de codificação de sinal (311) e uma segunda unidade de codificação de sinal (312), em que a primeira unidade de codificação de sinal (311) é especificamente configurada para: codificar o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de quadro de voz predefinida quando a unidade de detecção de sinal (300) detectar que o sinal downmixed de Nésimo quadro compreende o sinal de voz; ou codificar o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de quadro de voz predefinida se a unidade de detecção de sinal (300) determinar que o sinal downmixed de Nésimo quadro satisfaz uma condição de codificação de quadro de voz predefinida; e a segunda unidade de codificação de sinal (312) é especificamente configurada para: codificar o sinal downmixed de Nésimo quadro de acordo com uma taxa de codificação de quadro de descritor de inserção de silêncio SID predefinida se a unidade de detecção de sinal (300) determinar que o sinal downmixed de Nésimo quadro não satisfaz uma condição de codificação de quadro de voz predefinida, mas satisfaz uma condição de codificação de SID predefinida, em que a taxa de codificação de SID não é maior do que a taxa de codificação de quadro de voz.
17. Codificador, de acordo com a reivindicação 15 ou 16, caracterizado pelo fato de que ainda compreende uma unidade de geração de parâmetro (320), uma unidade de codificação de parâmetro (330), e uma unidade de detecção de parâmetro (340), em que a unidade de geração de parâmetro (320) é configurada para obter um conjunto de parâmetro estéreo de Nésimo quadro de acordo com os sinais de áudio de Nésimo quadro, em que o conjunto de parâmetro estéreo de Nésimo quadro compreende Z parâmetros estéreos, os Z parâmetros estéreos compreendem um parâmetro que usado quando o codificador mixa os sinais de áudio de Nésimo quadro com base no primeiro algoritmo predeterminado, e Z é um número inteiro positivo maior do que 0; e a unidade de codificação de parâmetro (330) é configurada para codificar o conjunto de parâmetro estéreo de Nésimo quadro quando a unidade de detecção de sinal (300) detectar que o sinal downmixed de Nésimo quadro compreende o sinal de voz; ou a unidade de codificação de parâmetro (330) é ainda configurada para: quando a unidade de detecção de sinal (300) detectar que o sinal downmixed de Nésimo quadro não compreende o sinal de voz, codificar pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro se a unidade de detecção de parâmetro (340) determinar que o conjunto de parâmetro estéreo de Nésimo quadro satisfaz uma condição de codificação de parâmetro estéreo predefinida, ou pular codificação do conjunto de parâmetro estéreo se a unidade de detecção de parâmetro (340) determinar que o conjunto de parâmetro estéreo de Nésimo quadro não satisfaz uma condição de codificação de parâmetro estéreo predefinida.
18. Codificador, de acordo com a reivindicação 17, caracterizado pelo fato de que quando codificar o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro, a unidade de codificação de parâmetro (330) é especificamente configurada para: obter X parâmetros estéreos alvo de acordo com os Z parâmetros estéreos no conjunto de parâmetro estéreo de Nésimo quadro com base em uma regra de redução de dimensão de parâmetro estéreo predefinida, e codificar os X parâmetros estéreos alvo, em que X é um número inteiro positivo maior do que 0 e menor do que ou igual a Z.
19. Codificador, de acordo com a reivindicação 16, caracterizado pelo fato de que a unidade de geração de parâmetro (320) compreende uma primeira unidade de geração de parâmetro (321) e uma segunda unidade de geração de parâmetro (322), em que a primeira unidade de geração de parâmetro (321) é configurada para: quando a unidade de detecção de sinal (300) detectar que os sinais de áudio de Nésimo quadro compreendem o sinal de voz, e quando a unidade de detecção de sinal (300) detectar que os sinais de áudio de Nésimo quadro não compreendem o sinal de voz, e determinar que os sinais de áudio de Nésimo quadro satisfazem a condição de codificação de quadro de voz predefinida, obter o conjunto de parâmetro estéreo de Nésimo quadro de acordo com os sinais de áudio de Nésimo quadro com base em uma primeira maneira de geração de conjunto de parâmetro estéreo, e a unidade de codificação de parâmetro (330) codifica o conjunto de parâmetro estéreo de Nésimo quadro; e a segunda unidade de geração de parâmetro (322) é configurada para: quando a unidade de detecção de sinal (300) detectar que os sinais de áudio de Nésimo quadro não compreendem o sinal de voz, e determinar que os sinais de áudio de Nésimo quadro não satisfazem a condição de codificação de quadro de voz predefinida, obter o conjunto de parâmetro estéreo de Nésimo quadro de acordo com os sinais de áudio de Nésimo quadro com base em uma segunda maneira de geração de conjunto de parâmetro estéreo, e codificar pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro quando a unidade de detecção de parâmetro (340) determinar que o conjunto de parâmetro estéreo de Nésimo quadro satisfaz uma condição de codificação de parâmetro estéreo predefinida, ou pular codificação do conjunto de parâmetro estéreo quando a unidade de detecção de parâmetro (340) determinar que o conjunto de parâmetro estéreo de Nésimo quadro não satisfaz uma condição de codificação de parâmetro estéreo predefinida; em que a primeira maneira de geração de conjunto de parâmetro estéreo e a segunda maneira de geração de conjunto de parâmetro estéreo satisfazem pelo menos uma das seguintes condições: uma quantidade que é de tipos de parâmetros estéreos compreendidos em um conjunto de parâmetro estéreo e que é estipulada na primeira maneira de geração de conjunto de parâmetro estéreo não é menor do que uma quantidade que é de tipos de parâmetros estéreos compreendidos em um conjunto de parâmetro estéreo e que é estipulada na segunda maneira de geração de conjunto de parâmetro estéreo, uma quantidade que é de parâmetros estéreos compreendidos em um conjunto de parâmetro estéreo e que é estipulada na segunda maneira de geração de conjunto de parâmetro estéreo não é menor do que uma quantidade de parâmetros estéreos compreendidos em um conjunto de parâmetro estéreo e que é estipulada na primeira maneira de geração de conjunto de parâmetro estéreo, resolução em domínio de tempo que é de um parâmetro estéreo e que é estipulada na primeira maneira de geração de conjunto de parâmetro estéreo não é menor do que resolução em domínio de tempo que é de um parâmetro estéreo correspondente e que é estipulada na segunda maneira de geração de conjunto de parâmetro estéreo, ou resolução em domínio de frequência que é de um parâmetro estéreo e que é estipulada na primeira maneira de geração de conjunto de parâmetro estéreo não é menor do que resolução em domínio de frequência que é de um parâmetro estéreo correspondente e que é estipulada na segunda maneira de geração de conjunto de parâmetro estéreo.
20. Codificador, de acordo com qualquer uma das reivindicações 17 a 19, caracterizado pelo fato de que a unidade de codificação de parâmetro (330) compreende uma primeira unidade de codificação de parâmetro (331) e uma segunda unidade de codificação de parâmetro (332), em que a primeira unidade de codificação de parâmetro (331) é configurada para codificar o conjunto de parâmetro estéreo de Nésimo quadro de acordo com uma primeira maneira de codificação quando a unidade de detecção de sinal (300) detectar que o sinal downmixed de Nésimo quadro compreende o sinal de voz e o sinal downmixed de Nésimo quadro satisfaz a condição de codificação de quadro de voz; e a segunda unidade de codificação de parâmetro (332) é especificamente configurada para codificar o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro de acordo com uma segunda maneira de codificação quando o sinal downmixed de Nésimo quadro não satisfaz a condição de codificação de quadro de voz; em que uma taxa de codificação estipulada na primeira maneira de codificação não é menor do que uma taxa de codificação estipulada na segunda maneira de codificação; e/ou para qualquer parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro, precisão de quantização estipulada na primeira maneira de codificação não é menor do que precisão de quantização estipulada na segunda maneira de codificação.
21. Codificador, de acordo com qualquer uma das reivindicações 17 a 20, caracterizado pelo fato de que se o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro compreender uma diferença de nível intercanal ILD, a condição de codificação de parâmetro estéreo predefinida compreende DL > Do, em que D representa um grau pelo qual a ILD se desvia de um primeiro padrão, o primeiro padrão é determinado com base em um segundo algoritmo predeterminado de acordo com conjuntos de parâmetro estéreo de quadro T precedendo o conjunto de parâmetro estéreo de Nésimo quadro, e T é um número inteiro positivo maior do que 0; se o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro compreende uma diferença de tempo intercanal ITD, a condição de codificação de parâmetro estéreo predefinida compreende D > D, em que D representa um grau pelo qual a ITD se desvia de um segundo padrão, o segundo padrão é determinado com base em um terceiro algoritmo predeterminado de acordo com conjuntos de parâmetro estéreo de quadro T precedendo o conjunto de parâmetro estéreo de Nésimo quadro, e T é um número inteiro positivo maior do que 0; ou se o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro compreende uma diferença de fase intercanal IPD, a condição de codificação de parâmetro estéreo predefinida compreende D> D, em que D representa um grau pelo qual a IPD se desvia de um terceiro padrão, o terceiro padrão é determinado com base em um quarto algoritmo predeterminado de acordo com conjuntos de parâmetro estéreo de quadro T precedendo o conjunto de parâmetro estéreo de Nésimo quadro, e T é um número inteiro positivo maior do que 0.
22. Codificador, de acordo com a reivindicação 21, caracterizado pelo fato de que D , D , e D respectivamente satisfazerem as seguintes expressões: em que ILD(m) é uma diferença de nível gerada quando os sinais de áudio de Nésimo quadro são respectivamente transmitidos nos dois canais em uma mésima sub-banda de frequência, M é uma quantidade total de sub-bandas de frequência ocupadas para transmitir os sinais de áudio de Nésimo quadro, é um valor médio de ILDs nos conjuntos de parâmetro estéreo de quadro T precedendo o conjunto de parâmetro estéreo de Nésimo quadro na mésima sub-banda de frequência, T é um número inteiro positivo maior do que 0, ILD[-t](m) é uma diferença de nível gerada quando sinais de áudio de tésimo quadro precedendo os sinais de áudio de Nésimo quadro são respectivamente transmitidos nos dois canais na mésima sub-banda de frequência, a ITD é uma diferença de tempo gerada quando os sinais de áudio de Nésimo quadro são respectivamente transmitidos nos dois canais, é um valor médio de ITDs nos conjuntos de parâmetro estéreo de quadro T precedendo o conjunto de parâmetro estéreo de Nésimo quadro, ITD[-t] é uma diferença de tempo gerada quando os sinais de áudio de tésimo quadro precedendo os sinais de áudio de Nésimo quadro são respectivamente transmitidos nos dois canais, IPD(m) é uma diferença de fase gerada quando alguns dos sinais de áudio de Nésimo quadro são respectivamente transmitidos nos dois canais na mésima sub-banda de frequência,é um valor médio de IPDs nos conjuntos de parâmetro estéreo de quadro T precedendo o conjunto de parâmetro estéreo de Nésimo quadro na mésima sub-banda de frequência, e ipD[-t](m) é uma diferença de fase gerada quando os sinais de áudio de tésimo quadro precedendo os sinais de áudio de Nésimo quadro são respectivamente transmitidos nos dois canais na mésima sub-banda de frequência.
23. Decodificador, caracterizado pelo fato de que compreende: uma unidade receptora (400), configurada para receber um fluxo de bits, em que o fluxo de bits compreende pelo menos dois quadros, os pelo menos dois quadros compreendem pelo menos um quadro de primeiro tipo e pelo menos um quadro de segundo tipo, o quadro de primeiro tipo compreende um sinal downmixed, e o quadro de segundo tipo não compreende um sinal downmixed; e uma unidade de decodificação (410), configurada para: para um fluxo de bits de Nésimo quadro, em que N é um número inteiro positivo maior do que 1, decodificar o fluxo de bits de Nésimo quadro se for determinado que o fluxo de bits de Nésimo quadro é o quadro de primeiro tipo, para obter um sinal downmixed de Nésimo quadro; ou se for determinado que o fluxo de bits de Nésimo quadro é o quadro de segundo tipo, determinar, de acordo com uma primeira regra predefinida, sinais downmixed de quadro m em pelo menos um sinal downmixed de quadro precedendo o sinal downmixed de Nésimo quadro, e obter o sinal downmixed de Nésimo quadro de acordo com os sinais downmixed de quadro m com base em um primeiro algoritmo predeterminado, em que m é um número inteiro positivo maior do que 0, e o sinal downmixed de Nésimo quadro é obtido por um codificador ao mixar sinais de áudio de Nésimo quadro em dois dentre múltiplos canais com base em um segundo algoritmo predeterminado.
24. Decodificador, de acordo com a reivindicação 23, caracterizado pelo fato de que o quadro de primeiro tipo compreende ambos um sinal downmixed e um conjunto de parâmetro estéreo, e o quadro de segundo tipo compreende um conjunto de parâmetro estéreo, mas não compreende um sinal downmixed; a unidade de decodificação (410) é ainda configurada para: se for determinado que o fluxo de bits de Nésimo quadro é o quadro de primeiro tipo, decodificar o fluxo de bits de Nésimo quadro, para obter um conjunto de parâmetro estéreo de Nésimo quadro; ou se for determinado que o fluxo de bits de Nésimo quadro é o quadro de segundo tipo, decodificar o fluxo de bits de Nésimo quadro, para obter um conjunto de parâmetro estéreo de Nésimo quadro, em que pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base no terceiro algoritmo predeterminado; e o decodificador ainda compreende uma unidade de restauração de sinal (420), em que a unidade de restauração de sinal (420) é configurada para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro com base no terceiro algoritmo.
25. Decodificador, de acordo com a reivindicação 23, caracterizado pelo fato de que o quadro de primeiro tipo compreende ambos um sinal downmixed e um conjunto de parâmetro estéreo, e o quadro de segundo tipo não compreende nem um sinal downmixed nem um conjunto de parâmetro estéreo; a unidade de decodificação (410) é ainda configurada para: se for determinado que o fluxo de bits de Nésimo quadro é o quadro de primeiro tipo, decodificar o fluxo de bits de Nésimo quadro, para obter um conjunto de parâmetro estéreo de Nésimo quadro; ou se for determinado que o fluxo de bits de Nésimo quadro é o quadro de segundo tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetro estéreo de quadro k em pelo menos um conjunto de parâmetro estéreo de quadro precedendo o conjunto de parâmetro estéreo de Nésimo quadro, e obter o conjunto de parâmetro estéreo de Nésimo quadro de acordo com os conjuntos de parâmetro estéreo de quadro k com base em um quarto algoritmo predeterminado, em que k é um número inteiro positivo maior do que 0, e pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base no terceiro algoritmo predeterminado; e o decodificador ainda compreende uma unidade de restauração de sinal (420), em que a unidade de restauração de sinal (420) é configurada para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro com base no terceiro algoritmo.
26. Decodificador, de acordo com a reivindicação 23, caracterizado pelo fato de que o quadro de primeiro tipo compreende ambos um sinal downmixed e um conjunto de parâmetro estéreo, um quadro de terceiro tipo compreende um conjunto de parâmetro estéreo, mas não compreende um sinal downmixed, um quadro de quarto tipo não compreende nem um sinal downmixed nem um conjunto de parâmetro estéreo, e cada um dentre o quadro de terceiro tipo e o quadro de quarto tipo é um caso do quadro de segundo tipo; a unidade de decodificação (410) é ainda configurada para: se for determinado que o fluxo de bits de Nésimo quadro é o quadro de primeiro tipo, decodificar o fluxo de bits de Nésimo quadro, para obter um conjunto de parâmetro estéreo de Nésimo quadro; ou se for determinado que o fluxo de bits de Nésimo quadro é o quadro de segundo tipo, quando o fluxo de bits de Nésimo quadro é o quadro de terceiro tipo, decodificar o fluxo de bits de Nésimo quadro, para obter um conjunto de parâmetro estéreo de Nésimo quadro, ou quando o fluxo de bits de Nésimo quadro é o quadro de quarto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetro estéreo de quadro k em pelo menos um conjunto de parâmetro estéreo de quadro precedendo o conjunto de parâmetro estéreo de Nésimo quadro, e obter o conjunto de parâmetro estéreo de Nésimo quadro de acordo com os conjuntos de parâmetro estéreo de quadro k com base em um quarto algoritmo predeterminado, em que k é um número inteiro positivo maior do que 0, e pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base no terceiro algoritmo predeterminado; e o decodificador ainda compreende uma unidade de restauração de sinal (420), em que a unidade de restauração de sinal (420) é configurada para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro com base no terceiro algoritmo.
27. Decodificador, de acordo com a reivindicação 23, caracterizado pelo fato de que um quadro de quinto tipo compreende ambos um sinal downmixed e um conjunto de parâmetro estéreo, um quadro de sexto tipo compreende um sinal downmixed, mas não compreende um conjunto de parâmetro estéreo, cada um dentre o quadro de quinto tipo e o quadro de sexto tipo é um caso do quadro de primeiro tipo, e o quadro de segundo tipo não compreende nem um sinal downmixed nem um conjunto de parâmetro estéreo; a unidade de decodificação (410) é ainda configurada para: se for determinado que o fluxo de bits de Nésimo quadro é o quadro de primeiro tipo, quando o fluxo de bits de Nésimo quadro é o quadro de quinto tipo, decodificar o fluxo de bits de Nésimo quadro, para obter um conjunto de parâmetro estéreo de Nésimo quadro; ou quando o fluxo de bits de Nésimo quadro é o quadro de sexto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetro estéreo de quadro k em pelo menos um conjunto de parâmetro estéreo de quadro precedendo o conjunto de parâmetro estéreo de Nésimo quadro, e obter o conjunto de parâmetro estéreo de Nésimo quadro de acordo com os conjuntos de parâmetro estéreo de quadro k com base em um quarto algoritmo predeterminado; ou se for determinado que o fluxo de bits de Nésimo quadro é o quadro de segundo tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetro estéreo de quadro k em pelo menos um conjunto de parâmetro estéreo de quadro precedendo o conjunto de parâmetro estéreo de Nésimo quadro, e obter o conjunto de parâmetro estéreo de Nésimo quadro de acordo com os conjuntos de parâmetro estéreo de quadro k com base em um quarto algoritmo predeterminado, em que pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base no terceiro algoritmo predeterminado, e k é um número inteiro positivo maior do que 0; e o decodificador ainda compreende uma unidade de restauração de sinal (420), em que a unidade de restauração de sinal (420) é configurada para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro com base no terceiro algoritmo.
28. Decodificador, de acordo com a reivindicação 23, caracterizado pelo fato de que um quadro de quinto tipo compreende ambos um sinal downmixed e um conjunto de parâmetro estéreo, um quadro de sexto tipo compreende um sinal downmixed, mas não compreende um conjunto de parâmetro estéreo, cada um dentre o quadro de quinto tipo e o quadro de sexto tipo é um caso do quadro de primeiro tipo, um quadro de terceiro tipo compreende um conjunto de parâmetro estéreo, mas não compreende um sinal downmixed, um quadro de quarto tipo não compreende nem um sinal downmixed nem um conjunto de parâmetro estéreo, e cada um dentre o quadro de terceiro tipo e o quadro de quarto tipo é um caso do quadro de segundo tipo; a unidade de decodificação (410) é ainda configurada para: se for determinado que o fluxo de bits de Nésimo quadro é o quadro de primeiro tipo, quando o fluxo de bits de Nésimo quadro é o quadro de quinto tipo, decodificar o fluxo de bits de Nésimo quadro, para obter um conjunto de parâmetro estéreo de Nésimo quadro; ou quando o fluxo de bits de Nésimo quadro é o quadro de sexto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetro estéreo de quadro K em pelo menos um conjunto de parâmetro estéreo de quadro precedendo o conjunto de parâmetro estéreo de Nésimo quadro, e obter o conjunto de parâmetro estéreo de Nésimo quadro de acordo com os conjuntos de parâmetro estéreo de quadro k com base em um quarto algoritmo predeterminado; ou se for determinado que o fluxo de bits de Nésimo quadro é o quadro de segundo tipo, quando o fluxo de bits de Nésimo quadro é o quadro de terceiro tipo, decodificar o fluxo de bits de Nésimo quadro, para obter um conjunto de parâmetro estéreo de Nésimo quadro, ou quando o fluxo de bits de Nésimo quadro é o quadro de quarto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetro estéreo de quadro k em pelo menos um conjunto de parâmetro estéreo de quadro precedendo o conjunto de parâmetro estéreo de Nésimo quadro, e obter o conjunto de parâmetro estéreo de Nésimo quadro de acordo com os conjuntos de parâmetro estéreo de quadro k com base em um quarto algoritmo predeterminado, em que pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro com base no terceiro algoritmo predeterminado, e k é um número inteiro positivo maior do que 0; e o decodificador ainda compreende uma unidade de restauração de sinal (420), em que a unidade de restauração de sinal (420) é configurada para restaurar o sinal downmixed de Nésimo quadro para os sinais de áudio de Nésimo quadro de acordo com o pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo de Nésimo quadro com base no terceiro algoritmo.
29. Sistema de codificação e decodificação, caracterizado pelo fato de que compreende o codificador como definido em qualquer uma das reivindicações 15 a 22 e o decodificador como definido em qualquer uma das reivindicações 23 a 28.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2016/100617 WO2018058379A1 (zh) | 2016-09-28 | 2016-09-28 | 一种处理多声道音频信号的方法、装置和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
BR112019005983A2 BR112019005983A2 (pt) | 2019-10-01 |
BR112019005983B1 true BR112019005983B1 (pt) | 2024-03-26 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6790251B2 (ja) | マルチチャネルオーディオ信号処理方法、装置、およびシステム | |
US9324329B2 (en) | Method for parametric spatial audio coding and decoding, parametric spatial audio coder and parametric spatial audio decoder | |
US9384743B2 (en) | Apparatus and method for encoding/decoding multichannel signal | |
US9275646B2 (en) | Method for inter-channel difference estimation and spatial audio coding device | |
CN110556118A (zh) | 立体声信号的编码方法和装置 | |
US20100114568A1 (en) | Apparatus for processing an audio signal and method thereof | |
BR112020024257A2 (pt) | método de codificação de sinal estéreo, aparelho, meio de armazenamento legível por computador e chip | |
BR112019005983B1 (pt) | Método de processamento de sinal de áudio de multicanais, codificador, decodificador e sistema de codificação e decodificação | |
KR20200090856A (ko) | 오디오 인코딩 및 디코딩 방법 및 관련 제품 | |
JP2017058696A (ja) | インターチャネル差分推定方法及び空間オーディオ符号化装置 | |
BR112020026932A2 (pt) | Método e aparelho de codificação de sinal estéreo, e método e aparelho de decodificação de sinal estéreo | |
WO2024052499A1 (en) | Decoder and decoding method for discontinuous transmission of parametrically coded independent streams with metadata | |
WO2024051954A1 (en) | Encoder and encoding method for discontinuous transmission of parametrically coded independent streams with metadata |