BR112019005983A2 - método, aparelho e sistema de processamento de sinal de áudio de multicanais - Google Patents

método, aparelho e sistema de processamento de sinal de áudio de multicanais Download PDF

Info

Publication number
BR112019005983A2
BR112019005983A2 BR112019005983A BR112019005983A BR112019005983A2 BR 112019005983 A2 BR112019005983 A2 BR 112019005983A2 BR 112019005983 A BR112019005983 A BR 112019005983A BR 112019005983 A BR112019005983 A BR 112019005983A BR 112019005983 A2 BR112019005983 A2 BR 112019005983A2
Authority
BR
Brazil
Prior art keywords
frame
nth frame
stereo
nth
signal
Prior art date
Application number
BR112019005983A
Other languages
English (en)
Other versions
BR112019005983B1 (pt
Inventor
Wang Zhe
Original Assignee
Huawei Tech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Tech Co Ltd filed Critical Huawei Tech Co Ltd
Publication of BR112019005983A2 publication Critical patent/BR112019005983A2/pt
Publication of BR112019005983B1 publication Critical patent/BR112019005983B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

a presente invenção proporciona um método, um aparelho e um sistema de processamento de sinal de áudio de multicanais e refere-se ao campo das tecnologias de codificação e decodificação de áudio, para resolver um problema na técnica anterior que um sinal de áudio não pode ser transmitido, descontinuamente, em um sistema de comunicação de áudio de multicanais. um codificador inclui uma unidade de detecção de sinal e uma unidade de codificação de sinal.a unidade de codificação de sinal é configurada para: quando a unidade de detecção de sinal detecta que um sinal downmixed de enésimo quadro inclui um sinal de voz, codificar o sinal downmixed de enésimo quadro; ou quando a unidade de detecção de sinal detecta que o sinal downmixed de enésimo quadro não inclui um sinal de voz; codificar o sinal downmixed de enésimo quadro, se a unidade de detecção de sinal determina que o sinal downmixed de enésimo quadro satisfaz uma condição de codificação de quadro de áudio predefinido, ou saltar a codificação do sinal downmixed de enésimo quadro, se a unidade de detecção de sinal determina que o sinal downmixed de enésimo quadro não satisfaz uma condição de codificação de quadro de áudio predefinido. nesta solução técnica, como a codificação em um sinal downmixed é descontínua, o problema na técnica anterior de que o sinal de áudio não pode ser transmitido descontinuamente é resolvido.

Description

Relatório Descritivo da Patente de Invenção para MÉTODO, APARELHO E SISTEMA DE PROCESSAMENTO DE SINAL DE ÁUDIO DE MULTICANAIS.
CAMPO TÉCNICO [001] A presente invenção refere-se ao campo das tecnologias de codificação e decodificação e, em particular, a um método, a um aparelho e a um sistema de processamento de sinal de áudio de multicanais.
ANTECEDENTES [002] Durante a comunicação de áudio, para aumentar a capacidade de um sistema de comunicações, geralmente, uma extremidade de transmissão primeiro codifica cada quadro do sinal de áudio original a ser transmitido e depois transmite o sinal de áudio. O sinal de áudio é comprimido por meio de codificação. Depois de receber o sinal, uma extremidade de recepção decodifica o sinal recebido e restaura o sinal de áudio original. Para implementar a compactação máxima em um sinal de áudio, diferentes tipos de modos de codificação são usados para diferentes tipos de sinais de áudio. Na técnica anterior, quando um sinal de áudio é um sinal de fala, geralmente é usada uma maneira de codificação contínua, isto é, cada quadro de sinal de fala é codificado; quando um sinal de áudio é um sinal de ruído, uma maneira de codificação descontínua é geralmente usada para codificar o sinal de ruído, isto é, um quadro de sinal de ruído é codificado a cada vários quadros de sinais de ruído. Por exemplo, um sinal de ruído é codificado a cada seis quadros. Depois que o primeiro quadro de sinal de ruído é codificado, o segundo quadro de sinal de ruído para o sétimo quadro de sinal de ruído não é codificado, e o oitavo quadro de sinal de ruído é codificado. O segundo quadro para o sétimo quadro são seis quadros NoJData. Especificamente, o sinal de áudio é um sinal de áudio mono.
Petição 870190037280, de 18/04/2019, pág. 5/131
2/85 [003] Com o desenvolvimento de tecnologias de comunicações de áudio, um sistema de comunicações de áudio ainda tem uma maneira especial de comunicação: comunicação estéreo. A comunicação estéreo é comunicação dual channel e é usada como um exemplo. Os dois canais incluem um primeiro canal e um segundo canal. Uma extremidade de transmissão obtém, de acordo com um sinal de fala de enésimo quadro no primeiro canal e um sinal de fala de enésimo quadro no segundo canal, um parâmetro estéreo usado para misturar o sinal de fala de enésimo quadro no primeiro canal e no enésimo quadro sinal de fala no segundo canal em um quadro de sinal downmixed, onde o sinal downmixed é um sinal mono. Então, a extremidade de transmissão mistura os sinais de fala de enésimo quadro nos dois canais em um quadro de sinal downmixed, onde n é um número inteiro positivo maior que 0, codifica o quadro de sinal downmixed e, finalmente, envia o sinal codificado downmixed e o parâmetro estéreo para uma extremidade de recepção. Depois de receber o sinal codificado downmixed e o parâmetro estéreo, a extremidade de recepção decodifica o sinal codificado downmixed e restaura o sinal downmixed para um sinal de canal duplo de acordo com o parâmetro estéreo. Comparado com uma maneira de transmissão na qual cada quadro de sinal de fala nos dois canais é codificado, nesta maneira de transmissão, uma quantidade de bits transmitidos é grandemente reduzida, implementando compressão.
[004] No entanto, quando um sinal de ruído é transmitido durante a comunicação estéreo, se uma mesma maneira de codificação é usada como para um sinal de fala, e uma maneira de codificação descontínua usada em mono é diretamente aplicada à comunicação estéreo, a extremidade de recepção não pode restaurar o sinal de ruído, levando a uma experiência subjetiva ruim de um usuário da extremidade de recebimento.
Petição 870190037280, de 18/04/2019, pág. 6/131
3/85
SUMÁRIO [005] A presente invenção fornece um método, um aparelho e um sistema de processamento de sinal de áudio de multicanais, , para resolver um problema na técnica anterior de que um sinal de áudio não pode ser transmitido de forma descontínua em um sistema de comunicação de áudio multicanais.
[006] De acordo com um primeiro aspecto, um método de processamento de sinal de áudio de multicanais é fornecido, incluindo: detectar, por meio de um codificador, se um sinal downmixed de enésimo quadro inclui um sinal de fala; e codificação do sinal downmixed de enésimo quadro quando se detecta que o sinal downmixedde enésimo quadro inclui o sinal de voz; ou quando detectando que o sinal downmixedde enésimo quadro não inclui o sinal de fala: codificando o sinal downmixedde enésimo quadro, se determinar que o sinal downmixed de enésimo quadro satisfaz uma condição de codificação de quadro de áudio predefinida ou ignorando a codificação do sinal downmixed de enésimo quadro se determinar que o sinal downmixed de enésimo quadro não satisfaz uma condição de codificação de quadro de áudio predefinida, onde o sinal downmixed de enésimo quadro é obtido após os sinais de áudio de enésimo quadro em dois de múltiplos canais serem misturados com base em um primeiro algoritmo predeterminado, e N é um número inteiro positivo maior que 0.
[007] O codificador codifica o sinal downmixed somente quando o sinal downmixed inclui o sinal de fala ou o sinal downmixed satisfaz a condição de codificação do quadro de áudio predefinido; caso contrário, o codificador não codifica o sinal downmixed, de modo que o codificador implemente a codificação descontínua no sinal downmixed, e a eficiência da compressão do sinal downmixedé melhorada.
[008] Deve-se notar que, nas modalidades da presente invenção, a condição de codificação de quadro de áudio predefinido inclui um
Petição 870190037280, de 18/04/2019, pág. 7/131
4/85 sinal downmixedde quadro inicial. Ou seja, quando o sinal downmixed de primeiro quadro não inclui o sinal de fala, mas o sinal downmixed de primeiro quadro satisfaz a condição de codificação de quadro de áudio predefinida, o sinal downmixed de primeiro quadro é codificado. [009] Baseado no primeiro aspecto, para melhorar a eficiência de compressão de sinal downmixed em maior extensão, opcionalmente, o codificador codifica o sinal downmixed de Enésimo quadro de acordo com uma taxa de codificação de quadro de voz pré-ajustada ao detectar que o sinal downmixed de enésimo quadro inclui o sinal de fala; ou quando se detecta que o sinal downmixed de enésimo quadro não inclui o sinal de voz: codifica o sinal downmixed de enésimo quadro de acordo com uma taxa de codificação de quadro de voz pré-ajustada se determinar que o sinal downmixed de enésimo quadro satisfaz uma condição de codificação predefinida codifica o sinal downmixed de enésimo quadro de acordo com uma taxa de codificação SI D predefinida se determinar que o sinal downmixedde enésimo quadro não satisfaz uma condição de codificação de quadro de voz predefinida, mas satisfaz uma condição de codificação SI D predefinida, em que a taxa de codificação de SI D é inferior à taxa de codificação do quadro de voz.
[0010] Deve ser entendido que durante a implementação específica, se for determinado que o sinal downmixed de enésimo quadro não satisfaz a condição de codificação predefinida do quadro de voz, mas satisfaz a condição de codificação SI D predefinida, a codificação SID é executada no sinal downmixed de enésimo quadro de acordo com a taxa de codificação SID predefinida. Em comparação com a codificação do sinal de fala, isso melhora ainda mais a eficiência da compressão do sinal downmixed. Além disso, deve-se notar que, no primeiro aspecto e na solução técnica, para evitar que um decodificador não possa restaurar o sinal downmixed, um conjunto de parâmetros estéPetição 870190037280, de 18/04/2019, pág. 8/131
5/85 reos precisa ser codificado.
[0011] Com base no primeiro aspecto, para melhorar ainda mais a eficiência de compressão de um sistema de comunicações multicanais, opcionalmente, o codificador realiza a codificação descontínua em um conjunto de parâmetros estéreos. Especificamente, o codificador obtém um conjunto de parâmetros estéreo de enésimo quadro de acordo com os sinais de áudio de enésimo quadro; e codifica o conjunto de parâmetros estéreos de enésimo quadro ao detectar que o sinal downmixedde enésimo quadro inclui o sinal de fala; ou quando detectando que o sinal downmixed de enésimo quadro não inclui o sinal de fala: se determinar que o conjunto de parâmetros estéreos de enésimo quadro satisfaz uma condição de codificação de parâmetro estéreo predefinida, codifica pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro ou se determinar que o conjunto de parâmetros estéreo de enésimo quadro não satisfaz uma condição de codificação de parâmetro estéreo predefinida, ignora a codificação do conjunto de parâmetros estéreo, onde o conjunto de parâmetros estéreo de enésimo quadro inclui parâmetros estéreos Z, os parâmetros estéreos Z incluem um parâmetro que é usado quando o codificador mistura os sinais de áudio de enésimo quadro com base em um algoritmo predeterminado, e Z é um número inteiro positivo maior que 0.
[0012] Com base no primeiro aspecto, opcionalmente, para melhorar ainda mais a eficiência de compressão do sistema de comunicações multicanais, antes da codificação de pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro, o codificador obtém parâmetros estéreo alvo X de acordo com parâmetros estéreos de z no conjunto de parâmetros estéreos de enésimo quadro com base em uma regra de redução de dimensão de parâmetro estéreo predefinida e codifica os parâmetros estéreos alvo X, em que X é
Petição 870190037280, de 18/04/2019, pág. 9/131
6/85 um número inteiro positivo maior que 0 e menor ou igual a Z.
[0013] A regra de redução de dimensão de parâmetro estéreo predefinida pode ser um tipo de parâmetro estéreo predefinido. Ou seja, os parâmetros estéreos alvo X que satisfazem o tipo de parâmetro estéreo predefinido são selecionados a partir do conjunto de parâmetros estéreos de enésimo quadro. Como alternativa, a regra de redução de dimensão de parâmetros estéreo predefinida é uma quantidade predefinida de parâmetros estéreos. Ou seja, os parâmetros estéreos alvo X são selecionados do conjunto de parâmetros estéreos de enésimo quadro. Como alternativa, a regra de redução de dimensão de parâmetro estéreo predefinida está reduzindo a resolução no domínio do tempo ou no domínio da frequência para pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro. Ou seja, os parâmetros estéreos alvo X são determinados com base nos parâmetros estéreos Z de acordo com a resolução reduzida do domínio do tempo ou do domínio da frequência de pelo menos um parâmetro estéreo.
[0014] Com base no primeiro aspecto, opcionalmente, o seguinte método pode ser usado ainda para melhorar a eficiência de compressão do sistema de comunicações multicanais:
[0015] ao detectar que os sinais de áudio de enésimo quadro incluem o sinal de fala: o codificador obtém o conjunto de parâmetros estéreos de enésimo quadro de acordo com os sinais de áudio de enésimo quadro baseados em uma primeira forma de geração de conjunto de parâmetros estéreo e codifica o conjunto de parâmetros estéreos de enésimo quadro; ou ao detectar que os sinais de áudio de enésimo quadro não incluem o sinal de fala: se determinar que os sinais de áudio de enésimo quadro satisfazem a condição de codificação predefinida, o codificador obtém o conjunto de parâmetros estéreos de enésimo quadro de acordo com os sinais de áudio de enésimo
Petição 870190037280, de 18/04/2019, pág. 10/131
7/85 quadro com base em uma primeira forma de geração de conjunto de parâmetros estéreos e codifica o conjunto de parâmetros estéreos de enésimo quadro; ou se a determinação de que os sinais de áudio de enésimo quadro não satisfazem a condição de codificação de quadro de fala predefinida, o codificador obtém o conjunto de parâmetros estéreos de enésimo quadro de acordo com os sinais de áudio de enésimo quadro baseados em uma segunda forma de geração de conjunto de parâmetros estéreos e codifica pelo menos um parâmetro estéreo no parâmetro estéreo de enésimo quadro definido ao determinar que o conjunto de parâmetros estéreos de enésimo quadro satisfaz uma condição de codificação de parâmetro estéreo predefinida ou o codificador não codifica o conjunto de parâmetros estéreos quando o conjunto de parâmetros estéreos de enésimo quadro não satisfaz uma condição de codificação de parâmetros estéreos predefinida; onde [0016] o primeiro modo de geração do conjunto de parâmetros estéreos e o segundo modo de geração do conjunto de parâmetros estéreos satisfazem pelo menos uma das seguintes condições:
[0017] - uma quantidade que é de tipos de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreos não é menor que uma quantidade que é dos tipos de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na segunda forma de geração de conjunto de parâmetros estéreos, uma quantidade que é de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreos não é menor que uma quantidade de parâmetros estéreos incluída em um parâmetro estéreo definido e estipulado na segunda forma de geração do conjunto de parâmetros estéreos, a resolução no domínio do tempo que é de um parâmetro estéreo e que é estipulado na primeira forma de geração do
Petição 870190037280, de 18/04/2019, pág. 11/131
8/85 primeiro conjunto de parâmetros estéreos não é inferior à resolução no domínio do tempo que é de um parâmetro estéreo correspondente e que é estipulado na forma de geração de segundo conjunto de parâmetros estéreos ou resolução de domínio de frequência que é de um parâmetro estéreo e que é estipulado na maneira de geração de segundo conjunto de parâmetros estéreos.
[0018] Com base no primeiro aspecto, opcionalmente, quando o sinal downmixed de enésimo quadro inclui o sinal de fala, o codificador codifica o conjunto de parâmetros estéreos enésimo quadro de acordo com uma primeira maneira de codificação; e quando o sinal downmixed de enésimo quadro satisfaz a condição de codificação do quadro de voz, o codificador codifica pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro de acordo com a primeira forma de codificação; ou quando o sinal downmixed de enésimo quadro não satisfaz a condição de codificação de quadro de voz, o codificador codifica o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro de acordo com uma segunda maneira de codificação; onde [0019] uma taxa de codificação estipulada na primeira maneira de codificação não é menor do que uma taxa de codificação estipulada na segunda maneira de codificação; e / ou para qualquer parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro a precisão de quantização estipulada na primeira maneira de codificação não é inferior à precisão de quantização estipulada na segunda maneira de codificação.
[0020] Por exemplo, o conjunto de parâmetros estéreos de enésimo quadro inclui um IPD e um ITD. A precisão de quantização IPD estipulada na primeira maneira de codificação não é inferior à precisão de quantização IPD estipulada na segunda maneira de codificação, e a precisão de quantização ITD estipulada na primeira maneira de codifi
Petição 870190037280, de 18/04/2019, pág. 12/131
9/85 cação não é inferior à precisão de quantização ITD estipulada na segunda maneira de codificação.
[0021] Baseado no primeiro aspecto, opcionalmente, geralmente, se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro inclui uma ILD de diferença de nível entre canais, a condição de codificação de parâmetro estéreo predefinida includes dl -do , [0022] Onde DL representa um grau pelo qual o ILD se desvia de um primeiro padrão, o primeiro padrão é determinado com base em um segundo algoritmo predeterminado de acordo com os conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de enésimo quadro e T é um número inteiro positivo maior do que 0 ;
[0023] se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro incluir uma diferença de tempo entre canais ITD, a condição de codificação de parâmetro estéreo predefinida incluiDT >DX, [0024] onde DT representa um grau pelo qual a ITD se desvia de um segundo padrão, o segundo padrão é determinado com base em um terceiro algoritmo predeterminado de acordo com conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de enésimo quadro e T é um número inteiro positivo maior que 0; ou [0025] se pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro incluir uma IPD de diferença de fase entre canais, a condição de codificação de parâmetro estéreo predefinida inclui /),, >/λ [0026] onde Dp representa um grau pelo qual a IPD se desvia de um terceiro padrão, o terceiro padrão é determinado com base em um
Petição 870190037280, de 18/04/2019, pág. 13/131
10/85 quarto algoritmo predeterminado de acordo com os conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de enésimo quadro e T é um número inteiro positivo maior que 0.
[0027] O segundo algoritmo, o terceiro algoritmo e o quarto algoritmo precisam ser pré-ajustados de acordo com uma situação real.
[0028] Opcionalmente, DL, dt e Dp respectivamente, satisfazem as seguintes expressões:
M-l1 T m=0 *- t=l T
DT = ITD; e
T r=i
M-l1 T m=0 *- t=l [0029] Onde ILDtm>> é uma diferença de nível gerada quando os sinais de áudio de enésimo quadro são transmitidos, respectivamente nos dois canais em uma emésima banda de subfrequências. M é uma quantidade total de banda de subfrequências ocupada para transmissão dos sinais de áudio de enésimo quadro, T /=l é um valor médio de ILDs nos conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de enésimo quadro, é uma diferença de tempo gerada quando os sinais de áudio de enésimo quadro, precedendo os sinais de áudio de enésimo quadro são transmitidos, respectivamente nos dois canais, [e uma diferença de fase gerada quando alguns dos sinais de áudio de enésimo quadro são transmitidos, respectivamente, nos dois canais na emésima banda de subfrequências.
[0030] De acordo com um segundo aspecto, é fornecido um método de processamento de sinais de áudio multicanal, incluindo: recep
Petição 870190037280, de 18/04/2019, pág. 14/131
11/85 ção, por um decodificador, de um fluxo de bits, em que o fluxo de bits inclui pelo menos dois quadros, pelo menos dois quadros incluem pelo menos um quadro de primeiro tipo e pelo menos um quadro de segundo tipo, o quadro do primeiro tipo inclui um sinal downmixed, e o quadro do segundo tipo não inclui um sinal downmixed; e para um fluxo de bits enésimo quadro, onde N é um número inteiro positivo maior que 1, decodificação, pelo decodificador, fluxo de bits de enésimo quadro se determinar que o fluxo de bits de enésimo quadro é o primeiro tipo para obter um sinal downmixed de enésimo quadro; ou se determinar que o fluxo de bits de enésimo quadro é o segundo tipo de quadro, determinando, pelo decodificador de acordo com uma primeira regra predefinida, sinais downmixed de emésimo quadro em pelo menos um sinal downmixed de enésimo quadro, e obtenção do sinal downmixed de enésimo quadro de acordo com os sinais downmixed de emésimoquadro com base em um primeiro algoritmo predeterminado, onde m é um número inteiro positivo maior que 0, e o sinal downmixed de enésimo quadro é obtido por um codificador através de mistura de sinais em dois de múltiplos canais com base em um segundo algoritmo predeterminado.
[0031] O fluxo de bits recebido pelo decodificador inclui o quadro de primeiro tipo e o quadro de segundo tipo, o quadro de primeiro tipo inclui o sinal de downmixed e o quadro de segundo tipo não inclui o sinal de downmixed. Ou seja, o codificador não codifica cada quadro do sinal downmixed. Portanto, a transmissão descontínua no sinal downmixed é implementada, e a eficiência de compressão de sinal downmixed de um sistema de comunicações de áudio multicanais é melhorada.
[0032] Deve-se notar que, nas modalidades da presente invenção, o fluxo de bits do primeiro quadro é o quadro do primeiro tipo. Especificamente, para restaurar o sinal downmixed obtido para os sinais de
Petição 870190037280, de 18/04/2019, pág. 15/131
12/85 áudio nos dois canais após a decodificação do fluxo de bits do primeiro quadro, o fluxo de bits do primeiro quadro precisa ainda incluir um conjunto de parâmetros estéreos. Especificamente, porque o quadro de primeiro tipo inclui o sinal downmixed e o quadro de segundo tipo não inclui o sinal downmixed, um tamanho do quadro de primeiro tipo é maior que um tamanho do quadro de segundo tipo. O decodificador pode determinar, de acordo com um tamanho do fluxo de bits do enésimo quadro, se o fluxo de bits do enésimo quadro é do primeiro tipo ou do segundo tipo. Além disso, um bit de sinalizador pode ser ainda mais encapsulado no fluxo de bits do enésimo quadro. O decodificador decodifica parcialmente o fluxo de bits do enésimo quadro, para obter o bit de sinalização. Se o bit de sinalizador indicar que o fluxo de bits do enésimo quadro é o quadro de primeiro tipo, o decodificador decodificará o fluxo de bits de enésimo quadro, para obter o sinal de downmix do enésimo quadro. Se o bit de sinalizador indicar que o fluxo de bits de enésimo quadro é o quadro do segundo tipo, o decodificador obtém o sinal downmixedde enésimo quadro de acordo com o primeiro algoritmo predeterminado.
[0033] Baseado no segundo aspecto, para restaurar o sinal downmixed para sinais de áudio nos dois canais e assegurar a qualidade de comunicação dos sinais de áudio, opcionalmente, o quadro de primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, e o quadro do segundo tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed', e, ao determinar que o fluxo de bits do enésimo quadro é do primeiro tipo, após decodificar o fluxo de bits, o decodificador obtém o sinal downmixed de enésimo quadro e um conjunto de parâmetros estéreos de enésimo quadro e restaura o sinal para os sinais de áudio de enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos com enésimo quadro baseado em um terceiro algoritmo prede
Petição 870190037280, de 18/04/2019, pág. 16/131
13/85 terminado; ou se determinar que o fluxo de bits de enésimo quadro é o quadro do segundo tipo, o decodificador decodifica o fluxo de bits de enésimo quadro, para obter um conjunto de parâmetros estéreos de enésimo quadro e obtém o sinal downmixed de enésimo quadro com base no primeiro algoritmo predeterminado. Em seguida, o decodificador restaura o sinal downmixed de enésimo quadro para os sinais de áudio de enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro com base no terceiro algoritmo predeterminado.
[0034] Baseado no segundo aspecto, para restaurar o sinal downmixed para os sinais de áudio nos dois canais e assegurar a qualidade de comunicação, opcionalmente, o quadro de primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, e o quadro de segundo tipo não inclui nem um sinal downmixed nem um conjunto de parâmetros estéreos; e, se determinar que o fluxo de bits de enésimo quadro é do primeiro tipo, o decodificador decodificará o fluxo de bits de enésimo quadro, para obter o sinal de mixagem de enésimo quadro e um conjunto de parâmetros estéreos de enésimo quadro, sinal downmixed para os sinais de áudio de enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro baseado em um terceiro algoritmo; ou se determinar que o fluxo de bits do enésimo quadro é o quadro de segundo tipo, o decodificador obtém o sinal downmixedde enésimo quadro baseado no primeiro algoritmo predeterminado, determina, de acordo com uma segunda regra pré-definida, conjunto de parâmetros estéreos de quadro único precedendo um conjunto de parâmetros estéreos de enésimo quadro, obtém o conjunto de parâmetros estéreos de de enésimo quadro, de acordo com os conjuntos de parâmetros estéreos de quadro K com base em um quarto algoritmo predeterminado e restaura o sinal downmixed de enésimo quadro para os sinais
Petição 870190037280, de 18/04/2019, pág. 17/131
14/85 de áudio de enésimo quadro de acordo com pelo menos um conjunto de parâmetros estéreos de enésimo quadro baseado em um terceiro algoritmo, em que k é um número inteiro positivo maior que 0.
[0035] Baseado no segundo aspecto, para restaurar o sinal downmixed para os sinais de áudio nos dois canais e assegurar a qualidade de comunicação dos sinais de áudio, opcionalmente, o quadro de primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, um quadro de terceiro tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed, um quadro do quarto tipo não inclui um sinal downmixed nem um conjunto de parâmetros estéreos e cada um dos quadros de terceiro tipo e quarto tipo é um caso do quadro do segundo tipo; e [0036] se determinar que o fluxo de bits da Enésimo quadro é do primeiro tipo, o decodificador decodificará o fluxo de bits do Enésimo quadro, para obter o sinal de downmixed de Enésimo quadro e um conjunto de parâmetros estéreos de Enésimo quadro e restaura para os sinais de áudio de enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro com base em um terceiro algoritmo; ou [0037] se o decodificador determinar que o fluxo de bits do Enésimo quadro é um quadro do segundo tipo, os dois casos a seguir serão incluídos:
[0038] ao determinar que o fluxo de bits da Enésimo quadro é um quadro do terceiro tipo, o decodificador decodifica o fluxo de bits do Enésimo quadro, obtém um conjunto de parâmetros estéreos de enésimo quadro, obtém o sinal downmixed de enésimo quadro baseado no primeiro algoritmo predeterminado e restaura o sinal downmixedde enésimo quadro para os sinais de áudio de enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro baseado em um terceiro algoritmo; ou
Petição 870190037280, de 18/04/2019, pág. 18/131
15/85 [0039] quando o quadro de bits do Enésimo quadro é urn quadro do quarto tipo, o decodificador determina, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de quadro único precedendo um conjunto de parâmetros estéreos de Enésimo quadro, obtém o conjunto de parâmetros estéreos de enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k baseado em um quarto algoritmo predeterminado, onde k é um número inteiro positivo maior que 0, obtém o sinal de downmixed de Enésimo quadro baseado no primeiro algoritmo predeterminado, e restaura o sinal downmixed de enésimo quadro para os sinais de áudio de enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro com base em um terceiro algoritmo.
[0040] Baseado no segundo aspecto, para restaurar o sinal downmixed para os sinais de áudio nos dois canais e assegurar a qualidade de comunicação dos sinais de áudio, opcionalmente, um quadro do tipo quinto inclui um sinal downmixed e um conjunto de parâmetros estéreos, um quadro do sexto tipo inclui um sinal downmixed mas não inclui um conjunto de parâmetros estéreos, cada um dos quadros do tipo quinto e do sexto tipo é um caso do quadro do primeiro tipo, e o quadro do segundo tipo não inclui nem um sinal downmixed nem um conjunto de parâmetros estéreos; e [0041] - se o decodificador determinar que o fluxo de bits de Enésimo quadro é do primeiro tipo, os dois casos a seguir serão incluídos: [0042] - quando o fluxo de bits da Enésimo quadro é do quinto tipo, o decodificador decodifica o fluxo de bits da Enésimo quadro, para obter o sinal de downmixed de Enésimo quadro e um conjunto de parâmetros estéreos de Enésimo quadro e restaura o sinal downmixed de Enésimo quadro para sinais de áudio de enésimo quadro de acordo
Petição 870190037280, de 18/04/2019, pág. 19/131
16/85 com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro com base em um terceiro algoritmo; ou [0043] - quando o fluxo de bits de Enésimo quadro é o quadro do sexto tipo, o decodificador decodifica o fluxo de bits de conjuntos de parâmetros estéreos de Enésimo quadro para determinar o sinal downmixed de Enésimo quadro, determina, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros precedendo um conjunto de parâmetros estéreos de enésimo quadro, obtém o conjunto de parâmetros estéreo de enésimo quadro definido de acordo com os conjuntos de parâmetros estéreos de quadro k baseados em um quarto algoritmo predeterminado e restaura o sinal downmixed de Enésimo quadro para os sinais de áudio de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro com base em um terceiro algoritmo; ou [0044] - se o fluxo de bits de Enésimo quadro for do segundo tipo, o decodificador obterá o sinal downmixed do enésimo quadro com base no primeiro algoritmo predeterminado, determina, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de quadro único que precede um conjunto de parâmetros estéreos de enésimo quadro, obtém o conjunto de parâmetros estéreo Enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado e restaura o sinal downmixed de enésimo quadro para os sinais de áudio de Enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro com base em um terceiro algoritmo.
[0045] Baseado no segundo aspecto, para restaurar o sinal downmixed para os sinais de áudio nos dois canais e assegurar a qua
Petição 870190037280, de 18/04/2019, pág. 20/131
17/85 lidade de comunicação dos sinais de áudio, opcionalmente, um quadro do quinto tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, um quadro do sexto tipo inclui um sinal downmixed, mas não inclui um conjunto de parâmetros estéreos, cada quadro do quinto tipo e do quadro do sexto tipo é um caso do quadro de primeiro tipo, um quadro de terceiro tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed, um quadro de quarto tipo não inclui nem um sinal de downmixed nem um conjunto de parâmetros estéreo, e cada um dos quadros de terceiro tipo e de quarto tipo é um caso do quadro de segundo tipo ; e [0046] - se o decodificador determinar que o fluxo de bits de Enésimo quadro é do primeiro tipo, os dois casos a seguir serão incluídos: [0047] - quando o fluxo de bits do Enésimo quadro é de quadro do quinto tipo, após decodificar o fluxo de bits de Enésimo quadro, o decodificador obtém o sinal downmixedde enésimo quadro e um conjunto de parâmetros estéreos de Enésimo quadro e restaura o sinal downmixed de enésimo quadro para os sinais de áudio de enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro com base em um terceiro algoritmo; ou [0048] - quando o fluxo de bits de Enésimo quadro é de um quadro do sexto tipo, após decodificar o fluxo de bits de Enésimo quadro, o decodificador obtém o sinal downmixed de Enésimo quadro, determina, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de quadro único precedendo um conjunto de parâmetros estéreos de enésimo quadro, obtém o conjunto de parâmetros estéreos de enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado e restaura o sinal downmixedde Enésimo quadro para os sinais de
Petição 870190037280, de 18/04/2019, pág. 21/131
18/85 áudio de enésimo quadro, de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro com base em um terceiro algoritmo; ou [0049] - se o decodificador determinar que o fluxo de bits de Enésimo quadro é um quadro do segundo tipo, os dois casos a seguir serão incluídos:
[0050] - quando o fluxo de bits de Enésimo quadro é um quadro do terceiro tipo, o decodificador decodifica o fluxo de bits de Enésimo quadro, obtém um conjunto de parâmetros estéreos de enésimo quadro, obtém o sinal de down mixed de enésimo quadro baseado no primeiro algoritmo predeterminado e restaura o sinal downmixed de enésimo quadro para os sinais de áudio de enésimo quadro, de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro com base em um terceiro algoritmo; ou [0051] - quando o quadro de bits de Enésimo quadro é o quadro do quarto tipo, o decodificador determina, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de quadro único precedido por um conjunto de parâmetros estéreos de Enésimo quadro, obtém o conjunto de parâmetros estéreos de enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado, onde k é um número inteiro positivo maior que 0, obtém o sinal downmixed de Enésimo quadro baseado no primeiro algoritmo predeterminado e restaura o sinal downmixed de enésimo quadro para os sinais de áudio de enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro com base em um terceiro algoritmo.
[0052] De acordo com um terceiro aspecto, é fornecido um codificador, incluindo: uma unidade de detecção de sinal e uma unidade de
Petição 870190037280, de 18/04/2019, pág. 22/131
19/85 codificação de sinal. A unidade de detecção de sinal é configurada para detectar se um sinal down mixed de enésimo quadro inclui um sinal de fala, onde o sinal downmixed de enésimo quadro é obtido após os sinais de áudio de enésimo quadro em dois de múltiplos canais serem misturados com base em um primeiro algoritmo predeterminado. N é um número inteiro positivo maior que 0. A unidade codificadora de sinal é configurada para: codificar o sinal downmixedde enésimo quadro quando a unidade de detecção de sinal detecta que o sinal downmixed de enésimo quadro inclui o sinal de fala; ou quando a unidade de detecção de sinal detecta que o sinal downmixedde enésimo quadro não inclui o sinal de voz: codificar o sinal downmixed de enésimo quadro, se a unidade de detecção de sinal determinar que o sinal downmixed de enésimo quadro satisfaz uma condição de codificação de quadro de áudio predefinida ou ignorar a codificação do sinal downmixedde enésimo quadro, se a unidade de detecção de sinal determinar que o sinal down-mix de enésimo quadro não satisfaz uma condição de codificação de quadro de áudio predefinida.
[0053] Baseado no terceiro aspecto, opcionalmente, a unidade de codificação de sinal inclui uma primeira unidade codificadora de sinal e uma segunda unidade codificadora de sinal. Quando a unidade de deteco de sinal detecta que o sinal downmixed inclui o sinal de voz, a unidade de detecção de sinal instrui a primeira unidade codificadora de sinal a codificar o sinal downmixedde Enésimo quadro. Em alternativa, se for determinado que o sinal downmixedde Enésimo quadro satisfaz uma condição de codificação de quadro de voz predefinida, a unidade de detecção de sinal instrui a primeira unidade de codificação de sinal para codificar o sinal downmixed de Enésimo quadro . Especificamente, a primeira unidade codificadora de sinal codifica o sinal downmixed de Enésimo quadro de acordo com uma taxa de codificação de quadro de voz pré-ajustada. Se determinar que o sinal downmixed de Enési
Petição 870190037280, de 18/04/2019, pág. 23/131
20/85 mo quadro não satisfaz uma condição de codificação de quadro de voz pré-ajustada, mas satisfaz uma condição de codificação de quadro SI D de descritor de inserção de silêncio predefinido, a unidade de detecção de sinal instrui a segunda unidade de codificação de sinal para codificar o sinal downmixed de Enésimo quadro. Especificamente, a segunda unidade de codificação de sinal codifica o sinal downmixedde Enésimo quadro de acordo com uma taxa de codificação de SI D predefinida, em que a taxa de codificação de SI D não é maior do que a taxa de codificação de quadro de voz.
[0054] Com base no terceiro aspecto, opcionalmente, o codificador inclui ainda uma unidade de geração de parâmetros, uma unidade de codificação de parâmetros e uma unidade de detecção de parâmetros. A unidade de geração de parâmetros é configurada para obter um conjunto de parâmetros estéreos de Enésimo quadro de acordo com os sinais de áudio de Enésimo quadro, onde o conjunto de parâmetros estéreos de Enésimo quadro inclui parâmetros estéreos de Z, os parâmetros estéreos Z incluem um parâmetro usado quando o codificador mistura os sinais de áudio de Enésimo quadro com base no primeiro algoritmo predeterminado e Z é um número inteiro positivo maior que 0. A unidade de codificação de parâmetros é configurada para: codificar o conjunto de parâmetros estéreos de Enésimo quadro quando a unidade de detecção de sinal detecta que o sinal downmixed de Enésimo quadro inclui o sinal de fala; ou quando a unidade de detecção de sinal detecta que o sinal downmixed de Enésimo quadro não inclui o sinal de fala, codifique pelo menos um parâmetro estéreo no parâmetro estéreo de Enésimo quadro, se a unidade de detecção de parâmetro determinar que o parâmetro estéreo Enésimo quadro satisfaz uma condição de codificação de parâmetro estéreo predefinida ou ignorar a codificação do conjunto de parâmetros estéreos, se a unidade de detecção de parâmetro determinar que o conjunto de parâme
Petição 870190037280, de 18/04/2019, pág. 24/131
21/85 tros estéreos de Enésimo quadro não satisfaz uma condição de codificação de parâmetro estéreo predefinida.
[0055] Com base no terceiro aspecto, opcionalmente, a unidade de codificação de parâmetros é configurada para: obter X parâmetros estéreos alvo de acordo com os parâmetros estéreos Z no conjunto de parâmetros estéreos de Enésimo quadro com base em uma regra de redução de dimensão de parâmetro estéreo predefinida e codificar os parâmetros estéreos alvo X, em que X é um número inteiro positivo maior que 0 e menor ou igual a Z.
[0056] Com base no terceiro aspecto, opcionalmente, a unidade de geração de parâmetros inclui uma primeira unidade de geração de parâmetros e uma segunda unidade de geração de parâmetros, onde [0057] quando a unidade de detecção de sinal detecta que os sinais de áudio de Enésimo quadro incluem o sinal de voz, ou quando a unidade de detecção de sinal detecta que os sinais de áudio de Enésimo não incluem o sinal de voz e os sinais de áudio de Enésimo quadro satisfazem a condição de codificação de quadro de voz predefinida, a unidade de detecção de sinal instrui a primeira unidade de geração de parâmetros a gerar um conjunto de parâmetros estéreos de Enésimo quadro; especificamente, a primeira unidade de geração parâmetros obtém o conjunto de parâmetros estéreos de Enésimo quadro de acordo com os sinais de áudio de Enésimo baseado em um primeiro modo de geração de conjunto de parâmetros estéreos, e a unidade de codificação de parâmetros estéreos codifica o conjunto de parâmetros estéreos de Enésimo quadro; especificamente, quando a unidade de codificação de parâmetros inclui uma primeira unidade de codificação de parâmetros e uma segunda unidade de codificação de parâmetros, a primeira unidade de codificação de parâmetros codifica o conjunto de parâmetros estéreos de Enésimo quadro , em que uma forma de codificação estipulada pela primeira unidade de codificação
Petição 870190037280, de 18/04/2019, pág. 25/131
22/85 de parâmetros é uma primeira forma de codificação, uma maneira de codificação estipulada pela segunda unidade de codificação de parâmetros é uma segunda maneira de codificação; especificamente, uma taxa de codificação estipulada na primeira maneira de codificação não é menor do que uma taxa de codificação estipulada na segunda maneira de codificação; e / ou, para qualquer parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro, a precisão de quantização estipulada na primeira maneira de codificação não é inferior à precisão de quantização estipulada na segunda maneira de codificação; e [0058] quando a unidade de detecção de sinal detecta que os sinais de áudio de Enésimo quadro não incluem o sinal de fala: a segunda unidade de geração de parâmetros obtém o parâmetro estéreo Enésimo quadro de acordo com os sinais de áudio de Enésimo quadro com base em uma segunda maneira de geração de conjunto de parâmetros estéreos de Enésimo quadro , e quando a unidade de detecção de parâmetro determina que o conjunto de parâmetros estéreos de Enésimo quadro satisfaz uma condição de codificação de parâmetros estéreos predefinida, a unidade de codificação de parâmetro codifica pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro e, especificamente, quando a unidade de codificação de parâmetros inclui a primeira unidade de codificação de parâmetros e a segunda unidade de codificação de parâmetros, a segunda unidade de codificação de parâmetros codifica o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro; ou [0059] a unidade de codificação de parâmetros ignora a codificação do conjunto de parâmetros estéreos quando a unidade de detecção de parâmetros determina que o conjunto de parâmetros estéreos de Enésimo quadro não satisfaz uma condição de codificação de paPetição 870190037280, de 18/04/2019, pág. 26/131
23/85 râmetros estéreos predefinida; e [0060] o primeiro modo de geração do conjunto de parâmetros estéreos e o segundo modo de geração do conjunto de parâmetros estéreos satisfazem pelo menos uma das seguintes condições:
[0061] uma quantidade que é de tipos de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreos não é menor que uma quantidade que é dos tipos de parâmetros estéreoss incluídos em um conjunto de parâmetros estéreo e que é estipulado na segunda forma de geração de conjunto de parâmetros estéreo, uma quantidade que é de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreos não é menor que uma quantidade de parâmetros estéreos incluída em um parâmetro estéreo definido e estipulado na segunda forma de geração do conjunto de parâmetros estéreos, a resolução no domínio do tempo que é de um parâmetro estéreo e que é estipulado na primeira forma de geração do conjunto de parâmetros estéreos não é inferior à resolução no domínio de tempo que é de um parâmetro estéreo correspondente e que é estipulado na segunda forma de geração de conjunto de parâmetros estéreos, ou resolução de domínio de frequência que é de um parâmetro estéreo e que é estipulado na primeira forma de geração do conjunto de parâmetros estéreos não é inferior à resolução de domínio de frequência que é de um parâmetro estéreo correspondente e que é estipulado na segunda forma de geração do conjunto de parâmetros estéreos.
[0062] Baseado no terceiro aspecto, opcionalmente, a unidade de codificação de parâmetros inclui uma primeira unidade de codificação de parâmetros e uma segunda unidade de codificação de parâmetros. Especificamente, a primeira unidade de codificação de parâmetros é configurada para codificar o conjunto de parâmetros estéreos de Ené
Petição 870190037280, de 18/04/2019, pág. 27/131
24/85 simo quadro de acordo com uma primeira forma de codificação quando o sinal downmixedde Enésimo quadro inclui o sinal de voz e quando o sinal downmixed de Enésimo quadro não inclui o sinal de voz, mas satisfaz a condição de codificação do quadro de voz; e a segunda unidade de codificação de parâmetros é configurada para codificar pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro de acordo com uma segunda maneira de codificação quando o sinal downmixedde Enésimo quadro não satisfaz a condição de codificação de quadro de voz, onde [0063] - uma taxa de codificação estipulada na primeira maneira de codificação não é menor do que uma taxa de codificação estipulada na segunda maneira de codificação; e / ou para qualquer parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro, a precisão de quantização estipulada na primeira maneira de codificação não é inferior à precisão de quantização estipulada na segunda maneira de codificação.
[0064] Baseado no terceiro aspecto, opcionalmente, se o pelo me nos um parâmetro estéreo no conjunto de parâmetros estéreo de Enésimo quadro incluir uma ILD de diferença de nível entre canais, a condição de codificação de parâmetro estéreo predefinida inclui dl>d0, [0065] Onde dl representa um grau pelo qual o ILD se desvia de um primeiro padrão, o primeiro padrão é determinado com base em um segundo algoritmo predeterminado de acordo com conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Enésimo quadro e T é um número inteiro positivo maior que 0;
[0066] se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro incluir uma diferença de tempo entre canais ITD, a condição de codificação de parâmetro estéreo predefinida inclui dt>d1,
Petição 870190037280, de 18/04/2019, pág. 28/131
25/85 [0067] - onde DT representa um grau pelo qual o ITD se desvia de um segundo padrão, o segundo padrão é determinado com base em um terceiro algoritmo predeterminado de acordo com conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Enésimo quadro e T é um número inteiro positivo maior que 0; ou [0068] - Se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro incluir uma IPD de diferença de fase entre canais, a condição de codificação de parâmetro estéreo predefinida inclui dp>d2, [0069] - onde Dp representa um grau pelo qual o IPD se desvia de um terceiro padrão, o terceiro padrão é determinado com base em um quarto algoritmo predeterminado de acordo com os conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Enésimo quadro e T é um número inteiro positivo maior que 0.
[0070] Baseado no terceiro aspecto, opcionalmente, dl, DTe dp respectivamente, satisfazem as seguintes expressões:
M-l 1 T
Dl = ^(110^)--^110^^));
m=0 *- t=l
DT=ITD-^ITDl-t](m)-,e í í=l
M-l 1 T
Op^(fPO(m)--^fP/rti(m)), m=0 *- t=l [0071] onde iLO(m) é uma diferença de nível gerada quando os sinais de áudio de Enésimo quadro são transmitidos, respectivamente, nos dois canais em uma emésima banda de subfrequências, M é uma quantidade total de sub bandas de frequências ocupadas para transi T missão dos sinais de áudio de Enésimo quadro, —é um
Petição 870190037280, de 18/04/2019, pág. 29/131
26/85 valor médio de ILDs nos conjuntos de parâmetros estéreos de Enésimo quadro precedendo o conjunto de parâmetros estéreos de Enésimo quadro na emésima sub banda de frequências , T é um interior positivo maior do que 0, iLD[~‘\m) é uma diferença de nível gerada quando os sinais de áudio de quadro-t que precedem os sinais de áudio de Enésimo quadro são transmitidos respectivamente nos dois canais na mésima banda de subfrequências, o ITD é uma diferença de tempo gerada quando os sinais de áudio de Enésimo quadro são i T transmitidos respectivamente nos dois canais, —^/td[í] é um valor T f=i médio de ITDs nos conjuntos de parâmetros estéreos de quadro T que precedem o conjunto de parâmetros estéreos de Enésimo , é uma diferença de tempo gerada quando os sinais de áudio de quadro t que precedem os sinais de áudio de Enésimo quadro são transmitidos respectivamente nos dois canais, —^/PD[_f](m) nrtt} é uma diferenT f=i ça de fase gerada quando alguns dos sinais de áudio Enésimo quadro são transmitidos respectivamente nos dois canais na m-ésima subi T banda de frequências, —^/PD[_f](m) é um valor médio de IPDs nos T f=i conjuntos de parâmetros estéreos T-frame que precedem o conjunto de parâmetros estéreos de Enésimo quadro ajustado na m-ésima subbanda de frequências, e é uma diferença de fase gerada quando os sinais de áudio de quadro T precedendo os sinais de áudio de Enésimo quadro são transmitidos respectivamente nos dois canais da emésima sub banda de frequências [0072] De acordo com um quarto aspecto, é fornecido um decodificador, incluindo: uma unidade receptora e uma unidade de decodificação. A unidade receptora é configurada para receber um fluxo de bits, onde o fluxo de bits inclui pelo menos dois quadros, os pelo menos dois quadros incluem pelo menos um quadro de primeiro tipo e
Petição 870190037280, de 18/04/2019, pág. 30/131
27/85 pelo menos um quadro de segundo tipo, o quadro de primeiro tipo inclui um sinal downmixed e o quadro do segundo tipo não inclui um sinal downmixed; e a unidade de decodificação é configurada para: um fluxo de bits de Enésimo quadro, onde N é um número inteiro positivo maior que 1, decodificar o fluxo de bits de Enésimo quadro, se for determinado que o fluxo de bits do Enésimo quadro é um sinal downmixed de Enésimo quadro; ou se for determinado que o fluxo de bits de Enésimo quadro é do segundo tipo, determinar, de acordo com uma primeira regra predefinida, sinais downmixed em quadro-m em pelo menos um sinal downmixed de quadro anterior e obtenha o sinal downmixed de Enésimo quadro de acordo com os sinais downmixed de quadro m baseado em um primeiro algoritmo predeterminado, onde m é um número inteiro positivo maior que 0, e [0073] o sinal downmixed de Enésimo quadro é obtido por um codificador misturando sinais de áudio de Enésimo quadro em dois de múltiplos canais com base em um segundo algoritmo predeterminado. [0074] Com base no quarto aspecto, opcionalmente, o quadro de primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, e o quadro de segundo tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed;
[0075] a unidade de decodificação é ainda configurada para: se for determinado que o fluxo de bits do Enésimo quadro é o primeiro tipo de quadro, decodificar o fluxo de bits de Enésimo quadro, para obter tanto o sinal downmixed de Enésimo quadro quanto um conjunto de parâmetros estéreos de Enésimo quadro; ou se for determinado que o fluxo de bits de Enésimo quadro é do segundo tipo, decodificar o fluxo de bits de Enésimo quadro para obter um conjunto de parâmetros estéreos de Enésimo quadro, onde pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro é utilizado pelo decodificador para restaurar o sinal downmixed de Enésimo quadro
Petição 870190037280, de 18/04/2019, pág. 31/131
28/85 para os sinais de áudio de Enésimo quadro com base em um terceiro algoritmo predeterminado; e [0076] - uma unidade de restauração de sinal é configurada para restaurar o sinal downmixedde Enésimo quadro para os sinais de áudio de Enésimo quadro de acordo com o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro baseado no terceiro algoritmo.
[0077] Com base no quarto aspecto, opcionalmente, o quadro do primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, e o quadro de segundo tipo não inclui nem um sinal downmixed nem um conjunto de parâmetros estéreos:
[0078] - a unidade de decodificação é ainda configurada para: se for determinado que o fluxo de bits de Enésimo quadro é o quadro de primeiro tipo, decodificar o fluxo de bits de Enésimo quadro, para obter o sinal downmixed de Enésimo quadro e um conjunto de parâmetros estéreos de Enésimo quadro; ou se for determinado que o fluxo de bits de Enésimo quadro é o quadro de segundo tipo , determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de quadro único precedendo um conjunto de parâmetros estéreos de Enésimo quadro, e obter o conjunto de parâmetros estéreos de Enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado, onde k é um número inteiro maior do que 0, e [0079] pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro é usado pelo decodificador para restaurar o sinal downmixed do Enésimo quadro para os sinais de áudio do Enésimo quadro com base em um terceiro algoritmo predeterminado; e [0080] uma unidade de restauração de sinal é configurada para
Petição 870190037280, de 18/04/2019, pág. 32/131
29/85 restaurar o sinal downmixed de Enésimo quadro para os sinais de áudio de Enésimo quadro de acordo com o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro com base no terceiro algoritmo.
[0081] Com base no quarto aspecto, opcionalmente, o quadro de primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, um quadro de terceiro tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed, um quadro de quarto tipo não inclui nem um sinal downmixed nem um conjunto de parâmetros estéreos, e cada quadro de terceiro tipo e quadro de quarto tipo é um caso do quadro de segundo tipo;
[0082] - a unidade de decodificação é ainda configurada para: se for determinado que o fluxo de bits de Enésimo quadro é o quadro de primeiro tipo, decodificar o fluxo de bits de Enésimo quadro, para obter o sinal downmixed de Enésimo quadro e um conjunto de parâmetros estéreos de Enésimo quadro; ou se for determinado que o fluxo de bits de Enésimo quadro é o quadro de segundo tipo, quando o fluxo de bits de Enésimo quadro for o quadro de terceiro tipo, decodificar o fluxo de bits de Enésimo quadro para obter um conjunto de parâmetros estéreos de Enésimo quadro, ou quando o fluxo de bits de Enésimo quadro é o quadro de quarto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de quadro único precedendo um conjunto de parâmetros estéreos de Enésimo quadro, e obter o conjunto de parâmetros de Enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado, onde k é um número inteiro positivo maios que 0, e [0083] pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro é usado pelo decodificador para res
Petição 870190037280, de 18/04/2019, pág. 33/131
30/85 taurar o sinal downmixed de Enésimo quadro para os sinais de áudio de Enésimo quadro com base em terceiro algoritmo predeterminado; e [0084] uma unidade de restauração de sinal é configurada para restaurar o sinal downmixed de Enésimo quadro para os sinais de áudio de Enésimo quadro de acordo com o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro com base no terceiro algoritmo.
[0085] Com base no quarto aspecto, opcionalmente, um quadro de quinto tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, um quadro de sexto tipo inclui um sinal downmixed, mas não inclui um conjunto de parâmetros estéreos, cada quadro de quinto tipo e quadro de sexto tipo é um caso do quadro de primeiro tipo, e o quadro de segundo tipo não inclui nem um sinal downmixed nem um conjunto de parâmetros estéreos;
[0086] - a unidade de decodificação é ainda configurada para: se for determinado que o fluxo de bits de Enésimo quadro é o quadro de primeiro tipo, quando o fluxo de bits de Enésimo quadro for um quadro de quinto tipo, decodificar o fluxo de bits de Enésimo quadro para obter o sinal downmixed e um conjunto de parâmetros estéreos de Enésimo quadro; ou quando o fluxo de bits de Enésimo quadro for o quadro de sexto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de quadro único precedendo um conjunto de parâmetros estéreos de Enésimo quadro, e obter o conjunto de parâmetros estéreos de Enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado; ou se for determinado que o fluxo de bits de Enésimo quadro é o quadro de segundo tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros esté
Petição 870190037280, de 18/04/2019, pág. 34/131
31/85 reos de quadro único precedendo um conjunto de parâmetros estéreos de Enésimo quadro, e obter o conjunto de parâmetros estéreos de Enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado, onde [0087] pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Enésimo quadro para os sinais de áudio de Enésimo quadro com base em um terceiro algoritmo predeterminado, e k é um número inteiro positivo maior que 0; e [0088] uma unidade de restauração de sinal é configurada para restaurar o sinal downmixed do Enésimo quadro para os sinais de áudio de Enésimo qaudro de acordo com o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro com base no terceiro algoritmo.
[0089] Com base no quarto aspecto, opcionalmente, um quadro do quinto tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, um quadro do terceiro tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed, um quadro de quarto tipo e não inclui nem um sinal downmixed nem um conjunto de parâmetros estéreos e cada um dentre o quadro de terceiro tipo e o quadro de quarto tipo é um caso do quadro de segundo tipo;
[0090] - a unidade de decodificação é ainda configurada para: se for determinado que o fluxo de bits de Enésimo quadro é do primeiro tipo, quando o fluxo de bits de Enésimo quadro é do quinto tipo, decodificar o fluxo de bits do Enésimo quadro para obter o sinal downmixed de Enésimo quadro e um conjunto de parâmetros estéreos de Enésimo quadro; ou quando o fluxo de bits de Enésimo quadro for do sexto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos precedido por um conjunto de parâmetros
Petição 870190037280, de 18/04/2019, pág. 35/131
32/85 estéreos de Enésimo quadro e obtenha o conjunto de parâmetros estéreos de Enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado; ou [0091] - a unidade de decodificação é ainda configurada para: se for determinado que o fluxo de bits de Enésimo quadro [0092] é um quadro do segundo tipo, quando o fluxo de bits de enésimo quadro é um quadro do terceiro tipo, decodificar o fluxo de bits de enésimo quadro, para obter um conjunto de parâmetros estéreos de enésimo quadro, ou quando o fluxo de bits de enésimo quadro é um quadro do quarto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos precedendo um conjunto de parâmetros estéreos de Enésimo quadro, e obter o conjunto de parâmetros estéreos de Enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado, onde [0093] pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Enésimo quadro para os sinais de áudio de Enésimo quadro com base em um terceiro algoritmo predeterminado e k é um número inteiro positivo maior que 0; e [0094] o decodificador ainda inclui uma unidade de restauração de sinal, onde [0095] uma unidade de restauração de sinal é configurada para restaurar o sinal downmixedde Enésimo quadro para os sinais de áudio de Enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro baseado no terceiro algoritmo.
[0096] De acordo com um quinto aspecto, um sistema de codifica
Petição 870190037280, de 18/04/2019, pág. 36/131
33/85 ção e de decodificação é proporcionado, incluindo qualquer codificador proporcionado no terceiro aspecto, e qualquer decodificador proporcionado no quarto aspecto.
[0097] De acordo com um sexto aspecto, uma modalidade da presente invenção fornece ainda um dispositivo terminal. O dispositivo terminal inclui um processador e uma memória. A memória é configurada para armazenar um programa de software, e o processador é configurado para ler o programa de software armazenado na memória e implementar o método fornecido no primeiro aspecto ou em qualquer implementação do primeiro aspecto.
[0098] De acordo com um sétimo aspecto, uma modalidade da presente invenção fornece ainda um meio de armazenamento de computador. O meio de armazenamento pode ser não volátil. Ou seja, o conteúdo não é perdido após o desligamento. O meio de armazenamento armazena um programa de software, e quando o programa de software é lido e executado por um ou mais processadores, o método fornecido no primeiro aspecto ou qualquer implementação do primeiro aspecto pode ser implementado.
BREVE DESCRIÇÃO DOS DESENHOS [0099] A figura 1 é um fluxograma de um método de processamento de sinais de áudio de multicanais de acordo com a modalidade 1 da presente invenção;
[00100] As figuras 2A, 2B e 2C são um fluxograma esquemático de um método de processamento de sinal de áudio multicanal de acordo com a modalidade 2 da presente invenção;
[00101] As figuras 3a à 3d são diagramas esquemáticos de um codificador de acordo com uma modalidade da presente invenção;
[00102] A figura 4 é um diagrama esquemático de um decodificador de acordo com uma modalidade da presente invenção; e [00103] A figura 5 é um diagrama esquemático de um sistema de
Petição 870190037280, de 18/04/2019, pág. 37/131
34/85 codificação e decodificação de acordo com uma modalidade da presente invenção.
DESCRIÇÃO DE MODALIDADES [00104] Para tornar os objetivos, soluções técnicas e vantagens da presente invenção mais claros, o seguinte descreve ainda a presente invenção em detalhes com referência aos desenhos em anexo.
[00105] Deve ser entendido que, em uma tecnologia de codificação e decodificação de áudio, um sinal de áudio é codificado ou decodificado em uma unidade de quadro. Especificamente, um sinal de áudio de Enésimo quadro é um enésimo quadro de áudio. Quando o sinal de áudio de enésimo quadro inclui um sinal de fala, o enésimo quadro de áudio é um quadro de fala. Quando o sinal de áudio de Enésimo quadro não inclui um sinal de fala, mas inclui um sinal de ruído de fundo, o enésimo quadro de áudio é um quadro de ruído. Aqui, N é um número inteiro positivo maior que 0.
[00106] Além disso, em um sistema de comunicação mono, quando uma maneira de codificação descontínua é usada, a codificação é executada uma vez a cada vários quadros de ruído, para obter um quadro descritor de inserção de silêncio (Silence Insertion Descriptor, SID).
[00107] Um codificador e um decodificador nas modalidades da presente invenção são pacotes utilizados para processar um sinal de áudio multicanal. Os pacotes podem ser instalados em um dispositivo que suporte processamento de sinais de áudio multicanal, como um terminal (por exemplo, um telefone celular, um notebook ou um computador tablet) ou um servidor, de modo que o dispositivo, como o terminal ou o servidor, tem uma função de processar o sinal de áudio multicanal nas modalidades da presente invenção.
[00108] Nas modalidades da presente invenção, porque um sinal de áudio pode ser codificado usando um mecanismo de codificação des
Petição 870190037280, de 18/04/2019, pág. 38/131
35/85 contínua em um sistema de comunicações multicanal, a eficiência de compressão de sinal de áudio é grandemente melhorada.
[00109] O seguinte descreve em detalhes um método de processamento de sinal de áudio multicanal nas modalidades da presente invenção utilizando um sinal downmixed de Enésimo quadro como exemplo, e N é um número inteiro positivo maior que 0. Supõe-se que o sinal downmixed de Enésimo quadro é obtido após os sinais de áudio de Enésimo quadro em dois dos múltiplos canais serem misturados.
[00110] Quando os canais múltiplos são dois canais, e os dois canais são respectivamente um primeiro canal e um segundo canal, os dois dos múltiplos canais são o primeiro canal e o segundo canal, e um sinal down-mix de Enésimo quadro é obtido misturando um sinal de áudio de Enésimo quadro no primeiro canal e um sinal de áudio de Enésimo quadro no segundo canal. Quando os múltiplos canais são pelo menos três canais, um sinal downmixed é obtido pela mistura de sinais de áudio em dois canais emparelhados nos múltiplos canais. Especificamente, três canais são usados como exemplo, e os três canais são um primeiro canal, um segundo canal e um terceiro canal. Supondo que apenas o primeiro canal e o segundo canal estejam emparelhados de acordo com uma regra especificada, os dois dos múltiplos canais são o primeiro canal e o segundo canal, e um sinal downmixed de Enésimo quadro é obtido após downmixing ser realizado em sinais de áudio de Enésimo quadro no primeiro canal e um sinal de áudio de Enésimo quadro no segundo canal. Supondo que, nos três canais, o primeiro canal e o segundo canal estão emparelhados e o segundo canal e o terceiro canal estão emparelhados, os dois dos múltiplos canais podem ser o primeiro canal e o segundo canal, ou podem ser o segundo canal e o terceiro canal.
[00111] Como mostrado na figura 1, um método de processamento
Petição 870190037280, de 18/04/2019, pág. 39/131
36/85 de sinal de áudio multicanal na modalidade 1 da presente invenção inclui as seguintes etapas:
[00112] Etapa 100: Um codificador gera um conjunto de parâmetros estéreos de Enésimo quadro de acordo com os sinais de áudio de Enésimo quadro em dois dos múltiplos canais, onde o conjunto de parâmetros estéreos inclui parâmetros estéreos Z.
[00113] Especificamente, os parâmetros estéreos Z incluem um parâmetro que é usado quando o codificador mistura os sinais de áudio de Enésimo quadro com base em um primeiro algoritmo predeterminado, e Z é um número inteiro positivo maior que 0. Deve ser entendido que o primeiro algoritmo predeterminado é um algoritmo de geração de sinal downmixed predefinido no codificador.
[00114] Deve ser notado que os parâmetros estéreos estão incluídos no conjunto de parâmetros estéreos de Enésimo quadro usando o algoritmo de geração de parâmetros estéreos predefinido. Supondo que um dos dois canais é um canal esquerdo e o outro é um canal direito, o algoritmo de geração de parâmetros estéreos predefinido é como segue, e um parâmetro estéreo obtido de acordo com os sinais de áudio de Enésimo quadro é uma diferença de nível entre canais. (Diferença de nível entre canais, ILD):
PL(z) = Re L(z)2+ImL(z)2 z = l,2,K,—-2
PR(z) = ReR(z)2+ImR(z)2 z=l,2,K,—-2 bh(m)
EL(m)= PL(i) m = 0,l,L ,M -1 i=bl(m) bh(m)
ER(m) = PR(b m = 0,l,L ,M -1 i=bl(m) θ
ILD(m) = 10 -log(£L(m)) m = 0,lL,M-l
EP(m) [00115] Onde é um coeficiente de Transformação Distinta de
Petição 870190037280, de 18/04/2019, pág. 40/131
37/85
Fourier (Discrete Fourier Transform, DFT) de um sinal de áudio de Enésimo quadro no canal esquerdo em uma iésima caixa de frequência, R^ é um coeficiente DFT de um sinal de áudio de Enésimo quadro no canal direito na iésima caixa de frequência, ReLW é uma parte real de LÍJ\ ImLW é uma parte imaginária de LÍJ\ Re^W é uma parte real de R^ , é uma parte imaginária de R^ , PL^ é um espectro de energia do sinal de áudio de Enésimo quadro no canal esquerdo na iésimacaixa de frequência i, PR^ é um espectro de energia do sinal de áudio de Enésimo quadro no canal direito na iésima caixa de frequência, EL(m^ é energia de um sinal de áudio de Enésimo quadro em uma emésima sub-banda de frequência do canal esquerdo, é energia de um sinal de áudio de Enésimo quadro em uma emésima sub- banda de frequência do canal direito e uma quantidade total de sub-bandas de frequência para transmitir os sinais de áudio de Enésimo quadro é M.
[00116] No algoritmo de geração de parâmetros estéreos, um caso em que o sinal de áudio de Enésimo quadro é um componente direto ou um componente Nyquist, respectivamente, em caixas de frequência N 1 i =--1 ' = 0 ou 2 não é considerado.
[00117] Quando o algoritmo de geração de parâmetros estéreos predefinido inclui ainda um algoritmo para calcular outros parâmetros estéreos, como uma diferença de tempo entre canais (diferença de tempo entre canais, ITD), uma diferença de fase entre canais (diferença de fase entre canais, IPD) e coerência entre canais (coerência entre canais, IC), o codificador pode obter ainda os parâmetros estéreos, como o ITD, o IPD e o IC, de acordo com o sinal de áudio com base no algoritmo de geração de parâmetros estéreos predefinido.
[00118] Deve ser entendido que o conjunto de parâmetros estéreos
Petição 870190037280, de 18/04/2019, pág. 41/131
38/85 de Enésimo quadro inclui pelo menos um parâmetro estéreo. Por exemplo, o IPD, o ITD, o ILD e o IC são obtidos de acordo com os sinais de áudio de Enésimo quadro nos dois canais com base no algoritmo de geração de parâmetros estéreos predefinido, e o IPD, o ITD, o ILD e o IC formam o conjunto de parâmetros estéreos de Enésimo quadro.
[00119] Etapa 101: O codificador mistura os sinais de áudio de Enésimo quadro nos dois canais em um sinal down mixed de Enésimo quadro de acordo com pelo menos uma parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro com base em um primeiro algoritmo predeterminado, [00120] Por exemplo, o conjunto de parâmetros estéreos de Enésimo quadro inclui o ITD, o ILD, o IPD e o IC. O sinal down mixed de Enésimo quadro é obtido de acordo com o ILD e o IPD baseado no primeiro algoritmo predeterminado. Especificamente, o sinal downmixed de Enésimo quadro satisfaz a seguinte expressão em uma caixa de frequência k:
\L(k )|+|w)|
DMX (k) =J----y----- e 1+10 z down mixed de Enésimo representa uma amplitu[00121] Onde representa 0 sinal quadro na késima caixa de frequência, \L^\ de de um sinal de áudio de Enésimo quadro em um canal esquerdo em um k-ésimo par de canais na k-ésima caixa de frequência, representa uma amplitude de um sinal de áudio de Enésimo quadro em um canal direito em um k-ésimo par de canais na k-ésima caixa de frequência, representa um ângulo de fase de um sinal de áudio de Enésimo quadro no canal esquerdo na k-ésima caixa de frequência, representa um ILD dos sinais de áudio de Enésimo quadro na k-ésima caixa de frequência e IPD^ representa um IPD dos sinais de
Petição 870190037280, de 18/04/2019, pág. 42/131
39/85 áudio de Enésimo quadro na k-ésima caixa de frequência.
[00122] Deve ser notado que, além do algoritmo para obter o sinal downmixed, esta modalidade da presente invenção não impõe qualquer limitação a outro algoritmo para obter o sinal downmixed.
[00123] Na modalidade 1 da presente invenção, o conjunto de parâmetros estéreos de enésimo quadro é codificado, de modo que um decodificador pode restaurar o sinal downmixed de enésimo quadro. Opcionalmente, para melhorar a eficiência de compressão durante a codificação, o codificador codifica um parâmetro estéreo usado para obter o sinal downmixed de enésimo quadro no conjunto de parâmetros estéreos de enésimo quadro. Por exemplo, o conjunto de parâmetros estéreos Enésimo quadro gerado inclui o ITD, o ILD, o IPD e o IC. Se o codificador mixar os sinais de áudio de Enésimo quadro nos dois canais no sinal downmixedde Enésimo quadro de acordo com apenas o ILD e o IPD no conjunto de parâmetros estéreos de Enésimo quadro baseado no algoritmo predeterminado, para melhorar a eficiência de compressão, o codificador pode codificar apenas o ILD e o IPD no conjunto de parâmetros estéreos de Enésimo quadro.
[00124] Etapa 102: O codificador detecta se o sinal downmixed de enésimo quadro inclui um sinal de fala e se o sinal downmixedde enésimo quadro inclui o sinal de fala, executa a etapa 103, ou se o sinal downmixed de Enésimo quadro não inclui o sinal de fala, executa a etapa 104.
[00125] Para facilitar a detecção, pelo codificador, se o sinal downmixed de enésimo quadro inclui o sinal de fala, opcionalmente, o codificador detecta diretamente, por meio de detecção de atividade de voz (Voice Activity Detection, VAD), se o sinal downmixed de Enésimo quadro inclui o sinal de fala.
[00126] Opcionalmente, um método para detectar indiretamente, pelo codificador, se o sinal downmixed de enésimo quadro inclui o si
Petição 870190037280, de 18/04/2019, pág. 43/131
40/85 nal de fala é: O codificador detecta diretamente, por meio de VAD, se os sinais de áudio de enésimo quadro incluem o sinal de fala. Especificamente, se detectar que um sinal de áudio em um dos dois canais inclui o sinal de fala, o codificador determina que um sinal downmixed, obtido pela mistura de sinais de áudio nos dois canais, inclui o sinal de fala. Apenas quando se determina que nenhum dos sinais de áudio nos dois canais inclui o sinal de fala, o codificador determina que o sinal downmixed obtido pela mistura dos sinais de áudio nos dois canais inclui o sinal de fala. Deve ser notado que, de uma forma indireta de detecção, uma sequência entre a etapa 102 e a etapa 100 ou a etapa 101 não é limitada, desde que a etapa 100 preceda a etapa 101.
[00127] Etapa 103: O codificador codifica o sinal downmixed de enésimo quadro e realiza a etapa 107.
[00128] O codificador codifica o sinal downmixed de enésimo quadro para obter um fluxo de bits de enésimo quadro.
[00129] Como a codificação descontínua é realizada no sinal downmixed na modalidade 1 da presente invenção, um fluxo de bits inclui dois tipos de quadro: um quadro de primeiro tipo e um quadro de segundo tipo. O quadro do primeiro tipo inclui um sinal downmixed e o quadro do segundo tipo não inclui um sinal downmixed. O fluxo de bits do enésimo quadro obtido na etapa 103 é o quadro do primeiro tipo. [00130] Na etapa 103, porque o sinal downmixed de enésimo quadro inclui o sinal de fala, opcionalmente, o codificador codifica o sinal downmixed de enésimo quadro de acordo com uma taxa de codificação de quadro de voz pré-ajustada. De preferência, a taxa de codificação de quadro de voz predefinida pode ser definida para 13,2 kbps.
[00131] Além disso, opcionalmente, se codificando o sinal down-mix de enésimo quadro, o codificador codifica o conjunto de parâmetros estéreos de Enésimo quadro.
[00132] Etapa 104: O codificador determina se o sinal downmixed
Petição 870190037280, de 18/04/2019, pág. 44/131
41/85 de enésimo quadro satisfaz uma condição de codificação de quadro de áudio predefinida e se o sinal down mixed de enésimo quadro satisfaz a condição de codificação de quadro de áudio predefinida, executa a etapa 105 ou se o sinal downmixed de Enésimo quadro não satisfaz a condição de codificação do quadro de áudio predefinida, executa a etapa 106.
[00133] A condição de codificação de quadro de áudio predefinida é uma condição que é pré-configurada no codificador e que é usada para determinar se deve codificar o sinal downmixedde enésimo quadro. [00134] Deve ser notado que, para um sinal downmixed de primeiro quadro, se o sinal downmixed de primeiro quadro não incluir o sinal de fala, o sinal downmixed de primeiro quadro satisfaz a condição de codificação de quadro de áudio predefinida. Ou seja, o sinal downmixed de primeiro quadro é codificado, independentemente de o sinal downmixed de primeiro quadro incluir o sinal de fala.
[00135] Etapa 105: O codificador codifica o sinal downmixed de Enésimo quadro e executa a etapa 107.
[00136] Especificamente, o fluxo de bits de Enésimo quadro obtido na etapa 105 é também o quadro do primeiro tipo.
[00137] Deve ser notado que, opcionalmente, se codificando o sinal down-mix de enésimo quadro, o codificador codifica o conjunto de parâmetros estéreos de Enésimo quadro.
[00138] Opcionalmente, para facilitar a simplificação de uma implementação de codificação do sinal downmixed, na modalidade 1 da presente invenção, o sinal downmixedde Enésimo quadro é codificado de uma mesma maneira na etapa 103 e na etapa 105.
[00139] Opcionalmente, porque o sinal downmixed de Enésimo quadro na etapa 105 não inclui o sinal de fala, quando o sinal downmixed de Enésimo quadro satisfaz uma condição de codificação de quadro de voz pré-ajustada, o codificador codifica o sinal downmixed de
Petição 870190037280, de 18/04/2019, pág. 45/131
42/85
Enésimo quadro de acordo com a taxa de codificação do quadro de fala pré-definida. Alternativamente, quando o sinal downmixedde Enésimo quadro não satisfaz uma condição de codificação de quadro de fala pré-definida, mas satisfaz uma condição de codificação SID préajustada, o codificador codifica o sinal downmixed de enésimo quadro de acordo com uma taxa de codificação SID pré-definida. A taxa de codificação SID predefinida pode ser definida para 2,8 kbps.
[00140] Deve ser notado que quando o sinal downmixed de enésimo quadro não satisfaz a condição de codificação de quadro de voz pré-ajustada, mas satisfaz a condição de codificação SID pré-ajustada, o codificador codifica o sinal downmixedde enésimo quadro de acordo com uma maneira de codificação SID. A forma de codificação SID estipula que uma taxa de codificação é a taxa de codificação SID predefinida e estipula um algoritmo usado para a codificação e um parâmetro usado para a codificação.
[00141] A condição de codificação de quadro de fala predefinida pode ser: a duração entre o sinal downmixedde Enésimo quadro e um sinal downmixed de m-ésimo quadro não é maior que a duração predefinida. O sinal downmixedde m-ésimo quadro inclui o sinal de fala e o sinal downmixed de m-ésimo quadro é um quadro de sinal downmixed que inclui o sinal de fala e que está mais próximo do sinal downmixed de enésimo quadro. A condição de codificação SID predefinida pode estar codificando um quadro de números ímpares. Quando N do sinal downmixedde Enésimo quadro é um número ímpar, o codificador determina que o sinal downmixedde Enésimo quadro satisfaz a condição de codificação SID pré-definida.
[00142] Etapa 106: O codificador pula a codificação do sinal downmixed de Enésimo quadro e executa a etapa 109.
[00143] Especificamente, o fluxo de bits de Enésimo quadro obtido na etapa 106 é o segundo tipo de quadro.
Petição 870190037280, de 18/04/2019, pág. 46/131
43/85 [00144] O codificador determina que o sinal downmixedde Enésimo quadro não satisfaz a condição de codificação de quadro de áudio predefinida. Especificamente, o codificador determina que o sinal downmixedde Enésimo quadro não satisfaz a condição de codificação de quadro de fala predefinida e não satisfaz a condição de codificação SID predefinida.
[00145] Nesta modalidade da presente invenção, o codificador não codifica o sinal downmixed de enésimo quadro. Especificamente, o fluxo de bits de Enésimo quadro não inclui o sinal downmixed de Enésimo quadro.
[00146] Quando o codificador não codifica o sinal downmixed de Enésimo quadro, o codificador pode codificar o conjunto de parâmetros estéreos de Enésimo quadro ou pode não codificar o conjunto de parâmetros estéreos de Enésimo quadro.
[00147] Na modalidade 1 da presente invenção, é feita uma descrição usando um exemplo em que o codificador não codifica o sinal downmixed de enésimo quadro, mas codifica o conjunto de parâmetros estéreod de enésimo quadro. No entanto, opcionalmente, quando o codificador não codifica o sinal downmixed de enésimo quadro, o codificador também não pode codificar o conjunto de parâmetros estéreos de Enésimo quadro. Especificamente, quando o codificador não codifica nem o parâmetro estéreo de Enésimo quadro nem o sinal downmixedde Enésimo quadro, para obter o sinal downmixedde enésimo quadro e o parâmetro estéreo de Enésimo quadro definido pelo decodificador, consulte a modalidade 2 da presente invenção.
[00148] Etapa 107: O codificador envia um fluxo de bits de Enésimo quadro para um decodificador.
[00149] Para que o decodificador possa restaurar o sinal downmixed de enésimo quadro para os sinais de áudio Enésimo quadro nos dois canais depois de obter, por meio de decodificação, o sinal down
Petição 870190037280, de 18/04/2019, pág. 47/131
44/85 mixed de Enésimo quadro, o fluxo de bits de Enésimo quadro inclui ambos, Conjunto de parâmetros estéreos de Enésimo quadro e sinal down-mix de enésimo quadro.
[00150] Etapa 108: Se for determinado que o fluxo de bits de Enésimo quadro é urn quadro de primeiro tipo, o decodificador decodifica ο fluxo de bits de Enésimo quadro, para obter o sinal downmixed de Enésimo quadro e o conjunto de parâmetros estéreos de Enésimo quadro e realiza a etapa 111.
[00151] Deve ser notado que, como o quadro de primeiro tipo inclui um sinal downmixed e o segundo tipo de quadro não inclui um sinal downmixed, um tamanho do primeiro tipo de quadro é maior que um tamanho do segundo tipo de quadro. O decodificador pode determinar, de acordo com um tamanho do fluxo de bits do enésimo quadro, se o fluxo de bits do enésimo quadro é do primeiro tipo ou do segundo tipo. Além disso, opcionalmente, um bit de sinalizador pode ser ainda mais encapsulado no fluxo de bits de Enésimo quadro. O decodificador parcialmente decodifica o fluxo de bits de Enésimo quadro para obter o bit de sinalização e determina, de acordo com o bit de sinalizador, se o fluxo de bits de Enésimo quadro é do primeiro tipo ou do segundo. Por exemplo, quando o bit de sinalização é 1, indica que o fluxo de bits de Enésimo quadro é o quadro do primeiro tipo; quando o bit de sinalização é 0, indica que o fluxo de bits de Enésimo quadro é do segundo tipo de quadro.
[00152] Além disso, opcionalmente, o decodificador determina uma maneira de decodificação de acordo com uma taxa correspondente ao fluxo de bits de Enésimo quadro. Por exemplo, se a taxa do fluxo de bits do Enésimo quadro for 17,4 kbps, uma taxa de um fluxo de bits correspondente a um sinal downmixed é de 13,2 kbps, e uma taxa de fluxo de bits correspondente a um conjunto de parâmetros estéreos é de 4,2 kbps, o decodificador decodifica, de acordo com um modo de
Petição 870190037280, de 18/04/2019, pág. 48/131
45/85 decodificação correspondente a 13,2 kbps, o fluxo de bits correspondendo ao sinal downmixed e decodifica, de acordo com um modo de decodificação correspondendo a 4,2 kbps, o fluxo de bits correspondendo ao conjunto de parâmetros estéreos.
[00153] Alternativamente, o decodificador determina uma maneira de codificação do fluxo de bits de Enésimo quadro de acordo com um bit de sinalização de modo de codificação no fluxo de bits de Enésimo quadro e decodifica o fluxo de bits de Enésimo quadro de acordo com uma maneira de decodificação correspondente à maneira de codificação.
[00154] Etapa 109: O codificador envia um fluxo de bits de enésimo quadro para um decodificador, onde o fluxo de bits de Enésimo quadro inclui o conjunto de parâmetros estéreos de Enésimo quadro.
[00155] Etapa 110: Se determinar que o fluxo de bits de Enésimo quadro é um segundo tipo de quadro, o decodificador decodifica o fluxo de bits de Enésimo quadro, para obter o conjunto de parâmetros estéreos de Enésimo quadro, determina, de acordo com uma primeira regra pré-definida, sinais downmixed de Emésimo quadro em sinal downmixedde pelo menos um quadro que precede o sinal downmixed de Enésimo quadro, e obtém o sinal downmixed de Enésimo quadro de acordo com os sinais downmixed de Emésimo quadro baseado no primeiro algoritmo predeterminado, onde m é um número inteiro positivo maior do que 0.
[00156] Especificamente, um valor médio de um sinal downmixed de (N - 3) th-quadro, um sinal downmixed de (N - 2) th-quadro, e um sinal downmixed de (N - 1) th-quadro é usado como o sinal downmixed de enésimo quadro, ou um sinal downmixed de quadro (N-1) th-frame é usado diretamente como o sinal downmixed, ou o sinal downmixed de Enésimo quadro é estimado de acordo com outro algoritmo.
[00157] Além disso, o sinal downmixed (N-1) th- quadro pode ser
Petição 870190037280, de 18/04/2019, pág. 49/131
46/85 usado diretamente como o sinal downmixed de Enésimo quadro, ou o sinal downmixed de Enésimo quadro é calculado de acordo com o sinal downmixed de (N - 1)th- quadro e um valor de compensação predefinido com base em um algoritmo predefinido.
[00158] Etapa 111:0 decodificador restaura o sinal downmixed de Enésimo quadro para os sinais de áudio de Enésimo quadro nos dois canais de acordo com um parâmetro estéreo alvo no conjunto de parâmetros estéreos de Enésimo quadro, baseado em um segundo algoritmo predeterminado.
[00159] Deve ser entendido que o parâmetro estéreo alvo é pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro.
[00160] Especificamente, um processo de restauração, pelo decodificador, do sinal downmixed de Enésimo quadro para os sinais de áudio de enésimo quadro nos dois canais é um processo inverso de mixagem, pelo codificador, dos sinais de áudio de Enésimo quadro nos dois canais no sinal downmixed de Enésimo quadro. Supondo que o codificador obtém o sinal downmixed de Enésimo quadro de acordo com o IPD e o ILD no conjunto de parâmetros estéreos de Enésimo quadro, o decodificador restaura o sinal downmixed de Enésimo quadro para os sinais de Enésimo quadro nos canais do Kth par dos canais de acordo com o IPD e o ILD no conjunto de parâmetros estéreos de Enésimo quadro. Além disso, deve-se notar que um algoritmo que é pré-ajustado no decodificador e que é usado para restaurar um sinal downmixed pode ser um algoritmo inverso de um algoritmo de geração de sinal downmixed no codificador, ou pode ser um algoritmo independente de um algoritmo de geração de sinal downmixed no codificador.
[00161] Além disso, para melhorar a eficiência de compressão durante a codificação em um sistema de comunicações multicanais, ao implementar a codificação descontínua em um sinal downmixed, um
Petição 870190037280, de 18/04/2019, pág. 50/131
47/85 codificador pode implementar ainda a codificação descontínua em um conjunto de parâmetros estéreos. Um sinal downmixed de enésimo quadro é usado como um exemplo abaixo. Como mostrado na FIG. 2A, FIG. 2B e FIG. 2C, um método de processamento de sinal de áudio multicanais na modalidade 2 da presente invenção inclui as seguintes etapas.
[00162] Etapa 200: Um codificador gera um conjunto de parâmetros estéreos de Enésimo quadro de acordo com os sinais de áudio de enésimo quadro em dois de múltiplos canais, onde o conjunto de parâmetros estéreos inclui parâmetros estéreos Z.
[00163] Especificamente, os parâmetros estéreos Z incluem um parâmetro que é usado quando o codificador mistura os sinais de áudio de enésimo quadro com base em um primeiro algoritmo predeterminado, e Z é um número inteiro positivo maior que 0. Deve ser entendido que o primeiro algoritmo é um algoritmo de geração de sinal downmixed predefinido no codificador.
[00164] Deve ser notado que os parâmetros estéreos incluídos no conjunto de parâmetros estéreos de enésimo quadro são determinados utilizando um algoritmo de geração de parâmetros estéreos predefinido. Supondo que um dos dois canais é um canal esquerdo, e o outro é um canal direito, o algoritmo de geração de parâmetros estéreos predefinido é como segue, e um parâmetro estéreo obtido de acordo com os sinais de áudio de enésimo quadro é um ITD:
N-l-i j=0 , e
N-l-i cp& = Σ OMj + O
7=0 [00165] Onde n θ um comprimento de quadro, representa um quadro de sinal de domínio de tempo no canal esquerdo em um momento J representa um quadro de sinal de domínio de
Petição 870190037280, de 18/04/2019, pág. 51/131
48/85 tempo no canal direito em um momento e se max (cn(i))> max (c (i)) , .....
j0 iyd θ um numero oposto de urn valor de mdimax (cn(z)) r . r ce correspondente a ; caso contrario, O ITD e um numero max (c (z)) oposto de um valor de indice correspondente a [00166] Outro algoritmo para obtenção do ITD também é aplicável a esta modalidade da presente invenção.
[00167] Se o algoritmo de geração de parâmetro estéreo predefinido inclui ainda o seguinte algoritmo de geração de IPD, um IPD pode ser ainda obtido de acordo com o seguinte algoritmo. Especificamente, um IPD em uma biésima banda de frequência satisfaz a seguinte ex4-i pressão:ZPD(b) = arg( L(k)R*(k)),0<b<B onde £=4-i [00168] B é uma quantidade total de bandas de subfrequências ocupadas por um sinal de áudio em um domínio de frequência, L(k) é um sinal de um sinal de áudio de enésimo quadro no canal esquerdo em uma k=ésima caixa de frequências e R\k) é um sinal conjugado de sinais de áudio de enésimo quadro no canal direito na k-ésima caixa de frequências [00169] Além disso, quando o algoritmo de geração de parâmetro estéreo predefinido ainda inclui um algoritmo de geração de ILD na modalidade 1 da presente invenção, um ILD ainda pode ser obtido.
[00170] Etapa 201: O codificador mistura os sinais de áudio de enésimo quadro nos dois canais em um sinal downmixed de enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro baseado em um algoritmo predeterminado.
[00171] Especificamente, para o primeiro algoritmo predeterminado, referir-se ao método para obter um sinal downmixed de enésimo quadro na modalidade 1 da presente invenção. No entanto, o primeiro al
Petição 870190037280, de 18/04/2019, pág. 52/131
49/85 goritmo predeterminado não está limitado ao método para obtenção de um sinal downmixed de enésimo quadro na modalidade 1 da presente invenção.
[00172] Etapa 202: O codificador detecta se o sinal downmixed de enésimo quadro inclui um sinal de fala, e se o sinal downmixed de enésimo quadro inclui o sinal de fala, realiza a etapa 203, ou se o sinal downmixed de enésimo quadro não inclui o sinal de fala, executa a etapa 204.
[00173] Na modalidade 2 da presente invenção, para uma implementação específica de detecção, pelo codificador, se o sinal sinal downmixedde enésimo quadro inclui o sinal de fala, refira-se à maneira de detectar, pelo codificador, se sinal downmixed de enésimo quadro inclui o sinal de fala na modalidade 1 da presente invenção.
[00174] Etapa 203: O codificador codifica o sinal downmixed de enésimo quadro de acordo com uma taxa de codificação de quadro de fala predefinida, codifica o conjunto de parâmetros estéreos de enésimo quadro e executa a etapa 211.
[00175] Especificamente, quando o codificador inclui duas maneiras de codificar um conjunto de parâmetros estéreos: uma primeira maneira de codificação e uma segunda maneira de codificação, uma taxa de codificação estipulada na primeira maneira de codificação não é menor do que uma taxa de codificação estipulada na segunda maneira de codificação; e / ou, para qualquer parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro, a precisão de quantização estipulada na primeira maneira de codificação não é inferior à precisão de quantização estipulada na segunda maneira de codificação. Na etapa 203, o codificador codifica o conjunto de parâmetros estéreos de enésimo quadro de acordo com a primeira maneira de codificação.
[00176] Por exemplo, o conjunto de parâmetros estéreos de enésimo quadro inclui um IPD e um ITD. A precisão de quantização IPD es
Petição 870190037280, de 18/04/2019, pág. 53/131
50/85 tipulada na primeira maneira de codificação não é inferior à precisão de quantização IPD estipulada na segunda maneira de codificação, e a precisão de quantização ITD estipulada na primeira maneira de codificação não é inferior à precisão de quantização ITD estipulada na segunda maneira de codificação.
[00177] De preferência, a taxa de codificação do quadro de fala pode ser ajustada para 13,2 kbps.
[00178] Etapa 204: O codificador determina se o sinal downmixed de enésimo quadro satisfaz uma condição de codificação de quadro de fala predefinida e se o sinal downmixed de enésimo quadro satisfaz a condição de codificação de quadro de fala predefinida, executa a etapa 205 ou se o sinal downmixed de enésimo quadro não satisfaz a condição de codificação do quadro de fala predefinida, executa a etapa 206.
[00179] Etapa 205: O codificador codifica o sinal downmixed de enésimo quadro de acordo com uma taxa de codificação de quadro de fala predefinida, codifica o conjunto de parâmetros estéreos de enésimo quadro e executa a etapa 211.
[00180] Especificamente, quando o codificador inclui duas maneiras de codificar um conjunto de parâmetros estéreos: uma primeira maneira de codificação e uma segunda maneira de codificação, uma taxa de codificação estipulada na primeira maneira de codificação não é menor do que uma taxa de codificação estipulada na segunda maneira de codificação ; e / ou, para qualquer parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro, a precisão de quantização estipulada na primeira maneira de codificação não é inferior à precisão de quantização estipulada na segunda maneira de codificação. Na etapa 205, o codificador codifica o conjunto de parâmetros estéreos de enésimo quadro de acordo com a primeira maneira de codificação.
[00181] Etapa 206: O codificador determina se o sinal downmixed
Petição 870190037280, de 18/04/2019, pág. 54/131
51/85 de enésimo quadro satisfaz uma condição de codificação SI D predefinida e determina se o conjunto de parâmetros estéreos de enésimo quadro satisfaz uma condição de codificação de parâmetro estéreo predefinida e se o sinal downmixedde enésimo quadro satisfaz a condição de codificação SID predefinida e o conjunto de parâmetros estéreos de enésimo quadro satisfaz a condição de codificação de parâmetros estéreos predefinida, realiza a etapa 207 ou se o sinal downmixed de enésimo quadro satisfaz a condição de codificação SID predefinida, mas o conjunto de parâmetros estéreos de enésimo quadro não satisfazer a condição de codificação de parâmetros estéreos predefinida, executar a etapa 208 ou se o sinal downmixedde enésimo quadro não satisfaz a condição de codificação SID predefinida, mas o conjunto de parâmetros estéreos de enésimo quadro satisfaz a condição de codificação de parâmetros estéreos predefinida, executa a etapa 209 ou se o sinal downmixed de enésimo quadro não satisfaz a condição de codificação SID predefinida e o conjunto de parâmetros estéreos de enésimo quadro não satisfaz a condição de codificação de parâmetros estéreos, realiza a etapa 210.
[00182] Especificamente, antes de codificar o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro, o codificador determina se um parâmetro estéreo no pelo menos um parâmetro estéreo satisfaz uma condição de codificação de parâmetro estéreo correspondente predefinida. Especificamente, se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro inclui uma ILD de diferença de nível entre canais, a condição de codificação de parâmetro estéreo predefinida inclui dl>d0 onde dl representa um grau pelo qual a ILD se desvia de um primeiro padrão, o primeiro padrão é determinado com base em um terceiro algoritmo predeterminado de acordo com os conjuntos de parâmetros estéreos de quadro-T que precede o conjunto de parâmetros
Petição 870190037280, de 18/04/2019, pág. 55/131
52/85 estéreos de enésimo quadro e T é um número inteiro positivo maior que 0.
[00183] Se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro inclui um ITD de diferença de tempo intercanais, a condição de codificação de parâmetro estéreo predefinida inclui /]>//, onde dtrepresenta um grau pelo qual o ITD se desvia de um segundo padrão, o segundo padrão é determinado com base em um quarto algoritmo predefinido de acordo com conjuntos de parâmetros estéreos de quadro T, precedendo o conjunto de parâmetros estéreos de enésimo quadro e T é um número inteiro positivo maior do que 0.
[00184] Se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro inclui um IPD de diferença de fase intercanais, a condição de codificação de parâmetros estéreos predefinida inclui dp>d2 onde dp representa um grau pelo qual IPD se desvia de um terceiro padrão, o terceiro padrão é determinado com base em um quinto algoritmo , de acordo com conjunto de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de enésimo quadro e T é um número inteiro positivo maior do que 0.
[00185] O terceiro algoritmo, o quarto algoritmo e o quinto algoritmo precisam ser predefinidos de acordo com a situação real.
[00186] Especificamente, quando o pelo menos um parâmetro estéreo de enésimo quadro inclui apenas ITD, a condição de codificação de parâmetro estéreo predefinida inclui apenas 1)T>1), e quando ITD incluído no pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro satisfaz dt>1)}, o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro é codificado. Quando o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro inclui apenas ITD e IPD, a condição de codificação de parâmetro estéreo predefinido in
Petição 870190037280, de 18/04/2019, pág. 56/131
53/85 clui apenas DT >De quando o ITD incluído no pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro satisfaz dt>d,, o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro é codificado. Contudo, quando o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro inclui apenas ITD e ILD, a condição de codificação de parâmetro estéreo predefinido inclui dt>d1 e DL>Doe o codificador codifica ITD e ILD apenas quando o ITD incluído no pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro satisfaz DT > D} e ILD satisfaz dl > Do.
[00187] Opcionalmente, dl, dt e Dp, respectivamente, satisfazem as seguintes expressões:
M—li T
Dl = ^(ILD(m)-—^ILDl~t](m)) m=Q* t=l T
DT= ITD--ITD[~t} (m)
T f=
M-li T
Dp Y (IPD(m)--YlPD^(m)) m=Q* t=l [00188] Onde !LD(m) é uma diferença de nível gerada quando os sinais de áudio de enésimo quadro são transmitidos, respectivamente nos dois canais em uma emésima banda de subfrequências, M é uma quantidade total de bandas de subfrequências ocupadas para a transmissão dos sinais de áudio de enésimo quadro, — ^iLD[~t}(m) é um
T f=i valor médio de ILDs nos conjuntos de parâmetros estéreos de quadro T, precedendo o conjunto de parâmetros estéreos de enésimo quadro na emésima banda de subfrequências, T é um número inteiro positivo maior do que 0, οΗΙ(Χ)έ uma diferença de nível gerada quando os sinais de áudio do quadro T, precedendo os sinais de áudio de enésimo quadro são transmitidos, respectivamente, nos dois canais, na mPetição 870190037280, de 18/04/2019, pág. 57/131
54/85 ésima banda de subfrequências, ITD é uma diferença de tempo gerada quando os sinais de áudio de enésimo quadro são transmitidos, respectivamente, nos dois canais, —é um valor médio de
T f=i
ITDs nos conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de enésimo quadro, ITld~t] é uma diferença de tempo gerada quando os sinais de áudio de t-ésimo quadro, precedendo os sinais de áudio de enésimo quadro são transmitidos, respectivamente, nos dois canais, lPD(m) é uma diferença de fase gerada quando alguns dos sinais de áudio de enésimo quadro são transmitidos, respectivamente, nos dois canais na emésima banda de subfrequências, —^ZPD[f](m) é um valor médio de IPDs nos conjunT f=i tos de parâmetros estéreos de quadro T, precedendo o conjunto de parâmetros estéreos de enésimo quadro na emésima banda de subfrequências e iPD[~‘Xm) é uma diferença de fase gerada quando sinais de áudio de quadro T são transmitidos, respectivamente, nos dois canais na emésima banda de subfrequências [00189] Etapa 207: O codificador codifica o sinal downmixed de enésimo quadro de acordo com uma taxa de codificação SI D predefinida, codifica o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro e executa a etapa 211.
[00190] Especificamente, quando o codificador inclui duas maneiras de codificar um conjunto de parâmetros estéreo: uma primeira maneira de codificação e uma segunda maneira de codificação, uma taxa de codificação estipulada na primeira maneira de codificação não é menor que uma taxa de codificação estipulada na segunda maneira de codificação; e / ou, para qualquer parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro, a precisão de quantização estipulada na primeira maneira de codificação não é inferior à precisão de
Petição 870190037280, de 18/04/2019, pág. 58/131
55/85 quantização estipulada na segunda maneira de codificação. O codificador codifica o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro, de acordo com a segunda maneira de codificação.
[00191] Por exemplo, na primeira maneira de codificação, o codificador codifica o conjunto de parâmetros estéreos de enésimo quadro de acordo com 4,2 kbps e, na segunda forma de codificação, o codificador codifica o conjunto de parâmetros estéreos de enésimo quadro de acordo com 1,2 kbps.
[00192] Para melhorar a eficiência de compressão do parâmetro estéreo definido pelo codificador, opcionalmente, o codificador obtém parâmetros estéreos alvo X de acordo com os parâmetros estéreos Z no conjunto de parâmetros estéreos de enésimo quadro baseado em uma regra de redução de dimensão de parâmetro estéreo predefinida e codifica os parâmetros estéreo de alvo X. X é um número inteiro positivo maior que 0 e menor ou igual a Z.
[00193] Especificamente, o conjunto de parâmetros estéreos de enésimo quadro inclui três tipos de parâmetros estéreos: um IPD, um ITD e um ILD. O ILD inclui ILDs em 10 bandas de subfrequência: um ILD (0),... e um ILD (9), o IPD inclui IPDs em 10 bandas de subfrequência: um IPD (0),... e um IPD (9), e o ITD inclui ITDs em duas subbandas de domínio do tempo: um ITD (0) e um ITD (1). Assumindo que a regra de redução de dimensão de parâmetro estéreo predefinida é que o conjunto de parâmetros estéreos inclui apenas dois tipos de parâmetros estéreos o codificador seleciona quaisquer dois tipos de parâmetros estéreos do IPD, do ITD e do ILD. Assumindo que o IPD e o ILD são selecionados, o codificador codifica o IPD e o ILD. Alternativamente, se a regra de redução de dimensão de parâmetro estéreo predefinida é que apenas metade de cada tipo de parâmetros estéreos é reservada, cinco DPIs são selecionados a partir do ILD (0),... e do
Petição 870190037280, de 18/04/2019, pág. 59/131
56/85
ILD (9), cinco IPDs são selecionados do IPD (0),..., e o IPD (9), um ITD é selecionado do ITD (0) e do ITD (1), e os parâmetros selecionados são codificados. Alternativamente, a regra de redução de dimensão de parâmetro estéreo predefinida é que cinco ILDs e cinco IPDs sejam selecionados. Alternativamente, se a regra de redução de dimensão de parâmetros estéreo predefinida é aquela resolução de domínio de frequência dos ILDs, resolução de domínio de frequência dos IPDs e resolução de domínio de tempo dos ITDs são reduzidas, ILDs em bandas de subfrequência vizinhas no ILD (0 ),... E o ILD (9) são combinados. Por exemplo, um valor médio de ILD (0) e ILD (1) é calculado para obter um novo ILD (0), um valor médio do ILD (2) e o ILD (3) é calculado para obter um novo ILD (1),..., e um valor médio da ILD (8) e da ILD (9) são calculados para obter uma nova DPI (4). Uma banda de subfrequência correspondente ao novo ILD (0) é igual às bandas de subfrequências correspondentes ao ILD original (0) e ao ILD original (1),..., e uma banda de subfrequências correspondente ao novo ILD (4) é igual a bandas de subfrequências correspondentes ao ILD original (8) e ao ILD original (9). De acordo com o mesmo método, IPDs em bandas de subfrequências vizinhas no IPD (0),..., e o IPD (9) são combinados, para obter um novo IPD (0),..., e um novo IPD (4); e um valor médio do ITD (0) e do ITD (1) também é calculado e combinado para obter um novo ITD (0). Um sinal no domínio do tempo correspondente ao novo ITD (0) é o mesmo que os sinais no domínio do tempo correspondentes ao ITD original (0) e ao ITD original (1). O novo ILD (0),... e o novo ILD (4), o novo IPD (0),... e o novo IPD (4) e o novo ITD (0) são codificados. Alternativamente, se a regra de redução de dimensão de parâmetro estéreo predefinida é que a resolução de domínio de frequência dos ILDs é reduzida, os ILDs nas bandas de sub-frequência vizinhas no ILD (0),... e o ILD (9) são combinados. Por exemplo, um valor médio de ILD (0) e ILD (1) é calculado para obter
Petição 870190037280, de 18/04/2019, pág. 60/131
57/85 um novo ILD (0), um valor médio do ILD (2) e o ILD (3) é calculado para obter um novo ILD (1),..., e um valor médio da ILD (8) e da ILD (9) são calculados para obter uma nova DPI (4). Uma banda de subfrequências correspondente ao novo ILD (0) é igual às bandas de subfrequências correspondentes ao ILD original (0) e ao ILD original (1),..., e uma banda de subfrequências correspondente ao novo ILD (4) é igual a bandas de subfrequências correspondentes ao ILD original (8) e ao ILD original (9). Então, o novo ILD (0),... e o novo ILD (4) são codificados.
[00194] Etapa 208: O codificador codifica o sinal downmixed de enésimo quadro de acordo com uma taxa de codificação SI D predefinida, mas ignora a codificação de pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro e executa a etapa 211.
[00195] Etapa 209: O codificador codifica o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro, mas ignora a codificação do sinal downmixed de enésimo quadro e executa a etapa 215.
[00196] Etapa 210: O codificador não codifica nem o sinal downmixed de enésimo quadro nem o conjunto de parâmetros estéreos de enésimo quadro, e realiza a etapa 217.
[00197] Na modalidade 2 da presente invenção, o codificador executa a codificação para obter um fluxo de bits. O fluxo de bits inclui quatro tipos diferentes de quadros, isto é, um quadro de terceiro tipo, um quadro de quarto tipo, um quadro de quinto tipo e um quadro de sexto tipo. O quadro do terceiro tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed; o quadro do quarto tipo não inclui um sinal downmixed nem um conjunto de parâmetros estéreos, o quadro do quinto tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos e o quadro do sexto tipo inclui um sinal
Petição 870190037280, de 18/04/2019, pág. 61/131
58/85 downmixed, mas não inclui um conjunto de parâmetros estéreos. Cada um dos quadros do quinto tipo e do sexto tipo é um caso de um quadro tipo incluindo um sinal downmixed, e cada um dos quadros do terceiro tipo e do quarto tipo é um caso de um quadro de tipo não incluindo sinal downmixed algum.
[00198] Especificamente, um fluxo de bits de enésimo quadro obtido na etapa 203, na etapa 205 ou na etapa 207 é o quadro de tipo quinto, um fluxo de bits de enésimo quadro obtido na etapa 208 é o quadro de tipo sexto, um fluxo de bits de enésimo quadro obtido na etapa 209 é um quadro do terceiro tipo e um fluxo de bits de enésimo quadro obtido na etapa 211 é um quadro de quarto tipo.
[00199] Etapa 211: O codificador envia um fluxo de bits de enésimo quadro para um decodificador, onde o fluxo de bits de enésimo quadro inclui o sinal downmixed de enésimo quadro e o conjunto de parâmetros estéreos de enésimo quadro.
[00200] Etapa 212: O decodificador recebe o fluxo de bits de enésimo quadro, decodifica o fluxo de bits dade enésimo quadro e, se determinar que o fluxo de bits de enésimo quadro é um quadro do quinto tipo, obtém o sinal downmixed de enésimo quadro e o conjunto de parâmetros estéreos de enésimo quadro e executa a etapa 218.
[00201] Para uma implementação específica de determinação, pelo decodificador, de qual tipo de quadro é o fluxo de bits de enésimo quadro, consulte a modalidade 1 da presente invenção.
[00202] Especificamente, o decodificador decodifica o fluxo de bits de enésimo quadro de acordo com uma taxa correspondente ao fluxo de bits de enésimo quadro. Especificamente, se o codificador codifica o sinal downmixedde enésimo quadro de acordo com 13,2 kbps, o decodificador decodifica um fluxo de bits do sinal downmixedde enésimo quadro no fluxo de bits de enésimo quadro de acordo com 13,2 kbps. Se o codificador codifica o conjunto de parâmetros estéreos de enési
Petição 870190037280, de 18/04/2019, pág. 62/131
59/85 mo quadro de acordo com 4,2 kbps, o decodificador decodifica um fluxo de bits do parâmetro estéreo de enésimo quadro definido no fluxo de bits de enésimo quadro de acordo com 4,2 kbps.
[00203] Etapa 213: O codificador envia um fluxo de bits de enésimo quadro para um decodificador, onde o fluxo de bits de enésimo quadro inclui o sinal downmixedde enésimo quadro.
[00204] Etapa 214: O decodificador decodifica o fluxo de bits de enésimo quadro, se determinar que o fluxo de bits de enésimo quadro é um quadro do sexto tipo, para obter o sinal downmixed de enésimo quadro, determina, de acordo com uma segunda regra pré-definida conjunto de parâmetros estéreos de quadro K em, pelo menos, um conjunto de parâmetros estéreos de quadro único precedendo o conjunto de parâmetros estéreos de enésimo quadro, obtém o conjunto de parâmetros estéreos de enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um sexto algoritmo predeterminado e realiza a etapa 218.
[00205] Especificamente, usando um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro como exemplo, um conjunto de parâmetros estéreo estipulado na segunda regra predefinida é um quadro de conjunto de parâmetros estéreos mais próximo de P e que é obtido por meio de decodificação e um parâmetro estéreo de enésimo quadro P é obtido de acordo com o seguinte algoritmo: ρ = ί^+δ [00206] Onde P representa o parâmetro estéreo de enésimo quadro, representa um quadro de parâmetro estéreo que está mais próximo de Pe que é obtido por meio de decodificação e δ representa um número aleatório cujo valor absoluto é relativamente pequeno. Por exemplo, δ pode ser um número aleatório entre v-^x5% e +^1]x5%.
[00207] Deve ser notado que esta modalidade da presente inven
Petição 870190037280, de 18/04/2019, pág. 63/131
60/85 ção não impõe limitação alguma ao método para estimar os parâmetros estéreos no conjunto de parâmetros estéreos de enésimo quadro. [00208] Etapa 215: O codificador envia um fluxo de bits de enésimo quadro para um decodificador, onde o fluxo de bits de enésimo quadro inclui o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro.
[00209] Etapa 216: O decodificador decodifica o fluxo de bits de enésimo quadro, se determinar que o fluxo de bits de enésimo quadro é um quadro do terceiro tipo, para obter o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro, determina, de acordo uma primeira regra predefinida, sinais downmixed de quadro m no pelo menos um sinal downmixedde quadro um precedendo o sinal downmixed de enésimo quadro, obtém o sinal downmixed de enésimo quadro de acordo com os sinais dm de quadro m com base em um segundo algoritmo predeterminado, onde m é um número inteiro positivo maior do que 0 e realiza a etapa 218.
[00210] Especificamente, um valor médio de sinal downmixed de (N-3)ésimo- quadro, um sinal downmixed de (N-2)ésimo- quadro e um sinal downmixed de (N-1)ésimo- quadro é usado diretamente como o sinal downmixed de enésimo quadro ou sinal downmixed de enésimo quadro é estimado de acordo com outro algoritmo.
[00211] Além disso, o sinal downmixed de (N-1 )ésimo- quadro pode ser usado diretamente como o sinal downmixedde enésimo quadro ou o sinal downmixed de enésimo quadro é calculado de acordo com o sinal downmixed de (N-1 )ésimo- quadro e um valor de desvio predefinido com base em um algoritmo predefinido.
[00212] Etapa 217: Depois de receber um fluxo de bits de enésimo quadro, um decodificador determina que o fluxo de bits de enésimo quadro é um quadro de quarto tipo, determina, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de qua
Petição 870190037280, de 18/04/2019, pág. 64/131
61/85 dro k em pelo menos um conjunto de parâmetros estéreos precedendo o conjunto de parâmetros estéreos de enésimo quadro e obtém o conjunto de parâmetros estéreos de enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um sexto algoritmo predeterminado; e [00213] determina, de acordo com uma primeira regra predefinida, sinais downmixed de quadro m em pelo menos um sinal downmixed de quadro um precedendo o sinal down-mix de enésimo quadro e obtém o sinal downmixed de enésimo quadro de acordo com os sinais downmixed de quadro m com base em um segundo algoritmo predeterminado, onde m é um número inteiro positivo maior do que 0.
[00214] Etapa 218: O decodificador restaura o sinal downmixed de enésimo quadro para os sinais de áudio de enésimo quadro nos dois canais de acordo com um parâmetro estéreo alvo no conjunto de parâmetros estéreos de enésimo quadro com base em um sétimo algoritmo predeterminado.
[00215] Além disso, com base nesta modalidade da presente invenção, se o codificador detectar, usando os sinais de áudio de enésimo quadro nos dois canais, que o sinal downmixed de enésimo quadro inclui o sinal de fala, outra maneira de codificar um conjunto de parâmetros estéreos é fornecida adicionalmente. Especificamente, se for detectado que qualquer um dos sinais de áudio de enésimo quadro nos dois canais inclui o sinal de fala, o codificador obtém o parâmetro estéreo de enésimo quadro definido de acordo com os sinais de áudio de enésimo quadro com base em uma primeira forma de geração de conjunto de parâmetros estéreos e codifica o conjunto de parâmetros estéreos de enésimo quadro.
[00216] Quando o codificador determina que nenhum dos sinais de áudio de enésimo quadro nos dois canais inclui o sinal de fala: se os sinais de áudio de enésimo quadro satisfazem uma condição de codifi
Petição 870190037280, de 18/04/2019, pág. 65/131
62/85 cação de quadro de fala predefinida, o codificador obtém o conjunto de parâmetros estéreos de enésimo quadro de acordo com os sinais de áudio de enésimo quadro com base em um primeiro modo de geração de conjunto de parâmetros estéreos, e codifica o conjunto de parâmetros estéreos de enésimo quadro ou se os sinais de áudio de enésimo quadro não satisfazem uma condição de codificação de quadro de fala predefinida, o codificador obtém o conjunto de parâmetros estéreos de enésimo quadro definido de acordo com os sinais de áudio de enésimo quadro com base em uma segunda forma de geração de conjunto de parâmetros estéreos, e [00217] codifica pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro ao determinar que o conjunto de parâmetros estéreos de enésimo quadro satisfaz uma condição de codificação de parâmetro estéreo predefinida; ou ignora a codificação do conjunto de parâmetros estéreos ao determinar que o conjunto de parâmetros estéreos de enésimo quadro não satisfaz uma condição de codificação de parâmetros estéreos predefinida.
[00218] O primeiro modo de geração de conjunto de parâmetros estéreos e o segundo modo de geração de conjunto de parâmetros estéreos satisfazem pelo menos uma das seguintes condições: [00219] Uma quantidade que é de tipos de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreos não é menor que uma quantidade que é dos tipos de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na segunda forma de geração de conjunto de parâmetros estéreos uma quantidade que é de parâmetros estéreos incluídos em um conjunto de parâmetros estéreo e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreos não é menor que uma quantidade que é de parâmetros estéreos incluídos um conjunto de
Petição 870190037280, de 18/04/2019, pág. 66/131
63/85 parâmetros estéreos e que é estipulado na segunda maneira de geração de conjunto de parâmetros estéreos, a resolução no domínio do tempo que é de um parâmetro estéreo e estipulada na primeira forma de geração do conjunto de parâmetros estéreos não é inferior à resolução no domínio do tempo que é de um parâmetro estéreo correspondente e que é estipulado na segunda forma de geração de conjunto de parâmetros estéreos, ou resolução de domínio de frequência que é de um parâmetro estéreo e que é estipulado na primeira forma de geração do conjunto de parâmetros estéreos não é inferior à resolução do domínio da frequência que é de um parâmetro estéreo correspondente e que é estipulado na segunda forma de geração do conjunto de parâmetros estéreos.
[00220] Especificamente, a precisão no domínio da frequência ou a precisão no domínio do tempo de um conjunto de parâmetros estéreos obtido na primeira forma de geração de conjunto estéreo é maior do que a de um conjunto de parâmetros estéreos obtido na segunda geração de conjunto estéreo.
[00221] Além disso, em um método de processamento de sinal de áudio multicanal na modalidade 3 da presente invenção, ao detectar que um sinal downmixed de enésimo quadro inclui um sinal de fala, um codificador codifica o sinal downmixed de enésimo quadro de acordo com uma taxa de codificação de voz. e codifica um conjunto de parâmetros estéreos de enésimo quadro; ou quando um codificador detecta que um sinal downmixed de enésimo quadro não inclui um sinal de fala: se o sinal downmixed de enésimo quadro satisfaz uma condição de codificação de quadro de fala predefinida, o codificador codifica o sinal downmixed de enésimo quadro de acordo com uma taxa de codificação de fala, e codifica um conjunto de parâmetros estéreos de enésimo quadro ou se o sinal downmixed de enésimo quadro não satisfaz uma condição de codificação predefinida, mas satisfaz
Petição 870190037280, de 18/04/2019, pág. 67/131
64/85 uma condição de codificação SI D predefinida, o codificador codifica o sinal downmixedde enésimo quadro de acordo com uma taxa de codificação SID e codifica pelo menos um parâmetro estéreo em um conjunto de parâmetros estéreos de enésimo quadro ou se o sinal downmixed de enésimo quadro não satisfizer nem uma condição de codificação de quadro de fala predefinida nem uma condição de codificação SID predefinida, o codificador não codifica sinal downmixed de enésimo quadro nem um conjunto de parâmetros estéreos de enésimo quadro.
[00222] Deve ser compreendido que uma diferença entre a modalidade 3 da presente invenção e a modalidade 1 da presente invenção ou entre a modalidade 3 da presente invenção e a modalidade 2 da presente invenção reside em: O codificador não realiza a determinação em um conjunto de parâmetros estéreos e codifica o conjunto de parâmetros estéreos independente de qual maneira é usada para codificar um sinal downmixed.
[00223] Na modalidade 3 da presente invenção, um fluxo de bits obtido após o codificador codificar o sinal downmixed inclui dois tipos de quadros: um quadro do primeiro tipo e um quadro de segundo tipo. O quadro do primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos e o quadro de segundo tipo não inclui nem um sinal downmixed, nem um conjunto de parâmetros estéreos. Especificamente, para um método para restaurar o fluxo de bits para sinais de áudio em dois canais por um decodificador após o recebimento do fluxo de bits, refira-se à modalidade 2 da presente invenção e à modalidade 1 da presente invenção.
[00224] Com base na modalidade 3 da presente invenção, opcionalmente, quando o sinal downmixed de enésimo quadro não satisfaz nem a condição de codificação de quadro de fala predefinida, nem a condição de codificação de SID predefinida, o codificador determina se
Petição 870190037280, de 18/04/2019, pág. 68/131
65/85 o conjunto de parâmetros estéreos de enésimo quadro satisfaz uma condição de codificação de parâmetros estéreos predefinida e, se o conjunto de parâmetros estéreos de enésimo quadro satisfaz a condição de codificação de parâmetros estéreos predefinida, o codificador não codifica o sinal downmixed de enésimo quadro, mas codifica pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro, ou, se o conjunto de parâmetros estéreos de enésimo quadro não satisfaz a condição de codificação de parâmetro estéreo predefinido, o codificador não codifica nem o sinal downmixed de enésimo quadro nem o conjunto de parâmetros estéreos de enésimo quadro.
[00225] Um fluxo de bits obtido com base no método de codificação precedente inclui três tipos de quadros: um quadro do primeiro tipo, um quadro do terceiro tipo e um quadro de quarto tipo. O quadro do primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, o quadro de terceiro tipo não inclui sinal downmixed, mas inclui um conjunto de parâmetros estéreos e o quadro de quarto tipo não inclui nem um sinal downmixed, nem um conjunto de parâmetros estéreos. Especificamente, para um método para restaurar o fluxo de bits para sinais de áudio em dois canais por um decodificador após o recebimento do fluxo de bits, refira-se à modalidade 2 da presente invenção e à modalidade 1 da presente invenção.
[00226] Uma diferença entre a solução técnica precedente e a modalidade 2 da presente invenção reside em: Quando o sinal downmixed de enésimo quadro não satisfaz nem a condição de codificação de quadro de fala predefinida, nem a condição de codificação de SI D predefinida, o codificador determina se o conjunto de parâmetros estéreos de enésimo quadro satisfaz a condição de codificação de parâmetros estéreos predefinida.
[00227] Opcionalmente, em um método de processamento de sinal
Petição 870190037280, de 18/04/2019, pág. 69/131
66/85 de áudio multicanais na modalidade 4 da presente invenção, quando detectando que um sinal downmixed de enésimo quadro inclui um sinal de fala, um codificador codifica o sinal downmixed de enésimo quadro de acordo com uma taxa de codificação de fala e codifica um conjunto de parâmetros estéreos de enésimo quadro; ou, quando um codificador detecta que um sinal downmixed de enésimo quadro não inclui um sinal de fala; se o sinal downmixed de enésimo quadro satisfaz uma condição de codificação de quadro de fala predefinida, o codificador codifica o sinal downmixed de enésimo quadro de acordo com uma taxa de codificação de fala e codifica um conjunto de parâmetros estéreos de enésimo quadro ou se o sinal downmixed de enésimo quadro não satisfaz uma condição de codificação de quadro de fala predefinida, mas satisfaz uma condição de codificação de SID predefinida, o codificador determina se um conjunto de parâmetros estéreos de enésimo quadro satisfaz uma condição de codificação de parâmetros estéreos predefinidos e, quando o conjunto de parâmetros estéreos de enésimo quadro satisfaz a condição de codificação de conjunto de parâmetros estéreos predefinida, o codificador codifica o sinal downmixed de enésimo quadro de acordo com uma taxa de codificação de SID e codifica pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro ou, quando o conjunto de parâmetros estéreos de enésimo quadro não satisfaz uma condição de codificação de conjunto de parâmetros estéreos predefinida, o codificador codifica o sinal downmixed de enésimo quadro de acordo com uma taxa de codificação SID, mas não codifica o conjunto de parâmetros estéreos de enésimo quadro; ou, se o sinal downmixed de enésimo quadro não satisfaz nem uma condição de codificação de quadro de fala predefinida, nem uma condição de codificação de SID predefinida, o codificador não codifica nem um sinal downmixed de enésimo quadro, nem um conjunto de parâmetros estéreos de enésimo quadro.
Petição 870190037280, de 18/04/2019, pág. 70/131
67/85 [00228] Um fluxo de bits obtido com base em um modo de codificação na modalidade 4 da presente invenção inclui três tipos de quadros: um quadro do quinto tipo, um quadro do sexto tipo e um quadro do segundo tipo . O quadro do quinto tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos: o quadro do sexto tipo inclui um sinal downmixed, mas não inclui um conjunto de parâmetros estéreos e o quadro do segundo tipo não inclui nem um sinal downmixed, nem um conjunto de parâmetros estéreos. Especificamente, para um método para restauração do fluxo de bits para sinais de áudio em dois canais por um decodificador após o recebimento do fluxo de bits, refira-se à modalidade 2 da presente invenção e à modalidade 1 da presente invenção.
[00229] Uma diferença entre a modalidade 4 da presente invenção e a modalidade 2 da presente invenção reside em: Quando o sinal downmixed de enésimo quadro não satisfaz a condição de codificação de quadro de fala predefinida, mas satisfaz a condição de codificação de SID predefinida, o codificador determina se codifica o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro e, quando o sinal downmixed de enésimo quadro não satisfaz nem a condição de codificação de quadro de fala predefinida, nem a condição de codificação de SID predefinida, salta a codificação do conjunto de parâmetros estéreos de enésimo quadro.
[00230] Na modalidade 3 da presente invenção e na modalidade 4 da presente invenção, especificamente, para uma maneira de obtenção do sinal downmixed de enésimo quadro e do conjunto de parâmetros estéreos de enésimo quadro pelo decodificador, refira-se à modalidade 2 da presente invenção e à modalidade 1 da presente invenção e para implementação específica de codificação de um parâmetro estéreo e um sinal downmixed, refira-se à modalidade 2 da presente invenção e à modalidade 1 da presente invenção.
Petição 870190037280, de 18/04/2019, pág. 71/131
68/85 [00231] Em qualquer modalidade da presente invenção, primeiro e segundo no primeiro algoritmo predeterminado não têm significados especiais e são usados apenas para distinguir entre diferentes algoritmos, terceiro, quarto, quinto, sexto, sétimo e semelhantes são similares e detalhes não são descritos aqui.
[00232] Com base em um mesmo conceito da invenção, as modalidades da presente invenção proporcionam ainda um codificador, um decodificador e um sistema de codificação e decodificação. Como os métodos correspondentes ao codificador, ao decodificador e ao sistema de codificação e decodificação nas modalidades da presente invenção são o método de processamento de sinal de áudio multicanal nas modalidades da presente invenção, para implementações do codificador, do decodificador e do sistema de codificação e decodificação nas modalidades da presente invenção, refiram-se à implementação do método e os detalhes não são repetidos aqui.
[00233] Como mostrado na figura 3a, um codificador em uma modalidade da presente invenção inclui uma unidade de detecção de sinal 300 e uma unidade de codificação de sinal 310. A unidade de detecção de sinal 300 é configurada para detectar se um sinal downmixed de enésimo quadro inclui um sinal de fala. O sinal downmixed de enésimo quadro é obtido após os sinais de áudio de enésimo quadro em dois dos múltiplos canais serem misturados com base em um primeiro algoritmo predeterminado, e N é um número inteiro positivo maior do que 0. A unidade de codificação de sinal 310 é configurada para: codificar o sinal downmixed de enésimo quadro quando a unidade de detecção de sinal 300 detecta que o sinal downmixed de enésimo quadro inclui o sinal de fala; ou quando a unidade de detecção de sinal 300 detecta que o sinal downmixed de enésimo quadro não inclui o sinal de voz: codificar o sinal downmixed de enésimo quadro se a unidade de detecção de sinal 300 determinar que o sinal downmixed de
Petição 870190037280, de 18/04/2019, pág. 72/131
69/85 enésimo quadro satisfaz uma condição de codificação de quadro de áudio predefinida; ou pular a codificação do sinal downmixed de enésimo quadro, se a unidade de detecção de sinal 300 determinar que o sinal downmixed de enésimo quadro não satisfaz uma condição de codificação de quadro de áudio predefinida.
[00234] Opcionalmente, como mostrado na figura 3b, a unidade de codificação de sinal 310 inclui uma primeira unidade de codificação de sinal 311 e uma segunda unidade de codificação de sinal 312. Quando a unidade de detecção de sinal 300 detecta que o sinal downmixed de enésimo quadro inclui o sinal de voz, a unidade de detecção de sinal 300 instrui a primeira unidade de codificação de sinal 311 para codificar o sinal downmixed de enésimo quadro.
[00235] Se for determinado que o sinal downmixed de enésimo quadro satisfaz uma condição de codificação de quadro de fala predefinida, a unidade de detecção de sinal 300 instrui a primeira unidade de codificação de sinal 311 a codificar o sinal downmixed de enésimo quadro.
[00236] Especificamente, estipula-se que a primeira unidade de codificação de sinal 311 codifica o sinal downmixed de enésimo quadro de acordo com uma taxa de codificação de quadro de fala predefinida. [00237] Se for determinado que o sinal downmixed de enésimo quadro não satisfaz uma condição de codificação de quadro de fala predefinida, mas satisfaz uma condição de codificação de quadro SI D de descritor de inserção de silêncio predefinida, a unidade de detecção de sinal 300 instrui a segunda unidade de codificação de sinal 312 a codificar o sinal downmixed de enésimo quadro. Especificamente, estipula-se que a segunda unidade de codificação de sinal 312 codifica o sinal downmixed de enésimo quadro de acordo com uma taxa de codificação SI D predefinida. A taxa de codificação SI D não é maior que a taxa de codificação do quadro de fala.
Petição 870190037280, de 18/04/2019, pág. 73/131
70/85 [00238] Opcionalmente, como mostrado na figura 3a e na figura 3b, o codificador inclui ainda uma unidade de geração de parâmetros 320, uma unidade de codificação de parâmetros 330 e uma unidade de detecção de parâmetros 340. A unidade de geração de parâmetros 320 é configurada para obter um conjunto de parâmetros estéreos de enésimo quadro, de acordo com os sinais de áudio de enésimo quadro. O conjunto de parâmetros estéreos de enésimo quadro inclui parâmetros estéreos Z, os parâmetros estéreos Z incluem um parâmetro que é usado quando o codificador mistura os sinais de áudio de enésimo quadro com base no primeiro algoritmo predeterminado, e Z é um número inteiro positivo maior que 0. A unidade de codificação de parâmetros 330 é configurada para: codificar o conjunto de parâmetros estéreos de enésimo quadro quando a unidade de detecção de sinal detecta que o sinal downmixed de enésimo quadro inclui o sinal de fala; ou quando a unidade de detecção de sinal 300 detecta que o sinal downmixed de enésimo quadro não inclui o sinal de fala, codificar pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro, se a unidade de detecção de sinal 300 determinar que o conjunto de parâmetros estéreos de enésimo quadro satisfaz uma condição de codificação de parâmetros estéreos predefinida; ou pular a codificação do conjunto de parâmetros estéreos se a unidade de detecção de sinal 300 determinar que o conjunto de parâmetros estéreos de enésimo quadro não satisfaz uma condição de codificação de parâmetros estéreos predefinida.
[00239] Opcionalmente, a unidade de codificação de parâmetros 330 é configurada para: obter X parâmetros estéreos alvo de acordo com os parâmetros estéreos Z no conjunto de parâmetros estéreos de enésimo quadro com base em uma regra de redução de dimensão de parâmetro estéreo predefinida e codificar os x parâmetros estéreos alvo. X é um número inteiro positivo maior do que 0 e menor do que ou
Petição 870190037280, de 18/04/2019, pág. 74/131
71/85 igual a Z.
[00240] Especificamente, quando a unidade de codificação de parâmetros 330 inclui uma unidade de codificação de primeiro parâmetro 331 e uma segunda unidade de codificação de parâmetro 332, a segunda unidade de codificação de parâmetro 332 é configurada para: obter os X parâmetros estéreo alvo de acordo com os parâmetros estéreos Z no conjunto de parâmetros estéreos de enésimo quadro com base na regra de redução de dimensão do parâmetro estéreo predefinida e codificar os X parâmetros estéreos alvo.
[00241] Opcionalmente, com base na figura 3a e na figura 3b, como mostrado na figura 3c, a unidade de geração de parâmetros 320 do codificador inclui uma primeira unidade de geração de parâmetros 321 e uma segunda unidade de geração de parâmetros 322. Quando a unidade de detecção de sinal 300 detecta que os sinais de áudio de quadro de enésimo quadro incluem o sinal de fala ou a unidade de detecção de sinal 300 detecta que os sinais de áudio de enésimo quadro não incluem o sinal de fala e os sinais de áudio de enésimo quadro satisfazem a condição de codificação de quadro de fala predefinida, a unidade de detecção de sinal 300 instrui a primeira unidade de geração de parâmetros 321 a gerar o conjunto de parâmetros estéreos de enésimo quadro . Quando a unidade de detecção de sinal 300 detecta que os sinais de áudio de enésimo quadro não incluem o sinal de fala e os sinais de áudio de enésimo quadro não satisfazem a condição de codificação de quadro de fala predefinida, a unidade de detecção de sinal 300 instrui a segunda unidade de geração de parâmetros 322 para gerar o conjunto de parâmetros estéreos de enésimo quadro. Especificamente, é pré-estipulado que a primeira unidade de geração de parâmetros 321 obtém o conjunto de parâmetros estéreos de enésimo quadro de acordo com os sinais de áudio de enésimo quadro com base em uma primeira forma de geração de conjunto de parâmetros es
Petição 870190037280, de 18/04/2019, pág. 75/131
72/85 téreos e a segunda unidade de geração de parâmetros 322 obtém o conjunto de parâmetros estéreos de enésimo quadro de acordo com os sinais de áudio de enésimo quadro com base em uma segunda forma de geração de conjunto de parâmetros estéreos.
[00242] A primeira forma de geração de conjunto de parâmetros estéreos e a segunda forma de geração de conjunto de parâmetros estéreos satisfazem pelo menos uma das seguintes condições: [00243] Uma quantidade que é de tipos de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreos não é menor que uma quantidade de tipos de parâmetros estéreos incluídos em um conjunto de parâmetros estéreo e que é estipulado na segunda forma de geração de conjunto de parâmetros estéreos, uma quantidade que é de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreo não é menor que uma quantidade que é de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado no segundo modo de geração de conjunto de parâmetros estéreos, a resolução no domínio do tempo que é de um parâmetro estéreo e que é estipulada na primeira forma de geração do conjunto de parâmetros estéreos não é inferior à resolução no domínio do tempo de um parâmetro estéreo correspondente e que é estipulado na segunda forma de geração de conjunto de parâmetros estéreos, ou resolução de domínio de frequência que é de um parâmetro estéreo e que é estipulada na primeira forma de geração do conjunto de parâmetros estéreos não é inferior à resolução do domínio da frequência que é de um parâmetro estéreo correspondente e que é estipulada na segunda forma de geração do conjunto de parâmetros estéreos.
[00244] Após a segunda unidade de geração de parâmetros 322
Petição 870190037280, de 18/04/2019, pág. 76/131
73/85 obter o conjunto de parâmetros estéreos de enésimo quadro, a unidade de codificação de parâmetros 330 codifica o conjunto de parâmetros estéreos de enésimo quadro. Especificamente, como mostrado na figura 3d, quando a unidade de codificação de parâmetros 330 inclui uma primeira unidade de codificação de parâmetros 331 e uma segunda unidade de codificação de parâmetros 332, a primeira unidade de codificação de parâmetros 331 codifica o conjunto de parâmetros estéreos de enésimo quadro gerado pela primeira unidade de geração de parâmetros 321 e a segunda unidade de codificação de parâmetros 332 codifica o conjunto de parâmetros estéreos de enésimo quadro gerado pela segunda unidade de geração de parâmetros 322. É préestipulado que uma maneira de codificação da primeira unidade de codificação de parâmetros 331 é uma primeira maneira de codificação, e é pré-estipulado que uma forma de codificação da segunda unidade de codificação de parâmetros 332 é uma segunda maneira de codificação. Uma maneira de codificação estipulada pela primeira unidade de codificação de parâmetros é a primeira forma de codificação, e uma maneira de codificação estipulada pela segunda unidade de codificação de parâmetros é a segunda maneira de codificação. Especificamente, uma taxa de codificação estipulada na primeira maneira de codificação não é menor do que uma taxa de codificação estipulada na segunda maneira de codificação; e / ou para qualquer parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro, a precisão de quantização estipulada na primeira maneira de codificação não é inferior à precisão de quantização estipulada na segunda maneira de codificação.
[00245] O conjunto de parâmetros estéreos não é codificado quando a unidade de detecção de parâmetros 340 determina que o conjunto de parâmetros estéreos de enésimo quadro não satisfaz a condição de codificação de parâmetro estéreo predefinida.
Petição 870190037280, de 18/04/2019, pág. 77/131
74/85 [00246] Opcionalmente, a unidade de codificação de parâmetros 330 inclui uma primeira unidade de codificação de parâmetros 331 e uma segunda unidade de codificação de parâmetro 332. Especificamente, a primeira unidade de codificação de parâmetro 331 é configurada para codificar o conjunto de parâmetros estéreos de enésimo quadro de acordo com uma primeira maneira de codificação quando o sinal downmixed de enésimo quadro inclui o sinal de fala e quando o sinal downmixed de enésimo quadro não inclui o sinal de fala, mas satisfaz a condição de codificação de quadro de fala. A segunda unidade de codificação de parâmetros 332 está configurada para codificar pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro de acordo com uma segunda forma de codificação quando o sinal downmixed de enésimo quadro não satisfizer a condição de codificação de quadro de fala.
[00247] Uma taxa de codificação estipulada na primeira maneira de codificação não é menor do que uma taxa de codificação estipulada na segunda maneira de codificação; e / ou para qualquer parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro, a precisão de quantização estipulada na primeira maneira de codificação não é inferior à precisão de quantização estipulada na segunda maneira de codificação.
[00248] Opcionalmente, se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro incluir um ILD de diferença de nível intercanais, a condição de codificação de parâmetro estéreo predefinida inclui dl>d0, onde dl representa um grau pelo qual ILD se desvia de um primeiro padrão, o primeiro padrão é determinado com base em um segundo algoritmo predeterminado de acordo com conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de enésimo quadro e T é um número inteiro positivo maior do que 0.
Petição 870190037280, de 18/04/2019, pág. 78/131
75/85 [00249] Se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro incluir um ITD de diferença de tempo intercanais, a condição de codificação de parâmetros estéreos predefinida incluir DT>1)}, onde DT representa um grau pelo qual ITD se desvia de um segundo padrão, o segundo padrão é determinado com base em um terceiro algoritmo predeterminado de acordo com conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de enésimo quadro e T é um número inteiro positivo maior do que 0.
[00250] Se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro incluir um IPD de diferença de fase intercanais, a condição de codificação de parâmetros estéreos predefinida incluir Dp >i)2, onde Dp representa um grau pelo qual IPD se desvia de um terceiro padrão, o terceiro padrão é determinado com base em um quarto algoritmo predeterminado de acordo com conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de enésimo quadro e T é um número inteiro positivo maior do que 0.
[00251] Opcionalmente, dl, dt e Dp satisfazem, respectivamente as seguintes expressões:
M-li T
Dl = ^^0^)--^^0^)) m=Q1 í=l T
DT = ITD--ITD[~t} (m) T t=i ; e
M-li T
Dp Σ (IPD(m)--^IPD^Xm)) m=Q1 í=l [00252] Onde !LD(m) é uma diferença de nível gerada quando sinais de áudio de enésimo quadro são transmitidos, respectivamente, nos dois canais em uma emésima banda de subfrequências, M é uma quantidade total de bandas de subfrequências ocupadas para transPetição 870190037280, de 18/04/2019, pág. 79/131
76/85 τ missão dos sinais de áudio de enésimo quadro, —é um T f=i valor médio de ILDs nos conjuntos de parâmetros estéreos de quadro T, precedendo o conjunto de parâmetros estéreos de enésimo quadro na emésima banda de subfrequências, T é um número inteiro positivo maior do que 0, iLD[~‘Xm) é uma diferença de nível gerada quando sinais de áudio de quadro T precedendo os sinais de áudio de enésimo quadro são transmitidos, respectivamente, nos dois canais na emésima banda de subfrequências , ITD é uma diferença de tempo gerada quando os sinais de áudio de enésimo quadro são transmitidos, respectivamente, nos dois canais, — ^lTDl~t]é um valor médio de
ITDs nos conjuntos de parâmetros estéreos de quadro T, precedendo o conjunto de parâmetros estéreos de enésimo quadro, ITld~t] é uma diferença de tempo gerada quando os sinais de áudio de quadro T precedendo os sinais de áudio de enésimo quadro são transmitidos, respectivamente, nos dois canais, lPl)(m) é uma diferença de fase gerada quando alguns dos sinais de áudio de enésimo quadro são transmitidos, respectivamente, nos dois canais na emésima banda de subfrequências, —^lPD[~‘\m) é um valor médio de IPDs nos conjunT f=i tos de parâmetros estéreos de quadro T, precedendo o conjunto de parâmetros estéreos de enésimo quadro na emésima banda de subfrequências e iPDl~‘\m)é uma diferença de fase gerada quando os sinais de áudio de quadro t precedendo os sinais de áudio de enésimo quadro são transmitidos, respectivamente, nos dois canais na emésima banda de subfrequências.
[00253] Deve ser notado que a unidade de detecção de parâmetros 340 na figura 3a até a figura 3d é opcional. Isto é, o codificador pode incluir a unidade de detecção de parâmetros 340 ou pode não incluir a
Petição 870190037280, de 18/04/2019, pág. 80/131
77/85 unidade de detecção de parâmetros 340.
[00254] Quando a unidade de codificação de parâmetros 300 codifica cada quadro de conjunto de parâmetros estéreos da unidade de geração de parâmetros 320, o parâmetro estéreo não precisa ser detectado, mas é codificado diretamente.
[00255] Como mostrado na figura 4, um decodificador em uma modalidade da presente invenção inclui uma unidade receptora 400 e uma unidade de decodificação 410. A unidade receptora 400 está configurada para receber um fluxo de bits. O fluxo de bits inclui pelo menos dois quadros, os pelo menos dois quadros incluem pelo menos um quadro de primeiro tipo e pelo menos um quadro de segundo tipo, o quadro de primeiro tipo inclui um sinal downmixed e o quadro de segundo tipo não inclui sinal downmixed. Para um fluxo de bits enésimo quadro, onde N é um número inteiro positivo maior que 1, a unidade de decodificação 410 é configurada para: se for determinado que o fluxo de bits de enésimo quadro é do primeiro tipo, decodificar o fluxo de bits de enésimo quadro para obter um sinal downmixed de enésimo quadro; ou se for determinado que o fluxo de bits de enésimo quadro é do segundo tipo, determinar, de acordo com uma primeira regra predefinida, sinais downmixed em quadro-m em pelo menos um sinal downmixed de quadro um precedendo um sinal downmixed de enésimo quadro e obter o sinal downmixed de enésimo quadro de acordo com os sinais downmixed de quadro m com base em um primeiro algoritmo predeterminado, m é um número inteiro positivo maior que 0.
[00256] O sinal downmixed de enésimo quadro é obtido por um codificador através da mixagem de sinais de áudio de enésimo quadro em dois de múltiplos canais com base em um segundo algoritmo predeterminado.
[00257] Opcionalmente, como mostrado na figura 4, o decodificador inclui ainda uma unidade de restabelecimento de sinal 420. O quadro
Petição 870190037280, de 18/04/2019, pág. 81/131
78/85 do primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos e o quadro do segundo tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed.
[00258] Se for determinado que o fluxo de bits de enésimo quadro é do primeiro tipo, a unidade de decodificação 410 decodifica o fluxo de bits de enésimo quadro, para obter o sinal downmixed de enésimo quadro e um conjunto de parâmetros estéreos de enésimo quadro; ou se for determinado que o fluxo de bits de enésimo quadro é um quadro do segundo tipo, a unidade de decodificação 410 decodifica o fluxo de bits de enésimo quadro, para obter um conjunto de parâmetros estéreos de enésimo quadro. Pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de enésimo quadro para os sinais de áudio de enésimo quadro com base em um terceiro algoritmo predeterminado.
[00259] A unidade de restauração de sinal 420 é configurada para restaurar o sinal downmixed de enésimo quadro para os sinais de áudio de enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro com base no terceiro algoritmo.
[00260] Opcionalmente, o quadro de primeiro tipo inclui tanto um sinal downmixed quanto um conjunto de parâmetros estéreos e o quadro de segundo tipo não inclui nem um conjunto de parâmetros estéreos nem um sinal downmixed.
[00261] A unidade de decodificação 410 é ainda configurada para: se for determinado que o fluxo de bits de enésimo quadro é um quadro de primeiro tipo, decodificar o fluxo de bits de enésimo quadro, para obter tanto o sinal downmixed de enésimo quadro quanto um conjunto de parâmetros estéreos de enésimo quadro; ou, se for determinado que o fluxo de bits de enésimo quadro é do segundo tipo, determinar,
Petição 870190037280, de 18/04/2019, pág. 82/131
79/85 de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos precedendo um conjunto de parâmetros estéreos de enésimo quadro e obter o conjunto de parâmetros estéreos de enésimo quadro de acordo com os conjuntos de parâmetros estéreos quadro k com base em um quarto algoritmo predeterminado, k é um número inteiro positivo maior que 0.
[00262] Pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de enésimo quadro para os sinais de áudio de enésimo quadro com base em um terceiro algoritmo predeterminado.
[00263] Uma unidade de restauração de sinal 420 é configurada para restaurar o sinal downmixed de enésimo quadro para os sinais de áudio de enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro com base no terceiro algoritmo.
[00264] Opcionalmente, o quadro do primeiro tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, um quadro de terceiro tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed, um quadro do quarto tipo não inclui um sinal downmixed nem um conjunto de parâmetros estéreo, e cada um dos quadros de terceiro tipo e de quarto tipo é um caso do quadro de segundo tipo.
[00265] A unidade de decodificação 410 é ainda configurada para: se for determinado que o fluxo de bits de enésimo quadro é um quadro do primeiro tipo, decodificar o fluxo de bits de enésimo quadro, para obter tanto o sinal downmixed de enésimo quadro quanto um conjunto de parâmetros estéreos de enésimo quadro; ou se for determinado que o fluxo de bits de enésimo quadro é um quadro de segundo tipo,
Petição 870190037280, de 18/04/2019, pág. 83/131
80/85 quando o fluxo de bits de enésimo quadro é o quadro de terceiro tipo, decodificar o fluxo de bits de enésimo quadro, para obter um conjunto de parâmetros estéreos de enésimo quadro ou quando o fluxo de bits de enésimo quadro é o quadro de quarto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de urn quadro precedendo um conjunto de parâmetros estéreos de enésimo quadro e obter o conjunto de parâmetros estéreos de enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em urn quarto algoritmo predeterminado, k é um número inteiro positivo maior do que 0.
[00266] Pelo menos um parâmetro estéreo no conjunto de parâmetros estéreo de enésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de enésimo quadro para os sinais de áudio de enésimo quadro com base em um terceiro algoritmo predeterminado.
[00267] Uma unidade de restauração de sinal 420 é configurada para restaurar o sinal downmixed de enésimo quadro para os sinais de áudio de enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro com base no terceiro algoritmo.
[00268] Opcionalmente, um quadro de quinto tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, um quadro do sexto tipo inclui um sinal downmixed, mas não inclui um conjunto de parâmetros estéreos, cada um dentre o quadro do quinto tipo e o do sexto tipo é um caso do quadro do primeiro tipo, e o quadro do segundo tipo não inclui um sinal downmixed nem um conjunto de parâmetros estéreos.
[00269] A unidade de decodificação 410 é ainda configurada para: se for determinado que o fluxo de bits de enésimo quadro é o quadro
Petição 870190037280, de 18/04/2019, pág. 84/131
81/85 de primeiro tipo, quando o fluxo de bits de enésimo quadro é do quinto tipo, decodificar o fluxo de bits de enésimo quadro, obter o sinal downmixed de enésimo quadro e um conjunto de parâmetros estéreos de enésimo quadro; ou quando o fluxo de bits de enésimo quadro for um quadro do sexto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de um quadro precedendo um conjunto de parâmetros estéreos de enésimo quadro e obter o conjunto de parâmetros estéreos de enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado.
[00270] A unidade de decodificação 410 está ainda configurada para: se for determinado que o fluxo de bits de enésimo quadro é do segundo tipo de quadro, determinar, de acordo com uma segunda regra predefinida, conjuntos de parametros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de um quadro que precede um conjunto de parâmetros estéreos de enésimo quadro, e obter o conjunto de parâmetros estéreos de enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado.
[00271] Pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de enésimo quadro para os sinais de áudio de enésimo quadro com base em um terceiro algoritmo predeterminado, e k é um número inteiro positivo maior do que 0.
[00272] Uma unidade de restauração de sinal 420 é configurada para restaurar o sinal downmixed de enésimo quadro para os sinais de áudio de enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro com base no terceiro algoritmo.
Petição 870190037280, de 18/04/2019, pág. 85/131
82/85 [00273] Opcionalmente, um quadro de quinto tipo inclui um sinal downmixed e um conjunto de parâmetros estéreos, um quadro do sexto tipo inclui um sinal downmixed, mas não inclui um conjunto de parâmetros estéreos, cada um dentre o quadro do quinto tipo e o quadro de sexto tipo é um caso do quadro de primeiro tipo, um quadro de terceiro tipo inclui um conjunto de parâmetros estéreos, mas não inclui um sinal downmixed, um quadro de quarto tipo não inclui um sinal downmixed ou um conjunto de parâmetros estéreos do quadro do terceiro tipo e do quadro do quarto tipo é um caso do quadro do segundo tipo.
[00274] A unidade de decodificação 410 é ainda configurada para: se for determinado que o fluxo de bits de enésimo quadro é o quadro de primeiro tipo, quando o fluxo de bits de enésimo quadro é o quadro do quinto tipo, decodificar o fluxo de bits de enésimo quadro, obter o sinal downmixed de enésimo quadro e um conjunto de parâmetros estéreos de enésimo quadro; ou quando o fluxo de bits de enésimo quadro for um quadro do sexto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de um quadro precedendo um conjunto de parâmetros estéreos de enésimo quadro e obter o conjunto de parâmetros estéreos de enésimo quadro de acordo com os conjuntos de parâmetros estéreo de quadro k com base em um quarto algoritmo predeterminado.
[00275] A unidade de decodificação 410 é ainda configurada para: se for determinado que o fluxo de bits de enésimo quadro é o quadro de segundo tipo, quando o fluxo de bits de enésimo quadro é o quadro de terceiro tipo, decodificar o fluxo de bits de enésimo quadro obter um conjunto de parâmetros estéreos de enésimo quadro ou, quando o fluxo de bits de enésimo quadro for o quadro de quarto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâme
Petição 870190037280, de 18/04/2019, pág. 86/131
83/85 tros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de urn quadro precedendo um conjunto de parâmetros estéreos de enésimo quadro e obter o conjunto de parâmetros estéreos de enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em urn quarto algoritmo predeterminado.
[00276] Pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de enésimo quadro para os sinais de áudio de enésimo quadro com base em um terceiro algoritmo predeterminado, e k é um número inteiro positivo maior do que 0.
[00277] Uma unidade de restauração de sinal 420 é configurada para restaurar o sinal downmixed de enésimo quadro para os sinais de áudio de enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro com base no terceiro algoritmo.
[00278] Como mostrado na figura 5, uma modalidade da presente invenção proporciona um sistema de codificação e decodificação, incluindo qualquer codificador 500 mostrado na figura 3a e na figura 3b e o decodificador 510 mostrado na figura 4 [00279] Pessoas especializadas na técnica devem compreender que as modalidades da presente invenção podem ser fornecidas como um método, um sistema ou um produto de programa de computador. Por conseguinte, a presente invenção pode utilizar uma forma de apenas modalidades de hardware, apenas modalidades de software, ou modalidades com uma combinação de software e hardware. Além disso, a presente invenção pode usar uma forma de produto de programa de computador que é implementado em um ou mais meios de armazenamento utilizáveis por computador (incluindo mas não limitado a uma memória de disco, um CD-ROM, uma memória ótica e similares) que incluem código de programa utilizável por computador.
Petição 870190037280, de 18/04/2019, pág. 87/131
84/85 [00280] A presente invenção é descrita com referência aos fluxogramas e / ou diagramas de blocos do método, do dispositivo (sistema) e do produto de programa de computador de acordo com as modalidade da presente invenção. Deve ser entendido que as instruções do programa de computador podem ser usadas para implementar cada processo e / ou cada bloco nos fluxogramas e / ou nos diagramas de blocos e implementar uma combinação de um processo e / ou um bloco nos fluxogramas e / ou diagramas de blocos. Estas instruções de programas de computador podem ser fornecidas para um computador de uso geral, um computador dedicado, um processador incorporado ou um processador de outro dispositivo de processamento de dados programável para gerar uma máquina, de modo que as instruções executadas pelo computador ou processador de outro dispositivo de processamento de dados programável gerem um aparelho para implementar uma função específica em um ou mais processos nos fluxogramas e / ou em um ou mais blocos nos diagramas de blocos.
[00281] Estas instruções de programas de computador podem ser armazenadas em uma memória legível por computador que pode instruir o computador ou o outro dispositivo de processamento de dados programável para trabalhar de uma maneira específica, para que as instruções armazenadas na memória de computador gerem um artefato que inclua um aparelho de instrução. O aparelho de instrução implementa uma função específica em um ou mais processos nos fluxogramas e / ou em um ou mais blocos nos diagramas de bloco.
[00282] Estas instruções de programas de computador podem ser carregadas no computador ou no outro dispositivo de processamento de dados programável, de modo que uma série de operações e etapas sejam executadas no computador ou no outro dispositivo programável, para gerar processamento implementado por computador. Portanto, as instruções executadas no computador ou no outro dispositivo progra
Petição 870190037280, de 18/04/2019, pág. 88/131
85/85 mável fornecem etapas para implementar uma função específica em um ou mais processos nos fluxogramas e / ou em um ou mais blocos nos diagramas de blocos.
[00283] Embora algumas modalidades preferidas da presente invenção tenham sido descritas, os habilitados na técnica podem fazer alterações e modificações nestas modalidades uma vez que aprendam o conceito inventivo básico. Por conseguinte, as reivindicações que se seguem destinam-se a ser interpretadas de modo a abranger as modalidades preferidas e todas as alterações e modificações abrangidas pelo âmbito da presente invenção.
[00284] Obviamente, pessoas habilitadas na técnica podem fazer várias modificações e variações na presente invenção sem se afastar do espírito e escopo da presente invenção. A presente invenção destina-se a cobrir estas modificações e variações desde que elas caiam dentro do âmbito de proteção definido pelas seguintes reivindicações e suas tecnologias equivalentes.

Claims (30)

1. Método de processamento de sinal de áudio de multicanais, caracterizado pelo fato de compreender:
detecção, por um codificador, se um sinal downmixed de Enésimo quadro compreende um sinal de voz, em que o sinal downmixed de Enésimo quadro é obtido após os sinais de áudio de Enésimo quadro em dois de múltiplos canais serem misturados com base em um algoritmo predeterminado, e N é um número inteiro positivo maior que 0; e codificação, pelo codificador, do sinal downmixed de Enésimo quadro quando se detecta que o sinal downmixed de Enésimo quadro compreende o sinal de voz; ou quando o codificador detecta que o sinal downmixed de Enésimo quadro não compreende o sinal de fala:
codificação, pelo codificador, do sinal downmixed de Enésimo quadro, se determinar que o sinal downmixedde Enésimo quadro satisfaz uma condição predefinida de codificação de quadro de áudio, ou pular a codificação do sinal downmixed de Enésimo quadro, se determinar que o sinal downmixed de Enésimo quadro não satisfaz uma condição de codificação de quadro de áudio predefinida.
2. Método de acordo com a reivindicação 1, caracterizado pelo fato de a codificação, pelo codificador, do sinal downmixed de Enésimo quadro, quando se detecta que o sinal downmixed de Enésimo quadro compreende o sinal de voz, compreende:
codificação, pelo codificador, do sinal downmixed de Enésimo quadro de acordo com uma taxa de codificação de quadro de fala predefinida quando se detecta que o sinal downmixed de Enésimo quadro compreende o sinal de voz; ou a codificação, pelo codificador, do sinal downmixedde Enésimo quadro, se a determinação de que o sinal downmixed de Enési
Petição 870190074232, de 02/08/2019, pág. 5/37
2/30 mo quadro satisfaz uma condição de codificação de quadro de áudio predefinida, compreende:
codificação, pelo codificador, do sinal downmixed de Enésimo quadro de acordo com uma taxa de codificação de quadro de fala predefinida, se determinar que o sinal downmixed de Enésimo quadro satisfaz uma condição de codificação de quadro de voz predefinida; ou codificação, pelo codificador, do sinal downmixed de Enésimo quadro de acordo com uma taxa de codificação de quadro SID do descritor de inserção de silêncio predefinido, se determinar que o sinal downmixedde Enésimo quadro não satisfaz a condição de codificação de quadro de voz predefinida, mas satisfaz uma condição de codificação SID predefinida em que a taxa de codificação SID não é maior que a taxa de codificação do quadro de voz.
3. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de o método compreender ainda:
obtenção, pelo codificador, de um conjunto de parâmetros estéreos de Enésimo quadro de acordo com os sinais de áudio de Enésimo quadro, em que o conjunto de parâmetros estéreos de Enésimo quadro compreende parâmetros estéreos Z, os parâmetros estéreos Z compreendem um parâmetro usado quando o codificador mistura Sinais de áudio de Enésimo quadro baseado no primeiro algoritmo predeterminado, e Z é um número inteiro positivo maior que 0; e codificação, pelo codificador, do conjunto de parâmetros estéreos de Enésimo quadro ao detectar que o sinal downmixed de Enésimo quadro compreende o sinal de fala; ou quando o codificador detecta que o sinal downmixed de Enésimo quadro não compreende o sinal de fala:
codificação, pelo codificador, de pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro, se determinar que o conjunto de parâmetros estéreos de Enésimo quadro
Petição 870190074232, de 02/08/2019, pág. 6/37
3/30 satisfaz uma condição de codificação de parâmetro estéreo predefinida ou ignorar a codificação do conjunto de parâmetros estéreos, se determinar que o conjunto de parâmetros estéreos de enésimo quadro não satisfaz uma condição de codificação de parâmetro estéreo predefinida.
4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de a codificação, pelo codificador, de pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro compreender:
obtenção, pelo codificador, de parâmetros estéreos alvo de X de acordo com os parâmetros estéreos Z no conjunto de parâmetros estéreos de Enésimo quadro com base em uma regra de redução de dimensão estéreo predefinida, em que X é um inteiro positivo maior que 0 e menor ou igual a Z ; e codificação, pelo codificador, dos parâmetros estéreos alvo X.
5. Método, de acordo com a reivindicação 2, caracterizado pelo fato de compreender ainda:
quando o codificador detecta que os sinais de áudio de Enésimo quadro compreendem o sinal de fala:
obtenção, pelo codificador, do conjunto de parâmetros estéreos de Enésimo quadro de acordo com os sinais de áudio de Enésimo quadro baseado em uma primeira maneira de geração de conjunto de parâmetros estéreos e codificar o conjunto de parâmetros estéreos de Enésimo quadro; ou quando o codificador detecta que os sinais de áudio de Enésimo quadro não compreendem o sinal de voz:
se determinar que os sinais de áudio de Enésimo quadro satisfazem a condição de codificação de quadro de voz predefinida, obtenção, pelo codificador, do parâmetro estéreo de Enésimo quadro
Petição 870190074232, de 02/08/2019, pág. 7/37
4/30 definido de acordo com os sinais de áudio de Enésimo quadro com base em uma primeira forma de geração de conjunto de parâmetros estéreos e codificação do conjunto de parâmetros estéreos de Enésimo quadro; ou se determinar que os sinais de áudio de Enésimo quadro não satisfazem a condição de codificação de quadro de fala predefinida, obtenção, pelo codificador, do parâmetro estéreo de Enésimo quadro definido de acordo com os sinais de áudio de Enésimo quadro com base em uma segunda forma de geração de conjunto de parâmetros estéreos, e codificação de pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro ao determinar que o conjunto de parâmetros estéreos de Enésimo quadro satisfaz uma condição de codificação de parâmetro estéreo predefinida ou ignorar a codificação do conjunto de parâmetros estéreos ao determinar que o conjunto de parâmetros estéreos de Enésimo quadro não satisfaz uma condição de codificação de parâmetros estéreos predefinida; em que o primeiro modo de geração do conjunto de parâmetros estéreos e o segundo modo de geração do conjunto de parâmetros estéreos satisfazem pelo menos uma das seguintes condições:
uma quantidade que é de tipos de parâmetros estéreos compreendidos em um conjunto de parâmetros estéreos e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreos não é menor que uma quantidade que é dos tipos de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na segunda forma de geração de conjunto de parâmetros estéreos, uma quantidade que é de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreo não é menor que uma quantidade de parâmetros estéreo em um parâmetro estéreo de
Petição 870190074232, de 02/08/2019, pág. 8/37
5/30 finido e estipulado na segunda forma de geração do conjunto de parâmetros estéreos, a resolução no domínio do tempo que é de um parâmetro estéreo e que é estipulado na primeira forma de geração do conjunto de parâmetros estéreos não é inferior à resolução no domínio do tempo que é de um parâmetro estéreo correspondente e que é estipulado na segunda forma de geração de conjunto de parâmetros estéreos, ou resolução de domínio de frequência que é de um parâmetro estéreo e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreos não é inferior à resolução de domínio de frequência que é de um parâmetro estéreo correspondente e que é estipulado na segunda forma de geração de conjunto de parâmetros estéreos.
6. Método, de acordo com qualquer uma das reivindicações 3 a 5, caracterizado pelo fato de a codificação, pelo codificador, do conjunto de parâmetros estéreos de Enésimo quadro compreender:
codificação, pelo codificador, do conjunto de parâmetros estéreos de Enésimo quadro de acordo com uma primeira maneira de codificação; e a codificação, pelo codificador, de pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro compreende:
codificação, pelo codificador, do pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro de acordo com a primeira maneira de codificação quando o sinal downmixed de Enésimo quadro satisfaz a condição de codificação do quadro de voz; ou codificação, pelo codificador, de pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro de acordo com a segunda maneira de codificação quando o sinal downmixed de Enésimo quadro não satisfaz a condição de codificação de
Petição 870190074232, de 02/08/2019, pág. 9/37
6/30 quadro de voz; em que uma taxa de codificação estipulada na primeira maneira de codificação não é menor do que uma taxa de codificação estipulada na segunda maneira de codificação; e/ou para qualquer parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro, a precisão de quantização estipulada na primeira maneira de codificação não é inferior à precisão de quantização estipulada na segunda maneira de codificação
7. Método, de acordo com qualquer uma das reivindicações 3 a 6, caracterizado pelo fato de se pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro compreender uma ILD de diferença de nível entre canais, a condição de codificação de parâmetros estéreos predefinida compreende dl^d0, em que DL representa um grau pelo qual o ILD se desvia de um primeiro padrão, o primeiro padrão é determinado com base em um segundo algoritmo predeterminado de acordo com conjuntos de parâmetros estéreos T-frame precedendo o conjunto de parâmetros estéreo Enésimo quadro e T é um inteiro positivo maior que 0;
se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreo de Enésimo quadro compreende uma diferença de tempo entre canais ITD, a condição de codificação de parâmetro estéreo predefinidacompreende DT>DX, em que DT representa um grau pelo qual o ITD se desvia de um segundo padrão, o segundo padrão é determinado com base em um terceiro algoritmo predeterminado de acordo com conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Enésimo quadro e T é um inteiro positivo maior que 0; ou se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro compreende uma IPD de dife
Petição 870190074232, de 02/08/2019, pág. 10/37
7/30 rença de fase entre canais, a condição de codificação de parâmetro estéreo predefinida compreende DP>D„ em que Dprepresenta um grau pelo qual o IPD se desvia de um terceiro padrão, o terceiro padrão é determinado com base em um quarto algoritmo predeterminado de acordo com conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Enésimo quadro e T é um inteiro positivo maior que 0
8. Método , de acordo com a reivindicação 7, caracterizado pelo fato de DL, DT e Dp respectivamente, satisfazerem as seguintes expressões:
M-l1 T
Dl = £(ZLD(m)--£ZLD[-f](m));
m=Qt=l
1 T
DT= ITD £ ITD[~t} (m); e
T t=l
M-l1 T
Dp Σ (IPD(m) - - ΣIPD^ (m)), m=0t=l
Em que iLD(m) é uma diferença de nível gerada quando os sinais de áudio de Enésimo quadro são transmitidos, respectivamente, nos dois canais em uma emésima sub-banda de frequência, M é uma quantidade total de sub-bandas de frequência ocupadas para trans1 T missão dos sinais de áudio de Enésimo quadro, —é um T t=í valor médio de ILDs nos conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Enésimo quadro na emésima sub-banda de frequência, T é um inteiro positivo maior do que 0, /LD[í](m) é uma diferença de nível gerada quando os sinais de áudio de quadro T que precedem os sinais de áudio de Enésimo quadro são transmitidos respectivamente nos dois canais na emésima sub-banda de frequência, ITD é uma diferença de tempo gerada quando os sinais de áudio de Enésimo quadro são transmitidos respectivaPetição 870190074232, de 02/08/2019, pág. 11/37
8/30
1 τ mente nos dois canais, —V lTD[~t} é um valor médio de ITDs nos conrtr juntos de parâmetros estéreos com quadro T precedendo o conjunto de parâmetros estéreos de Enésimo quadro, lTD[~t} é uma diferença de tempo gerada quando os sinais de áudio de quadro t que precedem os sinais de áudio de Enésimo quadro são transmitidos respectivamente nos dois canais, iPD(m) é uma diferença de fase gerada quando alguns dos sinais de áudio de Enésimo quadro são transmitidos respectivamente nos dois canais na emésima sub-banda de fre1 T quência, —^ZPD[f](m) é um valor médio de IPDs nos conjuntos de τ t=í parâmetros estéreos com quadro T precedendo os parâmetros estéreos de Enésimo quadro ajustado na emésima sub-banda de frequência e lPD[~t}(m) é uma diferença de fase gerada quando os sinais de áudio de quadro-t que precedem os sinais de áudio de Enésimo quadro são transmitidos respectivamente nos dois canais na emésima sub-banda de frequência.
9. Método de processamento de sinal de áudio multicanais, caracterizado pelo fato de compreender recebimento, por um decodificador, de um fluxo de bits, em que o fluxo de bits compreende, pelo menos, dois quadros, os pelo menos dois quadros compreendem pelo menos um quadro de primeiro tipo e pelo menos um quadro de segundo tipo, o quadro de primeiro tipo compreende um sinal downmixed, e o quadro do segundo tipo não compreende um sinal downmixed', e para um fluxo de bits de Enésimo quadro, em que N é um inteiro positivo maior que 1, decodificação, pelo decodificador, do fluxo de bits de Enésimo quadro, se for determinado que o fluxo de bits de Enésimo quadro é um quadro de primeiro tipo, para obter um sinal de downmixed
Petição 870190074232, de 02/08/2019, pág. 12/37
9/30 de Enésimo quadro; ou se determinar que o fluxo de bits de Enésimo quadro é um quadro de segundo tipo, determinação, pelo decodificador de acordo com uma primeira regra predefinida, sinais downmixed de Emésimo quadro em pelo menos um quadro de sinal downmixed que precede o sinal downmixed de Enésimo quadro, e obtenção do sinal downmixed de Enésimo quadro de acordo com os sinais downmixed de Emésimo quadro baseado em um primeiro algoritmo predeterminado, em que m é um inteiro positivo maior que 0, e o sinal downmixed de Enésimo quadro é obtido por um codificador misturando sinais de áudio de Enésimo quadro em dois de múltiplos canais com base em um segundo algoritmo predeterminado.
10. Método, de acordo com a reivindicação 9, caracterizado pelo fato de o quadro de primeiro tipo compreender tanto um sinal downmixed quanto um conjunto de parâmetros estéreos, e o segundo tipo de quadro compreender um conjunto de parâmetros estéreos, mas não compreender um sinal downmixed', e após a decodificação, pelo decodificador, o fluxo de bits de Enésimo quadro se determinar que o fluxo de bits de Enésimo quadro é do primeiro tipo de quadro, o método compreende ainda:
obtenção, pelo decodificador, de um conjunto de parâmetros estéreo de enésimo quadro; ou após o decodificador determinar que o fluxo de bits de Enésimo quadro é do segundo tipo de quadro, o método compreende ainda:
decodificar, pelo decodificador, o fluxo de bits de Enésimo quadro, para obter um conjunto de parâmetros estéreos de Enésimo quadro, em que pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos com enésimo quadro é usado pelo decodificador para
Petição 870190074232, de 02/08/2019, pág. 13/37
10/30 restaurar o sinal mixado de enésimo quadro para os sinais de áudio de enésimo quadro baseado no terceiro algoritmo predeterminado; e restauração, pelo decodificador, do sinal downmixed de enésimo quadro para os sinais de áudio de Enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro baseado no terceiro algoritmo.
11. Método, de acordo com a reivindicação 9, caracterizado pelo fato de o quadro de primeiro tipo compreender tanto um sinal downmixed como um conjunto de parâmetros estéreos, e o quadro do segundo tipo não compreender nem um sinal downmixed nem um conjunto de parâmetros estéreos; e após a decodificação, pelo decodificador, o fluxo de bits de Enésimo quadro determinar que o fluxo de bits de Enésimo quadro é do primeiro tipo de quadro, o método compreende ainda:
obtenção, pelo decodificador, de um conjunto de parâmetros estéreos de enésimo quadro; ou após o decodificador determinar que o fluxo de bits de Enésimo quadro é do segundo tipo de quadro, o método compreende ainda:
determinação, pelo decodificador, de acordo com uma segunda regra predefinida, de conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos precedendo o conjunto de parâmetros estéreo de Enésimo quadro e obtenção do conjunto de parâmetros estéreos de Enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k baseado em um quarto algoritmo predeterminado, em que k é um número inteiro positivo maior que 0, e pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos com enésimo quadro é usado pelo decodificador para restaurar o sinal mixado de enésimo quadro para os sinais de áudio de
Petição 870190074232, de 02/08/2019, pág. 14/37
11/30 enésimo quadro baseado no terceiro algoritmo predeterminado; e restauração, pelo decodificador, do sinal downmixed de enésimo quadro para os sinais de áudio de Enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro baseado no terceiro algoritmo.
12. Método, de acordo com a reivindicação 9, caracterizado pelo fato de o quadro de primeiro tipo compreender tanto um sinal downmixed quanto um conjunto de parâmetros estéreos, um terceiro tipo de quadro compreende um conjunto de parâmetros estéreos, mas não compreende um sinal downmixed, um quadro de tipo quarto não compreende nem um sinal downmixed nem um conjunto de parâmetros estéreos, e cada um dos quadros de terceiro tipo e de quarto tipo é um caso do quadro de segundo tipo; e após a decodificação, pelo decodificador, do fluxo de bits de Enésimo quadro se determinar que o fluxo de bits de Enésimo quadro é do primeiro tipo de quadro, o método compreende ainda:
obtenção, pelo decodificador, de um conjunto de parâmetros estéreos de enésimo quadro; ou após o decodificador determinar que o fluxo de bits de Enésimo quadro é o segundo tipo de quadro, o método compreende ainda:
decodificação, pelo decodificador, do fluxo de bits Enésimo quadro quando o fluxo de bits de Enésimo quadro é do terceiro tipo de quadro, para obter um conjunto de parâmetros estéreos de enésimo quadro; ou quando o fluxo de bits de Enésimo quadro é o quadro de quarto tipo, determinando, pelo decodificador, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos precedendo o conjunto de parâmetros estéreos de Enésimo quadro, e obtendo o conjunto de parâmetros estéreos de Enésimo quadro, de acordo com
Petição 870190074232, de 02/08/2019, pág. 15/37
12/30 os conjuntos de parâmetros estéreos de quadro K, baseado em um quarto algoritmo predeterminado, em que k é um número inteiro positivo maior que 0, e pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de enésimo quadro para os sinais de áudio de enésimo quadro baseado no terceiro algoritmo predeterminado; e restauração, pelo decodificador, do sinal downmixed de enésimo quadro para os sinais de áudio de Enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro baseado no terceiro algoritmo.
13. Método, de acordo com a reivindicação 9, caracterizado pelo fato de um quadro do quinto tipo compreender tanto um sinal downmixed como um conjunto de parâmetros estéreos, um quadro do sexto tipo compreender um sinal downmixed, mas não compreende um conjunto de parâmetros estéreos, cada um do quadro do quinto tipo e do quadro do sexto tipo é um caso do quadro de primeiro tipo, e o segundo tipo de quadro não compreende nem um sinal downmixed nem um conjunto de parâmetros estéreos; e após o decodificador determinar que o fluxo de bits de Enésimo quadro é do primeiro tipo de quadro, o método compreende ainda:
decodificação, pelo decodificador, o fluxo de bits de Enésimo quadro quando o fluxo de bits de Enésimo quadro é do quinto tipo de quadro, para obter um conjunto de parâmetros estéreos com Enésimo quadro; ou quando o fluxo de bits de Enésimo quadro é o quadro do tipo sexto, determinação, pelo decodificador, de acordo com uma segunda regra predefinida, de conjuntos de parâmetros estéreos de quadro K em pelo menos um conjunto de parâmetros estéreos prece
Petição 870190074232, de 02/08/2019, pág. 16/37
13/30 dendo o conjunto de parâmetros estéreos de Enésimo quadro e obtenção do conjunto de parâmetros estéreos de Enésimo quadro de acordo com os conjuntos de parâmetros estéreos quadro K baseados em um quarto algoritmo predeterminado; ou após o decodificador determinar que o fluxo de bits de Enésimo quadro é o segundo tipo de quadro, o método compreende ainda:
determinar, pelo decodificador, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro K em pelo menos um conjunto de parâmetros estéreos precedendo o conjunto de parâmetros estéreos de Enésimo quadro e obtenção do conjunto de parâmetros estéreos de Enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro k com base em um quarto algoritmo predeterminado, em que pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Enésimo quadro para os sinais de áudio de Enésimo quadro com base no terceiro algoritmo predeterminado e k é um número inteiro positivo maior que 0; e restauração, pelo decodificador, o sinal downmixedde Enésimo quadro para os sinais de áudio de Enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro baseado no terceiro algoritmo.
14. Método, de acordo com a reivindicação 9, caracterizado pelo fato de um quadro do quinto tipo compreender tanto um sinal downmixed como um conjunto de parâmetros estéreos, um quadro do tipo sexto compreende um sinal downmixed, mas não compreende um conjunto de parâmetros estéreos, cada um dentre o quadro de tipo quinto e o quadro de tipo sexto é um caso do quadro de primeiro tipo, um quadro de terceiro tipo compreende um conjunto de parâmetros estéreos, mas não inclui um sinal de downmixed, um quadro de tipo
Petição 870190074232, de 02/08/2019, pág. 17/37
14/30 quarto não compreende nenhum sinal downmixed nem conjunto de parâmetros estéreos, e cada um dos quadros do terceiro tipo e do quarto tipo é um caso do quadro do segundo tipo; e após o decodificador determinar que o fluxo de bits de Enésimo quadro é do primeiro tipo de quadro, o método compreende ainda:
decodificação, pelo decodificador, do fluxo de bits de Enésimo quadro quando o fluxo de bits de Enésimo quadro é o quinto tipo de quadro, para obter um conjunto de parâmetros estéreos de Enésimo quadro; ou quando o fluxo de bits de Enésimo quadro é o quadro do tipo sexto, determinação, pelo decodificador, de acordo com uma segunda regra predefinida, de conjuntos de parâmetros estéreos de quadro K em pelo menos um conjunto de parâmetros estéreos precedendo o conjunto de parâmetros estéreos de Enésimo quadro e obtenção do conjunto de parâmetros estéreos de Enésimo quadro de acordo com os conjuntos de parâmetros estéreos de quadro K baseado em um quarto algoritmo predeterminado; ou após o decodificador determinar que o fluxo de bits de Enésimo quadro é o segundo tipo de quadro, o método compreende ainda:
decodificação, pelo decodificador, do fluxo de bits de Enésimo quadro quando o fluxo de bits de Enésimo quadro é o terceiro tipo de quadro, para obter um conjunto de parâmetros estéreos de Enésimo quadro; ou quando o fluxo de bits de Enésimo quadro é o quadro de tipo quarto, determinação, pelo decodificador, de acordo com uma segunda regra predefinida, de conjuntos de parâmetros estéreos de quadro K em pelo menos um conjunto de parâmetros estéreos precedendo o conjunto de parâmetros estéreos de Enésimo quadro, e obtenção do conjunto de parâmetros estéreos de Enésimo quadro, de acordo
Petição 870190074232, de 02/08/2019, pág. 18/37
15/30 com os conjuntos de parâmetros estéreos de quadro K baseado em urn quarto algoritmo predeterminado, em que pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Enésimo quadro para os sinais de áudio de Enésimo quadro com base no terceiro algoritmo predeterminado, e k é um número inteiro positivo maior que 0; e restauração, pelo decodificador, do sinal downmixed de Enésimo quadro para os sinais de áudio de Enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro baseado no terceiro algoritmo.
15. Codificador, caracterizado pelo fato de compreender:
uma unidade de detecção de sinal, configurada para detectar se um sinal downmixed de Enésimo quadro compreende um sinal de voz, em que o sinal downmixed de Enésimo quadro obtido depois dos sinais de áudio de Enésimo quadro em dois de múltiplos canais ser misturados com base em um primeiro algoritmo predeterminado; N é um número inteiro positivo maior que 0; e uma unidade de codificação de sinal, configurada para codificar o sinal downmixed de Enésimo quadro quando a unidade de detecção de sinal detecta que o sinal downmixed de Enésimo quadro compreende o sinal de voz, em que a unidade codificadora de sinal é ainda configurada para: quando a unidade de detecção de sinal detecta que o sinal downmixed de Enésimo quadro não compreende o sinal de fala, codificar o sinal downmixedde Enésimo quadro se a unidade de detecção de sinal determinar que o sinal downmixed de Enésimo quadro satisfaz uma condição de codificação de quadro de áudio predefinida, ou ignorar a codificação do sinal downmixed de Enésimo quadro, se a unidade de detecção de sinal determinar que o sinal
Petição 870190074232, de 02/08/2019, pág. 19/37
16/30 downmixed de Enésimo quadro não satisfaz uma condição de codificação de quadro de áudio predefinida.
16. Codificador, de acordo com a reivindicação 15, caracterizado pelo fato de a unidade de codificação de sinal compreender uma primeira unidade codificadora de sinal e uma segunda unidade codificadora de sinal, em que a primeira unidade codificadora de sinal é especificamente configurada para:
codificar o sinal downmixed de Enésimo quadro de acordo com uma taxa de codificação de quadro de voz predefinida quando a unidade de detecção de sinal detecta que o sinal downmixed de Enésimo quadro compreende o sinal de voz; ou codificar o sinal misto de Enésimo quadro de acordo com uma taxa de codificação de quadro de voz predefinida, se a unidade de detecção de sinal determinar que o sinal downmixed de Enésimo quadro satisfaz uma condição de codificação de quadro de voz predefinida; e a segunda unidade de codificação de sinal é especificamente configurada para:
codificar o sinal downmixed de Enésimo quadro de acordo com uma taxa de codificação de quadro SI D do descritor de inserção de silêncio predefinida, se a unidade de detecção de sinal determinar que o sinal downmixedde Enésimo quadro não satisfaz uma condição de codificação de quadro de voz predefinida, mas satisfaz uma condição de codificação SI D predefinida a taxa de codificação SI D não é maior que a taxa de codificação do quadro de voz.
17. Codificador, de acordo com a reivindicação 15 ou 16, caracterizado pelo fato de compreender ainda uma unidade de geração de parâmetros, uma unidade de codificação de parâmetros e uma unidade de detecção de parâmetros, em que a unidade de geração de parâmetros é configurada para
Petição 870190074232, de 02/08/2019, pág. 20/37
17/30 obter um conjunto de parâmetros estéreos de Enésimo quadro, de acordo com os sinais de áudio de Enésimo quadro , em que o conjunto de parâmetros estéreos de Enésimo quadro compreende parâmetros estéreos Z, os parâmetros estéreos Z incluem um parâmetro usado quando o codificador mistura os sinais de áudio de Enésimo quadro, baseado no primeiro algoritmo predeterminado, e Z é um número inteiro positivo maior que 0; e a unidade de codificação de parâmetros é configurada para codificar o conjunto de parâmetros estéreos de Enésimo quadro quando a unidade de detecção de sinal detecta que o sinal downmixed de Enésimo quadro compreende o sinal de fala; ou a unidade de codificação de parâmetros ainda configurada para: quando a unidade de detecção de sinal detecta que o sinal de downmixedde Enésimo quadro não compreende o sinal de voz, codificar pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro se a unidade de detecção de parâmetro determinar que o conjunto de parâmetros estéreos de Enésimo quadro satisfaz uma condição de codificação de parâmetro estéreo predefinida ou ignore a codificação do conjunto de parâmetros estéreos, se a unidade de detecção de parâmetro determinar que o conjunto de parâmetros estéreos de Enésimo quadro não satisfaz uma condição de codificação de parâmetros estéreos predefinida.
18. Codificador, de acordo com a reivindicação 17, caracterizado pelo fato de ao codificar o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro, a unidade de codificação de parâmetro ser especificamente configurada para:
obter parâmetros estéreos alvo X de acordo com os parâmetros estéreos Z no conjunto de parâmetros estéreos de Enésimo quadro com base em uma regra de redução de dimensão de parâmetro estéreo predefinida, e codificar os parâmetros estéreos alvo X, em
Petição 870190074232, de 02/08/2019, pág. 21/37
18/30 que X é um número inteiro positivo maior que 0 e menor do que ou igual a Z.
19. Codificador, de acordo com a reivindicação 16, caracterizado pelo fato de a unidade de geração de parâmetros compreender uma primeira unidade de geração de parâmetros e uma segunda unidade de geração de parâmetros, em que a primeira unidade de geração de parâmetros é configurada para: quando a unidade de detecção de sinal detecta que os sinais de áudio de Enésimo quadro compreendem o sinal de voz e quando a unidade de detecção de sinal detecta que os sinais de áudio de Enésimo quadro não compreendem o sinal de voz, e determina que os sinais de áudio de Enésimo quadro satisfazem a condição de codificação de quadro de fala predefinida, obter o conjunto de parâmetros estéreos de Enésimo quadro, de acordo com os sinais de áudio de Enésimo quadro baseado em uma primeira forma de geração de conjunto de parâmetros estéreos e a unidade de codificação de parâmetro de conjunto de parâmetros estéreos de Enésimo quadro; e a segunda unidade de geração de parâmetros é configurada para: quando a unidade de detecção de sinal detecta que os sinais de áudio de Enésimo quadro não compreendem o sinal de fala, e determina que os sinais de áudio de Enésimo quadro não satisfazem a condição de codificação de quadro de voz predefinida, obter o conjunto de parâmetros estéreos de Enésimo quadro de acordo com os sinais de áudio de Enésimo quadro baseado em um segundo modo de geração de conjunto de parâmetros estéreos e codificar de pelo menos um parâmetro estéreo no parâmetro estéreo de Enésimo quadro quando a unidade de detecção de parâmetro determina que o conjunto de parâmetros estéreos de Enésimo quadro satisfaz uma condição de codificação de parâmetro estéreo
Petição 870190074232, de 02/08/2019, pág. 22/37
19/30 predefinida, ou ignora a codificação do conjunto de parâmetros estéreos quando a unidade de detecção de parâmetro determina que o conjunto de parâmetros estéreos de Enésimo quadro não satisfaz uma condição de codificação de parâmetros estéreos predefinida; em que o primeiro modo de geração do conjunto de parâmetros estéreos e o segundo modo de geração do conjunto de parâmetros estéreos satisfazem pelo menos uma das seguintes condições:
uma quantidade que é de tipos de parâmetros estéreos compreendida em um conjunto de parâmetros estéreos e que é estipulada na primeira forma de geração de conjunto de parâmetros estéreos não é menor do que uma quantidade que é de tipos de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulada na segunda geração de conjunto de parâmetros estéreos, uma quantidade de parâmetros estéreos formada por um conjunto de parâmetros estéreos e que estipulada na primeira forma de geração do conjunto de parâmetros estéreos não é menor do que uma quantidade que é de parâmetros estéreos incluídos em um conjunto de parâmetros estéreos e que é estipulada na segunda forma de geração de conjunto de parâmetros estéreos, a resolução de domínio de tempo que é de um parâmetro estéreo e que é estipulado na primeira forma de geração de conjunto de parâmetros estéreos não é inferior à resolução de domínio de tempo que é de um parâmetro estéreo correspondente e que é estipulada na segunda forma de geração de conjunto de parâmetros estéreos, ou resolução de domínio de frequência que é de um parâmetro estéreo e que é estipulado na primeira forma de geração do conjunto de parâmetros estéreos não é menor do que a resolução do domínio de frequência que é de um parâmetro estéreo correspondente e que é estipulado na segunda forma de geração do conjunto de parâmetros estéreos.
20. Codificador, de acordo com qualquer uma das reivindi
Petição 870190074232, de 02/08/2019, pág. 23/37
20/30 cações 17 a 19, caracterizado pelo fato de a unidade de codificação de parâmetros compreender uma primeira unidade de codificação de parâmetro e uma segunda unidade de codificação de parâmetro, em que a primeira unidade de codificação de parâmetros é configurada para codificar o conjunto de parâmetros estéreos de Enésimo quadro, de acordo com uma primeira maneira de codificação quando a unidade de detecção de sinal detecta que o sinal downmixed de Enésimo quadro compreende o sinal de voz e o sinal downmixed de Enésimo quadro satisfaz a condição de codificação de quadro de voz; e a segunda unidade de codificação de parâmetros é especificamente configurada para codificar pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro de acordo com uma segunda maneira de codificação quando o sinal downmixed de Enésimo quadro não satisfaz a condição de codificação de quadro de voz; em que uma taxa de codificação estipulada na primeira maneira de codificação não é menor do que uma taxa de codificação estipulada na segunda maneira de codificação; e / ou para qualquer parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro, a precisão de quantização estipulada na primeira maneira de codificação não é inferior à precisão de quantização estipulada na segunda maneira de codificação.
21. Codificador, de acordo com qualquer uma das reivindicações 17 a 20, caracterizado pelo fato de, se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de Enésimo quadro compreender uma ILD de diferença de nível intercanais, a condição de codificação de parâmetro estéreo predefinida compreende dl>d0, onde DL representa um grau pelo qual o ILD se desvia de um primeiro padrão, o primeiro padrão é determinado com base em um segundo algoritmo predeterminado de acordo com os conjuntos de
Petição 870190074232, de 02/08/2019, pág. 24/37
21/30 parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de enésimo quadro e T é umnúmero inteiro positivo maior do que 0 ;
se o pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro incluir uma diferença de tempo entre canais ITD, a condição de codificação de parâmetro estéreo predefinida inclui DT >Dl, onde DT representa um grau pelo qual a ITD se desvia de um segundo padrão, o segundo padrão é determinado com base em um terceiro algoritmo predeterminado de acordo com conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de enésimo quadro e T é umnúmero inteiro positivo maior do que 0; ou se pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos de enésimo quadro incluir uma IPD de diferença de fase entre canais, a condição de codificação de parâmetro estéreo predefinida inclui dp>d2 em que Dp representa um grau pelo qual o IPD se desvia de um terceiro padrão, o terceiro padrão é determinado com base em um quarto algoritmo predeterminado de acordo com conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Enésimo quadro e T é umnúmero inteiro positivo maior do que 0.
22. Codificador, de acordo com a reivindicação 21, caracterizado pelo fato de, Dl,Dt e Dp respectivamente, satisfazerem as seguintes expressões:
M—l 1 T
Dl = £(ZLD(m)--£ZLD[-f](m));
m=0 t=\
1 T
DT= ITD--£ ITD[~t} (m); e
T t=l
Petição 870190074232, de 02/08/2019, pág. 25/37
22/30
M-l 1 τ
Dp Υ (IPD(m) £ IPD^ (m)), m=0 t=\ onde ILD(m) θ uma diferença de nível gerada quando os sinais de áudio de enésimo quadro são transmitidos, respectivamente nos dois canais em uma emésima sub-banda de frequências, M é uma quantidade total de sub-banda de frequências ocupada para transmissão dos sinais de áudio de enésimo quadro, T /=l é um valor médio de ILDs nos conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de enésimo quadro na emésima sub-banda de frequências, T é um número inteiro positivo maior do que 0,/LD[_í](m) é uma diferença de nível gerada quando os sinais de áudio de enésimo quadro, precedendo os sinais de áudio de enésimo quadro são transmitidos, respectivamente nos dois canais, na emésima sub- banda de frequência,ITD é uma diferença de tempo gerada quando os sinais de áudio de Enésimo quadro são transmitidos,
1 T respectivamente em dois canais — ^lTDl~t] é um valor médio de ITDs τ t=l nos conjuntos de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Enésimo quadro , ITD[ t] é uma diferença de tempo gerada quando os sinais de áudio de Enésimo quadro precedendo os sinais de áudio de enésimo quadro são transmitidos, respectivamente nos dois canais, é uma diferença de fase gerada quando alguns dos sinais de áudio de enésimo quadro são transmitidos, respectivamente, nos dois canais na emésima sub-banda 1 T de frequência, —^ZPD[f](m) é um valor médio de IPDs nos conjuntos τ t=í de parâmetros estéreos de quadro T precedendo o conjunto de parâmetros estéreos de Enésimo quadro na emésima sub- banda de frequência e lPD[~t}(m) é uma diferença de fase gerada quando os sinais
Petição 870190074232, de 02/08/2019, pág. 26/37
23/30 de áudio de enésimo quadro precedendo os sinais de áudio de enésimo quadro são transmitidos, respectivamente, nos dois canais na emésima sub-banda de frequência.
23. Decodificador, caracterizado pelo fato de compreender:
uma unidade receptora, configurada para receber um fluxo de bits, em que o fluxo de bits compreende pelo menos dois quadros, pelo menos dois quadros compreendem pelo menos um quadro de primeiro tipo e pelo menos um quadro de segundo tipo, o quadro de primeiro tipo compreende um sinal downmixed e o quadro do segundo tipo não compreende um sinal downmixed; e uma unidade de decodificação, configurada para: um fluxo de bits de Enésimo quadro, em que N é um númerointeiro positivo maior do que 1, decodificar o fluxo de bits de Enésimo quadro se for determinado que o fluxo de bits de Enésimo quadro é o primeiro tipo de quadro, para obter um sinal downmixedde Enésimo quadro; ou se for determinado que o fluxo de bits de Enésimo quadro é o segundo tipo de quadro, determinar, de acordo com uma primeira regra predefinida, sinais downmixed de quadro m em pelo menos um sinal downmixed de quadro precedendo o sinal downmixed de Enésimo quadro ,e obter o sinal downmixed de Enésimo quadro de acordo com os sinais downmixed baseado em um primeiro algoritmo predeterminado, em que m é um númerointeiro positivo maior do que 0, e o sinal downmixedde Enésimo quadro é obtido por um codificador misturando sinais de áudio de Enésimo quadro em dois de múltiplos canais com base em um segundo algoritmo predeterminado.
24. Decodificador, de acordo com a reivindicação 23, caracterizado pelo fato de o quadro de primeiro tipo compreender tanto um sinal downmixed como um conjunto de parâmetros estéreos e o segundo tipo de quadro compreender um conjunto de parâmetros esté-
Petição 870190074232, de 02/08/2019, pág. 27/37
24/30 reos, mas não compreender um sinal downmixed;
a unidade de decodificação é ainda configurada para:
se for determinado que o fluxo de bits de Enésimo quadro é o primeiro tipo de quadro, decodificar o fluxo de bits de Enésimo quadro, para obter um conjunto de parâmetros estéreos com Enésimo quadro; ou se for determinado que o fluxo de bits de Enésimo quadro é o segundo tipo de quadro, decodificar o fluxo de bits de Enésimo quadro, para obter um conjunto de parâmetros estéreos com Enésimo quadro, em que pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos com Enésimo quadro é usado pelo decodificador para restaurar o sinal downmixed de Enésimo quadro para os sinais de áudio de Enésimo quadro baseado no terceiro algoritmo predeterminado; e o decodificador compreende ainda uma unidade de restauração de sinal, em que a unidade de restauração de sinal é configurada para restaurar o sinal downmixed de Enésimo quadro aos sinais de áudio de Enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo do Enésimo quadro baseado no terceiro algoritmo.
25. Decodificador de acordo com a reivindicação 23, caracterizado pelo fato de que o quadro do primeiro tipo compreende um sinal downmixed e um conjunto de parâmetros estéreos, e o quadro do segundo tipo não compreende nem um sinal downmixed nem um conjunto de parâmetros estéreos;
a unidade de decodificação é ainda configurada para:
se for determinado que o fluxo de bits de Enésimo quadro é o primeiro tipo de quadro, decodificar o fluxo de bits de Enésimo
Petição 870190074232, de 02/08/2019, pág. 28/37
25/30 quadro, para obter um conjunto de parâmetros estéreos com Enésimo quadro; ou se for determinado que o fluxo de bits de Enésimo quadro é o segundo tipo de quadro, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos do quadro k em pelo menos um conjunto de parâmetros estéreos precedendo o conjunto de parâmetros estéreos do Enésimo quadro e obter o conjunto de parâmetros estéreos do Enésimo quadro de acordo com os conjuntos de parâmetros estéreos do quadro k, baseado em um quarto algoritmo predeterminado, em que k é umnúmero inteiro positivo maior do que 0, e pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos com Enésimo quadro é usado pelo decodificador para restaurar o sinal downmixed do Enésimo quadro para os sinais de áudio do Enésimo quadro baseado no terceiro algoritmo predeterminado; e o decodificador compreende ainda uma unidade de restauração de sinal, em que a unidade de restauração de sinal é configurada para restaurar o sinal downmixed de Enésimo quadro aos sinais de áudio de Enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo do Enésimo quadro baseado no terceiro algoritmo.
26. Decodificador de acordo com a reivindicação 23, caracterizado pelo fato de que o quadro de primeiro tipo compreende tanto um sinal downmixed e um conjunto de parâmetros estéreos, um quadro de terceiro tipo compreende um conjunto de parâmetros estéreos, mas não compreende um sinal downmixed,um quadro de quarto tipo compreende nem um sinal downmixed nem um conjunto de parâmetros estéreos, e cada um dos quadros de terceiro tipo e de quarto tipo
Petição 870190074232, de 02/08/2019, pág. 29/37
26/30 é um caso do quadro de segundo tipo;
a unidade de decodificação é ainda configurada para:
se for determinado que o fluxo de bits de Enésimo quadro é o quadro de primeiro tipo, decodificar o fluxo de bits de Enésimo quadro para obter um conjunto de parâmetros estéreos com Enésimo quadro; ou se for determinado que o fluxo de bits de Enésimo quadro é o quadro de segundo tipo , quando o fluxo de bits de Enésimo quadro é o quadro de terceiro, decodificar o fluxo de bits de Enésimo quadro para obter um conjunto de parâmetros estéreos do Enésimo quadro ou, quando o fluxo de bits do Enésimo quadro é o quadro de quarto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de um quadro precedendo o conjunto de parâmetros estéreos do Enésimo quadro e obter o conjunto de parâmetros estéreos do Enésimo quadro de acordo com os conjuntos de parâmetros estéreos do quadro k baseado em um quarto algoritmo predeterminado, em que k é um número inteiro positivo maior do que 0, e pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos com Enésimo quadro é usado pelo decodificador para restaurar o sinal downmixedde Enésimo quadro para os sinais de áudio de Enésimo quadro baseado no terceiro algoritmo predeterminado; e o decodificador compreende ainda uma unidade de restauração de sinal, em que a unidade de restauração de sinal é configurada para restaurar o sinal downmixed de Enésimo quadro aos sinais de áudio de Enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos do Enésimo quadro baseado no terPetição 870190074232, de 02/08/2019, pág. 30/37
27/30 ceiro algoritmo.
27. Decodificador de acordo com a reivindicação 23, caracterizado pelo fato de que um quadro de quinto tipo compreende um sinal downmixed e um conjunto de parâmetros estéreos, um quadro do sexto tipo compreende um sinal downmixed, mas não compreende um conjunto de parâmetros estéreos , cada um do quadro de quinto tipo e o quadro de sexto tipo é um caso do quadro de primeiro tipo, e o quadro de segundo tipo não compreende nem um sinal downmixed nem um conjunto de parâmetros estéreos;
a unidade de decodificação é ainda configurada para:
se for determinado que o fluxo de bits de Enésimo quadro é o quadro do primeiro tipo, quando o fluxo de bits de Enésimo quadro for do quadro de quinto tipo, decodificar o fluxo de bits de Enésimo quadro para obter um conjunto de parâmetros estéreos de Enésimo quadro; ou, quando o fluxo de bits de Enésimo quadro for do quadro de sexto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetro estéreo de um quadro precedendo o conjunto de parâmetro estéreo do Enésimo quadro e obter o conjunto de parâmetro estéreo de Enésimo quadro de acordo com os conjuntos de parâmetros estéreos do quadro k baseado em um quarto algoritmo predeterminado; ou se for determinado que o fluxo de bits de Enésimo quadro é o quadro de segundo tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de um quadro precedendo o conjunto de parâmetros estéreos de Enésimo quadro e obter o conjunto de parâmetros estéreos com Enésimo quadro de acordo com os conjuntos de parâmetros estéreos do quadro k baseado em um quarto algoritmo predeterminado, em que
Petição 870190074232, de 02/08/2019, pág. 31/37
28/30 pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos com Enésimo quadro é usado pelo decodificador para restaurar o sinal downmixedde Enésimo quadro para os sinais de áudio de Enésimo quadro com base no terceiro algoritmo predeterminado e k é um número inteiro positivo maior do que 0; e o decodificador compreende ainda uma unidade de restauração de sinal, em que a unidade de restauração de sinal é configurada para restaurar o sinal downmixed de Enésimo quadro aos sinais de áudio de Enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo do Enésimo quadro baseado no terceiro algoritmo.
28. Decodificador de acordo com a reivindicação 23, caracterizado pelo fato de que um quadro de quinto tipo compreende tanto um sinal downmixed como um conjunto de parâmetros estéreos, um quadro do sexto tipo compreende um sinal downmixed, mas não compreende um conjunto de parâmetros estéreos,cada um do quadro de quinto tipo e o quadro de sexto tipo é um caso do quadro de primeiro tipo, um quadro de terceiro tipo compreende um conjunto de parâmetros estéreos, mas não compreende um sinal downmixed, um quadro de quarto tipo não compreende nenhum sinal de downmixed nem um conjunto de parâmetros estéreo e cada um dos quadros do terceiro tipo e de quarto tipo é um caso do quadro do segundo tipo;
a unidade de decodificação é ainda configurada para:
se for determinado que o fluxo de bits de Enésimo quadro é o quadro de primeiro tipo, quando o fluxo de bits de Enésimo quadro for do quadro de quinto tipo, decodificar o fluxo de bits de Enésimo quadro para obter um conjunto de parâmetros estéreos de Enésimo quadro; ou, quando o fluxo de bits de Enésimo quadro for do quadro de sexto tipo, determinar, de acordo com uma segunda regra predefi
Petição 870190074232, de 02/08/2019, pág. 32/37
29/30 nida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de quadro precedendo o conjunto de parâmetros estéreos do Enésimo quadro e obter o conjunto de parâmetro estéreo de Enésimo quadro de acordo com os conjuntos de parâmetros estéreos do quadro k baseado em um quarto algoritmo predeterminado; ou se for determinado que o fluxo de bits de Enésimo quadro é o quadro de segundo tipo, quando o fluxo de bits de Enésimo quadro é o quadro de terceiro tipo, decodificar o fluxo de bits de Enésimo quadro para obter um conjunto de parâmetros estéreos do Enésimo quadro ou, quando o fluxo de bits de Enésimo quadro é o quadro de quarto tipo, determinar, de acordo com uma segunda regra predefinida, conjuntos de parâmetros estéreos de quadro k em pelo menos um conjunto de parâmetros estéreos de um quadro precedendo o conjunto de parâmetros estéreos de Enésimo quadro e obter o conjunto de parâmetros estéreos do Enésimo quadro de acordo com os conjuntos de parâmetros estéreos do quadro k baseado em um quarto algoritmo predeterminado, em que pelo menos um parâmetro estéreo no conjunto de parâmetros estéreos com Enésimo quadro é usado pelo decodificador para restaurar o sinal downmixedde Enésimo quadro para os sinais de áudio de Enésimo quadro com base no terceiro algoritmo predeterminado e k é um número inteiro positivo maior do que 0; e o decodificador compreende ainda uma unidade de restauração de sinal, em que a unidade de restauração de sinal é configurada para restaurar o sinal downmixed de Enésimo quadro aos sinais de áudio de Enésimo quadro de acordo com pelo menos um parâmetro estéreo no conjunto de parâmetro estéreo do Enésimo quadro baseado no terceiro algoritmo.
Petição 870190074232, de 02/08/2019, pág. 33/37
30/30
29. Sistema de codificação e decodificação caracterizado pelo fato de que compreende o codificador como definido em qualquer uma das reivindicações 15 a 22 e o decodificador como definido em qualquer uma das reivindicações 23 a 28.
BR112019005983-0A 2016-09-28 Método de processamento de sinal de áudio de multicanais, codificador, decodificador e sistema de codificação e decodificação BR112019005983B1 (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2016/100617 WO2018058379A1 (zh) 2016-09-28 2016-09-28 一种处理多声道音频信号的方法、装置和系统

Publications (2)

Publication Number Publication Date
BR112019005983A2 true BR112019005983A2 (pt) 2019-10-01
BR112019005983B1 BR112019005983B1 (pt) 2024-03-26

Family

ID=

Also Published As

Publication number Publication date
CN117351966A (zh) 2024-01-05
US20190221219A1 (en) 2019-07-18
EP3511934A1 (en) 2019-07-17
CN117476018A (zh) 2024-01-30
MX2019003417A (es) 2019-10-07
US10593339B2 (en) 2020-03-17
CN117392988A (zh) 2024-01-12
JP2019533189A (ja) 2019-11-14
US10984807B2 (en) 2021-04-20
US20200273468A1 (en) 2020-08-27
EP3511934A4 (en) 2019-08-14
EP3511934B1 (en) 2021-04-21
KR20210111898A (ko) 2021-09-13
KR20220053030A (ko) 2022-04-28
WO2018058379A1 (zh) 2018-04-05
EP3910629A1 (en) 2021-11-17
CN117351965A (zh) 2024-01-05
KR102387162B1 (ko) 2022-04-14
US11922954B2 (en) 2024-03-05
US20210312932A1 (en) 2021-10-07
CN108140393A (zh) 2018-06-08
CN108140393B (zh) 2023-10-20
JP6790251B2 (ja) 2020-11-25
KR102480710B1 (ko) 2022-12-22
KR20190052122A (ko) 2019-05-15

Similar Documents

Publication Publication Date Title
RU2696465C2 (ru) Аудиокодер и аудиодекодер с метаданными сведений о программе или структуры вложенных потоков
KR101276849B1 (ko) 오디오 신호의 처리 방법 및 장치
US9324329B2 (en) Method for parametric spatial audio coding and decoding, parametric spatial audio coder and parametric spatial audio decoder
US11922954B2 (en) Multichannel audio signal processing method, apparatus, and system
BR112016001248B1 (pt) Decodificador de áudio de múltiplos canais e método para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada
WO2006058590A1 (en) Interpolation and signalling of spacial reconstruction parameters for multichannel coding and decoding of audio sources
US9275646B2 (en) Method for inter-channel difference estimation and spatial audio coding device
JP2020516955A (ja) マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ
BR112015010023B1 (pt) Codificador de áudio e método para codificar um sinal de áudio
JP2017058696A (ja) インターチャネル差分推定方法及び空間オーディオ符号化装置
BR112019005983B1 (pt) Método de processamento de sinal de áudio de multicanais, codificador, decodificador e sistema de codificação e decodificação
WO2024052499A1 (en) Decoder and decoding method for discontinuous transmission of parametrically coded independent streams with metadata

Legal Events

Date Code Title Description
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B350 Update of information on the portal [chapter 15.35 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 28/09/2016, OBSERVADAS AS CONDICOES LEGAIS