BR112019023204A2 - parâmetros estéreo para decodificação estéreo - Google Patents

parâmetros estéreo para decodificação estéreo Download PDF

Info

Publication number
BR112019023204A2
BR112019023204A2 BR112019023204A BR112019023204A BR112019023204A2 BR 112019023204 A2 BR112019023204 A2 BR 112019023204A2 BR 112019023204 A BR112019023204 A BR 112019023204A BR 112019023204 A BR112019023204 A BR 112019023204A BR 112019023204 A2 BR112019023204 A2 BR 112019023204A2
Authority
BR
Brazil
Prior art keywords
channel
value
decoded
generate
stereo parameter
Prior art date
Application number
BR112019023204A
Other languages
English (en)
Inventor
Subrahmanyam Chandra Sekhar Chebiyyam Venkata
Atti Venkatraman
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of BR112019023204A2 publication Critical patent/BR112019023204A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/05Generation or adaptation of centre channel in multi-channel audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Error Detection And Correction (AREA)

Abstract

a presente invenção refere-se a um aparelho que inclui um receptor e um decodificador. o receptor é configurado para receber um fluxo de bits que inclui um canal médio codificado e um valor quantizado representando um deslocamento entre um canal de referência associado com um codificador e um canal alvo associado com o codificador. o valor quantizado baseia-se em um valor do deslocamento. o valor do deslocamento é associado com o codificador e tem uma precisão maior do que o valor quantizado. o decodificador é configurado para decodificar o canal médio codificado para gerar um canal médio decodificado e para gerar um primeiro canal com base no canal médio decodificado. o decodificador é ainda configurado para gerar um segundo canal com base no canal médio decodificado e no valor quantizado. o primeiro canal corresponde ao canal de referência e o segundo canal corresponde ao canal alvo.

Description

PARÂMETROS ESTÉREO PARA DECODIFICAÇÃO ESTÉREO
I. Reivindicação de Prioridade
[0001] O presente pedido reivindica o beneficio de prioridade do Pedido de Patente Provisório dos EUA N° . 62/505, 041, depositado era 11 de maio de 2017, intitulado STEREO PARAMETERS FOR STEREO CODING e Pedido de Patente Não Provisório dos EUA N°. 15/962,834, depositado eia 25 de abril de 2018, intitulado STEREO PARAMETERS FOR STEREO CODING, de propriedade coiaura, o conteúdo de cada ura dos pedidos mencionados acima é aqui expressamente incorporado por referência, em sua totalidade.
II. Campo
[0002] A presente invenção refere-se, de forma geral, à decodificação de sinais de áudio.
III. Descrição de Técnica. Relacionada
[0003] Os avanços da tecnologia resultaram em dispositivos de computação menores e mais potentes. Por exemplo, atualmente existe uma variedade de dispositivos de computação pessoal portáteis, incluindo telefones sem. fio, tais como celulares e smartphones, tablets e laptops que são pequenos, leves e fáceis de transportar pelos usuários. Esses dispositivos podem comunicar pacotes de voz e dados através de redes sem fio. Além disso, muitos desses dispositivos incorporam funcionalidades adicionais, tais como uma câmera fotográfica digital, uma câmera de video digital, um gravador digital e um reprodutor de arquivos de áudio. Além, disso, esses dispositivos podem processar instruções executáveis, incluindo aplicativos de software, tais como um aplicativo de navegador da web, que pode ser
Petição 870190112962, de 05/11/2019, pág. 6/134
2/105 usado para acessar a Internet. Assim, esses dispositivos podem usar recursos computacionais significativos.
[0004] Um dispositivo de computação pode incluir ou pode ser acoplado a múltiplos microfones para receber sinais de áudio. Geralmente, uma fonte sonora está mais próxima a um primeiro microfone do que a um segundo microfone dos múltiplos microfones. Por conseguinte, um. segundo sinal de áudio recebido do segundo microfone pode ser atrasado em relação a um primeiro sinal de áudio recebido do primeiro microfone devido às respectivas distâncias dos microfones da fonte sonora. Em outras implementações, o primeiro sinal de áudio pode ser atrasado com relação ao segundo sinal de áudio. Em codificação estéreo, sinais de áudio dos microfones podem. ser codificados para, gerar um sinal de canal médio e um ou mais sinal de canal lateral. O sinal de canal médio pode corresponder a uma soma do primeiro sinal de áudio e do segundo sinal de áudio. Um sinal de canal lateral pode corresponder a uma diferença entre o primeiro sinal de áudio e o segundo sinal de áudio. O primeiro sinal de áudio pode não ser alinhado com o segundo sinal de áudio devido ao atraso na recepção do segundo sinal de áudio em. relação ao primeiro sinal de áudio. G atraso pode ser indicado por ura valor de deslocamento codificado (por exeraplo, ura parâmetro estéreo) que é transmitido a um decodificador. O alinhamento preciso do primeiro sinal de áudio com o segundo sinal de áudio permite codificação eficiente para transmissão para, o decodificador. No entanto, a transmissão de dados de alta precisão que indicam o alinhamento dos
Petição 870190112962, de 05/11/2019, pág. 7/134
3/105 sinais de áudio utiliza recursos de transmissão elevados em comparação com a transmissão de dados de baixa precisão. Outros parâmetros estéreo indicativos das características entre o primeiro e o segundo sinal de áudio podem também ser codificados e transmitidos para o decodificador.
[0005] O decodificador pode reconstruir o primeiro e segundo sinais de áudio com base pelo menos no sinal de canal médio e nos parâmetros estéreo que são recebidos no decodificador através de um fluxo de bits que inclui uma sequência de quadros. A precisão no decodificador durante a reconstrução de sinal de áudio pode ser com base na precisão do codificador. Por exemplo, o valor de deslocamento de alta precisão codificado pode ser recebido no decodificador e pode permitir ao decodificador reproduzir o atraso em versões reconstruídas do primeiro sinal de áudio e do segundo sinal de áudio com uma alta precisão. Se o valor de deslocamento estiver indisponível no decodif icador, tal como quando um. quadro de dados transmitidos através do fluxo de bits é corrompido devido a. condições de transmissão ruidosas, o valor de deslocamento pode ser requerido e retransmitido ao decodificador para permitir reprodução precisa do atraso entre os sinais de áudio. Por exemplo, a precisão do decodificador na reprodução do atraso pode exceder uma limitação de perceptividade audível de seres humanos para perceber uma variação no atraso.
IV. Sumário
[0006] De acordo com uma implementação da presente invenção, um aparelho inclui um receptor
Petição 870190112962, de 05/11/2019, pág. 8/134
4/105 configurado para receber pelo menos uma porção de um fluxo de bits. O fluxo de bits inclui um primeiro quadro e um. segundo quadro. O primeiro quadro inclui uma. primeira, porção de um canal médio e um primeiro valor de um parâmetro estéreo, e o segundo quadro inclui uma segunda porção do canal médio e um. segundo valor do parâmetro estéreo. O aparelho também inclui um decodificador configurado para decodificar a primeira porção do canal médio para gerar uma primeira porção de um canal médio decodificado. 0 decodificador é também configurado para gerar uma primeira porção de um canal esquerdo com base pelo menos na primeira porção do canal médio decodificado e no primeiro valor do parâmetro estéreo e para gerar uma primeira porção de um canal direito com base pelo menos na. primeira, porção do canal médio decodificado e no primeiro valor do parâmetro estéreo. O decodificador é ainda configurado para, em resposta ao segundo quadro estar indisponível para operações de decodificação, gerar uma segunda porção do canal esquerdo e uma segunda porção do canal direito com base pelo menos no primeiro valor do parâmetro estéreo. A segunda porção do canal esquerdo e a segunda porção do canal direito correspondem a. uma versão decodificada do segundo quadro.
[0007] De acordo cora outra implementação, ura método de decodificação de um sinal inclui receber pelo menos uma porção de um fluxo de bits. O fluxo de bits inclui um primeiro quadro e um segundo quadro. O primeiro quadro inclui uma. primeira porção de um canal médio e um primeiro valor de um parâmetro estéreo, e o segundo quadro
Petição 870190112962, de 05/11/2019, pág. 9/134
5/105 inclui uma segunda porção do canal médio e um segundo valor do parâmetro estéreo. 0 método também inclui decodificar a primeira porção do canal médio para gerar uma primeira porção de um canal médio decodificado. 0 método ainda inclui gerar uma primeira porção de um canal esquerdo com base pelo menos na primeira porção do canal médio decodificado e no primeiro valor do parâmetro estéreo e gerar uma primeira porção de um canal direito com base pelo menos na primeira porção do canal médio decodificado e no primeiro valor do parâmetro estéreo. 0 método também inclui, em. resposta, ao segundo quadro estar indisponível para operações de decodificação, gerar uma segunda porção do canal esquerdo e uma segunda porção do canal direito com base pelo menos no primeiro valor do parâmetro estéreo. A segunda porção do canal esquerdo e a segunda porção do canal direito correspondem a uma versão decodificada do segundo quadro.
[0008] De acordo com outra implementação, um. meio legível por computador não transitório inclui instruções que, quando executadas por um processador dentro de um decodificador, levam o processador a realizar operações incluindo receber pelo menos uma. porção de um fluxo de bits. 0 fluxo de bits inclui um primeiro quadro e um segundo quadro. O primeiro quadro inclui uma primeira porção de um canal médio e um primeiro valor de um parâmetro estéreo, e o segundo quadro inclui uma segunda porção do canal médio e um. segundo valor do parâmetro estéreo. As operações também incluem decodificar a primeira porção do canal médio para gerar uma primeira porção de um
Petição 870190112962, de 05/11/2019, pág. 10/134
6/105 canal médio decodificado. As operações ainda incluem gerar uma primeira porção de um canal esquerdo com base pelo menos na primeira, porção do canal médio decodificado e no primeiro valor do parâmetro estéreo e gerar uma primeira porção de um canal direito com base pelo menos na primeira porção do canal médio decodificado e no primeiro valor do parâmetro estéreo. As operações também, incluem, em. resposta ao segundo quadro estar indisponível para operações de decodificação, gerar uma segunda porção do canal esquerdo e uma segunda porção do canal direito com. base pelo menos no primeiro valor do parâmetro estéreo. A segunda porção do canal esquerdo e a segunda porção do canal direito correspondem a uma versão decodificada do segundo quadro.
[0009] De acordo com outra implementação, um aparelho inclui meios para receber pelo menos uma porção de um fluxo de bits. O fluxo de bits inclui um primeiro quadro e um segundo quadro. Q primeiro quadro inclui uma primeira porção de um. canal médio e um primeiro valor de um parâmetro estéreo, e o segundo quadro inclui uma segunda, porção do canal médio e um segundo valor do parâmetro estéreo. O aparelho também inclui meios para decodificar a primeira porção do canal médio para gerar uma. primeira, porção de um. canal médio decodificado. O aparelho ainda inclui meios para gerar uma primeira porção de um canal esquerdo com base pelo menos na primeira porção do canal médio decodificado e no primeiro valor do parâmetro estéreo e meios para gerar uma primeira porção de um. canal direito com base pelo menos na primeira porção do canal médio decodificado e no primeiro valor do parâmetro estéreo. O
Petição 870190112962, de 05/11/2019, pág. 11/134
7/105 aparelho também inclui meios para gerar, em resposta ao segundo quadro estar indisponível para operações de decodificação, uma segunda, porção do canal esquerdo e uma segunda porção do canal direito com base pelo menos no primeiro valor do parâmetro estéreo. A segunda porção do canal esquerdo e a segunda, porção do canal direito correspondem a uma versão decodificada do segundo quadro.
[0010] De acordo com outra implementação, um aparelho inclui um receptor configurado para receber pelo menos uma porção de um fluxo de bits de um codificador. 0 fluxo de bits inclui um primeiro quadro e um segundo quadro. O primeiro quadro inclui uma primeira porção de um canal médio e um primeiro valor de um parâmetro estéreo. O segundo quadro inclui uma. segunda porção do canal médio e um segundo valor do parâmetro estéreo. G aparelho também inclui um decodificador configurado para decodificar a primeira porção do canal médio para gerar uma primeira porção de um canal médio decodificado. O decodificador é também configurado para realizar uma operação de transformação na primeira porção do canal médio decodificado para gerar uma primeira porção de um canal médio de domínio de frequência decodificado. O decodificador é ainda configurado para fazer upmix da primeira porção do canal médio de domínio de frequência decodificado para gerar uma primeira porção de um canal de domínio de frequência esquerdo e uma primeira porção de um canal de domínio de frequência, direito. O decodificador é também configurado para, gerar uma primeira, porção de um. canal esquerdo com base pelo menos na primeira porção do
Petição 870190112962, de 05/11/2019, pág. 12/134
8/105 canal de domínio de frequência esquerdo e no primeiro valor do parâmetro estéreo. 0 decodificador é ainda configurado para gerar uma. primeira porção de um. canal direito com base pelo menos na primeira porção do canal de domínio de frequência direito e no primeiro valor do parâmetro estéreo. O decodificador é também configurado para determinar que o segundo quadro está indisponível para operações de decodificação. O decodificador é ainda configurado para gerar, com base pelo menos no primeiro valor do parâmetro estéreo, uma. segunda porção do canal esquerdo e uma segunda porção do canal direito em resposta, à determinação de que o segundo quadro está indisponível. A segunda porção do canal esquerdo e a segunda porção do canal direito correspondem a. uma versão decodificada do segundo quadro.
[0011] De acordo cora outra implementação, um método de decodificação de um sinal inclui receber, em um decodificador, pelo menos uma porção de um fluxo de bits de um codificador. O fluxo de bits inclui um primeiro quadro e um segundo quadro. O primeiro quadro inclui uma primeira porção de um canal médio e um primeiro valor de um parâmetro estéreo. O segundo quadro inclui uma segunda, porção do canal médio e um segundo valor do parâmetro estéreo. O método também inclui decodificar a primeira porção do canal médio para gerar uma primeira porção de um canal médio decodificado. O método ainda inclui realizar uma operação de transformação na primeira porção do canal médio decodificado para, gerar uma primeira, porção de um canal médio de domínio de frequência decodificado. 0 método
Petição 870190112962, de 05/11/2019, pág. 13/134
9/105 também inclui fazer upmix da primeira porção do canal médio de domínio de frequência decodificado para gerar uma primeira porção de um canal de domínio de frequência, esquerdo e uma primeira porção de um canal de domínio de frequência direito. O método ainda inclui gerar uma primeira porção de um canal esquerdo com. base pelo menos na. primeira, porção do canal de domínio de frequência, esquerdo e no primeiro valor do parâmetro estéreo. O método ainda inclui gerar uma primeira porção de um canal direito com base pelo menos na primeira porção do canal de domínio de frequência. direito e no prim.ei.ro valor do parâmetro estéreo. 0 método também inclui determinar que o segundo quadro está indisponível para operações de decodificação. 0 método ainda inclui gerar, com base pelo menos no primeiro valor do parâmetro estéreo, uma segunda porção do canal esquerdo e uma segunda porção do canal direito em resposta à determinação de que o segundo quadro está indisponível. A segunda porção do canal esquerdo e a segunda, porção do canal direito correspondem a. uma versão decodificada do segundo quadro.
[0012] De acordo com outra implementação, um meio legível por computador não transitório inclui instruções que, quando executadas por um processador dentro de um decodificador, levam o processador a realizar operações incluindo receber pelo menos uma porção de um fluxo de bits de um codificador. 0 fluxo de bits inclui um primeiro quadro e um segundo quadro. 0 primeiro quadro inclui uma. primeira, porção de um. canal médio e um. primeiro valor de um parâmetro estéreo. 0 segundo quadro inclui uma segunda
Petição 870190112962, de 05/11/2019, pág. 14/134
10/105 porção do canal médio e um segundo valor do parâmetro estéreo. As operações também incluem decodificar a primeira porção do canal médio para gerar uma primeira porção de um canal médio decodificado. As operações ainda incluem realizar uma operação de transformação na primeira porção do canal médio decodificado para gerar uma primeira porção de um. canal médio de domínio de frequência decodificado. As operações também incluem fazer upmix da primeira porção do canal médio de domínio de frequência decodificado para gerar uma primeira porção de um canal de domínio de frequência, esquerdo e uma. primeira porção de um. canal de domínio de frequência direito. As operações ainda incluem gerar uma primeira porção de um canal esquerdo com base pelo menos na primeira porção do canal de domínio de frequência esquerdo e no primeiro valor do parâmetro estéreo. As operações ainda incluem gerar uma primeira porção de um canal direito com base pelo menos na primeira porção do canal de domínio de frequência direito e no primeiro valor do parâmetro estéreo. As operações também incluem determinar que o segundo quadro está indisponível para operações de decodificação. As operações ainda incluem gerar, com base pelo menos no primeiro valor do parâmetro estéreo, uma. segunda, porção do canal esquerdo e uma segunda porção do canal direito era resposta à determinação de que o segundo quadro està indisponível. A segunda porção do canal esquerdo e a segunda porção do canal direito correspondem a uma versão decodificada do segundo quadro.
[0013] De acordo com outra. implementação, um aparelho inclui meios para receber pelo menos uma porção de
Petição 870190112962, de 05/11/2019, pág. 15/134
11/105 um fluxo de bits de um codificador. O fluxo de bits inclui um primeiro quadro e um. segundo quadro. O primeiro quadro inclui uma primeira porção de um canal médio e um primeiro valor de um parâmetro estéreo. O segundo quadro inclui uma segunda porção do canal médio e um segundo valor do parâmetro estéreo. O aparelho também inclui meios para decodificar a primeira porção do canal médio para gerar uma primeira porção de um canal médio decodificado. O aparelho também inclui meios para realizar uma operação de transformação na primeira. porção do canal médio decodificado para, gerar uma primeira, porção de um canal médio de domínio de frequência decodificado. O aparelho também inclui meios para fazer upmix da primeira porção do canal médio de domínio de frequência decodificado para gerar uma. primeira, porção de um canal de domínio de frequência esquerdo e uma primeira porção de um canal de domínio de frequência direito. O aparelho também inclui meios para gerar uma primeira porção de um. canal esquerdo com base pelo menos na primeira porção do canal de domínio de frequência esquerdo e no primeiro valor do parâmetro estéreo. O aparelho também inclui meios para gerar uma primeira porção de um canal direito com base pelo menos na primeira, porção do canal de domínio de frequência direito e no primeiro valor do parâmetro estéreo. O aparelho também inclui meios para determinar que o segundo quadro está indisponível para operações de decodificação. O aparelho também inclui meios para, gerar, com base pelo menos no primeiro valor do parâmetro estéreo, uma segunda, porção do canal esquerdo e uma segunda porção do canal direito em
Petição 870190112962, de 05/11/2019, pág. 16/134
12/105 resposta a uma determinação de que o segundo quadro está indisponível. A segunda porção do canal esquerdo e a segunda porção do canal direito correspondem a uma versão decodificada do segundo quadro.
[0014] De acordo com outra implementação, um aparelho inclui um receptor e um decodificador. O receptor é configurado para, receber um. fluxo de bits que inclui um canal médio codificado e ura valor quantizado representando um deslocamento entre um canal de referência associado com um codificador e um canal alvo associado com o codificador. O valor quantizado baseia-se em. um valor do deslocamento. O valor do deslocamento é associado com o codificador e tem uma precisão maior do que o valor quantizado. O decodificador é configurado para decodificar o canal médio codificado para gerar um canal médio decodificado e para gerar um primeiro canal com base no canal médio decodificado. O decodificador é ainda configurado para gerar um segundo canal com. base no canal médio decodificado e no valor quantizado. O primeiro canal corresponde ao canal de referência e o segundo· canal corresponde ao canal
[0015] De acordo com outra implementação, um método de decodificação de um sinal inclui receber, em um. decodificador, um fluxo de bits incluindo um canal médio e um valor quantizado representando um deslocamento entre um canal de referência associado com um codificador e um canal alvo associado com. o codificador. O valor quantizado baseia-se em um valor do deslocamento. G valor é associado com o codificador e tem uma precisão maior do que o valor
Petição 870190112962, de 05/11/2019, pág. 17/134
13/105 quantizado. O método também inclui decodificar o canal médio para gerar um canal médio decodificado. O método ainda inclui gerar um primeiro canal com base no canal médio decodificado e gerar um segundo canal com base no canal médio decodificado e no valor quantizado. O primeiro canal corresponde ao canal de referência e o segundo canal corresponde ao canal alvo.
[0016] De acordo com outra implementação, um meio legível por computador não transitório inclui instruções que, quando executadas por um processador dentro de um decodificador, levam o processador a realizar operações incluindo receber, em um decodificador, um fluxo de bits incluindo um canal médio e um valor quantizado representando um deslocamento entre um canal de referência associado com um codificador e um canal alvo associado com o codificador. 0 valor quantizado baseia-se em um valor do deslocamento. O valor é associado com o codificador e tem uma precisão maior do que o valor quantizado. As operações também incluem decodificar o canal médio para gerar um canal médio decodificado. As operações ainda incluem gerar um primeiro canal com base no canal médio decodificado e gerar um. segundo canal com base no canal médio decodificado e no valor quantizado. O primeiro canal corresponde ao canal de referência e o segundo canal corresponde ao canal alvo.
[0017] De acordo com outra implementação, um aparelho inclui meios para receber, em um. decodificador, um fluxo de bits incluindo um canal médio e um. valor quantizado representando um deslocamento entre um canal de
Petição 870190112962, de 05/11/2019, pág. 18/134
14/105 referência associado com um codificador e um canal alvo associado com o codificador. 0 valor quantizado baseia-se em um valor do deslocamento. O valor é associado com. o codificador e tem uma precisão maior do que o valor quantizado. O aparelho também inclui meios para decodificar o canal médio para, gerar um canal médio decodificado. O aparelho ainda inclui meios para gerar um primeiro canal com base no canal médio decodificado e meios para gerar ura segundo canal com base no canal médio decodificado e no valor quantizado. 0 primeiro canal corresponde ao canal de referência, e o segundo canal corresponde ao canal alvo.
[0018] De acordo com outra implementação, um aparelho inclui um receptor configurado para receber um fluxo de bits de um codificador. O fluxo de bits inclui um canal médio e um. valor quantizado representando um deslocamento entre um canal de referência associado com o codificador e um canal alvo associado com o codificador. O valor quantizado baseia-se em um valor do deslocamento que tem. uma. precisão maior do que o valor quantizado. O aparelho também inclui um decodificador configurado para decodificar o canal médio para gerar um canal médio decodificado. O decodificador é também configurado para realizar uma operação de transformação no canal médio decodificado para gerar um canal médio de domínio de frequência decodificado. O decodificador é ainda configurado para fazer upmix do canal médio de domínio de frequência, decodificado para gerar um primeiro canal de domínio de frequência e um segundo canal de domínio de frequência. O decodificador é também configurado para gerar
Petição 870190112962, de 05/11/2019, pág. 19/134
15/105 um primeiro canal com base no primeiro canal de domínio de frequência. O primeiro canal corresponde ao canal de referência. 0 decodificador é ainda, configurado para, gerar um segundo canal com base no segundo canal de domínio de frequência. O segundo canal corresponde ao canal alvo. O segundo canal de domínio de frequência é deslocado no domínio de frequência pelo valor quantizado se o valor quantizado corresponder a um deslocamento de domínio de frequência, e uma versão de domínio de tempo do segundo canal de domínio de frequência, é deslocado pelo valor quantizado se o valor quantizado corresponder a. um deslocamento de domínio de tempo.
[0019] De acordo com outra implementação, um método inclui receber, em um decodif icador, um. fluxo de bits de um codificador. O fluxo de bits inclui um canal médio e um valor quantizado representando um deslocamento entre um canal de referência associado com o codificador e um. canal alvo associado com o codificador. O valor quantizado baseia-se em. um valor do deslocamento que tem uma precisão maior do que o valor quantizado. O método também inclui decodificar o canal médio para gerar um canal médio decodificado. O método ainda inclui realizar uma. operação de transformação no canal médio decodificado para gerar um canal médio de domínio de frequência decodificado. O método também inclui fazer upmix do canal médio de domínio de frequência decodificado para gerar um primeiro canal de domínio de frequência e um segundo canal de domínio de frequência. O método também inclui gerar um primeiro canal com base no primeiro canal de domínio de
Petição 870190112962, de 05/11/2019, pág. 20/134
16/105 frequência. O primeiro canal corresponde ao canal de referência. O método ainda inclui gerar um segundo canal com base no segundo canal de domínio de frequência. O segundo canal corresponde ao canal alvo. O segundo canal de domínio de frequência é deslocado no domínio de frequência pelo valor quantizado se o valor quantizado corresponder a. um deslocamento de domínio de frequência, e uma versão de domínio de tempo do segundo· canal de domínio de frequência é deslocada pelo valor quantizado se o valor quantizado corresponder a um deslocamento de domínio de tempo.
[0020] De acordo com outra implementação, um meio legível por computador não transitório inclui instruções para decodificar um sinal. As instruções, quando executadas por um processador dentro de um decodificador, levam o processador a realizar operações incluindo receber um fluxo de bits de um codificador. O fluxo de bits inclui um canal médio e um valor quantizado representando um deslocamento entre um canal de referência associado com o codificador e um canal alvo associado com. o codificador. O valor quantizado baseia-se em um valor do· deslocamento que tem uma precisão maior do que o valor quantizado. As operações também incluem decodificar o canal médio para gerar um canal médio decodificado. As operações ainda incluem, realizar uma operação de transformação no canal médio decodificado para gerar um canal médio de domínio de frequência decodificado. As operações também incluem fazer upmix do canal médio de domínio de frequência decodificado para, gerar um primeiro canal de domínio de frequência e um segundo canal de domínio de frequência. As operações também
Petição 870190112962, de 05/11/2019, pág. 21/134
17/105 incluem gerar um primeiro canal com base no primeiro canal de domínio de frequência. O primeiro canal corresponde ao canal de referência. As operações ainda incluem gerar um segundo canal com base no segundo canal de domínio de frequência. O segundo canal corresponde ao canal alvo. O segundo canal de domínio de frequência é deslocado no domínio de frequência pelo valor quantizado se o valor quantizado corresponder a um deslocamento de domínio de frequência, e uma versão de domínio de tempo do segundo canal de domínio de frequência, é deslocado pelo valor quantizado se o valor quantizado corresponder a. um deslocamento de domínio de tempo.
[0021] De acordo com outra implementação, um aparelho inclui meios para receber um fluxo de bits de um codificador. O fluxo de bits inclui um. canal médio e um valor quantizado representando um deslocamento entre um canal de referência associado com o codificador e um canal alvo associado com o codificador. O valor quantizado baseia-se em um. valor do deslocamento que tem uma precisão maior do que o valor quantizado. O aparelho também inclui meios para decodificar o canal médio para gerar um canal médio decodificado. O aparelho também inclui meios para, realizar uma operação de transformação no canal médio decodificado para gerar um canal médio de domínio de frequência decodificado. O aparelho também inclui meios para fazer upmix do canal médio de domínio de frequência decodificado para gerar um primeiro canal de domínio de frequência e um segundo canal de domínio de frequência. G aparelho também inclui meios para gerar um primeiro canal
Petição 870190112962, de 05/11/2019, pág. 22/134
18/105 com base no primeiro canal de domínio de frequência. 0 primeiro canal corresponde ao canal de referência. Ο aparelho também inclui meios para, gerar um. segundo canal com base no segundo canal de domínio de frequência. O segundo canal corresponde ao canal alvo. O segundo canal de domínio de frequência é deslocado no domínio de frequência pelo valor quantizado se o valor quantizado corresponder a um deslocamento de domínio de frequência, e uma versão de domínio de tempo do segundo canal de domínio de frequência é deslocado pelo valor quantizado se o valor quantizado corresponder a. um deslocamento de domínio de tempo.
[0022] Outras implementações, vantagens e recursos da presente invenção se tornarão evidentes após a análise de todo o pedido, incluindo as seguintes seções: Breve Descrição dos Desenhos, Descrição Detalhada e as
Reivindicações.
V. Brers D&scrição dos Desenhos
[0023] A Figura 1 é um diagrama, de blocos de um exemplo ilustrativo particular de um sistema que inclui um decodificador operável para estimar parâmetros estéreo para quadro ausentes e para, decodificar sinais de áudio usando parâmetros estéreo quantizados;
[0024] A Figura 2 é um diagrama ilustrando o decodificador da Figura 1;
[0025] A Figura 3 é um diagrama de um exemplo ilustrativo de parâmetros estéreo preditivos para um quadro ausente em um decodificador;
[0026] A Figura 4A é um exemplo ilustrativo não
Petição 870190112962, de 05/11/2019, pág. 23/134
19/105 limitante de um método de decodificação de um sinal de áudio;
[0027] A Figura 4B é um exemplo ilustrativo não limitante de uma versão mais detalhada do método de decodificação do sinal de áudio da Figura 4A;
[0028] A Figura 5A é outro exemplo ilustrativo não limitante de um método de decodificação de um sinal de áudio;
[0029] A Figura 5B é um exemplo ilustrativo não limitante de uma versão mais detalhada do método de decodificação do sinal de audio da. Figura dA;
[0030] A Figura 6 é um diagrama de blocos de um exemplo ilustrativo particular de um dispositivo que inclui um decodif icador para, estimar parâmetros estéreo para, quadros ausentes e para decodificar sinais de áudio usando parâmetros estéreo quantizados; e
[0031] A Figura 7 é um diagrama de blocos de uma estação de base que é operável para estimar parâmetros estéreo para, quadros ausentes e para, decodificar sinais de áudio usando parâmetros estéreo quantizados.
VI. Descrição Detalhada
[0032] Aspectos particulares da. presente invenção são descritos abaixo com referência aos desenhos. Na descrição, recursos comuns são designados por números de referência comuns. Conforme usado aqui, várias terminologias são usadas com a finalidade de descrever implementações específicas apenas e não se destinam a. limitar as implementações. Por exemplo, as formas singulares um/uma e o/a também pretendem incluir também
Petição 870190112962, de 05/11/2019, pág. 24/134
20/105 as formas plurais, a menos que o contexto indique claramente o contrário. Ainda pode ser entendido que os termos compreende e compreendendo podem ser usados alternadamente com inclui ou incluindo. Além disso, será entendido que o termo em que pode ser usado intercambiavelmente com onde. Como usado aqui, um termo ordinal (por exemplo, primeiro, segundo, terceiro etc.) usado para modificar um elemento, tal como uma estrutura, um componente, uma operação etc., não indica por si só qualquer prioridade ou ordem do elemento em. relação ao outro elemento, mas apenas distingue o elemento de outro elemento com o mesmo nome (mas para uso do termo· ordinal) . Como usado aqui, o termo conjunto refere-se a. um ou mais de um elemento especifico, e o termo pluralidade referese a múltiplos (por exemplo, dois ou mais) de um elemento
GSpGCljZlCO <
[0033] Na presente invenção, termos como determinar, calcular, deslocar, ajustar etc. podem, ser usados para descrever como uma ou mais operações são executadas. Deve-se observar que esses termos não devem ser interpretados como limitantes e outras técnicas podem ser utilizadas para. realizar operações semelhantes. Adicionalmente, conforme referido neste documento, gerar, calcular, usar, selecionar, acessar e determinar podem ser usados de forma intercambiável. Por exemplo, gerar, calcular ou determinar um parâmetro (ou um sinal) pode se referir a. gerar, calcular ou determinar ativamente o parâmetro (ou o sinal) ou pode se referir a usar, selecionar ou acessar o parâmetro (ou sinal) que já
Petição 870190112962, de 05/11/2019, pág. 25/134
21/105 está gerado, tal como por outro componente ou dispositivo.
[0034] Sistemas e dispositivos operáveis para codificar múltiplos sinais de áudio são divulgados. Um dispositivo pode incluir um codificador configurado para codificar os múltiplos sinais de áudio. Os múltiplos sinais de áudio podem ser capturados simultaneamente no tempo usando múltiplos dispositivos de gravação, por exemplo, múltiplos microfones. Em alguns exemplos, os múltiplos sinais de áudio (ou áudio multicanal) podem ser gerados sinteticamente (por exemplo, artificialmente) por multiplexação de vários canais de áudio gravados ao mesmo tempo ou em momentos diferentes. Como exemplos ilustrativos, a gravação ou multiplexação simultânea dos canais de áudio pode resultar em uma configuração de 2 canais (isto é, estéreo: esquerda e direito), uma configuração de 5.1 canais (esquerdo, direito, central, surround esquerdo, surround direito e canais de ênfase de baixa frequência (LEE)), uma. configuração de 7.1 canais, uma configuração de 7.1+4 canais, uma configuração de 22.2 canais ou uma configuração de N canais.
[0035] Os dispositivos de captura de áudio em salas de teleconferência (ou salas de telepresença) podem incluir múltiplos microfones que adquirem áudio espacial. O áudio espacial pode incluir fala, bem como áudio de fundo que é codificado e transmitido. A fala/áudio de uma determinada fonte (por exemplo, um locutor) pode chegar aos múltiplos microfones em diferentes momentos, dependendo de como os microfones são dispostos, bem como onde a fonte (por exemplo, o locutor) está localizada em relação aos
Petição 870190112962, de 05/11/2019, pág. 26/134
22/105 microfones e dimensões da sala. Por exemplo, uma fonte sonora (por exemplo, um. locutor) pode estar mais próximo a um primeiro microfone associado com o dispositivo do que a. um segundo microfone associado com o dispositivo. Dessa forma, um som emitido da fonte sonora pode alcançar o primeiro microfone mais cedo no tempo do que o segundo microfone. O dispositivo pode receber um prim.ei.ro sinal de áudio através do primeiro microfone e pode receber ura segundo sinal de áudio através do segundo microfone.
[0036] Codificação lateral média. (MS) e codificação estéreo paramétrica (PS) são técnicas de codificação estéreo que podem prover maior eficiência em relação às técnicas de codificação dual-mono. Na codificação dual-mono, o canal esquerdo (ou sinal) (L) e o canal (ou sinal) direito (R) são codificados independentemente, sem fazer uso de correlação intercanal. A codificação MS reduz a redundância entre um par de canais L/R correlacionados, transformando o canal esquerdo e o canal direito em. um. canal de soma e um canal de diferença, (por exemplo, um canal lateral) antes da codificação. 0 sinal de soma e o sinal de diferença são formas de onda codificadas ou codificadas com base em um modelo de codificação MS. Relativamente mais bits são gastos no sinal de soma do que no sinal lateral. A codificação PS reduz a redundância em cada sub-banda, transformando os sinais L/R em um sinal de soma e um conjunto de parâmetros laterais. Os parâmetros laterais podem indicar uma diferença de intensidade (IID), uma diferença de fa.se (IPD), uma diferença de tempo intercanal (1TD),
Petição 870190112962, de 05/11/2019, pág. 27/134
23/105 ganhos de previsão lateral ou residual etc. O sinal de soma é uma forma de onda codificada e transmitida junto com. os parâmetros laterais. Em. um sistema, híbrido, o canal lateral pode ser a forma de onda codificada nas bandas inferiores (por exemplo, menos de 2 kilohertz (kHz)) e PS codificada nas bandas superiores (por exemplo, maior ou igual a 2 kHz), em. que a preservação de fase intercanal é perceptualmente menos critica. Em algumas implementações, a codificação PS pode ser usada nas bandas inferiores também para, reduzir a redundância intercanal antes da. codificação de forma de onda.
[003'7] A codificação MS e a codificação PS podem ser feitas no domínio da frequência, no domínio de subbanda ou no domínio de tempo. Em alguns exemplos, o canal esquerdo e o canal direito podem não estar correlacionados. Por exemplo, o canal esquerdo e o canal direito podem incluir sinais sintéticos não correlacionados. Quando o canal esquerdo e o canal direito não estão correlacionados, a eficiência de codificação da codificação MS, da. codificação PS, ou ambas, pode se aproximar da eficiência de codificação da codificação dual-mono.
[0038] Dependendo da configuração da gravação, pode haver um. deslocamento temporal entre um canal esquerdo e um direito do canal, bem como outros efeitos espaciais, tais como eco e reverberação de sala. Se o deslocamento temporal e a incompatibilidade de fase entre os canais não forem compensados, o canal de soma, e o canal de diferença, podem, conter energias comparáveis, reduzindo os ganhos de codificação associados às técnicas de MS ou PS. A redução
Petição 870190112962, de 05/11/2019, pág. 28/134
24/105 nos ganhos de codificação pode ser baseada na quantidade de deslocamento temporal (ou de fase) . As energias comparáveis do sinal de soma e do sinal de diferença podem limitar o uso da codificação MS em determinados quadros em que os canais são temporariamente deslocados, mas são altamente correlacionados. Na codificação estéreo, um canal médio (por exemplo, um canal de soma) e um canal lateral (por exemplo, um canal de diferença) podem ser gerados com base na seguinte fórmula:
M=(L+R/2, S=(L-R)/2 (Formula 1)
[0039] em que M corresponde ao canal médio, S corresponde ao canal lateral, L corresponde ao canal esquerdo, e R corresponde ao canal direito.
[0040] em alguns cases, o canal médio e o canal lateral podem ser gerados com base na seguinte Fórmula:
M=c(L+R), S=c(L-R) Fórmula 2
[0041] em que c corresponde a um valor complexo que é dependente de frequência. A geração do canal médio e do canal lateral com. base na Fórmula 1 ou Fórmula 2 pode ser referida como downmixing. Um processo reverso de geração do canal esquerdo e do canal direito a partir do canal médio e do canal lateral com base na Fórmula 1 ou Fórmula 2 pode ser referido como upmixing.
[0042] Em alguns cases, o canal médio pode ser com base outras fórmulas, tais como:
M~(L+gDR)/2 Fórmula 3
M=giL + g2R Fórmula 4
[0043] em que g2 + g2 = 1,0, e em que gD é um. parâmetro de ganho. Em outros exemplos, o downmix pode ser
Petição 870190112962, de 05/11/2019, pág. 29/134
25/105 realizado em bandas, em que mid(b) ~ CiL(b) + C^RÍb), em que Ci e C2 são números complexos, em que lado (b) = C-lLíb)C4R(b), e em que C3 e C4 são números complexos.
[0044] Uma abordagem ad-hoc usada para escolher entre a codificação MS ou codificação dual-mono para um quadro especifico pode incluir gerar um sinal médio e um sinal lateral, calcular energias do sinal médio e do sinal lateral e determinar se realiza ou não codificação MS com base nas energias. Por exemplo, a codificação MS pode ser realizada em resposta à determinação de que a razão de energias do sinal lateral e do sinal médio é menor do que um limite. Para ilustrar, se um canal direito for deslocado pelo menos pela primeira vez (por exemplo, cerca de 0,001 segundo ou 48 amostras a 48 kHz), uma primeira energia do sinal médio (correspondente a. uma soma do sinal esquerdo e do sinal direito) pode ser comparável para uma segunda energia do sinal lateral (correspondente a uma diferença entre o sinal esquerdo e o sinal direito) para quadros de fala com. voz. Quando a primeira energia é comparável à segunda energia, um número maior de bits pode ser usado para codificar o canal lateral, reduzindo assim a eficiência, de codificação da codificação MS em. relação à codificação dual-mono. A codificação dual-mono pode, portanto, ser usada quando a primeira energia é comparável à segunda energia (por exemplo, quando a razão entre a primeira energia e a segunda energia é maior ou igual ao limite) . Em uma abordagem alternativa, a. decisão entre codificação MS e codificação dual-mono para um quadro especifico pode ser feita com. base em uma comparação de um
Petição 870190112962, de 05/11/2019, pág. 30/134
26/105 limite e valores de correlação cruzada normalizados do canal esquerdo e do canal direito.
[0045] Em alguns exemplos, o codificador pode determinar um valor de incompatibilidade indicativo de uma quantidade de desalinhamento temporal entre o primeiro sinal de áudio e o segundo sinal de áudio. Como usado aqui, um valor de deslocamento temporal, um valor de deslocamento e um valor de incompatibilidade podem ser usados de forma intercambiável. Por exemplo, o codificador pode determinar um valor de deslocamento temporal indicativo de um deslocamento (por exemplo, a. incompatibilidade temporal) do primeiro sinal de áudio relativo ao segundo sinal de áudio. O valor de incompatibilidade temporal pode corresponder a uma quantidade de atraso de tempo entre a recepção do primeiro sinal de áudio no primeiro microfone e a recepção do segundo sinal de áudio no segundo microfone. Além disso, o codificador pode determinar o valor de incompatibilidade temporal em uma base quadro a quadro, por exemplo, com base em cada quadro de fala/áudio de 20 milissegundos (ms). Por exemplo, o valor de incompatibilidade temporal pode corresponder a. uma quantidade de tempo que um segundo quadro do segundo sinal de áudio é atrasado em. relação a um primeiro quadro do primeiro sinal de áudio. Alternativamente, o valor de incompatibilidade temporal pode corresponder a uma quantidade de tempo que o primeiro quadro do primeiro sinal de áudio é atrasado com. relação ao segundo quadro do segundo sinal de áudio.
[0046] Quando a fonte sonora está mais próxima do
Petição 870190112962, de 05/11/2019, pág. 31/134
27/105 primeiro microfone do que o segundo microfone, os quadros do segundo sinal de áudio podem, ser atrasados em relação aos quadros do primeiro sinal de áudio. Nesse caso, o primeiro sinal de áudio pode ser referido como o sinal de áudio de referência ou canal de referência e o segundo sinal de áudio atrasado pode ser referido como o sinal de áudio alvo ou canal alvo. Alternativamente, quando a fonte sonora está mais próxima do segundo microfone do que do primeiro microfone, os quadros do primeiro sinal de áudio podem ser atrasados em relação aos quadros do segundo sinal de áudio. Nesse caso, o segundo sinal de áudio pode ser referido como o sinal de áudio de referência ou canal de referência e o primeiro sinal de áudio atrasado pode ser referido como o sinal de áudio alvo ou canal alvo.
[0047] Dependendo de onde as fontes sonoras (por exemplo, locutores) estiverem localizadas em uma sala de conferência ou telepresença ou de como a posição da fonte sonora (por exemplo, locutor) muda. em. relação aos microfones, o canal de referência e o canal alvo pode mudar de um quadro para outro; da mesma forma, o valor de atraso de tempo também pode mudar de um quadro para outro. No entanto, em algumas implementações, o valor de incompatibilidade temporal sempre pode ser positivo para indicar uma quantidade de atraso do canal alvo em relação ao canal referência. Além disso, o valor de incompatibilidade temporal pode corresponder a um valor de deslocamento não causai, pelo qual o canal alvo atrasado é recuado no tempo, tal que o canal alvo esteja alinhado (por exemplo, maximamente alinhado) com o canal de
Petição 870190112962, de 05/11/2019, pág. 32/134
28/105 referência. O algoritmo de downmix para determinar ο canal médio e o canal lateral pode ser executado no canal de referência e no canal alvo deslocado não causal.
[0048] O codificador pode determinar o valor de incompatibilidade temporal com base no canal de áudio de referência. e em uma pluralidade de valores de incompatibilidade temporal aplicados ao canal de áudio alvo. Por exemplo, um primeiro quadro do canal de áudio de referência, X, pode ser recebido em um primeiro horário (m.i) . Um primeiro quadro específico do canal de áudio alvo, Y, pode ser recebido em um segundo horário (ni) correspondente a um primeiro valor de incompatibilidade temporal, por exemplo, deslocamentol ~ nj-ntj.. Além disso, um segundo quadro do canal de áudio de referência pode ser recebido em um. terceiro horário (m2). Um segundo quadro específico do canal de áudio alvo pode ser recebido em um quarto horário (n?) correspondente a um segundo valor de incompatibilidade temporal, por exemplo, deslocamento! = ri2~m2
[0049] O dispositivo pode executar um algoritmo de enquadramento ou buffering para gerar um quadro (por exemplo, amostras de 20 ms) em uma primeira taxa de amostragem (por exemplo, taxa de amostragem de 32 kHz (ou seja, 640 amostras por quadro)) . O codificador pode, era resposta à determinação de que um primeiro quadro do primeiro sinal de áudio e um segundo quadro do segundo sinal de áudio chegam ao mesmo tempo no dispositivo, estimar um valor de incompatibilidade temporal (por exemplo, deslocamentol) igual a zero amostras. Um canal
Petição 870190112962, de 05/11/2019, pág. 33/134
29/105 esquerdo (por exemplo, correspondente ao primeiro sinal de áudio) e um canal direito (por exemplo, correspondente ao segundo sinal de áudio) podem estar temporariamente alinhados. Em alguns casos, o canal esquerdo e o canal direito, mesmo quando alinhados, podem diferir em energia devido a várias razões (por exemplo, calibraçâo do microfone).
[0050] Em alguns exemplos, o canal esquerdo e o canal direito podem estar temporariamente desalinhados devido a várias razões (por exemplo, uma fonte sonora, tal como um locutor, pode estar mais próxima de um dos microfones do que do outro e os dois microfones pode estar mais distantes do que um limite (por exemplo, de 1 a 20 centímetros). Uma localização da fonte sonora em relação aos microfones pode introduzir atrasos diferentes no canal esquerdo e no canal direito. Além disso, pode haver uma diferença de ganho, uma diferença de energia ou uma diferença de nível entre o canal esquerdo e o canal direito.
[0051] Em alguns exemplos, onde existem mais de dois canais, um canal de referência é selecionado inicia.lm.ente com base nos níveis ou energias dos canais e, posteriormente, refinado com base nos valores de incompatibilidade temporal entre diferentes pares dos canais, por exemplo, tl(ref, ch2) , t2(ref, ch3), t3(ref, ch4), . .., em que chi é o canal de referência inicialmente tl (.) , t2 ( .) etc. são as funções para estimar os valores de incompatibilidade. Se todos os valores de incompatibilidade temporal forem positivos, então, chi é tratado como o canal
Petição 870190112962, de 05/11/2019, pág. 34/134
30/105 de rsf 6Γencra. Se quaiquer um dos valoros do incompatibilidade for urn valor negativo, então, o canal de referência, é reconfigurado para o canal que foi associado a. um valor de incompatibilidade que resultou em um valor negativo, e o processo acima continuará até a melhor seleção (por exemplo, com base no número máximo de canais laterais maximamente descorrelacionante) do canal de referência ser alcançada. Uma histerese pode ser usada para superar qualquer variação repentina na seleção do canal de referência.
[0052] Em. alguns exemplos, o horário de chegada, de sinais de áudio nos microfones de várias fontes sonoras (por exemplo, locutores) pode variar quando os múltiplos locutores estão falando de forma, alternada (por exemplo, sem sobreposição) . Nesse caso, o codificador pode ajustar dinamicamente um valor de incompatibilidade temporal cora base no locutor para identificar o canal de referência. Em alguns outros exemplos, os múltiplos locutores podem, estar falando ao mesmo tempo, o que pode resultar em valores de incompatibilidade temporal varáveis, dependendo de quem é o locutor que fala mais alto, o mais próximo do microfone etc. Nesse caso, a identificação dos canais alvo e de referência pode se basear nos valores de deslocamento temporal variáveis no quadro atual e nos valores de incompatibilidade temporal estimados nos quadros prévios, e se basear na energia ou evolução temporal do primeiro e segundo sinais de áudio.
[0053] Em alguns exemplos, o primeiro sinal de áudio e o segundo sinal de áudio podem ser sintetizados ou
Petição 870190112962, de 05/11/2019, pág. 35/134
31/105 gerados artificialmente quando os dois sinais mostram potencialmente menos (por exemplo, não) correlação. Deve ser entendido que os exemplos aqui descritos são ilustrativos e podem ser instrutivo para determinar um relacionamento entre o primeiro sinal de áudio e o segundo sinal de áudio em situações semelhantes ou diferentes.
[0054] O codificador pode gerar valores de comparação (por exemplo, valores de diferença ou valores de correlação cruzada) com base em uma comparação de um primeiro quadro do primeiro sinal de áudio e uma pluralidade de quadros do segundo sinal de áudio. Cada, quadro da pluralidade de quadros pode corresponder a um valor de incompatibilidade temporal especifico. O codificador pode gerar um primeiro valor de incompatibilidade temporal estimado com base nos valores de comparação. Por exemplo, o primeiro valor de incompatibilidade temporal estimado pode corresponder a um valor de comparação indicando uma. similaridade temporal mais alta, (ou menor diferença) entre o primeiro quadro do primeiro sinal de áudio e um primeiro quadro correspondente do segundo sinal de áudio.
[0055] O codificador pode determinar um valor final de incompatibilidade temporal refinando, em estágios múltiplos, uma série de valores estimados de incompatibilidade temporal. Por exemplo, o codificador pode primeiro estimar um valor de incompatibilidade temporal experimental com base nos valores de comparação gerados a. partir de versões estéreo pré-processadas e reamostradas do primeiro sinal de áudio e do segundo sinal de áudio. O
Petição 870190112962, de 05/11/2019, pág. 36/134
32/105 codificador pode gerar valores de comparação interpelados associados a valores de incompatibilidade temporal próximos ao valor de incompatibilidade temporal experimental estimado. O codificador pode determinar um segundo valor de incompatibilidade temporal interpelado estimado com base nos valores de comparação interpolados. Por exemplo, o segundo valor de incompatibilidade temporal interpolado estimado pode corresponder a ura valor de comparação interpolado especifico que indica uma maior similaridade temporal (ou menor diferença) que os valores de comparação interpolados restantes e o primeiro valor de incompatibilidade teraporal experimental estimado. Se o segundo valor de incompatibilidade temporal interpolado estimado do quadro atual (por exemplo, o primeiro quadro do primeiro sinal de áudio) for diferente do valor de incompatibilidade temporal final de um quadro anterior (por exemplo, um quadro do primeiro sinal de áudio que precede o primeiro quadro), então, o valor de incompatibilidade temporal interpolado do quadro atual ainda é ainda, alterado para melhorar a similaridade temporal entre o primeiro sinal de áudio e o segundo sinal de áudio deslocado. Em particular, um terceiro valor de incompatibilidade temporal alterado estimado pode corresponder a uma medição mais precisa de similaridade temporal pesquisando em torno do segundo valor de incompatibilidade temporal interpolado estimado do quadro atual e o valor de incompatibilidade temporal estimado final do quadro anterior. O terceiro valor de incompatibilidade temporal alterado estimado ainda está
Petição 870190112962, de 05/11/2019, pág. 37/134
33/105 condicionado para estimar o valor de incompatibilidade temporal final, limitando quaisquer alterações espúrias no valor de incompatibilidade temporal entre quadros e ainda controlado para não alternar de um valor de incompatibilidade temporal negativo para um valor de incompatibilidade temporal positivo (ou vice-versa) em dois quadros sucessivos (ou consecutivos), conforme descrito aqui.
[0056] Em alguns exemplos, o codificador pode deixar de alternar entre um valor de incompatibilidade temporal positivo e um. valor de incompatibilidade temporal negativo ou vice-versa em quadros consecutivos ou em quadros adjacentes. Por exemplo, o codificador pode definir o valor de incompatibilidade temporal final para um valor particular (por exemplo, 0) indicando nenhum deslocamento temporal com base no valor de incompatibilidade temporal alterado ou interpolado estimado do primeiro quadro e um. valor de incompatibilidade temporal final ou alterado ou interpolado estimado correspondente em um quadro particular que precede o primeiro quadro. Para ilustrar, o codificador pode definir o valor de incompatibilidade temporal final do quadro atual (por exemplo, o primeiro quadro) para indicar nenhum deslocamento temporal, isto é, deslocamentol = 0, em resposta à determinação de que um do valor de incompatibilidade temporal alterado ou interpolado ou experimental estimado do quadro atual é positivo e o outro do valor de incompatibilidade temporal estimado alterado ou interpolado ou experimental estimado do quadro anterior (por exemplo, o quadro
Petição 870190112962, de 05/11/2019, pág. 38/134
34/105 precedente ao primeiro quadro) é negativo. Alternativamente, o codificador pode também definir o valor de incompatibilidade temporal final do quadro atual (por exemplo, o primeiro quadro) para indicar nenhum deslocamento temporal, isto é, deslocamentol ~ 0, em resposta à determinação de que um do valor de incompatibilidade temporal alterado ou interpolado ou experimental estimado do quadro atual é negativo e o outro do valor de incompatibilidade temporal estimado alterado ou interpolado ou experimental estimado do quadro anterior (por exemplo, o quadro precedente ao primeiro quadro) é positivo.
[0057] O codificador pode selecionar um quadro do primeiro sinal de áudio ou do segundo sinal de áudio como uma referência ou alvo com base no valor de incompatibilidade temporal. Por exemplo, em resposta à determinação de que o valor de incompatibilidade temporal final é positivo, o codificador pode gerar um indicador de sinal ou canal de referência tendo um primeiro valor (por exemplo, 0) indicando que o primeiro sinal de áudio é um sinal de referência e que o segundo sinal de áudio é o sinal alvo. Alternativamente, em resposta à determinação de que o valor de incompatibilidade temporal final é negativo, o codificador pode gerar o indicador de sinal ou canal de referência tendo ura segundo valor (por exemplo, 1) indicando que o segundo sinal de áudio é o sinal de referência e que o primeiro sinal de áudio é o sinal ... Ί ., . ff cl .1. V O »
[0058] O codificador pode estimar um ganho
Petição 870190112962, de 05/11/2019, pág. 39/134
35/105 relativo (por exemplo, um parâmetro de ganho relativo) associado com. o sinal de referência e o sinal alvo deslocado não causai. Por exemplo, em resposta à. determinação de que o valor de incompatibilidade temporal final é positivo, o codificador pode estimar um valor de ganho para, normalizar ou equalizar os níveis de amplitude ou potência do primeiro sinal de áudio relativo ao segundo sinal de áudio que é desviado pelo valor de incompatibilidade temporal não causai (por exemplo, um valor absoluto do valor de incompatibilidade temporal final). Alternativamente, em. resposta à determinação de que o valor de incompatibilidade temporal final é negativo, o codificador pode estimar um valor de ganho para normalizar ou equalizar os níveis de potência ou amplitude do primeiro sinal de áudio deslocado não causai relativo ao segundo sinal de áudio. Em alguns exemplos, o codificador pode estimar um valor de ganho para normalizar ou equalizar os níveis de amplitude ou potência, do sinal de referência relativo ao sinal alvo deslocado não causai. Em outros exemplos, o codificador pode estimar o valor de ganho (por exemplo, um valor de ganho relativo) com base no sinal de referência, relativo ao sinal alvo (por exemplo, o sinal alvo não deslocado).
[0059] O codificador pode gerar pelo menos ura sinal codificado (por exemplo, um sinal médio, um sinal lateral ou ambos) com base no sinal de referência, no sinal alvo, no valor de incompatibilidade temporal não causai, e no parâmetro de ganho relativo. Em. outras implementações, o codificador pode gerar pelo menos um sinal codificado (por
Petição 870190112962, de 05/11/2019, pág. 40/134
36/105 exemplo, um canal médio, um canal lateral, ou ambos) com base no canal de referência e no canal alvo ajustado de incompatibilidade temporal. O sinal lateral pode corresponder a uma diferença entre primeiras amostras do primeiro quadro do primeiro sinal de áudio e amostras selecionadas de um quadro selecionado do segundo sinal de áudio. O codificador pode selecionar o quadro selecionado com base no valor de incompatibilidade temporal final. Menos bits podem ser usados para codificar o sinal de canal lateral devido à diferença reduzida entre as primeiras amostras e as amostras selecionadas em comparação com outras amostras do segundo sinal de áudio que correspondem a um quadro do segundo sinal de áudio que é recebido pelo dispositivo ao mesmo tempo que o primeiro quadro. Um transmissor do dispositivo pode transmitir o pelo menos um sinal codificado, o valor de incompatibilidade temporal não causai, o parâmetro de ganho relativo, o indicador de sinal ou canal de referência, ou uma combinação dos mesmos.
[0060] O codificador pode gerar pelo menos um sinal codificado (por exemplo, um sinal médio, um sinal lateral, ou ambos) com base no sinal de referência, no sinal alvo, no valor de incompatibilidade temporal não causal, no parâmetro de ganho relativo, parâmetros de banda baixa de um quadro particular do primeiro sinal de áudio, parâmetros de banda alta do quadro particular, ou uma combinação dos mesmos. O quadro particular pode preceder o primeiro quadro. Determ.ina.dos parâmetros de banda, baixa, parâmetros de banda, alta, ou uma. combinação dos mesmos, de ura ou mais quadros prévios podem ser usados para codificar
Petição 870190112962, de 05/11/2019, pág. 41/134
37/105 um sinal médio, um sinal lateral, ou ambos, do primeiro quadro. A codificação do sinal médio, do sinal lateral, ou ambos, com base nos parâmetros de banda baixa, nos parâmetros de banda alta, ou uma combinação dos mesmos, pode melhorar as estimativas do valor de incompatibilidade temporal não causai e parâmetro de ganho relativo intercanal. Os parâmetros de banda baixa, os parâmetros de banda alta, ou uma combinação dos mesmos, podem incluir um parâmetro de pitch, um parâmetro de voz, um parâmetro de tipo de codificador, um parâmetro de energia de banda baixa, um. parâmetro de energia de banda alta, um parâmetro de inclinação, um parâmetro de ganho de pitch, ura parâmetro de ganho FCB, um parâmetro de modo de codificação, um parâmetro de atividade de voz, um parâmetro de estimativa de ruído, um parâmetro de razão sinal-ruído, um parâmetro de formantes, um parâmetro de decisão de fala/música, o deslocamenco nao causai, o parametro de g’anho intsrcarial ou uma combinação dos mesmos. Um transmissor do dispositivo pode transmitir pelo menos um sinal codificado, o valor de incompatibilidade temporal não causai, o parâmetro de ganho relativo, o indicador de canal de referência (ou sinal) ou uma combinação dos mesmos. Na. presente invenção, termos como determinar, calcular, deslocar, ajustar etc. podem ser usados para descrever como ura ou mais operações são realizadas. Deve-se notar que esses termos não devem ser interpretados como limitantes e que outras técnicas podem ser utilizadas para realizar operações semelhantes.
[0061] De acordo com algumas implementações, o valor de incompatibilidade temporal final (por exemplo, um
Petição 870190112962, de 05/11/2019, pág. 42/134
38/105 valor de deslocamento) é um valor não quantizado que indicando o deslocamento verdadeiro entre um canal alvo e um canal de referência. Embora todos os valores digitais sejam quantizados devido à precisão fornecida pelo sistema que armazena ou usa o valor digital, como usado aqui, os valores digitais são quantizados se gerados por uma operação de quantização para reduzir uma precisão do valor digital (por exemplo, para reduzir um intervalo ou largura de banda associado ao valor digital) e são não quantizados caso contrário. Como um exemplo não limitante, o primeiro sinal de áudio pode ser o canal alvo e o segundo sinal de áudio pode ser o canal de referência. Se o deslocamento verdadeiro entre o canal alvo e o canal de referência, for de trinta e sete amostras, o canal de alvo pode ser deslocado por trinta e sete amostras no codificador para gerar um canal alvo deslocado, que é temporariamente alinhado com o canal de referência. Em outras implementações, ambos os canais podem ser deslocados, tal que o deslocamento relativo entre os canais seja igual ao valor de deslocamento final (37 amostras neste exemplo). Esse deslocamento relativo de canais pelo valor de deslocamento atinge o efeito de alinhamento temporal dos canais. Um codificador de alta eficiência pode alinhar os canais tanto quanto possível para reduzir a entropia de codificação e, assim, aumentar a eficiência de codificação, porque a entropia de codificação é sensível a alterações de deslocamento entre os canais. O canal alvo deslocado e o canal de referência, podem ser usados para gerar um canal médio que é codificado e transmitido para um
Petição 870190112962, de 05/11/2019, pág. 43/134
39/105 decodificador como parte de um fluxo de bits. Adicionalmente, o valor da incompatibilidade temporal final pode ser quantizado e transmitido para, o decodificador como parte do fluxo de bits. Por exemplo, o valor de incompatibilidade temporal final pode ser quantizado usando um piso de quatro, tal que o valor de incompatibilidade temporal final quantizado seja igual a nove (por exempio, aproximadamente 37/4).
[0062] 0 decodificador pode decodificar o canal médio para gerar um canal médio decodificado, e o decodificador pode gerar um primeiro canal e um segundo canal com base no canal médio decodificado. Por exemplo, o decodificador pode fazer upmix do canal médio decodificado usando parâmetros estéreo incluídos no fluxo de bits para, gerar o primeiro canal e o segundo canal. G primeiro e o segundo canal podem ser temporariamente alinhados no decodificador; no entanto, o decodificador pode deslocar um ou mais canais um. em relação ao outro com base no valor de incompatibilidade temporal final quantizado. Por exemplo, se o primeiro canal corresponder ao canal alvo (por exemplo, o primeiro sinal de áudio) no codificador, o decodificador pode deslocar o primeiro canal por trinta e seis amostras (por exemplo, 4*9) para gerar um primeiro canal deslocado. Perceptivamente, o primeiro canal deslocado e o segundo canal são semelhantes ao canal alvo e ao canal de referência, respectivamente. Por exemplo, se o deslocamento de trinta, e sete amostras entre o canal alvo e o de referência. no codificador corresponder a um deslocamento de 10 ms, o deslocamento de trinta e seis
Petição 870190112962, de 05/11/2019, pág. 44/134
40/105 amostras entre o primeiro canal deslocado e o segundo canal no decodificador é perceptualmente semelhante a, e pode ser perceptuaimente indistinguível de, o deslocamento de trinta, e sete amostras.
[0063] Referindo-se à Figura 1, um exemplo ilustrativo particular de um. sistema 100 é mostrado. O sistema 100 inclui um primeiro dispositivo 104 comunicativamente acoplado, através de uma rede 12 0, a um segundo dispositivo 106. A rede 120 pode incluir uma ou mais redes sem fio, um ou mais redes a cabo, ou uma combinação das mesmas.
[0064] O primeiro dispositivo 104 inclui um codificador 114, um transmissor 110 e uma ou mais interfaces de entrada 112. Uma primeira interface de entraaa das intsriacss de entra cia 1.12 pio de ser a. copia cia. a ura primeiro microfone 14 6. Uma segunda interface de entrada da(s) interface (s) de entrada 112 pode ser acoplada a um segundo microfone 148. O primeiro dispositivo 104 pode também incluir uma memória 153 configurada para armazenar dados de análise, conforme descrito abaixo. O segundo dispositivo 106 pode incluir um decodificador 118 e uma memória 154. O segundo dispositivo 106 pode ser acoplado a um primeiro altifalante 142, um segundo altifalante 144, ou ambos.
[0065] Durante a operação, o primeiro dispositivo 104 pode receber um primeiro sinal de áudio 130 através da primeira interface de entrada do primeiro microfone 146 e pode receber um segundo sinal de áudio 132 através da segunda interface de entrada do segundo microfone 148. O
Petição 870190112962, de 05/11/2019, pág. 45/134
41/105 primeiro sinal de áudio 130 pode corresponder a um de um sinal de canal direito ou um sinal de canal esquerdo.O segundo sinal de áudio 132 pode corresponder ao outrodo sinal de canal direito ou o sinal de canal esquerdo. Conforme descrito aqui, o primeiro sinal de áudio 130 pode corresponder a um canal de referência, e o segundo sinalde áudio 132 pode corresponder a um canal alvo. No entanto, deve-se compreender que, era outras implementações, o primeiro sinal de áudio 130 pode corresponder ao canal alvo, e o segundo sinal de áudio 132 pode corresponder ao canal de referência. Em outras implementações, pode não haver nenhuma atribuição de canal de referência e alvo. Nesses casos, o alinhamento de canal no codificador e o desalinhamento de canal no decodificador podem ser realizados em um ou ambos os canais, tal que o deslocamento relativo entre os canais baseia-se em um valor de deslocamento.
[0066] O primeiro microfone 146 e o segundo microfone 148 podem receber áudio de uma fonte sonora. 152 (por exemplo, um usuário, um alto-falante, ruido do ambiente, um instrumento musical etc.) . Em um aspecto particular, o primeiro microfone 146, o segundo microfone 148, ou ambos, podem receber áudio de múltiplas fontes sonoras. As múltiplas fontes sonoras podem incluir uma fonte sonora dominante (ou mais dominante) (por exemplo, a fonte sonora 152) e uma ou mais fontes sonoras secundárias. As uma ou mais fontes sonoras secundárias podem corresponder a tráfego, música, de fundo, outro locutor, ruído da rua etc. A fonte sonora 152 (por exemplo, a fonte
Petição 870190112962, de 05/11/2019, pág. 46/134
42/105 sonora dominante) pode estar mais próxima do primeiro microfone 146 do que do segundo microfone 148. Por conseguinte, um sinal de áudio da fonte sonora. 152 pode ser recebido na(s) interface(s) de entrada 112 através do primeiro microfone 146 mais cedo do que através do segundo microfone 148. Esse atraso natural na aquisição de sinal multicanal através dos múltiplos microfones pode introduzir um deslocamento temporal entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132.
[0067] O primeiro dispositivo 104 pode armazenar o primeiro sinal de áudio 130, o segundo sinal de áudio 132, ou ambos, na memória 153. O codificador 114 pode determinar um primeiro valor de deslocamento 180 (por exemplo, um valor de deslocamento não causai) indicativo do deslocamento (por exemplo, um deslocamento não causal) do primeiro sinal de áudio 130 relativo ao segundo sinal de áudio 132 para um primeiro quadro 190. O primeiro valor de deslocamento 180 pode ser um valor (por exemplo, um valor não quantizado) representando um. deslocamento entre o canal de referência (por exemplo, o primeiro sinal de áudio 130) e o canal alvo (por exemplo, o segundo sinal de áudio 132) para o primeiro quadro 190. O primeiro valor de deslocamento 180 pode ser armazenado na memória 153 como dados de análise. O codificador 114 pode também determinar um segundo valor de deslocamento 184 indicativo do deslocamento do primeiro sinal de áudio 130 relativo ao segundo sinal de áudio 132 para um segundo quadro 192. O segundo quadro 192 pode seguir (por exemplo, ser posterior no tempo a) o primeiro quadro 190. O segundo valor de
Petição 870190112962, de 05/11/2019, pág. 47/134
43/105 deslocamento 184 pode ser um valor (por exemplo, um valor não quantizado) representando um deslocamento entre o canal de referência (por exemplo, o primeiro sinal de áudio 130) e o canal alvo (por exemplo, o segundo sinal de áudio 132) para o segundo quadro 192. O segundo valor de deslocamento 184 pode também ser armazenado na memória 153 como dados de 3 R ô. J. 18 ê «.
[0068] Dessa forma, os valores de deslocamento
180, 184 (por exemplo, os valores de incompatibilidade) podem ser indicativos de uma quantidade de incompatibilidade temporal (por exemplo, atraso de tempo) entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 para o primeiro e segundo quadros 190, 192, respectivamente. Como referido aqui, atraso de tempo pode corresponder a. atraso temporal. A incompatibilidade temporal pode ser indicativa de um atraso de tempo entre a recepção, através do primeiro microfone 146, do primeiro sinal de áudio 130 e a recepção, através do segundo microfone 148, do segundo sinal de áudio 132. Por exemplo, um primeiro valor (por exemplo, um valor positivo) do valor de deslocamentos 180, 184 pode indicar que o segundo sinal de áudio 132 é atrasado em. relação ao primeiro sinal de áudio 130. Neste exemplo, o primeiro sinal de áudio 130 pode corresponder a um sinal avançado e o segundo sinal de áudio 132 pode corresponder a um sinal atrasado. Um segundo valor (por exemplo, um valor negativo) dos valores de deslocamento 180, 184 pode indicar que o primeiro sinal de audio e a.trasacio em reiaçao ao segundo sina.1. cie áud..i.o 132. Neste exemplo, o primeiro sinal de áudio 130 pode
Petição 870190112962, de 05/11/2019, pág. 48/134
44/105 corresponder a um sinal atrasado e o segundo sinal de áudio 132 pode corresponder a um sinal avançado. Um terceiro valor (por exemplo, 0) dos valores de deslocamento 180, 184 pode indicar nenhum atraso entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132.
[0069] O codificador 114 pode quantizar o primeiro valor de deslocamento 180 para, gerar um primeiro valor de deslocamento quantizado 181. Para ilustrar, se o primeiro valor de deslocamento 180 (por exemplo, o valor de deslocamento verdadeiro) for igual a trinta e sete amostras, o codificador 114 pode quantizar o primeiro valor de deslocamento 180 com base em um piso para gerar o primeiro valor de deslocamento quantizado 181. Como um exemplo não limitante, se o piso for igual a quatro, o primeiro valor de deslocamento quantizado 181 pode ser igual a nove (por exemplo, aproximadamente 37/4). Conforme descrito abaixo, o primeiro valor de deslocamento 180 pode ser usado para gerar uma primeira porção de um. canal médio 191, e o primeiro valor de deslocamento quantizado 181 pode ser codificado em um fluxo de bits 160 e transmitido para o segundo dispositivo 106. Como usado aqui, uma porção de um sinal ou canal inclui um. ou mais quadros do sinal ou canal, um ou. mais subquadros do sinal ou canal, uma ou mais amostras, bits, blocos, palavras ou outros segmentos do sinal ou canal, ou qualquer combinação dos mesmos. De maneira similar, o codificador 114 pode quantizar o segundo valor de deslocamento 184 para, gerar um segundo valor de deslocamento quantizado 185. Para ilustrar, se o segundo valor de deslocamento 184 for igual a trinta e seis
Petição 870190112962, de 05/11/2019, pág. 49/134
45/105 amostras, o codificador 114 pode quantizer o segundo valor de deslocamento 184 com base no piso para gerar o segundo valor de deslocamento quantizado 185. Como um exemplo não limitante, o segundo valor de deslocamento quantizado 185 pode também ser igual a nove (por exemplo, 36/4). Conforme descrito abaixo, o segundo valor de deslocamento 184 pode ser usado para gerar uma. segunda, porção do canal médio 193, e o segundo valor de deslocamento quantizado 185 pode ser codificado no fluxo de bits 160 e transmitido para o segundo dispositivo 106.
[0070] O codificador 114 pode também gerar um indicador de sinal de referência com base nos valores de deslocamento 180, 184. Por exemplo, o codificador 114 pode, em resposta à determinação de que o primeiro valor de deslocamento 180 indica um primeiro valor (por exemplo, um valor positivo), gerar o indicador de sinal de referência para ter um primeiro valor (por exemplo, 0) indicando que o primeiro sinal de áudio 130 é um sinal de referência e que o segundo sinal de áudio 132 corresponde a. um sinal ' alvo.
[0071] O codificador 114 pode alinhar temporalmente o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 com base nos valores de deslocamento 180, 184. Por exemplo, para o primeiro quadro 190, o codificador 114 pode deslocar temporalmente o segundo sinal de áudio 132 pelo primeiro valor de deslocamento 180 para gerar um segundo sinal de áudio deslocado que é temporalmente alinhado com o primeiro sinal de áudio 130. Embora o segundo sinal de áudio 132 seja descrito como
Petição 870190112962, de 05/11/2019, pág. 50/134
46/105 submetido a um deslocamento temporal no domínio de tempo, deve-se compreender que o segundo sinal de áudio 132 pode ser submetido a um deslocamento de fase no domínio de frequência para gerar o segundo sinal de áudio deslocado 132. Por exemplo, o primeiro valor de deslocamento 180 pode corresponder a. um valor de deslocamento de domínio de frequência. Para o segundo quadro 192, o codificador 114 pode deslocar temporalmente o segundo sinal de áudio 132 pelo segundo valor de deslocamento 184 para gerar um segundo sinal de áudio deslocado que é tempora.lm.ente alinhado com o primeiro sinal de áudio 130. Embora o segundo sinal de áudio 132 seja descrito como submetido a um deslocamento temporal no domínio de tempo, deve-se compreender que o segundo sinal de áudio 132 pode ser submetido a. um deslocamento de fase no domínio de frequência para gerar o segundo sinal de áudio deslocado 132. Por exemplo, o segundo valor de deslocamento 184 pode corresponder a um valor de deslocamento de domínio de frequência..
[0072] O codificador 114 pode gerar um ou mais parâmetros estéreo adicionais (por exemplo, outros parâmetros estéreo além dos valores de deslocamento 180, 184) para cada quadro com. base nas amostras do canal de referência e amostras do canal alvo. Como um exemplo não limitante, o codificador 114 pode gerar um primeiro parâmetro estéreo 182 para o primeiro quadro 190 e um segundo parâmetro estéreo 186 para o segundo quadro 192. Exemplos não limitantes dos parâmetros estéreo 182, 186 podem incluir outros valores de deslocamento, parâmetros de
Petição 870190112962, de 05/11/2019, pág. 51/134
47/105 diferença de fase intercanal, parâmetros de diferença de nível intercanal, parâmetros de diferença de tempo intercanal, parâmetros de correlação intercanal, parâmetros de inclinação espectral, parâmetros de ganho intercanal, parâmetros de voz intercanal, ou parâmetros de pitch intercanal·
[0073] Para ilustrar, se os parâmetros estéreo 182, 186 corresponderem a parâmetros de ganho, para cada quadro, o codificador 114 pode gerar um parâmetro de ganho (por exemplo, um. parâmetro de ganho de CODEC) com base em. amostras do sinal de referência (por exemplo, o primeiro sinal de áudio 130) e com base em amostras do sinal alvo (por exemplo, o segundo sinal de áudio 132) . Por exemplo, para o primeiro quadro 190, o codificador 114 pode selecionar amostras do segundo sinal de áudio 132 com base no primeiro valor de deslocamento 180 (por exemplo, o valor de deslocamento não causai). Como referido aqui, selecionar amostras de um. sinal de áudio com base em um. valor de deslocamento pode corresponder a gerar um sinal de áudio modificado (deslocado no tempo ou deslocado em frequência) ajustando (por exemplo, deslocando) o sinal de áudio com base no valor de deslocamento e selecionando amostras do sinal de áudio modificado. Por exemplo, o codificador 114 pode gerar um segundo sinal de áudio deslocado no tempo pelo deslocamento do segundo sinal de áudio 132 com base no primeiro valor de deslocamento 180 e pode selecionar amostras do segundo sinal de áudio deslocado no tempo. O codificador 114 pode, em. resposta à determinação de que o primeiro sinal de áudio 130 é o sinal de referência,
Petição 870190112962, de 05/11/2019, pág. 52/134
48/105 determinar o parâmetro de ganho das amostras selecionadas com base nas primeiras amostras do primeiro quadro 190 do primeiro sinal de áudio 130. Como um exemplo, o parâmetro de ganho pode ser com base em uma das seguintes equações:
.....SML
OWWI *
/Equação Iii
Equação ife
Equação 1.C
Equação· id
Equação le /Equação if
[0074] em que gD corresponde ao parâmetro de ganho relativo para processamento de downmix, Ref(n) corresponde a amostras do sinal de referência, Ni corresponde ao primeiro valor de deslocamento 180 do primeiro quadro 190, e Targ(n + Nj) corresponde a amostras do sinal alvo. O parâmetro de ganho ígD) pode ser modificado, por exemplo, com base em uma das Equações la~ If, para incorporar lógica de suavização/histerese a longo prazo para evitar grandes saltos de ganho entre quadros.
[0075] O codificador 114 pode quantizar os parâmetros estéreo 182, 186 para gerar parâmetros estéreo quantizados 183, 187 que são codificados no fluxo de bits 160 e transmitidos para o segundo dispositivo 106. Por
Petição 870190112962, de 05/11/2019, pág. 53/134
49/105 exemplo, o codificador 114 pode quantizar o primeiro parâmetro estéreo 182 para gerar um primeiro parâmetro estéreo quantizado 183, e o codificador 114 pode quantizar o segundo parâmetro estéreo 186 para gerar um segundo parâmetro estéreo quantizado 187. Os parâmetros estéreo quantizados 183, 187 podem ter uma resolução mais baixa (por exemplo, menos precisão) do que os parâmetros estéreo 182, 186, respectivamente.
[0076] Para cada quadro 190, 192, o codificador 114 pode gerar um ou mais sinais codificados com base nos valores de deslocamento 180, 184, nos outros parâmetros estéreo 182, 186 e nos sinais de áudio 130, 132. Por exemplo, para o primeiro quadro 190, o codificador 114 pode gerar uma primeira porção de um canal médio 191 com base no primeiro valor de deslocamento 180 (por exemplo, o valor de deslocamento não quantizado), o primeiro parâmetro estéreo 182, e os sinais de áudio 130, 132. Adicionalmente, para o segundo quadro 192, o codificador 114 pode gerar uma segunda porção do canal médio 193 com base no segundo valor de deslocamento 184 (por exemplo, o valor de deslocamento não quantizado), no segundo parâmetro estéreo 186 e nos sinais de áudio 130, 132. De acordo com algumas implementações, o codificador 114 pode gerar canais laterais (não mostrados) para cada quadro· 190, 192 com base nos valores de deslocamento· 180, 184, nos outros parâmetros estéreo 182, 186, e nos sinais de áudio 130, 132.
[0077] Por exemplo, o codificador 114 pode gerar as porções do canal médio 191, 193 com. base em uma das seguintes Equações:
Petição 870190112962, de 05/11/2019, pág. 54/134
50/105
Μ — /te/(η) + ^Τ«Γ$·(ϊί 4- i¥s).
Μ = J?e/'(n) ψ Tan? (η 4- AÇ), /Equação- 2a
Equação 2b
M - /te/(n -- A'z) 4 T«rgr(n 4 A\ — jV2), «n que his pode ter qualquer valer arbitrário.
(Equação 2c
[0078] em que M corresponde ao canal médio, gD corresponde ao parâmetro de ganho relativo (por exemplo, os parâmetros estéreos 182, 186) para processamento de downmix, Ref(n) corresponde a amostras do sinal de referência, Nx corresponde aos valores de deslocamento 180, 184, e Targ(n + Ni) corresponde a amostras do sinal ' alvo.
[0079] O codificador 114 pode gerar os canais laterais com. base em. uma das seguintes Equações:
S -4 jVj)? Equação 3a.
S ss $9 W (n) “ Tsr#(n 4 Ay, Equação 3 b
S as lte/’(?i — Ay - Tar#(n 4 Af s — Ay s em que Hz pode ter qualquer valor arbitrário,
Equação 3c
[0080] em que S corresponde ao sinal de canal lateral, gD corresponde ao parâmetro de ganho relativo (por exemplo, parâmetros estéreo 182, 186) para processamento de downmix, Ref(n) corresponde a amostras do sinal de referência, Ni corresponde aos valores de deslocamento 180, 184, e Targ(n + Nj) corresponde a amostras do sinal alvo.
[0081] O transmissor 110 pode transmitir o fluxo de bits 160, através da rede 12 0, para o segundo
Petição 870190112962, de 05/11/2019, pág. 55/134
51/105 dispositivo 106. O primeiro quadro 190 e o segundo quadro 192 podem ser codificados no fluxo de bits 160. Por exemplo, a primeira porção do canal médio 191, o primeiro valor de deslocamento quantizado 181 e o primeiro parâmetro estéreo quantizado 183 podem ser codificados no fluxo de bits 160. Adicionalmente, a segunda porção do canal médio 193, o segundo valor de deslocamento quantizado 185 e o segundo parâmetro estéreo quantizado 187 podem ser codificados no fluxo de bits 160. Informações do canal lateral podem também ser codificadas no fluxo de bits 160. Embora, não mostrado, informações adicionais podem também ser codificados no fluxo de bits 160 para cada quadro 190, 192. Como um exemplo não limitante, um indicador de canal de referência pode ser codificado no fluxo de bits 160 para, cada, quadro 190, 192.
[0082] Devido a más condições de transmissão, alguns dados codificados no fluxo de bits 160 podem ser perdidos na transmissão. A perda de pacote pode ocorrer devido a más condições de transmissão, apagamento de quadro pode ocorrer devido a más condições de rádio, pacotes podem chegar atrasados devido a alta instabilidade etc. De acordo com o exemplo ilustrativo não limitante, o segundo dispositivo 106 pode receber o primeiro quadro 190 do fluxo de bits 160 e a segunda porção do canal médio 193 do segundo quadro 192. Dessa forma, o segundo valor de deslocamento quantizado 185 e o segundo parâmetro estéreo quantizado 187 podem ser perdidos na transmissão devido a. más condições de transmissão.
[0083] O segundo dispositivo 106 pode, portanto,
Petição 870190112962, de 05/11/2019, pág. 56/134
52/105 receber pelo menos uma porção do fluxo de bits 160 como transmitido pelo primeiro dispositivo 102. O segundo dispositivo 106 pode armazenar a porção recebida do fluxo de bits 160 na memória 154 (por exemplo, em um buffer). Por exemplo, o primeiro quadro 190 pode ser armazenado na memória 154 e a segunda porção do canal médio 193 do segundo quadro 192 pode também ser armazenada na. memória 154 .
[0084] O decodificador 118 pode decodificar o primeiro quadro 190 para gerar um primeiro sinal de salda 12 6 que corresponde ao primeiro sinal de áudio 130 e para, gerar um segundo sinal de saída 128 que corresponde ao segundo sinal de áudio 132. Por exemplo, o decodificador 118 pode decodificar a primeira porção do canal médio 191 para. gerar uma primeira porção de um canal médio decodificado 170. O decodificador 118 pode também realizar uma operação de transformação na primeira porção do canal médio decodificado 170 para gerar uma primeira porção de um. canal médio decodificado de domínio de frequência (FD) 171. O decodificador 118 pode fazer upmix da primeira porção do canal médio decodificado de domínio de frequência 171 para gerar um primeiro canal de domínio de frequência (não mostrado) associado com o primeiro sinal de saída 126 e um segundo canal de domínio de frequência (não mostrado) associado com o segundo sinal de saída 128. Durante o upmix, o decodificador 118 pode aplicar o primeiro parâmetro estéreo quantizado 183 à primeira porção do canal médio decodificado de domínio de frequência 171.
[0085] Deve-se notar que, em outras
Petição 870190112962, de 05/11/2019, pág. 57/134
53/105 implementações, o decodificador 118 pode não realizar a operação de transformação, mas realizar o upmix com base no canal médio, alguns parâmetros estéreo (por exemplo, o ganho de dowmix) e, adicionalmente, se disponível, também com base em um canal lateral decodificado no domínio de tempo para gerar o primeiro canal de domínio de tempo (não mostrado; associado com o primeiro canal de saída 126 e um segundo canal de domínio de tempo (não mostrado; associado com o segundo canal de saída 128.
[0086] Se o primeiro valor de deslocamento quantizado 181 corresponder a um valor de deslocamento de domínio de frequência, o decodificador 118 pode deslocar o segundo canal de domínio de frequência pelo primeiro valor de deslocamento quantizado 181 para gerar um. segundo canal de domínio de frequência deslocado (não mostrado;. O decodificador 118 pode realizar uma operação de transformação inversa no primeiro canal de domínio de frequência para gerar o primeiro sinal de saída 126. O decodificador 118 pode também realizar uma operação de transformação inversa no segundo canal de domínio de frequência deslocado para gerar o segundo sinal de saída 12 8 .
[0087] Se o primeiro valor de deslocamento quantizado 181 corresponder a um valor de deslocamento de domínio de tempo, o decodificador 118 pode realizar uma operação de transformação inversa no primeiro canal de domínio de frequência para gerar o primeiro sinal de saída 126. O decodificador 118 pode também realizar uma operação de transformação inversa no segundo canal de domínio de
Petição 870190112962, de 05/11/2019, pág. 58/134
54/105 frequência para gerar um segundo canal de domínio de tempo. O decodificador 118 pode deslocar o segundo canal de domínio de tempo pelo primeiro valor de deslocamento quantizado 181 para gerar o segundo sinal de saída 128. Dessa forma, o decodificador 118 pode usar o primeiro valor de deslocamento quantizado 181 para emular uma. diferença, perceptível entre o primeiro sinal de saída 126 e o segundo sinal de saída 128. O primeiro altifalante 142 pode emitir o primeiro sinal de saída 126, e o segundo altifalante 144 pode emitir o segundo sinal de saída 128. Em alguns casos, a operação de transformação inversa pode ser omitida em implementações em que o upmix foi realizado no domínio de tempo para gerar diretamente o primeiro canal de domínio de tempo e o segundo canal de domínio de tempo, conforme descrito acima. Deve-se observar também que a presença de valor de deslocamento de domínio de tempo no decodificador 118 pode simplesmente ser uma questão de indicar que o decodificador é configurado para, realizar deslocamento de domínio de tempo e, em. algumas implementações, embora um deslocamento de domínio de tempo possa estar disponível no decodificador 118 (indicando que o decodificador realiza a operação de deslocamento no domínio de tempo), o codificador do qual o fluxo de bits foi recebido pode ter realizado uma operação de deslocamento de domínio de frequência ou uma operação de deslocamento de domínio de tempo para alinhar os canais.
[0088] Se o decodificador 118 determinar que o segundo quadro 192 está indisponível para operações de decodificação (por exemplo, determinar que o segundo valor
Petição 870190112962, de 05/11/2019, pág. 59/134
55/105 de deslocamento quantizado 185 e o segundo parâmetro estéreo quantizado 187 estão indisponíveis), ο decodificador 118 pode gerar os sinais de saída 126, 128 para o segundo quadro 192 com base nos parâmetros estéreo associados com o primeiro quadro 190. Por exemplo, o decodificador 118 pode estimar ou interpolar o segundo valor de deslocamento quantizado 185 com base no primeiro valor de deslocamento quantizado 181. Adicionalmente, o decodificador 118 pode estimar ou interpolar o segundo parâmetro estéreo quantizado 187 com base no primeiro parâmetro estéreo quantizado 183.
[0089] Após estimar o segundo valor de deslocamento quantizado 185 e o segundo parâmetro estéreo quantizado 187, o decodificador 118 pode gerar os sinais de saída 126, 128 para o segundo quadro 192 de maneira similar a como sinais de saída 126, 128 são gerados para o primeiro quadro 190. Por exemplo, o decodificador 118 pode decodificar a segunda porção do canal médio 193 para gerar uma segunda porção do canal médio decodificado 172. O decodificador 118 pode também realizar uma operação de Lransformaçao na segunda porção do carai médro decodrficado 172 para gerar um segundo canal médio decodificado de domínio de frequência. 173. Com base no valor de deslocamento quantizado estimado e no parâmetro estéreo quantizado estimado 187, o decodificador 118 pode fazer upmix do segundo canal médio decodificado de domínio de frequência. 173, realizar uma. transformação inversa nos sinais com upmix, e deslocar o sinal resultante para gerar os sinais de saída 126, 128. Um exemplo de operações de
Petição 870190112962, de 05/11/2019, pág. 60/134
56/105 decodificação é descrito em maiores detalhes com relação à Figura 2.
[0090] O sistema 100 pode alinhar os canais tanto quanto possível no codificador 114 para reduzir a entropia de codificação e, assim, aumentar a eficiência de codificação, porque a entropia de codificação é sensível a alterações de deslocamento entre os canais. Por exemplo, o codificador 114 pode usar valores de deslocamento não quantizados para alinhar de forma precisa os canais porque valores de deslocamento não quantizados têm uma. resolução relativamente alta. No decodificador 118, parâmetros estéreo quantizados podem ser usados para emular uma diferença perceptível entre os sinais de saída 126, 128 usando um número reduzido de bits em comparação com o uso de valores de deslocamento não quantizados, e parâmetros estéreo ausentes (devido à má transmissão) podem ser interpelados ou estimados usando parâmetros estéreo de um ou mais quadros prévios. De acordo com algumas implementações, os valores de deslocamento 180, 184 (por exemplo, os valores de deslocamento não quantizados) podem ser usados para deslocar os canais alvo no dominio de frequência, e os valores de deslocamento quantizados 181, 185 podem, ser usados para deslocar os canais alvo no domínio de tempo. Por exemplo, os valores de deslocamento usados para codificação estéreo de dominio de tempo podem ter uma resolução mais baixa do que os valores de deslocamento usados para codificação estéreo de domínio de frequência.
[0091] Referindo-se à Figura 2, um diagrama
Petição 870190112962, de 05/11/2019, pág. 61/134
57/105 ilustrando uma implementação particular do decodificador 118 é mostrado. O decodificador 118 inclui um decodificador de canal médio 202, uma unidade de transformação 204, um upmixer 206, uma unidade de transformação inversa 210, uma unidade de transformação inversa 212, e um deslocador 214.
[0092] 0 fluxo de bits 160 da Figura 1 pode ser provido ao decodificador 118. Por exemplo, a primeira porção do canal médio 191 do primeiro quadro 190 e a segunda porção do canal médio 193 do segundo quadro 192 podem ser providas ao decodificador de canal médio 202. Adicionalmente, parâmetros estéreo 201 podem, ser providos ao upmixer 206 e ao deslocador 214. Os parâmetros estéreo 201 podem incluir o primeiro valor de deslocamento quantizado 181 associado com o primeiro quadro 190 e o primeiro parâmetro estéreo quantizado 183 associado com o primeiro quadro 190. Conforme descrito acima com relação à Figura 1, o segundo valor de deslocamento quantizado 185 associado com o segundo quadro 192 e o segundo parâmetro estéreo quantizado 187 associado com o segundo quadro 192 podem não ser recebidos pelo decodificador 118 devido a más condições de transmissão.
[0093] Para decodificar o primeiro quadro 190, o decodificador de canal médio 202 pode decodificar a primeira porção do canal médio 191 para gerar a primeira porção do canal médio decodificado 170 (por exemplo, um canal médio de domínio de tempo). De acordo com algumas implementações, duas janelas assimétricas podem ser aplicadas à primeira, porção do canal médio decodificado 170 para gerar uma porção em janelas de um canal médio de
Petição 870190112962, de 05/11/2019, pág. 62/134
58/105 domínio de tempo. A primeira porção do canal médio decodificado 170 é provida à unidade de transformação 204. A unidade de transformação 204 pode ser configurada para, realizar uma operação de transformação na primeira porção do canal médio decodificado 170 para gerar a primeira porção do canal médio decodificado de domínio de frequência. 171. A primeira, porção do canal médio decodificado de domínio de frequência 171 é provida ao upmixer 206. De acordo com algumas implementações, o enj anelamento e a operação de transformação podem ser totalmente ignorados e a primeira porção do canal médio decodificado 170 (por exemplo, um canal médio de domínio de tempo) pode ser diretamente provida ao upmixer 206.
[0094] O upmixer 206 pode fazer upmix da primeira, porção do canal médio decodificado de domínio de frequência 171 para gerar uma porção de um canal de domínio de frequência 250 e uma porção de um canal de domínio de frequência 254. O upmixer 206 pode aplicar o primeiro parâmetro estéreo quantizado 183 à primeira, porção do canal médio decodificado de domínio de frequência 171 durante as operações de upmix para gerar as porções de canais de domínio de frequência 250, 254. De acordo com uma.
implementação em que o primeiro valor de deslocamento quantizado 181 inclui um deslocamento de domínio de frequência (por exemplo, o primeiro valor de deslocamento quantizado 181 corresponde a um primeiro valor de deslocamento de domínio de frequência quantizado 281), o upmixer 206 pode realizar um. deslocamento de domínio de frequência (por exemplo, um deslocamento de fase) com base
Petição 870190112962, de 05/11/2019, pág. 63/134
59/105 no primeiro valor de deslocamento de domínio de frequência quantizado 281 para gerar a porção do canal de domínio de frequência. 254. Ά porção do canal de domínio de frequência. 250 é provida à unidade de transformação inversa 210, e a porção do canal de domínio de frequência 254 é provida à unidade de transformação inversa 212. De acordo com algumas implementações, o upmixer 206 pode ser configurado para operar nos canais de domínio de tempo em que os parâmetros estéreo (por exemplo, com base em valores de ganho alvo) podem ser aplicados no domínio de tempo.
[0095] A unidade de transformação inversa 210 pode realizar uma operação de transformação inversa na porção do canal de domínio de frequência 250 para gerar uma porção de um canal de domínio de tempo 260. A porção do canal de domínio de tempo 260 é provida, ao deslocador 214. A unidade de transformação inversa 212 pode realizar uma operação de transformação inversa na porção do canal de domínio de frequência 254 para gerar uma porção de um canal de domínio de tempo 264. A porção do canal de domínio de tempo 2 64 é também provida ao deslocador 214. Em implementações em que a operação de upmix é realizada no domínio de tempo, as operações de transformação inversa após a operação de upmix podem ser ignoradas.
[0096] De acordo com a implementação em que o primeiro valor de deslocamento quantizado 181 corresponde a um primeiro valor de deslocamento de domínio de frequência quantizado 281, o deslocador 214 pode bypassar as operações de deslocamento e passar as porções dos canais de domínio de tempo 2 60, 2 64 como porções dos sinais de saída 12 6,
Petição 870190112962, de 05/11/2019, pág. 64/134
60/105
8, respectivamente. De acordo com uma implementação em que o primeiro valor de deslocamento quantizado 181 inclui um deslocamento de domínio de tempo (por exemplo, o primeiro valor de deslocamento quantizado 181 corresponde a um primeiro valor de deslocamento de domínio de tempo quantizado 291), o deslocador 214 pode deslocar a porção do canal de domínio de tempo 2 64 pelo primeiro valor de deslocamento de domínio de tempo· quantizado 291 para gerar a porção do segundo sinal de saída 128.
[0097] Dessa forma, o decodificador 118 pode usar valores de deslocamento quantizados tendo precisão reduzida, (em comparação com os valores de deslocamento não quantizados usados no codificador 114) para gerar as porções dos sinais de saída 126, 128 para o primeiro quadro 190. Usar os valores de deslocamento quantizados para deslocar o sinal de saída 128 em relação ao sinal de saída 126 pode restaurar a percepção de usuário do deslocamento no codificador 114.
[0098] Para decodificar o segundo quadro 192, o decodificador de canal médio 202 pode decodificar a segunda porção do canal médio 193 para gerar a segunda porção do canal médio decodificado 172 (por exemplo, um canal médio de domínio de tempo). De acordo com algumas implementações, duas janelas assimétricas podem ser aplicadas â segunda porção do canal médio decodificado 172 para gerar uma porção em janelas do canal médio de domínio de tempo. A segunda porção do canal médio decodificado 172 é provida, à unidade de transformação 204. A unidade de transformação 204 pode ser configurada para realizar uma operação de
Petição 870190112962, de 05/11/2019, pág. 65/134
61/105 transformação na segunda porção do canal médio decodificado 172 para gerar a segunda porção do canal médio decodificado de domínio de frequência 173. Ά segunda porção do canal médio decodificado de domínio de frequência 173 é provida ao upmixer 206. De acordo com algumas implementações, o enjanelamento e a operação de transformação podem ser totalmente ignorados e a segunda porção do canal médio decodificado 172 (por exemplo, um canal médio de domínio de tempo) pode ser diretamente provida ao upmixer 206.
[0099] Conforme descrito acima com relação à Figura. 1, o segundo valor de deslocamento quantizado 185 e o segundo parâmetro estéreo quantizado 187 podem não ser recebidos pelo decodificador 118 devido a más condições de transmissão. Como resultado, parâmetros estéreo para o segundo quadro 192 podem não ser acessíveis ao upmixer 206 e ao deslocador 214. O upmixer 206 inclui um interpolador de parâmetro estéreo 208 que é configurado para interpolar (ou estimar) o segundo valor de deslocamento quantizado 185 com. base no primeiro valor de deslocamento de domínio de frequência quantizado 281. Por exemplo, o interpolador de parâmetro estéreo 208 pode gerar um segundo valor de deslocamento de domínio de frequência interpolado 285 com base no primeiro valor de deslocamento de domínio de frequência quantizado 281. O interpolador de parâmetro estéreo 208 pode também ser configurado para interpolar (ou estimar) o segundo parâmetro estéreo quantizado 187 com base no primeiro parâmetro estéreo quantizado 183. Por exemplo, o interpolador de parâmetro estéreo 208 pode gerar ura segundo· parâmetro· estéreo interpolado 287 com base no
Petição 870190112962, de 05/11/2019, pág. 66/134
62/105 primeiro parâmetro estéreo quantizado 183.
[0100] O upmixer 206 pode fazer upmix da segunda porção do canal médio decodificado de domínio de frequência. 173 para gerar uma porção de um canal de domínio de frequência 252 e uma porção de um canal de domínio de frequência 256. O upmixer 206 pode aplicar o segundo parâmetro estéreo interpelado 287 à segunda porção do canal médio decodificado de domínio de frequência 173 durante as operações de upmix para gerar as porções dos canais de domínio de frequência 252, 256. De acordo com uma implementação em que o primeiro valor de deslocamento quantizado 181 inclui um deslocamento de domínio de frequência (por exemplo, o primeiro valor de deslocamento quantizado 181 corresponde a um primeiro valor de deslocamento de domínio de frequência quantizado 281), o upmixer 206 pode realizar um deslocamento de domínio de frequência (por exemplo, um deslocamento de fase) com base no segundo valor de deslocamento de domínio de frequência interpelado 285 para gerar a. porção do canal de domínio de frequência 256. A porção do canal de domínio de frequência 252 é provida à unidade de transformação inversa 210, e a porção do canal de domínio de frequência 256 é provida à unidade de transformação inversa. 212.
[0101] A unidade de transformação inversa 210 pode realizar uma operação de transformação inversa na porção do canal de domínio de frequência 252 parva gerar uma porção de um canal de domínio de tempo 2 62. A porção do canal de domínio de tempo 262 é provida, ao deslocador 214.
A unidade de transformação inversa 212 pode realizar uma
Petição 870190112962, de 05/11/2019, pág. 67/134
63/105 operação de transformação inversa na porção do canal de domínio de frequência 256 para gerar uma porção de um canal de domínio de tempo 266. Ά porção do canal de domínio de tempo 266 é também provida ao deslocador 214. Em implementações em que o upmixer 206 opera nos canais de domínio de tempo, a saída do upmixer 206 pode ser provida ao deslocador 214, e as unidades de transformação inversa 210, 212 podem ser ignoradas ou omitidas.
[0102] O deslocador 214 inclui um interpolador de valor de deslocamento 216 que é configurado para interpolar (ou estimar) o segundo valor de deslocamento quantizado 185 com base no primeiro valor de deslocamento de domínio de tempo quantizado 291. Por exemplo, o interpolador de valor de deslocamento 216 pode gerar um segundo valor de deslocamento de domínio de tempo interpolado 295 com base no primeiro valor de deslocamento de domínio de tempo quantizado 291. De acordo com a implementação em que o primeiro valor de deslocamento quantizado 181 corresponde ao primeiro valor de deslocamento de domínio de frequência quantizado 281, o deslocador 214 pode bypassar as operações de deslocamento e passar as porções dos canais de domínio de tempo 262, 266 como os sinais de saída 126, 128, respectivamente. De acordo com a implementação em que o primeiro valor de deslocamento quantizado 181 corresponde ao primeiro valor de deslocamento de domínio de tempo quantizado 291, o deslocador 214 pode deslocar a porção do canal de domínio de tempo 266 pelo segundo valor de deslocamento de domínio de tempo interpolado 2 95 para, gerar o segundo sinal de saída 128.
Petição 870190112962, de 05/11/2019, pág. 68/134
64/105
[0103] Dessa forma, o decodificador 118 pode aproximar parâmetros estéreo (por exemplo, valores de deslocamento) com base em parâmetros estéreo ou variação nos parâmetros estéreo· de quadros prévios. Por exemplo, o decodificador 118 pode extrapolar parâmetros estéreo para quadros que são perdidos durante a transmissão (por exemplo, o segundo quadro 192) a partir de parâmetros estéreo de um ou mais quadros prévios.
[0104] Referindo-se à Figura 3, um diagrama 300 para prever parâmetros estéreo de um quadro ausente em. um. decodificador é mostrado. De acordo com o diagrama. 300, o primeiro quadro 190 pode ser transmitido de forma bemsucedida do codificador 114 para o decodificador 118, e o segundo quadro 192 pode não ser transmitido de forma bemsucedida. do codificador 114 para o decodificador 118. Por exemplo, o segundo quadro 192 pode ser perdido na transmissão devido a mas condições de cransmissão.
[0105] O decodificador 118 pode gerar a. primeira porção do canal médio decodificado 170 do primeiro quadro 190. Por exemplo, o decodificador 118 pode decodificar a primeira porção do canal médio 191 para gerar a primeira porção do canal médio decodificado 170. Usando as técnicas descritas com relação à Figura 2, o decodificador 118 pode também gerar uma primeira porção de um canal esquerdo 302 e uma primeira porção de um canal direito 304 com base na primeira porção do canal médio decodificado 170. A primeira porção do canal esquerdo 302 pode corresponder ao primeiro sinal de salda 126, e a primeira porção do canal direito 304 pode corresponder ao segundo sinal de salda 128. Por
Petição 870190112962, de 05/11/2019, pág. 69/134
65/105 exemplo, o decodificador 118 pode usar o primeiro parâmetro estéreo quantizado 183 e o primeiro valor de deslocamento quantizado 181 para gerar os canais 302, 304.
[0106] O decodificador 118 pode interpelar (ou estimar) o segundo valor de deslocamento de domínio de frequência. interpelado 285 (ou o segundo valor de deslocamento de domínio de tempo interpelado 295) com base no primeiro valor de deslocamento quantizado 181. De acordo com outras implementações, os segundos valores de deslocamento interpolados 285, 295 podem ser estimados (por exemplo, interpolados ou extrapolados) com ba.se em valores de deslocamento quantizados associados com dois ou mais quadros prévios (por exemplo, o primeiro quadro 190 e pelo menos um quadro precedente ao primeiro quadro ou um quadro seguinte ao segundo quadro 192, um ou mais outros quadros no fluxo de bits 160, ou qualquer combinação dos mesmos). O decodificador 118 pode também interpolar (ou estimar) o segundo parâmetro estéreo interpolado 287 com base no primeiro parâmetro estéreo quantizado 183. De acordo com outras implementações, o segundo parâmetro estéreo interpolado 287 pode ser estimado com base em parâmetros estéreo quantizados associados com dois ou mais outros quadros (por exemplo, o primeiro quadro 190 e pelo menos um quadro precedente ou seguinte ao primeiro quadro).
[0107] Adicionalmente, o decodificador 118 pode interpolar (ou estimar) uma segunda porção do canal médio decodificado 306 com. base na primeira porção do canal médio decodificado 170 (ou canais médios associados com. dois ou mais quadros prévios). Usando as técnicas descritas com
Petição 870190112962, de 05/11/2019, pág. 70/134
66/105 relação à Figura 2, o decodificador 118 pode também gerar uma segunda porção do canal esquerdo 308 e uma segunda porção do canal direito 310 com base na segunda porção estimada do canal médio decodificado 306. A segunda porção do canal esquerdo 308 pode corresponder ao primeiro sinal de saída 126, e a segunda porção do canal direito 310 pode corresponder ao segundo sinal de saída 128. Por exemplo, o decodificador 118 pode usar o segundo parâmetro estéreo interpolado 287 e o segundo valor de deslocamento quantizado de domínio de frequência interpolado 285 para gerar os canais direito e esquerdo.
[0108] Referindo-se à Figura 4A, um método 400 de decodificação de um sinal é mostrado. O método 400 pode ser realizado pelo segundo dispositivo 106 da Figura 1, o decodificador 118 das Figuras 1 e 2, ou ambos.
[0109] O método· 400 inclui receber, em ura decodificador, um fluxo de bits incluindo um canal médio e um valor quantizado representando um deslocamento entre um primeiro canal (por exemplo, um canal de referência) associado com um codificador e um segundo canal (por exemplo, um canal alvo) associado com o codificador, em 402. 0 valor quantizado baseia-se em um valor do deslocamento. O valor é associado com o codificador e tem. uma precisão maior do que o valor quantizado.
[0110] O método 400 também inclui decodificar o canal médio para gerar um canal médio decodificado, em 404. O método 400 ainda inclui gerar um primeiro canal (um primeiro canal gerado) com base no canal médio decodificado, em 406, e gerar um segundo canal (um segundo
Petição 870190112962, de 05/11/2019, pág. 71/134
67/105 canal gerado) cora base no canal médio decodificado e no valor quantizado, em 408. O primeiro canal gerado corresponde ao primeiro canal associado com o codificador (por exemplo, o canal de referência) e o segundo canal gerado corresponde ao segundo canal associado corn o codificador (por exemplo, o canal alvo). Em algumas implementações, ambos o primeiro canal e o segundo canal podem ser corn base no valor quantizado de deslocamento. Em algumas implementações, o decodificador pode não explicitamente identificar canais alvo e de referência antes da operação de deslocamento.
[0111] Dessa forma, o método 400 da Figura 4A pode permitir o alinhamento de canais laterais do codificador para reduzir a entropia de codificação e, assim, aumentar a eficiência de codificação, porque a entropia de codificação é sensível a alterações de deslocamento entre os canais. Por exemplo, o codificador 114 pode usar valores de deslocamento não quantizados para alinhar de forma, precisa os canais porque valores de deslocamento não quantizados têm uma resolução relativamente alta. Valores de deslocamento quantizados podem ser transmitidos ao decodificador 118 para reduzir a utilização de recursos de transmissão de dados. No decodificador 118, os parâmetros de deslocamento quantizados podem ser usados para emular uma diferença perceptível entre os sinais de saída 126, 128.
[0112] Referindo-se à Figura 4B, um método 450 de decodificação de um sinal é mostrado. Em. algumas implementações, o método 450 da Figura 4B é uma versão mais
Petição 870190112962, de 05/11/2019, pág. 72/134
68/105 detalhada do método 400 de decodificação do sinal de áudio da Figura 4A. O método 450 pode ser realizado pelo segundo dispositivo 106 da Figura. 1, pelo decodi f icador 118 das Figuras 1 e 2, ou ambos.
[0113] O método 450 inclui receber, em um decodificador, um. fluxo de bits de um codificador, em 452. O fluxo de bits inclui um canal médio e um. valor quantizado representando ura deslocamento entre um canal de referência associado com o codificador e um canal alvo associado com o codificador. 0 valor quantizado pode ser com base em um valor (por exemplo, um valor não quantizado) do deslocamento que tem uma precisão maior do que o valor quantizado. Por exemplo, referindo-se à Figura 1, o decodif icador 118 pode receber o fluxo de bits 160 do codificador 114. O fluxo de bits 160 pode incluir a primeira porção do canal médio 191 e o primeiro valor de deslocamento quantizado 181 representando o deslocamento entre o primeiro sinal de áudio 130 (por exemplo, o canal de referência) e o segundo sinal de áudio 132 (por exemplo, o canal alvo) . O primeiro valor de deslocamento quantizado· 181 pode ser com base no primeiro valor de deslocamento 180 (por exemplo, um valor não quantizado).
[0114] O primeiro valor de deslocamento 180 pode ter uma precisão maior do que o primeiro valor de deslocamento quantizado 181. Por exemplo, o primeiro valor de deslocamento quantizado 181 pode corresponder a uma versão de baixa resolução do primeiro valor de deslocamento 180. O primeiro valor de deslocamento pode ser usado pelo codificador 114 para temporariamente combinar o canal alvo
Petição 870190112962, de 05/11/2019, pág. 73/134
69/105 (por exemplo, o segundo sinal de áudio 132) e o canal de referência (por exemplo, o primeiro sinal de áudio 130).
[0115] O método 450 também inclui decodificar o canal médio para gerar um canal médio decodificado, em 454. Por exemplo, referindo-se à Figura 2, o decodificador de canal médio 202 pode decodificar a primeira porção do canal médio 191 para gerar a primeira porção do canal médio decodificado 170. O método 400 pode também incluir realizar uma operação de transformação no canal médio decodificado para gerar um canal médio de domínio de frequência decodificado, em 456. Por exemplo, referindo-se à Figura 2, a unidade de transformação 204 pode realizar uma operação de transformação na primeira porção do canal médio decodificado 170 para gerar a primeira porção do canal médio decodificado de domínio de frequência 171.
[0116] O método 450 pode também incluir fazer upmix do canal médio de domínio de frequência decodificado para, gerar uma primeira porção do canal de domínio de frequência, e um segundo canal de domínio de frequência, em 458. Por exemplo, referindo-se à Figura 2, o upmixer 206 pode fazer upmix da primeira porção do canal médio decodificado de domínio de frequência 171 para gerar a. porção do canal de domínio de frequência. 2 50 e a porção do canal de domínio de frequência 254. 0 método 450 pode também incluir gerar um primeiro canal com base na primeira porção do canal de domínio de frequência, em 460. O primeiro canal pode corresponder ao canal de referência. Por exemplo, a unidade de transformação inversa 210 pode realizar uma operação de transformação inversa na porção do
Petição 870190112962, de 05/11/2019, pág. 74/134
70/105 canal de domínio de frequência 2 50 para gerar a porção do canal de domínio de tempo 260, e o deslocador 214 pode passar a. porção do canal de domínio de tempo 2 60 como uma. porção do primeiro sinal de saída 126. O primeiro sinal de saída 126 pode corresponder ao canal de referência (por exemplo, o primeiro sinal de áudio 130).
[0117] O método 450 pode também, incluir gerar um segundo canal com base no segundo canal de domínio de frequência, em 462. O segundo canal pode corresponder ao canal alvo. De acordo com uma implementação, o segundo canal de domínio de frequência pode ser deslocado em um domínio de frequência pelo valor quantizado se o valor quantizado corresponder a um deslocamento de domínio de frequência. Por exemplo, referindo-se à Figura 2, o upmixer 206 pode deslocar a porção do canal de domínio de frequência 254 pelo primeiro valor de deslocamento de domínio de frequência quantizado 281 para um segundo canal de domínio de frequência deslocado (não mostrado). A unidade de transformação inversa 212 pode realizar uma. transformação inversa no segundo canal de domínio de frequência deslocado para gerar uma porção do segundo sinal de saída 128. O segundo sinal de saída 128 pode corresponder ao canal alvo (por exemplo, o segundo sinal de áudio 132).
[0118] De acordo com outra implementação, uma versão de domínio de tempo do segundo canal de domínio de frequência, pode ser deslocada pelo valor quantizado se o valor quantizado corresponder a um. deslocamento de domínio de tempo. Por exemplo, a unidade de transformação inversa
Petição 870190112962, de 05/11/2019, pág. 75/134
71/105
212 pode realizar uma operação de transformação inversa na porção do canal de domínio de frequência 2 54 para, gerar a porção do canal de domínio de tempo 264. O deslocador 214 pode deslocar a porção de canal de domínio de tempo 264 pelo primeiro valor de deslocamento de domínio de tempo quantizado 291 para gerar uma porção do segundo sinal de saída 128. O segundo sinal de saída 128 pode corresponder ao canal alvo (por exemplo, o segundo sinal de áudio 132).
[0119] Dessa forma, o método 450 da Figura 4B pode permitir o alinhamento de canais laterais do codificador para, reduzir entropia de codificação e, assim, aumentar a eficiência de codificação, porque a entropia de codificação é sensível a alterações de deslocamento entre os canais. Por exemplo, o codificador 114 pode usar valores de deslocamento não quantizados para alinhar de forma precisa os canais porque valores de deslocamento não quantizados têm uma resolução relativamente alta. Valores de deslocamento quantizados podem ser transmitidos para, o decodificador 118 para, reduzir a utilização de recursos de transmissão de dados. No decodificador 118, os parâmetros de deslocamento quantizados podem ser usados para emular uma diferença perceptível entre os sinais de saída 126, 12 8 .
[0120] Referindo-se à Figura 5A, outro método 500 de decodificação de um sinal é mostrado. O método 500 pode ser realizado pelo segundo dispositivo 106 da Figura 1, o decodificador 118 das Figuras 1 e 2, ou ambos.
[0121] O método 500 inclui receber pelo menos um porção de um fluxo de bits, em 502. O fluxo de bits inclui
Petição 870190112962, de 05/11/2019, pág. 76/134
72/105 um primeiro quadro e um segundo quadro. 0 primeiro quadro inclui uma primeira porção de um canal médio e um primeiro valor de um parâmetro estéreo, e o segundo quadro inclui uma segunda porção do canal médio e um segundo valor do parâmetro estéreo.
[0122] 0 método 500 também inclui decodificar a primeira, porção do canal médio para, gerar uma primeira porção de um canal médio decodificado, em 504. 0 método 500 ainda inclui gerar uma primeira porção de um canal esquerdo com base pelo menos na primeira, porção do canal médio decodificado e no primeiro valor do parâmetro estéreo, em 506, e gerar uma primeira porção de um canal direito com base pelo menos na primeira porção do canal médio decodificado e no primeiro valor do parâmetro estéreo, em 508. 0 método também inclui, em resposta ao segundo quadro estar indisponível para operações de decodificação, gerar uma segunda porção do canal esquerdo e uma segunda porção do canal direito com base pelo menos no primeiro valor do parâmetro estéreo, em 510. A segunda, porção do canal esquerdo e a segunda porção do canal direito correspondem a uma versão decodificada do segundo quadro.
[0123] De acordo com. uma implementação, o método 500 inclui gerar um. valor interpolado do parâmetro estéreo com base no primeiro· valor do parâmetro· estéreo e no segundo valor do parâmetro· estéreo em resposta ao segundo quadro estar disponível para operações de decodificação. De acordo com. outra implementação, o método 500 inclui gerar, em resposta ao segundo quadro estar indisponível para operações de decodificação, pelo menos a segunda porção do
Petição 870190112962, de 05/11/2019, pág. 77/134
73/105 canal esquerdo e a segunda porção do canal direito com base pelo menos no primeiro valor do parâmetro estéreo, a primeira porção do canal esquerdo e a primeira porção do canal direito.
[0124] De acordo com uma implementação, o método 500 inclui gerar, em resposta ao segundo quadro estar indisponível para operações de decodificação, pelo menos a segunda porção do canal médio e uma segunda porção de um canal lateral com base pelo menos no primeiro valor do parâmetro estéreo, a primeira, porção do canal médio, a primeira porção do canal esquerdo ou a. primeira porção do canal direito. O método 500 também inclui gerar, em resposta ao segundo quadro estar indisponível para operações de decodificação, a. segunda porção do canal esquerdo e a segunda porção do canal direito com base na segunda porção do canal médio, a segunda porção do canal lateral e um terceiro valor do parâmetro estéreo. O terceiro valor do parâmetro estéreo é pelo menos com base no primeiro valor do parâmetro estéreo, um valor interpolado do parâmetro estéreo e um modo de codificação.
[0125] Dessa forma, o método 500 pode permitir ao o decodificador 118 aproximar parâmetros estéreo (por exemplo, valores de deslocamento) com base em. parâmetros estéreo ou variação nos parâmetros estéreo de quadros prévios. Por exemplo, o decodificador 118 pode extrapolar parâmetros estéreo para quadros que são perdidos durante a transmissão (por exemplo, o segundo quadro 192) a partir de parâmetros estéreo de um ou mais quadros prévios.
[0126] Referindo-se à Figura 5B, outro método 550
Petição 870190112962, de 05/11/2019, pág. 78/134
74/105 de decodificação de um sinal é mostrado. Em algumas implementações, o método 550 da Figura 5B é uma versão mais detalhada do método 500 de decodificação do sinal de áudio da Figura 5A. O método 550 pode ser realizado pelo segundo dispositivo 106 da Figura 1, pelo decodif icador 118 das Figuras 1 e 2, ou ambos.
[0127] O método 550 inclui receber, em um decodificador, pelo menos uma porção de um fluxo de bits de um codificador, em 552. O fluxo de bits inclui um primeiro quadro e um segundo quadro. 0 primeiro quadro inclui uma primeira porção de um canal médio e um primeiro valor de um parâmetro estéreo, e o segundo quadro inclui uma segunda porção do canal médio e um segundo valor do parâmetro estéreo. Por exemplo, referindo-se à Figura. 1, o segundo dispositivo 106 pode receber uma. porção do fluxo de bits 160 do codificador 114. O fluxo de bits inclui o primeiro quadro 190 e o segundo quadro 192. O primeiro quadro 190 inclui a primeira porção do canal médio 191, o primeiro valor de deslocamento quantizado 181 e o primeiro parâmetro estéreo quantizado· 183. O segundo quadro 192 inclui a segunda porção do canal médio 193, o segundo valor de deslocamento quantizado 185 e o segundo parâmetro estéreo quantizado 187.
[0128] O método 550 também inclui decodificar a primeira porção do canal médio para gerar uma primeira porção de um canal médio decodificado, em 554. Por exemplo, referindo-se à Figura 2, o decodificador de canal médio 202 pode decodificar a primeira porção do canal médio 191 para gerar a primeira porção do canal médio decodificado 170. O
Petição 870190112962, de 05/11/2019, pág. 79/134
75/105 método 550 pode também incluir realizar uma operação de transformação na primeira porção do canal médio decodificado para gerar uma primeira porção de um canal médio de domínio de frequência decodificado, em 556. Por exemplo, referindo-se à Figura 2, a unidade de transformação 204 pode realizar uma operação de transformação na primeira porção do canal médio decodificado 170 para gerar a primeira porção do canal médio decodificado de domínio de frequência 171.
[0129] 0 método 550 pode também, incluir fazer upmix da. primeira porção do canal médio de domínio de frequência decodificado para gerar uma primeira porção de um canal de domínio de frequência esquerdo e uma primeira porção de um canal de domínio de frequência direito, em 558. Por exemplo, referindo-se à Figura 1, o upmixer 206 pode fazer upmix da primeira porção do canal médio decodificado de domínio de frequência 171 para gerar o canal de domínio de frequência 250 e o canal de domínio de frequência. 254. Conforme descrito aqui, o canal de domínio de frequência 250 pode ser um canal esquerdo, e o canal de domínio de frequência 254 pode ser um canal direito. No entanto, em outras implementações, o canal de domínio de frequência 250 pode ser um canal direito, e o canal de domínio de frequência 254 pode ser um canal esquerdo.
[0130] O método 550 pode também incluir gerar uma primeira porção de um canal esquerdo com base pelo menos na primeira porção do canal de domínio de frequência esquerdo, o primeiro valor do parâmetro estéreo, em 560. Por exemplo, o upmixer 206 pode usar o primeiro parâmetro estéreo
Petição 870190112962, de 05/11/2019, pág. 80/134
76/105 quantizado 183 para gerar o canal de domínio de frequência 250. A unidade de transformação inversa. 210 pode realizar uma operação de transformação inversa no canal de domínio de frequência 250 para gerar o canal de domínio de tempo 260, e o deslocador 214 pode passar o canal de domínio de tempo 260 como o primeiro sinal de saída 126 (por exemplo, a primeira porção do canal esquerdo de acordo com o método 550) .
[0131] O método 550 pode também incluir gerar uma primeira porção de um canal direito com. base pelo menos na primeira porção do canal de domínio de frequência direito e no primeiro valor do· parâmetro estéreo, em 562. Por exemplo, o upmixer 206 pode usar o primeiro parâmetro estéreo quantizado 183 para gerar o canal de domínio de frequência 254. A unidade de transformação inversa 212 pode realizar uma operação de transformação inversa no canal de domínio de frequência 254 para gerar o canal de domínio de tempo 264, e o deslocador 214 pode passar (ou seletivamente deslocar) o canal de domínio de tempo 264 como o segundo sinal de saída 128 (por exemplo, a primeira porção do canal direito de acordo com o método 550).
[0132] O método 550 também inclui determinar que o segundo quadro está indisponível para operações de decodificação, em 564. Por exemplo, o decodificador 118 pode determinar que uma ou mais porções do segundo· quadro 192 estão indisponíveis para operações de decodificação. Para ilustrar, o segundo valor de deslocamento quantizado 185 e o segundo parâmetro estéreo quantizado 187 podem ser perdidos na transmissão (do primeiro dispositivo 104 para o
Petição 870190112962, de 05/11/2019, pág. 81/134
77/105 segundo dispositivo 106) com base em más condições de transmissão. O método 550 também inclui gerar, com base pelo menos no primeiro valor do parâmetro estéreo, uma. segunda porção do canal esquerdo e uma segunda porção do canal direito em resposta à determinação de que o segundo quadro está indisponível, em. 566. A segunda porção do canal esquerdo e a segunda porção do canal direito podem corresponder a uma versão decodificada do segundo quadro.
[0133] Por exemplo, o interpolador de parâmetro estéreo 208 pode interpelar (ou estimar) o segundo valor de deslocamento quantizado 185 com. base no primeiro valor de deslocamento de domínio de frequência quantizado 281. Para ilustrar, o interpolador de parâmetro estéreo 208 pode gerar o segundo valor de deslocamento de domínio de frequência interpelado 285 com. base no primeiro valor de deslocamento de domínio de frequência quantizado 281. O interpolador de parâmetro estéreo 208 pode também interpelar (ou estimar) o segundo parâmetro estéreo quantizado 187 com base no primeiro parâmetro estéreo quantizado 183. Por exemplo, o interpolador de parâmetro estéreo 208 pode gerar um segundo parâmetro estéreo interpelado 287 com base no primeiro parâmetro estéreo quantizado 183.
[0134] O upmixer 206 pode fazer upmix do segundo canal médio decodificado de domínio de frequência 173 para gerar o canal de domínio de frequência 252 e o canal de domínio de frequência 256. O upmixer 206 pode aplicar o segundo parâmetro estéreo interpelado 287 ao segundo canal médio decodificado de domínio de frequência 173 durante as
Petição 870190112962, de 05/11/2019, pág. 82/134
78/105 operações de upmix para gerar os canais de domínio de frequência 252, 256. De acordo com. a implementação em que o primeiro valor de deslocamento quantizado 181 inclui um deslocamento de domínio de frequência (por exemplo, o primeiro valor de deslocamento quantizado 181 corresponde a um primeiro valor de deslocamento de domínio de frequência quantizado 281), o upmixer 206 pode realizar urn deslocamento de domínio de frequência (por exemplo, ura deslocamento de fase) com base no segundo valor de deslocamento de domínio de frequência interpolado 285 para gerar o canal de domínio de frequência. 256.
[0135] A unidade de transformação inversa 210 pode realizar uma operação de transformação inversa no canal de domínio de frequência 2 52 para gerar o canal de domínio de tempo 262, e a unidade de transformação inversa 212 pode realizar uma operação de transformação inversa no canal de domínio de frequência 256 para gerar um canal de domínio de tempo 266. 0 interpolador de valor de deslocamento 216 pode interpelar (ou estimar) o segundo valor de deslocamento quantizado 185 com base no primeiro valor de deslocamento de domínio de tempo quantizado 291. Por exemplo, o interpolador de valor de deslocamento 216 pode gerar o segundo valor de deslocamento de domínio de tempo interpolado 295 com base no primeiro valor de deslocamento de domínio de tempo quantizado 291. De acordo com a implementação em que o primeiro valor de deslocamento quantizado 181 corresponde ao primeiro valor de deslocamento de domínio de frequência quantizado 281, o deslocador 214 pode bypassar as operações de deslocamento e
Petição 870190112962, de 05/11/2019, pág. 83/134
79/105 passar os canais de domínio de tempo 2 62, 2 66 como os sinais de saída 126, 128, respectivamente. De acordo com. a implementação em. que o primeiro valor de deslocamento quantizado 181 corresponde ao primeiro valor de deslocamento de domínio de tempo quantizado 291, o deslocador 214 pode deslocar o canal de domínio de tempo 266 pelo segundo valor de deslocamento de dominio de tempo interpolado 295 para gerar o segundo sinal de saída 128.
[0136] Dessa forma, o método 550 pode permitir ao decodificador 118 interpolar (ou estimar) parâmetros estéreo para quadros que são perdidos durante a. transmissão (por exemplo, o segundo quadro 192) com base em parâmetros estéreo para um ou mais quadros prévios.
[0137] Referindo-se à Figura 6, um diagrama de blocos de um. exemplo ilustrativo particular de um dispositivo (por exemplo, um dispositivo de comunicação sera fio) é apresentado e geralmente designado 600. Em várias implementações, o dispositivo 600 pode ter menos ou mais componentes do que ilustrado na Figura 6. Em. uma. implementação ilustrativa, o dispositivo 600 pode corresponder ao primeiro dispositivo 104 da Figura 1, ao segundo dispositivo 106 da. Figura 1 ou a uma combinação dos mesmos. Em uma implementação ilustrativa, o dispositivo 600 pode realizar uma ou mais operações descritas cora referência a sistemas e métodos das Figuras 1-3, 4A, 4B, 5A
[0138] Em uma implementação particular, o dispositivo 600 inclui um processador 606 (por exemplo, uma unidade de processamento central (CPU)). O dispositivo 600
Petição 870190112962, de 05/11/2019, pág. 84/134
80/105 pode incluir urn ou mais processadores adicionais 610 (por exemplo, um ou mais processadores de sinal digital (DSPs)). Os processadores 610 podem incluir um. codificadordecodificador (CODEC) de mídia (por exemplo, fala e música) 608, e um cancelador de eco 612. O CODEC de mídia 608 pode incluir o decodif icador 118, o codificador 114 ou uma. combinação dos mesmos.
[0139] O dispositivo 600 pode incluir uma memória 153 e um CODEC 634. Embora o CODEC de mídia 608 seja ilustrado como um componente dos processadores 610 (por exemplo, circuitos dedicados e/ou código de programação executável), em outras implementações, um ou mais componentes do CODEC de mídia 608, tais como o decodificador 118, o codificador 114 ou uma combinação dos mesmos, podem ser incluídos no processador 606, no CODEC 634, em outro componente de processamento, ou uma combinação dos mesmos.
[0140] O dispositivo 600 pode incluir o transmissor 110 acoplado a uma antena 642. O dispositivo 600 pode incluir um visor 628 acoplado a um controlador de visor 626. Um ou mais alto-falantes 648 podem ser acoplados ao CODEC 634. Um ou mais microfones 646 podem ser acoplados, através da(s) interface(s) de entrada 112, ao CODEC 634. Em uma implementação particular, os altofalantes 648 podem incluir o primeiro altifalante 142, o segundo altifalante 144 da Figura 1, ou uma combinação dos mesmos. Em. uma implementação particular, os microfones 646 podem, incluir o primeiro microfone 14 6, o segundo microfone 148 da Figura 1, ou uma combinação dos mesmos. O CODEC 634
Petição 870190112962, de 05/11/2019, pág. 85/134
81/105 pode incluir urn conversor analógico para digital (DAC) 602 e um conversor digital para analógico (ADC) 604.
[0141] A memória 153 pode incluir instruções 660 executáveis pelo processador 606, os processadores 610, o CODEC 634, outra unidade de processamento do dispositivo 600, ou uma combinação dos mesmos, para realizar uma ou mais operações descritas com referência às Figuras 1-3, 4A, 4B, 5A, 5B. As instruções 660 podem ser executáveis para levar o processador (por exemplo, o processador 606, os processadores 606, o CODEC 634, o decodificador 118, outra unidade de processamento do dispositivo 600, ou uma. combinação dos mesmos) a realizar o método 400 da Figura 4A, o método 450 da Figura 4B, o método 500 da Figura 5A, o método 550 da Figura 5B, ou uma combinação dos mesmos.
[0142] Um ou mais componentes do dispositivo 600 podem ser implementados através de hardware dedicado (por exemplo, circuitos), por um processador executando instruções para realizar uma ou mais tarefas, ou uma combinação dos mesmos. Como um exemplo, a memória 153 ou um ou mais componentes do processador 606, os processadores 610 e/ou o CODEC 634 podem ser um dispositivo de memória, tal como uma memória de acesso aleatório (RAM), memória de acesso aleatório magnorresistiva (MRAM), MRAM de transferência de torque de rotação (STT-MRAM), memória flash, memória somente de leitura (ROM), memória somente de leitura programável (FROM), memória somente de leitura programável apagável (EPROM) , memória somente de leitura, programável eletricamente apagável (EEPROM), registros, disco rígido, um disco removível ou uma memória somente de
Petição 870190112962, de 05/11/2019, pág. 86/134
82/105 leitura de disco compacto (CD-ROM). O dispositivo de memória pode incluir instruções (por exemplo, as instruções 660) que, quando executadas por um computador (por exemplo, um processador no CODEC 634, o processador 606 e/ou os processadores 610), podem levar o computador a realizar uma ou mais operações descritas com referência às Figuras 1-3, 4A, 4B, 5A, 5B. Como um exemplo, a memória. 153 ou os um ou mais componentes do processador 606, os processadores 610 e/ou o CODEC 634 podem ser um meio legível por computador não transitório que inclui instruções (por exemplo, as instruções 660) que, quando executadas por um computador (por exemplo, um processador no CODEC 634, o processador 606 e/ou os processadores 610), levam o computador a realizar um ou mais operações descritas com. referência às Figuras 1-3, 4A, 4B, 5A, 5B.
[0143] Em uma implementação particular, o dispositivo 600 pode ser incluído em um dispositivo com sistema em. pacote ou sistema em chip (por exemplo, um modem, de estação móvel (MSM) ) 622. Em. uma implementação particular, o processador 606, os processadores 610, o controlador de visor 626, a memória 153, o CODEC 634 e o transmissor 110 são incluídos em. um dispositivo com sistema em pacote ou sistema em. chip 622. Em uma. implementação particular, um dispositivo de entrada 630, tal como uma tela de toque e/ou teclado, e uma fonte de alimentação 644 são acoplados ao dispositivo com sistema em chip 622. Além disso, em uma implementação particular, como ilustrado na Figura 6, o visor 628, o dispositivo de entrada 630, o alto-falantes 648, os microfones 646, a antena 642, e a
Petição 870190112962, de 05/11/2019, pág. 87/134
83/105 fonte de alimentação 644 são externos ao dispositivo com sistema em. chip 622. No entanto, cada, um do visor 628, o dispositivo de entrada 630, os alto-falantes 648, os microfones 646, a antena 642 e a fonte de alimentação 644 pode ser acoplado a um componente do dispositivo com sistema em chip 622, tal como uma interface ou um controlador.
[0144] O dispositivo 600 pode incluir um telefone sem fio, um dispositivo de comunicação móvel, um telefone celular, um smartphone, um telefone celular, um laptop, um computador de mesa, um computador, um tablet, uma set-topbox, um assistente digital pessoal (PDA), um dispositivo de visor, uma televisão, um console de jogos, um reprodutor de música, um rádio, um reprodutor de vídeo, uma unidade de entretenimento, um dispositivo de comunicação, uma unidade de dados de localização fixa, ura reprodutor de raídia pessoal, um reprodutor de vídeo digital, um disco de vídeo digital (DVD), um sintonizador, uma câmera, um dispositivo de navegação, um sistema decodif icador, um sistema, codificador, ou qualquer combinação dos mesmos.
[0145] Em uma implementação particular, um ou mais componentes dos sistemas e dispositivos divulgados aqui podem, ser integrados em um aparelho ou sistema de decodificação (por exemplo, um dispositivo eletrônico, um CODEC ou um processador nele), em um aparelho ou sistema de codificação, ou ambos. Em outras implementações, um ou mais componentes dos sistemas e dispositivos divulgados aqui podem, ser integrados em um telefone sem. fio, um tablet, um computador de mesa, um laptop, uma set-top-box, um
Petição 870190112962, de 05/11/2019, pág. 88/134
84/105 reprodutor de música, um reprodutor de vídeo, uma unidade de entretenimento, uma televisão, um console de jogos, um dispositivo de navegação, um dispositivo de comunicação, um assistente pessoal digital (PDA), uma unidade de dados de localização fixa, um reprodutor de mídia pessoal ou outro tipo de dispositivo.
[0146] Em conjunto com as técnicas descritas aqui, um primeiro aparelho inclui meios para receber um fluxo de bits. O fluxo de bits inclui um canal médio e um valor quantizado representando um deslocamento entre um canal de referência associado com um codificador e um canal alvo associado com o codificador. O valor quantizado baseia-se em um valor do deslocamento. O valor é associado com o codificador e tendo uma precisão maior do que o valor quantizado. Por exemplo, os meios para receber o fluxo de bits podem incluir o segundo dispositivo 106 da Figura 1, um receptor (não mostrado) do segundo dispositivo 106, o decodificador 118 da Figura 1, 2 ou 6, a antena 642 da Figura. 6, um ou mais outros circuitos, dispositivos, componentes, módulos, ou uma combinação dos mesmos.
[0147] O primeiro aparelho pode também incluir meios para decodificar o canal médio para gerar um canal médio decodificado. Por exemplo, os meios para decodificar o canal médio podem incluir o decodificador 118 das Figuras 1, 2 ou 6, o decodificador de canal médio 202 da Figura 2, o processador 606 da Figura 6, os processadores 610 da Figura 6, o CODEC 634 da Figura 6, as instruções 660 da Figura 6, executáveis por um processador, um ou mais outros circuitos, dispositivos, componentes, módulos, ou uma
Petição 870190112962, de 05/11/2019, pág. 89/134
85/105 combinação dos mesmos.
[0148] O primeiro aparelho pode também incluir meios para gerar um primeiro canal com base no canal médio decodificado. O primeiro canal corresponde ao canal de referência. Por exemplo, os meios para gerar o primeiro canal podem incluir o decodificador 118 das Figuras 1, 2 ou 6, a unidade de transformação inversa 210 da. Figura 2, o deslocador 214 da Figura 2, o processador 606 da Figura 6, os processadores 610 da Figura 6, o CODEC 634 da Figura 6, as instruções 660 da Figura 6, executáveis por um. processador, um ou mais outros circuitos, dispositivos, componentes, módulos, ou uma combinação dos mesmos.
[0149] O primeiro aparelho pode também incluir meios para gerar um segundo canal com base no canal médio decodificado e no valor quantizado. O segundo canal corresponde ao canal alvo. Os meios para gerar o segundo canal podem incluir o decodificador 118 das Figuras 1, 2 ou 6, a unidade de transformação inversa 212 da Figura 2, o desiocaaor 2_i.4 da. F.i.gura z, o processador 606 da igura o, os processadores 610 da Figura 6, o CODEC 634 da Figura 6, as instruções 660 da Figura 6, executáveis por um processador, um ou mais outros circuitos, dispositivos, componentes, módulos, ou uma. combinação dos mesmos.
[0150] Em conjunto com as técnicas descritas aqui, um segundo aparelho inclui meios para receber um fluxo de bits de um codificador. O fluxo de bits pode incluir um. canal médio e um valor quantizado representando um deslocamento entre um canal de referência, associado com o codificador e um canal alvo associado com o codificador.
Petição 870190112962, de 05/11/2019, pág. 90/134
86/105 valor quantizado pode ser com base em um valor do deslocamento que tem uma precisão maior do que o valor quantizado. Por exemplo, os meios para receber o fluxo de bits podem incluir o segundo dispositivo 106 da Figura 1, um receptor (não mostrado) do segundo dispositivo 106, o decodif icador 118 da Figura 1, 2 ou 6, a antena 642 da Figura 6, um ou mais outros circuitos, dispositivos, componentes, módulos, ou uma combinação dos mesmos.
[0151] O segundo aparelho pode também incluir meios para decodificar o canal médio para gerar um canal médio decodificado. Por exemplo, os meios para decodificar o canal médio podem incluir o decodificador 118 das Figuras 1, 2 ou 6, o decodificador de canal médio 202 da Figura 2, o processador 606 da. Figura 6, os processadores 610 da Figura 6, o CODEC 634 da Figura 6, as instruções 660 da Figura 6, executáveis por um processador, um ou mais outros circuitos, dispositivos, componentes, módulos, ou uma combinação dos mesmos.
[0152] O segundo aparelho pode também, incluir meios para realizar uma operação de transformação no canal médio decodificado para gerar um canal médio de domínio de frequência. decodificado. Por exemplo, os meios para realizar a operação de transformação podem incluir o decodif icador 118 das Figuras 1, 2 ou 6, a unidade de transformação 204 da Figura 2, o processador 606 da Figura 6, os processadores 610 da Figura 6, o CODEC 634 da Figura 6, as instruções 660 da Figura 6, executáveis por um processador, um. ou mais outros circuitos, dispositivos, componentes, módulos, ou uma combinação dos mesmos.
Petição 870190112962, de 05/11/2019, pág. 91/134
87/105
[0153] O segundo aparelho pode também incluir meios para fazer upmix do canal médio de domínio de frequência, decodificado para gerar um primeiro canal de domínio de frequência e um segundo canal de domínio de frequência. Por exemplo, os meios para fazer upmix podem incluir o decodif icador 118 das Figuras 1, 2 ou 6,o upmixer 206 da Figura 2, o processador 606 da Figura 6,os processadores 610 da Figura 6, o CODEC 634 da Figura 6,as instruções 660 da Figura 6, executáveis por um processador, um ou mais outros circuitos, dispositivos, componentes, módulos, ou uma combinação dos mesmos.
[0154] O segundo aparelho pode também incluir meios para gerar um primeiro canal com base no primeiro canal de domínio de frequência. O primeiro canal pode corresponder ao canal de referência. Por exemplo, os meios para gerar o primeiro canal podem incluir o decodificador 118 das Figuras 1, 2 ou 6, a unidade de transformação inversa 210 da Figura 2, o deslocador 214 da Figura 2, o processador 606 da. Figura 6, os processadores 610 da Figura. 6, o CODEC 634 da Figura 6, as instruções 660 da Figura 6, executáveis por um processador, um ou mais outros circuitos, dispositivos, componentes, módulos, ou uma. combinação dos mesmos.
[0155] O segundo aparelho pode também incluir meios para gerar um segundo canal com base no segundo canal de domínio de frequência. O segundo canal pode corresponder ao canal alvo. Se o valor quantizado corresponder a um deslocamento de domínio de frequência, o segundo canal de domínio de frequência pode ser deslocado em um domínio de
Petição 870190112962, de 05/11/2019, pág. 92/134
88/105 frequência pelo valor quantizado. Se o valor quantizado corresponder a um deslocamento de domínio de tempo, uma versão de domínio de tempo do segundo canal de dominio de frequência pode ser deslocado pelo valor quantizado. Os meios para gerar o segundo canal podem incluir o decodif icador 118 das Figuras 1, 2 ou 6, a unidade de transformação inversa. 212 da Figura. 2, o deslocador 214 da Figura 2, o processador 606 da Figura 6, os processadores 610 da Figura 6, o CODEC 634 da Figura 6, as instruções 660 da Figura 6, executáveis por um processador, um ou mais outros circuitos, dispositivos, componentes, módulos, ou uma combinação dos mesmos.
[0156] Em conjunto com as técnicas descritas aqui, um. terceiro aparelho inclui meios para receber pelo menos uma porção de um fluxo de bits. O fluxo de bits inclui um primeiro quadro e um segundo quadro. 0 primeiro quadro inclui uma primeira porção de um canal médio e um primeiro valor de um parâmetro estéreo, e o segundo quadro inclui uma. segunda, porção do canal médio e um segundo valor do parâmetro estéreo. Os meios para recepção podem incluir o segundo dispositivo 106 da Figura 1, um receptor (não mostrado) do segundo dispositivo 106, o decodificador 118 da Figura 1, 2 ou 6, a antena 642 da. Figura 6, um ou mais outros circuitos, dispositivos, componentes, módulos, ou uma combinação dos mesmos.
[0157] O terceiro aparelho pode também incluir meios para, decodificar a primeira, porção do canal médio para. gerar uma primeira porção de um canal médio decodificado. Por exemplo, os meios para decodificação
Petição 870190112962, de 05/11/2019, pág. 93/134
89/105 podem incluir o decodificador 118 das Figuras 1, 2 ou 6, o decodificador de canal médio 202 da Figura 2, o processador 606 da Figura. 6, os processadores 610 da. Figura 6, o CODEC 634 da Figura 6, as instruções 660 da Figura 6, executáveis por um processador, um ou mais outros circuitos, d i s p o s i t i vo s, component e s, mó du1o s, ou uma comb i na ç ão d o s mesmos.
[0158] O terceiro aparelho pode também incluir meios para gerar uma primeira porção de um canal esquerdo com base pelo menos na primeira, porção do canal médio decodificado e no primeiro valor do parâmetro estéreo. Por exemplo, os meios para gerar a primeira porção do canal esquerdo podem incluir o decodificador 118 das Figuras 1, 2 ou 6, a unidade de transformação inversa 210 da. Figura 2, o deslocador 214 da Figura. 2, o processador 606 da. Figura 6, os processadores 610 da Figura 6, o CODEC 634 da Figura 6, as instruções 660 da Figura 6, executáveis por um processador, um ou mais outros circuitos, dispositivos, componentes, módulos, ou uma combinação dos mesmos.
[0159] O terceiro aparelho pode também incluir meios para gerar uma primeira porção de um canal direito com base pelo menos na primeira porção do canal médio decodificado e no primeiro valor do parâmetro estéreo. Por exemplo, os meios para gerar a primeira porção do canal direitos podem incluir o decodificador 118 das Figuras 1, 2 ou 6, a unidade de transformação inversa 212 da Figura 2, o deslocador 214 da. Figura 2, o processador 606 da Figura 6, os processadores 610 da Figura. 6, o CODEC 634 da Figura. 6, as instruções 660 da Figura 6, executáveis por um
Petição 870190112962, de 05/11/2019, pág. 94/134
90/105 processador, um ou mais outros circuitos, dispositivos, componentes, módulos, ou uma combinação dos mesmos.
[0160] 0 terceiro aparelho pode também incluir meios para gerar, em resposta ao segundo quadro estar indisponível para operações de decodificação, uma segunda porção do canal esquerdo e uma segunda porção do canal direito com. base pelo menos no primeiro valor do parâmetro estéreo. A segunda porção do canal esquerdo e a segunda porção do canal direito correspondem a uma versão decodificada do segundo quadro. Os meios para, gerar a segunda porção do canal esquerdo e a. segunda porção do canal direito podem incluir o decodificador 118 das Figuras 1, 2 ou 6, o interpolador de valor de deslocamento estéreo 216 da. Figura 2, o interpolador de parâmetro estéreo 208 da. Figura 2, o deslocador 214 da Figura 2, o processador 606 da Figura 6, os processadores 610 da Figura 6, o CODEC 634 da Figura 6, as instruções 660 da Figura 6, executáveis por um. processador, um. ou mais outros circuitos, dispositivos, componentes, módulos, ou uma combinação dos mesmos.
[0161] Em conjunto com as técnicas descritas aqui, um quarto aparelho inclui meios para receber pelo menos uma. porção de um fluxo de bits de um codificador. O fluxo de bits pode incluir um. primeiro quadro e um segundo quadro. O primeiro quadro pode incluir uma primeira porção de um canal médio e um primeiro valor de um parâmetro estéreo, e o segundo quadro pode incluir uma segunda porção do canal médio e um segundo valor do parâmetro estéreo. Os meios para recepção podem incluir o segundo dispositivo 106 da Figura 1, um receptor (não mostrado) do segundo
Petição 870190112962, de 05/11/2019, pág. 95/134
91/105 dispositivo 106, o decodificador 118 da Figura 1, 2 ou 6, a antena 642 da Figura.
um ou mais outros circuitos, dispositivos, componentes, módulos, ou uma combinação dos mesmos.
[0162] O quarto aparelho pode também incluir meios para decodificar a primeira porção do canal médio para. gerar uma primeira porção de um canal médio decodificado. Por exemplo, os meios para decodificar a primeira porção do canal médio podem incluir o decodificador 118 das Figuras 1, 2 ou 6, o decodificador de canal médio 202 da. Figura 2, o processador 606 da Figura 6, os processadores 610 da Figura 6, o CODEC 634 da Figura 6, as instruções 660 da Figura 6, executáveis por um processador, um ou mais outros circuitos, dispositivos, componentes, módulos, ou uma. combinação dos mesmos.
[0163] O quarto aparelho pode também incluir meios para realizar uma operação de transformação na primeira porção do canal médio decodificado para gerar uma primeira porção de um canal médio de domínio de frequência, decodificado. Por exemplo, os meios para realizar a operação de transformação podem incluir o decodificador 118 das Figuras 1, 2 ou 6, a unidade de transformação 204 da Figura 2, o processador 606 da Figura. 6, os processadores 610 da Figura 6, o CODEC 634 da Figura 6, as instruções 660 da Figura 6, executáveis por um processador, um ou mais outros circuitos, dispositivos, componentes, módulos, ou uma combinação dos mesmos.
[0164] O quarto aparelho pode também incluir meios para fazer upmix da primeira porção do canal médio de
Petição 870190112962, de 05/11/2019, pág. 96/134
92/105 domínio de frequência decodificado para gerar uma primeira porção de um canal de domínio de frequência esquerdo e uma primeira porção de um canal de domínio de frequência, direito. Por exemplo, os meios para fazer upmix podem incluir o decodif icador 118 das Figuras 1, 2 ou 6, o upmixer 206 da Figura 2, o processador 606 da Figura. 6, os processadores 610 da Figura 6, o CODEC 634 da Figura 6, as instruções 660 da Figura 6, executáveis por um processador, um ou mais outros circuitos, dispositivos, componentes, módulos, ou uma combinação dos mesmos.
[0165] O quarto aparelho pode também incluir meios para gerar uma primeira porção de um canal esquerdo com base pelo menos na primeira porção do canal de domínio de frequência esquerdo e no primeiro valor do parâmetro estéreo. Por exemplo, os meios para gerar a primeira porção do canal esquerdo podem incluir o decodificador 118 das Figuras 1, 2 ou 6, a unidade de transformação inversa 210 da Figura. 2, o deslocador 214 da. Figura 2, o processador 606 da Figura. 6, os processadores 610 da Figura 6, o CODEC 634 da Figura 6, as instruções 660 da Figura 6, executáveis por um processador, um ou mais outros circuitos, d i s p o s i t i vo s, component e s, mó du1o s, ou uma comb i na ç ão d o s mesmos.
[0166] O quarto aparelho pode também incluir meios para gerar uma primeira porção de um canal direito com base pelo menos na primeira porção do canal de domínio de frequência direito e no primeiro valor do parâmetro estéreo. Por exemplo, os meios para gerar a primeira porção do canal direito podem incluir o decodificador 118 das
Petição 870190112962, de 05/11/2019, pág. 97/134
93/105
Figuras 1, 2 ou 6, a unidade de transformação inversa 212 da Figura. 2, o deslocador 214 da. Figura 2, o processador 606 da Figura. 6, os processadores 610 da Figura 6, o CODEC 634 da Figura 6, as instruções 660 da Figura 6, executáveis por um processador, um ou mais outros circuitos, d i s p o s i t i vo s, component e s, mó du1o s, ou uma comb i na ç ão do s mesmos.
[0167] O quarto aparelho pode também incluir meios para gerar, com base pelo menos no primeiro valor do parâmetro estéreo, uma segunda porção do canal esquerdo e uma segunda porção do canal direito em resposta a uma. determinação de que o segundo quadro está indisponível. A segunda porção do canal esquerdo e a segunda porção do canal direito podem corresponder a uma versão decodificada do segundo quadro. Os meios para gerar a segunda porção do canal esquerdo e a segunda porção do canal direito podem incluir o decodif icador 118 das Figuras 1, 2 ou 6, o interpolador de valor de deslocamento estéreo 216 da Figura 2, o interpolador de parâmetro estéreo 208 da Figura 2, o deslocador 214 da Figura 2, o processador 606 da Figura 6, os processadores 610 da Figura 6, o CODEC 634 da Figura 6, as instruções 660 da Figura 6, executáveis por um processador, um. ou mais outros circuitos, dispositivos, componentes, módulos, ou uma combinação dos mesmos.
[0168] Deve-se observar que várias funções executadas pelo um ou mais componentes dos sistemas e dispositivos divulgados aqui são descritas como sendo executadas por determinados componentes ou módulos. Esta divisão de componentes e módulos é apenas para ilustração.
Petição 870190112962, de 05/11/2019, pág. 98/134
94/105
Em uma implementação alternativa, uma função executada por um componente ou módulo específico pode ser dividida entre múltiplos componentes ou módulos. Além disso, em uma. implementação alternativa, dois ou mais componentes ou módulos podem ser integrados em um único componente ou módulo. Cada componente ou módulo pode ser implementado usando hardware (por exemplo, um dispositivo de matriz de portas programáveis em campo ÍFPGA), um circuito integrado de aplicação específica (ASIC), um DSP, um controlador etc.), software (por exemplo, instruções executáveis por um. processador), ou qualquer combinação dos mesmos.
[0169] Referindo-se à Figura 7, um diagrama de blocos de um exemplo ilustrativo particular de uma estação de base 700 é apresentado. Em várias implementações, a. estação de base 700 pode ter mais componentes ou menos componentes do que ilustrado na Figura 7. Em um exemplo ilustrativo, a estação de base 700 pode incluir o segundo dispositivo 106 da Figura 1. Em. um. exemplo ilustrativo, a estação de base 700 pode operar de acordo com. um ou mais dos métodos ou sistemas descritos com referência às Figuras
1-3, 4A, 4B, 5A, 5B, e 6.
[0170] A estação de base 700 pode ser parte de um sistema de comunicação sem. fio. O sistema de comunicação sem. fio pode incluir múltiplas estações de bases e múltiplos dispositivos sem. fio. O sistema de comunicação sem fio pode ser um sistema de Evolução de Longo Prazo (LTE), um sistema de Acesso Múltiplo por Divisão de Códigos (CDMA) , um. Sistema Global para. Comunicações Móveis (GSM) , ura sistema de rede de área local sem fio (WLAN) , ou algum
Petição 870190112962, de 05/11/2019, pág. 99/134
95/105 outro sistema sem fio. Um sistema CDMA pode implementar CDMA de Banda Larga (WCDMA), CDMA IX, Dados de Evolução Otimizados (EVDO), CDMA Sincrono por Divisão de Tempo (TDSCDMA), ou alguma outra versão de CDMA.
[0171] Os dispositivos sem fio podem também ser referidos como equipamento de usuário (UE), uma estação móvel, um. terminal, um terminal de acesso, uma unidade de assinante, uma estação etc. Os dispositivos sem fio poderá incluir um telefone celular, um smartphone, um tablet, um modem sem fio, um assistente digital pessoal (PDA) , um. dispositivo portátil, um laptop, um smartbook, um netbook, um tablet, um telefone sem fio, uma estação de circuito local sem fio (WLL) , um dispositivo Bluetooth etc. Os dispositivos sem fio podem incluir ou corresponder ao dispositivo 600 da Figura 6.
[0172] Várias funções podem ser realizadas por um ou mais componentes da estação de base 700 (e/ou em outros componentes não mostrado) , tais como enviar e receber mensagens e dados (por exemplo, dados de áudio) . Em. um exemplo particular, a estação de base 700 inclui um processador 706 (por exemplo, uma CPU) . A estação de base 700 pode incluir um transcodificador 710. O transcodificador 710 pode incluir um. CODEC de áudio 708. Por exemplo, o transcodificador 710 pode incluir um ou mais componentes (por exemplo, circuitos) configurados para realizar operações do CODEC de áudio 708. Como outro exemplo, o transcodificador 710 pode ser configurado para executar uma. ou mais instruções legíveis por computador para realizar as operações do CODEC de áudio 708. Embora o
Petição 870190112962, de 05/11/2019, pág. 100/134
96/105
CODEC de áudio 708 seja ilustrado como um componente do transcodificador 710, em. outros exemplos, um ou mais componentes do CODEC de áudio 708 podem ser incluídos no processador 706, outro componente de processamento, ou uma combinação dos mesmos. Por exemplo, um decodificador 738 (por exemplo, um decodificador Vocoder) pode ser incluído em um processador de dados de recepção 764. Como outro exemplo, um codificador 736 (por exemplo, um codificador Vocoder) pode ser incluído em um processador de dados de transmissão 782. 0 codificador 736 pode incluir o codificador 114 da Figura 1. O decodif icador 7.38 pode incluir o decodificador 118 da Figura 1.
[0173] O transcodificador 710 pode funcionar para transcodificar mensagens e dados entre duas ou mais redes. O transcodificador 710 pode ser configurado para converter mensagem e dados de áudio de um primeiro formato (por exemplo, um formato digital) em um segundo formato. Para ilustrar, o decodificador 738 pode decodificar sinais codificados tendo um primeiro formato e o codificador 736 pode codificar sinais decodificados em sinais codificados tendo um segundo formato. Adicionalmente ou alternativamente, o transcodificador 710 pode ser configurado para, realizar adaptação de taxa de dados. Por exemplo, o transcodificador 710 pode realizar conversão descendente em uma taxa de dados ou conversão ascendente da taxa de dados sem alterar um formato dos dados de áudio. Para ilustrar, o transcodificador 710 pode realizar conversão descendente de sinais de 64 kbit/s em sinais de
Petição 870190112962, de 05/11/2019, pág. 101/134
97/105
[0174] A estação de base 700 pode incluir uma memória 732. A memória 732, tal como um dispositivo de armazenamento legivel por computador, pode incluir instruções. As instruções podem incluir uma ou mais instruções que são executáveis pelo processador 706, pelo transcodificador 710, ou uma combinação dos mesmos, para realizar uma. ou mais operações descritas com referência aos métodos e sistemas das Figuras 1-3, 4A, 4B, 5A, 5B, 6.
[0175] A estação de base 700 pode incluir múltiplos transmissores e receptores (por exemplo, transceptores), tais como um primeiro transceptor 752 e um segundo transceptor 754, acoplado a uma matriz de antenas. A matriz de antenas pode incluir uma primeira antena 742 e uma segunda antena 744. A matriz de antenas pode ser configurada para se comunicar sem fio com um. ou mais dispositivos sem fio, tais como o dispositivo 600 da Figura 6. Por exemplo, a segunda antena 744 pode receber um fluxo de dados 714 (por exemplo, um fluxo de bits) de um dispositivo sem fio. O fluxo de dados 714 pode incluir mensagens, dados (por exemplo, dados de fala codificados), ou uma comomaçao dos mesmos.
[017 6] A estação de base 7 00 pode incluir uma. conexão de rede 760, tal como uma conexão de backhaul. A. conexão de rede 760 pode ser configurada para se comunicar com uma rede núcleo ou uma ou mais estações de base da rede de comunicação sem fio. Por exemplo, a estação de base 700 pode receber um segundo fluxo de dados (por exemplo, mensagens ou dados de áudio) de uma rede núcleo através da conexão de rede 760. A estação de base 700 pode processar o
Petição 870190112962, de 05/11/2019, pág. 102/134
98/105 segundo fluxo de dados para gerar mensagens de texto ou dados de áudio e prover as mensagens ou os dados de áudio a um ou mais dispositivos sem fio através de uma. ou mais antenas da matriz de antenas ou a outra estação de base através da conexão de rede 7 60. Em uma implementação particular, a. conexão de rede 7 60 pode ser uma. conexão de rede de área, ampla (WAN) , como um. exemplo ilustrativo e não limitante. Em algumas implementações, a rede núcleo pode incluir ou corresponder a uma Rede de telefonia Pública Comutada. (PSTN) , uma. rede de estrutura de pacotes ou ambas.
[0177] A estação de base 700 pode incluir um gateway de mídia 770 que é conectado à conexão· de rede 7 60 e ao processador 706. O gateway de mídia 770 pode ser usado para converter fluxos de mídia de diferentes tecnologias de telecomunicações. Por exemplo, o gateway de mídia 770 pode converter entre diferentes protocolos de transmissão, diferentes esquemas de codificação ou ambos. Para ilustração, o gateway de mídia 770 pode converter de sinais PCM a sinais RTP (Protocol de Transporte em. Tempo Real), como um exemplo ilustrativo e não limitante. O gateway de mídia 770 pode converter dados entre redes comutadas por pacotes (por exemplo, uma. rede de Protocolo de Voz sobre Internet (VoIP) , um Subsistema. Multimídia TP (IMS), uma rede sem fio de quarta geração (4G), tal como LTE, WiMax e UMB, etc.), redes comutadas por circuito (por exemplo, uma PSTN) , e redes híbridas (por exemplo, uma rede sem fio de segunda geração (2G) , tal como GSM, GPRS e EDGE, uma rede sem fio de terceira geração (3G) , tal como WCDMA, EV-DO e HSPA, etc.).
Petição 870190112962, de 05/11/2019, pág. 103/134
99/105
[017 8] Adicionalmente, o cjateway de midia 77 0 pode incluir um transcodificador, tal como o transcodif icador 710, e pode ser configurado para, transcodificar dados quando codecs são incompatíveis. Por exemplo, o gateway de mídia 770 pode transcodificar entre um codec Multitaxa Adaptativo (AMR) e um codec G.711, como um exemplo ilustrativo e não limitante. O gateway de mídia 770 pode incluir um roteador e uma pluralidade de interfaces físicas. Em algumas implementações, o gateway de mídia 770 também pode incluir um controlador (não mostrado]. Em uma implementação específica, o controlador de gateway de mídia pode ser externo ao gateway de mídia 770, externo à estação de base 700, ou ambos. O controlador de gateway de mídia pode controlar e coordenar operações de múltiplos gateways de mídia. O gateway de mídia. 770 pode receber sinais de controle do controlador de gateway de midia e pode funcionar para fazer a ponte entre diferentes tecnologias de transmissão e pode adicionar serviço aos recursos e conexões do usuário final.
[0179] A estação de base 700 pode incluir um demodulador 762 que é acoplado aos transceptorss 752, 754, ao processador de dados do receptor 764 e ao processador 706, e o processador de dados do receptor 764 pode ser usado pelo processador 706. O demodulador 7 62 pode ser configurado para demodular sinais modulados recebidos dos transceptores 752, 754 e para fornecer dados demodulados ao processador de dados do receptor 764. O processador de dados do receptor 7 64 pode ser usado para extrair uma mensagem ou dados de áudio dos dados demodulados e enviar a
Petição 870190112962, de 05/11/2019, pág. 104/134
100/105 mensagem ou os dados de áudio ao processador 706.
[0180] A estação de base 700 pode incluir um processador de dados de transmissão 782 e um processador de transmissão de múltiplas entradas e múltiplas saídas (MIMO) 784. O processador de dados de transmissão 782 pode ser conectado ao processador 706 e ao processador MIMO de transmissão 784. O processador MIMO de transmissão 784 pode ser acoplado aos transceptores 752, 754 e ao processador 706. Em algumas implementações, o processador MIMO de transmissão 784 pode ser conectado ao gateway de mídia 770. O processador de dados de transmissão 782 pode ser configurado para receber as mensagens ou os dados de áudio do processador 706 e codificar as mensagens ou os dados de áudio com. base em um esquema de codificação, tal como CDMA ou OFDM (multiplexação por divisão de frequência ortogonal), como um exemplo ilustrativo e não limitante. O processador de dados de transmissão 782 pode prover os dados codificados ao processador MIMO de transmissão 784.
[0181] Os dados codificados podem ser multiplexados com outros dados, tais como dados piloto, usando técnicas CDMA ou OFDM para gerar dados multiplexados. Os dados multiplexados podem ser modulados (por exemplo, mapeados por símbolo) pelo processador de dados de transmissão 782, com base em um esquema de modulação especifico (por exemplo, chaveamento de deslocamento de fase binária (BPSK), chaveamento de deslocamento de fase em quadrature (QSPK), chaveamento de deslocamento de fase M-ária (M-PSK), modulação de amplitude de quadratura M-ária (M-QAM) etc.) para gerar
Petição 870190112962, de 05/11/2019, pág. 105/134
101/105 símbolos de modulação. Em uma implementação especifica, os dados de codec e outros dados codificados podem ser modulados usando diferentes esquemas de modulação. Ά taxa de dados, codificação e modulação para cada fluxo de dados podem ser determinadas por instruções executadas pelo processador 706.
[0182] O processador MIMO de transmissão 784 pode ser configurado para receber os símbolos de modulação do processador de dados de transmissão 782 e pode ainda processar os símbolos de modulação e pode realizar filtragem espacial (beamforming) nos dados. Por exemplo, o processador MIMO de transmissão 784 pode aplicar pesos de filtragem espacial aos símbolos de modulação.
[0183] Durante a operação, a segunda antena 744 da estação de base 700 pode receber um fluxo de dados 714. O segundo transceptor 754 pode receber o fluxo de dados 714 da segunda antena 744 e pode prover o fluxo de dados 714 ao demodulador 762. O demodulador 762 pode demodular sinais modulados do fluxo de dados 714 e prover dados demoduiados ao processador de dados do receptor 764. o processador de dados do receptor 764 pode extrair dados de áudio dos dados demoduiados e prover os dados de áudio extraídos ao processador 706.
[0184] O processador 706 pode prover os dados de áudio ao transcodificador 710 para transcodificação. O decodificador 738 do transcodificador 710 pode decodificar os dados de áudio de ura. primeiro formato em dados de áudio decodificados e o codificador 736 pode codificar os dados de áudio decodificados em um segundo formato. Em algumas
Petição 870190112962, de 05/11/2019, pág. 106/134
102/105 implementações, o codificador 736 pode codificar os dados de áudio usando uma taxa de dados mais alta (por exemplo, conversão ascendente) ou uma taxa, de dados mais baixa (por exemplo, conversão descendente) do que a recebida do dispositivo sem fio. Em outras implementações, os dados de áudio podem não ser transcodificados. Embora a transcodificação (por exemplo, decodificação e codificação) seja ilustrada corão sendo realizada por um transcodificador 710, as operações de transcodificação (por exemplo, decodificação e codificação) podem ser realizadas por múltiplos componentes da estação de base 700. Por exemplo, a decodificação pode ser realizada pelo processador de dados do receptor 7 64 e a codificação pode ser realizadas pelo processador de dados de transmissão 782. Em outras implementações, o processador 706 pode prover os dados de áudio ao gateway de mídia 770 para conversão para outro protocolo de transmissão, esquema de codificação, ou ambos. O gateway de mídia 770 pode prover os dados convertidos a outra estação de base ou. rede núcleo através da conexão de rede 760.
[0185] Dados de áudio codificados gerados no codificador 736 podem ser providos ao processador de dados de transmissão 7 82 ou à conexão de rede 7 60 através do processador 706. Os dados de áudio transcodifiçados do transcodificador 710 podem ser providos ao processador de dados de transmissão 782 para codificação de acordo com um esquema de modulação, tal como OFDM, para gerar os símbolos de modulação. O processador de dados de transmissão 782 pode prover os símbolos de modulação ao processador MIMO de
Petição 870190112962, de 05/11/2019, pág. 107/134
103/105 transmissão 784 para processamento adicional e filtragem espacial. O processador MIMO de transmissão 784 pode aplicar pesos de filtragem espacial e pode prover os simbolos de modulação a uma ou mais antenas da matriz de antenas, tal como a primeira antena 742 através do primeiro transceptor 752. Dessa forma, a estação de base 700 pode prover um. fluxo de dados transcodifiçados 716, que corresponde ao fluxo de dados 714 recebido do dispositivo sem fio, a outro dispositivo sem fio. O fluxo de dados transcodifiçados 716 pode ter um. formato de codificação, taxa de dados, ou ambos, diferente do fluxo de dados 714. Em outras implementações, o fluxo de dados transcodifiçados 716 pode ser provido à conexão de rede 760 para transmissão a outra estação de base ou uma. rede núcleo.
[0186] Os versados na técnica ainda apreciariam que os vários blocos lógicos, configurações, módulos, circuitos e etapas de algoritmo ilustrativos descritos em conexão com as implementações aqui divulgadas podem ser implementados como hardware eletrônico, software de computador executado por um dispositivo de processamento, tal como processador de hardware ou combinações de ambos. Vários componentes, blocos, configurações, módulos, circuitos e etapas ilustrativos foram descritos acima geralmente em termos de sua funcionalidade. Se tal funcionalidade é implementada como hardware ou software executável depende da aplicação particular e restrições de projeto impostas ao sistema geral. Os versados na técnica podem, implementar a funcionalidade descrita de várias maneiras para cada aplicação particular, mas essas decisões
Petição 870190112962, de 05/11/2019, pág. 108/134
104/105 de implementação não devem ser interpretadas corão causas de um afastamento do escopo da presente invenção.
[0187] As etapas de um método ou algoritmo descrito em conexão com as implementações aqui divulgadas podem ser incorporadas diretamente em hardware, em um módulo de software executado por um processador, ou em uma. combinação dos dois. Um módulo de software pode residir em um dispositivo de memória, tal como uma memória de acesso aleatório (RAM), memória de acesso aleatório magnorresistiva (MRAM) , MRAM de transferência, de torque de rotação (STT-MRAM), memória flash, memória somente de leitura (ROM), memória somente de leitura programável (FROM), memória somente de leitura programável apagável (EPROM) , memória somente de leitura. programável eletricamente apagável (EEPROM), registros, disco rígido, ura disco removível ou uma memória somente de leitura de disco compacto (CD-ROM). Um dispositivo de memória exemplificativo é acoplado ao processador, tal que o processador possa ler informações de e gravar informações no dispositivo de memória. Em alternativa, o dispositivo de memória pode ser parte integrante do processador. O processador e o meio de armazenamento podem residir em um circuito integrado de aplicação específica (ASIC). O ASIC pode residir em um dispositivo de computação ou em um terminal de usuário. Em alternativa, o processador e o meio de armazenamento podem residir como componentes discretos em um dispositivo de computação ou em um terminal do usuário.
[0188] A descrição acima das implementações
Petição 870190112962, de 05/11/2019, pág. 109/134
105/105 divulgadas é fornecida para permitir que um versado na técnica produza ou utilize as implementações divulgadas. Várias modificações a essas implementações serão prontamente evidentes para os versados na técnica, e os princípios aqui definidos podem ser aplicados a outras implementações sem. se afastar do escopo da. invenção. Dessa, forma, a presente invenção pretende se limitar às implementações mostradas neste documento, mas deve ter o escopo mais amplo possível consistente com os princípios e novos recursos, conforme definido pelas reivindicações a seguir.

Claims (39)

1. Aparelho, compreendendo:
um receptor configurado para receber pelo menos uma porção de um fluxo de bits, o fluxo de bits compreendendo um primeiro quadro e um segundo quadro, o primeiro quadro incluindo uma primeira porção de um canal médio e um primeiro valor de um parâmetro estéreo, o segundo quadro incluindo uma segunda porção do canal médio e um segundo valor do parâmetro estéreo; e um decodificador configurado para:
decodificar a primeira porção do canal médio para gerar uma primeira porção de um canal médio decodificado;
gerar uma primeira porção de um canal esquerdo com base pelo menos na primeira porção do canal médio decodificado e no primeiro valor do parâmetro estéreo;
gerar uma primeira porção de um canal direito com base pelo menos na primeira porção do canal médio decodificado e no primeiro valor do parâmetro estéreo; e em resposta ao segundo quadro estar indisponível para operações de decodificação, gerar uma segunda porção do canal esquerdo e uma segunda porção do canal direito com base pelo menos no primeiro valor do parâmetro estéreo, na segunda porção do canal esquerdo e na segunda porção do canal direito correspondente a uma versão decodificada do segundo quadro.
2. Aparelho, de acordo com a reivindicação 1, em que o decodificador é ainda configurado para, em resposta ao segundo quadro estar disponível para as operações de decodificação, gerar um valor interpolado do parâmetro estéreo com base no primeiro valor do parâmetro estéreo e
Petição 870190112962, de 05/11/2019, pág. 111/134
2/11 no segundo valor do parâmetro estéreo.
3. Aparelho, de acordo com a reivindicação 1, em que o decodificador é ainda configurado para, em resposta ao segundo quadro estar indisponível para as operações de decodificação, gerar pelo menos a segunda porção do canal médio e uma segunda porção de um canal lateral com base pelo menos no primeiro valor do parâmetro estéreo, a primeira porção do canal médio, a primeira porção do canal esquerdo ou a primeira porção do canal direito.
4. Aparelho, de acordo com a reivindicação 3, em que o decodificador é ainda configurado para, em resposta ao segundo quadro estar indisponível para as operações de decodificação, gerar a segunda porção do canal esquerdo e a segunda porção do canal direito com base na segunda porção do canal médio, a segunda porção do canal lateral e um terceiro valor do parâmetro estéreo.
5. Aparelho, de acordo com a reivindicação 4, em que o terceiro valor do parâmetro estéreo é pelo menos com base no primeiro valor do parâmetro estéreo, um valor interpolado do parâmetro estéreo e um modo de codificação.
6. Aparelho, de acordo com a reivindicação 1, em que o decodificador é ainda configurado para, em resposta ao segundo quadro estar indisponível para as operações de decodificação, gerar pelo menos a segunda porção do canal esquerdo e a segunda porção do canal direito com base pelo menos no primeiro valor do parâmetro estéreo, na primeira porção do canal esquerdo e na primeira porção do canal direito.
7. Aparelho, de acordo com a reivindicação 1, em que o decodificador é ainda configurado para:
Petição 870190112962, de 05/11/2019, pág. 112/134
3/11 realizar uma operação de transformação na primeira porção do canal médio decodificado para gerar uma primeira porção de um canal médio de domínio de frequência decodificado;
fazer upmix da primeira porção do canal médio de domínio de frequência decodificado com base no primeiro valor do parâmetro estéreo para gerar uma primeira porção de um canal de domínio de frequência esquerdo e uma primeira porção de um canal de domínio de frequência direito;
realizar uma primeira operação de domínio de tempo na primeira porção do canal de domínio de frequência esquerdo para gerar a primeira porção do canal esquerdo; e realizar uma segunda operação de domínio de tempo na primeira porção do canal de domínio de frequência direito para gerar a primeira porção do canal direito.
8. Aparelho, de acordo com a reivindicação 7, em que, em resposta ao segundo quadro estar indisponível para operações de decodificação, o decodificador é configurado para:
gerar uma segunda porção do canal médio decodificado com base na primeira porção do canal médio decodificado;
realizar uma segunda operação de transformação na segunda porção do canal médio decodificado para gerar uma segunda porção do canal médio de domínio de frequência decodificado;
fazer upmix da segunda porção do canal médio de domínio de frequência decodificado para gerar uma segunda porção do canal de domínio de frequência esquerdo e uma
Petição 870190112962, de 05/11/2019, pág. 113/134
4/11 segunda porção do canal de domínio de frequência direito;
realizar uma terceira operação de domínio de tempo na segunda porção do canal de domínio de frequência esquerdo para gerar a segunda porção do canal esquerdo; e realizar uma quarta operação de domínio de tempo na segunda porção do canal de domínio de frequência direito para gerar a segunda porção do canal direito.
9. Aparelho, de acordo com a reivindicação 8, em que o decodificador é ainda configurado para estimar o segundo valor do parâmetro estéreo com base no primeiro valor do parâmetro estéreo, em que o segundo valor estimado do parâmetro estéreo é usado para fazer upmix da segunda porção do canal médio de domínio de frequência decodificado.
10. Aparelho, de acordo com a reivindicação 8, em que o decodificador é ainda configurado para interpolar o segundo valor do parâmetro estéreo com base no primeiro valor do parâmetro estéreo, em que o segundo valor interpolado do parâmetro estéreo é usado para fazer upmix da segunda porção do canal médio de domínio de frequência decodificado.
11. Aparelho, de acordo com a reivindicação 8, em que o decodificador é configurado para realizar uma operação de interpolação na primeira porção do canal médio decodificado para gerar a segunda porção do canal médio decodificado.
12. Aparelho, de acordo com a reivindicação 8, em que o decodificador é configurado para realizar uma operação de estimativa na primeira porção do canal médio decodificado para gerar a segunda porção do canal médio
Petição 870190112962, de 05/11/2019, pág. 114/134
5/11 decodificado .
13. Aparelho, de acordo com a reivindicação 1, em que o primeiro valor do parâmetro estéreo é um valor quantizado representando um deslocamento entre um canal de referência associado com um codificador e um canal alvo associado com o codificador, o valor quantizado com base em um valor do deslocamento, o valor do deslocamento associado com o codificador e tendo uma precisão maior do que o valor quantizado.
14. Aparelho, de acordo com a reivindicação 1, em que o parâmetro estéreo compreende um parâmetro de diferença de fase intercanal.
15. Aparelho, de acordo com a reivindicação 1, em que o parâmetro estéreo compreende um parâmetro de diferença de nivel intercanal.
16. Aparelho, de acordo com a reivindicação 1, em que o parâmetro estéreo compreende um parâmetro de diferença de tempo intercanal.
17. Aparelho, de acordo com a reivindicação 1, em que o parâmetro estéreo compreende um parâmetro de correlação intercanal.
18. Aparelho, de acordo com a reivindicação 1, em que o parâmetro estéreo compreende um parâmetro de inclinação espectral.
19. Aparelho, de acordo com a reivindicação 1, em que o parâmetro estéreo compreende um parâmetro de ganho intercanal.
20. Aparelho, de acordo com a reivindicação 1, em que o parâmetro estéreo compreende um parâmetro de voz intercanal.
Petição 870190112962, de 05/11/2019, pág. 115/134
6/11
21. Aparelho, de acordo com a reivindicação 1, em que o parâmetro estéreo compreende um parâmetro de pitch intercanal.
22. Aparelho, de acordo com a reivindicação 1, em que o receptor e o decodif icador são integrados em um dispositivo móvel.
23. Aparelho, de acordo com a reivindicação 1, em que o receptor e o decodif icador são integrados em uma estação de base.
24. Método, compreendendo:
receber, em um decodificador, pelo menos uma porção de um fluxo de bits, o fluxo de bits compreendendo um primeiro quadro e um segundo quadro, o primeiro quadro incluindo uma primeira porção de um canal médio e um primeiro valor de um parâmetro estéreo, o segundo quadro incluindo uma segunda porção do canal médio e um segundo valor do parâmetro estéreo;
decodificar a primeira porção do canal médio para gerar uma primeira porção de um canal médio decodificado;
gerar uma primeira porção de um canal esquerdo com base pelo menos na primeira porção do canal médio decodificado e no primeiro valor do parâmetro estéreo;
gerar uma primeira porção de um canal direito com base pelo menos na primeira porção do canal médio decodificado e no primeiro valor do parâmetro estéreo; e em resposta ao segundo quadro estar indisponível para operações de decodificação, gerar uma segunda porção do canal esquerdo e uma segunda porção do canal direito com base pelo menos no primeiro valor do parâmetro estéreo, na segunda porção do canal esquerdo e na segunda porção do
Petição 870190112962, de 05/11/2019, pág. 116/134
7/11 canal direito correspondente a uma versão decodificada do segundo quadro.
25. Método, de acordo com a reivindicação 24, ainda compreendendo:
realizar uma operação de transformação na primeira porção do canal médio decodificado para gerar uma primeira porção de um canal médio de domínio de frequência decodificado;
fazer upmix da primeira porção do canal médio de domínio de frequência decodificado com base no primeiro valor do parâmetro estéreo para gerar uma primeira porção de um canal de domínio de frequência esquerdo e uma primeira porção de um canal de domínio de frequência direito;
realizar uma primeira operação de domínio de tempo na primeira porção do canal de domínio de frequência esquerdo para gerar a primeira porção do canal esquerdo; e realizar uma segunda operação de domínio de tempo na primeira porção do canal de domínio de frequência direito para gerar a primeira porção do canal direito.
26. Método, de acordo com a reivindicação 25, ainda compreendendo, em resposta ao segundo quadro estar indisponível para operações de decodificação:
gerar uma segunda porção do canal médio decodificado com base na primeira porção do canal médio decodificado;
realizar uma segunda operação de transformação na segunda porção do canal médio decodificado para gerar uma segunda porção do canal médio de domínio de frequência decodificado;
Petição 870190112962, de 05/11/2019, pág. 117/134
8/11 fazer upmix da segunda porção do canal médio de domínio de frequência decodificado para gerar uma segunda porção do canal de domínio de frequência esquerdo e uma segunda porção do canal de domínio de frequência direito;
realizar uma terceira operação de domínio de tempo na segunda porção do canal de domínio de frequência esquerdo para gerar a segunda porção do canal esquerdo; e realizar uma quarta operação de domínio de tempo na segunda porção do canal de domínio de frequência direito para gerar a segunda porção do canal direito.
27. Método, de acordo com a reivindicação 26, ainda compreendendo estimar o segundo valor do parâmetro estéreo com base no primeiro valor do parâmetro estéreo, em que o segundo valor estimado do parâmetro estéreo é usado para fazer upmix da segunda porção do canal médio de domínio de frequência decodificado.
28. Método, de acordo com a reivindicação 26, ainda compreendendo interpolar o segundo valor do parâmetro estéreo com base no primeiro valor do parâmetro estéreo, em que o segundo valor interpolado do parâmetro estéreo é usado para fazer upmix da segunda porção do canal médio de domínio de frequência decodificado.
29. Método, de acordo com a reivindicação 26, ainda compreendendo realizar uma operação de interpolação na primeira porção do canal médio decodificado para gerar a segunda porção do canal médio decodificado.
30. Método, de acordo com a reivindicação 26, ainda compreendendo realizar uma operação de estimativa na primeira porção do canal médio decodificado para gerar a segunda porção do canal médio decodificado.
Petição 870190112962, de 05/11/2019, pág. 118/134
9/11
31. Método, de acordo com a reivindicação 24, em que o primeiro valor de um parâmetro estéreo é um valor quantizado representando um deslocamento entre um canal de referência associado com um codificador e um canal alvo associado com o codificador, o valor quantizado com base em um valor do deslocamento, o valor do deslocamento associado com o codificador e tendo uma precisão maior do que o valor quantizado.
32. Método, de acordo com a reivindicação 24, em que o decodificador é integrado em um dispositivo móvel.
33. Método, de acordo com a reivindicação 24, em que o decodificador é integrado em uma estação de base.
34. Meio legível por computador não transitório compreendendo instruções que, quando executadas por um processador dentro de um decodificador, levam o processador a realizar operações compreendendo:
receber pelo menos uma porção de um fluxo de bits, o fluxo de bits compreendendo um primeiro quadro e um segundo quadro, o primeiro quadro incluindo uma primeira porção de um canal médio e um primeiro valor de um parâmetro estéreo, o segundo quadro incluindo uma segunda porção do canal médio e um segundo valor do parâmetro estéreo;
decodificar a primeira porção do canal médio para gerar uma primeira porção de um canal médio decodificado;
gerar uma primeira porção de um canal esquerdo com base pelo menos na primeira porção do canal médio decodificado e no primeiro valor do parâmetro estéreo;
gerar uma primeira porção de um canal direito com base pelo menos na primeira porção do canal médio
Petição 870190112962, de 05/11/2019, pág. 119/134
10/11 decodificado e no primeiro valor do parâmetro estéreo; e em resposta ao segundo quadro estar indisponível para operações de decodificação, gerar uma segunda porção do canal esquerdo e uma segunda porção do canal direito com base pelo menos no primeiro valor do parâmetro estéreo, na segunda porção do canal esquerdo e na segunda porção do canal direito correspondente a uma versão decodificada do segundo quadro.
35. Meio legível por computador não transitório, de acordo com a reivindicação 34, em que o primeiro valor de um parâmetro estéreo é um valor quantizado representando um deslocamento entre um canal de referência associado com um codificador e um canal alvo associado com o codificador, o valor quantizado com base em um valor do deslocamento, o valor do deslocamento associado com o codificador e tendo uma precisão maior do que o valor quantizado.
36. Aparelho, compreendendo:
meios para receber pelo menos uma porção de um fluxo de bits, o fluxo de bits compreendendo um primeiro quadro e um segundo quadro, o primeiro quadro incluindo uma primeira porção de um canal médio e um primeiro valor de um parâmetro estéreo, o segundo quadro incluindo uma segunda porção do canal médio e um segundo valor do parâmetro estéreo;
meios para decodificar a primeira porção do canal médio para gerar uma primeira porção de um canal médio decodificado;
meios para gerar uma primeira porção de um canal esquerdo com base pelo menos na primeira porção do canal médio decodificado e no primeiro valor do parâmetro
Petição 870190112962, de 05/11/2019, pág. 120/134
11/11 estéreo;
meios para gerar uma primeira porção de um canal direito com base pelo menos na primeira porção do canal médio decodificado e no primeiro valor do parâmetro estéreo; e em resposta ao segundo quadro estar indisponível para operações de decodificação, meios para gerar uma segunda porção do canal esquerdo e uma segunda porção do canal direito com base pelo menos no primeiro valor do parâmetro estéreo, na segunda porção do canal esquerdo e na segunda porção do canal direito correspondente a uma versão decodificada do segundo quadro.
37. Aparelho, de acordo com a reivindicação 36, em que o primeiro valor de um parâmetro estéreo é um valor quantizado representando um deslocamento entre um canal de referência associado com um codificador e um canal alvo associado com o codificador, o valor quantizado com base em um valor do deslocamento, o valor do deslocamento associado com o codificador e tendo uma precisão maior do que o valor quantizado.
38. Aparelho, de acordo com a reivindicação 36, em que os meios para gerar a segunda porção do canal esquerdo e a segunda porção do canal direito são integrados em um dispositivo móvel.
39. Aparelho, de acordo com a reivindicação 36, em que os meios para gerar a segunda porção do canal esquerdo e a segunda porção do canal direito são integrados em uma estação de base.
BR112019023204A 2017-05-11 2018-04-27 parâmetros estéreo para decodificação estéreo BR112019023204A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762505041P 2017-05-11 2017-05-11
US15/962,834 US10224045B2 (en) 2017-05-11 2018-04-25 Stereo parameters for stereo decoding
PCT/US2018/029872 WO2018208515A1 (en) 2017-05-11 2018-04-27 Stereo parameters for stereo decoding

Publications (1)

Publication Number Publication Date
BR112019023204A2 true BR112019023204A2 (pt) 2020-05-19

Family

ID=64097350

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112019023204A BR112019023204A2 (pt) 2017-05-11 2018-04-27 parâmetros estéreo para decodificação estéreo

Country Status (9)

Country Link
US (5) US10224045B2 (pt)
EP (1) EP3622508A1 (pt)
KR (2) KR102628065B1 (pt)
CN (2) CN110622242B (pt)
AU (1) AU2018266531C1 (pt)
BR (1) BR112019023204A2 (pt)
SG (1) SG11201909348QA (pt)
TW (3) TWI790230B (pt)
WO (1) WO2018208515A1 (pt)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
US10224045B2 (en) 2017-05-11 2019-03-05 Qualcomm Incorporated Stereo parameters for stereo decoding
US10475457B2 (en) * 2017-07-03 2019-11-12 Qualcomm Incorporated Time-domain inter-channel prediction
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
KR102470429B1 (ko) * 2019-03-14 2022-11-23 붐클라우드 360 인코포레이티드 우선순위에 의한 공간 인식 다중 대역 압축 시스템
CN113676397B (zh) * 2021-08-18 2023-04-18 杭州网易智企科技有限公司 空间位置数据处理方法、装置、存储介质及电子设备

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4456601B2 (ja) 2004-06-02 2010-04-28 パナソニック株式会社 音声データ受信装置および音声データ受信方法
WO2009084226A1 (ja) 2007-12-28 2009-07-09 Panasonic Corporation ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法
EP2626855B1 (en) * 2009-03-17 2014-09-10 Dolby International AB Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
JP5764488B2 (ja) 2009-05-26 2015-08-19 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 復号装置及び復号方法
CN103098131B (zh) * 2010-08-24 2015-03-11 杜比国际公司 调频立体声无线电接收器的间歇单声道接收的隐藏
KR101748760B1 (ko) * 2011-03-18 2017-06-19 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치
US8654984B2 (en) * 2011-04-26 2014-02-18 Skype Processing stereophonic audio signals
CN102810313B (zh) 2011-06-02 2014-01-01 华为终端有限公司 音频解码方法及装置
US9299355B2 (en) * 2011-08-04 2016-03-29 Dolby International Ab FM stereo radio receiver by using parametric stereo
ES2560402T3 (es) * 2012-04-05 2016-02-18 Huawei Technologies Co., Ltd Método para la codificación y la decodificación de audio espacial paramétrica, codificador de audio espacial paramétrico y decodificador de audio espacial paramétrico
EP3067889A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for signal-adaptive transform kernel switching in audio coding
EP3067887A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
DK3353779T3 (da) * 2015-09-25 2020-08-10 Voiceage Corp Fremgangsmåde og system til kodning af et stereolydssignal ved at anvende kodningsparametre for en primær kanal til at kode en sekundær kanal
US10366695B2 (en) 2017-01-19 2019-07-30 Qualcomm Incorporated Inter-channel phase difference parameter modification
US10224045B2 (en) 2017-05-11 2019-03-05 Qualcomm Incorporated Stereo parameters for stereo decoding

Also Published As

Publication number Publication date
KR102628065B1 (ko) 2024-01-22
US20240161757A1 (en) 2024-05-16
CN110622242A (zh) 2019-12-27
US20200335114A1 (en) 2020-10-22
TW202315426A (zh) 2023-04-01
US10783894B2 (en) 2020-09-22
AU2018266531C1 (en) 2023-04-06
US20190214028A1 (en) 2019-07-11
US11823689B2 (en) 2023-11-21
CN116665682A (zh) 2023-08-29
US11205436B2 (en) 2021-12-21
TW202315425A (zh) 2023-04-01
US10224045B2 (en) 2019-03-05
CN110622242B (zh) 2023-06-16
AU2018266531B2 (en) 2022-08-18
WO2018208515A1 (en) 2018-11-15
TWI828480B (zh) 2024-01-01
EP3622508A1 (en) 2020-03-18
KR20240006717A (ko) 2024-01-15
AU2018266531A1 (en) 2019-10-31
SG11201909348QA (en) 2019-11-28
TWI790230B (zh) 2023-01-21
US20180330739A1 (en) 2018-11-15
US20220115026A1 (en) 2022-04-14
TWI828479B (zh) 2024-01-01
KR20200006978A (ko) 2020-01-21
TW201902236A (zh) 2019-01-01

Similar Documents

Publication Publication Date Title
ES2821676T3 (es) Codificación de múltiples señales de audio
BR112019023204A2 (pt) parâmetros estéreo para decodificação estéreo
ES2837406T3 (es) Estimación de desviación temporal
BR112019019144A2 (pt) geração de amostra alvo
TWI778073B (zh) 用於具有時域頻道間頻寬延展之高頻帶殘值預測的音訊信號寫碼裝置、方法、包含指令的非暫時性電腦可讀媒體及設備
KR102263550B1 (ko) 다중 오디오 신호들의 코딩
BR112019027202A2 (pt) predição intercanal no domínio do tempo
BR112020004703A2 (pt) estimativa de desvio temporal
BR112020004753A2 (pt) método de ajuste de canal de seleção para variações de deslocamento temporal interquadro
BR112019014544A2 (pt) Modificação de parâmetro de diferença de fase entre canais
TWI724290B (zh) 通信器件,解碼信號之方法,非暫時性電腦可讀媒體及通信裝置
BR112019026971B1 (pt) Predição residual de banda alta com extensão de largura de banda inter-canal no domínio do tempo

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]