BR112020006776A2 - decodificação de sinais de áudio - Google Patents

decodificação de sinais de áudio Download PDF

Info

Publication number
BR112020006776A2
BR112020006776A2 BR112020006776-8A BR112020006776A BR112020006776A2 BR 112020006776 A2 BR112020006776 A2 BR 112020006776A2 BR 112020006776 A BR112020006776 A BR 112020006776A BR 112020006776 A2 BR112020006776 A2 BR 112020006776A2
Authority
BR
Brazil
Prior art keywords
signal
synthesized
parameter
medial
value
Prior art date
Application number
BR112020006776-8A
Other languages
English (en)
Inventor
Venkata Subrahmanyam Chandra Sekhar Chebiyyam
Venkatraman Atti
Original Assignee
Qualcomm Incorporated
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Incorporated filed Critical Qualcomm Incorporated
Publication of BR112020006776A2 publication Critical patent/BR112020006776A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Um dispositivo inclui um receptor configurado para receber um parâmetro de ganho de predição intercanal e um sinal de áudio codificado. O sinal de áudio codificado inclui um sinal medial codificado. O dispositivo também inclui um decodificador configurado para gerar um sinal medial sintetizado com base no sinal medial codificado. O decodificador é configurado para gerar um sinal lateral sintetizado intermediário com base no sinal medial sintetizado e no parâmetro de ganho de predição intercanal. O decodificador é configurado adicionalmente para filtrar o sinal lateral sintetizado intermediário para gerar um sinal lateral sintetizado.

Description

“DECODIFICAÇÃO DE SINAIS DE ÁUDIO” II. Reivindicação de Prioridade
[0001] o presente pedido reivindica o benefício de prioridade do Pedido de Patente Provisório dos E.U.A. de propriedade comum N.º 62/568.719, depositado em 5 de outubro de 2017, e do Pedido de Patente Não Provisório dos E.U.A. N.º 16/147.208, depositado em 28 de setembro de 2018, os conteúdos de cada um dos quais são aqui incorporados expressamente à guisa de referência em sua totalidade.
II. Campo
[0002] A presente revelação é geralmente relacionada à codificação ou decodificação de sinais de áudio.
III. Descrição da Técnica Correlata
[0003] Os avanços em tecnologia resultaram em dispositivos de computação menores e mais poderosos. Por exemplo, atualmente existe uma variedade de dispositivos portáteis de computação pessoal, que incluem telefones sem fio, tais como telefones móveis e inteligentes, tablets e laptops que são pequenos, leves e facilmente portados por usuários. Esses dispositivos podem comunicar pacotes de voz e dados através de redes sem fio. Além disso, muitos de tais dispositivos incorporam funcionalidades adicionais, tais como uma câmera fotográfica digital, uma câmera de vídeo digital, um gravador digital e um tocador de arquivos de áudio. Além disso, tais dispositivos podem processar instruções executáveis, que incluem aplicativos de software, tais como um aplicativo de navegador de Web, que podem ser utilizados para acessar a Internet. Como tal,
esses dispositivos podem incluir capacidades de computação significativas.
[0004] Um dispositivo de computação pode incluir múltiplos microfones para receber sinais de áudio. Em codificação estéreo, os sinais de áudio a partir dos microfones, são utilizados para gerar um sinal medial e um ou mais sinais laterais. O sinal medial pode corresponder a uma soma do primeiro sinal de áudio e do segundo sinal de áudio. Um sinal lateral pode corresponder a uma diferença entre o primeiro sinal de áudio e o segundo sinal de áudio. Um codificador em um primeiro dispositivo pode gerar um sinal medial codificado que corresponde ao sinal medial e um sinal lateral codificado que corresponde ao sinal lateral. O sinal medial codificado e o sinal lateral codificado podem ser transmitidos a partir do primeiro dispositivo para um segundo dispositivo.
[0005] O segundo dispositivo pode gerar um sinal medial sintetizado que corresponde ao sinal medial codificado e um sinal lateral sintetizado que corresponde ao sinal lateral. O segundo dispositivo pode gerar sinais de saída com base no sinal medial sintetizado e no sinal lateral sintetizado. A largura de banda de comunicação entre o primeiro dispositivo e o segundo dispositivo é limitada. Reduzir a diferença entre os sinais de saída gerados no segundo dispositivo e os sinais de áudio recebidos no primeiro dispositivo na presença de largura de banda limitada é um desafio.
IV. Sumário
[0006] Sob um aspecto específico, um dispositivo inclui um codificador configurado para gerar um sinal medial com base em um primeiro sinal de áudio e um segundo sinal de áudio. O sinal medial inclui um sinal medial de banda baixa e um sinal medial de banda alta. O codificador é configurado para gerar um sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio. O codificador é configurado adicionalmente para gerar uma pluralidade de parâmetros de ganho de predição intercanal com base no sinal medial de banda baixa, no sinal medial de banda alta e no sinal lateral. O dispositivo também inclui um transmissor configurado para enviar a pluralidade de parâmetros de ganho de predição intercanal e um sinal de áudio codificado a um segundo dispositivo.
[0007] Sob outro aspecto específico, um método inclui gerar, em um primeiro dispositivo, um sinal medial com base em um primeiro sinal de áudio e um segundo sinal de áudio. O sinal medial inclui um sinal medial de banda baixa e um sinal medial de banda alta. O método inclui gerar um sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio. O método inclui gerar uma pluralidade de parâmetros de ganho de predição intercanal com base no sinal medial de banda baixa, no sinal medial de banda alta e no sinal lateral. O método inclui adicionalmente enviar a pluralidade de parâmetros de ganho de predição intercanal e um sinal de áudio codificado a um segundo dispositivo.
[0008] Sob outro aspecto específico, um aparelho inclui meios para gerar, em um primeiro dispositivo, um sinal medial com base em um primeiro sinal de áudio e um segundo sinal de áudio. O sinal medial inclui um sinal medial de banda baixa e um sinal medial de banda alta. O aparelho inclui meios para gerar um sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio. O aparelho inclui meios para gerar uma pluralidade de parâmetros de ganho de predição intercanal com base no sinal medial de banda baixa, no sinal medial de banda alta e no sinal lateral. O aparelho inclui adicionalmente meios para enviar a pluralidade de parâmetros de ganho de predição intercanal e um sinal de áudio codificado a um segundo dispositivo.
[0009] Sob outro aspecto específico, um dispositivo de armazenamento passível de leitura por computador armazena instruções que, quando executadas por um processador, fazem com que o processador efetue operações, que incluem gerar, em um primeiro dispositivo, um sinal medial com base em um primeiro sinal de áudio e um segundo sinal de áudio. O sinal medial inclui um sinal medial de banda baixa e um sinal medial de banda alta. As operações incluem gerar um sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio. As operações incluem gerar um parâmetro de ganho de predição intercanal com base no sinal medial de banda baixa, no sinal medial de banda alta e no sinal lateral. As operações incluem adicionalmente enviar a pluralidade de parâmetros de ganho de predição intercanal e um sinal de áudio codificado a um segundo dispositivo.
[0010] Sob outro aspecto específico, um dispositivo inclui um receptor configurado para receber um ou mais parâmetros de upmix, um ou mais parâmetros de extensão de largura de banda intercanal, um ou mais parâmetros de ganho de predição intercanal e um sinal de áudio codificado. O sinal de áudio codificado inclui um sinal medial codificado. O dispositivo também inclui um decodificador configurado para gerar um sinal medial sintetizado com base no sinal medial codificado. O decodificador é configurado adicionalmente para gerar um sinal lateral sintetizado com base no sinal medial sintetizado e em um ou mais parâmetros de ganho de predição intercanal. O decodificador é também configurado para gerar um ou mais sinais de saída com base no sinal medial sintetizado, no sinal lateral sintetizado, em um ou mais parâmetros de upmix e um ou mais parâmetros de extensão de largura de banda intercanal.
[0011] Sob outro aspecto específico, um método inclui receber um ou mais parâmetros de upmix, um ou mais parâmetros de extensão de largura de banda intercanal, um ou mais parâmetros de ganho de predição intercanal e um sinal de áudio codificado em um primeiro dispositivo a partir de um segundo dispositivo. O sinal de áudio codificado inclui um sinal medial codificado. O método inclui gerar, no primeiro dispositivo, um sinal medial sintetizado com base no sinal medial codificado. O método inclui adicionalmente gerar um sinal lateral sintetizado com base no sinal medial sintetizado e em um ou mais parâmetros de ganho de predição intercanal. O método também inclui gerar um ou mais sinais de saída com base no sinal medial sintetizado, no sinal lateral sintetizado, em um ou mais parâmetros de upmix e um ou mais parâmetros de extensão de largura de banda intercanal.
[0012] Sob outro aspecto específico, um aparelho inclui meios para receber um ou mais parâmetros de upmix, um ou mais parâmetros de extensão de largura de banda intercanal, um ou mais parâmetros de ganho de predição intercanal e um sinal de áudio codificado. O sinal de áudio codificado inclui um sinal medial codificado. O aparelho inclui meios para gerar um sinal medial sintetizado com base no sinal medial codificado. O aparelho inclui adicionalmente meios para gerar um sinal lateral sintetizado com base no sinal medial sintetizado e em um ou mais parâmetros de ganho de predição intercanal. O aparelho inclui meios para gerar um ou mais sinais de saída com base no sinal medial sintetizado, no sinal lateral sintetizado, em um ou mais parâmetros de upmix e um ou mais parâmetros de extensão de largura de banda intercanal.
[0013] Sob outro aspecto específico, um dispositivo de armazenamento passível de leitura por computador armazena instruções que, quando executadas por um processador, fazem com que o processador efetue operações que incluem receber um ou mais parâmetros de upmix, um ou mais parâmetros de extensão de largura de banda intercanal, um ou mais parâmetros de ganho de predição de canal e um sinal de áudio codificado em um primeiro dispositivo a partir de um segundo dispositivo. O sinal de áudio codificado inclui um sinal medial codificado. As operações incluem gerar, no primeiro dispositivo, um sinal medial sintetizado com base no sinal medial codificado. As operações incluem adicionalmente gerar um sinal lateral sintetizado com base no sinal medial sintetizado e em um ou mais parâmetros de ganho de predição intercanal. As operações incluem gerar um ou mais sinais de saída com base no sinal medial sintetizado, no sinal lateral sintetizado, em um ou mais parâmetros de upmix e um ou mais parâmetros de extensão de largura de banda intercanal.
[0014] Sob outro aspecto específico, um dispositivo inclui um codificador e um transmissor. O codificador é configurado para gerar um sinal medial com base em um primeiro sinal de áudio e um segundo sinal de áudio. O codificador é também configurado para gerar um sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio. O codificador é configurado adicionalmente para determinar uma pluralidade de parâmetros com base no primeiro sinal de áudio, no segundo sinal de áudio ou ambos. O codificador é também configurado para determinar, com base na pluralidade de parâmetros, se o sinal lateral deve ser codificado para transmissão. O codificador é configurado adicionalmente para gerar um sinal medial codificado que corresponde ao sinal medial. O codificador é também configurado para gerar um sinal lateral codificado que corresponde ao sinal lateral em resposta à determinação de que o sinal lateral deve ser codificado para transmissão. O transmissor é configurado para transmitir parâmetros de fluxo de bits que correspondem ao sinal medial codificado, ao sinal lateral codificado ou a ambos.
[0015] Sob outro aspecto específico, um dispositivo inclui um receptor e um decodificador. O receptor é configurado para receber parâmetros de fluxo de bits que correspondem a pelo menos um sinal medial codificado. O decodificador é configurado para gerar um sinal medial sintetizado com base nos parâmetros de fluxo de bits. O decodificador é também configurado para gerar um sinal lateral sintetizado, seletivamente, com base nos parâmetros de fluxo de bits em resposta à determinação de se os parâmetros de fluxo de bits correspondem a um sinal lateral codificado.
[0016] Sob outro aspecto específico, um método inclui gerar, em um dispositivo, um sinal medial com base em um primeiro sinal de áudio e um segundo sinal de áudio. O método também inclui gerar, no dispositivo, um sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio. O método inclui adicionalmente determinar, no dispositivo, uma pluralidade de parâmetros com base no primeiro sinal de áudio, no segundo sinal de áudio ou ambos. O método também inclui determinar, com base na pluralidade de parâmetros, se o sinal lateral deve ser codificado para transmissão. O método inclui adicionalmente gerar, no dispositivo, um sinal medial codificado que corresponde ao sinal medial. O método também inclui gerar, no dispositivo, um sinal lateral codificado que corresponde ao sinal lateral em resposta à determinação de que o sinal lateral deve ser codificado para transmissão. O método inclui adicionalmente iniciar a transmissão, a partir do dispositivo, de parâmetros de fluxo de bits que correspondem ao sinal medial codificado, ao sinal lateral codificado ou a ambos.
[0017] Sob outro aspecto específico, um método inclui receber, em um dispositivo, parâmetros de fluxo de bits que correspondem a pelo menos um sinal medial codificado. O método também inclui gerar, no dispositivo, um sinal medial sintetizado com base nos parâmetros de fluxo de bits. O método inclui adicionalmente gerar, no dispositivo, um sinal lateral sintetizado seletivamente com base nos parâmetros de fluxo de bits em resposta à determinação de se os parâmetros de fluxo de bits correspondem a um sinal lateral codificado.
[0018] Sob outro aspecto específico, um dispositivo de armazenamento passível de leitura por computador armazena instruções que, quando executadas por um processador, fazem com que o processador efetue operações que incluem gerar um sinal medial com base em um primeiro sinal de áudio e um segundo sinal de áudio. As operações também incluem gerar um sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio. As operações incluem adicionalmente determinar uma pluralidade de parâmetros com base no primeiro sinal de áudio, no segundo sinal de áudio ou ambos. As operações também incluem determinar, com base na pluralidade de parâmetros, se o sinal lateral deve ser codificado para transmissão. As operações incluem adicionalmente gerar um sinal medial codificado que corresponde ao sinal medial. As operações também incluem gerar um sinal lateral codificado que corresponde ao sinal lateral em resposta à determinação de que o sinal lateral deve ser codificado para transmissão. As operações incluem adicionalmente iniciar a transmissão de parâmetros de fluxo de bits que correspondem ao sinal medial codificado, ao sinal lateral codificado ou a ambos.
[0019] Sob outro aspecto específico, um dispositivo de armazenamento passível de leitura por computador armazena instruções que, quando executadas por um processador, fazem com que o processador efetue operações que incluem receber parâmetros de fluxo de bits que correspondem a pelo menos um sinal medial codificado. As operações também incluem gerar um sinal medial sintetizado com base nos parâmetros de fluxo de bits. As operações incluem adicionalmente gerar seletivamente um sinal lateral com base nos parâmetros de fluxo de bits em resposta à determinação de se os parâmetros de fluxo de bits correspondem a um sinal lateral codificado.
[0020] Sob outro aspecto específico, um dispositivo inclui um codificador e um transmissor. O codificador é configurado para gerar um parâmetro de downmix que tem um primeiro valor em resposta à determinação de que um parâmetro de codificação ou predição indica que um sinal lateral deve ser codificado para transmissão. O primeiro valor é baseado em uma métrica de potência, uma métrica de correlação ou ambas. A métrica de potência, a métrica de correlação ou ambas, são baseadas em um primeiro sinal de áudio e um segundo sinal de áudio. O codificador é também configurado para gerar o parâmetro de downmix que tem um segundo valor com base, pelo menos em parte, na determinação de que o parâmetro de codificação ou predição indica que o sinal lateral não deve ser codificado para transmissão. O segundo valor é baseado em um valor de parâmetro de downmix predefinido, no primeiro valor ou ambos. O codificador é configurado adicionalmente para gerar um sinal medial com base no primeiro sinal de áudio, no segundo sinal de áudio e no parâmetro de downmix. O codificador é também configurado para gerar um sinal medial codificado que corresponde ao sinal medial. O transmissor é configurado para transmitir parâmetros de fluxo de bits que correspondem pelo menos ao sinal medial codificado.
[0021] Sob outro aspecto específico, um dispositivo inclui um receptor e um decodificador. O receptor é configurado para receber parâmetros de fluxo de bits que correspondem a pelo menos um sinal medial codificado. O decodificador é configurado para gerar um sinal medial sintetizado com base nos parâmetros de fluxo de bits. O decodificador é também configurado para gerar um ou mais parâmetros de upmix. Um parâmetro de upmix de um ou mais parâmetros de upmix tem um primeiro valor ou um segundo valor com base na determinação de se os parâmetros de fluxo de bits correspondem a um sinal lateral codificado. O primeiro valor é baseado em um parâmetro de downmix recebido. O segundo valor é baseado, pelo menos em parte, em um valor de parâmetro predefinido. o decodificador é configurado adicionalmente para gerar um sinal de saída com base pelo menos no sinal medial sintetizado e em um ou mais parâmetros de upmix.
[0022] Sob outro aspecto específico, um método inclui gerar, em um dispositivo, um parâmetro de downmix com um primeiro valor em resposta à determinação de que um parâmetro de codificação ou predição indica que um sinal lateral deve ser codificado para transmissão. O primeiro valor é baseado em uma métrica de potência, uma métrica de correlação ou ambas. A métrica de potência, a métrica de correlação ou ambas, são baseadas em um primeiro sinal de áudio e um segundo sinal de áudio. O método também inclui gerar, no dispositivo, o parâmetro de downmix que tem um segundo valor com base pelo menos em parte na determinação de que o parâmetro de codificação ou predição indica que o sinal lateral não deve ser codificado para transmissão. O segundo valor é baseado em um valor de parâmetro de downmix predefinido, no primeiro valor ou ambos. O método inclui adicionalmente gerar, no dispositivo, um sinal medial com base no primeiro sinal de áudio, no segundo sinal de áudio e no parâmetro de downmix. O método também inclui gerar, no dispositivo, um sinal medial codificado que corresponde ao sinal medial. O método inclui adicionalmente iniciar a transmissão, a partir do dispositivo, de parâmetros de fluxo de bits que correspondem pelo menos ao sinal medial codificado.
[0023] Sob outro aspecto específico, um método inclui receber, em um dispositivo, parâmetros de fluxo de bits que correspondem a pelo menos um sinal medial codificado. O método também inclui gerar, no dispositivo, um sinal medial sintetizado com base nos parâmetros de fluxo de bits. O método inclui adicionalmente gerar, no dispositivo, um ou mais parâmetros de upmix. Um parâmetro de upmix de um ou mais parâmetros de upmix têm um primeiro valor ou um segundo valor com base na determinação de se os parâmetros de fluxo de bits correspondem a um sinal lateral codificado. O primeiro valor é baseado em um parâmetro de downmix recebido. O segundo valor é baseado, pelo menos em parte, em um valor de parâmetro predefinido. O método também inclui gerar, no dispositivo, um sinal de saída com base pelo menos no sinal medial sintetizado e em um ou mais parâmetros de upmix.
[0024] Sob outro aspecto específico, um dispositivo de armazenamento passível de leitura por computador armazena instruções que, quando executadas por um processador, fazem com que o processador efetue operações que incluem gerar um parâmetro de downmix que tem um primeiro valor em resposta à determinação de que um parâmetro de codificação ou predição indica que um o sinal lateral deve ser codificado para transmissão. O primeiro valor é baseado em uma métrica de potência, uma métrica de correlação ou ambas. A métrica de potência, a métrica de correlação ou ambas, são baseadas em um primeiro sinal de áudio e um segundo sinal de áudio. As operações também incluem gerar o parâmetro de downmix que tem um segundo valor com base, pelo menos em parte, na determinação de que o parâmetro de codificação ou predição indica que o sinal lateral não deve ser codificado para transmissão. O segundo valor é baseado em um valor de parâmetro de downmix predefinido, no primeiro valor ou ambos. As operações incluem adicionalmente gerar um sinal medial com base no primeiro sinal de áudio, no segundo sinal de áudio e no parâmetro de downmix. As operações também incluem gerar um sinal medial codificado que corresponde ao sinal medial. As operações incluem adicionalmente iniciar a transmissão de parâmetros de fluxo de bits que correspondem pelo menos ao sinal medial codificado.
[0025] Sob outro aspecto específico, um dispositivo de armazenamento passível de leitura por computador armazena instruções que, quando executadas por um processador, fazen com que o processador efetue operações que incluem receber parâmetros de fluxo de bits que correspondem a pelo menos um sinal medial codificado. As operações também incluem gerar um sinal medial sintetizado com base nos parâmetros de fluxo de bits. As operações incluem adicionalmente gerar um ou mais parâmetros de upmix. Um parâmetro de upmix de um ou mais parâmetros de upmix tem um primeiro valor ou um segundo valor com base na determinação de se os parâmetros de fluxo de bits correspondem a um sinal lateral codificado. O primeiro valor é baseado em um parâmetro de downmix recebido. O segundo valor é baseado, pelo menos em parte, em um valor de parâmetro predefinido. As operações também incluem gerar um sinal de saída com base pelo menos no sinal medial sintetizado e em um ou mais parâmetros de upmix.
[0026] Sob outro aspecto específico, um dispositivo inclui um receptor configurado para receber um parâmetro de ganho de predição intercanal e um sinal de áudio codificado. O sinal de áudio codificado inclui um sinal medial codificado. O dispositivo também inclui um decodificador configurado para gerar um sinal medial sintetizado com base no sinal medial codificado. O decodificador é configurado para gerar um sinal lateral sintetizado intermediário com base no sinal medial sintetizado e no parâmetro de ganho de predição intercanal. O decodificador é configurado adicionalmente para filtrar o sinal lateral sintetizado intermediário para gerar um sinal lateral sintetizado.
[0027] Sob outro aspecto específico, um método inclui receber um parâmetro de ganho de predição intercanal e um sinal de áudio codificado em um primeiro dispositivo a partir de um segundo dispositivo. O sinal de áudio codificado inclui um sinal medial codificado. O método inclui gerar, no primeiro dispositivo, um sinal medial sintetizado com base no sinal medial codificado. O método inclui gerar um sinal lateral sintetizado intermediário com base no sinal medial sintetizado e no parâmetro de ganho de predição intercanal. O método inclui adicionalmente filtrar o sinal lateral sintetizado intermediário para gerar um sinal lateral sintetizado.
[0028] Sob outro aspecto específico, um aparelho inclui meios para receber um parâmetro de ganho de predição intercanal e um sinal de áudio codificado. O sinal de áudio codificado inclui um sinal medial codificado. O aparelho inclui meios para gerar um sinal medial sintetizado com base no sinal medial codificado. O aparelho inclui meios para gerar um sinal lateral sintetizado intermediário com base no sinal medial sintetizado e no parâmetro de ganho de predição intercanal. O aparelho inclui adicionalmente meios para filtrar o sinal lateral sintetizado intermediário para gerar um sinal lateral sintetizado.
[0029] Sob outro aspecto específico, um dispositivo de armazenamento passível de leitura por computador armazena instruções que, quando executadas por um processador, fazem com que o processador efetue operações que incluem receber um parâmetro de ganho de predição intercanal e um sinal de áudio codificado de um dispositivo. O sinal de áudio codificado inclui um sinal medial codificado. As operações incluem gerar um sinal medial sintetizado com base no sinal medial codificado. As operações incluem gerar um sinal lateral sintetizado intermediário com base no sinal medial sintetizado e no parâmetro de ganho de predição intercanal. As operações incluem adicionalmente filtrar o sinal lateral sintetizado intermediário para gerar um sinal lateral sintetizado.
[0030] Outros aspectos, vantagens e recursos da presente revelação se tornarão evidentes depois do exame do pedido inteiro, inclusive das seções seguintes: Descrição Resumida dos Desenhos, Descrição Detalhada e da Reivindicações.
V. Descrição Resumida dos Desenhos
[0031] A Figura 1 é um diagrama de blocos de um exemplo ilustrativo específico de um sistema operável para codificar ou decodificar sinais de áudio;
[0032] A Figura 2 é um diagrama de blocos de um exemplo ilustrativo específico de um sistema operável para sintetizar um sinal lateral com base em um parâmetro de ganho de predição intercanal;
[0033] A Figura 3 é um diagrama de blocos de um exemplo ilustrativo específico de um codificador do sistema da Figura 2;
[0034] A Figura 4 é um diagrama de blocos de um exemplo ilustrativo específico de um decodificador do sistema da Figura 2;
[0035] A Figura 5 é um diagrama que mostra um exemplo de um codificador do sistema da Figura 1;
[0036] A Figura 6 é um diagrama que mostra um exemplo de um codificador do sistema da Figura 1;
[0037] A Figura 7 é um diagrama que mostra um exemplo de um alinhador intercanal do sistema da Figura 1;
[0038] A Figura 8 é um diagrama que mostra um exemplo de um gerador de midside do sistema da Figura 1;
[0039] A Figura 9 é um diagrama que mostra um exemplo de um seletor de codificação ou predição do sistema da Figura 1;
[0040] A Figura 10 é um diagrama que mostra um exemplo de um determinador de codificação ou predição do sistema da Figura 1;
[0041] A Figura 11 é um diagrama que mostra exemplos de um gerador de parâmetros de upmix do sistema da Figura 1;
[0042] A Figura 12 é um diagrama que mostra exemplos de um gerador de parâmetros de upmix do sistema da Figura 1;
[0043] A Figura 13 é um diagrama de blocos de um exemplo ilustrativo específico de um sistema operável para sintetizar um sinal lateral intermediário com base em um parâmetro de ganho de predição intercanal e para efetuar filtragem no sinal lateral intermediário para sintetizar um sinal lateral;
[0044] A Figura 14 é um diagrama de blocos de um primeiro exemplo ilustrativo de um decodificador do sistema da Figura 13;
[0045] A Figura 15 é um diagrama de blocos de um segundo exemplo ilustrativo de um decodificador do sistema da Figura 13;
[0046] A Figura 16 é um diagrama de blocos de um terceiro exemplo ilustrativo de um decodificador do sistema da Figura 13;
[0047] A Figura 17 é um fluxograma que mostra um método específico de codificação de sinais de áudio;
[0048] A Figura 18 é um fluxograma que mostra um método específico de decodificação de sinais de áudio;
[0049] A Figura 19 é um fluxograma que mostra um método específico de codificação de sinais de áudio;
[0050] A Figura 20 é um fluxograma que mostra um método específico de decodificação de sinais de áudio;
[0051] A Figura 21 é um fluxograma que mostra um método específico de codificação de sinais de áudio;
[0052] Figura 22 é um fluxograma que mostra um método específico de decodificação de sinais de áudio;
[0053] A Figura 23 é um fluxograma que mostra um método específico de decodificação de sinais de áudio;
[0054] A Figura 24 é um diagrama de blocos de um exemplo ilustrativo específico de um dispositivo que é operável para codificar ou decodificar sinais de áudio; e
[0055] A Figura 25 é um diagrama de blocos de uma estação base que é operável para codificar ou decodificar sinais de áudio.
VI. Descrição detalhada
[0056] São revelados sistemas e dispositivos operáveis para codificar sinais de áudio. Um dispositivo pode incluir um codificador configurado para codificar os sinais de áudio. Os sinais de áudio podem ser capturados concomitantemente no tempo utilizando-se múltiplos dispositivos de gravação, como, por exemplo, múltiplos microfones. Em alguns exemplos, os sinais de áudio (ou áudio de múltiplos canais) podem ser sinteticamente (como, por exemplo, artificialmente) gerados por multiplexação de vários canais de áudio que são gravados ao mesmo tempo ou em momentos diferentes. Como exemplos ilustrativos, a gravação ou multiplexação simultânea dos canais de áudio pode resultar em uma configuração de 2 canais (isto é, estéreo: Esquerdo e Direito), em uma configuração de 5.1 canais (esquerdo, Direito, central, surround esquerdo, surround direito e canais de acentuação de baixa frequência (LFE)), uma configuração de 7.1 canais, uma configuração de
7.1 + 4 canais, uma configuração de 22.2 canais ou uma configuração de N canais.
[0057] Os dispositivos de captura de áudio nas salas de teleconferência (ou salas de tele-presença) podem incluir múltiplos microfones que adquirem áudio espacial. O áudio espacial pode incluir fala, bem como áudio de fundo que é codificado e transmitido. A fala/áudio a partir de uma dada fonte (como, por exemplo, um locutor) pode chegar aos múltiplos microfones em momentos diferentes, dependendo de como os microfones estão dispostos bem como onde a fonte (como, por exemplo, o locutor) está localizada com relação aos microfones e dimensões da sala. Por exemplo, uma fonte de som (como, por exemplo, um locutor) pode estar mais próxima de um primeiro microfone associado com oO dispositivo do que de um segundo microfone associado com o dispositivo. Assim, um som enviado a partir da fonte de som pode alcançar o primeiro microfone antes do segundo microfone. O dispositivo pode receber um primeiro sinal de áudio através do primeiro microfone e pode receber um segundo sinal de áudio por meio do segundo microfone.
[0058] Um sinal de áudio pode ser codificado em segmentos ou quadros. Um quadro pode corresponder a um número de amostras (como, por exemplo, 1920 amostras ou 2000 amostras). A codificação de mid-side (MS) e a codificação estéreo paramétrica (PS) são técnicas de codificação estéreo que podem fornecer eficiência aperfeiçoada sobre as técnicas de codificação dual-mono. Na codificação dual-mono, o canal Esquerdo (L) (ou sinal) e o canal Direito (R) (ou sinal) são codificados independentemente, sem fazer utilização da correlação intercanal. A codificação MS reduz a redundância entre um par de canais L/R correlatos, pela transformação do canal Esquerdo e do canal Direito em um canal de soma e um canal de diferença (como, por exemplo, um canal Lateral) antes da codificação. O sinal de soma e o sinal de diferença são codificados em forma de onda em codificação MS. São gastos relativamente mais bits no sinal de soma do que no sinal lateral. A codificação PS reduz a redundância em cada sub- banda, pela transformação dos sinais L/R em um sinal de soma e em um conjunto de parâmetros laterais. Os parâmetros laterais podem indicar uma diferença de intensidade intercanal (IDL), uma diferença de fase intercanal (IPD), uma diferença de tempo intercanal (ITD) etc. O sinal de soma é codificado em forma de onda e transmitido junto com os parâmetros laterais. Em um sistema híbrido, o canal Lateral pode codificado em forma de onda nas bandas mais baixas (como, por exemplo, menos de 2 kilohertz (KkHz)) e codificado em PS nas bandas superiores (como, por exemplo, maiores ou iguais a 2 kHz) onde a preservação de fase intercanal é perceptualmente menos crítica.
[0059] A codificação MS e a codificação PS podem ser feitas ou no domínio da frequência ou no domínio da sub-banda. Em alguns exemplos, o canal Esquerdo e o canal Direito podem não ser correlatos. Por exemplo, o canal Esquerdo e o canal Direito podem incluir sinais sintéticos não correlatos. Quando o canal Esquerdo e o canal Direito não são correlatos, a eficiência de codificação de codificação MS, da codificação PS, ou ambas, pode se aproximar da eficiência de codificação da codificação dual-mono.
[0060] Dependendo da configuração de gravação, pode ser que haja um deslocamento temporal entre um canal Esquerdo e um canal Direito, além de outros efeitos espaciais, tais como eco e reverberação de sala. Se o deslocamento temporal e a disparidade de fase entre os canais não forem compensados, o canal de soma e o canal de diferença podem conter potências comparáveis, reduzindo os ganhos de codificação associados com as técnicas de MS ou PS. A redução nos ganhos de codificação pode ser baseada na quantidade de deslocamento temporal (ou fase). As potências comparáveis do sinal de soma e do sinal de diferença podem limitar a utilização de codificação MS em determinados quadros em que os canais são deslocados temporalmente, mas são altamente correlatos. Em codificação estéreo, um canal Medial (como, por exemplo, um canal de soma) e um canal Lateral (como, por exemplo, um canal de diferença) podem ser gerados com base na seguinte equação: M=(L+R)/2,S= (L-R)/2, Equação 1
[0061] em que M corresponde ao canal medial, S corresponde ao canal Lateral, L corresponde ao canal Esquerdo e R corresponde ao canal Direito.
[0062] Em alguns casos, o canal medial e o canal Lateral podem ser gerados com base na seguinte Equação: M=c(L+R, S=c(L-R), Equação 2
[0063] em que c corresponde a um valor complexo ou um valor real que pode variar a partir do quadro a quadro, a partir de uma frequência ou sub-banda para outra, ou uma combinação deles.
[0064] Em alguns casos, o canal medial e o canal Lateral podem ser gerados com base na seguinte Equação: M = (cl*L + c2*R), S = (c3*L-c4*R), Equação 3
[0065] em que cl, c2, c3 e c4 são valores complexos ou valores reais que podem variar a partir do quadro a quadro, a partir de uma sub-banda ou frequência a outra, ou uma combinação deles. A geração do canal medial e do canal Lateral com base na Equação 1, Equação 2 ou Equação 3 pode ser referida como execução de um algoritmo de “redução de amostragem”. Um processo reverso de geração do canal Esquerdo e do canal Direito a partir do canal medial e do canal Lateral com base na equação 1, equação 2 ou equação 3 pode ser referido como execução de um algoritmo de “upmixing”.
[0066] Em alguns casos, o canal medial pode ser baseado em outras equações, tais como: M = (L + gÕR)/2, ou Equação 4 M = g9L + gR Equação 5
[0067] onde gi + gr, = 1.0 e onde gy é um parâmetro de ganho. Em outros exemplos, o downmix pode ser efetuado em bandas, onde mid(b) = ciL(b)+ckR(b), onde co; e c7, são números complexos, onde lado(b) = c3L(b)-caR(b), e onde c; e c, são números complexos.
[0068] Uma abordagem ad hoc utilizada para escolher entre codificação MS ou codificação dual-mono para um quadro específico pode incluir gerar um sinal medial e um sinal lateral, calcular potências do sinal medial e do sinal lateral e determinar se a codificação MS deve ser efetuada com base nas potências. Por exemplo, a codificação MS pode ser efetuada em resposta à determinação de que a razão de potências do sinal lateral e do sinal medial é menor que um limite. Para exemplificar, se um canal Direito for deslocado por pelo menos um primeiro tempo (como, por exemplo, em cerca de 0,001 segundos ou 48 amostras em 48 kHz), uma primeira potência do sinal medial (que corresponde à soma do sinal esquerdo e do sinal direito) pode ser comparável a uma segunda potência do sinal lateral (que corresponde a uma diferença entre o sinal esquerdo e o sinal direito) para quadros de voz harmonizados. Quando a primeira potência é comparável à segunda potência, um número mais elevado de bits pode ser utilizado para codificar o canal Lateral, reduzindo assim a eficiência de codificação de codificação MS em relação à codificação dual-mono. A codificação dual-mono pode, com efeito, ser utilizada quando a primeira potência é comparável à segunda potência (como, por exemplo, quando a razão da primeira potência e da segunda potência é maior que ou igual ao limite). Em uma abordagem alternativa, a decisão entre a codificação MS e a codificação dual-mono para um quadro específico pode ser tomada com base na comparação de um limite e valores de correlação cruzada normalizados do canal Esquerdo e do canal Direito.
[0069] Em alguns exemplos, o codificador pode determinar um valor de disparidade (como, por exemplo, um valor de disparidade temporal, um valor de ganho, um valor de potência, um valor de predição intercanal) indicativo de uma disparidade temporal (como, por exemplo, um deslocamento) do primeiro áudio sinal relativo ao segundo sinal de áudio. O valor de disparidade temporal (como, por exemplo, o valor de disparidade) pode corresponder a uma quantidade de retardo temporal entre a recepção do primeiro sinal de áudio no primeiro microfone e a recepção do segundo sinal de áudio no segundo microfone. Em adição ao mais, o codificador pode determinar o valor de disparidade temporal sobre uma base de quadro por quadro, como, por exemplo, com base em cada quadro de fala/áudio de 20 milissegundos (mseg). Por exemplo, o valor de disparidade temporal pode corresponder a uma quantidade de tempo em que um segundo quadro do segundo sinal de áudio é retardado com relação a um primeiro quadro do primeiro sinal de áudio. Alternativamente, o valor de disparidade temporal pode corresponder a uma quantidade de tempo em que o primeiro quadro do primeiro sinal de áudio é retardado com relação ao segundo quadro do segundo sinal de áudio.
[0070] Quando a fonte de som está mais próxima ao primeiro microfone do que ao segundo microfone, os quadros do segundo sinal de áudio podem ser retardados em relação aos quadros do primeiro sinal de áudio. Nesse caso, o primeiro sinal de áudio pode ser referido como “sinal de áudio de referência” ou “canal de referência” e o segundo sinal de áudio defasado pode ser referido como “sinal de áudio alvo” ou “canal alvo”. Alternativamente, quando a fonte de som está mais próxima ao segundo microfone do que ao primeiro microfone, os quadros do primeiro sinal de áudio podem ser retardados em relação aos quadros do segundo sinal de áudio. Nesse caso, o segundo sinal de áudio pode ser referido como um sinal de áudio de referência ou canal de referência e o primeiro sinal de áudio defasado pode ser referido como um sinal de áudio ou canal alvo.
[0071] Dependendo de onde as fontes de som (como, por exemplo, locutores) estão localizadas em uma sala de conferência ou telepresença ou de como à posição da fonte de som (como, por exemplo, locutor) se altera em relação aos microfones, o canal de referência e o canal alvo podem alterar-se de um quadro para outro; do mesmo modo, o valor de disparidade temporal (como, por exemplo deslocamento) também pode alterar-se de um quadro para outro. Contudo, em algumas implementações, o valor de disparidade temporal pode sempre ser positivo para indicar uma quantidade de retardo do canal “alvo” em relação ao canal “referência”. Em adição ao mais, o valor de disparidade temporal pode corresponder a um valor de “deslocamento não causal” pelo qual o canal alvo retardado é “puxado de volta” no tempo, de tal modo que o canal alvo esteja alinhado (como, por exemplo, alinhado ao máximo) com o canal “referência”. “Puxar de volta” o canal alvo pode corresponder ao avanço do canal alvo no tempo. Um “deslocamento não causal” pode corresponder a um deslocamento de um canal de áudio retardado (como, por exemplo, um canal de áudio defasado) em relação a um canal de áudio principal para alinhar temporariamente o canal de áudio retardado com o canal de áudio principal. O algoritmo de downmix para determinar o canal medial e o canal Lateral pode ser efetuado no canal de referência e no canal alvo deslocado não causal.
[0072] O codificador pode determinar o valor de disparidade temporal com base no primeiro canal de áudio e em uma pluralidade de valores de disparidade temporal aplicados ao segundo canal de áudio. Por exemplo, um primeiro quadro do primeiro canal de áudio, X, pode ser recebido em um primeiro tempo (m;)). Um primeiro quadro específico do segundo canal de áudio, Y, pode ser recebido em um segundo tempo (n;) que corresponde a um primeiro valor de disparidade temporal, como, por exemplo, deslocamentol = nº - m. Além disso, um segundo quadro do primeiro canal de áudio pode ser recebido em um terceiro tempo (m2). Um segundo quadro específico do segundo canal de áudio pode ser recebido em um quarto tempo (n;) que corresponde a um segundo valor de disparidade temporal, como, por exemplo, deslocamento2 = n7 - Ma.
[0073] O dispositivo pode efetuar um algoritmo de enquadramento ou armazenamento para gerar um quadro (como, por exemplo, amostras de 20 mseg) em uma primeira taxa de amostragem (como, por exemplo, taxa de amostragem de 32 kHz (isto é, 640 amostras por quadro)). Em resposta à determinação de que um primeiro quadro do primeiro sinal de áudio e um segundo quadro do segundo sinal de áudio cheguem ao mesmo tempo ao dispositivo, o codificador pode estimar um valor de disparidade temporal (como, por exemplo, deslocamentol) igual a zero amostras. Um canal Esquerdo (como, por exemplo, que corresponde ao primeiro sinal de áudio) e um canal Direito (como, por exemplo, que corresponde ao segundo sinal de áudio) podem ser alinhados temporalmente. Em alguns casos, o canal Esquerdo e o canal Direito, mesmo quando alinhados, podem diferir em potência devido a diversos motivos (como, por exemplo, calibração do microfone).
[0074] Em alguns exemplos, o canal Esquerdo e o canal Direito podem ser disparatados temporariamente (como, por exemplo, não alinhados) devido a diversas razões (como, por exemplo, uma fonte de som, tal como um locutor, pode estar mais próxima a um dos microfones do que do outro e dois microfones podem estar mais acima de um limite de distância (como, por exemplo, de 1 a 20 centímetros)). Uma localização da fonte de som em relação aos microfones pode introduzir retardos diferentes no canal Esquerdo e no canal Direito. Além disso, pode ser que haja uma diferença de ganho, uma diferença de potência ou uma diferença de nível entre o canal Esquerdo e o canal Direito.
[0075] Em alguns exemplos, o tempo de chegada dos sinais de áudio nos microfones a partir de múltiplas fontes de som (como, por exemplo, locutores) pode variar quando os múltiplos locutores estão falando alternativamente (como, por exemplo, sem sobreposição). Em tal caso, o codificador pode ajustar dinamicamente um valor de disparidade temporal com base no locutor para identificar o canal de referência. Em alguns outros exemplos, os múltiplos interlocutores podem estar falando ao mesmo tempo, o que pode resultar em variação de valores de disparidade temporal, dependendo de quem seja o locutor mais alto, mais próximo ao microfone, etc.
[0076] Em alguns exemplos, o primeiro sinal de áudio e o segundo sinal de áudio podem ser sintetizados ou gerados artificialmente quando os dois sinais mostram potencialmente menos (como, por exemplo, não) correlação. Deve ficar entendido que os exemplos aqui descritos são ilustrativos e podem ser instrutivos na determinação de uma relação entre o primeiro sinal de áudio e o segundo sinal de áudio em situações semelhantes ou diferentes.
[0077] O codificador pode gerar valores de comparação (como, por exemplo, valores de diferença ou valores de correlação cruzada) com base na comparação de um primeiro quadro do primeiro sinal de áudio e de uma pluralidade de quadros do segundo sinal de áudio. Cada quadro da pluralidade de quadros pode corresponder a um valor de disparidade temporal específico. O codificador pode gerar um primeiro valor de disparidade temporal estimado (como, por exemplo, um primeiro valor estimado de disparidade) com base nos valores de comparação. Por exemplo, o primeiro valor de disparidade temporal estimado pode corresponder a um valor de comparação que indica uma semelhança temporal mais elevada (ou de menor diferença) entre o primeiro quadro do primeiro sinal de áudio e o primeiro quadro correspondente do segundo sinal de áudio. Um valor de disparidade temporal positivo (como, por exemplo, o primeiro valor de disparidade temporal estimado) pode indicar que o primeiro sinal de áudio é um sinal de áudio principal (como, por exemplo, um sinal de áudio principal temporal) e que o segundo sinal de áudio é um sinal de áudio defasado (como, por exemplo, um sinal de áudio defasado temporal). Um quadro (como, por exemplo, amostras) do sinal de áudio defasado pode ser temporariamente retardado em relação a um quadro (como, por exemplo, amostras) do sinal de áudio principal.
[0078] O codificador pode determinar o valor de disparidade temporal final (como, por exemplo, o valor de disparidade final) por aprimoramento, em múltiplos estágios, de uma série de calores de disparidade temporal estimados. Por exemplo, o codificador pode primeiro estimar um valor de disparidade temporal “experimental” com base nos valores de comparação gerados a partir de versões estéreo pré-processadas e re-amostradas do primeiro sinal de áudio e do segundo sinal de áudio. O codificador pode gerar valores de comparação interpolados associados com valores de disparidade temporal próximos ao valor de disparidade temporal “experimental”. O codificador pode determinar um segundo valor de disparidade temporal “interpolado” estimado com base nos valores de comparação interpolados. Por exemplo, o segundo valor de disparidade temporal “interpolado” estimado pode corresponder a um valor de comparação interpolado específico que indica uma mais elevada semelhança temporal (ou de menor diferença) que os valores de comparação interpolados restantes e o primeiro valor de disparidade temporal “experimental” interpolado.
Se o segundo valor de disparidade temporal “interpolado” estimado do quadro atual (como, por exemplo, o primeiro quadro do primeiro sinal de áudio) for diferente do valor de disparidade temporal final de um quadro anterior (como, por exemplo, um quadro do primeiro sinal de áudio que precede o primeiro quadro), então o valor de disparidade temporal “interpolado” do quadro atual é adicionalmente “alterado” para aperfeiçoar a semelhança temporal entre o primeiro sinal de áudio e o segundo sinal de áudio deslocado.
Em particular, um terceiro valor de disparidade temporal “alterado” estimado pode corresponder a uma medida mais precisa da similaridade temporal, pela busca em torno do segundo valor de disparidade temporal “interpolado” estimado do quadro atual e do valor final de disparidade temporal estimado do quadro anterior. o terceiro valor de disparidade temporal “alterado” estimado é adicionalmente condicionado para estimar o valor de disparidade temporal final, pela limitação de quaisquer alterações espúrias no valor de disparidade temporal entre os quadros e adicionalmente controlado para não comutar de um valor de disparidade temporal negativo para um valor de disparidade temporal positivo ou Vice-versa) em dois quadros sucessivos (ou consecutivos) conforme aqui descrito.
[0079] Em alguns exemplos, o codificador pode abster-se da comutação entre um valor de disparidade temporal positivo e um valor de disparidade temporal negativo ou Vice-versa em quadros consecutivos ou em quadros adjacentes.
Por exemplo, o codificador pode configurar o valor de disparidade temporal final para um valor específico (como, por exemplo, 0) indicando nenhum deslocamento temporal com base no valor de disparidade temporal “interpolado” ou “alterado” estimado do primeiro quadro e um valor de disparidade “interpolado” ou “alterado” ou final correspondente em um quadro específico que precede o primeiro quadro.
Para exemplificar, O codificador pode configurar o valor de disparidade temporal final do quadro atual (como, por exemplo, o primeiro quadro) para indicar nenhum deslocamento temporal, isto é, deslocamentol = 0, em resposta à determinação de que o valor de disparidade temporal “interpolado” ou “alterado” do quadro atual é positivo e o outro valor de disparidade temporal estimado “alterado” ou “final” do quadro anterior (como, por exemplo, o quadro que precede o primeiro quadro) é negativo.
Alternativamente, o codificador também pode configurar o valor de disparidade temporal final do quadro atual (como, por exemplo, o primeiro quadro) para indicar nenhum deslocamento temporal, isto é, deslocamentol = O, em resposta à determinação de que um do valor de disparidade temporal “experimental” ou “interpolado” ou “alterado” do quadro atual seja negativo e o outro do valor de disparidade temporal estimado “experimental” ou “interpolado” ou “alterado” ou “final” do quadro anterior (como, por exemplo, o quadro que precede ao primeiro quadro) seja positivo. Conforme aqui referido, um “deslocamento temporal” pode corresponder a um deslocamento de tempo, uma compensação de tempo, um deslocamento de amostra, uma compensação de amostra ou uma compensação.
[0080] O codificador pode selecionar um quadro do primeiro sinal de áudio ou do segundo sinal de áudio como uma “referência” ou “alvo” com base no valor de disparidade temporal. Por exemplo, em resposta à determinação de que o valor de disparidade temporal final é positivo, o codificador pode gerar um canal de referência ou indicador de sinal que tem um primeiro valor (como, por exemplo, 0) que indica que o primeiro sinal de áudio é um sinal de “referência” e que o segundo sinal de áudio é o sinal “alvo”. Alternativamente, em resposta à determinação de que o valor de disparidade temporal final é negativo, o codificador pode gerar o canal de referência ou o indicador de sinal que tem um segundo valor (como, por exemplo, 1) que indica que o segundo sinal de áudio é o sinal de “referência” e que o primeiro sinal de áudio é o sinal “alvo”.
[0081] O sinal de referência pode corresponder a um sinal principal, enquanto que o sinal alvo pode corresponder a um sinal defasado. Sob um aspecto específico, o sinal de referência pode ser o mesmo sinal que é indicado como um sinal principal pelo primeiro valor de disparidade temporal estimado. Sob um aspecto alternativo, o sinal de referência pode diferir do sinal indicado como sinal principal pelo primeiro valor de disparidade temporal estimado. O sinal de referência pode ser tratado como o sinal principal, independentemente de se o primeiro valor de disparidade temporal estimado indicar que o sinal de referência corresponde a um sinal principal. Por exemplo, o sinal de referência pode ser tratado como o sinal principal que desloca (como, por exemplo, por ajuste) o outro sinal (como, por exemplo, o sinal alvo) em relação ao sinal de referência.
[0082] Em alguns exemplos, o codificador pode identificar ou determinar pelo menos um sinal alvo ou sinal de referência com base em um valor de disparidade (como, por exemplo, um valor de disparidade temporal estimado ou o valor de disparidade temporal final) que corresponde a um quadro a ser codificado e valores de disparidade (como, por exemplo, deslocamento) que correspondem aos quadros codificados anteriormente. O codificador pode armazenar os valores de disparidade na memória. O canal alvo pode corresponder a um canal de áudio defasado temporalmente dos dois canais de áudio e o canal de referência pode corresponder a um canal de áudio principal temporal dos dois canais de áudio. Em alguns exemplos, o codificador pode identificar o canal defasado temporalmente e não alinhar ao máximo o canal alvo com o canal de referência com base nos valores de disparidade a partir da memória. Por exemplo, o codificador pode alinhar parcialmente o canal alvo com o canal de referência com base em um ou mais valores de disparidade. Em alguns outros exemplos, O codificador pode ajustar progressivamente o canal alvo por meio de uma série de quadros, pela distribuição “não causal” do valor de disparidade geral (como, por exemplo, 100 amostras) em valores menores de disparidade (como, por exemplo, 25 amostras, 25 amostras, 25 amostras e 25 amostras) codificadas através de múltiplos quadros (como, por exemplo, quatro quadros).
[0083] O codificador pode estimar um ganho relativo (como, por exemplo, um parâmetro de ganho relativo) associado com o sinal de referência e ao sinal alvo deslocado não causal. Por exemplo, em resposta à determinação de que o valor de disparidade temporal final é positivo, o codificador pode estimar um valor de ganho para normalizar ou equalizar os níveis de potência ou energia do primeiro sinal de áudio em relação ao segundo sinal de áudio que é compensado pelo valor de disparidade temporal não causal (como, por exemplo, um valor absoluto do valor de disparidade temporal final). Alternativamente, em resposta à determinação de que o valor de disparidade temporal final é negativo, o codificador pode estimar um valor de ganho para normalizar ou equalizar os níveis de energia do primeiro sinal de áudio deslocado não causal em relação ao segundo sinal de áudio. Em alguns exemplos, oO codificador pode estimar um valor de ganho para normalizar ou equalizar os níveis de potência ou energia do sinal de “referência” em relação ao sinal “alvo” deslocado não causal. Em outros exemplos, o codificador pode estimar o valor de ganho (como, por exemplo, um valor de ganho relativo) com base no sinal de referência em relação ao sinal alvo (como, por exemplo, o sinal alvo não deslocado).
[0084] O codificador pode gerar pelo menos um sinal codificado (como, por exemplo, um sinal medial, um sinal lateral ou ambos) com base no sinal de referência, no sinal alvo (como, por exemplo, no sinal alvo deslocado ou no sinal alvo não deslocado), no valor de disparidade temporal não causal e no parâmetro de ganho relativo. O sinal lateral pode corresponder a uma diferença entre as primeiras amostras do primeiro quadro do primeiro sinal de áudio e as amostras selecionadas de um quadro selecionado do segundo sinal de áudio. O codificador pode selecionar o quadro selecionado com base no valor de disparidade temporal final. Menos bits podem ser utilizados para codificar o sinal lateral por causa da diferença reduzida entre as primeiras amostras e as amostras selecionadas quando comparadas a outras amostras do segundo sinal de áudio que correspondem a um quadro do segundo sinal de áudio que é recebido pelo dispositivo ao mesmo tempo em que o primeiro quadro. Um transmissor do dispositivo pode transmitir pelo menos um sinal codificado, o valor de disparidade temporal não causal, o parâmetro de ganho relativo, o canal de referência ou indicador de sinal ou uma combinação deles.
[0085] O codificador pode gerar pelo menos um sinal codificado (como, por exemplo, um sinal medial, um sinal lateral ou ambos) com base no sinal de referência, no sinal alvo (como, por exemplo, no sinal alvo deslocado ou no sinal alvo não deslocado), no valor de disparidade temporal não causal, no parâmetro de ganho relativo, nos parâmetros de banda baixa de um quadro específico do primeiro sinal de áudio, nos parâmetros de banda alta do quadro específico ou uma combinação deles. O quadro específico pode preceder o primeiro quadro. Determinados parâmetros de banda baixa, parâmetros de banda alta ou uma combinação deles, a partir de um ou mais quadros anteriores podem ser utilizados para codificar um sinal medial, um sinal lateral, ou ambos, do primeiro quadro.
Codificar o sinal medial, o sinal lateral, ou ambos, com base nos parâmetros de banda baixa, nos parâmetros de banda alta ou em uma combinação deles, pode aperfeiçoar as estimativas do valor de disparidade temporal não causal e do parâmetro de ganho relativo intercanal.
Os parâmetros de banda baixa, os parâmetros de banda alta, ou uma combinação deles, podem incluir um parâmetro de pitch, um parâmetro de harmonização, um parâmetro de tipo codificador, um parâmetro de potência de banda baixa, um parâmetro de potência de banda alta, um parâmetro de inclinação, um parâmetro de ganho de pitch, um parâmetro de ganho de FCB, um parâmetro de modo de codificação, um parâmetro de atividade vocal, um parâmetro de estimativa de ruído, um parâmetro de relação sinal-ruído, um parâmetro de formantes, um parâmetro de decisão de fala/música, oO deslocamento não causal, o parâmetro de ganho intercanal ou uma combinação deles.
Um transmissor do dispositivo pode transmitir pelo menos um sinal codificado, o valor de disparidade temporal não causal, o parâmetro de ganho relativo, o indicador de canal (ou sinal) de referência ou uma combinação deles.
Conforme aqui referido, um “sinal” de áudio corresponde a um “canal” de áudio.
Conforme aqui referido, um “valor de disparidade temporal” corresponde a um valor de compensação, um valor de disparidade, um valor de compensação de tempo, um valor de disparidade temporal de amostra ou um valor de compensação de amostra.
Conforme aqui referido, “deslocar” um sinal alvo pode corresponder à localização(ões) de deslocamento de dados representativos do sinal alvo, copiar os dados para um ou mais armazenadores de memória, mover um ou mais indicadores de memória associados com o sinal alvo, ou uma combinação deles.
[0086] Aspectos específicos da presente revelação são descritos em seguida com referência aos desenhos. Na descrição, recursos comuns são designados por números de referência comuns em todos os desenhos. Conforme aqui utilizado, diversas terminologias são utilizadas para o propósito descrever apenas implementações específicas e não se destinam a ser limitação das implementações. Por exemplo, as formas singulares “um”, “uma”, “o” e “a” pretendem incluir também as formas plurais, a menos que o contexto indique claramente o contrário. Pode-se entender adicionalmente que os termos “compreendem”, “compreende” e “compreender” podem ser utilizados de forma intercambiável com “incluir”, “inclui” ou “que inclui”. Além disso, será entendido que o termo “em que” pode ser utilizado de forma intercambiável com “onde”. Conforme aqui utilizado, “exemplar” pode indicar um exemplo, uma implementação e/ou um aspecto, e não deve ser interpretado como limitativo ou como indicativo de uma preferência ou implementação preferida. Conforme aqui utilizado, um termo ordinal (como, por exemplo, “primeiro”, “segundo”, “terceiro” etc.) utilizado para modificar um elemento, tal como uma estrutura, um componente, uma operação etc., não indica por si só qualquer prioridade ou ordem do elemento com relação a outro elemento, mas apenas meramente distingue o elemento de outro elemento que tenha o mesmo nome (mas para utilização do termo ordinal). Conforme aqui utilizado, o termo “conjunto” refere-se a um ou mais de um elemento específico, e o termo “pluralidade” refere-se a múltiplos (como, por exemplo, dois ou mais) de um elemento específico.
[0087] Na presente revelação, termos como “determinar”, “calcular”, “estimar”, “deslocar”, “ajustar”, etc., podem ser utilizados para descrever como uma ou mais operações são efetuadas. Deve-se observar que tais termos não devem ser interpretados como limitativos e outras técnicas podem ser utilizadas para efetuar operações semelhantes. Além disso, conforme aqui referido, “gerar”, “calcular”, “estimar”, “utilizar”, “selecionar”, “acessar” e “determinar” podem ser utilizados de forma intercambiável. Por exemplo, “Gerar”, “calcular”, “estimar” ou “determinar” um parâmetro (ou um sinal) pode se referir à gerar, estimar, calcular ou determinar o parâmetro (ou sinal) ativamente ou pode se referir à utilizar, selecionar ou acessar o parâmetro (ou sinal) que é desde já gerado, tal como por outro componente ou dispositivo.
[0088] Com referência à Figura l, é revelado um exemplo ilustrativo específico de um sistema e geralmente designado 100. O sistema 100 inclui um primeiro dispositivo 104 acoplado comunicativamente, por meio de uma rede 120, a um segundo dispositivo 106. A rede 120 pode incluir uma ou mais redes sem fio, uma ou mais redes cabeadas ou uma combinação delas.
[0089] O primeiro dispositivo 104 pode incluir um codificador 114, um transmissor 110, uma ou mais interfaces de entrada 112 ou uma combinação deles. Uma primeira interface de entrada das interfaces de entrada 112 pode ser acoplada a um primeiro microfone 146. Uma segunda interface de entrada da(s) interface(s) de entrada 112 pode ser acoplada a um segundo microfone 147. O codificador 114 pode ser configurado para efetuar downmix e codificar sinais de áudio, conforme aqui descrito. O codificador 114 inclui um alinhador intercanal 108 acoplado a um seletor de codificação ou predição (CP) 122 e a um gerador de midside (gen) 148. O codificador 114 também inclui um gerador de sinais 116 acoplado ao seletor de CP 122 e ao gerador de midside 148. Sob um aspecto específico, o alinhador intercanal 108 pode ser referido como um “equalizador temporal”.
[0090] O segundo dispositivo 106 pode incluir um decodificador 118. O decodificador 118 pode incluir um determinador de CP 172 acoplado a um gerador de parâmetros (paramy de upmix 176 e a um gerador de sinais 174. O gerador de sinais 174 é configurado para efetuar upmix e renderizar sinais de áudio. O segundo dispositivo 106 pode ser acoplado a um primeiro alto-falante 142, um segundo alto-falante 144 ou ambos.
[0091] Durante a operação, o primeiro dispositivo 104 pode receber um primeiro sinal de áudio 130 por meio da primeira interface de entrada a partir do primeiro microfone 146 e pode receber um segundo sinal de áudio 132 por meio da segunda interface de entrada a partir do segundo microfone 147. O primeiro sinal de áudio 130 pode corresponde a um sinal de canal direito ou sinal de canal esquerdo. O segundo sinal de áudio 132 pode corresponder ao outro do sinal do canal direito ou do sinal do canal esquerdo. O primeiro microfone 146 e o segundo microfone 147 podem receber áudio a partir de uma fonte de som 152 (como, por exemplo, um usuário, um alto-falante, ruído ambiente, um instrumento musical, etc.). Sob um aspecto específico, o primeiro microfone 146, o segundo microfone 147, ou ambos, podem receber áudio a partir de múltiplas fontes de som. As múltiplas fontes de som podem incluir uma fonte de som dominante (ou mais dominante) (como, por exemplo, a fonte de som 152) e uma ou mais fontes de som secundárias. As uma ou mais fontes de som secundárias podem corresponder ao tráfego, música de fundo, outro locutor, ruído de rua, etc. A fonte de som 152 (como, por exemplo, a fonte de som dominante) pode estar mais próxima ao primeiro microfone 146 do que ao segundo microfone 147. Por conseguinte, um sinal de áudio a partir da fonte de som 152 pode ser recebido na(s) interface(s) de entrada 112 por meio do primeiro microfone 146 mais cedo do que por meio do segundo microfone 147. Esse retardo natural na aquisição de sinal de múltiplos canais através de múltiplos microfones podem introduzir uma disparidade temporal entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132.
[0092] o alinhador intercanal 108 pode determinar um valor de disparidade temporal indicativo de uma disparidade temporal (como, por exemplo, um deslocamento não causal) do primeiro sinal de áudio 130 (como, por exemplo, “alvo”) em relação ao segundo sinal de áudio 132 (como, por exemplo, “referência”), conforme descrito adicionalmente com referência à Figura 7. O valor de disparidade temporal pode ser indicativo de uma quantidade de disparidade temporal (como, por exemplo, retardo de tempo) entre as primeiras amostras de um primeiro quadro do primeiro sinal de áudio 130 e as segundas amostras de um segundo quadro do segundo sinal de áudio 132. Conforme aqui referido, “retardo de tempo” pode corresponder a “retardo temporal”. A disparidade temporal pode ser indicativa de um retardo de tempo entre a recepção, por meio do primeiro microfone 146, por meio do primeiro sinal de áudio 130 e a recepção, por meio do segundo microfone 147, do segundo sinal de áudio 132. Por exemplo, um primeiro valor (como, por exemplo, um valor positivo) do valor de disparidade temporal pode indicar que o segundo sinal de áudio 132 está retardado em relação ao primeiro sinal de áudio 130. Neste exemplo, o primeiro sinal de áudio 130 pode corresponder a um sinal principal e o segundo sinal de áudio 132 pode corresponder para um sinal defasado. Um segundo valor (como, por exemplo, um valor negativo) do valor de disparidade temporal pode indicar que o primeiro sinal de áudio 130 está retardado em relação ao segundo sinal de áudio 132. Neste exemplo, oO primeiro sinal de áudio 130 pode corresponder a um sinal defasado e o segundo sinal de áudio 132 pode corresponder a um sinal principal. Um terceiro valor (como, por exemplo, 0) do valor de disparidade temporal pode indicar nenhum retardo entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132.
[0093] Em algumas implementações, o terceiro valor (como, por exemplo, 0) do valor de disparidade temporal pode indicar que o retardo entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 comutou de sinal. Por exemplo, um primeiro quadro específico do primeiro sinal de áudio 130 pode preceder o primeiro quadro. O primeiro quadro específico e um segundo quadro específico do segundo sinal de áudio 132 podem corresponder ao mesmo som enviado pela fonte de som 152. O mesmo som pode ser detectado mais cedo no primeiro microfone 146 do que no segundo microfone 147. O retardo entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 podem deixar de ter o primeiro quadro específico retardado com relação ao segundo quadro específico para ter o segundo quadro retardado com relação ao primeiro quadro. Alternativamente, o retardo entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 pode deixar de ter o segundo quadro específico retardado com relação ao primeiro quadro específico para ter o primeiro quadro retardado com relação ao segundo quadro. O alinhador intercanal 108 pode configurar o valor de disparidade temporal para indicar o terceiro valor (como, por exemplo, 0), conforme descrito adicionalmente com referência à Figura 7, em resposta à determinação de que o retardo entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 comutou de sinal.
[0094] O alinhador intercanal 108 seleciona, com base no valor de disparidade temporal, um do primeiro sinal de áudio 130 ou do segundo sinal de áudio 132 como um sinal de referência 103 e o outro do primeiro sinal de áudio 130 ou do segundo sinal de áudio 132 como um sinal alvo, conforme descrito adicionalmente com referência à Figura 7. O alinhador intercanal 108 gera um sinal alvo ajustado 105 por ajustamento do sinal alvo com base no valor de disparidade temporal, conforme descrito adicionalmente com referência à Figura 7. O alinhador intercanal 108 gera um ou mais parâmetros de alinhamento intercanal (IICA) 107 com base no primeiro sinal de áudio 130, no segundo sinal de áudio 132 ou em ambos, conforme descrito adicionalmente com referência à Figura 7. O alinhador intercanal 108 fornece o sinal de referência 103 e o sinal alvo ajustado 105 para o seletor de CP 122, o gerador de midside 148, ou ambos. O alinhador intercanal 108 fornece os parâmetros de ICA 107 para o seletor de CP 122, o gerador de midside 148, ou ambos.
[0095] O seletor de CP 122 gera um parâmetro de CP 109 com base nos parâmetros de ICA 107, em um ou mais parâmetros adicionais ou uma combinação deles, conforme descrito adicionalmente com referência à Figura 9. O seletor de CP 122 pode gerar o parâmetro de CP 109 com base na determinação de se os parâmetros de ICA 107 indicam que um sinal lateral 113 que corresponde ao sinal de referência 103 e ao sinal alvo ajustado 105 é um candidato para predição.
[0096] Em um exemplo específico, o seletor de CP 122 determina se o sinal lateral 113 é um candidato para predição com base em um câmbio no valor de disparidade temporal. O valor de disparidade temporal pode mudar através dos quadros quando uma localização de um locutor se altera com relação à localização do primeiro microfone 146 e do segundo microfone 147. O seletor de CP 122 pode, com base na determinação de que o valor da disparidade temporal altera-se através dos quadros por um valor maior que um limite, determinar que o sinal lateral 113 não seja candidato para predição. A alteração maior que o limite no valor de disparidade temporal pode indicar que, provavelmente, um sinal lateral predito seja relativamente diferente do (como, por exemplo, não são bastante próximas de) do sinal lateral 113. Alternativamente, o seletor de CP 122 pode determinar que o sinal lateral 113 é um candidato para predição com base, pelo menos em parte, na determinação de que a alteração no valor de disparidade temporal é menor ou igual ao limite. Uma alteração no valor de disparidade temporal que é menor que ou igual ao limite pode indicar que um sinal lateral predito, provavelmente, deve ser relativamente bem mais próximo ao sinal lateral
113. Em algumas implementações, o limite pode ser variado adaptativamente através dos quadros para permitir a histerese e a suavização na determinação do parâmetro de CP 109, conforme descrito adicionalmente com referência à Figura 9.
[0097] O seletor de CP 122 pode gerar o parâmetro de CP 109 que tem um primeiro valor (como, por exemplo, 0) em resposta à determinação de que o sinal lateral 113 não é candidato para predição. Alternativamente, o seletor de CP 122 pode gerar o parâmetro de CP 109 que tem um segundo valor (como, por exemplo, 1) em resposta à determinação de que o sinal lateral 113 é um candidato para predição.
[0098] O primeiro valor (como, por exemplo, 0) do parâmetro de CP 109 indica que o sinal lateral 113 deve ser codificado para transmissão, que um sinal lateral codificado 123 deve ser transmitido para o segundo dispositivo 106 e que o decodificador 118 deve gerar um sinal lateral sintetizado 173 por decodificação do sinal lateral codificado 123. O segundo valor (como, por exemplo, 1) do parâmetro de CP 109 indica que o sinal lateral 113 não deve ser codificado para transmissão, que o sinal lateral codificado 123 não deve ser transmitido para o segundo dispositivo 106 e que o decodificador 118 deve predizer o sinal lateral sintetizado 173 com base em um sinal medial sintetizado 171. Ao invés disso, quando o sinal lateral codificado 123 não for transmitido, um parâmetro de ganho intercanal (como, por exemplo, um parâmetro de ganho de predição intercanal) pode ser transmitido, conforme descrito adicionalmente com referência às Figuras 2-4.
[0099] O seletor de CP 122 fornece o parâmetro de CP 109 ao gerador de midside 148. O gerador de midside 148 determina um parâmetro de downmix 115 com base no parâmetro de CP 109, conforme descrito adicionalmente com referência à Figura 8. Por exemplo, quando o parâmetro de CP 109 tem um primeiro valor (como, por exemplo, 0), o parâmetro de downmix 115 pode ser baseado em uma métrica de potência, uma métrica de correlação ou ambas. A métrica de potência pode ser baseada na primeira potência do primeiro sinal de áudio 130 e na segunda potência do segundo sinal de áudio 132. A métrica de correlação pode indicar uma correlação (como, por exemplo, uma correlação cruzada, uma diferença ou uma similaridade) entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132. O parâmetro de downmix 115 tem um valor dentro de uma faixa a partir de um primeiro valor (como, por exemplo, 0) a um segundo valor (como, por exemplo, 1). Sob um aspecto específico, o valor específico (como, por exemplo, 0,5) do parâmetro de downmix 115 pode indicar que o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 têm potência semelhante (como,
por exemplo, a primeira potência é aproximadamente igual à segunda potência). Um valor (como, por exemplo, menor que 0,5) do parâmetro de downmix 115 que é mais próximo do primeiro valor (como, por exemplo, 0) do que do segundo valor (como, por exemplo, 1) pode indicar que a primeira potência do primeiro sinal de áudio 130 é maior que a segunda potência do segundo sinal de áudio 132. Um valor (como, por exemplo, maior que 0,5) do parâmetro de downmix 115 que é mais próximo do segundo valor (como, por exemplo, 1) do que o primeiro valor (como, por exemplo, 0) pode indicar que a segunda potência do segundo sinal de áudio 132 é maior que a primeira potência do primeiro sinal de áudio 130. Sob um aspecto específico, o parâmetro de downmix 115 pode indicar potência relativa do sinal de referência 103 para o sinal alvo ajustado 105. Quando o parâmetro de CP 109 tem um segundo valor (como, por exemplo, 1), o parâmetro de downmix 115 pode ser baseado em um valor de parâmetro predefinido (como, por exemplo, 0,5).
[0100] O gerador de midside 148, com base no parâmetro de downmix 115, efetua o processamento de downmix para gerar um sinal medial 111 e o sinal lateral 113 que corresponde ao sinal de referência 103 e ao sinal alvo ajustado 105, conforme descrito adicionalmente com referência à Figura 8. Por exemplo, o sinal medial 111 pode corresponder a uma soma do sinal de referência 103 e o sinal alvo ajustado 105. O sinal lateral 113 pode corresponder a uma diferença entre o sinal de referência 103 e o sinal alvo ajustado 105. O gerador de midside 148 fornece o sinal medial 111, o sinal lateral 113, o parâmetro de downmix 115 ou uma combinação deles, ao gerador de sinais 116.
[0101] O gerador de sinais 116 pode ter um número específico de bits disponíveis para codificar o sinal medial 111, o sinal lateral 113 ou ambos. O gerador de sinais 116 pode determinar uma alocação de bits que indica que um primeiro número de bits é alocado para codificar o sinal medial 111 e que um segundo número de bits é alocado para codificar o sinal lateral 113. O primeiro número de bits pode ser maior que, ou igual a, o segundo número de bits. O gerador de sinais 116 pode, em resposta à determinação de que o parâmetro de CP 109 tem um segundo valor (como, por exemplo, 1) que indica que o sinal lateral codificado 123 não deve ser transmitido, determinar que nenhum bit (como, por exemplo, o segundo número de bits = zero) seja alocado para codificar o sinal lateral 113. O gerador de sinais 116 pode redirecionar os bits que teriam sido utilizados para codificar o sinal lateral 113. Por exemplo, o gerador de sinais 116 pode alocar alguns ou todos os bits redirecionados para codificar o sinal medial 111 ou para transmitir outros parâmetros, tal como um ou mais parâmetros de ganho intercanal, como um exemplo não limitador.
[0102] Em um exemplo específico, o gerador de sinais 116 pode determinar a alocação de bits com base no parâmetro de downmix 115 em resposta à determinação de que o parâmetro de CP 109 tem um primeiro valor (como, por exemplo, 0) que indica que o sinal lateral codificado 123 deve ser transmitido. Um valor específico (como, por exemplo, 0,5) do parâmetro de downmix 115 pode indicar que o sinal lateral 113 tem menos informações e é provável que tenha menos impacto sobre um sinal de saída no segundo dispositivo 106. Um valor de parâmetro de downmix 115 mais distante do valor específico (como, por exemplo, 0,5), tanto quanto mais próximo a um primeiro valor (como, por exemplo, 0) ou a um segundo valor (como, por exemplo, 1) pode indicar que o sinal lateral 113 tem mais potência. O gerador de sinais 116 pode alocar menos bits para codificar o sinal lateral 113 quando o parâmetro de downmix 115 estiver mais próximo do valor específico (como, por exemplo, 0,5).
[0103] O gerador de sinais 116 pode gerar um sinal medial codificado 121 com base no sinal medial 111. O sinal medial codificado 121 pode corresponder a um ou mais primeiros parâmetros de fluxo de bits representativos do sinal medial 111. Os primeiros parâmetros de fluxo de bits podem ser gerados com base na alocação de bits. Por exemplo, uma contagem dos primeiros parâmetros de fluxo de bits, uma exatidão de (como, por exemplo, um número de bits utilizado para representar) um parâmetro de fluxo de bits dos primeiros parâmetros de fluxo de bits, ou ambos, podem ser baseadas no primeiro número de bits alocado para codificar o sinal medial 111.
[0104] O gerador de sinais 116 pode abster-se de gerar o sinal lateral codificado 123 em resposta à determinação de que o parâmetro de CP 109 tem um segundo valor (como, por exemplo, 1) que indica que o sinal lateral codificado 123 não deve ser transmitido, que a alocação de bits indica que zero bits são alocados para codificar o sinal lateral 113, ou ambos. Alternativamente, o gerador de sinais 116 pode gerar o sinal lateral codificado 123 com base no sinal lateral 113 em resposta à determinação de que o parâmetro de CP 109 tem um primeiro valor (como, por exemplo, 0) que indica que o sinal lateral codificado 123 deve ser transmitido e que a alocação de bits indica que um número positivo de bits é alocado para codificar o sinal lateral 113. Oo sinal lateral codificado 123 pode corresponder a um ou mais segundos parâmetros de fluxo de bits representativos do sinal lateral 113. Os segundos parâmetros de fluxo de bits podem ser gerados com base na alocação de bits. Por exemplo, uma contagem dos segundos parâmetros de fluxo de bits, uma exatidão de um parâmetro de fluxo de bits dos segundos parâmetros de fluxo de bits, ou ambos, podem ser baseadas no segundo número de bits alocados para codificação do sinal lateral 113. O gerador de sinais 116 pode gerar o sinal medial codificado 121, o sinal lateral codificado 123, ou ambos, utilizando diversas técnicas de codificação. Por exemplo, o gerador de sinais 116 pode gerar o sinal medial codificado 121, o sinal lateral codificado 123, ou ambos, utilizando uma técnica no domínio do tempo, como predição linear excitada por código algébrico (ACELP). Em algumas implementações, o gerador de midside 148 pode abster-se de gerar o sinal lateral 113 em resposta à determinação de que o parâmetro de CP 109 tem um segundo valor (como, por exemplo, 1) que indica que o sinal lateral 113 não deve ser codificado para transmissão.
[0105] O transmissor 110 transmite parâmetros de fluxo de bits 102 que correspondem ao sinal medial codificado 121, ao sinal lateral codificado 123 ou a ambos. Por exemplo, o transmissor 110, em resposta à determinação de que o parâmetro de CP 109 tem um segundo valor (como, por exemplo, 1) que indica que o sinal lateral codificado 123 não deve ser transmitido, que a alocação de bits indica que zero bits são alocados para codificação o sinal lateral 113, ou ambos, transmite os primeiros parâmetros de fluxo de bits (que correspondem ao sinal medial codificado 121) como os parâmetros de fluxo de bits 102. O transmissor 110 se abstém de transmitir os segundos parâmetros de fluxo de bits (que correspondem ao sinal lateral codificado 123) em resposta à determinação de que o parâmetro de CP 109 tem um segundo valor (como, por exemplo, 1) que indica que o sinal lateral codificado 123 não deve ser transmitido, que a alocação de bits indica que zero bits são alocados para codificar o sinal lateral 113, ou ambos. O transmissor 110 pode, em resposta à determinação de que o parâmetro de CP 109 tem um segundo valor (como, por exemplo, 1) que indica que o sinal lateral codificado 123 não deve ser transmitido, transmitir um ou mais parâmetros de ganho de predição intercanal, conforme descrito adicionalmente com referência às Figuras 2-3. Alternativamente, o transmissor 110 transmite os primeiros parâmetros de fluxo de bits e os segundos parâmetros de fluxo de bits como os parâmetros de fluxo de bits 102 em resposta à determinação de que o parâmetro de CP 109 tem um primeiro valor (como, por exemplo, 0) que indica que o sinal lateral codificado 123 deve ser transmitido e que a alocação de bits indica que um número positivo de bits está alocado para codificar o sinal lateral 113.
[0106] O transmissor 110 pode transmitir um ou mais parâmetros de codificação 140 concomitantemente com os parâmetros de fluxo de bits 102, por meio da rede 120, para o segundo dispositivo 106. Os parâmetros de codificação 140 podem incluir pelo menos um dos parâmetros de ICA 107, do parâmetro de downmix 115, do parâmetro de CP 109, do valor de disparidade temporal ou um ou mais parâmetros adicionais. Por exemplo, o codificador 114 pode determinar um ou mais parâmetros de ganho de predição intercanal, conforme descrito adicionalmente com referência à Figura 2, um ou mais parâmetros de ganho de predição intercanal podem ser baseados no sinal medial 111 e no sinal lateral 113. Os parâmetros de codificação 140 podem incluir um ou mais parâmetros de ganho de predição intercanal, conforme descrito adicionalmente com referência às Figuras 2-3. Em algumas implementações, o transmissor 110 pode armazenar os parâmetros de fluxo de bits 102, os parâmetros de codificação 140, ou uma combinação deles, em um dispositivo da rede 120 ou em um dispositivo local para posterior processamento adicional ou decodificação.
[0107] o decodificador 118 do segundo dispositivo 106 pode decodificar o sinal medial codificado 121, o sinal lateral codificado 123, ou ambos, com base nos parâmetros de fluxo de bits 102, nos parâmetros de codificação 140 ou em uma combinação deles. O determinador de CP 172 pode determinar um parâmetro de CP 179 com base nos parâmetros de codificação 140, conforme descrito adicionalmente com referência à Figura 10. Um primeiro valor (como, por exemplo, 0) do parâmetro de CP 179 indica que os parâmetros de fluxo de bits 102 correspondem ao sinal lateral codificado 123 (em adição ao sinal medial codificado 121) e que o sinal lateral sintetizado 173 deve ser gerado com base nos (como, por exemplo, decodificado) parâmetros de fluxo de bits 102 e independentemente do sinal medial sintetizado 171. Um segundo valor (como, por exemplo, 1) do parâmetro de CP 179 indica que os parâmetros de fluxo de bits 102 não correspondem ao sinal lateral codificado 123 e que o sinal lateral sintetizado 173 deve ser predito com base no sinal medial sintetizado 171.
[0108] Sob alguns aspectos, o transmissor 110 transmite o parâmetro de CP 109 como um dos parâmetros de codificação 140 e o determinador de CP 172 gera o parâmetro de CP 179 que tem o mesmo valor que o parâmetro de CP 109. Sob outros aspectos, o determinador de CP 172 efetua técnicas semelhantes para determinar o parâmetro de CP 179 como o seletor de CP 122 efetuado para determinar o parâmetro de CP 109. Por exemplo, o determinador de CP 172 e o seletor de CP 122 podem determinar o parâmetro de CP 109 e o parâmetro de CP 179, respectivamente, com base em informações (como, por exemplo, um tipo de núcleo ou um tipo de codificador) que está disponível tanto no codificador 114 quanto no decodificador 118.
[0109] O determinador de CP 172 fornece o parâmetro de CP 179 para o gerador de parâmetros de upmix 176, o gerador de sinais 174 ou ambos. O gerador de parâmetros de upmix 176 gera um parâmetro de upmix 175 com base no parâmetro de CP 179, nos parâmetros de codificação 140 ou em uma combinação deles, conforme descrito adicionalmente com referência às Figuras 11-12. O parâmetro de upmix 175 pode corresponder ao parâmetro de downmix 115. Por exemplo, o codificador 114 pode utilizar o parâmetro de downmix 115 para efetuar o processamento de downmix para gerar o sinal medial 111 e o sinal lateral 113 a partir do sinal de referência 103 e do sinal alvo ajustado 105. O gerador de sinais 174 pode utilizar o parâmetro de upmix 175 para efetuar o processamento de upmix para gerar um primeiro sinal de saída 126 e um segundo sinal de saída 128 a partir do sinal medial sintetizado 171 e do sinal lateral sintetizado 173.
[0110] Sob alguns aspectos, o transmissor 110 transmite o parâmetro de downmix 115 como um dos parâmetros de codificação 140 e o gerador de parâmetros de upmix 176 gera o parâmetro de upmix 175 que corresponde ao parâmetro de downmix 115. Sob outros aspectos, o gerador de parâmetros de upmix 176 efetua técnicas semelhantes para determinar o parâmetro de upmix 175 como o gerador de midside 148 efetuado para determinar o parâmetro de downmix
115. Por exemplo, o gerador de midside 148 e o gerador de parâmetros de upmix 176 podem determinar o parâmetro de downmix 115 e o parâmetro de upmix 175, respectivamente, com base em informações (como, por exemplo, fator de sonoridade) que está disponível no codificador 114 e no decodificador 118.
[0111] Sob um aspecto específico, o gerador de parâmetros de upmix 176 gera múltiplos parâmetros de upmix. Por exemplo, o gerador de parâmetros de upmix 176 gera um primeiro parâmetro 175 de upmix, conforme descrito adicionalmente com referência a 1100 da Figura 11, um segundo parâmetro de upmix 175, conforme descrito adicionalmente com referência a 1102 da Figura 11, um terceiro parâmetro de upmix 175, conforme descrito adicionalmente com referência à Figura 12, ou uma combinação deles. Sob esse aspecto, o gerador de sinais 174 utiliza os múltiplos parâmetros de upmix para gerar o primeiro sinal de saída 126 e o segundo sinal de saída 128 a partir do sinal medial sintetizado 171 e do sinal lateral sintetizado 173. Em um exemplo específico, o parâmetro de upmix 175 inclui um ou mais dos parâmetros de ganho de ICA 709, dos parâmetros de ICA 107 (como, por exemplo, o TMV 943), do ICP 208 ou uma configuração de upmix. A configuração de upmix indica uma configuração para efetuar downmix, com base no parâmetro de upmix 175, o sinal medial sintetizado 171 e o sinal lateral sintetizado 173 para gerar o primeiro sinal de saída 126 e o segundo sinal de saída 128.
[0112] Sob um aspecto específico, o codificador 114 pode conservar recursos de rede (como, por exemplo, largura de banda) por abster-se de iniciar a transmissão de parâmetros (como, por exemplo, um ou mais dos parâmetros de codificação 140) que têm valores de parâmetro predefinido. Por exemplo, o codificador 114, em resposta à determinação de que um primeiro parâmetro corresponde a um valor de parâmetro predefinido (como, por exemplo, 0), se abstém de transmitir o primeiro parâmetro como um dos parâmetros de codificação 140. O decodificador 118, em resposta à determinação de que os parâmetros de codificação 140 não incluem o primeiro parâmetro, determina um segundo parâmetro correspondente com base no valor de parâmetro predefinido (como, por exemplo, o). Alternativamente, o codificador 114, em resposta à determinação de que o primeiro parâmetro não corresponde ao valor de parâmetro predefinido (como, por exemplo, 1),
inicia a transmissão (por meio do transmissor 110) do primeiro parâmetro como um dos parâmetros de codificação
140. O decodificador 118 determina o segundo parâmetro correspondente com base no primeiro parâmetro em resposta à determinação de que os parâmetros de codificação 140 incluem o primeiro parâmetro.
[0113] Em um exemplo específico, o primeiro parâmetro inclui o parâmetro de CP 109, o segundo parâmetro correspondente inclui o parâmetro de CP 179 e o valor de parâmetro predefinido inclui um primeiro valor (como, por exemplo, 0) ou um segundo valor (como, por exemplo, 1). Em outro exemplo, o primeiro parâmetro inclui o parâmetro de downmix 115, o segundo parâmetro correspondente inclui o parâmetro de upmix 175 e o valor de parâmetro predefinido inclui um valor específico (como, por exemplo, 0,5).
[0114] O gerador de sinais 174 determina, com base no parâmetro de CP 179, se os parâmetros de fluxo de bits 102 correspondem ao sinal lateral codificado 123. Por exemplo, o gerador de sinais 174 determina, com base em um segundo valor (como, por exemplo, 1) do parâmetro de CP 179, que os parâmetros de fluxo de bits 102 representam o sinal medial codificado 121 e não correspondem ao sinal lateral codificado 123. Sob um aspecto específico, O gerador de sinais 174 pode determinar que todos os bits disponíveis para representar o sinal medial codificado 121, o sinal lateral codificado 123, ou ambos, foram alocados para representar o sinal medial codificado 121. O gerador de sinais 174 gera o sinal medial sintetizado 171 por decodificação dos parâmetros de fluxo de bits 102. Sob um aspecto específico, o sinal medial sintetizado 171 corresponde a um sinal medial sintetizado de banda baixa ou um sinal medial sintetizado de banda alta. O gerador de sinais 174 gera (como, por exemplo, prediz) o sinal lateral sintetizado 173 com base no sinal medial sintetizado 171 conforme descrito adicionalmente com referência às Figuras 2 e 4, Por exemplo, o gerador de sinais 174 gera o sinal lateral sintetizado 173 por aplicação de um ganho de predição intercanal ao sinal medial sintetizado 171. Sob um aspecto específico, o sinal lateral sintetizado 173 corresponde a um sinal lateral sintetizado de banda baixa.
[0115] Em um exemplo específico, o gerador de sinais 174 determina, com base em um primeiro valor de parâmetro de CP 179 (como, por exemplo, 0), que os parâmetros de fluxo de bits 102 correspondem ao sinal lateral codificado 123 e ao sinal medial codificado 121. O gerador de sinais 174 gera o sinal medial sintetizado 171 e o sinal lateral sintetizado 173 por decodificação dos parâmetros de fluxo de bits 102. O gerador de sinais 174 gera o sinal medial sintetizado 171 por decodificação de um primeiro conjunto dos parâmetros de fluxo de bits 102 que correspondem ao sinal medial codificado 121. O gerador de sinais 174 gera o sinal lateral sintetizado 173 por decodificação de um segundo conjunto dos parâmetros de fluxo de bits 102 que correspondem ao sinal lateral codificado 123. Gerar o sinal lateral sintetizado 173, decodificar o segundo conjunto de parâmetros de fluxo de bits 102, pode corresponder à geração do sinal lateral sintetizado 173 independentemente ou parcialmente com base no sinal medial sintetizado 171. Sob um aspecto específico, o sinal lateral sintetizado 173 pode ser gerado concomitantemente com a geração do sinal medial sintetizado
171. Em outro exemplo específico, o gerador de sinais 174 determina, com base em um segundo valor de parâmetro de CP 179 (como, por exemplo, 1), que os parâmetros de fluxo de bits 102 não correspondem ao sinal lateral codificado 123. O gerador de sinais 174 gera o sinal medial sintetizado 171 por decodificação dos parâmetros de fluxo de bits 102 e o gerador de sinais 174 gera o sinal lateral sintetizado 173 com base no sinal medial sintetizado 171 e em um ou mais parâmetros de ganho de predição intercanal recebidos a partir do primeiro dispositivo 104, conforme descrito adicionalmente com referência às Figuras 2 e 4.
[0116] O gerador de sinais 174 pode efetuar upmix, com base no parâmetro de upmix 175, para gerar o primeiro sinal de saída 126 (como, por exemplo, em correspondência ao primeiro sinal de áudio 130) e o segundo sinal de saída 128 (como, por exemplo, em correspondência ao segundo sinal de áudio 132) do sinal medial sintetizado 171 e do sinal lateral sintetizado 173. Por exemplo, o gerador de sinais 174 pode utilizar algoritmos de upmixing que correspondem aos algoritmos de redução de amostragem utilizados pelo gerador de midside 148 para gerar o sinal medial 111 e o sinal lateral 113. Sob um aspecto específico, o sinal medial sintetizado 171 corresponde a um sinal medial sintetizado de banda alta. Nesse aspecto, O gerador de sinais 174 gera um primeiro sinal de saída de banda alta do primeiro sinal de saída 126 por efetuação da extensão de largura de banda intercanal (BWE) sobre o sinal medial sintetizado de banda alta. Por exemplo, os parâmetros de fluxo de bits 102 podem incluir um ou mais parâmetros de BWE intercanal. Os parâmetros de BWE intercanal podem incluir um conjunto de parâmetros de ganho de ajuste. Em uma implementação específica, o gerador de sinais 174 pode gerar o primeiro sinal de saída de banda alta por escalonamento do sinal medial sintetizado de banda alta com base em um primeiro parâmetro de ganho de ajuste. O gerador de sinais 174 gera um segundo sinal de saída de banda alta do segundo sinal de saída 128 com base na efetuação de extensão de largura de banda intercanal sobre o sinal medial sintetizado de banda alta. Por exemplo, o gerador de sinais 174 gera o segundo sinal de saída de banda alta por escalonamento do sinal medial sintetizado de banda alta com base em um segundo parâmetro de ganho de ajuste. O gerador de sinais 174 gera um primeiro sinal de saída de banda baixa do primeiro sinal de saída 126 por upmixing, com base no parâmetro de upmix 175, em um sinal medial sintetizado de banda baixa e em um sinal lateral sintetizado de banda baixa. Um segundo sinal de saída de banda baixa do primeiro sinal de saída 126 é baseado em upmixing, com base no parâmetro de upmix 175, no sinal medial sintetizado de banda baixa e no sinal lateral sintetizado de banda baixa. O gerador de sinais 174 gera o primeiro sinal de saída 126 por combinação do primeiro sinal de saída de banda baixa e do primeiro sinal de saída de banda alta. O gerador de sinais 174 gera o segundo sinal de saída 128 por combinação do segundo sinal de saída de banda baixa e do segundo sinal de saída de banda alta.
[0117] Sob um aspecto específico, o gerador de sinais 174 ajusta, com base em um valor de disparidade temporal específico, pelo menos um do primeiro sinal de saída 126 ou do segundo sinal de saída 128. Os parâmetros de codificação 140 podem indicar o valor de disparidade temporal específico. O valor de disparidade temporal específico pode corresponder ao valor de disparidade temporal utilizado pelo alinhador intercanal 108 para gerar o sinal alvo ajustado 105. O segundo dispositivo 106 pode enviar o primeiro sinal de saída 126 (ou o primeiro sinal de saída ajustado 126) por meio do primeiro alto-falante 142, o segundo sinal de saída 128 (ou o segundo sinal de saída ajustado 128) por meio do segundo alto-falante 144, ou ambos.
[0118] o sistema 100 habilita o ajuste dinâmico da utilização de recursos de rede (como, por exemplo, largura de banda), qualidade dos sinais de saída 126, 128 (como, por exemplo, em termos de aproximação dos sinais de áudio 130, 132) ou ambos. Quando o sinal lateral 113 não é candidato para predição, a alocação de bits pode ser ajustada dinamicamente com base no parâmetro de downmix
115. Menos bits podem ser utilizados para representar o sinal lateral codificado 123 quando o parâmetro de downmix 115 indica que o sinal lateral 113 inclui menos informação. Reduzir o número de bits para representar o sinal lateral codificado 123 pode ter um pequeno impacto (como, Por exemplo, não perceptível) na qualidade dos sinais de saída 126, 128 quando o sinal lateral 113 inclui menos informações. Os bits que teriam sido utilizados para representar o sinal lateral codificado 123 podem ser redirecionados para representar o sinal medial codificado 121 (como, por exemplo, bits adicionais do sinal medial codificado 121 podem ser transmitidos para o segundo dispositivo 106). O sinal medial sintetizado 171 pode ser mais estreitamente próximo do sinal medial 111 devido aos bits adicionais.
[0119] Quando o sinal lateral 113 é um candidato para predição, o gerador de sinais 116 se abstém de transmitir parâmetros de fluxo de bits que correspondem ao sinal lateral codificado 123. Sob um aspecto específico, o transmissor 110 utiliza menos recursos de rede pela abstenção de transmitir os parâmetros de fluxo de bits que correspondem ao sinal lateral codificado 123. o decodificador 118 pode gerar o sinal lateral sintetizado 173 (como, por exemplo, um sinal lateral predito) com base no sinal medial sintetizado 171, em comparação com a geração do sinal lateral sintetizado 173 (como, por exemplo, um sinal lateral decodificado) por decodificação dos parâmetros de fluxo de bits que representam o sinal lateral codificado 123.
[0120] Quando o sinal lateral 113 é candidato para predição, uma diferença entre os sinais de saída (como, por exemplo, o primeiro sinal de saída 126 e o segundo sinal de saída 128) gerados com base no sinal lateral sintetizado 173 (como, por exemplo, o sinal lateral predito) e os sinais de saída gerados com base no sinal lateral decodificado, pode ser relativamente imperceptível para um ouvinte. O sistema 100 pode, assim, habilitar o transmissor 110 a conservar recursos de rede (como, por exemplo, largura de banda) com menor (como, por exemplo, não perceptível) impacto na qualidade de áudio dos sinais de saída.
[0121] Sob um aspecto específico, o codificador 114 redireciona os bits que teriam sido utilizados para transmitir o sinal lateral codificado 123. Por exemplo, o gerador de sinais 116 pode alocar pelo menos alguns dos bits redirecionados para representar melhor o sinal medial codificado 121, os parâmetros de codificação 140, ou uma combinação deles. Para exemplificar, mais bits podem ser utilizados para representar os parâmetros de fluxo de bits 102 que correspondem ao sinal medial codificado 121. A transmissão de bits adicionais que representam o sinal medial codificado 121 pode resultar no sinal medial sintetizado 171 que se acerca mais proximamente do sinal medial 111. O sinal lateral sintetizado 173 predito com base no sinal medial sintetizado 171 (como, por exemplo, que inclui os bits adicionais) pode se acercar mais proximamente (em comparação com o sinal lateral decodificado) do sinal lateral 113.
[0122] o sistema 100 pode, com efeito, habilitar que o decodificador 118 gere sinais de saída 126 128 que são mais estreitamente próximos dos sinais de áudio 130, 132 fazendo com que o transmissor 110 utilize mais bits para representar o sinal medial codificado 121 quando o sinal lateral 113 é um candidato para predição, quando o sinal lateral 113 inclui menos informações, ou ambos. Dessa maneira, o sistema 100 pode aperfeiçoar uma experiência de audição associada com os sinais de saída 126, 128.
[0123] Com referência à Figura 2, é mostrado um exemplo ilustrativo específico de um sistema 200 que sintetiza um sinal lateral com base em um parâmetro de ganho de predição intercanal. Em uma implementação específica, o sistema 200 da Figura 2 inclui ou corresponde ao sistema 100 da Figura 1 após a determinação para predizer um sinal lateral sintetizado com base em um sinal medial sintetizado. O sistema 200 inclui um primeiro dispositivo 204 acoplado comunicativamente, por meio de uma rede 205, a um segundo dispositivo 206. A rede 205 pode incluir uma ou mais redes sem fio, uma ou mais redes cabeadas ou uma combinação delas. Em uma implementação específica, o primeiro dispositivo 204, a rede 205 e o segundo dispositivo 206 podem incluir ou corresponder ao primeiro dispositivo 104, à rede 120 e ao segundo dispositivo 106 da Figura l, respectivamente. Em uma implementação específica, o primeiro dispositivo 204 inclui ou corresponde a um dispositivo móvel. Em outra implementação específica, o primeiro dispositivo 204 inclui ou corresponde a uma estação base. Em uma implementação específica, o segundo dispositivo 206 inclui ou corresponde a um dispositivo móvel. Em outra implementação específica, o segundo dispositivo 206 inclui ou corresponde a uma estação base.
[0124] O primeiro dispositivo 204 pode incluir um codificador 214, um transmissor 210, uma ou mais interfaces de entrada 212 ou uma combinação deles. Uma primeira interface de entrada das interfaces de entrada 212 pode ser acoplada a um primeiro microfone 246. Uma segunda interface de entrada, das interfaces de entrada 212, pode ser acoplada a um segundo microfone 248. O primeiro microfone 246 e o segundo microfone 248 podem ser configurados para capturar uma ou mais entradas de áudio e gerar sinais de áudio. Por exemplo, o primeiro microfone 246 pode ser configurado para capturar um ou mais sons de áudio gerados por uma fonte de som 240 e para enviar um primeiro sinal de áudio 230 com base em um ou mais sons de áudio, e o segundo microfone 248 pode ser configurado para capturar um ou mais sons de áudio gerados pela fonte de som 240 e para enviar um segundo sinal de áudio 232 com base em um ou mais sons de áudio.
[0125] O codificador 214 pode ser configurado para efetuar downmix e codificar sinais de áudio, conforme descrito com referência à Figura 1. Em uma implementação específica, o codificador 214 pode ser configurado para efetuar uma ou mais operações de alinhamento no primeiro sinal de áudio 230 e no segundo sinal de áudio 232, conforme descrito com referência à Figura l. O codificador 214 inclui um gerador de sinais 216, um gerador de parâmetros de ganho de predição intercanal (ICP) 220 e um gerador de fluxo de bits 222. O gerador de sinais 216 pode ser acoplado ao gerador de ICP 220 e ao gerador de fluxo de bits 222, e o gerador de ICP 220 pode ser acoplado ao gerador de fluxo de bits 222. O gerador de sinais 216 é configurado para gerar sinais de áudio com base nos sinais de áudio de entrada recebidos por meio das interfaces de entrada 212, conforme descrito com referência à Figura 1. Por exemplo, o gerador de sinais 216 pode ser configurado para gerar um sinal medial 211 com base no primeiro sinal de áudio 230 e no segundo sinal de áudio 232. Conforme outro exemplo, o gerador de sinais 216 também pode ser configurado para gerar um sinal lateral 213 com base no primeiro sinal de áudio 230 e no segundo sinal de áudio
232. O gerador de sinais 216 é também configurado para codificar um ou mais sinais de áudio. Por exemplo, oO gerador de sinais 216 pode ser configurado para gerar um sinal medial codificado 215 com base no sinal medial 211 Em uma implementação específica, o sinal medial 211, o sinal lateral 213 e o sinal medial codificado 215 incluem ou correspondem ao sinal medial 111, o sinal lateral 113 e o sinal medial codificado 115, respectivamente, da Figura
1. O gerador de sinais 216 pode adicionalmente ser configurado para fornecer o sinal medial 211 e o sinal lateral 213 ao gerador de ICP 220 e fornecer o sinal medial codificado 215 ao gerador de fluxo de bits 222. Em uma implementação específica, o codificador 214 pode ser configurado para aplicar um ou mais filtros ao sinal medial 211 e ao sinal lateral 213 antes de fornecer o sinal medial 211 e o sinal lateral 213 ao gerador de ICP 220 (como, por exemplo, antes de gerar um parâmetro de ganho de predição intercanal).
[0126] O gerador de ICP 220 é configurado para gerar um parâmetro de ganho de predição intercanal (ICP) 208 com base no sinal medial 211 e no sinal lateral 213. Por exemplo, o gerador de ICP 220 pode ser configurado para gerar o ICP 208 com base em uma potência do sinal lateral 213 ou com base em uma potência do sinal medial 211 e na potência do sinal lateral 213, conforme descrito adicionalmente com referência à Figura 3. Alternativamente, o gerador de ICP 220 pode ser configurado para determinar o ICP 208 com base em uma operação (como, por exemplo, uma operação de produto escalar) efetuada no sinal medial 211 e no sinal lateral 213, conforme descrito adicionalmente com referência à Figura 3. O ICP 208 pode representar uma relação entre o sinal medial 211 e o sinal lateral 213, e o ICP 208 pode ser utilizado por um decodificador para sintetizar um sinal lateral a partir de um sinal medial sintetizado, conforme adicionalmente aqui descrito. Embora um único parâmetro de ICP 208 seja mostrado como sendo gerado, em outras implementações, múltiplos parâmetros de ICP podem ser gerados. Conforme um exemplo específico, o sinal medial 211 e o sinal lateral 213 podem ser filtrados em múltiplas bandas, e um ICP que corresponde a cada uma das múltiplas bandas pode ser gerado, conforme descrito adicionalmente com referência à Figura 3. O gerador de ICP 220 pode ser configurado adicionalmente para fornecer o ICP 208 ao gerador de fluxo de bits 222.
[0127] O gerador de fluxo de bits 222 pode ser configurado para receber o sinal medial codificado 215 e gerar um ou mais parâmetros de fluxo de bits 202 que representam um sinal de áudio codificado (além de outros parâmetros). Por exemplo, o sinal de áudio codificado pode incluir ou corresponder ao sinal medial codificado 215. O gerador de fluxo de bits 222 também pode ser configurado para incluir o ICP 208 em um ou mais parâmetros de fluxo de bits 202. Alternativamente, o gerador de fluxo de bits 222 pode ser configurado para gerar um ou mais parâmetros de fluxo de bits 202, de tal modo que o ICP 208 possa ser derivado a partir de um ou mais parâmetros de fluxo de bits
202. Em algumas implementações, um ou mais parâmetros adicionais, tal como um parâmetro de correlação, podem ser incluídos, indicados por ou enviado em adição a um ou mais parâmetros de fluxo de bits 202, conforme descrito adicionalmente com referência às Figuras 13 e 15. O transmissor 210 pode ser configurado para enviar um ou mais parâmetros de fluxo de bits 202 (como, por exemplo, o sinal medial codificado 215) que inclui (ou em adição a) o ICP 208 para o segundo dispositivo 206 por meio da rede 205. Em uma implementação específica, um ou mais parâmetros de fluxo de bits 202 incluem ou correspondem a um ou mais parâmetros de fluxo de bits 102 da Figura 1, e o ICP 208 é incluído em um ou mais parâmetros de codificação 140 que são incluídos (ou enviados em adição a) um ou mais parâmetros de fluxo de bits 102 da Figura 1.
[0128] O segundo dispositivo 206 pode incluir um decodificador 218 e um receptor 260. O receptor 260 pode ser configurado para receber o ICP 208 e um ou mais parâmetros de fluxo de bits 202 (como, por exemplo, o sinal medial codificado 215) a partir do primeiro dispositivo 204 por meio da rede 205. O decodificador 218 pode ser configurado para efetuar downmix e decodificar sinais de áudio. Para exemplificar, o decodificador 218 pode ser configurado para decodificar e misturar um ou mais sinais de áudio com base em um ou mais parâmetros de fluxo de bits 202 (que incluem o ICP 208).
[0129] O decodificador 218 pode incluir um gerador de sinais 274. Em uma implementação específica, O gerador de sinais 274 inclui ou corresponde ao gerador de sinais 174 da Figura l1. O gerador de sinais 274 pode ser configurado para gerar um sinal medial sintetizado 252 com base em um sinal medial codificado 225. Em uma implementação específica, o segundo dispositivo 206 (ou o decodificador 218) inclui circuitos adicionais configurados para determinar ou gerar o sinal medial codificado 225 com base em um ou mais parâmetros de fluxo de bits 202. Alternativamente, o gerador de sinais 274 pode ser configurado para gerar o sinal medial sintetizado 252 diretamente a partir de um ou mais parâmetros de fluxo de bits 202.
[0130] o gerador de sinais 274 pode adicionalmente ser configurado para gerar um sinal lateral sintetizado 254 com base no sinal medial sintetizado 252 e no ICP 208. Em uma implementação específica, o gerador de sinais 274 é configurado para aplicar o ICP 208 ao sinal medial sintetizado 252 (como, por exemplo, multiplicar o sinal medial sintetizado 252 pelo ICP 208) para gerar o sinal lateral sintetizado 254. Em outras implementações, O sinal lateral sintetizado 254 é gerado de outras maneiras, conforme descrito adicionalmente com referência à Figura 4. Em algumas implementações, a aplicação do ICP 208 ao sinal medial sintetizado 252 gera um sinal lateral sintetizado intermediário, e um processamento adicional é efetuado no sinal lateral sintetizado intermediário para gerar o sinal lateral sintetizado 254, conforme descrito adicionalmente com referência às Figuras 13-16. Adicionalmente, ou alternativamente, uma ou mais operações de redução de descontinuidade podem ser efetuadas seletivamente no sinal lateral sintetizado 254, conforme descrito adicionalmente com referência à Figura 14. O decodificador 218 pode ser configurado para processar adicionalmente o sinal medial sintetizado 252 e o sinal lateral sintetizado 254 para gerar um ou mais sinais de áudio de saída. Em uma implementação específica, os sinais de áudio de saída incluem um sinal de áudio esquerdo e um sinal de áudio direito.
[0131] Os sinais de áudio de saída podem ser renderizados e enviados em um ou mais dispositivos de saída de áudio. Para exemplificar, o segundo dispositivo 206 pode ser acoplado a (ou pode incluir) um primeiro alto-falante 242, um segundo alto-falante 244 ou ambos. O primeiro alto- falante 242 pode ser configurado para gerar uma saída de áudio com base em um primeiro sinal de saída 226 e o segundo alto-falante 244 pode ser configurado para gerar uma saída de áudio com base em um segundo sinal de saída
228.
[0132] Durante a operação, o primeiro dispositivo 204 pode receber o primeiro sinal de áudio 230 por meio da primeira interface de entrada a partir do primeiro microfone 246 e pode receber o segundo sinal de áudio 232 por meio da segunda interface de entrada a partir do segundo microfone 248. O primeiro sinal de áudio 230 pode corresponder a um de um sinal do canal direito ou um sinal do canal esquerdo. O segundo sinal de áudio 232 pode corresponder ao outro do sinal do canal direito ou do sinal do canal esquerdo. O primeiro microfone 246 e o segundo microfone 248 podem receber áudio a partir da fonte de som 240 (como, por exemplo, um usuário, um alto-falante, ruído ambiente, um instrumento musical, etc.). Sob um aspecto específico, o primeiro microfone 246, o segundo microfone 248, ou ambos, podem receber áudio a partir de múltiplas fontes de som. As múltiplas fontes de som podem incluir uma fonte de som dominante (ou mais dominante) (como, por exemplo, a fonte de som 240) e uma ou mais fontes de som secundárias. O codificador 214 pode efetuar uma ou mais operações de alinhamento para contabilizar um deslocamento temporal ou retardo temporal entre o primeiro sinal de áudio 230 e o segundo sinal de áudio 232, conforme descrito com referência à Figura 1.
[0133] O codificador 214 pode gerar sinais de áudio com base no primeiro sinal de áudio 230 e no segundo sinal de áudio 232. Por exemplo, o gerador de sinais 216 pode gerar o sinal medial 211 com base no primeiro sinal de áudio 230 e no segundo sinal de áudio 232. Conforme outro exemplo, o gerador de sinais 216 pode gerar o sinal lateral 213 com base no primeiro sinal de áudio 230 e no segundo sinal de áudio 232. O sinal medial 211 pode representar o primeiro sinal de áudio 230 sobreposto ao segundo sinal de áudio 232 e o sinal lateral 213 pode representar uma diferença entre o primeiro sinal de áudio 230 e o segundo sinal de áudio 232. O sinal medial 211 e o sinal lateral 213 podem ser fornecidos ao gerador de ICP 220. O gerador de sinais 216 também pode codificar o sinal medial 211 para gerar o sinal medial codificado 215, que é fornecido ao gerador de fluxo de bits 222. O sinal medial codificado 215 pode corresponder a um ou mais parâmetros de fluxo de bits representativos do sinal medial 211.
[0134] O gerador de ICP 220 pode gerar o ICP 208 com base no sinal medial 211 e no sinal lateral 213. O ICP 208 pode representar uma relação entre o sinal medial 211 e o sinal lateral 213 no codificador 214 (ou uma relação entre o sinal medial sintetizado 252 e o sinal lateral sintetizado 254 no decodificador 218). O ICP 208 pode ser fornecido ao gerador de fluxo de bits 222. Em algumas implementações, o ICP 208 pode ser suavizado com base em parâmetros de ganho de predição intercanal associados com quadros anteriores, conforme descrito adicionalmente com referência à Figura 3.
[0135] O gerador de fluxo de bits 222 pode receber o sinal medial codificado 215 e o ICP 208 e gerar um ou mais parâmetros de fluxo de bits 202. Por exemplo, o sinal medial codificado 215 pode incluir parâmetros de fluxo de bits e um ou mais parâmetros de fluxo de bits podem incluir o parâmetros de fluxo de bits. Em uma implementação específica, um ou mais parâmetros de fluxo de bits 202 incluem o 1ICP 208. Em uma implementação alternativa, um ou mais parâmetros de fluxo de bits 202 incluem um ou mais parâmetros que habilitam que o ICP 208 seja derivado (como, por exemplo, o ICP 208 é derivado a partir de um ou mais parâmetros de fluxo de bits 202). Os parâmetros de fluxo de bits 202 (que incluem ou indicam o ICP 208) são enviados pelo transmissor 210 ao segundo dispositivo 206 por meio da rede 205.
[0136] Em uma implementação específica, o ICP 208 é gerado em uma base por quadro. Por exemplo, o ICP 208 pode ter um primeiro valor associado com um primeiro quadro de áudio do sinal medial codificado 215 e um segundo valor associado com um segundo quadro de áudio do sinal medial codificado 215. O ICP 208 é enviado com (como, por exemplo, incluído em) um ou mais parâmetros de fluxo de bits 202 para cada quadro associado com uma determinação de que o sinal lateral sintetizado 254 deve ser predito (em vez de codificado), conforme descrito com referência à Figura 1. Para esses quadros, o ICP 208 é enviado e um ou mais quadros de áudio de um sinal lateral codificado não são enviados. Para exemplificar, o gerador de fluxo de bits 222 pode abster-se de incluir parâmetros indicativos do sinal lateral codificado responsivo ao ICP 208, que é incluído (como, por exemplo, o primeiro dispositivo 204 se abstém de enviar o sinal lateral codificado para um ou mais quadros que responsivo ao envio do ICP 208 para um ou mais quadros). Para os quadros que são associados com a determinação de codificar o sinal lateral 213, um ou mais parâmetros de fluxo de bits 202 incluem parâmetros que indicam quadros de um sinal lateral codificado e não incluem (ou indicam) o ICP 208. Assim, o ICP 208 ou parâmetros indicativos do sinal lateral codificado (como, por exemplo, não ambos) são incluídos um ou mais parâmetros de fluxo de bits 202 para cada quadro do sinal medial 211 e do sinal lateral 213. Como o ICP 208 utiliza menos bits que o sinal lateral codificado, os bits que de outra forma seriam utilizados para enviar o sinal lateral codificado podem, em vez disso, ser “redirecionados” e utilizados para enviar bits adicionais do sinal medial codificado 215, aperfeiçoando assim a qualidade do sinal medial codificado 215 (que aperfeiçoa a qualidade do sinal medial sintetizado 252 e do sinal lateral sintetizado 254, desde que o sinal lateral sintetizado 254 seja predito a partir do sinal medial sintetizado 252).
[0137] O segundo dispositivo 206 (como, por exemplo, o receptor 260) pode receber um ou mais parâmetros de fluxo de bits 202 (indicativos do sinal medial codificado 215) que incluem (ou indicam) o ICP 208. O decodificador 218 pode determinar o sinal medial codificado
225 com base em um ou mais parâmetros de fluxo de bits 202. O sinal medial codificado 225 pode ser semelhante ao sinal medial codificado 215, embora com pequenas diferenças devido a erros durante a transmissão ou devido ao processo de conversão de um ou mais parâmetros 202 de fluxo de bits no sinal medial codificado 225. O gerador de sinais 274 pode gerar o sinal medial sintetizado 252 com base no sinal medial codificado 225 (como, por exemplo, um ou mais parâmetros de fluxo de bits 202). O gerador de sinais 274 também pode gerar o sinal lateral sintetizado 254 com base no sinal medial sintetizado 252 e no ICP 208. Em uma implementação específica, o gerador de sinais 274 multiplica o sinal lateral sintetizado 254 pelo ICP 208 para gerar o sinal lateral sintetizado 254 Em outras implementações, o sinal lateral sintetizado 254 é baseado no sinal medial sintetizado 252, no ICP 208 e em um ou mais outros valores. Detalhes adicionais da determinação do sinal lateral sintetizado 254 são descritos com referência à Figura 4. Em algumas implementações, o sinal medial sintetizado 252 é filtrado antes da geração do sinal lateral sintetizado 254, subsequentemente à geração do sinal lateral sintetizado 254, ou ambos, conforme descrito adicionalmente com referência à Figura 4.
[0138] Após gerar o sinal medial sintetizado 252 e o sinal lateral sintetizado 254, o decodificador 218 pode efetuar adicionalmente processamento, filtragem, aumento de amostragem e upmixing no sinal medial sintetizado 252 e no sinal lateral sintetizado 254 para gerar um primeiro sinal de áudio e um segundo sinal de áudio. Em uma implementação específica, o primeiro sinal de áudio corresponde a um de um sinal esquerdo ou sinal direito, e o segundo sinal de áudio corresponde ao outro sinal esquerdo ou sinal direito. O primeiro sinal de áudio e o segundo sinal de áudio podem ser renderizados e enviados como o primeiro sinal de saída 226 e o segundo sinal de saída 228. Em uma implementação específica, o primeiro alto-falante 242 gera uma saída de áudio com base no primeiro sinal de saída 226 e o segundo alto-falante 244 gera uma saída de áudio com base no segundo sinal de saída
228.
[0139] O sistema 200 da Figura 2 habilita a geração e o envio do ICP 208 para quadros associados com uma determinação para predição de um sinal lateral (em vez de codificar o sinal lateral). O ICP 208 é gerado no codificador 214 para habilitar que o decodificador 218 predizer (como, por exemplo, gerar) o sinal lateral sintetizado 254 com base no sinal medial sintetizado 252. Assim, o ICP 208 é enviado em vez de um sinal lateral codificado para os quadros associados com a determinação de predizer o sinal lateral. Como o envio do ICP 208 utiliza menos bits do que o envio do sinal lateral codificado, os recursos de rede podem ser conservados, embora sejam relativamente despercebidos por um ouvinte. Alternativamente, um ou mais bits que, de outra forma, seriam utilizados para enviar o sinal lateral codificado podem, em vez disso, ser utilizados para enviar bits adicionais do sinal medial codificado 215. Aumentar o número de bits utilizados para enviar o sinal medial codificado 215 aperfeiçoa a qualidade do sinal medial sintetizado 252 gerado no decodificador 218. Além disso como o sinal lateral sintetizado 254 é gerado com base no sinal medial sintetizado 252, o que aumenta o número de bits utilizados para o envio do sinal medial codificado 215, há o aperfeiçoamento da qualidade do sinal lateral sintetizado 254, o que pode reduzir artefatos de áudio e aperfeiçoar a experiência de usuário como um todo.
[0140] A Figura 3 é um diagrama que mostra um exemplo ilustrativo específico de um codificador 314 do sistema 200 da Figura 2. Por exemplo, o codificador 314 pode incluir ou corresponder ao codificador 214 da Figura
2.
[0141] O codificador 314 inclui um gerador de sinais 316, um detector de potência 324, um gerador de ICP 320 e um gerador de fluxo de bits 322. O gerador de sinais 316, o gerador de ICP 320 e o gerador de fluxo de bits 322 podem incluir ou corresponder ao gerador de sinais 216, o gerador de ICP 220 e o gerador de fluxo de bits 222 da Figura 2, respectivamente. O gerador de sinais 316 pode ser acoplado ao gerador de ICP 320, ao detector de potência 324 e ao gerador de fluxo de bits 322. O detector de potência 324 pode ser acoplado ao gerador de ICP 320 e o gerador de ICP 320 pode ser acoplado ao gerador de fluxo de bits 322.
[0142] O codificador 314 pode opcionalmente incluir um ou mais filtros 331, um redutor de amostras 340, um sintetizador de sinal 342, um suavizador de ICP 350, um gerador de coeficientes de filtro 360 ou uma combinação deles. Um ou mais filtros 331 e o redutor de amostras 340 podem ser acoplados entre o gerador de sinais 316 e o gerador de ICP 320, o sintetizador de sinal 342 pode ser acoplado ao detector de potência 324 e ao gerador de ICP
320, o suavizador de ICP 350 pode ser acoplado entre o gerador de ICP 320 e o gerador de fluxo de bits 322, e o gerador de coeficientes de filtro 360 pode ser acoplado entre o gerador de sinais 316 e o gerador de fluxo de bits
322. Cada um de um ou mais filtros 331, do redutor de amostras 340, do sintetizador de sinal 342, do suavizador de ICP 350 e do gerador de coeficientes de filtro 360, são opcionais e, portanto, podem não ser incluídos em algumas implementações do codificador 314.
[0143] O gerador de sinais 316 pode ser configurado para gerar sinais de áudio com base nos sinais de áudio de entrada. Por exemplo, o gerador de sinais 316 pode ser configurado para gerar um sinal medial 311 com base em um primeiro sinal de áudio 330 e um segundo sinal de áudio 332. Conforme outro exemplo, o gerador de sinais 316 pode ser configurado para gerar um sinal lateral 313 com base no primeiro sinal de áudio 330 e no segundo sinal de áudio 332. O primeiro sinal de áudio 330 e o segundo sinal de áudio 332 podem incluir ou corresponder ao primeiro sinal de áudio 230 e ao segundo sinal de áudio 232 da Figura 2, respectivamente. O gerador de sinais 316 também pode ser configurado para codificar um ou mais sinais de áudio. Por exemplo, o gerador de sinais 316 pode ser configurado para gerar um sinal medial codificado 315 com base no sinal medial 311. Em algumas implementações, O gerador de sinais 316 é configurado para gerar um sinal lateral codificado 317 com base no sinal lateral 313, conforme adicionalmente aqui descrito.
[0144] Em algumas implementações, um ou mais filtros 331 são configurados para receber o sinal medial
311 e o sinal lateral 313 e para filtrar o sinal medial 311 e o sinal lateral 313. Um ou mais filtros 331 podem incluir um ou mais tipos de filtros.
Por exemplo, um ou mais filtros 331 podem incluir filtros de pré-acentuação, filtros passa-banda, filtros de transformada rápida de Fourier (FET) (ou transformadas), filtros (ou transformadas) de FTT inversa (IFFT), filtros no domínio do tempo, filtros no domínio de sub-banda ou frequência ou uma combinação deles.
Em uma implementação específica, um ou mais filtros 331 incluem um filtro de pré-acentuação fixo e um filtro passa-alta de 50 Hertz (Hz). Em outra implementação específica, um ou mais filtros 331 incluem um filtro passa-baixa e um filtro passa-alta.
Nessa implementação, o filtro passa-baixa do um ou mais filtros 331 é configurado para gerar um sinal medial de banda baixa 333 e um sinal lateral de banda baixa 336, e o filtro passa-alta do um ou mais filtros 331 é configurado para gerar um sinal medial de banda alta 334 e um sinal lateral de banda alta 338. Nessa implementação, múltiplos parâmetros de ganho de predição intercanal podem ser determinados com base no sinal medial de banda baixa 333, no sinal medial de banda alta 334, no sinal lateral de banda baixa 336 e no sinal lateral de banda alta 338, conforme adicionalmente aqui descrito.
Em outras implementações, um ou mais filtros 331 incluem diferentes filtros passa-banda (como, por exemplo, um filtro passa- baixa e um filtro passa-média ou um filtro passa-média e um filtro passa-alta, como exemplos não limitadores) ou diferentes números de filtros passa-banda (como, por exemplo, um filtro passa-baixa, um filtro passa-média e um filtro passa-alta, conforme um exemplo não limitador).
[0145] Em uma implementação específica, o redutor de amostras 340 é configurado para efetuar redução de amostragem do sinal medial 311 e do sinal lateral 313. Por exemplo, o redutor de amostras 340 pode ser configurado para efetuar redução de amostragem do sinal medial 311 e do sinal lateral 313 a partir de uma taxa de amostragem de entrada (associada com o primeiro sinal de áudio 330 e o segundo sinal de áudio 332). A redução de amostragem do sinal medial 311 e do sinal lateral 313 permite a geração de parâmetros de ganho de predição intercanal na taxa reduzida de amostragem (em vez da taxa de amostragem de entrada). Embora mostrado na Figura 3 como sendo acoplado à saída de um ou mais filtros 331, em outras implementações, o redutor de amostras 340 pode ser acoplado entre o gerador de sinais 316 e o um ou mais filtros 331.
[0146] o detector de potência 324 é configurado para detectar um nível de potência associado com um ou mais sinais de áudio. Por exemplo, o detector de potência 324 pode ser configurado para detectar um nível de potência associado com o sinal medial 311 (como, por exemplo, um nível de potência medial 326) e um nível de potência associado com o sinal lateral 313 (como, por exemplo, um nível de potência lateral 328). O detector de potência 324 pode ser configurado para fornecer o nível de potência lateral 328 (ou ambos, o nível de potência lateral 328 e o nível de potência medial 326) ao gerador de ICP
320.
[0147] Em uma implementação específica, o codificador 314 inclui o sintetizador de sinal 342. O sintetizador de sinal 342 pode ser configurado para gerar um ou mais sinais de áudio sintetizados que podem ser utilizados para gerar parâmetros de fluxo de bits a serem enviados para outro dispositivo (como, por exemplo, para um decodificador). O sintetizador de sinal 342 (como, por exemplo, um decodificador local) pode ser configurado para gerar um sinal medial sintetizado 344 de uma maneira semelhante à geração de um sinal medial sintetizado em um decodificador. Por exemplo, o sinal medial codificado 315 pode corresponder a parâmetros de fluxo de bits representativos do sinal medial 311. O sintetizador de sinal 342 pode gerar o sinal medial sintetizado 344 por decodificação dos parâmetros de fluxo de bits. O sinal medial sintetizado 344 pode ser fornecido ao detector de potência 324 e ao gerador de ICP 320. Em uma implementação específica, o detector de potência 324 é configurado adicionalmente para detectar um nível de potência associado com o sinal medial sintetizado 344 (como, por exemplo, um nível de potência medial sintetizado 329). O nível de potência medial sintetizado 329 pode ser fornecido ao gerador de ICP 320.
[0148] O gerador de ICP 320 é configurado para gerar um ou mais parâmetros de ganho de predição intercanal com base em sinais de áudio e níveis de potência dos sinais de áudio. Por exemplo, o gerador de ICP 320 pode ser configurado para gerar um ICP 308 com base no sinal medial 311, no sinal lateral 313 e em um ou mais níveis de potência. Em uma implementação específica, o gerador de ICP
320 e o ICP 308 incluem ou correspondem ao gerador de ICP 220 e ao ICP 208 da Figura 2, respectivamente. Em algumas implementações, o gerador de ICP 320 inclui um circuito de produto escalar 321. O circuito de produto escalar 321 pode ser configurado para gerar um produto escalar de dois sinais de áudio, e o gerador de ICP 320 pode ser configurado para determinar o ICP 308 com base no produto escalar, conforme aqui descrito.
[0149] Em uma implementação específica, o ICP 308 é baseado no nível de potência medial 326 e no nível de potência lateral 328. Nesta implementação, o gerador de ICP 320 (como, por exemplo, o codificador 314) é configurado para determinar uma razão do nível de potência lateral 328 e do nível de potência medial 326, e o ICP 308 é baseado na razão. Em outra implementação específica, o ICP 308 é baseado no nível de potência lateral 328 e no nível de potência medial sintetizado 329. Nesta implementação, O gerador de ICP 320 (como, por exemplo, o codificador 314) é configurado para determinar uma razão do nível de potência lateral 328 e do nível de potência medial sintetizado 329, e o ICP 308 é baseado na razão. Em outra implementação específica, o ICP 308 é baseado no nível de potência lateral 328 (e não no nível de potência medial 326 ou no nível de potência medial sintetizado 329). Em outra implementação específica, o ICP 308 é baseado no sinal medial 311, no sinal lateral 313 e no nível de potência medial 326. Nesta implementação, o circuito de produto escalar 321 é configurado para gerar um produto escalar do sinal medial 311 e do sinal lateral 313, o gerador de ICP 320 é configurado para gerar uma razão do nível de potência medial 326 e do produto escalar, e o ICP 308 é baseado na razão. Em outra implementação específica, o ICP 308 é baseado no sinal medial sintetizado 344, no sinal lateral 313 e no nível de potência medial sintetizado 329. Nesta implementação, o circuito de produto escalar 321 é configurado para gerar um produto escalar do sinal sintetizado intermediário 344 e do sinal lateral 313, o gerador de ICP 320 é configurado para gerar uma razão do nível de potência medial sintetizado 329 e do produto escalar, e o ICP 308 é baseado na razão. Em outra implementação específica, o gerador de ICP 320 é configurado para gerar múltiplos parâmetros de ganho de predição intercanal que correspondem a diferentes sinais ou bandas de sinal. Por exemplo, o gerador de ICP 320 pode ser configurado para gerar o ICP 308 com base no sinal medial de banda baixa 333 e no sinal lateral de banda baixa 336, e o gerador de ICP 320 pode ser configurado para gerar um segundo ICP 354 com base no sinal medial de banda alta 334 e sinal lateral de banda alta 338. Detalhes adicionais que se referem à determinação do ICP 308 são adicionalmente aqui descritos. O gerador de ICP 320 pode ser configurado adicionalmente para fornecer o ICP 308 (e o segundo ICP 354) ao gerador de fluxo de bits 322.
[0150] Em uma implementação específica, o suavizador de ICP 350 é configurado para efetuar uma operação de suavização no ICP 308 antes do ICP 308 ter sido fornecido ao gerador de fluxo de bits 322. A operação de suavização pode condicionar o ICP 308 a reduzir (ou eliminar) valores espúrios, tal como em limites de quadro específicos. A operação de suavização pode ser efetuada utilizando-se um fator de suavização 352. Em uma implementação específica, o suavizador de ICP 350 pode ser configurado para efetuar a operação de suavização de acordo com a seguinte equação: gICP smoothed = a * gICP smoothed (quadro anterior) + (1 - a) * gICP instantaneous onde gICP smoothed é o valor suavizado do ICP 308 para um quadro atual, gICP smoothed(quadro anterior) é o valor suavizado do ICP 308 para o quadro anterior, gICP instantaneous é um valor instantâneo do ICP 308 e à é o fator de suavização 352.
[0151] Em uma implementação específica, o fator de suavização 352 é um fator de suavização fixo. Por exemplo, o fator de suavização 352 pode ser um valor específico que é acessível ao suavizador de ICP 350. Conforme um exemplo específico, o fator de suavização pode ser 0,7. Alternativamente, o fator de suavização 352 pode ser um fator de suavização adaptativo. Em uma implementação específica, o fator de suavização adaptativo pode ser baseado nas potências de sinal do sinal medial 311. Para exemplificar, o valor do fator de suavização 352 pode ser baseado em um nível de sinal de curto prazo (Esr) e um nível de sinal de longo prazo (Err) do sinal medial 311 e do sinal lateral 313. Conforme um exemplo, o nível de sinal de curto prazo pode ser calculado para o quadro (N) que é processado ( (Est) (N)) somando-se a soma dos valores absolutos de amostras de referência com amostragem reduzida do sinal medial 311 e a soma dos valores absolutos de amostras com amostragem reduzida do sinal lateral 313. O nível de sinal de longo prazo pode ser uma versão suavizada do nível de sinal de curto prazo. Por exemplo, Erxr(N) = 0,6 * En(N-1) + 0,4 * Es(N). Além disso, o valor do fator de suavização 352 (como, por exemplo, a) pode ser controlado de acordo com o pseudo-código descrito a seguir:
[0152] Configura-se a como um valor inicial (como, por exemplo, 0,95).
se Esp > 4 * Err, modifica-se o valor de a (como, por exemplo, a = 0,5) se Esp > 2 * Em E Esp € 4 * Err, modifica-se o valor de a (como, por exemplo, a = 0,7)
[0153] Embora descrito como sendo determinado com base no sinal medial 311 e no sinal lateral 313, em outras implementações, o nível de sinal de curto prazo e Oo nível de sinal de longo prazo podem ser determinados com base no sinal medial sintetizado 344 e no sinal lateral
313. Em outra implementação específica, o fator de suavização 352 é um fator de suavização adaptativo que é baseada em um parâmetro de harmonização associado com o sinal medial 311. O parâmetro de harmonização pode indicar uma quantidade de som estacionário ou segmentos fortemente harmonizados no sinal medial 311 (ou no primeiro sinal de áudio 330 e no segundo sinal de áudio 332). Se o parâmetro de harmonização tem um valor relativamente alto, o(s) sinal (ais) pode (m) incluir segmentos fortemente harmonizados com ruído relativamente baixo, assim o fator de suavização 352 pode ser diminuído para reduzir (como, por exemplo, minimizar) uma taxa na qual a suavização é efetuada. Se o parâmetro de harmonização tiver um valor relativamente baixo, o(s) sinal(ais) pode (m) incluir segmentos fracamente harmonizados com ruído relativamente alto, assim o fator de suavização 352 pode ser aumentado para aumentar (como, por exemplo, maximizar) a taxa na qual a suavização é efetuada. Por conseguinte, em algumas implementações, o fator de suavização 352 pode ser indiretamente proporcional ao parâmetro de harmonização. Em outras implementações, o fator de suavização 352 pode ser baseado em outros parâmetros ou valores. Embora a suavização do ICP 308 tenha sido descrita, em implementações nas quais o segundo ICP 354 é gerado, a operação de suavização também pode ser aplicada ao segundo ICP 354.
[0154] Em uma implementação específica, a predição de um sinal lateral sintetizado em um decodificador inclui aplicar um filtro adaptativo a um sinal medial sintetizado (ou o sinal lateral sintetizado predito), conforme descrito adicionalmente com referência à Figura 4. Nesta implementação, o codificador 314 inclui o gerador de coeficientes de filtro 360. O gerador de coeficientes de filtro 360 pode ser configurado para gerar um ou mais coeficientes de filtro 362 para o filtro adaptativo que deve ser aplicado no decodificador. Por exemplo, o gerador de coeficientes de filtro 360 pode ser configurado para gerar um ou mais coeficientes de filtro 362 com base no sinal medial 311, no sinal lateral 313, no sinal medial codificado 315, no sinal lateral codificado 317, em um ou mais outros parâmetros, ou uma combinação deles. O gerador de coeficientes de filtro 360 pode ser configurado adicionalmente para fornecer um ou mais coeficientes de filtro 362 ao gerador de fluxo de bits 322 para inclusão nos parâmetros de fluxo de bits enviados pelo codificador 314.
[0155] O gerador de fluxo de bits 322 pode ser configurado para gerar um ou mais parâmetros de fluxo de bits indicativos de um sinal de áudio codificado (além de outros parâmetros). Por exemplo, o gerador de fluxo de bits 322 pode ser configurado para gerar um ou mais parâmetros de fluxo de bits 302 que incluem o sinal medial codificado
315. Um ou mais parâmetros de fluxo de bits 302 podem incluir outros parâmetros, tais como um parâmetro de pitch, um parâmetro de harmonização, um parâmetro de tipo de codificador, parâmetro de potência de banda baixa, parâmetro de potência de banda alta, parâmetro de inclinação, parâmetro de ganho de pitch, parâmetro de ganho de livro de códigos fixo (FCB), parâmetro de modo de codificação, parâmetro de atividade vocal, parâmetro de estimativa de ruído, um parâmetro de relação sinal-ruído, um parâmetro de formantes, um parâmetro de fala/música, um parâmetro de deslocamento não causal ou uma combinação deles. Em uma implementação específica, um ou mais parâmetros de fluxo de bits 302 incluem o ICP 308. Alternativamente, um ou mais parâmetros de fluxo de bits 302 podem incluir um ou mais parâmetros que permitem que o ICP 308 seja derivado (como, por exemplo, o ICP 308 é derivado de um ou mais parâmetros de fluxo de bits 302). Em algumas implementações, um ou mais parâmetros de fluxo de bits 302 também incluem (ou indicam) o segundo ICP 354. Em uma implementação específica, um ou mais parâmetros de fluxo de bits 302 incluem (ou indicam) um ou mais coeficientes de filtro 362. O codificador 314 pode ser configurado para enviar um ou mais parâmetros de fluxo de bits 302 (que inclui ou que indica o ICP 308) para um transmissor para transmissão para outros dispositivos.
[0156] Durante a operação, o codificador 314 recebe o primeiro sinal de áudio 330 e o segundo sinal de áudio 332, como a partir de uma ou mais interfaces de entrada. O gerador de sinais 316 pode gerar o sinal medial 311 e o sinal lateral 313 com base no primeiro sinal de áudio 330 e no segundo sinal de áudio 332. O gerador de sinais 316 também pode gerar o sinal medial codificado 315 com base no sinal medial 311. Em algumas implementações, O gerador de sinais 316 pode gerar o sinal lateral codificado 317 com base no sinal lateral 313. Por exemplo, o sinal lateral codificado 317 pode ser gerado para um ou mais quadros associados com a determinação de não predizer um sinal lateral sintetizado em um decodificador (como, por exemplo, uma determinação para codificar o sinal lateral 313). Adicionalmente, ou alternativamente, o sinal lateral codificado 317 pode ser gerado para determinar um ou mais parâmetros utilizados na geração de um ou mais parâmetros de fluxo de bits 302 ou para determinar um ou mais coeficientes de filtro 362.
[0157] Em algumas implementações, um ou mais filtros 331 podem filtrar o sinal medial 311 e o sinal lateral 313. Por exemplo, um ou mais filtros 331 podem efetuar filtragem de pré-acentuação no sinal medial 311 e no sinal lateral 313. Em algumas implementações, o redutor de amostras 340 pode efetuar redução de amostragem do sinal medial 311 e do sinal lateral 313. Por exemplo, o redutor de amostras 340 pode efetuar redução de amostragem do sinal medial 311 e do sinal lateral 313 a partir de uma frequência de amostragem de entrada associada com oO primeiro sinal de áudio 330 e com o segundo sinal de áudio 332 para uma frequência com amostragem reduzida. Em uma implementação específica, a frequência com amostragem reduzida está dentro da faixa de O a 6,4 kHz. Em uma implementação específica, o redutor de amostras 340 pode efetuar redução de amostragem do sinal medial 311 para gerar um primeiro sinal de áudio com amostragem reduzida (como, por exemplo, um sinal medial com amostragem reduzida) e pode efetuar redução de amostragem do sinal lateral 313 para gerar um segundo sinal de áudio com amostragem reduzida (como, por exemplo, um sinal lateral com amostragem reduzida), e o ICP 308 pode ser gerado com base no primeiro sinal de áudio com amostragem reduzida e no segundo sinal de áudio com amostragem reduzida. Em uma implementação alternativa, o redutor de amostras 340 não está incluído no codificador 314, e o ICP 308 é determinado na taxa de amostragem de entrada associada com o primeiro sinal de áudio 330 e o segundo sinal de áudio 332. Embora a filtragen e redução de amostragem sejam descritas com referência à Figura 3 como sendo efetuadas após a geração do sinal medial 311 e do sinal lateral 313, em outras implementações, a filtragemy a redução de amostragem ou ambas podem, em vez disso (ou em adição) ser efetuadas no primeiro sinal de áudio 330 e no segundo sinal de áudio 332 antes da geração do sinal medial 311 e do sinal lateral
313.
[0158] Oo detector de potência 324 pode detectar um ou mais níveis de potência associados com um ou mais sinais de áudio e fornecer os níveis de potência detectados ao gerador de ICP 320 para utilização na geração do ICP 308. Por exemplo, o detector de potência 324 pode detectar o nível de potência medial 326, o nível de potência lateral 328, o nível de potência medial sintetizado 329 ou uma combinação deles. O nível de potência medial 326 é baseado no sinal medial 311, o nível de potência lateral 328 é baseado no sinal lateral 313 e o nível de potência medial sintetizado 329 é baseado no sinal medial sintetizado 344, que é gerado pelo sintetizador de sinal 342. Por exemplo, em algumas implementações, O codificador 314 inclui o sintetizador de sinal 342 que gera o sinal medial sintetizado 344 que é utilizado para determinar um ou mais parâmetros de um ou mais parâmetros de fluxo de bits 302. Nessas implementações, o sinal medial sintetizado 344 pode ser utilizado para gerar parâmetro(s) de ganho de predição intercanal. Em outras implementações, o sintetizador de sinal 342 não está incluído no codificador 314 e o codificador 314 não tem acesso ao sinal medial sintetizado 344.
[0159] O gerador de ICP 320 gera o ICP 308 com base em um ou mais sinais e um ou mais níveis de potência. Um ou mais sinais podem incluir o sinal medial 311, o sinal lateral 313, o sinal medial sintetizado 344 ou uma combinação deles, e um ou mais níveis de potência podem incluir o nível de potência medial 326, o nível de potência lateral 328, o nível de potência medial sintetizado 329 ou uma combinação deles.
[0160] Em algumas implementações, a determinação do ICP 308 é “baseada em potência”. Por exemplo, o ICP 308 pode ser determinado para preservar potência de um sinal específico ou de uma relação entre potências de dois sinais diferentes.
Em uma primeira implementação específica, o ICP 308 é um fator de escala que preserva a potência relativa entre o sinal medial 311 e o sinal lateral 313 no codificador 314. Na primeira implementação, o ICP 308 é baseado em uma razão do nível de potência medial 326 e do nível de potência lateral 328, e o ICP 308 é determinado de acordo com a seguinte equação:
ICP Gain = sart (Potência(side signal unquantized)/ Potência(mid signal unquantized)
onde ICP Gain é o ICP 308, Potência(side signal unquantized) é o nível de potência lateral 328 e Potência(mid signal unquantized) é o nível de potência medial 326. Na primeira implementação, um sinal lateral sintetizado predito (como, por exemplo, mapeado) é determinado em um decodificador de acordo com a seguinte equação:
Side Mapped = Mid signal quantized * ICP Gain onde Side Mapped é o sinal lateral sintetizado predito (como, por exemplo, mapeado), ICP Gain é o ICP 308 e Mid signal quantized é um sinal medial sintetizado que é gerado com base em parâmetros de fluxo de bits (como, por exemplo, um ou mais parâmetros de fluxo de bits 302). Embora seja descrito como o Side Mapped sendo o produto do Mid signal quantized com o ICP Gain, em outras implementações, o Side Mapped pode ser um sinal medial e pode passar por processamento adicional (como, por exemplo, filtragem passa-tudo, filtragem de desacentuação etc.))
antes de ser utilizado em operações subsequentes no decodificador (como, por exemplo, operações de upmix).
[0161] Em uma segunda implementação específica, o ICP 308 é um fator de escala que corresponde à potência do sinal lateral sintetizado gerado em um decodificador para o nível de potência lateral 328 no codificador 314. Na segunda implementação, o ICP 308 é baseado em um razão do nível de potência medial sintetizado 329 e do nível de potência lateral 328, e o ICP 308 é determinado de acordo com a seguinte equação: ICP Gain = sqart (Potência (side signal unquantized)/ Potência(mid signal quantized) onde Potência(side signal unquantized) é o nível de potência lateral 328, Potência(mid signal quantized) é o nível de potência medial sintetizado 329 e ICP Gain é o ICP
308. Na segunda implementação, um sinal lateral sintetizado predito (como, por exemplo, mapeado) é determinado em um decodificador de acordo com a seguinte equação: Side Mapped = Mid signal quantized * ICP Gain onde Side Mapped é o sinal lateral sintetizado predito (como, por exemplo, mapeado), ICP Gain é o ICP 308, e Mid signal quantized é um sinal medial sintetizado que é gerado com base em parâmetros de fluxo de bits.
[0162] Em uma terceira implementação específica, o ICP 308 representa um valor absoluto do nível de potência lateral 328 no codificador 314. Na terceira implementação, o ICP 308 é determinado de acordo com a seguinte equação:
ICP Gain = sqrt (Potência(side signal unquantized)) onde sqrt(Potência(side signal unquantized) é o nível de potência lateral 328. Na terceira implementação, um sinal lateral sintetizado predito (como, por exemplo, mapeado) é determinado em um decodificador de acordo com a seguinte equação: Side Mapped = Mid signal quantized * ICP Gain/sqrt (Potência (Mid signal quantized)) onde Side Mapped é o sinal lateral sintetizado predito (como, por exemplo, mapeado), ICP Gain é o ICP 308 e Mid signal quantized é um sinal medial sintetizado que é gerado com base em parâmetros de fluxo de bits.
[0163] Em algumas implementações, a determinação do ICP 308 é “baseada em erro quadrático médio (MSE)”. Por exemplo, o ICP 308 pode ser determinado de tal modo que o MSE entre um sinal lateral sintetizado em um decodificador e o sinal lateral 313 seja reduzido (como, por exemplo, minimizado). Em uma quarta implementação específica, o ICP 308 é determinado de tal modo que, ao mapear (como, por exemplo, predizer) a partir do sinal medial 311, o MSE entre o sinal lateral 313 no codificador 314 e o sinal lateral sintetizado no decodificador seja minimizado (ou reduzido). Na quarta implementação, o ICP 308 é baseado em uma razão do nível de potência medial 326 e produto escalar do sinal medial 311 e do sinal lateral 313, e o ICP 308 é determinado de acordo com a seguinte equação:
ICP Gain = IMid signal unquantized. Side signal unquantized)| /Potência(mid signal unquantized) onde ICP Gain é o ICP 308, IMid signal unquantized. Side signal unquantized)| é o produto escalar do sinal medial 311 e o sinal lateral 313 (gerado pelo circuito de produto escalar 321), e Potência(mid signal unquantized) é o nível de potência medial 326. Na quarta implementação, um sinal lateral sintetizado predito (como, por exemplo, mapeado) é determinado em um decodificador de acordo com a seguinte equação: Side Mapped = Mid signal quantized * ICP Gain onde Side Mapped é o sinal lateral sintetizado predito (como, por exemplo, mapeado), ICP Gain é o ICP 308 e Mid signal quantized é um sinal medial sintetizado que é gerado com base em parâmetros de fluxo de bits.
[0164] Em uma quinta implementação específica, o ICP 308 é determinado de tal modo que, ao mapear (como, por exemplo, predizer) o MSE, entre o sinal lateral 313 no codificador 314 e o sinal lateral sintetizado no decodificador a partir do sinal medial sintetizado 344, seja minimizado (ou reduzido). Na quinta implementação, oO ICP 308 é baseado em uma razão do nível de potência medial sintetizado 329 e em um produto escalar do sinal medial sintetizado 344 e no sinal lateral 313, e o ICP 308 é determinado de acordo com a seguinte equação: ICP Gain = IMid signal quantized. Side signal unquantized| /Potência(mid signal quantized)
onde ICP Gain é o ICP 308, |Mid signal quantized. Side signal unquantized| é o produto escalar do sinal medial sintetizado 344 e o sinal lateral 313 (gerado pelos circuitos do produto escalar 321), e Potência(mid signal quantized) é o nível de potência medial sintetizado 329. Na quinta implementação, um sinal lateral sintetizado predito (como, por exemplo, mapeado) o é determinado em um decodificador de acordo com a seguinte equação: Side Mapped = Mid signal quantized * ICP Gain onde Side Mapped é o sinal lateral sintetizado predito (como, por exemplo, mapeado), ICP Gain é o ICP 308 e Mid signal quantized é um sinal medial sintetizado que é gerado com base em parâmetros de fluxo de bits. Em outras implementações, o ICP 308 pode ser gerado utilizando-se outras técnicas.
[0164] Em algumas implementações, o suavizador de ICP 350 efetua uma operação de suavização no ICP 308. A operação de suavização pode ser baseada no fator de suavização 352. O fator de suavização 352 pode ser um fator de suavização fixo ou um fator de suavização adaptativo. Em implementações nas quais o fator de suavização 352 é um fator de suavização adaptativo, o fator de suavização 352 pode ser baseado na potência de sinal do sinal medial 311 (como, por exemplo, no nível de sinal de curto prazo e no nível de sinal de longo prazo) ou com base em um parâmetro de harmonização associado com o sinal medial 311, conforme exemplos não limitadores. Em uma implementação específica, o suavizador de ICP 350 pode restringir o valor do ICP 308 para estar dentro de uma faixa fixa (como, por exemplo entre um limite inferior e um limite superior). Conforme um exemplo específico, o suavizador de ICP 350 pode efetuar uma operação de recorte no ICP 308 de acordo com o seguinte pseudocódigo: st stereo->gICP final = min(st estéreo >gICP smoothed, 0,6) em que gICP final corresponde a um valor final do ICP 308 e gICP smoothed corresponde a um valor suavizado do ICP 308 antes da efetuação da operação de recorte. Em outras implementações, a operação de recorte pode restringir o valor do ICP 308 a ser menor que 0,6 ou maior que 0,6.
[0166] Em algumas implementações, o gerador de ICP 320 também pode gerar um parâmetro de correlação com base no sinal medial 311 e no sinal lateral 313. O parâmetro correlação pode representar uma correlação entre o sinal medial 311 e o sinal lateral 313. Detalhes com referência à geração do parâmetro de correlação são descritos adicionalmente com referência à Figura 15. O parâmetro de correlação pode ser fornecido ao gerador de fluxo de bits 322 para inclusão em um ou mais parâmetros de fluxo de bits 302 (ou para saída em adição a um ou mais parâmetros de fluxo de bits 302). Em algumas implementações, o suavizador de ICP 350 efetua uma operação de suavização no parâmetro de correlação de uma maneira semelhante à efetuação da operação de suavização no ICP
308.
[0167] O gerador de fluxo de bits 322 pode receber o ICP 308 e o sinal medial codificado 315 e gerar um ou mais parâmetros de fluxo de bits 302. Um ou mais parâmetros de fluxo de bits 302 podem habilitar a geração de um sinal medial sintetizado em um decodificador). Um ou mais parâmetros de fluxo de bits 302 podem incluir (ou indicar) o ICP 308 (ou o ICP 308 pode ser enviado em adição a um ou mais parâmetros de fluxo de bits 302). Em uma implementação específica, o gerador de fluxo de bits 322 recebe um ou mais coeficientes de filtro 362 (como, por exemplo, um ou mais coeficientes de filtro adaptativos) que são gerados pelo gerador de coeficientes de filtro 360 e o gerador de fluxo de bits 322 inclui um ou mais coeficientes de filtro 362 (ou valores que habilitam a derivação de um ou mais coeficientes de filtro 362) um ou mais parâmetros de fluxo de bits 302. Um ou mais parâmetros de fluxo de bits 302 (que incluem ou indicam o ICP 308) podem ser enviados pelo codificador 314 para um transmissor para transmissão para outro dispositivo, conforme descrito com referência à Figura 2.
[0168] Em uma implementação específica, são gerados múltiplos parâmetros de ganho de predição intercanal. Para exemplificar, um ou mais filtros 331 podem incluir filtros passa-banda ou filtros FEFT configurados para gerar diferentes bandas de sinal. Por exemplo, um ou mais filtros 331 podem processar o sinal medial 311 para gerar o sinal medial de banda baixa 333 e o sinal medial de banda alta 334. Conforme outro exemplo, um ou mais filtros 331 podem processar o sinal lateral 313 para gerar o sinal lateral de banda baixa 336 e o sinal lateral de banda alta
338. Em outras implementações, outras bandas de sinal podem ser geradas ou mais de duas bandas de sinal podem ser geradas. Sob um aspecto específico, um ou mais filtros 331 geram um primeiro sinal filtrado (como, por exemplo, o sinal medial de banda baixa 333 ou o sinal lateral de banda baixa 336) que corresponde a uma primeira banda de sinal que pelo menos parcialmente se sobrepõe a uma segunda banda de sinal que corresponde a um segundo sinal filtrado (como, por exemplo, o sinal medial da banda alta 334 ou o sinal lateral da banda alta 338). Sob um aspecto alternativo, a primeira banda de sinal não se sobrepõe à segunda banda de sinal.
Os sinais múltiplos 333-338 podem ser fornecidos ao gerador de ICP 320 e o gerador de ICP 320 pode gerar múltiplos parâmetros de ganho de predição intercanal com base nos sinais múltiplos.
Por exemplo, o gerador de ICP 320 pode gerar o ICP 308 com base no sinal medial de banda baixa 333 e no sinal lateral de banda baixa 336, e o gerador de ICP 320 pode gerar o segundo ICP 354 com base no sinal medial de banda alta 334 e no sinal lateral de banda alta 338. O ICP 308 e o segundo ICP 354 podem ser opcionalmente suavizados e fornecidos ao gerador de fluxo de bits 322 para inclusão em um ou mais parâmetros de fluxo de bits 302 (ou para saída em adição a um ou mais parâmetros de fluxo de bits 302). Gerar múltiplos valores de ICP pode permitir que diferentes ganhos sejam aplicados em diferentes bandas, o que pode aperfeiçoar a predição como um todo do sinal lateral sintetizado em um decodificador.
Conforme um exemplo específico, o sinal lateral 313 pode corresponder a 20% da potência total (como, por exemplo, uma soma da potência do sinal medial 311 e a potência do sinal lateral 313) na banda baixa, mas pode corresponder a 60% da potência total na banda alta.
Por conseguinte, sintetizar a banda baixa do sinal lateral com base no ICP 308 e sintetizar a banda alta do sinal lateral com base no segundo ICP 354 pode resultar em um sinal lateral sintetizado mais preciso do que sintetizar o sinal lateral com base em um parâmetro de ganho de predição intercanal para todas as bandas de sinal.
[0169] O codificador 314 da Figura 3 permite a geração de parâmetros de ganho de predição intercanal para quadros associados com uma determinação para predizer um sinal lateral em um decodificador (em vez de codificar o sinal lateral). O parâmetro de ganho de predição intercanal (como, por exemplo, o ICP 308) é gerado no codificador 314 para permitir que um decodificador efetue predição (como, por exemplo, efetue geração) de um sinal lateral sintetizado com base em um sinal medial sintetizado que é gerado com base em um ou mais parâmetros de fluxo de bits gerados no codificador 314. Como o ICP 308 é enviado ao invés de um quadro do sinal lateral codificado 317 e porque o ICP 308 utiliza menos bits que o sinal lateral codificado 317, os recursos de rede podem ser conservados enquanto são relativamente despercebidos por um ouvinte. Alternativamente, um ou mais bits que, de outra forma, seriam utilizados para enviar o sinal lateral codificado 317 podem, em vez disso, ser redirecionados (como, por exemplo, utilizados) para enviar bits adicionais do sinal medial codificado 315. Aumentar o número de bits utilizados para enviar o sinal medial codificado 315 aumenta a quantidade de informação associada com o sinal medial codificado 315 que é enviado pelo codificador 314. Aumentar o número de bits do sinal medial codificado 315 que são enviados pelo codificador 314 pode aperfeiçoar a qualidade de um sinal medial sintetizado gerado em um decodificador, que pode reduzir (ou eliminar) artefatos de áudio no sinal medial sintetizado no decodificador (e no sinal lateral sintetizado no decodificador, uma vez que o sinal lateral sintetizado é predito com base no sinal medial sintetizado).
[0170] A Figura 4 é um diagrama que mostra um exemplo ilustrativo específico de um decodificador 418 do sistema 200 da Figura 2. Por exemplo, o decodificador 418 pode incluir ou corresponder ao decodificador 218 da Figura
2.
[0171] O decodificador 418 inclui um circuito de processamento de fluxo de bits 424 e um gerador de sinais 450 que inclui um sintetizador medial 452 e um sintetizador lateral 456. O gerador de sinais 450 pode incluir ou corresponder ao gerador de sinais 274 da Figura
2. O circuito de processamento de fluxo de bits 424 pode ser acoplado ao gerador de sinais 450.
[0172] O decodificador 418 pode opcionalmente incluir um detector de potência 460 e um ampliador de amostragem 464, e o gerador de sinais 450 pode opcionalmente incluir um ou mais filtros 454 e um ou mais filtros 458. Um ou mais filtros 454 podem ser acoplados entre o sintetizador medial 452 e o sintetizador lateral 456, um ou mais filtros 458 podem ser acoplados ao sintetizador lateral 456, o ampliador de amostragem 464 pode ser acoplado ao gerador de sinais 450 (como, por exemplo, a uma saída do gerador de sinais 450) e ao detector de potência 460 pode ser acoplado ao sintetizador medial 452 e ao sintetizador lateral 456. Cada um de um ou mais filtros 454, um ou mais filtros 458, o ampliador de amostragem 464 e o detector de potência 460 são opcionais e, assim, não podem ser incluídos em algumas implementações do decodificador 418.
[0173] O circuito de processamento de fluxo de bits 424 pode ser configurado para processar parâmetros de fluxo de bits e extrair parâmetros específicos a partir dos parâmetros de fluxo de bits. Por exemplo, o circuito de processamento de fluxo de bits 424 pode ser configurado para receber um ou mais parâmetros de fluxo de bits 402 (como, por exemplo, a partir de um receptor). Um ou mais parâmetros de fluxo de bits 402 podem incluir (ou indicar) um parâmetro de ganho de predição intercanal (ICP) 408. Alternativamente, o ICP 408 pode ser recebido em adição a um ou mais parâmetros de fluxo de bits 402. Um ou mais parâmetros de fluxo de bits 402 e o ICP 408 podem incluir ou corresponder a um ou mais parâmetros de fluxo de bits 302 e ao ICP 308 da Figura 3, respectivamente. Em algumas implementações, um ou mais parâmetros de fluxo de bits 402 também podem incluir (ou indicar) um ou mais coeficientes
406. Um ou mais coeficientes 406 podem incluir um ou mais coeficientes de filtro adaptativos que são gerados por um codificador (como, por exemplo, o codificador 314 da Figura 3, como um exemplo não limitador).
[0174] O circuito de processamento de fluxo de bits 424 pode ser configurado para extrair um ou mais parâmetros específicos a partir de um ou mais parâmetros de fluxo de bits 402. Por exemplo, o circuito de processamento de fluxo de bits 424 pode ser configurado para extrair (como, por exemplo, gerar) o ICP 408 e um ou mais parâmetros de sinal medial codificado 426. Um ou mais parâmetros de sinal medial codificado 426 incluem parâmetros indicativos de um sinal de áudio codificado (como, por exemplo, um sinal medial codificado) que é gerado em um codificador. Um ou mais parâmetros de sinal medial codificado 426 podem habilitar a geração de um sinal medial sintetizado, conforme aqui descrito. O circuito de processamento de fluxo de bits 424 pode ser configurado para fornecer o ICP 408 e um ou mais parâmetros de sinal medial codificado 426 para o gerador de sinais 450 (como, por exemplo, para o sintetizador medial 452). Em uma implementação específica, o circuito de processamento de fluxo de bits 424 é configurado adicionalmente para extrair um ou mais coeficientes 406 e fornecer um ou mais coeficientes 406 ao gerador de sinais 450 (como, por exemplo, a um ou mais filtros 454, a um ou mais filtros 458 ou ambos).
[0175] O gerador de sinais 450 pode ser configurado para gerar sinais de áudio com base nos parâmetros de sinal medial codificado 426 e no ICP 408. Para exemplificar, o sintetizador medial 452 pode ser configurado para gerar um sinal medial sintetizado 470 com base nos parâmetros de sinal medial codificado 426 (como, por exemplo, com base em um sinal medial codificado). Por exemplo, os parâmetros de sinal medial codificado 426 podem permitir a derivação do sinal medial sintetizado 470, e o sintetizador medial 452 pode ser configurado para derivar o sinal medial sintetizado 470 a partir dos parâmetros de sinal medial codificado 426. O sinal medial sintetizado 470 pode representar um primeiro sinal de áudio sobreposto a um segundo sinal de áudio.
[0176] Em uma implementação específica, um ou mais filtros 454 são configurados para receber o sinal medial sintetizado 470 e filtrar o sinal medial sintetizado
470. Um ou mais filtros 454 podem incluir um ou mais tipos de filtros. Por exemplo, um ou mais filtros 454 podem incluir filtros de desacentuação, filtros passa-banda, filtros FFT (ou transformadas), filtros IFFT (ou transformadas), filtros no domínio do tempo, filtros no domínio de frequência ou sub-banda no domínio, Ou uma combinação deles. Em uma implementação específica, um ou mais filtros 454 incluem um ou mais filtros fixos. Alternativamente, um ou mais filtros 454 podem incluir um ou mais filtros adaptativos configurados para filtrar o sinal medial sintetizado 470 com base nos coeficientes 406 (como, por exemplo, um ou mais coeficientes de filtro adaptativos que são recebidos a partir de outro dispositivo). Em uma implementação específica, um ou mais filtros 454 incluem um filtro de desacentuação e um filtro passa-alta de 50 Hz. Em outra implementação específica, um ou mais filtros 454 incluem um filtro passa-baixa e um filtro passa-alta. Nesta implementação, o filtro passa- baixa de um ou mais filtros 454 é configurado para gerar um sinal medial sintetizado de banda baixa 474, e o filtro passa-alta de um ou mais filtros 454 é configurado para gerar um sinal medial sintetizado de banda alta 473. Nesta implementação, múltiplos parâmetros de ganho de predição intercanal podem ser utilizados para predizer sinais múltiplos laterais sintetizados, conforme aqui descrito adicionalmente. Em outras implementações, um ou mais filtros 454 incluem diferentes filtros passa-banda (como, por exemplo, um filtro passa-baixa e um filtro passa-média ou um filtro passa-média e um filtro passa-alta, como exemplos não limitadores) ou diferentes números de filtros passa-banda (como, por exemplo, um filtro passa-baixa, um filtro passa-média e um filtro passa-alta, como um exemplo não limitador).
[0177] O sintetizador lateral 456 pode ser configurado para gerar um sinal lateral sintetizado 472 com base no sinal medial sintetizado 470 e no ICP 408. Por exemplo, o sintetizador lateral 456 pode ser configurado para aplicar o ICP 408 ao sinal medial sintetizado 470 para gerar o sinal lateral sintetizado 472. O sinal lateral sintetizado 472 pode representar uma diferença entre um primeiro sinal de áudio e um segundo sinal de áudio. Em uma implementação específica, o sintetizador lateral 456 pode ser configurado para multiplicar o sinal medial sintetizado 470 pelo ICP 408 para gerar o sinal lateral sintetizado
472. Em outra implementação específica, o sintetizador lateral 456 pode ser configurado para gerar o sinal lateral sintetizado 472 com base no sinal medial sintetizado 470 no ICP 408 e em um nível de potência do sinal medial sintetizado 470 (como, por exemplo, uma potência medial sintetizada 462). A potência medial sintetizada 462 pode ser recebida no sintetizador lateral 456 a partir do detector de potência 460. Por exemplo, o detector de potência 460 pode ser configurado para receber o sinal medial sintetizado 470 a partir do sintetizador medial 452 e o detector de potência 460 pode ser configurado para detectar a potência medial sintetizada 462 a partir do sinal medial sintetizado 470. Em outra implementação específica, o sintetizador lateral 456 pode ser configurado para gerar sinais múltiplos laterais (ou bandas de sinal) com base em múltiplos parâmetros de ganho de predição intercanal. Por exemplo, o sintetizador lateral 456 pode ser configurado para gerar um sinal lateral sintetizado de banda baixa 476 com base no sinal medial sintetizado de banda baixa 474 e no ICP 408, e o sintetizador lateral 456 pode ser configurado para gerar um sinal lateral sintetizado de banda alta 475 com base no sinal medial sintetizado de banda alta 473 e em um segundo ICP (como, por exemplo, o segundo ICP 354 da Figura 3).
[0178] Em uma implementação específica, um ou mais filtros 458 são configurados para receber o sinal lateral sintetizado 472 e filtrar o sinal lateral sintetizado 472. Um ou mais filtros 458 podem incluir um ou mais tipos de filtros. Por exemplo, um ou mais filtros 458 podem incluir filtros de desacentuação, filtros passa- banda, filtros de FTT (ou transformadas), filtros IFFT (ou transformadas), filtros no domínio do tempo, filtros no domínio da frequência ou sub-banda, ou uma combinação deles. Em uma implementação específica, um ou mais filtros 458 incluem um ou mais filtros fixos. Alternativamente, um ou mais filtros 458 podem incluir um ou mais filtros adaptativos configurados para filtrar o sinal lateral sintetizado 472 com base nos coeficientes 406 (como, por exemplo, um ou mais coeficientes de filtro adaptativos que são recebidos a partir de outro dispositivo). Em uma implementação específica, um ou mais filtros 458 incluem um filtro de desacentuação e um filtro passa-alta de 50 Hz. Em outra implementação específica, um ou mais filtros 458 incluem um filtro de combinação (ou outro combinador de sinal) configurado para combinar sinais múltiplos (ou bandas de sinal) para gerar um sinal sintetizado. Por exemplo, um ou mais filtros 458 podem ser configurados para combinar o sinal lateral sintetizado de banda alta 475 e o sinal lateral sintetizado de banda baixa 476 para gerar o sinal lateral sintetizado 472. Embora tenha siso descrito a efetuação de filtragem em sinal lateral sintetizado, em outras implementações (como, por exemplo, implementações que não incluem um ou mais filtros 454), um ou mais filtros 458 também podem ser configurados para efetuar filtragem em sinais mediais sintetizados.
[0179] Em uma implementação específica, o ampliador de amostragem 464 é configurado para efetuar aumento de amostragem do sinal medial sintetizado 470 e do sinal lateral sintetizado 472. Por exemplo, o ampliador de amostragem 464 pode ser configurado para efetuar aumento de amostragem do sinal medial sintetizado 470 e do sinal lateral sintetizado 472 a partir de uma taxa reduzida de amostragem (na qual o sinal medial sintetizado 470 e o sinal lateral sintetizado 472 são gerados) a uma taxa de aumento de amostragem (como, por exemplo, uma taxa de amostragem de entrada de sinais de áudio que são recebidos em um codificador e utilizados para gerar um ou mais parâmetros de fluxo de bits 402). O aumento de amostragem do sinal medial sintetizado 470 e do sinal lateral sintetizado 472 permite a geração (como, por exemplo, pelo decodificador 418) de sinais de áudio a uma taxa de amostragem de saída associada com a reprodução de sinais de áudio.
[0180] o decodificador 418 pode ser configurado para gerar um primeiro sinal de áudio 480 e um segundo sinal de áudio 482 com base no sinal medial sintetizado com aumento de amostragem 470 e no sinal lateral sintetizado com aumento de amostragem 472. Por exemplo, o decodificador 418 pode efetuar upmixing, conforme descrito com referência ao decodificador 118 da Figura 1, do sinal medial sintetizado 470 e do sinal lateral sintetizado 472 com base em um parâmetro de upmix para gerar o primeiro sinal de áudio 480 e o segundo sinal de áudio 482.
[0181] Durante a operação, o decodificador 418 recebe um ou mais parâmetros de fluxo de bits 402 (como, por exemplo, a partir de um receptor). Um ou mais parâmetros de fluxo de bits 402 incluem (ou indicam) o ICP
408. Em algumas implementações, um ou mais parâmetros de fluxo de bits 402 também incluem (ou indicam) os coeficientes 406. O circuito de processamento de fluxo de bits 424 pode processar um ou mais parâmetros de fluxo de bits 402 e extrair diversos parâmetros. Por exemplo, o circuito de processamento de fluxo de bits 424 pode extrair os parâmetros de sinal medial codificado 426 a partir de um ou mais parâmetros de fluxo de bits 402, e o circuito de processamento de fluxo de bits 424 pode fornecer os parâmetros de sinal medial codificado 426 ao gerador de sinais 450 (como, por exemplo, ao sintetizador medial 452). Conforme outro exemplo, o circuito de processamento de fluxo de bits 424 pode extrair o ICP 408 a partir de um ou mais parâmetros de fluxo de bits 402, e o circuito de processamento de fluxo de bits 424 pode fornecer o ICP 408 ao gerador de sinais 450 (como, por exemplo, ao sintetizador lateral 456). Em uma implementação específica, o circuito de processamento de fluxo de bits 424 pode extrair um ou mais coeficientes 406 a partir de um ou mais parâmetros de fluxo de bits 402, e o circuito de processamento de fluxo de bits 424 pode fornecer um ou mais coeficientes 406 ao gerador de sinais 450 (como, por exemplo, para um ou mais filtros 454, para um ou mais filtros 458 ou para ambos).
[0182] O sintetizador medial 452 pode gerar o sinal medial sintetizado 470 com base nos parâmetros de sinal medial codificado 426. Em algumas implementações, um ou mais filtros 454 podem filtrar o sinal medial sintetizado 470. Por exemplo, um ou mais filtros 454 podem efetuar filtragem de desacentuação, filtragem passa-alta ou ambos no sinal medial sintetizado 470. Em uma implementação específica, um ou mais filtros 454 aplicam um filtro fixo ao sinal medial sintetizado 470 (antes da geração do sinal lateral sintetizado 472). Em outra implementação específica, um ou mais filtros 454 aplicam um filtro adaptativo ao sinal medial sintetizado 470 (como, por exemplo, antes da geração do sinal lateral sintetizado 472). O filtro adaptativo pode ser baseado um ou mais coeficientes 406 recebidos a partir de outro dispositivo (como, por exemplo, por meio de inclusão em um ou mais parâmetros de fluxo de bits 402).
[0183] O sintetizador lateral 456 pode gerar o sinal lateral sintetizado 472 com base no sinal medial sintetizado 470 e no ICP 408. Como o sinal lateral sintetizado 472 é gerado com base no sinal medial sintetizado 470 (em vez de baseado nos parâmetros de sinal lateral codificado recebidos a partir de outro dispositivo), gerar o sinal lateral sintetizado 472 pode ser referido como predição (ou mapeamento) do sinal lateral sintetizado 472 a partir do sinal medial sintetizado 470. Em algumas implementações, o sinal lateral sintetizado 472 pode ser gerado de acordo com a seguinte equação: Side Mapped = Mid signal quantized * ICP Gain onde Side Mapped é o sinal lateral sintetizado 472, ICP Gain é o ICP 408 e Mid signal quantized é o sinal medial sintetizado 470. A geração do sinal lateral sintetizado 472 dessa maneira corresponde à primeira, segunda, quarta e quinta implementações da geração do ICP 308, conforme descrito com referência à Figura 3.
[0184] Em outra implementação específica, O sinal lateral sintetizado 472 é gerado de acordo com a seguinte equação: Side Mapped = Mid signal quantized * ICP Gain / sqrt (Potência(Mid signal quantized) onde Side Mapped é o sinal lateral sintetizado 472, ICP Gain é o ICP 408, Mid signal quantized é o sinal medial sintetizado 470 e Potência(Mid signal quantized) é a potência medial sintetizada 462 que é gerada pelo detector de potência 460.
[0185] Em uma implementação específica, um codificador de outro dispositivo pode incluir um ou mais bits um ou mais parâmetros de fluxo de bits 402 para indicar qual técnica deve ser utilizada para gerar o sinal lateral sintetizado 472. Por exemplo, se um bit específico tiver um primeiro valor (como, por exemplo, um valor lógico “0”), o sinal lateral sintetizado 472 pode ser gerado com base no sinal medial sintetizado 470 e no ICP 408 e se o bit específico tiver um segundo valor (como, por exemplo, um valor lógico “1”), o sinal lateral sintetizado 472 pode ser gerado com base no sinal medial sintetizado 470, no ICP 408 e na potência medial sintetizada 462. Em outras implementações, o decodificador 418 pode determinar como gerar o sinal lateral sintetizado 472 com base em outras informações, tal como um ou mais outros parâmetros incluídos um ou mais parâmetros de fluxo de bits 402 ou com base em um valor do ICP 408.
[0186] Em alguma implementação, o sinal lateral sintetizado 472 pode incluir ou corresponder a um sinal lateral sintetizado intermediário e o processamento adicional (como, por exemplo, filtragem passa-tudo, filtragem de passa-banda, outra filtragem, aumento de amostragem, etc.) pode ser efetuado no sinal lateral sintetizado intermediário para gerar um sinal lateral sintetizado final utilizado em upmixing. Em uma implementação específica, a filtragem passa-tudo efetuada no sinal lateral sintetizado intermediário é controlada com base em um parâmetro de correlação que é incluído (ou recebido em adição a) um ou mais parâmetros de fluxo de bits 402. Efetuar filtragem passa-tudo com base no parâmetro de correlação pode diminuir a correlação (como, por exemplo, aumentar a decorrelação) entre o sinal medial sintetizado 470 e o sinal lateral sintetizado final. Detalhes da filtragem do sinal lateral sintetizado intermediário com base no parâmetro de correlação são descritos com referência à Figura 15.
[0187] Em algumas implementações, um ou mais filtros 454 podem filtrar o sinal medial sintetizado 470 Por exemplo, um ou mais filtros 454 podem efetuar filtragem de desacentuação, filtragem passa-alta, ou ambas, no sinal medial sintetizado 470. Em uma implementação específica, um ou mais filtros 454 aplicam um filtro fixo ao sinal medial sintetizado 470 (antes da geração do sinal lateral sintetizado 472). Em outra implementação específica, um ou mais filtros 454 aplicam um filtro adaptativo ao sinal medial sintetizado 470 (como, por exemplo, antes da geração do sinal lateral sintetizado 472). O filtro adaptativo pode ser baseado um ou mais coeficientes 406 recebidos a partir de outro dispositivo (como, por exemplo, por meio de inclusão em um ou mais parâmetros de fluxo de bits 402).
[0188] Em algumas implementações, um ou mais filtros 458 podem filtrar o sinal lateral sintetizado 472. Por exemplo, um ou mais filtros 458 podem efetuar filtragem de desacentuação, filtragem passa-alta, ou ambas, no sinal lateral sintetizado 472. Em uma implementação específica, um ou mais filtros 458 aplicam um filtro fixo ao sinal lateral sintetizado 472. Em outra implementação específica, um ou mais filtros 458 aplicam um filtro adaptativo ao sinal lateral sintetizado 472. O filtro adaptativo pode ser baseado um ou mais coeficientes 406 recebidos a partir de outro dispositivo (como, por exemplo, por meio de inclusão um ou mais parâmetros de fluxo de bits 402). Em algumas implementações, um ou mais filtros 454 não estão incluídos no decodificador 418 e um ou mais filtros 458 efetuam a filtragem no sinal lateral sintetizado 472 e no sinal medial sintetizado 470.
[0189] Em algumas implementações, o ampliador de amostragem 464 pode efetuar aumento de amostragem do sinal medial sintetizado 470 e do sinal lateral sintetizado
472. Por exemplo, o ampliador de amostragem 464 pode efetuar aumento de amostragem do sinal medial sintetizado 470 e do sinal lateral sintetizado 472 a partir de uma taxa reduzida de amostragem (como, por exemplo, aproximadamente O - 6,4 kHz) a uma taxa de amostragem de saída. Após efetuar aumento de amostragem, o decodificador 418 pode gerar o primeiro sinal de áudio 480 e o segundo sinal de áudio 482 com base no sinal medial sintetizado 470 e no sinal lateral sintetizado 472. O primeiro sinal de áudio 480 e o segundo sinal de áudio 482 podem ser enviados para um ou mais dispositivos de saída, como um ou mais alto- falantes. Em uma implementação específica, o primeiro sinal de áudio 480 é um de um sinal de áudio esquerdo e de um sinal de áudio direito, e o segundo sinal de áudio 482 é o outro do sinal de áudio esquerdo e do sinal de áudio direito.
[0190] Em uma implementação específica, múltiplos parâmetros de ganho de predição intercanal são utilizados para gerar sinais múltiplos (ou bandas de sinal). Para exemplificar, um ou mais filtros 454 podem incluir filtros passa-banda ou FFT configurados para gerar diferentes bandas de sinal. Por exemplo, um ou mais filtros 454 podem processar o sinal medial sintetizado 470 para gerar o sinal medial sintetizado de banda baixa 474 e o sinal medial sintetizado de banda alta 473. Em outras implementações, outras bandas de sinal podem ser geradas ou mais de duas bandas de sinal podem ser geradas. O sintetizador lateral 456 pode gerar sinais múltiplos sintetizados (ou bandas de sinal) com base em múltiplos parâmetros de ganho de predição intercanal. Por exemplo, o sintetizador lateral 456 pode gerar o sinal lateral sintetizado de banda baixa 476 com base no sinal medial sintetizado de banda baixa 474 e no ICP 408. Conforme outro exemplo, o sintetizador lateral 456 pode gerar o sinal lateral sintetizado de banda alta 475 com base no sinal medial sintetizado de banda alta 473 e um em segundo ICP (como, por exemplo, que é incluído ou indicado pelos um ou mais parâmetros de fluxo de bits 402). Um ou mais filtros 458 (ou outro combinador de sinal) podem combinar o sinal lateral sintetizado de banda baixa 476 e o sinal lateral sintetizado de banda alta 475 para gerar o sinal lateral sintetizado 472. Aplicar diferentes parâmetros de ganho de predição intercanal para bandas de sinal diferentes pode resultar em um sinal lateral sintetizado que corresponde mais proximamente a um sinal lateral em um codificador do que um sinal lateral sintetizado que é gerado com base em um parâmetro de ganho de predição intercanal único associado com todas as bandas de sinal.
[0191] o decodificador 418 da Figura 4 habilita a predição (como, por exemplo, o mapeamento) do sinal lateral sintetizado 472 a partir do sinal medial sintetizado 470 por utilização de parâmetros de ganho de predição intercanal (como, por exemplo, o ICP 408) para quadros associados com uma determinação para predizer um sinal lateral no decodificador 418 (em vez de receber um sinal lateral codificado). Como o ICP 408 é enviado ao decodificador 418 em vez de um quadro de um sinal lateral codificado e porque o ICP 408 utiliza menos bits que o sinal lateral codificado, os recursos de rede podem ser conservados enquanto são relativamente despercebidos por um ouvinte. Alternativamente, um ou mais bits que, de outro modo, seriam utilizados para enviar o sinal lateral codificado podem, em vez disso, ser redirecionados (como, por exemplo, utilizados) para enviar bits adicionais de um sinal medial codificado. Aumentar o número de bits do sinal medial codificado que é recebido aumenta a quantidade de informação associada com o sinal medial codificado que é recebido pelo decodificador 418. Aumentar o número de bits do sinal medial codificado que é recebido pelo decodificador 418 pode aperfeiçoar a qualidade do sinal medial sintetizado 470, que pode reduzir (ou eliminar) artefatos de áudio no sinal medial sintetizado 470 (e no sinal lateral sintetizado 472, uma vez que o sinal lateral sintetizado 472 é predito com base no sinal medial sintetizado 470).
[0192] As Figuras 5-6 e 9 mostram exemplos adicionais de geração do parâmetro de CP 109. A Figura 1 mostra um exemplo em que o seletor de CP 122 é configurado para determinar o parâmetro de CP 109 com base nos parâmetros de ICA 107. A Figura 5 mostra um exemplo em que o seletor de CP 122 é configurado para determinar o parâmetro de CP 109 com base em um parâmetro de downmix, em um ou mais outros parâmetros ou uma combinação deles. A Figura 6 mostra um exemplo em que o seletor de CP 122 é configurado para determinar o parâmetro de CP 109 com base em um parâmetro de ganho de predição intercanal. Figura 9 mostra um exemplo em que o seletor de CP 122 é configurado para determinar o parâmetro de CP 109 com base nos parâmetros de ICA 107, em um parâmetro de downmix, em um parâmetro de ganho de predição intercanal, em um ou mais outros parâmetros ou uma combinação deles.
[0193] Com referência à Figura 5, é mostrado um exemplo do codificador 114. O seletor de CP 122 é configurado para determinar o parâmetro de CP 109 com base em um parâmetro de downmix 515, em um ou mais parâmetros outros 517 (como, por exemplo, parâmetros estéreo) ou uma combinação deles.
[0194] Durante a operação, o alinhador intercanal 108 fornece o sinal de referência 103 e o sinal alvo ajustado 105 ao gerador de midside 148, conforme descrito com referência à Figura l. O gerador de midside 148 gera um sinal medial 511 e um sinal lateral 513 por redução de amostragem do sinal de referência 103 e do sinal alvo ajustado 105. O gerador de midside 148 efetua redução de amostragem do sinal de referência 103 e no sinal alvo ajustado 105 com base no parâmetro de downmix 515, conforme descrito adicionalmente com referência à Figura 8. Sob um aspecto específico, o parâmetro de downmix 515 corresponde a um valor predefinido (como, por exemplo, 0,5). Sob um aspecto específico, o parâmetro de downmix 515 é baseado em uma métrica de potência, uma métrica de correlação, ou ambas, que são baseadas no sinal de referência 103 e no sinal alvo ajustado 105. O gerador de midside 148 pode gerar os parâmetros outros 517, conforme descrito adicionalmente com referência à Figura 8. Por exemplo, os parâmetros outros 517 podem incluir pelo menos um de um parâmetro de decisão de fala, um indicador de transitório, um tipo de núcleo ou um tipo de codificador.
[0195] Sob um aspecto específico, o seletor de CP 122 fornece um parâmetro de CP 509 ao gerador de midside
148. Sob um aspecto específico, o parâmetro de CP 509 tem um valor predefinido (como, por exemplo, 0) que indica que um sinal lateral codificado deve ser gerado para transmissão, que um sinal lateral sintetizado deve ser gerado pela decodificação do sinal lateral codificado, ou ambos. O parâmetro de CP 509 pode corresponder a um parâmetro intermediário que é utilizado para determinar o parâmetro de downmix 515. Por exemplo, conforme aqui descrito, o parâmetro de downmix 515 (como, por exemplo, um parâmetro de downmix intermediário) pode ser utilizado para determinar o sinal medial 511 (como, por exemplo, um sinal medial intermediário), o sinal lateral 513 (como, por exemplo, um sinal lateral intermediário), outros parâmetros 519 (como, por exemplo, parâmetros intermediários) ou uma combinação deles. O parâmetro de downmix 515, os outros parâmetros 519, ou uma combinação deles, podem ser utilizados para determinar o parâmetro de CP 109 (como, por exemplo, o parâmetro de CP final). O parâmetro de CP 109 pode ser utilizado para determinar o parâmetro de downmix 115 (como, por exemplo, o parâmetro de downmix final). O parâmetro de downmix 115 é utilizado para determinar o sinal medial 111 (como, por exemplo, o sinal medial final), o sinal lateral 113 (como, por exemplo, o sinal lateral final) ou ambos.
[0196] O gerador de midside 148 fornece o parâmetro de downmix 515, os parâmetros outros 517, ou uma combinação deles, ao seletor de CP 122. O seletor de CP 122 determina o parâmetro de CP 109 com base no parâmetro de downmix 515, nos parâmetros outros 517 ou em uma combinação deles, conforme descrito adicionalmente com referência à Figura 9. O seletor de CP 122 fornece o parâmetro de CP 109 para o gerador de midside 148, o gerador de sinais 116, ou ambos. O gerador de midside 148 gera o parâmetro de downmix 115 com base no parâmetro de CP 109, conforme descrito adicionalmente com referência à Figura 8. O gerador de midside 148 gera o sinal medial 111, o sinal lateral 113, ou ambos, com base no parâmetro de downmix 115, conforme descrito adicionalmente com referência à Figura 8. O gerador de midside 148 determina os outros parâmetros 519 (como, por exemplo, os parâmetros intermediários), conforme descrito adicionalmente com referência à Figura 8.
[0197] Sob um aspecto específico, o gerador de midside 148, em resposta à determinação de que o parâmetro de CP 109 corresponde (como, por exemplo, é igual a) ao parâmetro de CP 509, configura o parâmetro de downmix 115 para ter o mesmo valor que o parâmetro de downmix 515, designa o sinal medial 511 como o sinal medial 111, designa o sinal lateral 513 como o sinal lateral 113, designa os parâmetros outros 517 como os outros parâmetros 519, ou uma combinação deles. O gerador de midside fornece o sinal medial 111, o sinal lateral 113, o parâmetro de downmix 115, ou uma combinação deles, para o gerador de sinais 116. O gerador de sinais 116 gera o sinal medial codificado 121, o sinal lateral codificado 123, ou ambos, com base no parâmetro de CP 109, no parâmetro de downmix 115, no sinal medial 111, no sinal lateral 113 ou uma combinação deles, conforme descrito com referência à Figura l. O transmissor 110 transmite o sinal medial codificado 121, o sinal lateral codificado 123, um ou mais dos parâmetros outros 517, ou uma combinação deles, conforme descrito com referência à Figura 1. O seletor de CP 122 permite, assim, determinar o parâmetro de CP 109 com base no parâmetro de downmix 515, nos parâmetros outros 517 ou em uma combinação deles.
[0198] Com referência à Figura 6, é mostrado um exemplo do codificador 114. O codificador 114 inclui um gerador de ganho de predição intercanal (GICP) 612. Sob um aspecto específico, o gerador de GICP 612 corresponde ao gerador de ICP 220 da Figura 2. Por exemplo, o gerador de GICP 612 é configurado para efetuar uma ou mais operações descritas com referência ao gerador de ICP 220. O seletor de CP 122 é configurado para determinar o parâmetro de CP 109 com base em um GICP 601 (como, por exemplo, um valor de ganho de predição intercanal).
[0199] Durante a operação, o alinhador intercanal 108 fornece o sinal de referência 103 e o sinal alvo ajustado 105 para o gerador de midside 148, conforme descrito com referência à Figura l. O gerador de midside 148 gera, com base no parâmetro de CP 509, o sinal medial 511 e o sinal lateral 513, conforme descrito com referência à Figura 5. O gerador de midside 148 fornece o sinal medial 511 e o sinal lateral 513 ao gerador de GICP 612. O gerador de GICP 612 gera o GICP 601 com base no sinal medial 511 e no sinal lateral 513, conforme descrito com referência ao gerador de ICP 220 da Figura 2. Por exemplo, o sinal medial 511 pode corresponder ao sinal medial 211 da Figura 2, o sinal lateral 513 pode corresponder ao sinal lateral 213 da Figura 2, e o GICP 601 pode corresponder ao ICP 208 da Figura 2. Em algumas implementações, o GICP 601 pode ser baseado na potência do sinal medial 511 e na potência do sinal lateral 513. O GICP 601 pode corresponder a um parâmetro "intermediário utilizado para determinar o parâmetro de CP 109 (como, por exemplo, o parâmetro de CP final). Por exemplo, conforme aqui descrito, o parâmetro de CP 109 pode ser utilizado para determinar o parâmetro de downmix 115 (como, por exemplo, o parâmetro de downmix final). O parâmetro de downmix 115 pode ser utilizado para determinar o sinal medial 111 (como, por exemplo, o sinal medial final), o sinal lateral 113 (como, por exemplo, o sinal lateral final) ou ambos. O sinal medial 111, o sinal lateral 113, ou ambos, podem ser utilizados para determinar um GICP 603 (como, por exemplo, o GICP final). O GICP 603 pode ser transmitido ao segundo dispositivo 106 da Figura
1.
[0200] O gerador de GICP 612 fornece o GICP 601 ao seletor de CP 122. O seletor de CP 122 determina o parâmetro de CP 109 com base no GICP 601, conforme descrito adicionalmente com referência à Figura 9. O seletor de CP 122 fornece o parâmetro de CP 109 ao gerador de midside
148. O gerador de midside 148 gera o sinal medial 111 e o sinal lateral 113 com base no parâmetro de CP 109, conforme descrito com referência à Figura 8. O gerador de midside 148 fornece o sinal medial 111 e o sinal lateral 113 ao gerador de GICP 612. O gerador de GICP 612 gera o GICP 603 com base no sinal medial 111 e no sinal lateral 113, conforme descrito adicionalmente com referência ao ICP gerador 220 da Figura 2. Por exemplo, o sinal medial 111 pode corresponder ao sinal medial 211 da Figura 2, o sinal lateral 113 pode corresponder ao sinal lateral 213 da Figura 2, e o GICP 603 pode corresponder ao ICP 208 da Figura 2. Em algumas implementações, o GICP 603 pode ser baseado na potência do sinal medial 111 e na potência do sinal lateral 113.
[0201] Sob um aspecto específico, o gerador de midside 148, em resposta à determinação de que o parâmetro de CP 109 corresponde (como, por exemplo, é igual a) ao parâmetro de CP 509, designa o sinal medial 511 como o sinal medial 111, designa o sinal lateral 513 como o sinal lateral 113, designa o GICP 601 como o GICP 603, ou uma combinação deles. O gerador de midside 148 fornece o sinal medial 111, o sinal lateral 113, ou ambos, ao gerador de sinais 116. O gerador de sinais 116 gera o sinal medial codificado 121, o sinal lateral codificado 123, ou ambos, com base no parâmetro de CP 109, conforme descrito com referência à Figura l. Sob um aspecto específico, O transmissor 110 da Figura 1 transmite o GICP 603, o sinal medial codificado 121, o sinal lateral codificado 123 ou uma combinação deles. Por exemplo, os parâmetros de codificação 140 da Figura 1 podem incluir o GICP 603. Os parâmetros de fluxo de bits 102 da Figura 1 podem corresponder ao sinal medial codificado 121, ao sinal lateral codificado 123 ou a ambos.
[0202] Sob um aspecto específico, o transmissor 210 da Figura 2 transmite o GICP 603, o sinal medial codificado 121, o sinal lateral codificado 123 ou uma combinação deles. Por exemplo, o GICP 603 corresponde ao ICP 208 da Figura 2. Os parâmetros de fluxo de bits 202 da Figura 2 podem corresponder ao sinal medial codificado 121, ao sinal lateral codificado 123 ou a ambos. O seletor de CP 122 permite, assim, determinar o parâmetro de CP 109 com base no GICP 601.
[0203] Com referência à Figura 7, é mostrado um exemplo do alinhador intercanal 108. O alinhador intercanal 108 é configurado para gerar o sinal de referência 103, o sinal alvo ajustado 105, os parâmetros de ICA 107 ou uma combinação deles, com base no primeiro sinal de áudio 130 e no segundo sinal de áudio 132. Conforme aqui utilizado, um “alinhador intercanal” pode ser referido como “equalizador temporal”. O alinhador intercanal 108 pode incluir um reamostrador 704, um comparador de sinal 706, um interpolador 710, um refinador de deslocamento 711, um analisador de alteração de deslocamento 712, um gerador de disparidade temporal absoluta 716, um designador de sinal de referência 708, um gerador de parâmetros de ganho 714 ou uma combinação deles.
[0204] Durante a operação, o reamostrador 704 pode gerar um ou mais sinais reamostrados. Por exemplo, o reamostrador 704 pode gerar um primeiro sinal reamostrado 730 reamostrando o primeiro sinal de áudio 130 com base em um fator de reamostragem (D), que pode ser maior ou igual a um. O reamostrador 704 pode gerar um segundo sinal reamostrado 732 reamostrando o segundo sinal de áudio 132 com base no fator de reamostragem (D). O reamostrador 704 pode fornecer o primeiro sinal reamostrado 730, o segundo sinal reamostrado 732, ou ambos, ao comparador de sinal
706.
[0205] O comparador de sinal 706 pode gerar valores de comparação 734 (como, por exemplo, valores de diferença, valores de similaridade, valores de coerência ou valores de correlação cruzada), um valor de disparidade temporal experimental 701 ou uma combinação deles. Por exemplo, o comparador de sinal 706 pode gerar os valores de comparação 734 com base no primeiro sinal reamostrado 730 e uma pluralidade de valores de disparidade temporal aplicados ao segundo sinal reamostrado 732. O comparador de sinal 706 pode determinar o valor de disparidade temporal experimental 701 com base nos valores de comparação 734. Por exemplo, o valor de disparidade temporal experimental 701 pode corresponder à um valor de comparação selecionado que indica uma correlação mais elevada (ou menor diferença) que outros valores dos valores de comparação 734. O comparador de sinal 706 pode fornecer os valores de comparação 734, o valor de disparidade temporal experimental, ou ambos, ao interpolador 710.
[0206] O interpolador 710 pode estender o valor de disparidade temporal experimental 701. Por exemplo, o interpolador 710 pode gerar um valor de disparidade temporal interpolado 703. Para exemplificar, o interpolador 710 pode gerar valores de comparação interpolados que correspondem aos valores de disparidade temporal que são próximos ao valor de disparidade temporal experimental 701 por interpolação dos valores de comparação
734. O interpolador 710 pode determinar o valor de disparidade temporal interpolado 703 com base nos valores de comparação interpolados e nos valores de comparação 734. Os valores de comparação 734 podem ser baseados em uma granularidade mais grosseira dos valores de disparidade temporal. Por exemplo, os valores de comparação 734 podem ser baseados em um primeiro subconjunto de um conjunto de valores de disparidade temporal, de modo que uma diferença entre um primeiro valor de disparidade temporal do primeiro subconjunto e cada segundo valor de disparidade temporal do primeiro subconjunto seja maior ou igual a um limite (como, por exemplo, 21). O limite pode ser baseado no fator de reamostragem (D).
[0207] Os valores de comparação interpolados podem se basear em uma granularidade mais fina dos valores de disparidade temporal que são próximos ao valor de disparidade temporal experimental 701. Por exemplo, os valores de comparação interpolados podem ser baseados em um segundo subconjunto do conjunto de valores de disparidade temporal, de modo que uma diferença entre um valor de disparidade temporal mais alto do segundo subconjunto e o valor de disparidade temporal experimental 701 seja menor que o limite (como, por exemplo, <l1) e uma diferença entre um valor de disparidade temporal mais baixo do segundo subconjunto e o valor de disparidade temporal experimental 701 seja menor que o limite. O interpolador 710 pode fornecer o valor de disparidade temporal interpolado 703 para o refinador de deslocamento 711.
[0208] O refinador de deslocamento 711 pode gerar um valor de disparidade temporal alterado 705 pelo refinamento do valor de disparidade temporal interpolado
703. Por exemplo, o refinador de deslocamento 711 pode determinar se o valor de disparidade temporal interpolado 703 indica que uma alteração em uma disparidade temporal entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 é maior que um limite de disparidade temporal. A alteração na disparidade temporal pode ser indicada por uma diferença entre o valor de disparidade temporal interpolado 703 e um primeiro valor de disparidade temporal associado com um quadro codificado anteriormente. O refinador de deslocamento 711 pode, em resposta à determinação de que a diferença é menor ou igual ao limite, configurar o valor de disparidade temporal alterado 705 como o valor de disparidade temporal interpolado 703. Alternativamente, oO refinador de deslocamento 711 pode, em resposta à determinação de que a diferença é maior que o limite, determinar uma pluralidade de valores de disparidade temporal que correspondem a uma diferença menor ou igual ao limite de alteração de disparidade temporal. O refinador de deslocamento 711 pode determinar valores de comparação com base no primeiro sinal de áudio 130 e na pluralidade de valores de disparidade temporal aplicados ao segundo sinal de áudio 132. O refinador de deslocamento 711 pode determinar o valor de disparidade temporal alterado 705 com base nos valores de comparação. O refinador de deslocamento 711 pode configurar o valor de disparidade temporal alterado 705 para indicar o valor de disparidade temporal selecionado. O refinador de deslocamento 711 pode fornecer o valor de disparidade temporal alterado 705 ao analisador de alteração de deslocamento 712.
[0209] o analisador de alteração de deslocamento 712 pode determinar se o valor de disparidade temporal alterado 705 indica uma comutação Ou reversão na temporização entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132. Em particular, uma reversão ou uma comutação na temporização pode indicar que, para um primeiro quadro (como, por exemplo, um quadro codificado anteriormente), o primeiro sinal de áudio 130 é recebido nas interfaces de entrada 112 antes do segundo sinal de áudio 132 e, para um quadro subsequente, o segundo sinal de áudio 132 é recebido nas interfaces de entrada 112 antes do primeiro sinal de áudio 130. Alternativamente, uma reversão ou uma comutação na temporização pode indicar que, para o primeiro quadro, o segundo sinal de áudio 132 é recebido nas interfaces de entrada 112 antes do primeiro sinal de áudio 130 e, para um quadro subsequente, o primeiro sinal de áudio 130 é recebido nas interfaces de entrada 112 antes do segundo sinal de áudio 132. Em outras palavras, uma reversão ou uma comutação na temporização pode indicar que um primeiro valor de disparidade temporal (como, por exemplo, um valor de disparidade temporal final) que corresponde ao primeiro quadro tem um primeiro sinal que é distinto de um segundo sinal do valor de disparidade temporal alterado 705 correspondente ao quadro subsequente (como, por exemplo, uma transição de positivo para negativo ou vice-versa). O analisador de alteração de deslocamento 712 pode determinar se o retardo entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 comutou de sinal com base no valor de disparidade temporal alterado 705 e no primeiro valor de disparidade temporal associado com o primeiro quadro.
O analisador de alteração de deslocamento 712 pode, em resposta à determinação de que o retardo entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 comutou de sinal, configurar um valor de disparidade temporal final 707 para um valor (como, por exemplo, O) indicando nenhum deslocamento de tempo. Alternativamente, o analisador de alteração de deslocamento 712 pode configurar o valor de disparidade temporal final 707 como o valor de disparidade temporal alterado 705 em resposta à determinação de que o retardo entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 não comutou de sinal. O analisador de alteração de deslocamento 712 pode gerar um valor de disparidade temporal estimado por refinamento do valor de disparidade temporal alterado 705. O analisador de alteração de deslocamento 712 pode configurar o valor de disparidade temporal final 707 para o valor de disparidade temporal estimado. Configurar o valor de disparidade temporal final 707 para indicar que não há deslocamento de tempo pode reduzir a distorção em um decodificador, por se abster de deslocar o tempo do primeiro sinal de áudio 130 e do segundo sinal de áudio 132 em direções opostas para quadros consecutivos (ou adjacentes) do primeiro sinal de áudio 130. O analisador de alteração de deslocamento 712 pode fornecer o valor de disparidade temporal final 707 para o gerador de disparidade temporal absoluta 716 e para o designador de sinal de referência 708.
[0210] o gerador de disparidade temporal absoluta 716 pode gerar um valor de disparidade temporal não causal 717 por aplicação de uma função absoluta ao valor de disparidade temporal final 707. O gerador de disparidade temporal absoluta 716 pode fornecer o valor de disparidade temporal não causal 162 ao gerador parâmetro de ganho 714.
[0211] O designador de sinal de referência 708 pode gerar um indicador de sinal de referência 719. Por exemplo, o designador de sinal de referência 708 pode, em resposta à determinação de que o valor de disparidade temporal final 707 satisfaz (como, por exemplo, ser maior que) um limite específico (como, por exemplo, 0 ), configurar o indicador do sinal de referência 719 para ter um primeiro valor (como, por exemplo, 1). Alternativamente, o indicador de sinal de referência 719 pode, em resposta à determinação de que o valor de disparidade temporal final 707 não satisfaz (como, por exemplo, é menor que ou igual a) o limite específico (como, por exemplo, 0), configurar o indicador de sinal de referência 719 para ter um segundo valor (como, por exemplo, 0). Sob um aspecto específico, o designador de sinal de referência 708 pode, em resposta à determinação de que o valor de disparidade temporal final 707 tem um valor específico (como, por exemplo, 0) que indica nenhuma disparidade temporal, abster-se de alterar o indicador de sinal de referência 719 a partir de um valor que corresponda a um quadro codificado anteriormente. O indicador de sinal de referência 719 pode ter um primeiro valor que indica que o primeiro sinal de áudio 130 é designado como o sinal de referência 103 ou um segundo valor que indica que o segundo sinal de áudio 132 é designado como o sinal de referência 103. O designador de sinal de referência 708 pode fornecer o indicador de sinal de referência 719 ao gerador de parâmetros de ganho 714.
[0212] O gerador de parâmetros de ganho 714 pode, em resposta à determinação de que o indicador de sinal de referência 719 indica que um do primeiro sinal de áudio 130 ou do segundo sinal de áudio 132 corresponde ao sinal de referência 103, determinar que o outro do primeiro sinal de áudio 130 ou do segundo sinal de áudio 132 corresponde a um sinal alvo. O gerador de parâmetros de ganho 714 pode selecionar amostras do sinal alvo (como, por exemplo, o segundo sinal de áudio 132) com base no valor de disparidade temporal não causal 717. Conforme aqui referido, a seleção de amostras de um sinal de áudio com base em um valor de disparidade temporal pode corresponder à geração de um sinal de áudio ajustado (como, por exemplo, deslocamento de tempo) por ajuste (como, por exemplo, por deslocamento) do sinal de áudio com base no valor de disparidade temporal e na seleção de amostras do sinal de áudio ajustado. Por exemplo, o gerador de parâmetros de ganho 714 pode gerar o sinal alvo ajustado 105 (como, por exemplo, por deslocamento de tempo do segundo sinal de áudio) pela seleção de amostras do sinal alvo (como, por exemplo, o segundo sinal de áudio 132) com base no valor de disparidade temporal não causal 717.
[0213] O gerador de parâmetros de ganho 714 pode gerar um parâmetro de ganho de ICA 709 (como, por exemplo, um parâmetro de ganho intercanal) com base nas amostras do sinal de referência 103 e nas amostras selecionadas do sinal alvo ajustado. Por exemplo, o gerador de parâmetros de ganho 714 pode gerar o parâmetro de ganho de ICA 709 com base em uma das seguintes equações:
Equação 6a EN=N1 Ref(n) Targ(n+N,) — — ENEM Ref) Pavação O 90 | ZEN TargÓND — Elo Rer(m) Targ(m) Pavação &e
MO TT Equação 6d — FnsolRef(m)| 97 EN Targo|* FASO Ref(n) Targ(n) Fquação 6e Io xP CU — ENZMTArgo| Equação 6f IO Elalrefo| *
[0214] em que gn corresponde ao parâmetro de ganho de ICA 709 para processamento de downmix, Ref(n) corresponde a amostras do sinal de referência 103, MN corresponde ao valor de disparidade temporal não causal 717 e Targ(n + NM) corresponde a amostras selecionadas do sinal alvo ajustado 105. Em algumas implementações, o gerador de parâmetros de ganho 714 pode gerar o parâmetro de ganho de ICA 709 com base no tratamento do primeiro sinal de áudio 130 como um sinal de referência e no tratamento do segundo sinal de áudio 132 como um sinal alvo, independentemente do indicador de sinal de referência 719. O parâmetro de ganho de ICA 709 pode corresponder a uma razão de potência da primeira potência das primeiras amostras do sinal de referência 104 e da segunda potência das amostras selecionadas do sinal alvo ajustado 105.
[0215] O parâmetro de ganho de ICA 709 (gp) pode ser modificado para incorporar uma lógica de suavização/histerese de longo prazo para evitar grandes saltos no ganho entre os quadros. Por exemplo, o gerador de parâmetros de ganho 714 pode gerar um parâmetro de ganho de ICA suavizado 713 (como, por exemplo, um parâmetro de ganho intercanal suavizado) com base no parâmetro de ganho de ICA 709 e um primeiro parâmetro de ganho de ICA 715. O primeiro parâmetro de ganho de ICA 715 pode corresponder a um quadro codificado anteriormente. Para exemplificar, o gerador de parâmetros de ganho 714 pode gerar o parâmetro de ganho de ICA suavizado 713 com base em uma média do parâmetro de ganho de ICA 709 e do primeiro parâmetro de ganho de ICA
715. Os parâmetros de ICA 107 podem incluir pelo menos um do valor de disparidade temporal experimental, do valor de disparidade temporal interpolado 703, do valor de disparidade temporal alterado 705, do valor de disparidade temporal final 707, do valor de disparidade temporal não causal 717, do primeiro parâmetro de ganho de ICA 715, do parâmetro de ganho de ICA suavizado 713, do parâmetro de ganho de ICA suavizado 713, do parâmetro de ganho de ICA 709 ou de uma combinação deles.
[0216] Com referência à Figura 8, é mostrado um exemplo do gerador de midside 148. O gerador de midside 148 inclui um gerador de parâmetros de downmix 802. O gerador de parâmetros de downmix 802 é configurado para gerar um parâmetro de downmix 803 com base em um parâmetro de CP 809. Sob um aspecto específico, o parâmetro de CP 809 corresponde ao parâmetro de CP 109 da Figura 1 e o parâmetro de downmix 803 corresponde ao parâmetro de downmix 115 da Figura l1. Sob um aspecto específico, o parâmetro de CP 809 corresponde ao parâmetro de CP 509 da Figura 5 e o parâmetro de downmix 803 corresponde ao parâmetro de downmix 515 da Figura 5.
[0217] O gerador de parâmetros de downmix 802 inclui um decisor de geração de downmix 804 acoplado a um gerador de parâmetros 806. O decisor de geração de downmix 804 é configurado para gerar uma decisão de geração de downmix 895 que indica se uma primeira técnica ou uma segunda técnica devem ser utilizadas para gerar o parâmetro de downmix 803.
[0218] o gerador de parâmetros 806 é configurado para gerar um valor de parâmetro de downmix 805 utilizando a primeira técnica. O gerador de parâmetros 806 é configurado para gerar um valor de parâmetro de downmix 807 utilizando a segunda técnica. O gerador de parâmetros 806 é configurado para designar, com base na decisão de geração de downmix 895, o valor de parâmetro de downmix 805 ou o valor de parâmetro de downmix 807 como o parâmetro de downmix 803. Embora descrito como a geração de dois valores de parâmetro de downmix 805 e 807, em outras implementações, apenas o valor de parâmetro de downmix selecionado (como, por exemplo, com base na decisão de geração de downmix 895) é gerado.
[0219] O gerador de midside 148 é configurado para gerar um sinal medial 811 e um sinal lateral 813 com base no parâmetro de downmix 803. Sob um aspecto específico, o sinal medial 811 e o sinal lateral 813 correspondem ao sinal medial 111 e ao sinal lateral 113 da Figura l1, respectivamente. Sob um aspecto específico, o sinal medial 811 e o sinal lateral 813 correspondem ao sinal medial 511 e ao sinal lateral 513 da Figura 5, respectivamente.
[0220] Durante a operação, o decisor de geração de downmix 804, em resposta à determinação de que o parâmetro de CP 809 tem um segundo valor (como, por exemplo, 1), configura a decisão de geração de downmix 895 para um primeiro valor (como, por exemplo, 0) que indica que a primeira técnica deve ser utilizada para gerar o parâmetro de downmix 803. O segundo valor (como, por exemplo, 1) do parâmetro de CP 809 pode indicar que o sinal lateral 113 não deve ser codificado para transmissão e que o sinal lateral sintetizado 173 da Figura 1 é predito no decodificador 118 da Figura 1. Conforme outro exemplo, o decisor de geração de downmix 804, em resposta à determinação de que o parâmetro de CP 809 tem um primeiro valor (como, por exemplo, 0), configura a decisão de geração de downmix 895 para ter um segundo valor (como, por exemplo, 1) que indica que o a segunda técnica deve ser utilizada para gerar o parâmetro de downmix 803. O primeiro valor (como, por exemplo, 0) do parâmetro de CP 809 pode indicar que o sinal lateral 113 deve ser codificado para transmissão e que o sinal lateral sintetizado 173 da Figura 1 deve ser determinado no decodificador 118 por decodificação do sinal lateral codificado 123. O decisor de geração de downmix 804 fornece a decisão de geração de downmix 895 para o gerador de parâmetros 806.
[0221] o gerador de parâmetros 806, em resposta à determinação de que a decisão de geração de downmix 895 tem o primeiro valor (como, por exemplo, O),
gera o valor de parâmetro de downmix 805 utilizando a primeira técnica. Por exemplo, o gerador de parâmetros 806 gera o valor de parâmetro de downmix 805 como um valor predefinido (como, por exemplo, 0,5). O gerador de parâmetros 806 designa o valor de parâmetro de downmix 805 como o parâmetro de downmix 803. Alternativamente, O gerador de parâmetros 806, em resposta à determinação de que a decisão de geração de downmix 895 tem o segundo valor (como, por exemplo, 1), gera o valor de parâmetro de downmix 807 utilizando a segunda técnica. Por exemplo, o gerador de parâmetros 806 gera o valor de parâmetro de downmix 807 com base em uma métrica de potência, uma métrica de correlação ou ambas, com base no sinal de referência 103 e no sinal alvo ajustado 105. Para exemplificar, o gerador de parâmetros 806 pode determinar o valor de parâmetro de downmix 807 com base na comparação de um primeiro valor de uma primeira característica do sinal de referência 103 e de um segundo valor da primeira característica do sinal alvo ajustado 105. Por exemplo, a primeira característica pode corresponder à potência de sinal ou correlação de sinal. O gerador de parâmetros 806 pode determinar o valor de parâmetro de downmix 807 com base em um valor de comparação de característica (como, por exemplo, uma diferença) entre o primeiro valor e o segundo valor.
[0222] Sob um aspecto específico, o gerador de parâmetros 806 é configurado para gerar o valor de parâmetro de downmix 807 para estar dentro de uma faixa de um primeiro valor de faixa (como, por exemplo, 0) a um segundo valor de faixa (como, por exemplo, 1). Por exemplo,
o gerador de parâmetros 806 mapeia o valor de comparação de característica para um valor dentro da faixa. Neste aspecto, o valor de parâmetro de downmix 807, que tem um valor específico (como, por exemplo, 0,5), pode indicar que uma primeira potência do sinal de referência 103 é aproximadamente igual a uma segunda potência do sinal alvo ajustado 105. O gerador de parâmetros 806 pode determinar que o valor de parâmetro de downmix 807 tem o valor específico (como, por exemplo, 0,5) em resposta à determinação de que o valor de comparação de característica (como, por exemplo, a diferença) satisfaz (como, por exemplo, é menor que) um limite (como, por exemplo, um nível de tolerância). Quanto maior a primeira potência do sinal de referência 103 for do que a segunda potência do sinal alvo ajustado 105, mais próximo o valor de parâmetro de downmix 807 pode estar do primeiro valor de faixa (como, por exemplo, 0). Quanto maior a segunda potência do sinal alvo ajustado 105 for do que a primeira potência do sinal de referência 103, mais próximo o valor de parâmetro de downmix 807 pode estar do segundo valor de faixa (como, por exemplo, 1). O gerador de parâmetros 806, em resposta à determinação de que a decisão de geração de downmix 895 tem o segundo valor (como, por exemplo, 1), designa o valor de parâmetro de downmix 807 como o parâmetro de downmix 803.
[0223] Sob um aspecto específico, o gerador de parâmetros 806 é configurado para gerar, com base em um valor predefinido (como, por exemplo, 0,5), o valor de parâmetro de downmix 805, o valor de parâmetro de downmix 807, ou ambos. Por exemplo, o gerador de parâmetros 806 é configurado para gerar o valor de parâmetro de downmix 805,
pela modificação do valor de parâmetro de downmix 807 para estar dentro de uma faixa específica do valor predefinido (como, por exemplo, 0,5). Sob um aspecto específico, o gerador de parâmetros 806 é configurado para configurar o valor de parâmetro de downmix 805 para um primeiro valor específico (como, por exemplo, 0,3) em resposta à determinação de que o valor de parâmetro de downmix 807 é menor que o primeiro valor específico. Alternativamente, o gerador de parâmetros 806 é configurado para configurar o valor de parâmetro de downmix 805 para um segundo valor específico (como, por exemplo, 0,7) em resposta à determinação de que o valor de parâmetro de downmix 807 é maior que o segundo valor específico. Sob um aspecto específico, o gerador de parâmetros 806 gera o valor de parâmetro de downmix 805 por aplicação de uma função de redução de faixa dinâmica (como, por exemplo, um sigmóide modificado) ao valor de parâmetro de downmix 807.
[0224] Sob um aspecto específico, o gerador de parâmetros 806 é configurado para gerar, com base em um valor predefinido (como, por exemplo, 0,5), o valor de parâmetro de downmix 805, o valor de parâmetro de downmix 807 ou um ou mais parâmetros adicionais. Por exemplo, o gerador de parâmetros 806 é configurado para gerar o valor de parâmetro de downmix 805, por modificação do valor de parâmetro de downmix 807 com base em um fator de harmonização 825. Para exemplificar, o gerador de parâmetros 806 pode gerar o valor de parâmetro de downmix 805 com base na seguinte Equação: Ratio L=(vf)*0,5+(l1-vf)*original Ratio L squação 7
[0225] onde Ratio L corresponde ao valor de parâmetro de downmix 805, vf corresponde ao fator de harmonização 825 e original Ratio L corresponde ao valor de parâmetro de downmix 807. O fator de harmonização 825 pode estar dentro de uma faixa específica (como, por exemplo, de 0,0 a 1,0). O fator de harmonização 825 pode indicar uma natureza harmonizada/não-harmonizada (como, por exemplo, fortemente harmonizada, fracamente harmonizada, fracamente não-harmonizada ou fortemente não-harmonizada) do sinal de referência 103, do sinal alvo ajustado 105 ou de ambos. O fator de harmonização 825 pode corresponder a uma média de fatores de harmonização determinados por um núcleo de ACELP.
[0226] Em um exemplo específico, o gerador de parâmetros 806 é configurado para gerar o valor de parâmetro de downmix 805, por modificação do valor de parâmetro de downmix 807 com base em um valor de comparação
855. Por exemplo, o gerador de parâmetros 806 pode gerar o valor de parâmetro de downmix 805 com base no seguinte equação: Ratio L = (ica crosscorrelation) * 0.5 + (1 — ica crosscorrelation) * original Ratio L Equação 8
[0227] onde Ratio L corresponde ao valor de parâmetro de downmix 805, ica crosscorrelation corresponde ao valor de comparação 855, e original Ratio L corresponde ao valor de parâmetro de downmix 807. O gerador de midside 148 pode determinar o valor de comparação 855 (como, por exemplo, valor da diferença, valor de similaridade, valor de coerência ou valor de correlação cruzada) com base em uma comparação de amostras do sinal de referência 103 e amostras selecionadas do sinal alvo ajustado 105.
[0228] O gerador de midside 148 gera o sinal medial 811 e o sinal lateral 813 com base no parâmetro de downmix 803. Por exemplo, o gerador de midside 148 gera o sinal medial 811 e o sinal lateral 813 com base nos seguintes pares de equações: Mid(n) = Ratio L * L(n) + (1 - Ratio 1) * R(n) Fquação 9(a) Side(n) = (1 — Ratio L) * L(n) - (Ratio L)* Rá) — Equação 9(b) . . . Equação 10(a) Mid(n) = Ratio L * L(n) + (1I-Ratio L) * R(N) : Equação 10(b Side(n) = 0.5 * L(n) - 0.5 * RM) auação 10 (D) Mid(n) =0.5 * L(n) + 0.5 * R(n) Equação 11 (a) Side(n) = (1 - Ratio L) * L(n) - (Ratio L)* RW) — FAuação 11(D)
[0229] onde Mid(n) corresponde ao sinal medial 811, Side(n) corresponde ao sinal lateral 813, L(n) corresponde a amostras do primeiro sinal de áudio 130, R (n) corresponde a amostras do segundo sinal de áudio 132 e Ratio L corresponde ao parâmetro de downmix 803. Sob um aspecto específico, L(n) corresponde a amostras do sinal de referência 103 e R(n) corresponde a amostras correspondentes do sinal alvo ajustado 105. Sob um aspecto alternativo, R(n) corresponde a amostras do sinal de referência 103 e L(n) corresponde a amostras correspondentes do sinal alvo ajustado 105.
[0230] Sob um aspecto específico, o gerador de midside 148 gera o sinal medial 811 e o sinal lateral 813 com base nos seguintes pares de equações: Mid(n) = Ratio L * Ref(n) + (1 - Ratio L) * Targén+iNi) PAuação 12 (a) Side(n) = (1 - Ratio L) * Ref(n) - (Ratio L) * Targón+Ni) Equação 12 (b) Mid(n) = Ratio L * Ref(n) + (I-Ratio L) * Tare(n+Ni) Equação 13(a) ; Equação 13(b Side(n) = 0.5 * Ref(n) — 0.5 * Targ(n+Ni) quação 13(b) . o * * Equação 14(a) Mid(n) = 0.5 * Ref(n) + 0.5 * Tare(Nn+Ni) Side(n) = (1 — Ratio L) * Ref(n) — (Ratio L) * Targtn+NBAvação 14 (b)
[0231] onde Mid(n) corresponde ao sinal medial 811, Side(n) corresponde ao sinal lateral 813, Ref(n) corresponde a amostras do sinal de referência 103, N corresponde ao valor de disparidade temporal não-causal 717 da Figura 7, Targ(n + Ni) corresponde a amostras do sinal alvo ajustado 105 e Ratio L corresponde ao parâmetro de downmix 803.
[0232] Sob um aspecto específico, o decisor de geração de downmix 804 determina a decisão de geração de downmix 895 com base na determinação de se um critério 823 é satisfeito. Por exemplo, o decisor de geração de downmix 804, em resposta à determinação de que o parâmetro de CP 809 tem o segundo valor (como, por exemplo, 1) e que o critério 823 é satisfeito, gera a decisão de geração de downmix 895 que tem o primeiro valor (como, por exemplo, 0) que indica que a primeira técnica deve ser utilizada para gerar o parâmetro de downmix 803. Alternativamente, a decisão 804 da geração de downmix, em resposta à determinação de que o parâmetro de CP 809 tem o primeiro valor (como, por exemplo, 0) ou que o critério 823 não é satisfeito, gera a decisão de geração de downmix 895 que tem o segundo valor (como, por exemplo, 1) que indica que a segunda técnica deve ser utilizada para gerar o parâmetro de downmix 803. Sob um aspecto específico, satisfazer o critério 823 indica que um sinal lateral (como, por exemplo, o sinal lateral 813) que corresponde ao sinal de referência 103 e ao sinal alvo ajustado 105 é um candidato para predição.
[0233] O decisor de geração de downmix 804 é configurado para determinar se o critério 823 é satisfeito com base em um primeiro sinal lateral 851, em um segundo sinal lateral 853, nos parâmetros de ICA 107, no valor de comparação 855, em um valor de disparidade temporal 857, em um ou mais parâmetros outros 810, ou uma combinação deles. Sob um aspecto específico, o decisor de geração de downmix 804 determina se o critério 823 é satisfeito com base em uma comparação de sinais laterais que correspondem a cada um dos valores de parâmetro de downmix correspondentes à primeira técnica e à segunda técnica. Por exemplo, oO gerador de parâmetros 806 utiliza a primeira técnica para gerar o valor de parâmetro de downmix 805 e utiliza a segunda técnica para gerar o valor de parâmetro de downmix
807. O gerador de midside 148 gera o primeiro sinal lateral 851 que corresponde ao valor de parâmetro de downmix 805 com base em uma das Equações 9(b)-l4(b). Por exemplo, Side(n) corresponde ao primeiro sinal lateral 851 e Ratio L corresponde ao valor de parâmetro de downmix 805. O gerador de midside 148 gera o segundo sinal lateral 853 que corresponde ao valor de parâmetro de downmix 807 com base em uma das Equações 9(b)-l4(b). Por exemplo, Side (n) corresponde ao segundo sinal lateral 853 e Ratio L corresponde ao valor de parâmetro de downmix 807.
[0234] O decisor de geração de downmix 804 determina a primeira potência do primeiro sinal lateral 851 e determina a segunda potência do segundo sinal lateral
853. O decisor de geração de downmix 804 pode gerar um valor de comparação de potência com base na comparação da primeira potência e da segunda potência. O decisor de geração de downmix 804 pode determinar que o critério 823 é satisfeito com base na determinação de que o valor de comparação de potência satisfaz um limite de potência. Por exemplo, o decisor de geração de downmix 804 pode determinar que o critério 823 é satisfeito com base, pelo menos em parte, na determinação de que a primeira potência é menor que a segunda potência e que o valor de comparação de potência satisfaz o limite de potência. O decisor de geração de downmix 804 pode assim determinar que o critério 823 é satisfeito em resposta à determinação de que a primeira potência do primeiro sinal lateral 851 que corresponde ao valor de parâmetro de downmix 805 é suficientemente inferior à segunda potência do segundo sinal lateral 853 que corresponde ao valor de parâmetro de downmix 807.
[0235] O gerador de midside 148 pode, em resposta à determinação de que o parâmetro de CP 809 tem o segundo valor (como, por exemplo, 1) e que o critério 823 é satisfeito, designar o primeiro sinal lateral 851 como o sinal lateral 813. Alternativamente, o gerador de midside 148 pode, em resposta à determinação de que o parâmetro de CP 809 tem o primeiro valor (como, por exemplo, 0) ou que o critério 823 não é satisfeito, designar o segundo sinal lateral 853 como o sinal lateral 813.
[0236] Sob um aspecto específico, o decisor de geração de downmix 804 determina se o critério 823 é satisfeito com base nos parâmetros de ICA 107. Em um exemplo específico, o decisor de geração de downmix 804 determina que o critério 823 é satisfeito em resposta à determinação de que um valor de disparidade temporal 857 indica uma disparidade temporal relativamente pequena (como, por exemplo, nenhuma). Para exemplificar, o decisor de geração de downmix 804 determina que o critério 823 é satisfeito em resposta à determinação de que uma diferença entre o valor de disparidade temporal 857 e um valor específico (como, por exemplo, 0) satisfaz um limite de valor de disparidade temporal. O valor de disparidade temporal 857 pode incluir o valor de disparidade temporal experimental 701, o valor de disparidade temporal interpolado 703, o valor de disparidade temporal alterado 705, o valor de disparidade temporal final 707 ou o valor de disparidade temporal não causal 717 dos parâmetros de ICA 107.
[0237] Sob um aspecto específico, o decisor de geração de downmix 804 determina se o critério 823 é satisfeito com base no valor de comparação 855. Por exemplo, o decisor de geração de downmix 804 determina o valor de comparação 855 (como, por exemplo, valor da diferença, valor de similaridade, valor de coerência ou valor de correlação cruzada) com base na comparação de amostras do sinal de referência 103 (como, por exemplo, Ref(n)) e amostras correspondentes do sinal alvo ajustado 105 (como, por exemplo, Targ(n + N,i)). Para exemplificar, o decisor de geração de downmix 804 determina que o critério 823 é satisfeito em resposta à determinação de que o valor de comparação 855 (como, por exemplo, valor de diferença, valor de similaridade, valor de coerência ou valor de correlação cruzada) satisfaz um limite (como, por exemplo, um limite de diferença, um de similaridade, de coerência ou um limite de correlação cruzada). Sob um aspecto específico, o decisor de geração de downmix 804 determina que o critério 823 é satisfeito quando o valor de comparação 855 indica que uma correlação mais alta é possível. Por exemplo, o decisor de geração de downmix 804 determina que o critério 823 é satisfeito em resposta à determinação de que o valor de comparação 855 corresponde a uma correlação cruzada maior que o limite.
[0238] O gerador de midside 148 pode ser configurado para gerar um ou mais parâmetros outros 810 com base no sinal de referência 103, no sinal alvo ajustado 105 ou ambos. Os parâmetros outros 810 podem incluir um parâmetro de decisão de fala 815, um tipo de núcleo 817, um tipo de codificador 819, um indicador de transitório 821, o fator de harmonização 825 ou uma combinação deles. Por exemplo, o gerador de midside 148 pode determinar o parâmetro de decisão de fala 815 utilizando diversas técnicas de classificação de fala/música. O parâmetro de decisão de fala 815 pode indicar se o sinal de referência
103, o sinal alvo ajustado 105, ou ambos, são classificados como fala ou não fala (como, por exemplo, música ou ruído).
[0239] O gerador de midside 148 pode ser configurado para determinar o tipo de núcleo 817, o tipo de codificador 819 ou ambos. Por exemplo, um quadro codificado anteriormente pode ter sido codificado com base em um tipo de núcleo anterior, um tipo de codificador anterior ou ambos. O tipo de núcleo 817 pode corresponder ao tipo de núcleo anterior, o tipo de codificador 819 pode corresponder ao tipo de codificador anterior ou ambos. Sob um aspecto alternativo, o gerador de midside 148 determina o tipo de núcleo 817, o tipo de codificador 819, ou ambos, com base no parâmetro de decisão de fala 815. Por exemplo, o gerador de midside 148 pode, em resposta à determinação de que o parâmetro de decisão de fala 815 tem um primeiro valor (como, por exemplo, 0) que indica que o sinal de referência 103, o sinal alvo ajustado 105, ou ambos, correspondem à fala, selecionar um tipo de núcleo de ACELP como o tipo de núcleo 817. Alternativamente, o gerador de midside 148 pode, em resposta à determinação de que o parâmetro de decisão de fala 815 tem um segundo valor (como, por exemplo, 1) que indica que o sinal de referência 103, o sinal alvo ajustado 105, ou ambos, correspondem a não fala (como, por exemplo, música), selecionar tipo de núcleo de excitação codificada por transformada (TCX) como o tipo de núcleo 817.
[0240] O gerador de midside 148 pode, em resposta à determinação de que o parâmetro de decisão de fala 815 tem um primeiro valor (como, por exemplo, 0) que indica que o sinal de referência 103, o sinal alvo ajustado
105, ou ambos, correspondem à fala, selecionar um tipo de codificador de codificação de sinal geral (GSC) ou tipo de codificador de não-GSC como o tipo de codificador 819. Por exemplo, o gerador de midside 148 pode selecionar o tipo de codificador de não-GSC (como, por exemplo, transformada de co-seno discreta modificada (MDCT) ) em resposta à determinação de que o sinal de referência 103, o sinal alvo ajustado 105, ou ambos, correspondem à alta escassez espectral (como, por exemplo, mais elevada que um limite de escassez). Alternativamente, o gerador de midside 148 pode selecionar o tipo de codificador de GSC em resposta à determinação de que o sinal de referência 103, o sinal alvo ajustado 105, ou ambos, correspondem a um espectro não esparso (como, por exemplo, mais baixo que o limite de escassez).
[0241] O gerador de midside 148 pode ser configurado para determinar o indicador de transitório 821 com base na potência do sinal de referência 103, na potência do sinal alvo ajustado 105 ou ambos. Por exemplo, o gerador de midside 148 pode configurar o indicador de transitório 821 para um primeiro valor (como, por exemplo, 0) que indica que um transitório não é detectado em resposta à determinação de que a potência do sinal de referência 103, a potência do sinal alvo ajustado 105, ou ambos, não indicam um pico maior que o limite. Um pico pode corresponder a menos do que um número limite de amostras Alternativamente, o gerador de midside 148 pode configurar o indicador de transitório 821 para um segundo valor (como, por exemplo, 1) que indica que um transitório é detectado em resposta à determinação de que a potência do sinal de referência 103, a potência do sinal alvo ajustado 105, ou ambos, indicam um pico mais elevado que um limite. O pico (como, por exemplo, aumento) de potência pode estar associado com menos do que um número limite de amostras.
[0242] Sob um aspecto específico, o decisor de geração de downmix 804 determina se o critério 823 é satisfeito com base no parâmetro de decisão de fala 815. Por exemplo, o decisor de geração de downmix 804 determina que o critério 823 é satisfeito em resposta à determinação de que o parâmetro de decisão de fala 815 tem um primeiro valor (como, por exemplo, 0) que indica que o sinal de referência 103, o sinal alvo ajustado 105, ou ambos, correspondem ao discurso.
[0243] Sob um aspecto específico, o decisor de geração de downmix 804 determina se o critério 823 é satisfeito com base no tipo de codificador 819. Por exemplo, o decisor de geração de downmix 804 determina que o critério 823 é satisfeito em resposta à determinação de que o tipo de codificador 819 corresponde ao tipo de codificador harmonizado (como, por exemplo, um tipo de codificador de GSC).
[0244] Sob um aspecto específico, o decisor de geração de downmix 804 determina se o critério 823 é satisfeito com base no tipo de núcleo 817. Por exemplo, o decisor de geração de downmix 804 determina que o critério 823 é satisfeito em resposta à determinação de que o tipo de núcleo 817 corresponde ao núcleo de codificação de fala (como, por exemplo, um tipo de núcleo de ACELP).
[0245] Sob um aspecto específico, o transmissor 110 da Figura 1 pode transmitir o parâmetro de downmix 115 (como, por exemplo, o parâmetro de downmix 803) em resposta à determinação de que o parâmetro de downmix 115 difere de um valor de parâmetro de downmix predefinido (como, por exemplo, 0,5). Neste aspecto, o transmissor 110 pode abster-se de transmitir o parâmetro de downmix 115 em resposta à determinação de que o parâmetro de downmix 115 corresponde ao valor de parâmetro predefinido de downmix (como, por exemplo, 0,5).
[0246] Sob um aspecto específico, o transmissor 110 pode transmitir o parâmetro de downmix 115 em resposta à determinação de que o parâmetro de downmix 115 é baseado em um ou mais parâmetros que são indisponíveis no decodificador 118. Em um exemplo específico, pelo menos da potência do primeiro sinal lateral 851, da potência do segundo sinal lateral 853, do valor de comparação 855 ou do parâmetro de decisão de fala 815, são indisponíveis no decodificador 118. Neste exemplo, o gerador de midside 148 pode iniciar transmissão, por meio do transmissor 110, do parâmetro de downmix 115 em resposta à determinação de que o parâmetro de downmix 115 é baseado em pelo menos um da potência do primeiro sinal lateral 851, da potência do segundo sinal lateral 853, do valor de comparação 855 ou do parâmetro de decisão de fala 815.
[0247] Quanto mais o parâmetro de downmix 803 for de um valor específico (como, por exemplo, 0), mais informações o sinal lateral 813 inclui como sendo comum ao sinal medial 811. Por exemplo, quanto mais o parâmetro de downmix 803 for de valor específico (como, por exemplo, 0), mais elevada a potência do sinal lateral 813, e mais elevada a correlação entre o sinal lateral 813 e o sinal medial 811. Quando o sinal lateral 813 tiver menor potência e a decorrelação entre o sinal lateral 813 e o sinal medial 811 for mais elevada, um sinal lateral predito pode ser mais estreitamente próximo ao sinal lateral 813.
[0248] O sinal lateral 813 pode ter potência mais baixa quando gerado com base no parâmetro de downmix 803, que tem o valor de parâmetro de downmix 805 em comparação com quando gerado com base no parâmetro de downmix 803 que tem valor de parâmetro de downmix 807. O gerador de parâmetros de downmix 802 permite que o sinal lateral 813 seja gerado com base no valor de parâmetro de downmix 805 quando o parâmetro de CP 809 tiver um segundo valor (como, por exemplo, 1) indicando que o decodificador 118 deve predizer o sinal lateral sintetizado 173 com base no sinal medial sintetizado 171 da Figura 1. Em algumas implementações, o gerador de parâmetros de downmix 802 permite que o sinal lateral 813 seja gerado com base no valor de parâmetro de downmix 805 quando o parâmetro de CP 809 tiver o segundo valor (como, por exemplo, 1) e quando o critério 823 for satisfeito, indicando que um é possível uma decorrelação mais elevada do sinal lateral 813. A geração do sinal lateral 813, com base no valor de parâmetro de downmix 805, aumenta a probabilidade de que um sinal lateral predito em um decodificador seja mais estreitamente próximo do sinal lateral 813.
[0249] Com referência à Figura 9, é mostrado um exemplo do seletor de CP 122. O seletor de CP 122 é configurado para gerar um parâmetro de CP 919 com base em pelo menos um dos parâmetros de ICA 107, no parâmetro de downmix 515, nos parâmetros outros 517 ou no GICP 601. Sob um aspecto específico, o parâmetro de CP 919 corresponde ao parâmetro de CP 109 da Figura 1, ao parâmetro de CP 509 da Figura 5 ou ambos.
[0250] Durante a operação, o seletor de CP 122 pode receber pelo menos um dos parâmetros de ICA 107, do parâmetro de downmix 515, dos parâmetros outros 517 ou do GICP 610. O seletor de CP 122 pode determinar um ou mais indicadores 960 com base em pelo menos um dos parâmetros de ICA 107, do parâmetro de downmix 515, dos parâmetros outros 517 ou do GICP 610. O seletor de CP 122 pode determinar o parâmetro de CP 919 com base na determinação de se pelo menos um dos parâmetros de ICA 107, do parâmetro de downmix 515, dos parâmetros outros 517, do GICP 610 ou dos indicadores 960, satisfazem um ou mais limites 901.
[0251] Sob um aspecto específico, o seletor de CP 122 determina o parâmetro de CP 919 com base no seguinte pseudo-código: st stereo->icpFlag = 1; se(isICAStable=0) 1 /*Ou o deslocamento ou ganho de ICA é não estável*/ se(ShiftStable) ( /*Deslocamento é estável, o que significa que ganho é instável*/ se (isGICPHigh) 1
/*gICP é alto, o que significa que lateral é alta e predição é arriscada*/ st stereo->icpFlag = O ) ) caso contrário ( /*deslocamento de ICA não é estável, o que significa que é arriscado predizer*/ st stereo->icpFlag = O; ) )
[0252] onde st stereo->icpFlag corresponde ao parâmetro de CP 919, isICAStable corresponde a um indicador de estabilidade de ICA 975, isShiftStable corresponde a um indicador de estabilidade de disparidade temporal 965 e isGICPHigh corresponde a um indicador de GICP mais elevado
977.
[0253] O seletor de CP 122 pode gerar o indicador de GICP mais elevado 977 com base no GICP 601. Por exemplo, o indicador de GICP mais elevado 977 indica se o GICP 601 satisfaz (como, por exemplo, ser maior que) um limite de GICP mais elevado 923 (como, por exemplo, 0,7). Por exemplo, o seletor de CP 122 pode configurar o indicador de GICP mais elevado 977 para um primeiro valor (como, por exemplo, 0) em resposta à determinação de que o GICP 601 falha em satisfazer (como, por exemplo, é menor que ou igual a) o limite de GICP mais elevado 923 (como, por exemplo, 0,7). Alternativamente, o seletor de CP 122 pode configurar o indicador de GICP mais elevado 977 para um segundo valor (como, por exemplo, 1) em resposta à determinação de que o GICP 601 satisfaz (como, por exemplo, ser maior que) o limite de GICP mais elevado 923 (como, por exemplo, 0,7).
[0254] O seletor de CP 122 pode gerar o indicador de estabilidade de disparidade temporal 965 com base em uma evolução dos valores de disparidade temporal (TMVsS) através dos quadros. Por exemplo, o seletor de CP 122 pode gerar o indicador de estabilidade de disparidade temporal 965 com base em um TMV 943 e em um segundo TMV
945. Os parâmetros de ICA 107 podem incluir o TMV 943 e o segundo TMV 945. O TMV 943 pode incluir o TMV experimental 701, o TMV interpolado 703, o TMV alterado 705 ou o TMV final 707 da Figura 7. O segundo TMV 945 pode incluir um TMV experimental, um TMV interpolado, um TMV alterado ou um TMV final que correspondem a um quadro codificado anteriormente. Por exemplo, o TMV 943 pode ser baseado nas primeiras amostras do sinal de referência 103 e o segundo TMV 945 pode ser baseado nas segundas amostras do sinal de referência 103. As primeiras amostras podem ser distintas das segundas amostras. Por exemplo, as primeiras amostras podem incluir pelo menos uma amostra que não está incluída nas segundas amostras, as segundas amostras podem incluir pelo menos uma amostra que não está incluída nas primeiras amostras, ou ambas. Conforme outro exemplo, o TMV 943 pode ser baseado em primeiras amostras específicas de sinal alvo e o segundo TMV 945 pode ser baseado em segundas amostras específicas de sinal alvo. As primeiras amostras específicas podem ser distintas das segundas amostras específicas. Por exemplo, as primeiras amostras específicas podem incluir pelo menos uma amostra que não está incluída nas segundas amostras específicas, as segundas amostras específicas podem incluir pelo menos uma amostra que não está incluída nas primeiras amostras específicas, ou ambas.
[0255] Sob um aspecto particular, o seletor de CP 122 configura o indicador de estabilidade de disparidade temporal 965 para um primeiro valor (como, por exemplo, O) em resposta à determinação de que uma diferença entre o TMV 943 e o segundo TMV 945 é maior que um limite de estabilidade de disparidade temporal 905, que um do TMV 943 ou do segundo TMV 945 é positivo e o outro do TMV 943 ou do segundo TMV 945 é negativo, ou ambos. O primeiro valor (como, por exemplo, 0) do indicador de estabilidade de disparidade temporal 965 pode indicar que a disparidade temporal é instável. O seletor de CP 122 configura o indicador de estabilidade de disparidade temporal 965 para um segundo valor (como, por exemplo, 1) em resposta à determinação de que uma diferença entre o TMV 943 e o segundo TMV 945 é menor ou igual ao limite de estabilidade de disparidade temporal 905, que o TMV 943 e o segundo TMV 945 são positivos, que o TMV 943 e o segundo TMV 945 são negativos, que um do TMV 943 ou do segundo TMV 945 é zero ou uma combinação deles. O segundo valor (como, por exemplo, 1) do indicador de estabilidade de disparidade temporal 965 pode indicar que a disparidade temporal é estável.
[0256] O seletor de CP 122 pode gerar o indicador de estabilidade de ICA 975 com base em pelo menos um do indicado de estabilidade de disparidade temporal 965, do indicador de estabilidade de ganho de ICA 973 (como, por exemplo, um indicador de estabilidade de ganho intercanal) ou do indicador de confiabilidade de ganho de ICA 971 (como, por exemplo, um indicador de confiabilidade de ganho intercanal). Por exemplo, o seletor de CP 122 pode configurar o indicador de estabilidade de ICA 975 para um primeiro valor (como, por exemplo, 0) em resposta à determinação de que o indicador de estabilidade de disparidade temporal 965 tem um primeiro valor (como, por exemplo, 0) que indica que a disparidade temporal é instável, que o indicador de estabilidade de ganho de ICA 973 tem um primeiro valor (como, por exemplo, 0) que indica que o ganho de ICA é instável ou que o indicador de confiabilidade de ganho de ICA 971 tem um primeiro valor (como, por exemplo, 0) que indica que o ganho de ICA é não confiável.
Alternativamente, o seletor de CP 122 pode configurar o indicador de estabilidade de ICA 975 para um segundo valor (como, por exemplo, 1) em resposta à determinação de que o indicador de estabilidade de disparidade temporal 965 tem um segundo valor (como, por exemplo, 1) que indica que a disparidade temporal é estável, que o indicador de estabilidade de ganho de ICA 973 tem um segundo valor (como, por exemplo, 1) que indica que o ganho de ICA é estável e que o indicador de confiabilidade de ganho de ICA 971 tem um segundo valor (como, por exemplo, 1) que indica que o ganho de ICA é confiável.
O primeiro valor (como, por exemplo, 0) do indicador de estabilidade de ICA 975 pode indicar que o ICA é instável.
O segundo valor (como, por exemplo, 1) do indicador de estabilidade do ICA 975 pode indicar que o ICA é estável.
[0257] O seletor de CP 122 pode gerar o indicador de estabilidade de ganho de ICA 973 com base em uma evolução de ganhos de ICA através de quadros. O seletor de CP 122 pode determinar o indicador de estabilidade de ganho de ICA 973 com base no primeiro parâmetro de ganho de ICA 715, no parâmetro de ganho de ICA 709, no parâmetro de ganho de ICA suavizado 713 ou em uma combinação deles. Os parâmetros de ICA 107 podem incluir o parâmetro de ganho de ICA 709, o primeiro parâmetro de ganho de ICA 715 e o parâmetro de ganho de ICA suavizado 713. O seletor de CP 122 pode determinar uma diferença de ganho com base na diferença entre o parâmetro de ganho de ICA 709 e no primeiro parâmetro de ganho de ICA 715. Sob um aspecto alternativo, o seletor de CP 122 pode determinar a diferença de ganho com base em uma diferença entre o parâmetro de ganho de ICA suavizado 713 e o primeiro parâmetro de ganho de ICA 715.
[0258] O seletor de CP 122 pode configurar o indicador de estabilidade de ganho de ICA 973 para um primeiro valor (como, por exemplo, 0) em resposta à determinação de que a diferença de ganho não satisfaz (como, por exemplo, ser maior que) um limite de estabilidade de ganho de ICA 913. Alternativamente, oO seletor de CP 122 pode configurar o indicador de estabilidade de ganho de ICA 973 para um segundo valor (como, por exemplo, 1) em resposta à determinação de que a diferença de ganho satisfaz (como, por exemplo, ser menor ou igual a) o limite de estabilidade de ganho de ICA 913. O primeiro valor (como, por exemplo, 0) do indicador de estabilidade de ganho de ICA 973 pode indicar que o ganho de ICA é instável. O segundo valor (como, por exemplo, 1) do indicador de estabilidade de ganho de ICA 973 pode indicar que o ganho de ICA é estável.
[0259] O seletor de CP 122 pode determinar o indicador de confiabilidade de ganho de ICA 971 com base no parâmetro de ganho de ICA 709 e no parâmetro de ganho de ICA suavizado 713. Os parâmetros de ICA 107 podem incluir o parâmetro de ganho de ICA 709 e o parâmetro de ganho de ICA suavizado 713. O seletor de CP 122 pode configurar o indicador de confiabilidade de ganho de ICA 971 para um primeiro valor (como, por exemplo, 0) em resposta à determinação de que uma diferença entre o parâmetro de ganho de ICA 709 e o parâmetro de ganho de ICA suavizado 713 falha em satisfazer (como, por exemplo, ser maior que) um limite de confiabilidade de ganho de ICA 911. Alternativamente, o seletor de CP 122 pode configurar o indicador de confiabilidade de ganho de ICA 971 para um segundo valor (como, por exemplo, 1) em resposta à determinação de que a diferença entre o parâmetro de ganho de ICA 709 e o parâmetro de ganho de ICA suavizado 713 satisfaz (como, por exemplo, ser menor ou igual a) o limite de confiabilidade de ganho de ICA 911. O primeiro valor (como, por exemplo, 0) do indicador de confiabilidade de ganho de ICA 971 pode indicar que o ganho de ICA não é confiável. Por exemplo, o primeiro valor (como, por exemplo, 0) do indicador de confiabilidade de ganho de ICA 971 pode indicar que o ganho de ICA está sendo suavizado demasiado lentamente, de tal modo que a percepção estéreo é alterada. O segundo valor (como, por exemplo, 1) do indicador de confiabilidade de ganho de ICA 971 pode indicar que o ganho de ICA é confiável.
[0260] Sob um aspecto específico, o seletor de CP 122 determina o parâmetro de CP 919 com base no seguinte pseudo-código: if (i(SGICPLow || st stereo->sp aud decision0 == 1 || (st[0]->last core > ACELP CORE)) ( /*Habilitar o ICP quando gICP for baixo significa que lateral é insignificante para código, ou quando decisão de fala/áudio ou modo de codificação medial apontam para O sinal medial com conteúdo de música onde predição é desejada ao invés de codificação*/ st stereo-> icpFlag = 1; ) else if (isGICPHigh || (ICP > 0.6f && (!isICAStable || !iSsICAGainReliable)) || st stereo->attackPresent) ( /*Desabilitar ICP e código quando gICP for baixo significa que lateral tem alta potência ou quando icp gain instantâneo é alto ou ICA é instável ou Ganho de ICA não é confiável ou quando há um transitório presente na entrada de fala onde predição não é desejada*/ st stereo-> icpFlag = 1; )
[0261] onde st stereo->icpFlag corresponde ao parâmetro de CP 919, isGICPLow corresponde a um indicador mais baixo de GICP 979, st stereo-> sp aud decision0 corresponde ao parâmetro de decisão de fala 815, st[0]- >last core corresponde ao tipo de núcleo 817, isGICPHigh corresponde ao o indicador mais elevado de GICP 977, gICP corresponde ao GICP 601, isICAStable corresponde ao indicador de estabilidade de ICA 975, isICAGainReliable corresponde ao indicador de confiabilidade de ganho de ICA 971 e st stereo-> attackPresent corresponde ao indicador de transitório 821.
[0262] O seletor de CP 122 pode gerar o indicador de GICP mais baixo 979 com base no GICP 601. Por exemplo, o indicador de GICP mais baixo 979 indica se o GICP 601 satisfaz (como, por exemplo, ser menor ou igual a) um limite de GICP mais baixo 921 (como, por exemplo, 0,5). Por exemplo, o seletor de CP 122 pode configurar o indicador de GICP mais baixo 979 para um primeiro valor (como, por exemplo, 0) em resposta à determinação de que o GICP 601 falha em satisfazer (como, por exemplo, ser maior que) o limite de GICP mais baixo 921 (como, por exemplo, 0,5). Alternativamente, o seletor de CP 122 pode configurar o indicador de GICP mais baixo 979 para um segundo valor (como, por exemplo, 1) em resposta à determinação de que o GICP 601 satisfaz (como, por exemplo, ser menor ou igual a) o limite de GICP mais baixo 921 (como, por exemplo, 0,5). O limite de GICP mais baixo 921 pode ser igual ou diferente do limite de GICP mais elevado 923.
[0263] Sob um aspecto específico, o seletor de CP 122 pode determinar o parâmetro de CP 919 com base na determinação de um ou mais dos parâmetros de ICA 107, do parâmetro de downmix 515, dos parâmetros outros 810 ou do GICP 601, que satisfaçam um limite correspondente. Por exemplo, o seletor de CP 122 pode configurar o parâmetro de CP 919 para um primeiro valor (como, por exemplo, 0) em resposta à determinação de que um ou mais dos parâmetros de ICA 107, do parâmetro de downmix 515, dos parâmetros outros 810 ou do GICP 601 falha em satisfazer um limite correspondente. Alternativamente, o seletor de CP 122 pode configurar o parâmetro de CP 919 para um segundo valor (como, por exemplo, 1) em resposta à determinação de que um ou mais dos parâmetros de ICA 107, do parâmetro de downmix 515, dos parâmetros outros 810 ou do GICP 601 satisfazem um limite correspondente.
[0264] Sob um aspecto específico, o seletor de CP 122 pode configurar o parâmetro de CP 919 para um primeiro valor (como, por exemplo, o) em resposta à determinação de que o GICP 610 falha em satisfazer (como, por exemplo, ser maior que) um limite de GICP 915 (como, por exemplo, um limite de ganho de predição intercanal) Alternativamente, o seletor de CP 122 pode configurar o parâmetro de CP 919 para um segundo valor (como, por exemplo, 1) em resposta à determinação de que o GICP 610 satisfaz (como, por exemplo, ser menor ou igual a) o limite do GICP 915.
[0265] Sob um aspecto específico, o seletor de CP 122 pode configurar o parâmetro de CP 919 para um primeiro valor (como, por exemplo, o) com base na determinação de que o parâmetro de ganho de ICA 709 falha em satisfazer (como, por exemplo, ser maior que) um limite de ganho de ICA (como, por exemplo, um limite de ganho intercanal). Alternativamente, o seletor de CP 122 pode configurar o parâmetro de CP 919 para um segundo valor (como, por exemplo, 1) com base na determinação de que o parâmetro de ganho de ICA 709 satisfaz (como, por exemplo, ser menor ou igual a) o limite de ganho de ICA.
[0266] Sob um aspecto específico, o seletor de CP 122 pode configurar o parâmetro de CP 919 para um primeiro valor (como, por exemplo, o) com base na determinação de que o ganho de ICA suavizado que o parâmetro 713 falha em satisfazer (como, por exemplo, ser maior que) um limite de ganho intercanal suavizado. Alternativamente, o seletor de CP 122 pode configurar o parâmetro de CP 919 para um segundo valor (como, por exemplo, 1) com base na determinação de que o parâmetro de ganho de ICA suavizado 713 satisfaz (como, por exemplo, ser menor ou igual a) o limite de ganho intercanal suavizado.
[0267] Sob um aspecto específico, o seletor de CP 122 pode configurar o parâmetro de CP 919 para um primeiro valor (como, por exemplo, 0) em resposta à determinação de que uma diferença de downmix entre o parâmetro de downmix 515 e um valor específico (como, por exemplo, 0,5) falha em satisfazer (como, por exemplo, ser maior que) um limite de downmix 917. Alternativamente, o seletor de CP 122 pode configurar o parâmetro de CP 919 para um segundo valor (como, por exemplo, 1) em resposta à determinação de que a diferença de downmix satisfaz (como, por exemplo, ser menor ou igual a) o limite de downmix 917.
[0268] Sob um aspecto específico, o seletor de CP 122 pode configurar o parâmetro de CP 919 para um primeiro valor (como, por exemplo, o) em resposta à determinação de que o tipo de codificador 819 corresponde a um tipo de codificador específico (como, por exemplo, um codificador de fala). Alternativamente, o seletor de CP 122 pode configurar o parâmetro de CP 919 para um segundo valor (como, por exemplo, 1) em resposta à determinação de que o tipo de codificador 819 não corresponde ao tipo de codificador específico (como, por exemplo, um codificador de não-fala).
[0269] Sob um aspecto específico, o seletor de CP 122 pode configurar o parâmetro de CP 919 para um primeiro valor (como, por exemplo, 0) em resposta à determinação de que o fator de harmonização 825 satisfaz um limite (como, por exemplo, fortemente harmonizada Ou fracamente harmonizada ou fracamente não-harmonizada) Alternativamente, o seletor de CP 122 pode configurar o parâmetro de CP 919 para um segundo valor (como, por exemplo, 1) em resposta à determinação de que o fator de harmonização 825 falha em satisfazer o limite (como, por exemplo, intensamente não-harmonizada).
[0270] Sob um aspecto específico, o seletor de CP 122 pode configurar o parâmetro de CP 919 para um valor predefinido (como, por exemplo, 1) que indica que um sinal lateral deve ser codificado para transmissão, que um sinal lateral codificado deve ser transmitido e que um decodificador deve gerar um sinal lateral sintetizado com base na decodificação do sinal lateral codificado. Por exemplo, o seletor de CP 122 pode configurar o parâmetro de CP 919 para o valor predefinido (como, por exemplo, 1) em resposta à determinação de que o parâmetro de CP 919 deve ser gerado independentemente dos parâmetros de ICA 107, do parâmetro de downmix 515, dos parâmetros outros 517 e do GICP 610. Neste aspecto, o parâmetro de CP 919 pode corresponder ao parâmetro de CP 509 da Figura 5.
[0271] Sob um aspecto específico, o seletor de CP 122 pode aplicar histerese para modificar um ou mais dos limites 901. Por exemplo, o seletor de CP 122 pode modificar o limite de GICP mais elevado 923 de um primeiro valor (como, por exemplo, 0,7) para um segundo valor (como, por exemplo, 0,6) em resposta à determinação de que um GICP associado com um quadro codificado anteriormente satisfaz (como, por exemplo, ser maior que) um segundo limite de GICP (como, por exemplo, 0,9). O seletor de CP 122 pode determinar o indicador de GICP mais elevado 977 com base no segundo valor do limite de GICP mais elevado 923. Deve ficar entendido que o limite de GICP mais elevado 923 é utilizado como um exemplo ilustrativo; em outras implementações, o seletor de CP 122 pode aplicar histerese para modificar um ou mais limites adicionais. Aplicar histerese a um ou mais dos limites 901 pode reduzir a variabilidade no parâmetro de CP 919 através dos quadros.
[0272] Deve ficar entendido que os parâmetros de ICA 107, o parâmetro de downmix 515, os parâmetros outros 810, o GICP 601, os limites 901 e os indicadores 960 são aqui descritos como exemplos ilustrativos, em outras implementações o seletor de CP 122 pode utilizar outros parâmetros, indicadores, limites ou uma combinação deles, para determinar o parâmetro de CP 919. Por exemplo, o seletor de CP 122 pode determinar o parâmetro de CP 919 com base em pitch, inclinação, correlação cruzada de meio para lateral, potência absoluta de lateral, ou uma combinação deles. Deve ficar entendido que a determinação do parâmetro de CP 919 com base em uma evolução de ganho de ICA ou disparidade temporal são descritas como exemplos ilustrativos; em outras implementações, o seletor de CP 122 pode determinar o parâmetro de CP 919 com base na evolução de um ou mais parâmetros adicionais através dos quadros.
[0273] Com referência à Figura 10, é mostrado um exemplo do determinador de CP 172. O determinador de CP 172 é configurado para gerar o parâmetro de CP 179. O parâmetro de CP 179 pode corresponder ao parâmetro de CP
109.
10274] Durante a operação, o determinador de CP 172, em resposta à determinação de que os parâmetros de codificação 140 incluem o parâmetro de CP 109, configura o parâmetro de CP 179 para o mesmo valor que o parâmetro de CP 109. Alternativamente, o determinador de CP 172, em resposta à determinação que os parâmetros de codificação 140 não incluem o parâmetro de CP 109, determina que o parâmetro de CP 179 efetue uma ou mais técnicas descritas como efetuadas pelo seletor de CP 122 com referência à Figura 9. Por exemplo, o determinador de CP 172 pode determinar o parâmetro de CP 179 com base em pelo menos um dos parâmetros de downmix 115, dos parâmetros de ICA 107, dos parâmetros outros 810, dos limites 901 ou dos indicadores 960. Um primeiro valor (como, por exemplo, O) do parâmetro de CP 179 pode indicar que os parâmetros de fluxo de bits 102 correspondem ao sinal lateral codificado
123. Um segundo valor (como, por exemplo, 1) do parâmetro de CP 179 pode indicar que os parâmetros de fluxo de bits 102 não correspondem ao sinal lateral codificado 123. O determinador de CP 172 permite, assim, que o decodificador 118 determine dinamicamente se o sinal lateral sintetizado 173 deve ser predito com base no sinal medial sintetizado
171 ou decodificado com base nos parâmetros de fluxo de bits 102.
[0275] Com referência à Figura 11, é mostrado um exemplo do gerador de parâmetros de upmix 176 e geralmente designado 1100. No exemplo 1100, os parâmetros de codificação 140 incluem o parâmetro de downmix 115.
[0276] Durante a operação, o gerador de parâmetros de upmix 176, em resposta à determinação de que os parâmetros de codificação 140 incluem o parâmetro de downmix 115, gera o parâmetro de upmix 175 que corresponde ao parâmetro de downmix 115. Por exemplo, o parâmetro de upmix 175 pode ter o mesmo valor que o parâmetro de downmix
115. O parâmetro de downmix 115 pode ter o valor de parâmetro de downmix 805 ou o valor de parâmetro de downmix 807, conforme descrito com referência à Figura 8. Sob um aspecto específico, o valor de parâmetro de downmix 805 pode corresponder a um valor de parâmetro predefinido (como, por exemplo, 0,5). Sob um aspecto específico, oO gerador de parâmetros de upmix 176 pode, em resposta à determinação de que os parâmetros de codificação 140 não incluem o parâmetro de downmix 115, configurar o parâmetro de upmix 175 para um valor predefinido (como, por exemplo, 0,5).
[0277] A Figura 11 também inclui um exemplo 1102 do gerador de parâmetros de upmix 176. No exemplo 1102, o gerador de parâmetros de upmix 176 determina o parâmetro de upmix 175 com base no parâmetro de CP 179. Por exemplo, o gerador de parâmetros de upmix 176 pode, em resposta à determinação de que o parâmetro de CP 179 tem um primeiro valor (como, por exemplo, O), configurar o parâmetro de upmix 175 para o valor de parâmetro de downmix
807. Os parâmetros de codificação 140 podem incluir o valor de parâmetro de downmix 807. Alternativamente, o gerador de parâmetros de upmix 176 pode, em resposta a determinação de que o parâmetro de CP 179 tem um segundo valor (como, por exemplo, 1), configurar o parâmetro de upmix 175 para oO valor de parâmetro de downmix 805. Sob um aspecto específico, o valor de parâmetro de downmix 805 pode corresponder a um valor de parâmetro predefinido (como, por exemplo, 0,5). Sob um aspecto alternativo, o gerador de parâmetros de upmix 176 pode determinar o valor de parâmetro de downmix 805 com base no valor de parâmetro de downmix 807, conforme descrito com referência ao gerador de parâmetros 806 da Figura 8. Por exemplo, o gerador de parâmetros de upmix 176 pode determinar o valor de parâmetro de downmix 805 por aplicação de uma função de redução de faixa dinâmica (como, por exemplo, um sigmóide modificado) ao valor de parâmetro de downmix 807. Conforme outro exemplo, o gerador de parâmetros de upmix 176 pode determinar o valor de parâmetro de downmix 805 com base no valor de parâmetro de downmix 807, no fator de harmonização 825 ou em ambos, conforme descrito com referência ao gerador de parâmetros 806 da Figura 8. Os parâmetros de codificação 140 podem incluir o valor de parâmetro de downmix 807, o fator de harmonização 825 ou ambos.
[0278] Sob um aspecto específico, o gerador de parâmetros de upmix 176, em resposta à determinação de que os parâmetros de codificação 140 não incluem o parâmetro 115 de downmix, determina o parâmetro de upmix 175 com base no parâmetro de CP 179. Sob um aspecto alternativo, O gerador de parâmetros de upmix 176, em resposta à determinação de que o parâmetro de CP 179 tem um primeiro valor (como, por exemplo, 0), determina que os parâmetros de codificação 140 incluam o parâmetro de downmix 115 e determina que o parâmetro de upmix 175 corresponda ao parâmetro de downmix 115. O parâmetro de upmix 175 pode ser o mesmo que o parâmetro de downmix 115. O parâmetro de downmix 115 pode indicar o valor de parâmetro de downmix
807. Alternativamente, o gerador de parâmetros de upmix 176, em resposta à determinação de que o parâmetro de CP 179 tem um segundo valor (como, por exemplo, 1), determina que os parâmetros de codificação 140 não incluam o parâmetro de downmix 115 e configura o parâmetro de upmix 175 para o valor de parâmetro de downmix 805. O valor de parâmetro de downmix 805 pode ser baseado em um valor de parâmetro predefinido (como, por exemplo, 0,5), no valor de parâmetro de downmix 807, ou ambos, conforme descrito com referência à Figura 8. Os parâmetros de codificação 140 podem incluir o valor de parâmetro de downmix 807.
[0279] O gerador de parâmetros de upmix 176 pode, assim, permitir determinar o parâmetro de upmix 175 com base no parâmetro de CP 179. Sob um aspecto específico, o transmissor 110 transmite um bit único que indica o segundo valor (como, por exemplo, 1) do parâmetro de CP 109, o determinador de CP 172 determina o parâmetro de CP 179 com base no segundo valor (como, por exemplo, 1) indicado pelo bit único, e o gerador de parâmetros de upmix 176 determina o parâmetro de upmix 175 correspondente ao valor predefinido (como, por exemplo, 0) com base no parâmetro de CP 179. Nesse aspecto, o gerador de parâmetros de upmix 176 gera o parâmetro de upmix 175 com base no valor de um bit único transmitido pelo transmissor 110. O gerador de parâmetros de upmix conserva os recursos de rede (como, por exemplo, largura de banda) abstendo-se de transmitir o parâmetro de downmix 115. O gerador de parâmetros de upmix 176 pode redirecionar os bits que teriam sido utilizados para transmitir o parâmetro de downmix 115 para transmitir outro parâmetro (como, por exemplo, o GICP 603 da Figura 6), os parâmetros de fluxo de bits 102 ou uma combinação deles.
[0280] Com referência à Figura 12, é mostrado e geralmente designado 1200 um exemplo do gerador de parâmetros de upmix 176. No exemplo 1200, os parâmetros de codificação 140 incluem a decisão de geração downmix 895.
[0281] O gerador de parâmetros de upmix 176, em resposta à determinação de que a decisão de geração de downmix 895 tem um primeiro valor (como, por exemplo, 0), designa o valor de parâmetro de downmix 805 como o parâmetro de upmix 175. Alternativamente, o gerador de parâmetros de upmix 176, em resposta a determinação de que a decisão de geração de downmix 895 tem um segundo valor (como, por exemplo, 1), designa o valor de parâmetro de downmix 807 como o parâmetro de upmix 175. Sob um aspecto específico, o valor de parâmetro de downmix 805 pode corresponder a um valor predefinido (como, por exemplo, 0,5). Sob um aspecto alternativo, o gerador de parâmetros de upmix 176 pode determinar o valor de parâmetro de downmix 805 com base no valor de parâmetro de downmix 807, conforme descrito com referência ao gerador de parâmetros
806 da Figura 8. Os parâmetros de codificação 140 podem incluir o valor de parâmetro de downmix 807.
[0282] A Figura 12 também inclui um exemplo 1202 do gerador de parâmetros de upmix 176. No exemplo 1202, o gerador de parâmetros de upmix 176 inclui uma decisão de geração de downmix 1204 acoplada a um gerador de parâmetros 1206. A decisão de geração de downmix 1204 corresponde à decisão de geração de downmix 804 da Figura
8. O gerador de parâmetros 1206 corresponde ao gerador de parâmetros 806 da Figura 8.
[0283] O decisor de geração de downmix 1204 pode gerar uma decisão de geração de downmix 1295 com base no parâmetro de CP 179, no critério 823 da Figura 8, ou ambos. Por exemplo, o decisor de geração de downmix 1204 pode efetuar uma ou mais operações efetuadas pelo decisor de geração de downmix 804 da Figura 8 para gerar a decisão de geração de downmix 895. O parâmetro de CP 179 pode corresponder ao parâmetro de CP 809 da Figura 8. O gerador de parâmetros 1206 pode designar, com base na decisão de geração de downmix 1295, o valor de parâmetro de downmix 805 ou o parâmetro de downmix 807 como o parâmetro de upmix
175.
[0284] O gerador de parâmetros 1206 pode efetuar uma ou mais operações efetuadas pelo gerador de parâmetros 806 da Figura 8 para gerar o parâmetro de downmix 803. Por exemplo, o gerador de parâmetros de upmix 176 pode designar o valor de parâmetro de downmix 805 como o parâmetro de upmix 175 em resposta à determinação de que a decisão de geração de downmix 1295 tem um primeiro valor (como, por exemplo, 0). Alternativamente, o gerador de parâmetros de upmix 176 pode designar o valor de parâmetro de downmix 807 como o parâmetro de upmix 175 em resposta à determinação de que a decisão de geração de downmix 1295 tem um segundo valor (como, por exemplo, 1).
[0285] Sob um aspecto específico, o gerador de parâmetros de upmix 176 determina o parâmetro de upmix 175 com base nas informações disponíveis no codificador 114 e no decodificador 118. Por exemplo, o decisor de geração downmix 1204 pode determinar se o critério 823 é satisfeito com base no tipo de codificador 819, no tipo de núcleo 817 da Figura 8, ou ambos, conforme descrito com referência ao decisor de geração de downmix 804 da Figura 8. Conforme outro exemplo, o gerador de parâmetros 1206 pode gerar o valor de parâmetro de downmix 805 com base no valor de parâmetro de downmix 807, no fator de harmonização 825, ou ambos, conforme descrito com referência ao gerador de parâmetros 806 da Figura 8. Os parâmetros de codificação 140 podem incluir o valor de parâmetro de downmix 807, o fator de harmonização 825, o tipo de codificador 819, o tipo de núcleo 817 ou uma combinação deles.
[0286] Sob um aspecto específico, o transmissor 110 da Figura 1 pode transmitir um indicador de critério satisfeito que indica se o critério 823 é satisfeito. O decisor de geração de downmix 1204 pode determinar a decisão de geração de downmix 1295 com base no parâmetro de CP 179 e no indicador de critério satisfeito. Por exemplo, a decisão de geração de downmix 1204 pode, em resposta à determinação de que o parâmetro de CP 179 tem um primeiro valor (como, por exemplo, 0) ou o indicador de critério satisfeito tem um primeiro valor (como, por exemplo, 0), gerar a decisão de geração de downmix 1295 que tem um segundo valor (como, por exemplo, 1). Conforme outro exemplo, o decisor de geração de downmix 1204 pode, em resposta à determinação de que o parâmetro de CP 179 tem um segundo valor (como, por exemplo, 1) ou o indicador de critério satisfeito tem um segundo valor (como, por exemplo, 1), gerar a decisão de geração de downmix que tem um primeiro valor (como, por exemplo, 0). O primeiro valor (como, por exemplo, 0) do indicador de critério satisfeito pode indicar que o decisor de geração de downmix 804 determinou que o critério 823 não é satisfeito. O segundo valor (como, por exemplo, 1) do indicador de critério satisfeito pode indicar que a decisão de geração de downmix 804 determinou que o critério 823 é satisfeito.
[0287] Sob um aspecto específico, o gerador de parâmetros de upmix 176 pode selecionar um ou mais parâmetros com base em uma configuração e pode determinar o parâmetro de upmix 175 com base nos parâmetros selecionados. Por exemplo, o decisor de geração de downmix 1204 pode determinar se o critério 823 é satisfeito com base em um primeiro conjunto de parâmetros selecionados. Conforme outro exemplo, o gerador de parâmetros 1206 pode determinar o valor de parâmetro de downmix 805 com base em um segundo conjunto de parâmetros selecionados. O gerador de parâmetros de upmix 176 pode, assim, permitir diversas técnicas de determinação do parâmetro de upmix 175 correspondente ao parâmetro de downmix 115 da Figura 1.
[0288] Com referência à Figura 13, é mostrado um exemplo ilustrativo específico de um sistema 1300 que sintetiza um sinal lateral intermediário com base em um parâmetro de ganho de predição intercanal e que filtra (como, por exemplo, filtros de correlação) o sinal lateral intermediário para sintetizar um sinal lateral. Em uma implementação específica, o sistema 1300 da Figura 13 inclui ou corresponde ao sistema 100 da Figura l após a determinação para predizer um sinal lateral sintetizado com base em um sinal medial sintetizado. Em algumas implementações, o sistema 1300 inclui ou corresponde ao sistema 200 da Figura 2. O sistema 1300 inclui um primeiro dispositivo 1304 acoplado comunicativamente, por meio de uma rede 1305, a um segundo dispositivo 1306. A rede 1305 pode incluir uma ou mais redes sem fio, uma ou mais redes cabeadas ou uma combinação delas. O primeiro dispositivo 1304, a rede 1305 e o segundo dispositivo 1306 podem incluir ou corresponder ao primeiro dispositivo 104, à rede 120 e ao segundo dispositivo 106 da Figura 1, Ou ao primeiro dispositivo 204, à rede 205 e ao segundo dispositivo 206 da Figura 2, respectivamente. Em uma implementação específica, o primeiro dispositivo 1304 inclui ou corresponde a um dispositivo móvel. Em outra implementação específica, o primeiro dispositivo 1304 inclui ou corresponde a uma estação base. Em uma implementação específica, o segundo dispositivo 1306 inclui ou corresponde a um dispositivo móvel. Em outra implementação específica, o segundo dispositivo 1306 inclui ou corresponde a uma estação base.
[0289] o primeiro dispositivo 1304 pode incluir um codificador 1314, um transmissor 1310, uma ou mais interfaces de entrada 1312 ou uma combinação deles. As uma ou mais interfaces de entrada 1312 podem ser configuradas para receber um primeiro sinal de áudio 1330 e um segundo sinal de áudio 1332, a partir de um ou mais microfones, conforme descrito com referência às Figuras 1-
2.
[0290] O codificador 1314 pode ser configurado para efetuar downmix e codificar sinais de áudio, conforme descrito com referência à Figura l1. Em uma implementação específica, o codificador 1314 pode ser configurado para efetuar uma ou mais operações de alinhamento no primeiro sinal de áudio 1330 e no segundo sinal de áudio 1332, conforme descrito com referência à Figura 1. O codificador 1314 inclui um gerador de sinais 1316, um gerador de parâmetros de ganho de predição intercanal (ICP) 1320 e um gerador de fluxo de bits 1322. O gerador de sinais 1316 pode ser acoplado ao gerador de ICP 1320 e ao gerador de fluxo de bits 1322, e o gerador de ICP 1320 pode ser acoplado ao gerador de fluxo de bits 1322. O gerador de sinais 1316 é configurado para gerar sinais de áudio com base em sinais de áudio de entrada recebidos por meio de uma ou mais interfaces de entrada 1312, conforme descrito com referência à Figura 1. Por exemplo, o gerador de sinais 1316 pode ser configurado para gerar um sinal medial 1311 com base no primeiro sinal de áudio 1330 e no segundo sinal de áudio 1332. Conforme outro exemplo, o gerador de sinais 1316 pode ser configurado para gerar um sinal lateral 1313 com base no primeiro sinal de áudio 1330 e no segundo sinal de áudio 1332. O gerador de sinais 1316 também pode ser configurado para codificar um ou mais sinais de áudio. Por exemplo, o gerador de sinais 1316 pode ser configurado para gerar um sinal medial codificado 1315 com base no sinal medial 1311. Em uma implementação específica, o sinal medial 1311, o sinal lateral 1313 e o sinal medial codificado 1315 incluem ou correspondem ao sinal medial 111, ao sinal lateral 113 e ao sinal medial codificado 115 da Figura 1 ou ao sinal medial 211, ao sinal lateral 213 e ao sinal medial codificado 215 da Figura 2, respectivamente. O gerador de sinais 1316 pode ser configurado adicionalmente para fornecer o sinal medial 1311 e o sinal lateral 1313 ao gerador de ICP 1320 e fornecer o sinal medial codificado 1315 ao gerador de fluxo de bits 1322. Em uma implementação específica, o codificador 1314 pode ser configurado para aplicar um ou mais filtros ao sinal medial 1311 e ao sinal lateral 1313 antes de fornecer o sinal medial 1311 e o sinal lateral 1313 (como, por exemplo, antes de gerar um parâmetro de ganho de predição intercanal).
[0291] O gerador de ICP 1320 é configurado para gerar um parâmetro de ganho de predição intercanal (ICP) 1308 com base no sinal medial 1311 e no sinal lateral
1313. Por exemplo, o gerador de ICP 1320 pode ser configurado para gerar o ICP 1308 com base em uma potência do sinal lateral 1313 ou com base em uma potência do sinal medial 1311 e na potência do sinal lateral 1313, conforme descrito com referência à Figura 3. Alternativamente, o gerador de ICP 1320 pode ser configurado para determinar o ICP 1308 com base em uma operação (como, por exemplo, uma operação de produto escalar) efetuada no sinal medial 1311 e no sinal lateral 1313, conforme descrito com referência à Figura 3. Embora um único parâmetro de ICP 1308 seja mostrado como sendo gerado, em outras implementações,
múltiplos parâmetros de ICP podem ser gerados. Conforme um exemplo específico, o sinal medial 1311 e o sinal lateral 1313 podem ser filtrados em múltiplas bandas e um ICP correspondente a cada uma das múltiplas bandas pode ser gerado, conforme descrito com referência à Figura 3. O gerador de ICP 1320 pode ser configurado adicionalmente para fornecer o ICP 1308 ao gerador de fluxo de bits 1322.
[0292] O gerador de fluxo de bits 1322 pode ser configurado para receber o sinal medial codificado 1315 e gerar um ou mais parâmetros de fluxo de bits 1302 que representam um sinal de áudio codificado (além de outros parâmetros). Por exemplo, o sinal de áudio codificado pode incluir ou corresponder ao sinal medial codificado 1315. O gerador de fluxo de bits 1322 também pode ser configurado para incluir o ICP 1308 em um ou mais parâmetros de fluxo de bits 1302. Alternativamente, o gerador de fluxo de bits 1322 pode ser configurado para gerar um ou mais parâmetros de fluxo de bits 1302, de tal modo que o ICP 1308 possa ser derivado de um ou mais parâmetros de fluxo de bits 1302. Em algumas implementações, um parâmetro de correlação 1309 pode ser incluído, indicado por ou enviado em adição a um ou mais parâmetros de fluxo de bits 1302, conforme descrito adicionalmente com referência à Figura 15. O transmissor 1310 pode ser configurado para enviar um ou mais parâmetros de fluxo de bits 1302 (como, por exemplo, o sinal medial codificado 1315) inclusive (ou em adição ao) o ICP 1308 (e opcionalmente o parâmetro de correlação 1309) para o segundo dispositivo 1306 por meio da rede 1305. Em uma implementação específica, um ou mais parâmetros de fluxo de bits 1302 incluem ou correspondem a um ou mais parâmetros de fluxo de bits 102 da Figura l1, e o ICP 1308 (e opcionalmente o parâmetro de correlação 1309) é incluído um ou mais parâmetros de codificação 140 que são incluídos (ou enviados em adição a) um ou mais parâmetros de fluxo de bits 102 da Figura 1.
[0293] O segundo dispositivo 1306 pode incluir um decodificador 1318 e um receptor 1360. O receptor 1360 pode ser configurado para receber o ICP 1308 e um ou mais parâmetros de fluxo de bits 1302 (como, por exemplo, o sinal medial codificado 1315) a partir do primeiro dispositivo 1304 por meio da rede 1305. Em algumas implementações, o receptor 1360 é configurado para receber o parâmetro de correlação 1309. O decodificador 1318 pode ser configurado para efetuar upmix e decodificar sinais de áudio. Para exemplificar, o decodificador 1318 pode ser configurado para decodificar e efetuar upmix em um ou mais sinais de áudio com base em um ou mais parâmetros de fluxo de bits 1302 (que incluem o ICP 1308 e, opcionalmente, o parâmetro de correlação 1309).
[0294] O decodificador 1318 pode incluir um gerador de sinais 1374, um filtro 1375 e um efetuador de upmix 1390. Em uma implementação específica, o gerador de sinais 1374 inclui ou corresponde ao gerador de sinais 174 da Figura 1 ou ao gerador de sinais 274 da Figura 2. O gerador de sinais 1374 pode ser configurado para gerar um sinal medial sintetizado 1352 com base em um sinal medial codificado 1325 (indicado por ou correspondente a um ou mais parâmetros de fluxo de bits 1302).
[0295] O gerador de sinais 1374 pode ser adicionalmente configurado para gerar um sinal lateral sintetizado intermediário 1354 com base no sinal medial sintetizado 1352 e no ICP 1308. Como exemplos não limitadores, o gerador de sinais 1374 pode ser configurado para gerar o sinal lateral sintetizado intermediário 1354 por aplicação do ICP 1308 ao sinal medial sintetizado 1352 (como, por exemplo, multiplicando o sinal medial sintetizado 1352 pelo ICP 1308) ou com base no ICP 1308 e em um ou mais níveis de potência, conforme descrito com referência à Figura 4. O filtro 1375 pode ser configurado para filtrar o sinal lateral sintetizado intermediário 1354 para gerar um sinal lateral sintetizado 1355. Em uma implementação específica, o filtro 1375 inclui um filtro de “passagem total” configurado para efetuar o ajuste de fase (como, por exemplo, fuzzing de fase, dispersão de fase, difusão de fase ou decorrelação de fase), reverberação e extensão estéreo, conforme descrito adicionalmente com referência à Figura 14. O decodificador 1318 pode ser configurado para processar adicionalmente e o efetuador de upmix 1390 pode ser configurado para efetuar upmix no sinal medial sintetizado 1352 e no sinal lateral sintetizado 1355 para gerar um ou mais sinais de áudio de saída, que podem ser renderizados e enviados, tal como para um ou mais alto falantes.
Em uma implementação específica, os sinais de áudio de saída incluem um sinal de áudio esquerdo e um sinal de áudio direito.
Em algumas implementações, uma ou mais operações de redução de descontinuidade podem ser efetuadas seletivamente utilizando-se o sinal lateral sintetizado 1355 antes de efetuar-se upmix e processamento adicional, conforme descrito adicionalmente com referência à Figura 14.
[0296] Durante a operação, o primeiro dispositivo 1304 pode receber o primeiro sinal de áudio 1330 por meio de uma primeira interface de entrada de uma ou mais interfaces de entrada 1312 e pode receber o segundo sinal de áudio 1332 por meio de uma segunda interface de entrada das uma ou mais interfaces de entrada 1312. O primeiro sinal de áudio 1330 pode corresponder a um de um sinal de canal direito ou um sinal de canal esquerdo. O segundo sinal de áudio 1332 pode corresponder ao outro do sinal do canal direito ou do sinal do canal esquerdo. O codificador 1314 pode efetuar uma ou mais operações de alinhamento para contabilizar um deslocamento temporal ou retardo temporal entre o primeiro sinal de áudio 1330 e o segundo sinal de áudio 1332, conforme descrito com referência à Figura l. O codificador 1314 pode gerar o sinal medial 1311 e o sinal lateral 1313 com base no primeiro sinal de áudio 1330 e no segundo sinal de áudio 1332, conforme descrito com referência à Figura l. O sinal medial 1311 e o sinal lateral 1313 podem ser fornecidos ao gerador de ICP 1320. O gerador de sinais 1316 também pode codificar o sinal medial 1311 para gerar o sinal medial codificado 1315, que é fornecido ao gerador de fluxo de bits 1322.
[0297] O gerador de ICP 1320 pode gerar o ICP 1308 com base no sinal medial 1311 e no sinal lateral 1313, conforme descrito com referência às Figuras 2-3. O ICP 1308 pode ser fornecido ao gerador de fluxo de bits 1322. Em algumas implementações, o ICP 1308 pode ser suavizado com base em parâmetros de ganho de predição intercanal associados com quadros anteriores, conforme descrito com referência à Figura 3. Em algumas implementações, o gerador de ICP 1320 também pode gerar o parâmetro de correlação
1309. O parâmetro de correlação 1309 pode representar a correlação entre o sinal medial 1311 e o sinal lateral
1313.
[0298] O gerador de fluxo de bits 1322 pode receber o sinal medial codificado 1315 e o ICP 1308 (e opcionalmente o parâmetro de correlação 1309) e gerar um ou mais parâmetros de fluxo de bits 1302. Um ou mais parâmetros de fluxo de bits 1302 incluem um fluxo de bits (como, por exemplo, o sinal medial codificado 1315) e o ICP 1308 (e opcionalmente o parâmetro de correlação 1309). Alternativamente, um ou mais parâmetros de fluxo de bits 1302 incluem um ou mais parâmetros que permitem que o ICP 1308 (e opcionalmente o parâmetro de correlação 1309) seja derivado. Um ou mais parâmetros de fluxo de bits 1302 (que incluem ou que indicam o ICP 1308 e, opcionalmente, o parâmetro de correlação 1309) são enviados pelo transmissor 1310 para o segundo dispositivo 1306 por meio da rede 1305.
[0299] O segundo dispositivo 1306 (como, por exemplo, o receptor 1360) pode receber um ou mais parâmetros de fluxo de bits 1302 (indicativos do sinal medial codificado 1315) que incluem (ou indicam) o ICP 1308 (e opcionalmente o parâmetro de correlação 1309). O decodificador 1318 pode determinar o sinal medial codificado 1325 com base em um ou mais parâmetros de fluxo de bits 1302, conforme descrito com referência à Figura 2. O gerador de sinais 1374 pode gerar o sinal medial sintetizado 1352 com base no sinal medial codificado 1325 (ou diretamente a partir de um ou mais parâmetros de fluxo de bits 1302). O gerador de sinais 1374 também pode gerar o sinal lateral sintetizado intermediário 1354 com base no sinal medial sintetizado 1352 e no ICP 1308. Como exemplos não limitadores, o gerador de sinais 1374 gera o sinal lateral sintetizado intermediário 1354 por multiplicação do sinal medial sintetizado 1352 pelo ICP 1308 ou com base no sinal medial sintetizado 1352, no ICP 1308 e em um nível de potência, conforme descrito com referência à Figura 4.
[0300] Após gerar o sinal lateral sintetizado intermediário 1354, o sinal lateral sintetizado intermediário 1354 pode ser filtrado utilizando-se o filtro 1375 (como, por exemplo, o filtro passa-tudo) para gerar o sinal lateral sintetizado 1355. Aplicar o filtro 1375 pode diminuir a correlação (como, por exemplo, aumentar a decorrelação) entre o sinal medial sintetizado 1352 e o sinal lateral sintetizado 1355. Em algumas implementações, o parâmetro de correlação 1309 é utilizado para configurar o filtro 1375, conforme descrito adicionalmente com referência à Figura 15. Em algumas implementações, são recebidos múltiplos ICPs que correspondem a diferentes bandas de sinal e múltiplas bandas de sinais laterais sintetizados intermediários podem ser filtradas utilizando- se o filtro 1375, conforme descrito adicionalmente com referência à Figura 16. Depois de gerar o sinal lateral sintetizado 1355, o decodificador 1318 pode efetuar processamento adicional e filtrar o sinal medial sintetizado 1352 e o sinal lateral sintetizado 1355, e o efetuador de upmix 1390 pode alterar o sinal medial sintetizado 1352 e o sinal lateral sintetizado 1355 para gerar um primeiro sinal de áudio e um segundo sinal de áudio. Em algumas implementações, uma ou mais operações de supressão de descontinuidade podem ser efetuadas utilizando-se o sinal lateral sintetizado 1355 antes da geração do primeiro sinal de áudio e do segundo sinal de áudio, conforme descrito adicionalmente com referência à Figura 14.
[0301] Em uma implementação específica, o primeiro sinal de áudio corresponde a um de um sinal esquerdo ou de um sinal direito, e o segundo sinal de áudio corresponde ao outro do sinal esquerdo ou do sinal direito. Em uma implementação específica, o sinal esquerdo pode ser gerado com base na soma do sinal medial sintetizado 1352 e no sinal lateral sintetizado 1355, e o sinal direito pode ser gerado com base na diferença entre o sinal medial sintetizado 1352 e o sinal lateral sintetizado 1355. Diminuir a correlação entre o sinal medial sintetizado 1352 e o sinal lateral sintetizado 1355 pode aperfeiçoar as informações espaciais de áudio representadas pelo sinal esquerdo e pelo sinal direito. Para exemplificar, se o sinal medial sintetizado 1352 e o sinal lateral sintetizado 1355 são altamente correlatos, o sinal esquerdo pode se aproximar duas vezes do sinal medial sintetizado 1352 e o sinal direito pode se aproximar de um sinal nulo. Reduzir a correlação entre o sinal medial sintetizado 1352 e o sinal lateral sintetizado 1355 pode aumentar as diferenças espaciais entre os sinais, o que pode resultar em um sinal esquerdo e um sinal direito que são espacialmente diferentes, o que pode aperfeiçoar a experiência de um ouvinte.
[0302] O sistema 1300 da Figura 13 permite a decorrelação, em um decodificador, de um sinal medial sintetizado e um sinal lateral sintetizado predito (como, por exemplo, um sinal lateral sintetizado com base no sinal medial sintetizado e em um parâmetro de ganho de predição intercanal). A decorrelação do sinal medial sintetizado e do sinal lateral sintetizado permite a geração de sinais de áudio (como, por exemplo, um sinal esquerdo e um sinal direito) que têm diferenças espaciais. Os sinais esquerdos e direitos que têm diferenças espaciais podem soar como se estivessem vindo a partir de dois locais diferentes, o que aperfeiçoa a experiência de ouvinte em comparação aos sinais carentes de diferenças espaciais (como, por exemplo, os que são baseados em sinais altamente correlatos) e, assim, soam como se fossem provenientes a partir de um único local (como, por exemplo, um alto-falante).
[0303] A Figura 14 é um diagrama que mostra um primeiro exemplo ilustrativo de um decodificador 1418 do sistema 1300 da Figura 13. Por exemplo, o decodificador 1418 pode incluir ou corresponder ao decodificador 1318 da Figura 13.
[0304] O decodificador 1418 inclui um circuito de processamento de fluxo de bits 1424, um gerador de sinais 1450 que inclui um sintetizador medial 1452 e um sintetizador lateral 1456 e um filtro passa-tudo 1430. O circuito de processamento de fluxo de bits 1424 pode ser acoplado ao gerador de sinais 1450 e o gerador de sinais 1450 pode ser acoplado ao filtro passa-tudo 1430.
[0305] O decodificador 1418 pode opcionalmente incluir um detector de potência 1460, um ou mais filtros
1468, um ampliador de amostragem 1464 e um supressor de descontinuidade 1466. O detector de potência 1460 pode ser acoplado ao gerador de sinais 1450 (como, por exemplo, ao sintetizador medial 1452 e ao sintetizador lateral 1456) Um ou mais filtros 1468, o ampliador de amostragem 1464 e Oo supressor de descontinuidade 1466 podem ser acoplados entre o filtro passa-tudo 1430 e uma saída do decodificador 1418. Cada um dos detectores de potência 1460, de um ou mais filtros 1468, do ampliador de amostragem 1464 e do supressor de descontinuidade 1466 são opcionais e, com efeito, podem não ser incluídos em algumas implementações do decodificador 1418.
[0306] O circuito de processamento de fluxo de bits 1424 pode ser configurado para processar um ou mais parâmetros de fluxo de bits 1402 (incluindo um ICP 1408) e extrair parâmetros específicos de um ou mais parâmetros de fluxo de bits 1402. Por exemplo, o circuito de processamento de fluxo de bits 1424 pode ser configurado para extrair o ICP 1408 e um ou mais parâmetros de sinal medial codificado 1426, conforme descrito com referência à Figura 4. O circuito de processamento de fluxo de bits 1424 pode ser configurado para fornecer o ICP 1408 e um ou mais parâmetros de sinal medial codificado 1426 ao gerador de sinais 1450 (como, por exemplo, o ICP 1408 pode ser fornecido ao sintetizador lateral 1456 e o um ou mais dos parâmetros de sinal medial codificado 1426 podem ser fornecidos ao sintetizador medial 1452). Em algumas implementações, o decodificador 1418 pode receber um parâmetro de modo de codificação 1407 e o circuito de processamento de fluxo de bits 1424 pode ser configurado para extrair o parâmetro de modo de codificação 1407 e fornecer o parâmetro de modo de codificação 1407 ao filtro passa-tudo 1430.
[0307] O gerador de sinais 1450 pode ser configurado para gerar sinais de áudio com base em um ou mais parâmetros de sinal medial codificado 1426 e no ICP
1408. Para exemplificar, o sintetizador medial 1452 pode ser configurado para gerar um sinal medial sintetizado 1470 com base nos parâmetros de sinal medial codificado 1426 (como, por exemplo, com base em um sinal medial codificado) e o sintetizador lateral 1456 pode ser configurado para gerar um sinal lateral sintetizado intermediário 1471 com base no sinal medial sintetizado 1470 e no ICP 1408, conforme descrito com referência à Figura 4. Em uma implementação específica, o detector de potência 1460 é configurado para detectar um nível de potência medial sintetizado 1462 com base no sinal medial sintetizado 1470, e o sintetizador lateral 1456 é configurado para gerar o sinal lateral sintetizado intermediário 1471 com base no sinal medial sintetizado 1470, no ICP 1408 e no nível de potência medial sintetizado 1462, conforme descrito com referência à Figura 4.
[0308] O filtro passa-tudo 1430 pode ser configurado para filtrar o sinal lateral sintetizado intermediário 1471 para gerar um sinal lateral sintetizado
1472. Por exemplo, o filtro passa-tudo 1430 pode ser configurado para efetuar ajuste de fase (como, por exemplo, fuzzing de fase, dispersão de fase, difusão de fase ou decorrelação de fase), reverberação e extensão estéreo. Para exemplificar, o filtro passa-tudo 1430 pode efetuar ajuste de fase ou desfocagem para sintetizar os efeitos da largura do estéreo estimada em um codificador (como, por exemplo, no lado de transmissão). Em algumas implementações, o filtro passa-tudo 1430 inclui filtros de ajuste de fase em cascata de múltiplos estágios (como, por exemplo, fuzzing de fase, dispersão de fase, difusão de fase ou decorrelação de fase). O filtro passa-tudo 1430 pode ser configurado para filtrar o sinal lateral sintetizado intermediário 1471 no domínio do tempo para gerar o sinal lateral sintetizado 1472. A efetuação de ajuste de fase no domínio do tempo no decodificador 1418 seguida por upmixing temporal e síntese em taxas de bits mais baixas podem auxiliar com balanceamento e podem aperfeiçoar o equilíbrio entre a eficiência da codificação de sinal e a ampliação da imagem estéreo. Tal balanceamento dos parâmetros de CP pode resultar em aperfeiçoamento de codificação tanto das gravações de música quanto fala a partir de múltiplos microfones. O filtro passa-tudo 1430 é referido como um filtro passa-tudo porque a resposta de frequência do filtro passa-tudo 1430 é (ou se aproxima) a unidade, de tal modo que a magnitude de um sinal filtrado é a mesma (ou aproximadamente a mesma) através de diferentes frequências. O filtro passa-tudo 1430 pode ter uma resposta de fase que varia com a frequência, de tal modo que uma fase do sinal filtrado varia através de diferentes frequências.
[0309] O filtro passa-tudo 1430 é configurado para reduzir a correlação (como, por exemplo, aumentar a decorrelação) entre o sinal lateral sintetizado 1472 e o sinal medial sintetizado 1470 por alteração da fase do sinal filtrado (como, por exemplo, do sinal lateral sintetizado 1472) em relação ao sinal de entrada (como, por exemplo, o sinal lateral sintetizado intermediário 1471), tal como ajuste ou desfocagem de fase, adição de reverberação e extensão de imagem estéreo. Para exemplificar, como o sinal lateral sintetizado intermediário 1471 é gerado a partir do sinal medial sintetizado 1470, o sinal lateral sintetizado intermediário 1471 e o sinal medial sintetizado 1470 podem ser altamente correlatos, o que pode resultar em sinais de áudio de saída que não apresentam diferenças espaciais. O filtro passa- tudo 1430 pode reduzir a correlação entre o sinal lateral sintetizado 1472 e o sinal medial sintetizado 1470 por alteração da fase do sinal lateral sintetizado 1472 em relação à fase do sinal lateral sintetizado intermediário 1471, o que pode aumentar a diferença espacial entre os sinais de áudio de saída, aperfeiçoando assim uma experiência de audição.
[0310] Em algumas implementações, o filtro passa-tudo 1430 inclui um estágio único. Em outras implementações, o filtro passa-tudo 1430 inclui múltiplos estágios acoplados em série. Para exemplificar, o filtro passa-tudo 1430 pode incluir um primeiro estágio, um segundo estágio, um terceiro estágio e um quarto estágio. Em outras implementações, o filtro passa-tudo 1430 inclui menos de quatro ou mais de quatro estágios. Os estágios podem ser acoplados em série (como, por exemplo, em cascata). Cada estágio dos estágios pode ser associado com um parâmetro de retardo que controla uma quantidade de retardo (como, por exemplo, ajuste de fase) fornecido pelo estágio e a um parâmetro de ganho que controla uma quantidade de ganho (como, por exemplo, ajuste de magnitude) fornecido pelo estágio. Por exemplo, o primeiro estágio pode ser associado com um primeiro parâmetro de retardo e um primeiro parâmetro de ganho, o segundo estágio pode ser associado com um segundo parâmetro de retardo e um segundo parâmetro de ganho, o terceiro estágio pode ser associado com um terceiro parâmetro de retardo e um terceiro parâmetro de ganho e o quarto estágio pode ser associado com um quarto parâmetro de retardo e um quarto parâmetro de ganho. Em algumas implementações, cada um dos estágios é fixo. Por exemplo, os valores dos parâmetros de retardo e os valores dos parâmetros de ganho podem ser configurados com valores iguais ou diferentes, tal como durante uma fase de configuração ou instalação do decodificador 1418. Em outras implementações, cada estágio dos estágios pode ser configurável individualmente. Por exemplo, cada estágio pode ser ativado (ou desativado) individualmente, um ou mais dos parâmetros associados com os múltiplos estágios podem ser configurados (ou ajustados) individualmente ou uma combinação deles. Por exemplo, um ou mais parâmetros podem ser configurados (ou ajustados) com base no ICP 1408, conforme aqui descrito adicionalmente.
[0311] Em uma implementação específica, o filtro passa-tudo 1430 inclui um filtro passa-tudo estacionário. Por exemplo, os parâmetros associados com o filtro passa-tudo 1430 podem ser configurados (ou ajustados) para valores fixos. Em outra implementação específica, o filtro passa-tudo 1430 inclui um filtro passa-tudo não estacionário. Por exemplo, os parâmetros associados com o filtro passa-tudo 1430 podem ser configurados (ou ajustados) para valores que se alteram ao longo do tempo.
[0312] Em uma implementação específica, o filtro passa-tudo 1430 pode ser configurado para filtrar o sinal lateral sintetizado intermediário 1471 com base adicionalmente no parâmetro de modo de codificação 1407. Por exemplo, um ou mais dos parâmetros associados com o filtro passa-tudo 1430 podem ser configurados (ou ajustados) com base em um valor de parâmetro de modo de codificação 1407, conforme aqui descrito adicionalmente. Conforme outro exemplo, um ou mais dos estágios do filtro passa-tudo 1430 podem ser ativados (ou desativados) com base no parâmetro de modo de codificação 1407, conforme aqui descrito adicionalmente.
[0313] Em uma implementação específica, um ou mais filtros 1468 são configurados para receber o sinal medial sintetizado 1470 e o sinal lateral sintetizado 1472 e para filtrar o sinal medial sintetizado 1470, o sinal lateral sintetizado 1472 ou ambos. Um ou mais filtros 1468 podem incluir um ou mais tipos de filtros. Por exemplo, um ou mais filtros 1468 podem incluir filtros de desacentuação, filtros passa-banda, filtros de FTT (ou transformadas), filtros IFFT (ou transformadas), filtros no domínio do tempo, filtros no domínio da frequência ou sub- banda, ou uma combinação deles. Em uma implementação específica, um ou mais filtros 1468 incluem um ou mais filtros fixos. Alternativamente, um ou mais filtros 1468 podem incluir um ou mais filtros adaptativos configurados para filtrar o sinal medial sintetizado 1470, o sinal lateral sintetizado 1472, ou ambos, com base em um ou mais coeficientes de filtro adaptativos que são recebidos a partir de outro dispositivo, conforme descrito com referência à Figura 4. Em uma implementação específica, um ou mais filtros 1468 incluem um filtro de desacentuação configurado para efetuar filtragem de desacentuação no sinal medial sintetizado 1470, no sinal lateral sintetizado 1472, ou ambos, e um filtro passa-alta de 50 Hz.
[0314] Em uma implementação específica, o ampliador de amostragem 1464 é configurado para efetuar aumento de amostragem do sinal medial sintetizado 1470 e no sinal lateral sintetizado 1472. Por exemplo, o ampliador de amostragem 1464 é configurado para efetuar aumento de amostragem do sinal medial sintetizado 1470 e no sinal lateral sintetizado 1472 a partir de uma taxa reduzida de amostragem (na qual o sinal medial sintetizado 1470 e o sinal lateral sintetizado 1472 são gerados) para uma taxa de aumento de amostragem (como, por exemplo, uma taxa de amostragem de entrada de sinais de áudio que são recebidos em um codificador e utilizados para gerar um ou mais parâmetros de fluxo de bits 1402). O aumento de amostragem do sinal medial sintetizado 1470 e do sinal lateral sintetizado 1472 permite a geração (como, por exemplo, pelo decodificador 1418) de sinais de áudio a uma taxa de amostragem de saída associada com a reprodução de sinais de áudio.
[0315] Em uma implementação específica, o supressor de descontinuidade 1466 pode ser configurado para reduzir (ou eliminar) uma descontinuidade entre um primeiro quadro do sinal lateral sintetizado 1472 e um segundo quadro de um segundo sinal lateral sintetizado que é gerado com base em um sinal lateral codificado recebido em um receptor (e fornecido ao decodificador 1418). Para exemplificar, para um primeiro conjunto de quadros, que inclui o primeiro quadro, outro dispositivo (que inclui um codificado) pode enviar o ICP 1408 e um ou mais parâmetros de fluxo de bits 1402 (como, por exemplo, um sinal medial codificado). Por exemplo, o primeiro conjunto de quadros pode ser associado com a determinação de que o decodificador 1418 deve predizer o sinal lateral sintetizado 1472 com base no ICP 1408. Para um segundo conjunto de quadros, que inclui o segundo quadro, o outro dispositivo pode enviar um sinal lateral codificado em vez do ICP 1408. Por exemplo, o segundo conjunto de quadros pode ser associado com a determinação de que o decodificador 1418 deve decodificar o sinal lateral codificado para gerar um segundo sinal lateral sintetizado.
Em alguns casos, uma descontinuidade pode existir entre o sinal lateral sintetizado 1472 e o sinal lateral decodificado (como, por exemplo, o primeiro quadro do sinal lateral sintetizado 1472 pode ser relativamente diferente em ganho, pitch ou alguma outra característica do segundo quadro do sinal lateral codificado.
Descontinuidades podem existir quando o decodificador 1418 comuta a partir da predição do sinal lateral sintetizado 1472 para decodificar um sinal lateral codificado recebido, ou quando o decodificador 1418 comuta a partir da decodificação do sinal lateral codificado recebido para predizer o sinal lateral sintetizado 1472.
[0316] Em algumas implementações, o Supressor de descontinuidade 1466 é configurado para reduzir descontinuidades quando comuta a partir da predição do sinal lateral sintetizado 1472 para decodificar para gerar o segundo sinal lateral sintetizado (como, por exemplo, o sinal lateral decodificado). Em uma implementação específica, o supressor de descontinuidade 1466 pode ser configurado para efetuar atenuação cruzada em um ou mais quadros do sinal lateral sintetizado 1472 com um ou mais quadros do segundo sinal lateral sintetizado.
Por exemplo, uma primeira janela deslizante que varia de um primeiro valor (como, por exemplo, 1) para um segundo valor (como, por exemplo, 0) pode ser aplicada a um ou mais quadros do sinal lateral sintetizado 1472 e uma segunda janela deslizante que varia do segundo o valor ao primeiro valor pode ser aplicada a um ou mais quadros do segundo sinal lateral sintetizado, e os quadros podem ser combinados para “afunilar” o sinal lateral sintetizado 1472 e “afinar” o segundo sinal lateral sintetizado.
Em outra implementação específica, o supressor de descontinuidade 1466 pode ser configurado para adiar a geração do segundo sinal lateral sintetizado para um ou mais quadros.
Por exemplo, oO supressor de descontinuidade 1466 pode identificar um ou mais quadros específicos para os quais uma descontinuidade deve ser evitada, e o supressor de descontinuidade 1466 pode predizer o sinal lateral sintetizado 1472 para um ou mais quadros específicos.
Conforme um exemplo, o supressor de descontinuidade 1466 pode aplicar o último parâmetro de ganho de predição intercanal recebido a um ou mais quadros específicos do sinal medial sintetizado 1470 para gerar o sinal lateral sintetizado 1472 para um ou mais quadros específicos. Conforme outro exemplo, o supressor de descontinuidade 1466 pode estimar um parâmetro de ganho de predição intercanal com base no sinal medial sintetizado 1470 e no segundo sinal lateral sintetizado (como, por exemplo, o sinal lateral decodificado) e o supressor de descontinuidade pode gerar o sinal lateral sintetizado 1472 utilizando o parâmetro de ganho de predição intercanal estimado. Em outra implementação específica, o decodificador 141 pode receber o ICP 140 e o sinal lateral codificado para um ou mais quadros, e o supressor de descontinuidade 1466 pode efetuar atenuação cruzada no sinal lateral sintetizado 1472 e no segundo sinal lateral sintetizado.
[0317] Em algumas implementações, O supressor de descontinuidade 1466 é configurado para reduzir descontinuidades quando alterna de decodificação para gerar o segundo sinal lateral sintetizado (como, por exemplo, oO sinal lateral decodificado) para predizer o sinal lateral sintetizado 1472. Em uma implementação específica, O supressor de descontinuidade 1466 pode ser configurado para gerar amostras espelhadas do segundo sinal sintetizado. As amostras espelhadas podem ser geradas em ordem inversa (como, por exemplo, uma primeira amostra espelhada pode ser espelhada a partir de uma última amostra do segundo sinal sintetizado, uma segunda amostra espelhada pode ser espelhada a partir de uma penúltima amostra do segundo sinal sintetizado, etc.). O supressor de descontinuidade 1466 pode ser adicionalmente configurado para efetuar atenuação cruzada nas amostras espelhadas com o sinal lateral sintetizado 1472 para um ou mais quadros. Assim, o supressor de descontinuidade 1466 pode ser configurado para reduzir (ou eliminar) descontinuidades através de quadros para os quais o método de gerar o sinal lateral no decodificador 1418 é alterado (como, por exemplo, de predição para decodificação ou de decodificação para predição), o que pode aperfeiçoar uma experiência de audição.
[0318] Em uma implementação específica, o decodificador 1418 é configurado adicionalmente para efetuar upmixing no sinal medial sintetizado 1470 e no sinal lateral sintetizado 1472 para gerar sinais de saída, conforme descrito com referência à Figura l1. Por exemplo, o decodificador 1418 pode ser configurado para gerar um primeiro sinal de áudio 1480 e um segundo sinal de áudio 482 com base no sinal medial sintetizado com aumento de amostragem 1470 e no sinal lateral sintetizado com aumento de amostragem 1472.
[0319] Durante a operação, o decodificador 1418 recebe um ou mais parâmetros de fluxo de bits 1402 (como, por exemplo, a partir de um receptor). Um ou mais parâmetros de fluxo de bits 1402 incluem (ou indicam) o ICP
1408. Em algumas implementações, um ou mais parâmetros de fluxo de bits 1402 também incluem ou são recebidos em adição ao parâmetro de modo de codificação 1407. O circuito de processamento de fluxo de bits 1424 pode processar um ou mais parâmetros de fluxo de bits 1402 e extrair diversos parâmetros. Por exemplo, o circuito de processamento de fluxo de bits 1424 pode extrair os parâmetros de sinal medial codificado 1426 a partir de um ou mais parâmetros de fluxo de bits 1402, e o circuito de processamento de fluxo de bits 1424 pode fornecer os parâmetros de sinal medial codificado 1426 ao gerador de sinais 1450 (como, por exemplo, ao sintetizador medial 1452). Conforme outro exemplo, o circuito de processamento de fluxo de bits 1424 pode extrair o ICP 1408 a partir de um ou mais parâmetros de fluxo de bits 1402, e o circuito de processamento de fluxo de bits 1424 pode fornecer o ICP 1408 ao gerador de sinais 1450 (como, por exemplo, ao sintetizador lateral 1456). Em uma implementação específica, oO circuito de processamento de fluxo de bits 1424 pode extrair o parâmetro de modo de codificação 1407 e fornecer o parâmetro de modo de codificação 1407 ao filtro passa-tudo
1430.
[0320] O sintetizador medial 1452 pode gerar o sinal medial sintetizado 1470 com base nos parâmetros de sinal medial codificado 1426. O sintetizador lateral 1456 pode gerar o sinal lateral sintetizado intermediário 1471 com base no sinal medial sintetizado 1470 e no ICP 1408. Como um exemplo não limitador, o sintetizador lateral 1456 pode gerar o sinal lateral sintetizado intermediário 1471 de acordo com técnicas descritas com referência à Figura 4.
[0321] O filtro passa-tudo 1430 pode filtrar o sinal lateral sintetizado intermediário 1471 para gerar o sinal lateral sintetizado 1472. Em algumas implementações, o sinal lateral sintetizado 1472 pode ser gerado de acordo com a seguinte equação: Side Mapped (z)=H,.r(z)Mid signal decoded(z)*ICP Gain onde Side Mapped(z) é o sinal lateral sintetizado 1472, ICP Gain é o ICP 1408, Mid signal decoded(z) é o sinal medial sintetizado 1470 e Hir(z) é a filtragem aplicada pelo filtro passa-tudo 1430.
[0322] Em algumas implementações, H.ar(z) pode ser determinado de acordo com a seguinte equação: Har (z) =I1;Hi (z) onde Hi(z) é a filtragem aplicada pelo estágio i do filtro passa-tudo 1430. Assim, a filtragem aplicada pelo filtro passa-tudo 1430 pode ser igual ao produto da filtragem aplicada por cada um dos estágios do filtro passa-alta 1430.
[0323] Em algumas implementações, Hi(z) pode ser determinado de acordo com a seguinte equação: —M, Hi(z) e onde g; é o parâmetro de ganho associado com o estágio i do filtro passa-tudo 1430 e M; é o parâmetro de retardo associado com o estágio i do filtro passa-tudo
1430.
[0324] Em algumas implementações, os valores de um ou mais parâmetros do filtro passa-tudo 1430 podem ser configurados com base no ICP 1408. Por exemplo, com a base no ICP 1408 sendo relativamente alta (como, por exemplo, satisfazendo um primeiro limite), um ou mais dos parâmetros podem ser configurados (ou ajustados) para valores que aumentam a quantidade de decorrelação fornecida pelo filtro passa-tudo 1430. Conforme outro exemplo, com a base no ICP 1408 sendo relativamente baixa (como, por exemplo, falhando em satisfazer um segundo limite), um ou mais dos parâmetros podem ser configurados (ou ajustados) para valores que diminuem a quantidade de decorrelação fornecida pelo filtro passa-tudo 1430. Em outras implementações, os valores dos parâmetros podem ser configurados ou ajustados de outra forma com base no ICP
1408.
[0325] Em uma implementação específica, um ou mais estágios do filtro passa-tudo 1430 podem ser ativados (ou desativados) com base no parâmetro de modo de codificação 1407. Por exemplo, cada um dos estágios pode ser ativado com base no parâmetro de modo de codificação 1407 indicando-se um modo de codificação de música (como, por exemplo, um modo de Codificador de Transformada (TCX)). Conforme outro exemplo, o segundo estágio e o quarto estágio podem ser desativados com base no parâmetro de modo de codificação 1407, indicando-se um modo de codificação de fala (como, por exemplo, um modo de codificador de predição linear excitada por código algébrico (ACELP)). Desativar um ou mais estágios pode reduzir o eco nos sinais de fala filtrados. Em algumas implementações, desativar um estágio específico do filtro passa-tudo 1430 pode incluir configurar o parâmetro de retardo correspondente e o parâmetro de ganho correspondente a um valor específico (como, por exemplo, 0). Em outras implementações, OS estágios podem ser desativados (ou ativados) por outras vias. Embora o parâmetro de modo de codificação 1407 seja descrito, em outras implementações, os estágios podem ser desativados (ou ativados) com base em outros parâmetros, como outros parâmetros indicativos de conteúdo de fala ou música.
[0326] Em algumas implementações, um ou mais filtros 1468 podem filtrar o sinal medial sintetizado 1470, o sinal lateral sintetizado 1472 ou ambos. Por exemplo, um ou mais filtros 1468 podem efetuar filtragem de desacentuação, filtragem passa-alta, ou ambas, no sinal medial sintetizado 1470, no sinal lateral sintetizado 1472, ou ambos. Em uma implementação específica, um ou mais filtros 1468 aplicam um filtro fixo ao sinal medial sintetizado 1470, ao sinal lateral sintetizado 1472, ou ambos. Em outra implementação específica, um ou mais filtros 1468 aplicam um filtro adaptativo ao sinal medial sintetizado 1470, ao sinal lateral sintetizado 1472, ou ambos.
[0327] Em algumas implementações, o ampliador de amostragem 1464 pode efetuar aumento de amostragem do sinal medial sintetizado 1470 e no sinal lateral sintetizado 1472. Por exemplo, o ampliador de amostragem 1464 pode efetuar aumento de amostragem do sinal medial sintetizado 1470 e do sinal lateral sintetizado 1472 a partir de uma taxa reduzida de amostragem (como, por exemplo, aproximadamente 0 - 6,4 kHz) para uma taxa de amostragem de saída. Após efetuar aumento de amostragem, o decodificador 1418 pode gerar o primeiro sinal de áudio 1480 e o segundo sinal de áudio 1482 com base no sinal medial sintetizado 1470 e no sinal lateral sintetizado
1472. Por exemplo, o decodificador 1418 pode efetuar upmixing para gerar o primeiro sinal de áudio 1480 e o segundo sinal de áudio 1482, conforme descrito com referência à Figura 1. O primeiro sinal de áudio 1480 e o segundo sinal de áudio 1482 podem ser enviados para um ou mais dispositivos de saída, tal como um ou mais alto- falantes. Em uma implementação específica, o primeiro sinal de áudio 1480 é um de um sinal de áudio esquerdo e de um sinal de áudio direito, e o segundo sinal de áudio 1482 é o outro do sinal de áudio esquerdo e do sinal de áudio direito. Em algumas implementações, o supressor de descontinuidade 1466 pode efetuar uma ou mais operações de redução de descontinuidade antes da geração do primeiro sinal de áudio 1480 e do segundo sinal de áudio 1482.
[0328] O decodificador 1418 da Figura 14 habilita a predição (como, por exemplo, o mapeamento) do sinal lateral sintetizado 1472 a partir do sinal medial sintetizado 1470 utilizando parâmetros de ganho de predição intercanal (como, por exemplo, o ICP 1408). Além disso, o decodificador 1418 reduz a correlação (como, por exemplo, aumenta a decorrelação) entre o sinal medial sintetizado 1470 e o sinal lateral sintetizado 1472, o que pode aumentar a diferença espacial entre o primeiro sinal de áudio 1480 e o segundo sinal de áudio 1482, o que pode aperfeiçoar uma experiência de audição.
[0329] A Figura 15 é um diagrama que mostra um segundo exemplo ilustrativo de um decodificador 1518 do sistema 1300 da Figura 13. Por exemplo, o decodificador 1518 pode incluir ou corresponder ao decodificador 1318 da Figura 13.
[0330] o decodificador 1518 pode incluir circuitos de processamento de fluxo de bits 1524, um gerador de sinais 1550 (que inclui um sintetizador medial 1552 e um sintetizador lateral 1556), um filtro passa-tudo 1530 e, opcionalmente, um detector de potência 1560. Em uma implementação específica, o filtro de passagem 1530 pode incluir um primeiro estágio associado com um primeiro parâmetro de retardo e um primeiro parâmetro de ganho, um segundo estágio associado com um segundo parâmetro de retardo e um segundo parâmetro de ganho, um terceiro estágio associado com um terceiro parâmetro de retardo e um terceiro parâmetro de ganho e um quarto estágio que é associado com um quarto parâmetro de retardo e um quarto parâmetro de ganho. O circuito de processamento de fluxo de bits 1524, o gerador de sinais 1550, o sintetizador medial 1552, o sintetizador lateral 1556, o detector de potência 1560 e o filtro passa-tudo 1530 podem efetuar operações semelhantes às descritas com referência ao circuito de processamento de fluxo de bits 1424, ao gerador de sinais 1450, ao sintetizador medial 1452, ao sintetizador lateral 1456, ao detector de potência 1460 e ao filtro passa-tudo 1430 da Figura 14, respectivamente. O decodificador 1518 também pode incluir um misturador de sinal lateral 1590. O misturador de sinal lateral 1590 pode ser configurado para misturar um sinal lateral sintetizado intermediário e um sinal lateral sintetizado filtrado com base em um parâmetro de correlação, conforme aqui descrito adicionalmente.
[0331] Durante a operação, o decodificador 1518 recebe um ou mais parâmetros de fluxo de bits 1502 (como, por exemplo, a partir de um receptor). Um ou mais parâmetros de fluxo de bits 1502 incluem (ou indicam) parâmetros de sinal medial codificado 1526, um parâmetro de ganho de predição intercanal (ICP) 1508 e um parâmetro de correlação 1509. O ICP 1508 pode representar uma relação entre os níveis de potência de um sinal medial e um sinal lateral em um codificador, e o parâmetro de correlação 1509 pode representar uma correlação entre o sinal medial e o sinal lateral no codificador. Em uma implementação específica, o ICP 1508 é determinado no codificador de acordo com a seguinte equação: ICP Gain=sqrt (Potência(side signal unquantized) /Potência(mid signal unquantized) onde ICP Gain é o ICP 1508, Potência(side signal unquantized), o nível de potência lateral do sinal lateral no codificador e Potência(mid signal unquantized) é o nível de potência medial do sinal medial no codificador. O parâmetro de correlação 1509 pode ser determinado no codificador de acordo com a seguinte equação: ICP correlation=|Side signal unquantized.
Mid signal unquantized| /Potência(mid signal unquantized) onde ICP Gain é o ICP 1508, |Side signal unquantized. Mid signal unquantized| é o produto escalar do sinal lateral e do sinal medial no codificador, e Potência(mid signal unquantized) é o nível de potência medial do sinal medial no codificador. Em outras implementações, o ICP 1508 e o parâmetro de correlação 1509 podem ser determinados com base em outros valores.
[0332] O circuito de processamento de fluxo de bits 1524 pode processar um ou mais parâmetros 1502 de fluxo de bits e extrair diversos parâmetros. Por exemplo, o circuito de processamento de fluxo de bits 1524 pode extrair os parâmetros de sinal medial codificado 1526 a partir de um ou mais parâmetros de fluxo de bits 1502, e o circuito de processamento de fluxo de bits 1524 pode fornecer os parâmetros de sinal medial codificado 1526 ao gerador de sinais 1550 (como, por exemplo, ao sintetizador medial 1552). Conforme outro exemplo, o circuito de processamento de fluxo de bits 1524 pode extrair o ICP 1508 a partir de um ou mais parâmetros de fluxo de bits 1502, e o circuito de processamento de fluxo de bits 1524 pode fornecer o ICP 1508 ao gerador de sinais 1550 (como, por exemplo, ao sintetizador lateral 1556). Conforme outro exemplo, o circuito de processamento de fluxo de bits 1524 pode extrair o parâmetro de correlação 1509 a partir de um ou mais parâmetros de fluxo de bits 1502, e o circuito de processamento de fluxo de bits 1524 pode fornecer o parâmetro de correlação 1509 para o misturador de sinal lateral 1590.
[0333] O sintetizador medial 1552 pode gerar um sinal medial sintetizado 1570 com base nos parâmetros de sinal medial codificado 1526. O sintetizador lateral 1556 pode gerar um sinal lateral sintetizado intermediário 1571 com base no sinal medial sintetizado 1570 e no ICP 1508 Como exemplo não limitador, o sintetizador lateral 1556 pode gerar o sinal lateral sintetizado intermediário 1571 de acordo com técnicas descritas com referência à Figura 4.
[0334] O filtro passa-tudo 1530 pode filtrar o sinal lateral sintetizado intermediário 1571 para gerar um sinal lateral sintetizado filtrado 1573. O filtro passa- tudo 1530 pode ser configurado para efetuar o ajuste de fase (como, por exemplo, fuzzing de fase, dispersão de fase, difusão de fase ou decorrelação de fase),
reverberação e extensão estéreo. Para exemplificar, O filtro passa-tudo 1530 pode efetuar ajuste de fase ou desfocagem para sintetizar os efeitos da largura estéreo estimada em um codificador (como, por exemplo, no lado de transmissão). Em algumas implementações, o filtro passa- tudo 1530 inclui filtros de ajuste de fase em cascata de múltiplos estágios (como, por exemplo, fuzzing de fase, dispersão de fase, difusão de fase ou decorrelação de fase). Para exemplificar, o filtro passa-tudo 1530 inclui um filtro de dispersão de fase que inclui um ou mais filtros de decorrelação estacionária, um ou mais filtros de decorrelação não estacionária, um ou mais filtros de reamostragem passa-tudo não linear ou uma combinação deles. O filtro passa-tudo 1530 pode filtrar o sinal lateral sintetizado intermediário 1571 conforme descrito com referência à Figura 14.
[0335] Em algumas implementações, os valores de um ou mais parâmetros do filtro passa-tudo 1530 podem ser configurados (ou ajustados) com base no ICP 1508, conforme descrito com referência à Figura l14. Em algumas implementações, os valores de um ou mais parâmetros do filtro passa-tudo 1530 podem ser configurados (ou ajustados) com base no parâmetro de correlação 1509, um ou mais dos estágios do filtro passa-tudo 1530 podem ser desativados (ou ativados) com base no parâmetro de correlação 1509, ou ambos. Por exemplo, se o parâmetro de correlação 1509 indicar uma correlação relativamente alta, um ou mais parâmetros podem ser diminuídos, um ou mais estágios podem ser desativados ou ambos, de tal modo que o sinal lateral sintetizado filtrado 1573 e o sinal medial sintetizado 1570 também tenham correlação relativamente alta. Conforme outro exemplo, se o parâmetro de correlação 1509 indicar uma correlação relativamente baixa, um ou mais parâmetros podem ser aumentados, um ou mais estágios podem ser ativados ou ambos, de tal modo que o sinal lateral sintetizado filtrado 1573 e o meio sintetizado o sinal 1570 também tenham correlação relativamente baixa. Além disso, um ou mais dos parâmetros podem ser configurados (ou ajustados), um ou mais dos estágios podem ser ativados (ou desativados), com base adicionalmente em um parâmetro de modo de codificação (ou outro parâmetro), conforme descrito com referência à Figura 14.
[0336] o sinal lateral sintetizado intermediário 1571 e o sinal lateral sintetizado filtrado 1573 podem ser fornecidos ao misturador de sinal lateral
1590. O misturador de sinal lateral 1590 pode misturar o sinal lateral sintetizado intermediário 1571 com o sinal lateral sintetizado filtrado 1573 com base no parâmetro de correlação 1509 para gerar um sinal lateral sintetizado
1572. Em implementações alternativas, o sinal medial sintetizado 1570 pode ser fornecido ao filtro passa-tudo 1530 para filtro passa-tudo para gerar um sinal medial quantificado filtrado passa-tudo (antes da aplicação do ICP 1508), e o misturador de sinal lateral 1590 pode receber o sinal medial sintetizado 1570, o sinal medial quantizado filtrado passa-tudo, o ICP 1508 e o parâmetro de correlação
1509. O misturador de sinal lateral 1590 pode escalar e misturar o sinal medial sintetizado 1570 e o sinal medial quantificado filtrado passa-tudo com base no ICP 1508 e no parâmetro de correlação 1509 para gerar o sinal lateral sintetizado 1572.
[0336] Em uma implementação específica, o misturador de sinal lateral 1590 pode gerar o sinal lateral sintetizado 1572 de acordo com a seguinte equação: Mapped side(z) = ICP Gain * [(ICP correlation) * mid quantized(z)+ (1-— ICP correlation) * Hap(z) *mid quantized(z)] onde Mapped side(z) é o sinal lateral sintetizado 1572, ICP Gain é o ICP 1508, ICP correlation é o parâmetro de correlação 1509, mid quantized(z) é o sinal medial sintetizado 1570 e Hiwr(Z) é a filtragem aplicada por filtro passa-tudo 1530. Como o ICP Gain*mid quantized(z) é igual ao sinal lateral sintetizado intermediário 1571, e o ICP- Gain*Har(Z)*mid quantized(z) é igual ao sinal lateral sintetizado filtrado 1573, o sinal lateral sintetizado 1572 também pode ser gerado de acordo com a seguinte equação: sinal lateral sintetizado 1572 = parâmetro de correlação 1509 * sinal lateral sintetizado intermediário 1571 + (1 - parâmetro de correlação 1509) * sinal lateral sintetizado filtrado 1573
[0338] Em outra implementação específica, o misturador de sinal lateral 1590 pode gerar o sinal lateral sintetizado 1572 de acordo com a seguinte equação: Mapped side(z) = [(ICP correlation) * mid quantized(z) + square root(ICP Gain*ICP Gain -ICP correlation* ICP correlation) * Har(z) *mid quantized(z)]
onde Mapped side(z) é o sinal lateral sintetizado 1572, ICP Gain é o ICP 1508, ICP correlation é o parâmetro de correlação 1509, mid quantized(z) é o sinal medial sintetizado 1570 e Hw(z7) é a filtragem aplicada pelo filtro passa-tudo 1530. Nesta equação, Har (2) *mid quantized(z) corresponde ao (como, por exemplo, representa) sinal medial quantizado filtrado passa-tudo anterior à aplicação de ICP.
[0339] Em outra implementação específica, oO misturador de sinal lateral 1590 pode gerar o sinal lateral sintetizado 1572 de acordo com a seguinte equação: Mapped side(z) = scale factorl * mid quantized(z) + scale factor2 * Ha(z) * mid quantized)z) onde scale factorl e scale factor2 são estimados no decodificador 1518 com base em ICP correlation e ICP Gain, de tal modo que as duas restrições a seguir sejam atendidas: 1.) a correlação cruzada entre Mapped side e mid quantized é a mesma que ICP correlation; e 2.) a razão das potências de Mapped side e de mid quantized é igual a ICP Gain'2. Os valores de scale factorl e scale factor2 podem ser resolvidos por diversos métodos analíticos ou iterativos ou outras alternativas. Em algumas implementações, scale factorl e scale factor2 podem ser processados adicionalmente antes de serem utilizados para gerar Mapped side.
[0340] Assim, uma quantidade do sinal lateral sintetizado filtrado 1573 e uma quantidade do sinal lateral sintetizado intermediário 1571 que são misturados podem ser baseadas no parâmetro de correlação 1509. Por exemplo, a quantidade do sinal lateral sintetizado filtrado 1573 pode ser aumentada (e a quantidade do sinal lateral sintetizado intermediário 1571 pode ser diminuída) com base em uma diminuição no parâmetro de correlação 1509. Conforme outro exemplo, a quantidade do sinal lateral sintetizado filtrado 1573 pode ser diminuída (e a quantidade do sinal lateral sintetizado intermediário 1571 pode ser aumentada) com base em um aumento no parâmetro de correlação 1509. Embora tanto a configuração do filtro passa-tudo 1530 baseada no parâmetro de correlação 1509 quanto os sinais de mistura com base no parâmetro de correlação 1509 tenham sido descritos, em outras implementações, apenas um da configuração do filtro passa-tudo 1530 ou da mistura dos sinais é efetuado.
[0341] O decodificador 1518 pode gerar sinais de áudio de saída com base no sinal medial sintetizado 1570 e no sinal lateral sintetizado 1572. Em algumas implementações, um ou mais filtros adicionais, aumento de amostragem, reduções de descontinuidade podem ser efetuados antes do upmixing para gerar os sinais de áudio de saída, conforme descrito adicionalmente com referência à Figura
14.
[0342] Assim, o decodificador 1518 da Figura é configurado para equiparar uma correlação entre um sinal lateral sintetizado e um sinal medial sintetizado a uma correlação entre um sinal medial e um sinal lateral em um codificador. Equiparar a correlação pode resultar na geração de sinais de saída com diferenças espaciais que correspondem substancialmente às diferenças espaciais entre os sinais de entrada recebidos no codificador.
[0343] A Figura 16 é um diagrama que mostra um terceiro exemplo ilustrativo de um decodificador 1618 do sistema 1300 da Figura 13. Por exemplo, o decodificador 1618 pode incluir ou corresponder ao decodificador 1318 da Figura 13.
[0344] O decodificador 1618 pode incluir circuitos de processamento de fluxo de bits 1624, um gerador de sinais 1650 (que inclui um sintetizador medial 1652 e um sintetizador lateral 1656), um filtro passa-tudo 1630 e, opcionalmente, um detector de potência 1660. Em algumas implementações, o filtro passa-tudo 1630 pode incluir um primeiro estágio que é associado com um primeiro parâmetro de retardo e um primeiro parâmetro de ganho, um segundo estágio que é associado com um segundo parâmetro de retardo e um segundo parâmetro de ganho, um terceiro estágio que é associado com um terceiro parâmetro de retardo e um terceiro parâmetro de ganho e um quarto estágio associado com um quarto parâmetro de retardo e um quarto parâmetro de ganho. O circuito de processamento de fluxo de bits 1624, o gerador de sinais 1650, o sintetizador medial 1652, o sintetizador lateral 1656, o detector de potência 1660 e o filtro passa-tudo 1630 podem efetuar operações semelhantes às descritas com referência ao circuito de processamento de fluxo de bits 1424, ao gerador de sinais 1450, ao sintetizador medial 1452, ao sintetizador lateral 1456, ao detector de potência 1460 e ao filtro passa-tudo 1430 da Figura 14, respectivamente. O decodificador 1618 também pode incluir um filtro/combinador
1692. O filtro/combinador 1692 pode incluir um ou mais filtros, um ou mais combinadores de sinal, uma combinação deles ou outros circuitos configurados para combinar sinais sintetizados através de múltiplas bandas de sinal para gerar sinais sintetizados, conforme aqui descrito adicionalmente.
[0345] Durante a operação, o decodificador 1618 recebe um ou mais parâmetros de fluxo de bits 1602 (como, por exemplo, a partir de um receptor). Um ou mais parâmetros de fluxo de bits 1602 incluem (ou indicam) parâmetros de sinal medial codificado 1626, um parâmetro de ganho de predição intercanal (ICP) 1608 e um segundo ICP
1609. O ICP 1608 pode representar uma relação entre os níveis de potência de um sinal medial e um sinal lateral em uma primeira banda de sinal em um codificador, e o segundo ICP 1609 pode representar uma relação entre os níveis de potência do sinal medial e o sinal lateral em uma segunda banda de sinal no codificador.
[0346] O circuito de processamento de fluxo de bits 1624 pode processar um ou mais parâmetros de fluxo de bits 1602 e extrair diversos parâmetros. Por exemplo, o circuito de processamento de fluxo de bits 1624 pode extrair os parâmetros de sinal medial codificado 1626 a partir de um ou mais parâmetros de fluxo de bits 1602, e o circuito de processamento de fluxo de bits 1624 pode fornecer os parâmetros de sinal medial codificado 1626 para o gerador de sinais 1650 (como, por exemplo, para oO sintetizador medial 1652). Conforme outro exemplo, o circuito de processamento de fluxo de bits 1624 pode extrair o ICP 1608 e o segundo ICP 1609 a partir de um ou mais parâmetros de fluxo de bits 1602, e o circuito de processamento de fluxo de bits 1624 pode fornecer o ICP
1608 e o segundo ICP 1609 ao gerador de sinais 1650 (como, por exemplo, para o sintetizador lateral 1656).
[0347] O sintetizador medial 1652 pode gerar um sinal medial sintetizado com base nos parâmetros de sinal medial codificado 1626. O gerador de sinais 1650 também pode incluir um ou mais filtros que filtram o sinal medial sintetizado em múltiplas bandas para gerar um sinal medial sintetizado de banda baixa 1670 e um sinal medial sintetizado de banda alta 1671. O sintetizador lateral 1656 pode gerar múltiplas bandas de sinais laterais sintetizados intermediários com base no sinal medial sintetizado de banda baixa 1670, no sinal medial sintetizado de banda alta 1671, no ICP 1608 e no segundo ICP 1609. Por exemplo, o sintetizador lateral 1656 pode gerar um sinal lateral sintetizado intermediário de banda baixa 1672 com base no sinal medial sintetizado de banda baixa 1670 e no ICP 1608. Conforme outro exemplo, o sintetizador lateral 1656 pode gerar um sinal lateral sintetizado intermediário de banda alta 1673 com base no sinal medial sintetizado de banda alta 1671 e no segundo ICP 1609.
[0348] O filtro passa-tudo 1630 pode filtrar o sinal lateral sintetizado intermediário de banda baixa 1672 e o sinal lateral sintetizado intermediário de banda alta 1673 para gerar um sinal lateral sintetizado de banda baixa 1674 e um sinal lateral sintetizado de banda alta 1675. Por exemplo, o filtro passa-tudo 1630 pode filtrar o sinal lateral sintetizado intermediário de banda baixa 1672 e o sinal lateral sintetizado de banda alta 1673, conforme descrito com referência à Figura 14. Embora os sinais sejam descritos como sendo filtrados em duas bandas (como, por exemplo, uma banda baixa e uma banda alta), tal descrição não pretende ser limitativa. Em outras implementações, os sinais podem ser filtrados dentro de diferentes bandas, tal como uma banda intermediária, ou dentro de mais que duas bandas. Além disso, conforme descrito com referência à Figura 14, o filtro passa-tudo 1630 pode efetuar ajuste de fase (como, por exemplo, fuzzing de fase, dispersão de fase, difusão de fase ou decorrelação de fase), reverberação e extensão estéreo. Para exemplificar, o filtro passa-tudo 1630 pode efetuar ajuste de fase ou desfocagem para sintetizar os efeitos da largura do estéreo estimada em um codificador (como, por exemplo, no lado de transmissão). Em algumas implementações, o filtro passa- tudo 1630 inclui filtros de ajuste de fase em cascata de múltiplos estágios (como, por exemplo, fuzzing de fase, dispersão de fase, difusão de fase ou decorrelação de fase).
[0349] Em algumas implementações, os valores dos parâmetros associados com o filtro passa-tudo 1630, os estados (como, por exemplo, ativado ou desativado) dos estágios do filtro passa-tudo 1630, ou ambos, podem ser os mesmos para filtragem tanto do sinal lateral sintetizado intermediário de banda baixa 1672 quanto do sinal lateral sintetizado intermediário de banda alta 1673. Em outras implementações, os valores dos parâmetros, dos estados (como, por exemplo, ativado ou desativado) dos estágios, ou ambos, podem ser diferentes ao filtrar-se o sinal lateral sintetizado intermediário de banda baixa 1672, em comparação com a filtragem do sinal lateral sintetizado intermediário de banda alta 1673. Por exemplo, os parâmetros podem ser configurados para um primeiro conjunto de valores antes da filtragem do sinal lateral sintetizado intermediário de banda baixa 1672. Após o sinal lateral sintetizado intermediário de banda baixa 1672 ser filtrado, um ou mais dos valores dos parâmetros podem ser ajustados e o sinal lateral sintetizado intermediário de banda alta 1673 pode ser filtrado com base no valores do parâmetro ajustado. Conforme outro exemplo, o número de estágios do filtro passa-tudo 1630 que são habilitados para filtrar o sinal lateral sintetizado intermediário de banda baixa 1672 pode ser diferente do número de estágios que são habilitados para filtrar o sinal lateral sintetizado intermediário de banda alta 1673. Em algumas implementações, o filtro passa-tudo 1630 pode adicionalmente ser configurado com base em parâmetros de correlação que correspondem a cada uma das bandas de sinal, conforme descrito com referência à Figura 15. Assim, a quantidade de decorrelação aplicada pode ser diferente em diferentes bandas de sinal.
[0350] O sinal medial sintetizado de banda baixa 1670, o sinal medial sintetizado de banda alta 1671, o sinal lateral sintetizado de banda baixa 1674 e o sinal lateral sintetizado de banda alta 1675 podem ser fornecidos ao filtro/combinador 1692. O filtro/o combinador 1692 pode combinar múltiplas bandas de sinal para gerar sinais sintetizados. Por exemplo, o filtro/combinador 1692 pode combinar o sinal medial sintetizado de banda baixa 1670 e o sinal medial sintetizado de banda alta 1671 para gerar um sinal medial sintetizado 1676. Conforme outro exemplo, o filtro/combinador 1692 pode combinar o sinal lateral sintetizado de banda baixa 1674 e o sinal lateral sintetizado de banda alta 1675 para gerar um sinal lateral sintetizado 1677.
[0351] O decodificador 1618 pode gerar sinais de saída de áudio com base no sinal medial sintetizado 1676 e no sinal lateral sintetizado 1677. Em algumas implementações, um ou mais de filtragem, aumento de amostragem e redução de descontinuidade adicionais podem ser efetuados antes do upmixing para gerar sinais de áudio de saída, conforme descrito adicionalmente com referência à Figura 14.
[0352] O decodificador 1618 da Figura 16 habilita a predição (como, por exemplo, o mapeamento) do sinal lateral sintetizado 1677 a partir do sinal medial sintetizado 1676 utilizando múltiplos parâmetros de ganho de predição intercanal (como, por exemplo, o ICP 1608 e o segundo ICP 1609) para diferentes bandas. Além disso, o decodificador 1618 reduz a correlação (como, por exemplo, aumenta a decorrelação) entre o sinal medial sintetizado 1676 e o sinal lateral sintetizado 1677 para diferentes quantidades em diferentes bandas, o que pode resultar em geração de sinais de áudio de saída que têm variação de diversidade espacial através de diferentes frequências.
[0353] A Figura 17 é um fluxograma que mostra um método específico 1700 de codificação de sinais de áudio. Em uma implementação específica, o método 1700 pode ser efetuado no primeiro do primeiro dispositivo 204 da Figura 2 ou do codificador 314 da Figura 3.
[0354] O método 1700 inclui gerar, em um primeiro dispositivo, um sinal medial com base em um primeiro sinal de áudio e um segundo sinal de áudio, em
1702. Por exemplo, o primeiro dispositivo pode incluir ou corresponder ao primeiro dispositivo 204 da Figura 2 ou um dispositivo que inclua o codificador 314 da Figura 3, O sinal medial pode incluir ou corresponder ao sinal medial 211 da Figura 2 ou ao sinal medial 311 da Figura 3, oO primeiro sinal de áudio pode incluir ou corresponder ao primeiro sinal de áudio 230 da Figura 2 ou ao primeiro sinal de áudio 330 da Figura 3, e o segundo sinal de áudio pode incluir ou corresponder ao segundo sinal de áudio 232 da Figura 2 ou ao segundo sinal de áudio 332 da Figura 3. Em uma implementação específica, oO primeiro dispositivo inclui ou corresponde a um dispositivo móvel. Em outra implementação específica, o primeiro dispositivo inclui ou corresponde a uma estação base.
[0355] O método 1700 inclui gerar um sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio, em 1704. Por exemplo, o sinal lateral pode incluir ou corresponder ao sinal lateral 213 da Figura 2 ou ao sinal lateral 313 da Figura 3.
[0356] O método 1700 inclui gerar um parâmetro de ganho de predição intercanal com base no sinal medial e no sinal lateral, em 1706. Por exemplo, o parâmetro de ganho de predição intercanal pode incluir ou corresponder ao ICP 208 da Figura 2 ou ao ICP 308 da Figura 3.
[0357] O método 1700 inclui adicionalmente enviar o parâmetro de ganho de predição intercanal e um sinal de áudio codificado para um segundo dispositivo, em
1708. Por exemplo, o ICP 208 pode ser incluído em um ou mais parâmetros de fluxo de bits 202 (que são indicativos de um sinal medial codificado) e pode ser enviado para o segundo dispositivo 206, conforme descrito com referência à Figura 2.
[0358] Em uma implementação específica, o método 1700 inclui adicionalmente redução de amostragem do primeiro sinal de áudio para gerar um primeiro sinal de áudio com amostragem reduzida e a redução de amostragem do segundo sinal de áudio para gerar um segundo sinal de áudio com amostragem reduzida. O parâmetro de ganho de predição intercanal pode ser baseado no primeiro sinal de áudio com amostragem reduzida e no segundo sinal de áudio com amostragem reduzida. Por exemplo, o redutor de amostras 340 pode efetuar redução de amostragem do sinal medial 311 e do sinal lateral 313 antes da geração do ICP 308 pelo gerador de ICP 320, conforme descrito com referência à Figura 3. Em uma implementação alternativa, o parâmetro de ganho de predição intercanal é determinado em uma taxa de amostragem de entrada associada com o primeiro sinal de áudio e com o segundo sinal de áudio. Por exemplo, em algumas implementações, o redutor de amostras 340 não é incluído no codificador 314 e o ICP 308 é gerado na taxa de amostragem de entrada, conforme descrito adicionalmente com referência à Figura 3.
[0359] Em outra implementação específica, oO método 1700 inclui adicionalmente efetuar uma operação de suavização no parâmetro de ganho de predição intercanal antes de enviar o parâmetro de ganho de predição intercanal para o segundo dispositivo. Por exemplo, o suavizador de ICP 350 pode suavizar o ICP 308 com base no fator de suavização 352. Em uma implementação específica, a operação de suavização é baseada em um fator de suavização fixo. Em uma implementação alternativa, a operação de suavização é baseada em um fator de suavização adaptativo. O fator de suavização adaptativo pode ser baseado em uma potência de sinal do sinal medial. Por exemplo, o fator de suavização 352 pode ser baseado em potência de sinal de longo prazo e potência de sinal de curto prazo, conforme descrito com referência à Figura 3. Alternativamente, o fator de suavização adaptativo pode ser baseado em um parâmetro de harmonização associado com o sinal medial. Por exemplo, o fator de suavização 352 pode ser baseado em um parâmetro de harmonização, conforme descrito com referência à Figura 3.
[0360] Em outra implementação específica, O método 1700 inclui processar o sinal medial para gerar um sinal medial de banda baixa e um sinal medial de banda alta e processar o sinal lateral para gerar um sinal lateral de banda baixa e um sinal lateral de banda alta. Por exemplo, um ou mais filtros 331 podem processar o sinal medial 311 para gerar o sinal medial de banda baixa 333 e o sinal medial de banda alta 334 e um ou mais filtros 331 podem processar o sinal lateral 313 para gerar o sinal lateral de banda baixa 336 e o sinal lateral de banda alta 338, conforme descrito com referência à Figura 3. O método 1700 inclui gerar o parâmetro de ganho de predição intercanal com base no sinal medial de banda baixa e no sinal lateral de banda baixa e gerar um segundo parâmetro de ganho de predição intercanal com base no sinal medial de banda alta e sinal lateral de banda alta. Por exemplo, o gerador de ICP 320 pode gerar o ICP 308 com base no sinal medial de banda baixa 333 e no sinal lateral de banda baixa 336, e o gerador de ICP 320 pode gerar o segundo ICP 354 com base no sinal medial de banda alta 334 e no sinal lateral de banda alta 338, conforme descrito com referência à Figura 3. O método 1700 inclui adicionalmente enviar o segundo parâmetro de ganho de predição intercanal com o parâmetro de ganho de predição intercanal e o sinal de áudio codificado para o segundo dispositivo. Por exemplo, o ICP 308 e o segundo ICP 354 podem ser incluídos (ou indicados por) um ou mais parâmetros de fluxo de bits 302 que são enviados pelo codificador 314, conforme descrito com referência à Figura 3.
[0361] Em uma implementação específica, o método 1700 inclui adicionalmente gerar um parâmetro de correlação com base no sinal medial e no sinal lateral e enviar o parâmetro de correlação com o parâmetro de ganho de predição intercanal e o sinal de áudio codificado para o segundo dispositivo. Por exemplo, o parâmetro de correlação pode incluir ou corresponder ao parâmetro de correlação 1509 da Figura 15. O parâmetro de ganho de predição intercanal pode ser baseado em uma razão de um nível de potência do sinal lateral e de um nível de potência do sinal medial, e o parâmetro de correlação pode ser baseado em uma razão do nível de potência do sinal medial e de um produto escalar do sinal medial e lateral. Por exemplo, o parâmetro de correlação pode ser determinado conforme descrito com referência à Figura 15.
[0362] Assim, o método 1700 habilita a geração de um parâmetro de ganho de predição intercanal para quadros de um sinal de áudio que é associado com uma determinação para predizer um sinal lateral em um decodificador. Enviar o parâmetro de ganho de predição intercanal pode conservar recursos de rede em comparação com o envio de um quadro de um sinal lateral codificado. Alternativamente, um ou mais bits que, de outra forma, seriam utilizados para enviar o sinal lateral codificado podem, em vez disso, ser redirecionados (como, por exemplo, utilizados) para enviar bits adicionais de um sinal medial codificado, o que pode aperfeiçoar a qualidade de um sinal medial sintetizado e de um sinal lateral predito em um decodificador.
[0363] A Figura 18 é um fluxograma que mostra um método específico 1800 de decodificação de sinais de áudio. Em uma implementação específica, o método 1800 pode ser efetuado no segundo dispositivo 206 da Figura 2 ou no decodificador 418 da Figura 4.
[0364] o método 1800 inclui receber um parâmetro de ganho de predição intercanal e um sinal de áudio codificado em um primeiro dispositivo a partir de um segundo dispositivo, em 1802. O sinal de áudio codificado pode incluir um sinal medial codificado. Por exemplo, o primeiro dispositivo pode incluir ou corresponder ao segundo dispositivo 206 da Figura 2 ou a um dispositivo que inclui o decodificador 418 da Figura 4, o parâmetro de ganho de predição intercanal pode incluir ou corresponder ao ICP 208 da Figura 2 ou ao ICP 408 da Figura 4, e o sinal de áudio codificado pode ser indicado pelos um ou mais parâmetros de fluxo de bits 202 da Figura 2 ou um ou mais parâmetros de fluxo de bits 402 da Figura 4. Em uma implementação específica, o sinal de áudio codificado inclui ou corresponde ao sinal medial codificado 225 da Figura 2.
[0365] O método 1800 inclui gerar, no primeiro dispositivo, um sinal medial sintetizado com base no sinal medial codificado, em 1804. Por exemplo, o sinal medial sintetizado pode incluir ou corresponder ao sinal medial sintetizado 252 da Figura 2 ou ao sinal medial sintetizado 470 da Figura 4.
[0366] O método 1800 inclui adicionalmente gerar um sinal lateral sintetizado com base no sinal medial sintetizado e no parâmetro de ganho de predição intercanal, em 1806. Por exemplo, o sinal lateral sintetizado pode incluir ou corresponder ao sinal lateral sintetizado 254 da Figura 2 ou ao sinal lateral sintetizado 472 da Figura 4.
[0367] Em uma implementação específica, o método 1800 inclui adicionalmente aplicar um filtro fixo ao sinal medial sintetizado antes de gerar o sinal lateral sintetizado. Por exemplo, um ou mais filtros 454 podem incluir um filtro fixo que é aplicado ao sinal medial sintetizado 470 antes da geração do sinal lateral sintetizado 472, conforme descrito com referência à Figura
4. Em outra implementação específica, o método 1800 inclui adicionalmente aplicar um filtro fixo ao sinal lateral sintetizado. Por exemplo, um ou mais filtros 458 podem incluir um filtro fixo que é aplicado ao sinal lateral sintetizado 472, conforme descrito com referência à Figura
4. Em outra implementação específica, o método 1800 inclui aplicar um filtro adaptativo ao sinal medial sintetizado antes da geração do sinal lateral sintetizado. os coeficientes de filtro adaptativo associados com o filtro adaptativo podem ser recebidos a partir do segundo dispositivo. Por exemplo, um ou mais filtros 454 podem incluir um filtro adaptativo que é aplicado ao sinal medial sintetizado 470 com base em um ou mais coeficientes 406 antes da geração do sinal lateral sintetizado 472, conforme descrito com referência à Figura 4. Em outra implementação específica, o método 1800 inclui aplicar um filtro adaptativo ao sinal lateral sintetizado. Os coeficientes de filtro adaptativo associados com o filtro adaptativo podem ser recebidos a partir do segundo dispositivo. Por exemplo, um ou mais filtros 458 podem incluir um filtro adaptativo que é aplicado ao sinal lateral sintetizado 472 com base em um ou mais coeficientes 406, conforme descrito com referência à Figura 4.
[0368] Em outra implementação específica, O método 1800 inclui receber um segundo parâmetro de ganho de predição intercanal a partir do segundo dispositivo, processar o sinal medial sintetizado para gerar um sinal medial sintetizado de banda baixa e processar o sinal medial sintetizado para gerar um sinal de alta banda sintetizada sinal medial. Por exemplo, um ou mais filtros 454 podem processar o sinal medial sintetizado 470 para gerar o sinal medial sintetizado de banda baixa 474 e o sinal medial sintetizado de banda alta 473. Gerar o sinal lateral sintetizado inclui gerar um sinal lateral sintetizado de banda baixa com base no sinal medial sintetizado de banda baixa e no parâmetro de ganho de predição intercanal, gerar um sinal lateral sintetizado de banda alta com base no sinal medial sintetizado de banda alta e no segundo parâmetro de ganho de predição intercanal e processar o sinal lateral sintetizado de banda baixa e o sinal lateral sintetizado de banda alta para gerar o sinal lateral sintetizado. Por exemplo, o sintetizador lateral 456 pode gerar o sinal lateral sintetizado de banda baixa 476 com base no sinal medial sintetizado de banda baixa 474 e no ICP 408, e o sintetizador lateral 456 pode gerar o sinal lateral sintetizado de banda alta 475 com base no sinal medial sintetizado de banda alta 473 e em um segundo ICP. Um ou mais filtros 458 podem processar o sinal lateral sintetizado de banda baixa 476 e o sinal lateral sintetizado de banda alta 475 para gerar o sinal lateral sintetizado 472, conforme descrito com referência à Figura 4,
[0369] Assim, o método 1800 habilita a predição (como, por exemplo, o mapeamento) de um sinal lateral sintetizado em um decodificador utilizando-se um sinal medial codificado (ou parâmetros indicativos do mesmo) e um parâmetro de ganho de predição intercanal. Receber o parâmetro de ganho de predição intercanal pode conservar recursos de rede em comparação com a recepção de um quadro de um sinal lateral codificado a partir de um codificador. Alternativamente, um ou mais bits recebidos que, de outra forma, seriam utilizados para enviar o sinal lateral codificado ao decodificador podem, em vez disso, ser redirecionados (como, por exemplo, utilizados) para enviar bits adicionais de um sinal medial codificado ao decodificador, o que pode aperfeiçoar a qualidade de um sinal medial sintetizado e do sinal lateral sintetizado no decodificador.
[0370] Com referência à Figura 19, um método de operação é mostrado e geralmente designado 1900. O método 1900 pode ser efetuado por pelo menos um do gerador de midside 148, do alinhador intercanal 108, do gerador de sinais 116, do transmissor 110, do codificador 114, do primeiro dispositivo 104, do sistema 100 da Figura 1, do gerador de sinais 216, do transmissor 210, do codificador 214, do primeiro dispositivo 204 ou do sistema 200 da Figura 2.
[0371] O método 1900 inclui gerar, em um dispositivo, um sinal medial com base em um primeiro sinal de áudio e um segundo sinal de áudio, em 1902. Por exemplo, o gerador de midside 148 da Figura l pode gerar o sinal medial 111 com base no primeiro sinal de áudio 130 e no segundo sinal de áudio 132, conforme descrito com referência às Figuras 1 e 8.
[0372] O método 1900 também inclui gerar, no dispositivo, um sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio, em 1904. Por exemplo, Oo gerador de midside 148 da Figura l pode gerar o sinal lateral 113 com base no primeiro sinal de áudio 130 e no segundo sinal de áudio 132, conforme descrito com referência às Figuras 1 e 8.
[0373] O método 1900 inclui adicionalmente determinar, no dispositivo, uma pluralidade de parâmetros com base no primeiro sinal de áudio, no segundo sinal de áudio ou em ambos, em 1906. Por exemplo, o alinhador intercanal 108 da Figura 1 pode determinar os parâmetros de ICA 107 com base no primeiro sinal de áudio 130, no segundo sinal de áudio 132 ou em ambos, conforme descrito com referência às Figuras 1 e 7.
[0374] O método 1900 também inclui determinar, com base na pluralidade de parâmetros, se o sinal lateral deve ser codificado para transmissão, em 1908. Por exemplo, o seletor de CP 122 da Figura 1 pode determinar o parâmetro de CP 109 com base nos parâmetros de ICA 107, conforme descrito com referência às Figuras 1 e 9. O parâmetro de CP 109 pode indicar se o sinal lateral 113 deve ser codificado para transmissão.
[0375] O método 1900 inclui adicionalmente gerar, no dispositivo, um sinal medial codificado que corresponde ao sinal medial, em 1910. Por exemplo, o gerador de sinais 116 da Figura 1 pode gerar o sinal medial codificado 121 que corresponde ao sinal medial 111 conforme descrito com referência à Figura 1.
[0376] O método 1900 também inclui gerar, no dispositivo, um sinal lateral codificado que corresponde ao sinal lateral em resposta à determinação de que o sinal lateral deve ser codificado para transmissão em 1912. Por exemplo, o gerador de sinais 116 da Figura 1 pode gerar o sinal lateral codificado 123 em resposta à determinação de que o parâmetro de CP 109 indica que o sinal lateral 113 deve ser codificado para transmissão.
[0377] O método 1900 inclui adicionalmente transmitir, a partir do dispositivo, parâmetros de fluxo de bits que correspondem ao sinal medial codificado, ao sinal lateral codificado ou a ambos, em 1914. Por exemplo, o transmissor 110 da Figura 1 pode transmitir os parâmetros de fluxo de bits 102 que correspondem ao sinal medial codificado 121, ao sinal lateral codificado 123 ou a ambos.
[0378] O método 1900 habilita assim determinar dinamicamente, com base nos parâmetros de ICA 107, se o sinal lateral codificado 123 deve ser transmitido. O seletor de CP 122 pode determinar que o sinal lateral 113 não deve ser codificado para transmissão quando os parâmetros de ICA 107 indicam que é provável que um sinal sintetizado predito seja estreitamente aproximado do sinal lateral 113. O codificador 114 pode assim conservar os recursos de rede, evitando transmitir o sinal lateral codificado 123 quando o sinal sintetizado predito provavelmente tiver pouco ou nenhum impacto perceptível nos sinais de saída correspondentes.
[0379] Com referência à Figura 20, um método de operação é mostrado e geralmente designado como 2000. O método 2000 pode ser efetuado por pelo menos um dos receptores 160, do determinador de CP 172, do gerador de parâmetros de upmix 176, do gerador de sinais 174, do decodificador 118, do segundo dispositivo 106, do sistema 100 da Figura 1, do gerador de sinais 274, do decodificador 218 ou do segundo dispositivo 206 da Figura 2.
[0380] O método 2000 inclui receber, em um dispositivo, parâmetros de fluxo de bits que correspondem a pelo menos um sinal medial codificado, em 2002. Por exemplo, o receptor 160 da Figura l1 pode receber os parâmetros de fluxo de bits 102 correspondentes pelo menos ao sinal medial codificado 121.
[0381] O método 2000 também inclui gerar, no dispositivo, um sinal medial sintetizado com base nos parâmetros de fluxo de bits, em 2004. Por exemplo, oO gerador de sinais 174 da Figura 1 pode gerar o sinal medial sintetizado 171 com base nos parâmetros de fluxo de bits 102, conforme descrito com referência à Figura 1.
[0382] O método 2000 inclui adicionalmente determinar, no dispositivo, se os parâmetros de fluxo de bits correspondem a um sinal lateral codificado, em 2006 Por exemplo, o determinador de CP 172 da Figura 1 pode gerar o parâmetro de CP 179, conforme descrito adicionalmente com referência às Figuras 1 e 10. O parâmetro de CP 179 pode indicar se os parâmetros de fluxo de bits 102 correspondem ao sinal lateral codificado 123.
[0383] O método 2000 inclui, em resposta à determinação de que os parâmetros de fluxo de bits correspondem ao sinal lateral codificado, em 2006, gerar um sinal lateral sintetizado com base nos parâmetros de fluxo de bits, em 2008. Por exemplo, o gerador de sinais 174 da Figura 1 pode, em resposta à determinação de que os parâmetros de fluxo de bits 102 correspondem ao sinal lateral codificado 123, gerar o sinal lateral sintetizado 173 com base nos parâmetros de fluxo de bits 102, conforme descrito com referência à Figura 1.
[0384] O método 2000 inclui, em resposta à determinação de que os parâmetros de fluxo de bits não correspondem ao sinal lateral codificado, em 2006, gerar um sinal lateral sintetizado com base, pelo menos em parte, no sinal medial sintetizado, em 2010. Por exemplo, o sinal gerador 174 da Figura 1 pode, em resposta à determinação de que os parâmetros de fluxo de bits 102 não correspondem ao sinal lateral codificado 123, gerar o sinal lateral sintetizado 173 com base em pelo menos em parte no sinal medial sintetizado 171, conforme descrito com referência à Figura 1. O método 2000 habilita, assim, que fo) decodificador 118 efetue predição dinamicamente do sinal lateral sintetizado 173 com base no sinal medial sintetizado 171 ou decodifique o sinal lateral sintetizado 173 com base nos parâmetros de fluxo de bits 102.
[0385] Com referência à Figura 21, um método de operação é mostrado e geralmente designado 2100. O método 2100 pode ser efetuado por pelo menos um do gerador de midside 148, do alinhador intercanal 108, do gerador de sinais 116, do transmissor 110, do codificador 114, do primeiro dispositivo 104, do sistema 100 da Figura 1, do gerador de sinais 216, do transmissor 210, do codificador 214, do primeiro dispositivo 204 ou do sistema 200 da Figura 2.
[0386] O método 2100 inclui gerar, em um dispositivo, um parâmetro de downmix que tem um primeiro valor em resposta à determinação de que um parâmetro de predição ou codificação indica que um sinal lateral deve ser codificado para transmissão, em 2102. Por exemplo, o gerador de parâmetros de downmix 802 da Figura 8 pode gerar o parâmetro de downmix 803 que tem o valor de parâmetro de downmix 807 (como, por exemplo, o primeiro valor) em resposta à determinação de que o parâmetro de CP 809 indica que o sinal lateral 113 deve ser codificado para transmissão, conforme descrito com referência à Figura 8. O valor de parâmetro de downmix 807 pode ser baseado em uma métrica de potência, uma métrica de correlação ou ambas. A métrica de potência, a métrica de correlação ou ambas,
podem ser baseadas no sinal de referência 103 e no sinal alvo ajustado 105.
[0387] O método 2100 também inclui gerar, no dispositivo, o parâmetro de downmix que tem um segundo valor com base, pelo menos em parte, na determinação de que o parâmetro de predição ou codificação indicam que o sinal lateral não deve ser codificado para transmissão em 2104. Por exemplo, o gerador de parâmetros de downmix 802 da Figura 8 pode gerar o parâmetro de downmix 803 que tem o valor de parâmetro de downmix 805 (como, por exemplo, O segundo valor) em resposta à determinação de que o parâmetro de CP 809 indica que o sinal lateral 113 não deve ser codificado para transmissão, conforme descrito com referência à Figura 8. O valor de parâmetro de downmix 805 pode ser baseado em um valor de parâmetro predefinido de downmix (como, por exemplo, 0,5), no valor de parâmetro de downmix 807 ou em ambos, conforme descrito com referência à Figura 8.
[0388] O método 2100 inclui adicionalmente gerar, no dispositivo, um sinal medial com base no primeiro sinal de áudio, no segundo sinal de áudio e no parâmetro de downmix, em 2106. Por exemplo, o gerador de midside 148 da Figura 1 pode gerar o sinal medial 111 com base no primeiro sinal de áudio 130, no segundo sinal de áudio 132 e no parâmetro de downmix 115, conforme descrito com referência às Figuras 1 e 8.
[0389] O método 2100 também inclui gerar, no dispositivo, um sinal medial codificado que corresponde ao sinal medial, em 2108. Por exemplo, o gerador de sinais 116 da Figura 1 pode gerar o sinal medial codificado 121 que corresponde ao sinal medial 111, conforme descrito com referência à Figura 1.
[0390] O método 2100 inclui adicionalmente transmitir, a partir do dispositivo, parâmetros de fluxo de bits que correspondem pelo menos ao sinal medial codificado, em 2110. Por exemplo, o transmissor 110 da Figura 1 pode transmitir os parâmetros de fluxo de bits 102 que correspondem pelo menos ao sinal medial codificado 121.
[0391] o método 2100 habilita, assim, configurar dinamicamente o parâmetro de downmix 115 para o valor de parâmetro de downmix 805 ou o valor de parâmetro de downmix 807 com base em se o sinal lateral 113 deve ser codificado para transmissão. O valor de parâmetro de downmix 805 pode reduzir a potência do sinal lateral 113. Um sinal lateral predito sintetizado pode ser mais estreitamente aproximado do sinal lateral 113 com potência reduzida.
[0392] Com referência à Figura 22, um método de operação é mostrado e geralmente designado 2200. O método 2200 pode ser efetuado por pelo menos um do receptor 160, do determinador de CP 172, do gerador de parâmetros de upmix 176, do gerador de sinais 174, do decodificador 118, do segundo dispositivo 106, do sistema 100 da Figura 1, do gerador de sinais 274, do decodificador 218 ou do segundo dispositivo 206 da Figura 2.
[0393] O método 2200 inclui receber, em um dispositivo, parâmetros de fluxo de bits que correspondem a pelo menos um sinal medial codificado, em 2202. Por exemplo, o receptor 160 da Figura l1 pode receber os parâmetros de fluxo de bits 102 que correspondem pelo menos ao sinal medial codificado 121.
[0394] O método 2200 também inclui gerar, no dispositivo, um sinal medial sintetizado com base nos parâmetros de fluxo de bits, em 2204. Por exemplo, O gerador de sinais 174 da Figura 1 pode gerar o sinal medial sintetizado 171 com base nos parâmetros de fluxo de bits 102, conforme descrito com referência à Figura 1.
[0395] O método 2200 inclui adicionalmente determinar, no dispositivo, se os parâmetros de fluxo de bits correspondem a um sinal lateral codificado, em 2206 Por exemplo, o determinador de CP 172 da Figura l1 pode gerar o parâmetro de CP 179 indicando se os parâmetros de fluxo de bits 102 correspondem ao sinal lateral codificado 123, conforme descrito com referência às Figuras 1 e 10.
[0396] O método 2200 também inclui gerar, no dispositivo, um parâmetro de upmix com um primeiro valor em resposta à determinação de que os parâmetros de fluxo de bits correspondem ao sinal lateral codificado, em 2208. Por exemplo, o gerador de parâmetros de upmix 176 pode gerar o parâmetro de upmix 175 que tem o valor de parâmetro de downmix 807 (como, por exemplo, o primeiro valor) em resposta à determinação de que o parâmetro de CP 179 indica que os parâmetros de fluxo de bits 102 correspondem ao sinal lateral codificado 123, conforme descrito com referência às Figuras l1 e 11. O valor de parâmetro de downmix 807 pode ser baseado no parâmetro de downmix 115 recebido a partir do primeiro dispositivo 104, conforme descrito com referência às Figuras 1 e 11.
[0397] O método 2200 inclui adicionalmente gerar, no dispositivo, o parâmetro de upmix que tem um segundo valor com base, pelo menos em parte, na determinação de que os parâmetros de fluxo de bits não correspondem ao sinal lateral codificado em 2210. Por exemplo, o gerador de parâmetros de upmix 176 pode gerar o parâmetro de upmix 175 que tem o valor de parâmetro de downmix 805 (como, por exemplo, o segundo valor) com base, pelo menos em parte, na determinação de que o parâmetro de CP 179 indica que os parâmetros de fluxo de bits 102 não correspondem ao sinal lateral codificado 123, conforme descrito em referência às Figuras 1 e 11. O valor de parâmetro de downmix 805 pode ser baseado, pelo menos em parte, em um valor de parâmetro predefinido (como, por exemplo, 0,5), conforme descrito com referência às Figuras 8 ell.
[0398] O método 2200 também inclui gerar, no dispositivo, um sinal de saída com base pelo menos no sinal medial sintetizado e no parâmetro de upmix, em 2212. Por exemplo, o gerador de sinais 174 da Figura l1 pode gerar o primeiro sinal de saída 126, o segundo sinal de saída 128, ou ambos, com base pelo menos no sinal medial sintetizado 171 e no parâmetro de upmix 175, conforme descrito com referência à Figura 1
[0399] O método 2200, com efeito, habilita que o decodificador 118 determine o parâmetro de upmix 175 com base no parâmetro de CP 179. Quando o parâmetro de CP 179 indica que os parâmetros de fluxo de bits 102 não correspondem ao sinal lateral codificado 123, o decodificador 118 pode determinar o parâmetro de upmix 175 independentemente de receber o parâmetro de downmix 115 a partir do codificador 114. Os recursos de rede (como, por exemplo, largura de banda) podem ser conservados quando oO parâmetro de downmix 115 não é transmitido. Em uma implementação específica, os bits que teriam sido utilizados para transmitir o parâmetro de downmix 115 podem ser redirecionados para representar os parâmetros de fluxo de bits 102 ou outros parâmetros. Os sinais de saída com base nos bits redirecionados podem ter melhor qualidade de áudio, como, por exemplo, os sinais de saída podem ser mais estreitamente aproximados do primeiro sinal de áudio 130, do segundo sinal de áudio 132 ou de ambos.
[0400] A Figura 23 é um fluxograma que mostra um método específico de decodificação de sinais de áudio. Em uma implementação específica, o método 2300 pode ser efetuado no segundo dispositivo 1306 da Figura 13, no decodificador 1418 da Figura 14, no decodificador 1518 da Figura 15, ou no decodificador 1618 da Figura 16.
[0401] O método 2300 pode incluir receber um parâmetro de ganho de predição intercanal e um sinal de áudio codificado em um primeiro dispositivo a partir de um segundo dispositivo, em 2302. Por exemplo, o parâmetro de ganho de predição intercanal pode incluir ou corresponder ao ICP 1308 da Figura 13, ao ICP 1408 da Figura 14, ao ICP 1508 da Figura 15, ou ao ICP 1608 da Figura 16, o sinal de áudio codificado pode incluir ou corresponder a um ou mais parâmetros de fluxo de bits 1302 da Figura 13, a um ou mais parâmetros de fluxo de bits 1402 da Figura 14, a um ou mais parâmetros de fluxo de bits 1502 da Figura 15, ou à um ou mais parâmetros de fluxo de bits 1602 da Figura 16, o primeiro dispositivo pode incluir ou corresponder ao primeiro dispositivo 1304 da Figura 13, e o segundo dispositivo pode incluir ou corresponder ao segundo dispositivo 1306 da Figura 13, a um dispositivo que inclui o decodificador 1418 da Figura 14, a um dispositivo que inclui o decodificador 1518 da Figura 15, ou a um dispositivo que inclui o decodificador 1618 da Figura 16. O sinal de áudio codificado pode incluir um sinal medial codificado.
[0402] O método 2300 pode incluir gerar, no primeiro dispositivo, um sinal medial sintetizado com base no sinal medial codificado, em 2304. Por exemplo, o sinal medial sintetizado pode incluir ou corresponder ao sinal medial sintetizado 1352 da Figura 13, ao sinal medial sintetizado 1470 da Figura 14, ao sinal medial sintetizado 1570 da Figura 15, ou ao sinal medial sintetizado 1676 da Figura 16.
[0403] O método 2300 pode incluir gerar um sinal lateral sintetizado intermediário com base no sinal medial sintetizado e no parâmetro de ganho de predição intercanal, em 2306. Por exemplo, o sinal lateral sintetizado intermediário pode incluir ou corresponder ao sinal lateral sintetizado intermediário 1354 de Figura 13, ao sinal lateral sintetizado intermediário 1471 da Figura 14, ou ao sinal lateral sintetizado intermediário 1571 da Figura 15.
[0404] Oo método 2300 pode adicionalmente incluir filtrar o sinal lateral sintetizado intermediário para gerar um sinal lateral sintetizado, em 2308. Por exemplo, o sinal lateral sintetizado pode incluir ou corresponder ao sinal lateral sintetizado 1355 da Figura 13, ao sinal lateral sintetizado 1472 da Figura 14, ao sinal lateral sintetizado 1572 da Figura 15, ou ao sinal lateral sintetizado 1677 da Figura 16.
[0405] Em uma implementação específica, a filtragem pode ser efetuada por um filtro passa-tudo, tal como o filtro 1375 da Figura 13, o filtro passa-tudo 1430 da Figura 14, o filtro passa-tudo 1530 da Figura 15, ou o filtro passa-tudo 1630 da Figura 16. O método 2300 pode adicionalmente incluir configurar um valor de pelo menos um parâmetro do filtro passa-tudo com base no parâmetro de ganho de predição intercanal. Por exemplo, os valores de um ou mais dos parâmetros associados com o filtro passa-tudo 1430 podem ser configurados com base no ICP 1408, conforme descrito com referência à Figura 14. O pelo menos um parâmetro pode incluir um parâmetro de retardo, um parâmetro de ganho ou ambos.
[0406] Em uma implementação específica, o filtro passa-tudo inclui múltiplos estágios. Por exemplo, o filtro passa-tudo pode incluir múltiplos estágios, conforme descrito com referência às Figuras 14-16. O método 2300 pode incluir receber um parâmetro de modo de codificação no primeiro dispositivo a partir do segundo dispositivo e ativar cada um dos múltiplos estágios do filtro passa-tudo com base no parâmetro de modo de codificação que indica um modo de codificação de música. Por exemplo, cada um dos múltiplos estágios pode ser ativado com base no parâmetro de modo de codificação 1407, que indica um modo de codificação de música, conforme descrito com referência à Figura 14. O método 2300 pode adicionalmente incluir a desativação de pelo menos um estágio do filtro passa-tudo com base no parâmetro de modo de codificação que indica um modo de codificação de fala. Por exemplo, um ou mais dos múltiplos estágios podem ser desativados com base no parâmetro de modo de codificação 1407, que indica um modo de codificação de fala, conforme descrito com referência à Figura 14.
[0407] Em outra implementação específica, oO método 2300 pode incluir receber um segundo parâmetro de ganho de predição intercanal no primeiro dispositivo a partir do segundo dispositivo e processar o sinal medial sintetizado para gerar um sinal medial sintetizado de banda baixa e um sinal medial sintetizado de banda alta. Por exemplo, o segundo ICP 1609 e o ICP 1608 podem ser recebidos no decodificador 1618 e um sinal medial sintetizado pode ser processado para gerar o sinal medial sintetizado de banda baixa 1670 e o sinal medial sintetizado de banda alta 1671, conforme descrito com referência a Figura 16. Gerar o sinal lateral sintetizado intermediário pode incluir gerar um sinal lateral sintetizado intermediário de banda baixa com base no sinal medial sintetizado de banda baixa e no parâmetro de ganho de predição intercanal e gerar um sinal lateral sintetizado intermediário de banda alta com base no alto sinal medial sintetizado por banda e no segundo parâmetro de ganho de predição intercanal. Por exemplo, o sinal lateral sintetizado intermediário de banda baixa 1672 pode ser gerado com base no sinal medial sintetizado de banda baixa 1670 e no ICP 1608, e o sinal lateral sintetizado intermediário de banda alta 1673 pode ser gerado com base no sinal sintetizado de banda alta sinal medial 1671 e no segundo ICP 1609. O método 2300 pode incluir filtrar o sinal lateral sintetizado intermediário de banda baixa utilizando-se o filtro passa-tudo para gerar um primeiro sinal lateral sintetizado e ajustar pelo menos um parâmetro de pelo menos um dos estágios múltiplos do filtro passa- tudo. Por exemplo, um ou mais dos parâmetros do filtro passa-tudo 1630 podem ser ajustados após a geração do sinal lateral sintetizado de banda baixa 1674, conforme descrito com referência à Figura 16. O método 2300 pode adicionalmente incluir filtrar o sinal lateral sintetizado intermediário de banda alta utilizando-se o filtro passa- tudo para gerar um segundo sinal lateral sintetizado e combinar o primeiro sinal lateral sintetizado e o segundo sinal lateral sintetizado para gerar o sinal lateral sintetizado. Por exemplo, o sinal lateral sintetizado de banda alta 1675 pode ser gerado filtrando-se o sinal lateral sintetizado intermediário de banda alta 1673 utilizando-se o os valores de parâmetros ajustados, conforme descrito com referência à Figura 16.
[0408] Em outra implementação específica, filtrar o sinal lateral sintetizado intermediário utilizando-se o filtro passa-tudo gera um sinal lateral sintetizado intermediário filtrado. Nesta implementação, o método 2300 inclui receber um parâmetro de correlação no primeiro dispositivo a partir do segundo dispositivo e misturar, com base no parâmetro de correlação, o sinal lateral sintetizado intermediário com o sinal lateral sintetizado intermediário filtrado para gerar o sinal lateral sintetizado. Por exemplo, o sinal lateral sintetizado intermediário 1571 e o sinal lateral sintetizado filtrado 1573 podem ser misturados no misturador de sinal lateral 1590 com base no parâmetro de correlação 1509, conforme descrito com referência à Figura
15. Uma quantidade do sinal lateral sintetizado intermediário filtrado que é misturado com o sinal lateral sintetizado intermediário pode ser aumentada com base em uma diminuição no parâmetro de correlação, conforme descrito com referência à Figura 15.
[0409] O método 2300 da Figura 23 habilita a predição (como, por exemplo, o mapeamento) de um sinal lateral sintetizado a partir de um sinal medial sintetizado utilizando-se parâmetros de ganho de predição intercanal em um decodificador. Além disso, o método 2300 reduz a correlação (como, por exemplo, aumenta a decorrelação) entre o sinal medial sintetizado e o sinal lateral sintetizado, o que pode aumentar a diferença espacial entre o primeiro sinal de áudio e o segundo sinal de áudio, o que pode aperfeiçoar uma experiência de audição.
[0410] Com referência à Figura 24, é retratado, e geralmente designado 2400, um diagrama de blocos de um exemplo ilustrativo específico de um dispositivo (como, por exemplo, um dispositivo de comunicação sem fio). Sob diversos aspectos, o dispositivo 2400 pode ter menos ou mais componentes do que mostrado na Figura 24. Sob um aspecto ilustrativo, o dispositivo 2400 pode corresponder ao primeiro dispositivo 104, ao segundo dispositivo 106 da Figura l1, ao primeiro dispositivo 204, ao segundo dispositivo 206 da Figura 2, ao primeiro dispositivo 1304, ao segundo dispositivo 1306 da Figura 13,
ou a uma combinação deles. Sob um aspecto ilustrativo, o dispositivo 2400 pode efetuar uma ou mais operações descritas com referência aos sistemas e métodos das Figuras 1-23.
[0411] Sob um aspecto específico, o dispositivo 2400 inclui um processador 2406 (como, por exemplo, uma unidade central de processamento (CPU)). O dispositivo 2400 pode incluir um ou mais processadores 2410 adicionais (como, por exemplo, um ou mais processadores de sinal digital (DSPs)). Os processadores 2410 podem incluir um codificador-decodificador de meios (como, por exemplo, fala e música) (CODEC) 2408 e um cancelador de eco 2412. O CODEC de meios 2408 pode incluir um decodificador 2418, um codificador 2414 ou ambos. O codificador 2414 pode incluir pelo menos um do codificador 114 da Figura 1, do codificador 214 da Figura 2, do codificador 314 da Figura 3, ou do codificador 1314 da Figura 13. O decodificador 2418 pode incluir pelo menos um do decodificador 118 da Figura 1, do decodificador 218 da Figura 2, do decodificador 418 da Figura 4, do decodificador 1318 da Figura 13, do decodificador 1418 da Figura 14, do decodificador 1518 da Figura 15, ou do decodificador 1618 da Figura 16.
[0412] O codificador 2414 pode incluir pelo menos um do alinhador intercanal 108, do seletor de CP 122, do gerador de midside 148, de um gerador de sinais 2416 ou do gerador de ICP 220. O gerador de sinais 2416 pode incluir pelo menos um do gerador de sinais 116 da Figura 1, do gerador de sinais 216 da Figura 2, do gerador de sinais
316 da Figura 3, do gerador de sinais 450 da Figura 4, Ou do gerador de sinais 1316 da Figura 13.
[0413] O decodificador 2418 pode incluir pelo menos um do determinador de CP 172, do gerador de parâmetros de upmix 176, do filtro 1375 ou um do gerador de sinais 2474. O gerador de sinais 2474 pode incluir pelo menos um do gerador de sinais 174 da Figura 1, do gerador de sinais 274 da Figura 2, do gerador de sinais 450 da Figura 4, do gerador de sinais 1374 da Figura 13, do gerador de sinais 1450 da Figura 14, do gerador de sinais 1550 da Figura 15, ou do gerador de sinais 1650 da Figura
16.
[0414] O dispositivo 2400 pode incluir uma memória 2453 e um CODEC 2434. Embora o CODEC de meios 2408 seja mostrado como um componente dos processadores 2410 (como, por exemplo, circuitos dedicados e/ou código de programação executável), sob outros aspectos, um ou mais componentes do CODEC de meios 2408, tal como O decodificador 2418, o codificador 2414, ou ambos, podem ser incluídos no processador 2406, no CODEC 2434, em outro componente de processamento ou uma combinação deles.
[0415] O dispositivo 2400 pode incluir um transceptor 2440 acoplado a uma antena 2442. O transceptor 2440 pode incluir um receptor 2461, um transmissor 2411 ou ambos. O receptor 2461 pode incluir pelo menos um do receptor 160 da Figura 1, do receptor 260 da Figura 2, ou do receptor 1360 da Figura 13. O transmissor 2411 pode incluir pelo menos um do transmissor 110 da Figura 1, do transmissor 210 da Figura 2, ou do transmissor 1310 da Figura 13.
[0416] O dispositivo 2400 pode incluir um exibidor 2428 acoplado a um controlador de exibição 2426. Um ou mais alto-falantes 2448 podem ser acoplados ao CODEC
2434. Um ou mais microfones 2446 podem ser acoplados, por meio de uma ou mais interfaces de entrada 2413, ao CODEC
2434. As interfaces de entrada 2413 podem incluir as interfaces de entrada 112 da Figura l1, as interfaces de entrada 212 da Figura 2, ou as interfaces de entrada 1312 da Figura 13.
[0417] Sob um aspecto específico, os alto- falantes 2448 podem incluir pelo menos um do primeiro alto- falante 142, do segundo alto-falante 144 da Figura 1, do primeiro alto-falante 242 ou do segundo alto-falante 244 da Figura 2. Sob um aspecto específico, os microfones 2446 podem incluir pelo menos um do primeiro microfone 146, do segundo microfone 147 da Figura l1, do primeiro microfone 246 ou do segundo microfone 248 da Figura 2. O CODEC 2434 pode incluir um conversor digital-para-analógico (DAC) 2402 e um conversor analógico-para-digital (ADC) 2404.
[0418] A memória 2453 pode incluir instruções 2460 executáveis pelo processador 2406, pelos processadores 2410, pelo CODEC 2434, outra unidade de processamento do dispositivo 2400, ou uma combinação deles, para efetuar uma ou mais operações descritas com referência às Figuras 1-23. A memória 2453 pode armazenar um ou mais sinais, um ou mais parâmetros, um ou mais limites, um ou mais indicadores ou uma combinação deles, descritos com referência às Figuras 1-23.
[0419] Um ou mais componentes do dispositivo 2400 podem ser implementados por meio de hardware dedicado
(como, por exemplo, circuitos), por um processador que executa instruções para efetuar uma ou mais tarefas, ou uma combinação delas.
Por exemplo, a memória 2453 ou um ou mais componentes do processador 2406, dos processadores 2410 e/ou do CODEC 2434 podem ser um dispositivo de memória (como, por exemplo, um dispositivo de armazenamento passível de leitura por computador), tal como uma memória de acesso aleatório (RAM), memória de acesso aleatório magneto-resistiva (MRAM), uma MRAM com transferência de torque giratório (STT-MRAM), uma memória flash, uma memória exclusiva de leitura (ROM), uma memória exclusiva de leitura programável (PROM) , uma memória exclusiva de leitura programável apagável (EPROM), uma memória exclusiva de leitura programável eletricamente apagável (EEPROM), registradores, disco rígido, um disco removível ou uma memória exclusiva de leitura em disco compacto (CD-ROM). O dispositivo de memória pode incluir (como, por exemplo, armazenar) instruções (como, por exemplo, as instruções 2460) que, quando executadas por um computador (como, por exemplo, um processador no CODEC 2434, o processador 2406 e/ou os processadores 2410), podem fazer com que oO computador execute uma ou mais das operações descritas com referência às Figuras 1-23. Conforme um exemplo, a memória 2453 ou um ou mais componentes do processador 2406, os processadores 2410 e/ou o CODEC 2434 podem ser um meio passível de leitura por computador não transitório que inclui instruções (como, por exemplo, as instruções 2460) que, quando executadas por um computador (como, por exemplo, um processador no CODEC 2434, o processador 2406 e/ou os processadores 2410), fazem com que o computador efetue uma ou mais operações descritas com referência às Figuras 1-23.
[0420] Sob um aspecto específico, o dispositivo 2400 pode ser incluído em um dispositivo de sistema em pacote ou sistema em chip (como, por exemplo, um modem de estação móvel (MSM) ) 2422. Sob um aspecto específico, o processador 2406, os processadores 2410, o controlador de exibição 2426, a memória 2453, o CODEC 2434 e o transceptor 2440 são incluídos em um dispositivo de sistema em pacote ou sistema em chip 2422. Sob um aspecto específico, um dispositivo de entrada 2430, tal como uma tela sensível ao toque e/ou teclado e uma fonte de alimentação 2444 são acoplados a um dispositivo de sistema em chip 2422. Além do mais, sob um aspecto específico, conforme mostrado na Figura 24, o exibidor 2428, o dispositivo de entrada 2430, os alto-falantes 2448, os microfones 2446, a antena 2442 e a fonte de alimentação 2444 são externos ao dispositivo de sistema em chip 2422. Contudo, cada uma do exibidor 2428, da entrada o dispositivo 2430, dos alto-falantes 2448, dos microfones 2446, da antena 2442 e da fonte de alimentação 2444 podem ser acoplados a um componente do dispositivo de sistema em chip 2422, tal como uma interface ou um controlador.
[0421] O dispositivo 2400 pode incluir um telefone sem fio, um dispositivo de comunicação móvel, um dispositivo móvel, um telefone móvel, um telefone inteligente, um telefone celular, um computador laptop, um computador desktop, um computador, um computador tablet, um decodificador, um assistente digital pessoal (PDA), um dispositivo de exibição, uma televisão, um console de jogos, um tocador de música, um rádio, um tocador de vídeo, uma unidade de entretenimento, um dispositivo de comunicação, uma unidade de dados de localização fixa, um tocador de mídia pessoal, um tocador de vídeo digital, um tocador de disco de vídeo digital (DVD), um sintonizador, uma câmera, um dispositivo de navegação, um sistema de decodificador, um sistema de codificador ou qualquer combinação deles.
[0422] Sob um aspecto específico, um ou mais componentes dos sistemas descritos com referência às Figuras 1-23 e ao dispositivo 2400 podem ser integrados em um sistema ou aparelho de decodificação (como, por exemplo, um dispositivo eletrônico, um CODEC ou um processador), em um sistema ou aparelho de codificação, ou ambos. Sob outros aspectos, um ou mais componentes dos sistemas descritos com referência às Figuras 1-23 e o dispositivo 2400 podem ser integrados a um dispositivo móvel, um telefone sem fio, um computador tablet, um computador desktop, um laptop, um decodificador, um tocador de música, um tocador de vídeo, uma unidade de entretenimento, uma televisão, um console de jogos, um dispositivo de navegação, um dispositivo de comunicação, um assistente digital pessoal (PDA), uma unidade de dados de localização fixa, um tocador de meios pessoal ou outro tipo de dispositivo.
[0423] Deve-se observar que diversas funções efetuadas por um ou mais componentes dos sistemas descritos com referência às Figuras 1-23 e o dispositivo 2400 são descritos como sendo efetuados por determinados componentes ou módulos.
Esta divisão de componentes e módulos é apenas para ilustração. Sob um aspecto alternativo, uma função efetuada por um componente ou módulo específico pode ser dividida dentre múltiplos componentes ou módulos. Além disso, sob um aspecto alternativo, dois ou mais componentes ou módulos descritos com referência às Figuras 1-23 podem ser integrados em um único componente ou módulo. Cada componente ou módulo descrito com referência às Figuras 1- 23 pode ser implementado utilizando-se hardware (como, por exemplo, um dispositivo de arranjo de portas programável no campo (FPGA), um circuito integrado específico de aplicativo (ASIC), um DSP, um controlador etc.), software (como, por exemplo, instruções executáveis por um processador) ou qualquer combinação deles.
[0424] Em conjunto com os aspectos descritos um aparelho inclui meios para gerar um sinal medial com base em um primeiro sinal de áudio e um segundo sinal de áudio e um sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio. Por exemplo, os meios para gerar o sinal medial e o sinal lateral podem incluir o gerador de sinais 116, o codificador 114 ou o primeiro dispositivo 104 da Figura l, o gerador de sinais 216, o codificador 214 ou o primeiro dispositivo 204 da Figura 2, o gerador de sinais 316 ou o codificador 314 da Figura 3, O gerador de sinais 2416, o codificador 2414 ou o processador 2410 da Figura 24, uma ou mais estruturas, dispositivos ou circuitos configurados para gerar um sinal medial com base em um primeiro sinal de áudio e um segundo sinal de áudio e um sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio, ou uma combinação deles.
[0425] O aparelho inclui meios para gerar um parâmetro de ganho de predição intercanal com base no sinal medial e no sinal lateral. Por exemplo, os meios para gerar o parâmetro de ganho de predição intercanal podem incluir o gerador de ICP 220, o codificador 214 ou o primeiro dispositivo 204 da Figura 2, o gerador de ICP 320 ou o codificador 314 da Figura 3, oO gerador de ICP 220, o codificador 2414 ou o processador 2410 da Figura 24, uma ou mais estruturas, dispositivos ou circuitos configurados para gerar o parâmetro de ganho de predição intercanal com base no sinal medial e no sinal lateral, ou uma combinação deles.
[0426] O aparelho inclui adicionalmente meios para enviar o parâmetro de ganho de predição intercanal e um sinal de áudio codificado para um segundo dispositivo. Por exemplo, os meios para gerar o sinal medial e o sinal lateral podem incluir o transmissor 110 ou o primeiro dispositivo 104 da Figura 1, o transmissor 210 ou o primeiro dispositivo 204 da Figura 2, o transmissor 2410, o transceptor 2440 ou a antena 2442 da Figura 24, uma ou mais estruturas, dispositivos ou circuitos configurados para enviar o parâmetro de ganho de predição intercanal e o sinal de áudio codificado para o segundo dispositivo, ou uma combinação deles.
[0427] Em conjunto com os aspectos descritos um aparelho inclui meios para receber um parâmetro de ganho de predição intercanal e um sinal de áudio codificado em um primeiro dispositivo a partir de um segundo dispositivo. Por exemplo, os meios para receber podem incluir o receptor 160 ou o segundo dispositivo 106 da Figura l, o receptor
260 ou o segundo dispositivo 206 da Figura 2, oO receptor 2461, o transceptor 2440 ou a antena 2442 da Figura 24, uma ou mais estruturas, dispositivos ou circuitos configurados para enviar o parâmetro de ganho de predição intercanal e o sinal de áudio codificado para o segundo dispositivo, ou uma combinação deles. O sinal de áudio codificado inclui um sinal medial codificado.
[0428] O aparelho inclui meios para gerar um sinal medial sintetizado com base no sinal medial codificado. Por exemplo, os meios para gerar o sinal medial sintetizado podem incluir o gerador de sinais 174, oO decodificador 118 ou o segundo dispositivo 106 da Figura 1, o gerador de sinais 274, o decodificador 218 ou o segundo dispositivo 206 da Figura 2, Oo gerador de sinais 450, o sintetizador medial 452 ou o decodificador 418 da Figura 4, o gerador de sinais 2474, o decodificador 2418 ou o processador 2410 da Figura 24, uma ou mais estruturas, dispositivos ou circuitos configurados para gerar o sinal medial sintetizado com base no sinal medial codificado ou em uma combinação deles.
[0429] O aparelho inclui adicionalmente meios para gerar um sinal lateral sintetizado com base no sinal medial sintetizado e no parâmetro de ganho de predição intercanal. Por exemplo, os meios para gerar o sinal lateral sintetizado podem incluir o gerador de sinais 174, o decodificador 118 ou o segundo dispositivo 106 da Figura l1, o gerador de sinais 274, o decodificador 218 ou o segundo dispositivo 206 da Figura 2, o gerador de sinais 450, o sintetizador lateral 456 ou o decodificador 418 da Figura 4, o gerador de sinais 2474, o decodificador 2418 ou o processador 2410 da Figura 24, uma ou mais estruturas, dispositivos ou circuitos configurados para gerar o sinal medial sintetizado com base no sinal medial codificado ou em uma combinação deles.
[0430] Em conjunto com os aspectos descritos um aparelho inclui meios para gerar uma pluralidade de parâmetros com base em um primeiro sinal de áudio, em um segundo sinal de áudio ou ambos. Por exemplo, os meios para gerar a pluralidade de parâmetros podem incluir o alinhador intercanal 108, o gerador de midside 148, o codificador 114, o primeiro dispositivo 104, o sistema 100 da Figura 1, o gerador de GICP 612 da Figura 6, o gerador de parâmetros de downmix 802, o gerador de parâmetros 806 da Figura 8, o codificador 2414, o CODEC de meios 2408, os processadores 2410, o dispositivo 2400, um ou mais dispositivos configurados para gerar a pluralidade de parâmetros (como, por exemplo, um processador que executa instruções que são armazenadas em um dispositivo de armazenamento passível de leitura por computador) ou uma combinação deles.
[0431] O aparelho também inclui meios para determinar se um sinal lateral deve ser codificado para transmissão. Por exemplo, os meios para determinar se um sinal lateral deve ser codificado para transmissão podem incluir o seletor de CP 122, o codificador 114, o primeiro dispositivo 104, o sistema 100 da Figura 1, o codificador 2414, o CODEC de meios 2408, os processadores 2410, o dispositivo 2400, um ou mais dispositivos configurados para determinar se o sinal lateral deve ser codificado para transmissão (como, por exemplo, um processador que executa instruções que são armazenadas em um dispositivo de armazenamento passível de leitura computador) ou uma combinação deles. A determinação pode ser baseada na pluralidade de parâmetros (como, por exemplo, os parâmetros de ICA 107, no parâmetro de downmix 515, o GICP 601, nos parâmetros outros 810 ou em uma combinação deles).
[0432] O aparelho inclui adicionalmente meios para gerar um sinal medial e o sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio. Por exemplo, os meios para gerar o sinal medial e o sinal lateral podem incluir o gerador de midside 148, o codificador 114, o primeiro dispositivo 104, o sistema 100 da Figura 1, o codificador 2414, o CODEC de meios 2408, os processadores 2410, o dispositivo 2400, um ou mais dispositivos configurados para gerar o sinal medial e o sinal lateral (como, por exemplo, um processador que executa instruções que são armazenadas em um dispositivo de armazenamento passível de leitura por computador) ou uma combinação deles.
[0433] O aparelho também inclui meios para gerar pelo menos um sinal codificado. Por exemplo, os meios para gerar pelo menos um sinal codificado podem incluir o gerador de sinais 116, o codificador 114, o primeiro dispositivo 104, o sistema 100 da Figura 1, o codificador 2414, o CODEC de meios 2408, os processadores 2410, o dispositivo 2400, um ou mais dispositivos configurados para gerar pelo menos um sinal codificado (como, por exemplo, um processador que executa instruções que são armazenadas em um dispositivo de armazenamento passível de leitura por computador), ou uma combinação deles. Pelo menos um sinal codificado pode incluir o sinal medial codificado 121 que corresponde ao sinal medial 111. O pelo menos um sinal codificado pode incluir, em resposta a uma determinação de que o sinal lateral 113 deve ser codificado para transmissão, o sinal lateral codificado 123 que corresponde ao sinal lateral 113.
[0434] O aparelho inclui adicionalmente meios para transmitir parâmetros de fluxo de bits que correspondem a pelo menos um sinal codificado. Por exemplo, os meios para transmissão podem incluir o transmissor 110, o primeiro dispositivo 104, o sistema 100 da Figura 1, o transmissor 2411, o transceptor 2440, a antena 2442, oO dispositivo 2400, um ou mais dispositivos configurados para transmitir parâmetros de fluxo de bits (como, por exemplo, um processador que executa instruções que são armazenadas em um dispositivo de armazenamento passível de leitura por computador) ou uma combinação deles.
[0435] Também em conjunto com os aspectos descritos, um aparelho inclui meios para receber parâmetros de fluxo de bits que correspondem a pelo menos um sinal medial codificado. Por exemplo, os meios para receber os parâmetros de fluxo de bits podem incluir o receptor 160, o segundo dispositivo 106, o sistema 100 da Figura l1, o receptor 2461, o transceptor 2440, a antena 2442, oO dispositivo 2400, um ou mais dispositivos configurados para receber os parâmetros de fluxo de bits (como, por exemplo, um processador que executa instruções que são armazenadas em um dispositivo de armazenamento passível de leitura por computador) ou uma combinação deles.
[0436] O aparelho também inclui meios para determinar se os parâmetros de fluxo de bits correspondem a um sinal lateral codificado. Por exemplo, os meios para determinar se os parâmetros de fluxo de bits correspondem a um sinal lateral codificado podem incluir o determinador de CP 172, o decodificador 118, o segundo dispositivo 106, o sistema 100 da Figura l1, o decodificador 2418, o CODEC de meios 2408, os processadores 2410, o dispositivo 2400, um ou mais dispositivos configurados para determinar se os parâmetros de fluxo de bits correspondem a um sinal lateral codificado (como, por exemplo, um processador que executa instruções que são armazenadas em um dispositivo de armazenamento passível de leitura por computador) ou uma combinação deles.
[0437] O aparelho inclui adicionalmente meios para gerar um sinal medial sintetizado e um sinal lateral sintetizado. Por exemplo, os meios para gerar o sinal medial sintetizado e o sinal lateral sintetizado podem incluir o gerador de sinais 174 da Figura 1, o decodificador 118, o segundo dispositivo 106, o sistema 100 da Figura 1, o decodificador 2418, o CODEC de meios 2408, os processadores 2410, o dispositivo 2400, um ou mais dispositivos “configurados para gerar o sinal medial sintetizado e o sinal lateral sintetizado (como, por exemplo, um processador que executa instruções que são armazenadas em um computador passível de leitura dispositivo de armazenamento), ou uma combinação deles. O sinal medial sintetizado 171 pode ser baseado nos parâmetros de fluxo de bits 102. Sob um aspecto específico, o sinal lateral sintetizado 173 é seletivamente baseado nos parâmetros de fluxo de bits 102 em resposta a uma determinação de se os parâmetros de fluxo de bits 102 correspondem ao sinal lateral codificado 123. Por exemplo, o sinal lateral sintetizado 173 é baseado nos parâmetros de fluxo de bits 102 em resposta a uma determinação de que os parâmetros de fluxo de bits 102 correspondem ao sinal lateral codificado 123. O sinal lateral sintetizado 173 é baseado, pelo menos em parte, no sinal medial sintetizado 171, em resposta a uma determinação de que os parâmetros de fluxo de bits 102 não correspondem ao sinal lateral codificado 123.
[0438] Além disso, em conjunto com os aspectos descritos, um aparelho inclui meios para gerar um parâmetro de downmix e um sinal medial. Por exemplo, os meios para gerar o parâmetro de downmix e o sinal medial podem incluir o gerador de midside 148, o codificador 114, o primeiro dispositivo 104, o sistema 100 da Figura l, o gerador de parâmetros de downmix 802, o gerador de parâmetros 806 da Figura 8, o codificador 2414, o CODEC de meios 2408, os processadores 2410, o dispositivo 2400, um ou mais dispositivos configurados para gerar o parâmetro de downmix e o sinal medial (como, por exemplo, um processador que executa instruções que são armazenadas em um dispositivo de armazenamento passível de leitura por computador), ou uma combinação deles. O parâmetro de downmix 115 pode ter o valor de parâmetro de downmix 807 (como, por exemplo, O primeiro valor) em resposta a uma determinação de que oO parâmetro de CP 109 indica que o sinal lateral 113 deve ser codificado para transmissão. O parâmetro de downmix 115 pode ter o valor de parâmetro de downmix 805 (como, por exemplo, o segundo valor) com base, pelo menos em parte, na determinação de que o parâmetro de CP 109 indica que o sinal lateral 113 não deve ser codificado para transmissão. O valor de parâmetro de downmix 807 pode ser baseado em uma métrica de potência, uma métrica de correlação, ou ambas. A métrica de potência, a métrica de correlação, ou ambas, podem ser baseadas no primeiro sinal de áudio 130 e no segundo sinal de áudio 132. O valor de parâmetro de downmix 805 pode ser baseado em um valor de parâmetro predefinido de downmix (como, por exemplo, 0,5), no valor de parâmetro de downmix 807, ou ambos. O sinal medial 111 pode ser baseado no primeiro sinal de áudio 130, no segundo sinal de áudio 132 e no parâmetro de downmix 115.
[0439] O aparelho também inclui meios para gerar um sinal medial codificado que corresponde ao sinal medial. Por exemplo, os meios para gerar um sinal medial codificado podem incluir o gerador de sinais 116, O codificador 114, o primeiro dispositivo 104, o sistema 100 da Figura 1, o codificador 2414, o CODEC de meios 2408, os processadores 2410, o dispositivo 2400, um ou mais dispositivos configurados para gerar o sinal medial codificado (como, por exemplo, um processador que executa instruções que são armazenadas em um dispositivo de armazenamento passível de leitura por computador) ou uma combinação deles.
[0440] O aparelho inclui adicionalmente meios para transmitir parâmetros de fluxo de bits que correspondem pelo menos ao sinal medial codificado. Por exemplo, os meios para transmitir podem incluir o transmissor 110, o primeiro dispositivo 104, o sistema 100 da Figura l, o transmissor 2411, o transceptor 2440, a antena 2442, o dispositivo 2400, um ou mais dispositivos configurados para transmitir parâmetros de fluxo de bits (como, por exemplo, um processador que executa instruções que são armazenadas em um dispositivo de armazenamento passível de leitura por computador) ou uma combinação deles.
[0441] Também em conjunto com os aspectos descritos, um aparelho inclui meios para receber parâmetros de fluxo de bits que correspondem a pelo menos um sinal medial codificado. Por exemplo, os meios para receber os parâmetros de fluxo de bits podem incluir o receptor 160, o segundo dispositivo 106, o sistema 100 da Figura 1, o receptor 2461, o transceptor 2440, a antena 2442, o dispositivo 2400, um ou mais dispositivos configurados para receber os parâmetros de fluxo de bits (como, por exemplo, um processador que executa instruções que são armazenadas em um dispositivo de armazenamento passível de leitura por computador) ou uma combinação deles.
[0442] O aparelho inclui adicionalmente meios para gerar um ou mais parâmetros de upmix. Por exemplo, os meios para gerar um ou mais parâmetros de upmix podem incluir o gerador de parâmetros de upmix 176, o decodificador 118, o segundo dispositivo 106, o sistema 100 da Figura 1, o decodificador 2418, o CODEC de meios 2408 os processadores 2410, o dispositivo 2400, um ou mais dispositivos configurados para gerar o parâmetro de upmix (como, por exemplo, um processador que executa instruções que são armazenadas em um dispositivo de armazenamento passível de leitura por computador) ou um combinação deles. Um ou mais parâmetros de upmix podem incluir o parâmetro de upmix 175. O parâmetro de upmix 175 pode ter o valor de parâmetro de downmix 807 (como, por exemplo, um primeiro valor) ou o valor de parâmetro de downmix 805 (como, por exemplo, um segundo valor) com base em uma determinação se os parâmetros de fluxo de bits 102 correspondem ao sinal lateral codificado 123. Por exemplo, o parâmetro de upmix 175 pode ter o valor de parâmetro de downmix 807 (como, por exemplo, um primeiro valor) em resposta a uma determinação de que os parâmetros de fluxo de bits 102 correspondem ao sinal lateral codificado 123. O valor de parâmetro de downmix 807 pode ser baseado no parâmetro de downmix 115. O receptor 160 pode receber o valor de parâmetro de downmix
807. O parâmetro de upmix 175 pode ter o valor de parâmetro de downmix 805 (como, por exemplo, um segundo valor) com base, pelo menos em parte, na determinação de que os parâmetros de fluxo de bits 102 não correspondem ao sinal lateral codificado 123. O valor de parâmetro de downmix 805 pode ser baseado, pelo menos em parte, em um valor de parâmetro predefinido (como, por exemplo, 0,5).
[0443] O aparelho também inclui meios para gerar um sinal medial sintetizado com base nos parâmetros de fluxo de bits. Por exemplo, os meios para gerar o sinal medial sintetizado podem incluir o gerador de sinais 174 da Figura 1, o decodificador 118, o segundo dispositivo 106, o sistema 100 da Figura l1, o decodificador 2418, o CODEC de meios 2408, os processadores 2410, o dispositivo 2400, um ou mais dispositivos configurados para gerar o sinal medial sintetizado (como, por exemplo, um processador que executa instruções que são armazenadas em um dispositivo de armazenamento passível de leitura por computador) ou uma combinação deles.
[0444] O aparelho inclui adicionalmente meios para gerar um sinal de saída com base pelo menos no sinal medial sintetizado e em um ou mais parâmetros de upmix. Por exemplo, os meios para gerar o sinal de saída podem incluir o gerador de sinais 174 da Figura l1, o decodificador 118, o segundo dispositivo 106, o sistema 100 da Figura 1, o decodificador 2418, o CODEC de meios 2408, os processadores 2410, o dispositivo 2400, um ou mais dispositivos configurados para gerar o sinal de saída (como, por exemplo, um processador que executa instruções que são armazenadas em um dispositivo de armazenamento passível de leitura por computador) ou um combinação deles.
[0445] Em conjunto com os aspectos descritos um aparelho inclui meios para receber um parâmetro de ganho de predição intercanal e um sinal de áudio codificado em um primeiro dispositivo a partir de um segundo dispositivo. Por exemplo, os meios para receber podem incluir o receptor 1360 ou o segundo dispositivo 1306 da Figura 13, o receptor 2461, o transceptor 2440 ou a antena 2442 da Figura 24, uma ou mais estruturas, dispositivos ou circuitos configurados para enviar o parâmetro de ganho de predição intercanal e o sinal de áudio codificado para o segundo dispositivo, ou uma combinação deles. O sinal de áudio codificado inclui um sinal medial codificado.
[0446] O aparelho inclui meios para gerar um sinal medial sintetizado com base no sinal medial codificado. Por exemplo, os meios para gerar o sinal medial sintetizado podem incluir o gerador de sinais 1374, o decodificador 1318 ou o segundo dispositivo 1306 da Figura 13, o gerador de sinais 1450, o sintetizador medial 1452 ou o decodificador 1418 da Figura 14, o gerador de sinais 1550, o sintetizador medial 1552 ou o decodificador 1518 da Figura 15, o gerador de sinais 1650, o sintetizador medial 1652 ou o decodificador 1618 da Figura 16, o gerador de sinais 2474, o decodificador 2418 ou o processador 2410 da Figura 24, uma ou mais estruturas, dispositivos ou circuitos configurados para gerar o sinal medial sintetizado com base no sinal medial codificado ou em uma combinação deles.
[0447] O aparelho inclui meios para gerar um sinal lateral sintetizado intermediário com base no sinal medial sintetizado e no parâmetro de ganho de predição intercanal. Por exemplo, os meios para gerar o sinal lateral sintetizado intermediário podem incluir o gerador de sinais 1374, o decodificador 1318 ou o segundo dispositivo 1306 da Figura 13, o gerador de sinais 1450, o sintetizador lateral 1456 ou o decodificador 1418 da Figura 4, O gerador de sinais 1550, o sintetizador lateral 1556 ou o decodificador 1518 da Figura 15, o gerador de sinais 1650, o sintetizador lateral 1656 ou o decodificador 1618 da Figura 16, o gerador de sinais 2474, o decodificador 2418 ou o processador 2410 da Figura 24, uma ou mais estruturas, dispositivos ou circuitos configurados para gerar o sinal medial sintetizado intermediário com base no sinal medial codificado ou em uma combinação deles.
[0448] O aparelho inclui adicionalmente meios para filtrar o sinal lateral sintetizado intermediário para gerar um sinal lateral sintetizado. Por exemplo, os meios para filtrar podem incluir o filtro 1375 da Figura 13, o filtro passa-tudo 1430 da Figura 14, o filtro passa-tudo
1530 da Figura 15, o filtro passa-tudo 1630 da Figura 16, o filtro 1375 da Figura 24, uma ou mais estruturas, dispositivos ou circuitos configurados para filtrar o sinal lateral sintetizado intermediário para gerar o sinal lateral sintetizado, ou uma combinação deles.
[0449] Com referência à Figura 25, é retratado um diagrama de blocos de um exemplo ilustrativo específico de uma estação base 2500 (como, por exemplo, um dispositivo de estação base). Em diversas implementações, a estação base 2500 pode ter mais componentes ou menos componentes do que mostrado na Figura 25. Em um exemplo ilustrativo, a estação base 2500 pode incluir o primeiro dispositivo 104, o segundo dispositivo 106 da Figura 1, o primeiro dispositivo 204, o segundo dispositivo 206 da Figura 2, O primeiro dispositivo 1304, o segundo dispositivo 1306 da Figura 13, ou uma combinação deles. Em um exemplo ilustrativo, a estação base 2500 pode funcionar de acordo com um ou mais dos métodos ou sistemas descritos com referência às Figuras 1-24.
[0450] A estação base 2500 pode fazer parte de um sistema de comunicação sem fio. O sistema de comunicação sem fio pode incluir múltiplas estações base e múltiplos dispositivos sem fio. O sistema de comunicação sem fio pode ser um sistema de Evolução de Longo Prazo (LTE), um sistema de Acesso Múltiplo por Divisão de Código (CDMA), um sistema do Sistema Global para Comunicações Móveis (GSM), um sistema de rede de área local sem fio (WLAN) ou algum outro sistema sem fio. O sistema CDMA pode implementar CDMA de Banda Larga (WCDMA), CDMA 1X, Evolução-Dados Otimizados
(EV-DO), CDMA Síncrono por Divisão de Tempo (TD-SCDMA) ou alguma outra versão do CDMA.
[0451] Os dispositivos sem fio podem ser também referidos como equipamento de usuário (UE), uma estação móvel, um terminal, um terminal de acesso, uma unidade de assinante, uma estação etc. Os dispositivos sem fio podem incluir um telefone celular, um telefone inteligente, um tablet, um modem sem fio, um assistente digital pessoal (PDA), um dispositivo portátil, um computador laptop, um smartbook, um netbook, um tablet, um telefone sem fio, uma estação de loop local sem fio (WLL), um dispositivo de Bluetooth, etc. Os dispositivos sem fio podem incluir ou corresponder ao dispositivo 2400 da Figura
24.
[0452] Diversas funções podem ser efetuadas por um ou mais componentes da estação base 2500 (e/ou em outros componentes não mostrados), tal como enviar e receber mensagens e dados (como, por exemplo, dados de áudio). Em um exemplo específico, a estação base 2500 inclui um processador 2506 (como, por exemplo, uma CPU). A estação base 2500 pode incluir um transcodificador 2510. O transcodificador 2510 pode incluir um CODEC de áudio 2508. Por exemplo, o transcodificador 2510 pode incluir um ou mais componentes (como, por exemplo, circuitos) configurados para efetuar operações do CODEC de áudio 2508. Conforme outro exemplo, o transcodificador 2510 pode ser configurado para executar uma ou mais instruções passíveis de leitura por computador para efetuar as operações do CODEC de áudio 2508. Embora o CODEC de áudio 2508 seja mostrado como um componente do transcodificador 2510, em outros exemplos, um ou mais componentes do CODEC de áudio 2508 pode ser incluído no processador 2506, em outro componente de processamento ou uma combinação deles. Por exemplo, um decodificador 2538 (como, por exemplo, um decodificador de vocoder) pode ser incluído no processador de dados do receptor 2564. Conforme outro exemplo, um codificador 2536 (como, por exemplo, um codificador de vocoder) pode ser incluído em um processador de dados de transmissão 2582.
[0453] O transcodificador 2510 pode funcionar para transcodificar mensagens e dados entre duas ou mais redes. O transcodificador 2510 pode ser configurado para converter dados de mensagem e áudio de um primeiro formato (como, por exemplo, um formato digital) para um segundo formato. Para exemplificar, o decodificador 2538 pode decodificar sinais codificados com um primeiro formato e o codificador 2536 pode codificar os sinais decodificados em sinais codificados com um segundo formato. Além disto, ou alternativamente, o transcodificador 2510 pode ser configurado para efetuar conversão descendente de uma taxa de dados ou efetuar conversão ascendente da taxa de dados sem alterar o formato dos dados de áudio. Para exemplificar, o transcodificador 2510 pode efetuar conversão descendente de sinais de 64 kilobit por segundo (kKbit/s) em sinais de 16 kbit/s.
[0454] O CODEC de áudio 2508 pode incluir o codificador 2536 e o decodificador 2538. O codificador 2536 pode incluir pelo menos um do codificador 114 da Figura 1, do codificador 214 da Figura 2, do codificador 314 da Figura 3, ou do codificador 1314 da Figura 13. O decodificador 2538 pode incluir pelo menos um do codificador 118 da Figura 1, do decodificador 218 da Figura 2, do decodificador 418 da Figura 4, do decodificador 1318 da Figura 13, do decodificador 1418 da Figura 14, do decodificador 1518 da Figura 15, ou do decodificador 1618 da Figura 16.
[0455] A estação base 2500 pode incluir uma memória 2532. A memória 2532, tal como um dispositivo de armazenamento passível de leitura por computador, pode incluir instruções. As instruções podem incluir uma ou mais instruções que são executáveis pelo processador 2506, pelo transcodificador 2510 ou por uma combinação deles, para efetuar uma ou mais operações descritas com referência aos métodos e sistemas das Figuras 1-24. A estação base 2500 pode incluir múltiplos transmissores e receptores (como, por exemplo, transceptores), tal como um primeiro transceptor 2552 e um segundo transceptor 2554, acoplado a um arranjo de antenas. O arranjo de antenas pode incluir uma primeira antena 2542 e uma segunda antena 2544. O arranjo de antenas pode ser configurado para se comunicar sem fio com um ou mais dispositivos sem fio, tal como o dispositivo 2400 da Figura 24. Por exemplo, a segunda antena 2544 pode receber um fluxo de dados 2514 (como, por exemplo, um fluxo de bits) a partir de um dispositivo sem fio. O fluxo de dados 2514 pode incluir mensagens, dados (como, por exemplo, dados de fala codificados) ou uma combinação deles.
[0456] A estação base 2500 pode incluir uma conexão de rede 2560, tal como um conexão de transporte de retorno. A conexão de rede 2560 pode ser configurada para se comunicar com uma rede básica ou uma ou mais estações base da rede de comunicação sem fio. Por exemplo, a estação base 2500 pode receber um segundo fluxo de dados (como, por exemplo, mensagens ou dados de áudio) a partir de uma rede básica por meio da conexão de rede 2560. A estação base 2500 pode processar o segundo fluxo de dados de modo a gerar mensagens ou dados de áudio e fornecer as mensagens ou dados de áudio para um ou mais dispositivos sem fio por meio de uma ou mais antenas do arranjo de antenas ou para outra estação base por meio da conexão de rede 2560. Em uma implementação específica, a conexão de rede 2560 pode ser uma conexão de rede de área estendida (WAN), como um exemplo ilustrativo e não limitador. Em algumas implementações, a rede básica pode incluir ou corresponder a uma rede telefônica comutada pública (PSTN), uma rede de backbone de pacote ou ambas.
[0457] A estação base 2500 pode incluir um gateway de meios 2570 que é acoplado à conexão de rede 2560 e ao processador 2506. O gateway de meios 2570 pode ser configurado para efetuar conversão entre fluxos de mídia de diferentes tecnologias de telecomunicações. Por exemplo, o gateway de meios 2570 pode efetuar conversão entre diferentes protocolos de transmissão, diferentes esquemas de codificação ou ambos. Para exemplificar, o gateway de meios 2570 pode efetuar conversão de sinais PCM em sinais de Protocolo de Transporte em Tempo Real (RTP), como um exemplo ilustrativo e não limitador. O gateway de meios 2570 pode efetuar conversão de dados entre redes comutadas por pacote (como, por exemplo, uma rede de Protocolo de Voz através da Internet (VoIP), um Subsistema de Multimídia IP
(IMS), uma rede sem fio de quarta geração (4G), tais como LTE, WiMax e UMB, etc.), redes comutadas por circuito (como, por exemplo, uma PSTN) e redes híbridas (como, por exemplo, uma rede sem fio de segunda geração (2G), tais como GSM, GPRS e EDGE, uma rede sem fio de terceira geração (3G), tais como WCDMA, EV-DO e HSPA etc.).
[0458] Além disso, o gateway de meios 2570 pode incluir um transcodificador, tal como o transcodificador 2510, e pode ser configurado para transcodificar dados quando os codecs são incompatíveis. Por exemplo, o gateway de meios 2570 pode efetuar transcodificação entre um codec de Taxa Múltipla Adaptativa (AMR) e um codec G.71 1, conforme um exemplo ilustrativo e não limitador. O gateway de meios 2570 pode incluir um roteador e uma pluralidade de interfaces físicas. Em algumas implementações, o gateway de meios 2570 também pode incluir um controlador (não mostrado). Em uma implementação específica, o controlador de gateway de meios pode ser externo ao gateway de meios 2570, externo à estação base 2500, ou ambos. O controlador de gateway de meios pode controlar e coordenar operações de múltiplos gateways de meios. O gateway de meios 2570 pode receber sinais de controle a partir do controlador de gateway de meios e pode funcionar como uma ponte entre diferentes tecnologias de transmissão e pode adicionar serviços para OS recursos e conexões de usuário final.
[0459] A estação base 2500 pode incluir um demodulador 2562 que é acoplado aos transceptores 2552, 2554, ao processador de dados de receptor 2564 e ao processador 2506 e o processador de dados de receptor 2564 pode ser acoplado ao processador 2506. O demodulador 2562 pode ser configurado para demodular sinais modulados recebidos a partir dos transceptores 2552, 2554 e para fornecer dados demodulados ao processador de dados de receptor 2564. O processador de dados de receptor 2564 pode ser configurado para extrair uma mensagem ou dados de áudio a partir dos dados demodulados e enviar a mensagem ou o áudio dados para o processador 2506.
[0460] A estação base 2500 pode incluir um processador de dados de transmissão 2582 e um processador de transmissão de múltiplas entradas e múltiplas saídas (MIMO) 2584. O processador de dados de transmissão 2582 pode ser acoplado ao processador 2506 e ao processador MIMO de transmissão 2584. O processador MIMO de transmissão 2584 pode ser acoplado aos transceptores 2552, 2554 e ao processador 2506. Em algumas implementações, o processador MIMO de transmissão 2584 pode ser acoplado ao gateway de meios 2570. O processador de dados de transmissão 2582 pode ser configurado para receber as mensagens ou os dados de áudio a partir do processador 2506 e para codificar as mensagens ou os dados de áudio com base em um esquema de codificação, tal como CDMA ou multiplexação por divisão de frequência ortogonal (OFDM), como exemplos ilustrativos e não limitadores. O processador de dados de transmissão 2582 pode fornecer os dados codificados para o processador MIMO de transmissão 2584.
[0461] Os dados codificados podem ser multiplexados com outros dados, tais como dados-piloto, utilizando-se técnicas CDMA ou OFDM para gerar dados multiplexados. Os dados multiplexados podem ser então modulados (isto é, mapeados em símbolos) pelo processador de dados de transmissão 2582 com base em um esquema de modulação específico (chaveamento por deslocamento de chave Binário (“BPSK”), chaveamento por deslocamento de fase pela Quadratura (“OSPK”), chaveamento por deslocamento de fase M-aria (“M-PSK”), modulação de amplitude pela Quadratura M- aria (“M-QAM”), etc.) de modo a gerar símbolos de modulação. Em uma implementação específica, os dados codificados e outros dados podem ser modulados utilizando- se esquemas de modulação diferentes. A taxa de dados, a codificação e a modulação para cada fluxo de dados podem ser determinados por instruções executadas pelo processador
2506.
[0462] O processador MIMO de transmissão 2584 pode ser configurado para receber os símbolos de modulação a partir do processador de dados de transmissão 2582 e pode processar adicionalmente os símbolos de modulação e pode efetuar formação de feixes nos dados. Por exemplo, o processador MIMO de transmissão 2584 pode aplicar pesos de formação de feixes aos símbolos de modulação. Os pesos de formação de feixes podem corresponder a uma ou mais antenas do arranjo de antenas das quais os símbolos de modulação são transmitidos.
[0463] Durante o funcionamento, a segunda antena 2544 da estação base 2500 pode receber um fluxo de dados 2514. O segundo transceptor 2554 pode receber o fluxo de dados 2514 a partir da segunda antena 2544 e pode fornecer o fluxo de dados 2514 ao demodulador 2562. O demodulador 2562 pode demodular sinais modulados do fluxo de dados 2514 e fornecer dados demodulados ao processador de dados de receptor 2564. O processador de dados de receptor 2564 pode extrair dados de áudio a partir dos dados demodulados e fornecer os dados de áudio extraídos ao processador 2506.
[0464] O processador 2506 pode fornecer os dados de áudio ao transcodificador 2510 para transcodificação. O decodificador 2538 do transcodificador 2510 pode decodificar os dados de áudio de um primeiro formato em dados de áudio decodificados e o codificador 2536 pode codificar os dados de áudio decodificados em um segundo formato. Em algumas implementações, o codificador 2536 pode codificar os dados de áudio utilizando uma taxa de dados mais alta (como, por exemplo, upconvert) ou uma taxa de dados mais baixa (como, por exemplo, downconvert) do que a recebida a partir do dispositivo sem fio. Em outras implementações, os dados de áudio podem não ser transcodificados. Embora a transcodificação (como, por exemplo, decodificação e codificação) seja mostrada como sendo efetuada por um transcodificador 2510, as operações de transcodificação (como, por exemplo, decodificação e codificação) podem ser efetuadas por múltiplos componentes da estação base 2500. Por exemplo, a decodificação pode ser efetuada pelo processador de dados de receptor 2564 e a codificação pode ser efetuada pelo processador de dados de transmissão 2582. Em outras implementações, o processador 2506 pode fornecer os dados de áudio ao gateway de meios 2570 para conversão a outro protocolo de transmissão, esquema de codificação ou ambos. O gateway de meios 2570 pode fornecer os dados convertidos a outra estação base ou rede básica por meio de a conexão de rede 2560.
[0465] O codificador 2536 pode gerar os parâmetros de CP 109 com base no primeiro sinal de áudio 130 e no segundo sinal de áudio 132. O codificador 2536 pode determinar o parâmetro de downmix 115. O codificador 2536 pode gerar o sinal medial 111 e o sinal lateral 113 com base no parâmetro de downmix 115. O codificador 2536 pode gerar os parâmetros de fluxo de bits 102 que correspondem a pelo menos um sinal codificado. Por exemplo, os parâmetros de fluxo de bits 102 correspondem ao sinal medial codificado 121. Os parâmetros de fluxo de bits 102 podem corresponder ao sinal lateral codificado 123 com base no parâmetro de CP 109. O codificador 2536 também pode gerar o ICP 208 com base no parâmetro de CP 109. Dados de áudio codificados gerados no codificador 2536, tal como dados transcodificados, podem ser fornecidos ao processador de dados de transmissão 2582 ou à conexão de rede 2560 através do processador 2506.
[0466] Os dados de áudio transcodificados do transcodificador 2510 podem ser fornecidos ao processador de dados de transmissão 2582 para codificação de acordo com um esquema de modulação, tal como a OFDM, para gerar os símbolos de modulação. o processador de dados de transmissão 2582 pode fornecer os símbolos de modulação para o processador MIMO de transmissão 2584 para processamento e formação de feixes adicionais. o processador MIMO de transmissão 2584 pode aplicar pesos de formação de feixes e pode fornecer os símbolos de modulação a uma ou mais antenas d do arranjo de antenas, tal como a primeira antena 2542 por meio do primeiro transcodificador
2552. Assim, a estação base 2500 pode fornecer um fluxo de dados transcodificado 2516, que corresponde ao fluxo de dados 2514 recebido do dispositivo sem fio, ao outro dispositivo sem fio. O fluxo de dados transcodificado 2516 pode ter um formato de codificação diferente, uma taxa de dados ou ambos diferentes dos do fluxo de dados 2514. Em outras implementações, o fluxo de dados transcodificado 2516 pode ser fornecido à conexão de rede 2560 para transmissão para outra estação base ou para uma rede básica.
[0467] Sob um aspecto específico, o decodificador 2538 recebe os parâmetros de fluxo de bits 102 e, de modo seletivo, o ICP 208. O decodificador 2538 pode determinar o parâmetro de CP 179 e o parâmetro de upmix 175. O decodificador 2538 pode gerar o sinal medial sintetizado 171. O decodificador 2538 pode gerar o sinal lateral sintetizado 173 com base no parâmetro de CP 179. Por exemplo, o decodificador 2538 pode, em resposta à determinação de que o parâmetro de CP 179 tem um primeiro valor (como, por exemplo, 0), gerar o sinal lateral sintetizado 173 por decodificação dos parâmetros de fluxo de bits 102. Conforme outro exemplo, o decodificador 2538 pode, em resposta à determinação de que o parâmetro de CP 179 tem um segundo valor (como, por exemplo, 1), gerar o sinal lateral sintetizado 173 com base no sinal medial sintetizado 171 e no ICP 208. Em algumas implementações, oO decodificador 2538 pode filtrar um sinal lateral sintetizado intermediário utilizando um filtro passa-tudo para gerar o sinal lateral sintetizado 173, conforme descrito com referência às Figuras 13-16. O decodificador 2538 pode gerar o primeiro sinal de saída 126 e o segundo sinal de saída 128 por upmix, com base no parâmetro de upmix 175, no sinal medial sintetizado 171 e no sinal lateral sintetizado 173.
[0468] A estação base 2500 pode incluir um dispositivo de armazenamento passível de leitura por computador (como, por exemplo, a memória 2532) que armazena instruções que, quando executadas por um processador (como, por exemplo, o processador 2506 ou o transcodificador 2510), fazem com que o processador efetue operações que incluem gerar, em um primeiro dispositivo, um sinal medial com base em um primeiro sinal de áudio e um segundo sinal de áudio. As operações incluem gerar um sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio. As operações incluem gerar um parâmetro de ganho de predição intercanal com base no sinal medial e no sinal lateral. As operações incluem adicionalmente enviar o parâmetro de ganho de predição intercanal e um sinal de áudio codificado para um segundo dispositivo.
[0469] A estação base 2500 pode incluir um dispositivo de armazenamento passível de leitura por computador (como, por exemplo, a memória 2532) que armazena instruções que, quando executadas por um processador (como, por exemplo, o processador 2506 ou o transcodificador 2510), fazem com que o processador efetue operações que incluem receber um parâmetro de ganho de predição intercanal e um sinal de áudio codificado em um primeiro dispositivo a partir de um segundo dispositivo. O sinal de áudio codificado inclui um sinal medial codificado. As operações incluem gerar, no primeiro dispositivo, um sinal medial sintetizado com base no sinal medial codificado. As operações incluem adicionalmente gerar um sinal lateral sintetizado com base no sinal medial sintetizado e no parâmetro de ganho de predição intercanal.
[0470] A estação base 2500 pode incluir um dispositivo de armazenamento passível de leitura por computador (como, por exemplo, a memória 2532) que armazena instruções que, quando executadas por um processador (como, por exemplo, o processador 2506 ou o transcodificador 2510), fazem com que o processador efetue operações que incluem gerar um sinal medial com base em um primeiro sinal de áudio e um segundo sinal de áudio. As operações também incluem gerar um sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio. As operações incluem adicionalmente determinar uma pluralidade de parâmetros com base no primeiro sinal de áudio, no segundo sinal de áudio ou ambos. As operações também incluem determinar, com base na pluralidade de parâmetros, se o sinal lateral deve ser codificado para transmissão. As operações incluem adicionalmente gerar um sinal medial codificado que corresponde ao sinal medial. As operações também incluem gerar um sinal lateral codificado que corresponde ao sinal lateral em resposta à determinação de que o sinal lateral deve ser codificado para transmissão. As operações incluem adicionalmente iniciar a transmissão de parâmetros de fluxo de bits que correspondem ao sinal medial codificado, ao sinal lateral codificado, ou ambos.
[0471] A estação base 2500 pode incluir um dispositivo de armazenamento passível de leitura por computador (como, por exemplo, a memória 2532) que armazena instruções que, quando executadas por um processador (como,
por exemplo, o processador 2506 ou o transcodificador 2510), fazem com que o processador efetue operações que incluem gerar um parâmetro de downmix que tem um primeiro valor em resposta à determinação de que um parâmetro de codificação ou predição indica que um sinal lateral deve ser codificado para transmissão. O primeiro valor é baseado em uma métrica de potência, uma métrica de correlação ou ambas. A métrica de potência, a métrica de correlação ou ambas, são baseadas em um primeiro sinal de áudio e um segundo sinal de áudio. As operações também incluem gerar o parâmetro de downmix que tem um segundo valor com base pelo menos em parte, na determinação de que o parâmetro de codificação ou predição indica que o sinal lateral não deve ser codificado para transmissão. O segundo valor é baseado em um valor de parâmetro de downmix predefinido, no primeiro valor ou ambos. As operações incluem adicionalmente gerar um sinal medial com base no primeiro sinal de áudio, no segundo sinal de áudio e no parâmetro de downmix. As operações também incluem gerar um sinal medial codificado que corresponde ao sinal medial. As operações incluem adicionalmente iniciar a transmissão de parâmetros de fluxo de bits que correspondem pelo menos ao sinal medial codificado.
[0472] A estação base 2500 pode incluir um dispositivo de armazenamento passível de leitura por computador (como, por exemplo, a memória 2532) que armazena instruções que, quando executadas por um processador (como, por exemplo, o processador 2506 ou o transcodificador 2510), fazem com que o processador efetue operações, que incluem a recepção de parâmetros de fluxo de bits que correspondem a pelo menos um sinal medial codificado. As operações também incluem gerar um sinal medial sintetizado com base nos parâmetros de fluxo de bits. As operações incluem adicionalmente determinar se os parâmetros de fluxo de bits correspondem a um sinal lateral codificado. As operações também incluem gerar um sinal lateral sintetizado com base nos parâmetros de fluxo de bits em resposta à determinação de que os parâmetros de fluxo de bits correspondem ao sinal lateral codificado. As operações incluem adicionalmente gerar o sinal lateral sintetizado com base, pelo menos em parte, no sinal medial sintetizado em resposta à determinação de que os parâmetros de fluxo de bits não correspondem ao sinal lateral codificado.
[0473] A estação base 2500 pode incluir um dispositivo de armazenamento passível de leitura por computador (como, por exemplo, a memória 2532) que armazena instruções que, quando executadas por um processador (como, por exemplo, o processador 2506 ou o transcodificador 2510), fazem com que o processador efetue operações que incluem a recepção de parâmetros de fluxo de bits que correspondem a pelo menos um sinal medial codificado. As operações também incluem gerar um sinal medial sintetizado com base nos parâmetros de fluxo de bits. As operações incluem adicionalmente determinar se os parâmetros de fluxo de bits correspondem a um sinal lateral codificado. As operações também incluem gerar um parâmetro de upmix com um primeiro valor em resposta à determinação de que os parâmetros de fluxo de bits correspondem ao sinal lateral codificado. O primeiro valor é baseado em um parâmetro de downmix recebido. As operações incluem adicionalmente gerar o parâmetro de upmix que tem um segundo valor com base, pelo menos em parte, na determinação de que os parâmetros de fluxo de bits não correspondem ao sinal lateral codificado. O segundo valor é baseado, pelo menos em parte, em um valor de parâmetro predefinido. As operações também incluem gerar um sinal de saída com base, pelo menos em parte, no sinal medial sintetizado e o parâmetro de upmix.
[0474] A estação base 2500 pode incluir um dispositivo de armazenamento passível de leitura por computador (como, por exemplo, a memória 2532) que armazena instruções que, quando executadas por um processador (como, por exemplo, o processador 2506 ou o transcodificador 2510), fazem com que o processador efetue operações que incluem receber um parâmetro de ganho de predição intercanal e um sinal de áudio codificado em um primeiro dispositivo a partir de um segundo dispositivo. O sinal de áudio codificado inclui um sinal medial codificado. As operações incluem gerar, no primeiro dispositivo, um sinal medial sintetizado com base no sinal medial codificado. As operações incluem gerar um sinal lateral sintetizado intermediário com base no sinal medial sintetizado e no parâmetro de ganho de predição intercanal. As operações incluem adicionalmente filtrar o sinal lateral sintetizado intermediário para gerar um sinal lateral sintetizado.
[0475] Sob um aspecto específico, um dispositivo inclui um codificador configurado para gerar um sinal medial com base em um primeiro sinal de áudio e um segundo sinal de áudio. O codificador é configurado para gerar um sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio. O codificador é configurado adicionalmente para gerar um parâmetro de ganho de predição intercanal com base no sinal medial e no sinal lateral. O dispositivo também inclui um transmissor configurado para enviar o parâmetro de ganho de predição intercanal e um sinal de áudio codificado para um segundo dispositivo. O sinal de áudio codificado inclui um sinal medial codificado. O transmissor é configurado adicionalmente para abster-se de enviar um ou mais quadros de áudio de um sinal lateral codificado responsivo ao envio do parâmetro de ganho de predição intercanal. O parâmetro de ganho de predição intercanal tem um primeiro valor associado com um primeiro quadro de áudio do sinal de áudio codificado. O parâmetro de ganho de predição intercanal tem um segundo valor associado com um segundo quadro de áudio do sinal de áudio codificado.
[0476] Em uma implementação específica, o parâmetro de ganho de predição intercanal é baseado no nível de potência do sinal medial e no nível de potência do sinal lateral. O codificador é configurado para determinar uma razão entre o nível de potência do sinal lateral e o nível de potência do sinal medial. O parâmetro de ganho de predição intercanal é baseado na razão.
[0477] Em uma implementação específica, o parâmetro de ganho de predição intercanal é baseado no nível de potência do sinal lateral. Em uma implementação específica, o parâmetro de ganho de predição intercanal é baseado no sinal medial, no sinal lateral e em um nível de potência do sinal medial. O codificador é configurado para gerar uma razão do nível de potência do sinal medial e um produto escalar do sinal medial e do sinal lateral. O parâmetro de ganho de predição intercanal é baseado na razão.
[0478] Em uma implementação específica, o parâmetro de ganho de predição intercanal é baseado em um sinal medial sintetizado, no sinal lateral e em um nível de potência do sinal medial sintetizado. O codificador é configurado para gerar uma razão do nível de potência do sinal medial sintetizado e um produto escalar do sinal medial sintetizado e do sinal lateral. O parâmetro de ganho de predição intercanal é baseado na razão. Em uma implementação específica, o codificador é configurado para aplicar um ou mais filtros ao sinal medial e ao sinal lateral antes de gerar o parâmetro de ganho de predição intercanal. Em uma implementação específica, o codificador e o transmissor são integrados a um dispositivo móvel. Em uma implementação específica, o codificador e o transmissor são integrados em uma estação base.
[0479] Sob um aspecto específico, um método inclui gerar, em um primeiro dispositivo, um sinal medial com base em um primeiro sinal de áudio e um segundo sinal de áudio. O método inclui gerar um sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio. O método inclui gerar um parâmetro de ganho de predição intercanal com base no sinal medial e no sinal lateral. O método inclui adicionalmente enviar o parâmetro de ganho de predição intercanal e um sinal de áudio codificado para um segundo dispositivo. Em uma implementação específica, o primeiro dispositivo inclui um dispositivo móvel. Em uma implementação específica, o primeiro dispositivo inclui uma estação base.
[0480] O método inclui redução de amostragem do primeiro sinal de áudio para gerar um primeiro sinal de áudio com amostragem reduzida de áudio. O método também inclui redução de amostragem do segundo sinal de áudio para gerar um segundo sinal de áudio com amostragem reduzida. O parâmetro de ganho de predição intercanal é baseado no primeiro sinal de áudio com amostragem reduzida e no segundo sinal de áudio com amostragem reduzida. O parâmetro de ganho de predição intercanal é determinado em uma taxa de amostragem de entrada associada com o primeiro sinal de áudio e ao segundo sinal de áudio.
[0481] O método inclui efetuar uma operação de suavização no parâmetro de ganho de predição intercanal antes de enviar o parâmetro de ganho de predição intercanal ao segundo dispositivo. Em uma implementação específica, a operação de suavização é baseada em um fator de suavização fixo. Em uma implementação específica, a operação de suavização é baseada em um fator de suavização adaptativo. Em uma implementação específica, o fator de suavização adaptativo é baseado em uma potência de sinal do sinal medial. Em uma implementação específica, o fator de suavização adaptativo é baseado em um parâmetro de harmonização associado com o sinal medial.
[0482] O método inclui processar o sinal medial para gerar um sinal medial de banda baixa e um sinal medial de banda alta. O método também inclui processar o sinal lateral para gerar um sinal lateral de banda baixa e um sinal lateral de banda alta. O método inclui adicionalmente gerar o parâmetro de ganho de predição intercanal com base no sinal medial de banda baixa e no sinal lateral de banda baixa. o método inclui adicionalmente gerar um segundo parâmetro de ganho de predição intercanal com base no sinal medial de banda alta e no sinal lateral de banda alta. O método também inclui enviar o segundo parâmetro de ganho de predição intercanal com o parâmetro de ganho de predição intercanal e o sinal de áudio codificado ao segundo dispositivo.
[0483] O método inclui gerar um parâmetro de correlação com base no sinal medial e no sinal lateral. O método também inclui enviar o parâmetro de correlação com o parâmetro de ganho de predição intercanal e o sinal de áudio codificado ao segundo dispositivo. Em uma implementação específica, o parâmetro de ganho de predição intercanal é baseado em uma razão de um nível de potência do sinal lateral e em um nível de potência do sinal medial. Em uma implementação específica, o parâmetro de correlação é baseado em uma razão do nível de potência do sinal medial e em um produto escalar do sinal medial e do sinal lateral.
[0484] Sob um aspecto específico, um dispositivo inclui um codificador e um transmissor. O codificador é configurado para gerar um sinal medial com base em um primeiro sinal de áudio e um segundo sinal de áudio. O codificador é também configurado para gerar um sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio. O codificador é configurado adicionalmente para determinar uma pluralidade de parâmetros com base no primeiro sinal de áudio, no segundo sinal de áudio, ou ambos. O codificador é também configurado para determinar, com base na pluralidade de parâmetros, se o sinal lateral deve ser codificado para transmissão. O codificador é configurado adicionalmente para gerar um sinal medial codificado que corresponde ao sinal medial. O codificador é também configurado para gerar um sinal lateral codificado que corresponde ao sinal lateral em resposta à determinação de que o sinal lateral deve ser codificado para transmissão. O transmissor é configurado para transmitir parâmetros de fluxo de bits que correspondem ao sinal medial codificado, ao sinal lateral codificado, ou ambos.
[0485] Em uma implementação específica, o codificador é configurado adicionalmente para, em resposta à determinação de que o sinal lateral deve ser codificado para transmissão, gerar um parâmetro de codificação Ou predição com um primeiro valor. O transmissor é configurado para transmitir o parâmetro de codificação ou predição.
[0486] Em uma implementação específica, o codificador é configurado adicionalmente para determinar um valor de disparidade temporal indicativo de uma quantidade de disparidade temporal entre as primeiras amostras do primeiro sinal de áudio e as primeiras amostras específicas do segundo sinal de áudio. O codificador é também configurado para determinar que o sinal lateral deve ser codificado para transmissão com base na determinação de que o valor de disparidade temporal satisfaz um limite de disparidade. Em uma implementação específica, o codificador é configurado adicionalmente para determinar um indicador de estabilidade de disparidade temporal com base em uma comparação do valor de disparidade temporal e em um segundo valor de disparidade temporal. O segundo valor de disparidade temporal é baseado, pelo menos em parte, em segundas amostras do primeiro sinal de áudio. O codificador é também configurado para determinar que o sinal lateral deve ser codificado para transmissão com base na determinação de que o indicador de estabilidade de disparidade temporal satisfaz um limite de estabilidade de disparidade temporal. A pluralidade de parâmetros inclui o indicador de estabilidade de disparidade temporal.
[0487] Em uma implementação específica, o codificador é configurado adicionalmente para determinar um parâmetro de ganho intercanal que corresponde a uma razão de potência da primeira potência das primeiras amostras do primeiro sinal de áudio e da primeira potência específica das primeiras amostras específicas do segundo sinal de áudio. O codificador é também configurado para determinar que o sinal lateral deve ser codificado para transmissão com base na determinação de que o parâmetro de ganho intercanal satisfaz um limite de ganho intercanal. A pluralidade de parâmetros inclui o parâmetro de ganho intercanal.
[0488] Em uma implementação específica, o codificador é configurado adicionalmente para determinar um parâmetro de ganho intercanal que corresponde a uma razão de potência da primeira potência das primeiras amostras do primeiro sinal de áudio e da primeira potência específica das primeiras amostras específicas do segundo sinal de áudio. O codificador é também configurado para determinar um parâmetro de ganho intercanal suavizado com base no parâmetro de ganho intercanal e em um segundo parâmetro de ganho intercanal. O segundo parâmetro de ganho intercanal é baseado, pelo menos em parte, na segunda potência das segundas amostras do primeiro sinal de áudio. O codificador é configurado adicionalmente para determinar que o sinal lateral deve ser codificado para transmissão com base na determinação de que o parâmetro de ganho intercanal suavizado satisfaz um limite de ganho intercanal suavizado. A pluralidade de parâmetros inclui o parâmetro de ganho intercanal suavizado.
[0489] Em uma implementação específica, o codificador é configurado adicionalmente para determinar um parâmetro de ganho intercanal que corresponde à uma razão de potência da primeira potência das primeiras amostras do primeiro sinal de áudio e da primeira potência específica das primeiras amostras específicas do segundo sinal de áudio. O codificador é também configurado para determinar um parâmetro de ganho intercanal suavizado com base no parâmetro de ganho intercanal e em um segundo parâmetro de ganho intercanal. O segundo parâmetro de ganho intercanal é baseado, pelo menos em parte, na segunda potência das segundas amostras do primeiro sinal de áudio. O codificador é configurado adicionalmente para determinar um indicador de confiabilidade de ganho intercanal com base em uma comparação do parâmetro de ganho intercanal e no parâmetro de ganho intercanal suavizado. O codificador é também configurado para determinar que o sinal lateral deve ser codificado para transmissão com base na determinação de que o indicador de confiabilidade de ganho intercanal satisfaz um limite de confiabilidade de ganho intercanal. A pluralidade de parâmetros inclui o indicador de confiabilidade de ganho intercanal.
[0490] Em uma implementação específica, o codificador é configurado adicionalmente para determinar um parâmetro de ganho intercanal que corresponde a uma razão de potência da primeira potência das primeiras amostras do primeiro sinal de áudio e da primeira potência específica das primeiras amostras específicas do segundo sinal de áudio. O codificador é também configurado para determinar um indicador de estabilidade de ganho intercanal com base em uma comparação do parâmetro de ganho intercanal e em um segundo parâmetro de ganho intercanal. O segundo parâmetro de ganho intercanal é baseado, pelo menos em parte, na segunda potência das segundas amostras do primeiro sinal de áudio. O codificador é configurado adicionalmente para determinar que o sinal lateral deve ser codificado para transmissão com base na determinação de que o indicador de estabilidade de ganho intercanal satisfaz um limite de estabilidade de ganho intercanal. A pluralidade de parâmetros inclui o indicador de estabilidade de ganho intercanal. Em uma implementação específica, a pluralidade de parâmetros inclui pelo menos um de um parâmetro de decisão de fala, um tipo de núcleo ou um indicador de transitório.
[0491] Em uma implementação específica, o codificador é configurado adicionalmente para determinar um valor de ganho de predição intercanal com base na potência do sinal lateral, na potência do sinal medial, ou ambas. O codificador é também configurado para determinar que o sinal lateral deve ser codificado para transmissão com base na determinação de que o valor do ganho de predição intercanal satisfaz um limite de ganho de predição intercanal. A pluralidade de parâmetros inclui o valor de ganho de predição intercanal.
[0492] Em uma implementação específica, o codificador é configurado adicionalmente para gerar um sinal medial sintetizado com base no sinal medial codificado. O codificador é também configurado para determinar um valor de ganho de predição intercanal com base na potência do sinal lateral e na potência do sinal medial sintetizado. o codificador é configurado adicionalmente para determinar que o sinal lateral deve ser codificado para transmissão com base na determinação de que o valor do ganho de predição intercanal satisfaz um limite de ganho de predição intercanal. A pluralidade de parâmetros inclui o valor de ganho de predição intercanal.
[0493] Em uma implementação específica, o codificador é configurado adicionalmente para gerar o sinal lateral codificado que corresponde ao sinal lateral. O codificador é também configurado para gerar um sinal lateral sintetizado com base no sinal lateral codificado. O codificador é configurado adicionalmente para determinar um valor de ganho de predição intercanal com base na potência do sinal lateral e na potência do sinal lateral sintetizado. O codificador é também configurado para determinar que o sinal lateral deve ser codificado com base na determinação de que o valor do ganho de predição intercanal satisfaz um limite de ganho de predição intercanal. A pluralidade de parâmetros inclui o valor de ganho de predição intercanal.
[0494] Em uma implementação específica, o codificador, o transmissor e a antena são integrados a um dispositivo móvel. Em uma implementação específica, O codificador, o transmissor e a antena são integrados a um dispositivo de estação base.
[0495] Sob um aspecto específico, um método inclui gerar, em um dispositivo, um sinal medial com base em um primeiro sinal de áudio e um segundo sinal de áudio. O método também inclui gerar, no dispositivo, um sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio. O método inclui adicionalmente determinar, no dispositivo, uma pluralidade de parâmetros com base no primeiro sinal de áudio, no segundo sinal de áudio, ou ambos. O método também inclui determinar, com base na pluralidade de parâmetros, se o sinal lateral deve ser codificado para transmissão. O método inclui adicionalmente gerar, no dispositivo, um sinal medial codificado que corresponde ao sinal medial. O método também inclui gerar, no dispositivo, um sinal lateral codificado que corresponde ao sinal lateral em resposta à determinação de que o sinal lateral deve ser codificado para transmissão. O método inclui adicionalmente iniciar a transmissão, a partir do dispositivo, de parâmetros de fluxo de bits que correspondem ao sinal medial codificado, ao sinal lateral codificado, ou ambos.
[0496] Em uma implementação específica, o método inclui gerar, no dispositivo, um parâmetro de codificação ou predição que indica se o sinal lateral deve ser codificado para transmissão. O método também inclui transmitir o parâmetro de codificação ou predição do dispositivo.
[0497] Sob um aspecto específico, um dispositivo de armazenamento passível de leitura por computador armazena instruções que, quando executadas por um processador, fazem com que o processador efetue operações que incluem gerar um sinal medial com base em um primeiro sinal de áudio e um segundo sinal de áudio. As operações também incluem gerar um sinal lateral com base no primeiro sinal de áudio e no segundo sinal de áudio. As operações incluem adicionalmente determinar uma pluralidade de parâmetros com base no primeiro sinal de áudio, no segundo sinal de áudio, ou ambos. As operações também incluem determinar, com base na pluralidade de parâmetros, se o sinal lateral deve ser codificado para transmissão. As operações incluem adicionalmente gerar um sinal medial codificado que corresponde ao sinal medial. As operações também incluem gerar um sinal lateral codificado que corresponde ao sinal lateral em resposta à determinação de que o sinal lateral deve ser codificado para transmissão. As operações incluem adicionalmente iniciar a transmissão de parâmetros de fluxo de bits que correspondem ao sinal medial codificado, ao sinal lateral codificado, ou ambos.
[0498] Em uma implementação específica, a pluralidade de parâmetros inclui pelo menos um de um valor de disparidade temporal, de um indicador de estabilidade de disparidade temporal, de um parâmetro de ganho intercanal, de um parâmetro de ganho intercanal suavizado, de um indicador de confiabilidade de ganho intercanal, de um indicador de estabilidade de ganho intercanal, de um parâmetro de decisão de fala, de um tipo de núcleo, de um indicador de transitório ou de um valor de ganho de predicação intercanal.
[0499] Sob um aspecto específico, um dispositivo inclui um codificador e um transmissor. O codificador é configurado para gerar um parâmetro de downmix que tem um primeiro valor em resposta à determinação de que um parâmetro de codificação ou predição indica que um sinal lateral deve ser codificado para transmissão. O primeiro valor é baseado em uma métrica de potência, em uma métrica de correlação, ou ambas. A métrica de potência, a métrica de correlação, ou ambas, são baseadas em um primeiro sinal de áudio e em um segundo sinal de áudio. O codificador é também configurado para gerar o parâmetro de downmix que tem um segundo valor com base, pelo menos em parte, na determinação de que o parâmetro de codificação ou predição indica que o sinal lateral não deve ser codificado para transmissão. O segundo valor é baseado em um valor de parâmetro de downmix predefinido, no primeiro valor, ou ambos. O codificador é configurado adicionalmente para gerar um sinal medial com base no primeiro sinal de áudio, no segundo sinal de áudio e no parâmetro de downmix. O codificador é também configurado para gerar um sinal medial codificado que corresponde ao sinal medial. O transmissor é configurado para transmitir parâmetros de fluxo de bits que correspondem, pelo menos em parte, ao sinal medial codificado.
[0500] Em uma implementação específica, o codificador é configurado para determinar a primeira potência do primeiro sinal de áudio, determinar a segunda potência do segundo sinal de áudio e determinar o primeiro valor com base na comparação da primeira potência e da segunda potência. Em uma implementação específica, O codificador é configurado para gerar o sinal lateral com base no primeiro sinal de áudio, no segundo sinal de áudio e no parâmetro de downmix. O codificador é também configurado para, em resposta à determinação de que o parâmetro de codificação ou predição indica que o sinal lateral deve ser codificado para transmissão, gerar um sinal lateral codificado que corresponde ao sinal lateral. Os parâmetros de fluxo de bits também correspondem ao sinal lateral codificado.
[0501] Em uma implementação específica, o codificador é configurado para gerar o parâmetro de downmix, que tem o segundo valor condicionado adicionalmente mediante um critério que é satisfeito. O codificador é configurado para gerar o parâmetro de downmix com o primeiro valor condicionado adicionalmente mediante o critério que não é satisfeito.
[0502] Em uma implementação específica, o codificador é configurado para gerar um primeiro sinal lateral com base no primeiro sinal de áudio, no segundo sinal de áudio e no primeiro valor. O codificador é também configurado para gerar um segundo sinal lateral com base no primeiro sinal de áudio, no segundo sinal de áudio e no segundo valor. O codificador é configurado adicionalmente para determinar um valor de comparação de potência com base na comparação da primeira potência do primeiro sinal lateral e da segunda potência do segundo sinal lateral. O codificador é também configurado para determinar que o critério é satisfeito em resposta à determinação de que o valor de comparação de potência satisfaz um limite de potência.
[0503] Em uma implementação específica, o codificador é configurado para selecionar, com base em um valor de disparidade temporal, as primeiras amostras do primeiro sinal de áudio e as segundas amostras do segundo sinal de áudio. O valor de disparidade temporal indica uma quantidade de disparidade temporal entre o primeiro sinal de áudio e o segundo sinal de áudio. O codificador é também configurado para determinar um valor de correlação cruzada com base na comparação das primeiras amostras e das segundas amostras. o codificador é configurado adicionalmente para determinar que o critério é satisfeito em resposta à determinação de que o valor da correlação cruzada satisfaz um limite de correlação cruzada.
[0504] Em uma implementação específica, o codificador é configurado para determinar que o critério é atendido em resposta à determinação de que um valor de disparidade temporal satisfaz um limite de disparidade. Em uma implementação específica, o codificador é configurado para determinar se o critério é satisfeito com base em pelo menos um de um tipo de codificador, de um tipo de núcleo ou de um parâmetro de decisão de fala.
[0505] Em uma implementação específica, o transmissor é configurado para transmitir o primeiro valor. Em uma implementação específica, o transmissor é configurado para transmitir o parâmetro de downmix. Por exemplo, o transmissor é configurado para transmitir o parâmetro de downmix em resposta à determinação de que um valor de parâmetro de downmix difere do valor de parâmetro predefinido de downmix. Conforme outro exemplo, o transmissor é configurado para transmitir o parâmetro de downmix em resposta à determinação de que o parâmetro de downmix é baseado em um ou mais parâmetros indisponíveis em um decodificador.
[0506] Em uma implementação específica, o codificador é configurado para determinar o segundo valor adicionalmente com base em um fator de harmonização. Em uma implementação específica, o codificador é configurado para selecionar, com base em um valor de disparidade temporal, as primeiras amostras do primeiro sinal de áudio e as segundas amostras do segundo sinal de áudio. O valor de disparidade temporal indica uma quantidade de disparidade temporal entre o primeiro sinal de áudio e o segundo sinal de áudio. O codificador é também configurado para determinar um valor de correlação cruzada com base na comparação das primeiras amostras e das segundas amostras. O segundo valor é baseado no valor de correlação cruzada.
[0507] Em uma implementação específica, o dispositivo inclui uma antena acoplada ao transmissor. Em uma implementação específica, a antena, o codificador e o transmissor são integrados a um dispositivo móvel. Em uma implementação específica, a antena, o codificador e o transmissor são integrados dentro de uma estação base.
[0508] Sob um aspecto específico, um método inclui gerar, em um dispositivo, um parâmetro de downmix com um primeiro valor em resposta à determinação de que um parâmetro de codificação ou predição indica que um sinal lateral deve ser codificado para transmissão. O primeiro valor é baseado em uma métrica de potência, em uma métrica de correlação, ou ambas. A métrica de potência, a métrica de correlação, ou ambas, são baseadas em um primeiro sinal de áudio e em um segundo sinal de áudio. O método também inclui gerar, no dispositivo, o parâmetro de downmix com um segundo valor com base pelo menos em parte na determinação de que o parâmetro de codificação ou predição indica que o sinal lateral não deve ser codificado para transmissão. O segundo valor é baseado em um valor de parâmetro de downmix predefinido, no primeiro valor, ou ambos. O método inclui adicionalmente gerar, no dispositivo, um sinal medial com base no primeiro sinal de áudio, no segundo sinal de áudio e no parâmetro de downmix. O método também inclui gerar, no dispositivo, um sinal medial codificado que corresponde ao sinal medial. O método inclui adicionalmente iniciar a transmissão, a partir do dispositivo, de parâmetros de fluxo de bits que correspondem, pelo menos em parte, ao sinal medial codificado.
[0509] Em uma implementação específica, o método inclui gerar, no dispositivo, o sinal lateral com base no primeiro sinal de áudio, no segundo sinal de áudio e no parâmetro de downmix. O método também inclui gerar, no dispositivo, um sinal lateral codificado que corresponde ao sinal lateral em resposta à determinação de que o parâmetro de codificação ou predição indica que o sinal lateral deve ser codificado para transmissão. Os parâmetros de fluxo de bits também correspondem ao sinal lateral codificado.
[0510] Sob um aspecto específico, um dispositivo de armazenamento passível de leitura por computador armazena instruções que, quando executadas por um processador, fazem com que o processador efetue operações que incluem gerar um parâmetro de downmix que tem um primeiro valor em resposta à determinação de que um parâmetro de codificação ou predição indica que um o sinal lateral deve ser codificado para transmissão. O primeiro valor é baseado em uma métrica de potência, uma métrica de correlação, ou ambas. A métrica de potência, a métrica de correlação, ou ambas, são baseadas em um primeiro sinal de áudio e em um segundo sinal de áudio. As operações também incluem gerar o parâmetro de downmix com um segundo valor com base, pelo menos em parte, na determinação de que o parâmetro de codificação ou predição indica que o sinal lateral não deve ser codificado para transmissão. O segundo valor é baseado em um valor de parâmetro de downmix predefinido, no primeiro valor, ou ambos. As operações incluem adicionalmente gerar um sinal medial com base no primeiro sinal de áudio, no segundo sinal de áudio e no parâmetro de downmix. As operações também incluem gerar um sinal medial codificado que corresponde ao sinal medial. As operações incluem adicionalmente iniciar a transmissão de parâmetros de fluxo de bits que correspondem pelo menos ao sinal medial codificado.
[0511] Em uma implementação específica, as operações incluem determinar se um critério é satisfeito com base em pelo menos um valor de disparidade temporal, em um tipo de codificador, em um tipo de núcleo ou em um parâmetro de decisão de fala. O parâmetro de downmix tem o segundo valor condicionado adicionalmente mediante o critério que é satisfeito.
[0512] Os versados na técnica entenderiam também que os diversos blocos, configurações, módulos, circuitos e etapas de algoritmo lógicos ilustrativos descritos em conexão com os aspectos aqui revelados podem ser implementados como hardware eletrônico, software de computador executado por um dispositivo de processamento tal como um processador de hardware em combinações de ambos. Foram descritos acima diversos componentes, blocos, módulos, circuitos e etapas ilustrativos geralmente em termos da sua funcionalidade. Se tal funcionalidade é implementada como hardware ou software executável depende da aplicação específica e das restrições de desenho impostas ao sistema como um todo. Os versados na técnica podem implementar a funcionalidade descrita de maneiras variáveis para cada adaptação específica, mas tais decisões de implementação não devem ser interpretadas como provocando um afastamento do alcance da presente revelação.
[0513] As etapas de método ou algoritmos descritas em conexão com os aspectos aqui revelados podem ser corporificados diretamente em hardware, em um módulo de software executado por um processador ou em uma combinação dos dois. Um módulo de software pode residir em um aparelho de memória tal como uma memória de acesso aleatório (RAM), memória de acesso aleatório magneto-resistiva (MRAM), MRAM com transferência por rotação-torque (STT-MRAM), memória flash, memória exclusiva de leitura (ROM) , memória exclusiva de leitura programável (PROM), memória exclusiva de leitura programável apagável (EPROM), memória exclusiva de leitura programável eletricamente apagável (EEPROM), em registradores, disco rígido, disco removível, memória exclusiva de leitura de disco compacto (CD-ROM). Um dispositivo de memória exemplar é acoplado ao processador de modo que o processador possa ler informações do, e gravar informações no, dispositivo de memória. Alternativamente, o dispositivo de memória pode ser integrante com o processador. O processador e o meio de armazenamento podem residir em um circuito integrado específico de aplicativo (ASIC). O ASIC pode residir em um dispositivo de computação ou em um terminal de usuário. Alternativamente, o processador e o meio de armazenamento podem residir como componentes discretos em um dispositivo de computação ou terminal de usuário.
[0514] A descrição anterior dos aspectos revelados é apresentada para permitir quer uma pessoa versada na técnica fabrique ou utilize os aspectos revelados. Diversas modificações nestes aspectos serão prontamente evidentes aos versados na técnica, e os princípios aqui definidos podem ser aplicados a outros aspectos sem que se abandone o alcance da revelação. Assim, a presente revelação não pretende estar limitada aos aspectos aqui mostrados, mas deve receber o mais amplo alcance possível compatível com os princípios e recursos inéditos definidos pelas reivindicações seguintes.

Claims (30)

REIVINDICAÇÕES
1. Dispositivo, que compreende: um receptor configurado para receber um parâmetro de ganho de predição intercanal e um sinal de áudio codificado, em que o sinal de áudio codificado compreende um sinal medial codificado; e um decodificador configurado para: gerar um sinal medial sintetizado com base no sinal medial codificado; gerar um sinal lateral sintetizado intermediário com base no sinal medial sintetizado e no parâmetro de ganho de predição intercanal; e filtrar o sinal lateral sintetizado intermediário para gerar um sinal lateral sintetizado.
2. Dispositivo, de acordo com a reivindicação 1, em que o decodificador inclui um filtro de dispersão de fase configurado para filtrar o sinal lateral sintetizado intermediário para gerar o sinal lateral sintetizado.
3. Dispositivo, de acordo com a reivindicação 2, em que o filtro de dispersão de fase compreende um ou mais filtros de correlação estacionária, um ou mais filtros de correlação não estacionária ou uma combinação deles.
4, Dispositivo, de acordo com a reivindicação 2, em que o filtro de dispersão de fase compreende um ou mais filtros de reamostragem passa-tudo não linear.
5. Dispositivo, de acordo com a reivindicação 1, em que o decodificador inclui adicionalmente um filtro de desacentuação configurado para efetuar filtragem de desacentuação no sinal medial sintetizado.
6. Dispositivo, de acordo com a reivindicação 1, em que o decodificador inclui adicionalmente um ampliador de amostragem configurado para efetuar aumento de amostragem do sinal medial sintetizado e no sinal lateral sintetizado.
7. Dispositivo, de acordo com a reivindicação 1, em que o decodificador inclui adicionalmente um supressor de descontinuidade configurado para reduzir uma descontinuidade entre um primeiro quadro do sinal lateral sintetizado e um segundo quadro de um segundo sinal lateral sintetizado, o segundo sinal lateral sintetizado gerado com base em um sinal lateral codificado recebido no receptor.
8. Dispositivo, de acordo com a reivindicação 7, em que o supressor de descontinuidade é configurado para efetuar atenuação cruzada um ou mais quadros do sinal lateral sintetizado com um ou mais quadros do segundo sinal lateral sintetizado.
9. Dispositivo, de acordo com a reivindicação 7, em que o supressor de descontinuidade é configurado para: gerar amostras espelhadas do segundo sinal lateral sintetizado; e efetuar atenuação cruzada nas amostras espelhadas com o sinal lateral sintetizado para um ou mais quadros.
10. Dispositivo, de acordo com a reivindicação 7, em que o supressor de descontinuidade é configurado para adiar a geração do segundo sinal lateral sintetizado para um ou mais quadros.
11. Dispositivo, de acordo com a reivindicação 1, em que o decodificador e o receptor são integrados a um dispositivo móvel.
12. Dispositivo, de acordo com a reivindicação 1, em que o decodificador e o receptor são integrados a uma estação base.
13. Método de comunicação que compreende: receber um parâmetro de ganho de predição intercanal e um sinal de áudio codificado em um primeiro dispositivo a partir de um segundo dispositivo, em que o sinal de áudio codificado compreende um sinal medial codificado; gerar, no primeiro dispositivo, um sinal medial sintetizado com base no sinal medial codificado; gerar um sinal lateral sintetizado intermediário com base no sinal medial sintetizado e no parâmetro de ganho de predição intercanal; e filtrar o sinal lateral sintetizado intermediário para gerar um sinal lateral sintetizado.
14. Método, de acordo com a reivindicação 13, que compreende adicionalmente reduzir uma descontinuidade entre um primeiro quadro do sinal lateral sintetizado e um segundo quadro de um segundo sinal lateral sintetizado, o segundo sinal lateral sintetizado gerado com base em um sinal lateral codificado, em que o sinal de áudio codificado compreende o sinal lateral codificado.
15. Método, de acordo com a reivindicação 13, que compreende adicionalmente efetuar atenuação cruzada em um ou mais quadros do sinal lateral sintetizado com um ou mais quadros do segundo sinal lateral sintetizado.
16. Método, de acordo com a reivindicação 13, que compreende adicionalmente:
gerar amostras espelhadas do segundo sinal lateral sintetizado; e efetuar atenuação cruzada nas amostras espelhadas com o sinal lateral sintetizado para um ou mais quadros.
17. Método, de acordo com a reivindicação 13, que compreende adicionalmente configurar um valor de pelo menos um parâmetro de um filtro passa-tudo com base no parâmetro de ganho de predição intercanal, em que a filtragem é efetuada pelo filtro passa-tudo e em que o em pelo menos um parâmetro compreende um parâmetro de retardo, um parâmetro de ganho ou ambos.
18. Método, de acordo com a reivindicação 13, que compreende adicionalmente: receber um parâmetro de modo de codificação no primeiro dispositivo a partir do segundo dispositivo; e ativar cada um dos múltiplos estágios de um filtro passa-tudo com base no parâmetro de modo de codificação que indica um modo de codificação de música, em que a filtragem é efetuada pelo filtro passa-tudo.
19. Método, de acordo com a reivindicação 18, que compreende adicionalmente desativar pelo menos um estágio do filtro passa-tudo com base no parâmetro de modo de codificação que indica um modo de codificação de fala.
20. Método, de acordo com a reivindicação 13, que compreende adicionalmente: receber um segundo parâmetro de ganho de predição intercanal no primeiro dispositivo a partir do segundo dispositivo; e processar o sinal medial sintetizado para gerar um sinal medial sintetizado de banda baixa e um sinal medial sintetizado de banda alta.
21. Método, de acordo com a reivindicação 20, em que gerar o sinal lateral sintetizado intermediário compreende: gerar um sinal lateral sintetizado intermediário de banda baixa com base no sinal medial sintetizado de banda baixa e no parâmetro de ganho de predição intercanal; e gerar um sinal lateral sintetizado intermediário de banda alta com base no sinal medial sintetizado de banda alta e no segundo parâmetro de ganho de predição intercanal.
22. Método, de acordo com a reivindicação 21, em que gerar o sinal lateral sintetizado compreende: filtrar o sinal lateral sintetizado intermediário de banda baixa utilizando um filtro passa-tudo para gerar um primeiro sinal lateral sintetizado; ajustar pelo menos um parâmetro de pelo menos um dos múltiplos estágios do filtro passa-tudo; filtrar o sinal lateral sintetizado intermediário de banda alta utilizando o filtro passa-tudo para gerar um segundo sinal lateral sintetizado; e combinar o primeiro sinal lateral sintetizado e Oo segundo sinal lateral sintetizado para gerar o sinal lateral sintetizado.
23. Método, de acordo com a reivindicação 13, em que o primeiro dispositivo compreende um dispositivo móvel.
24. Método, de acordo com a reivindicação 13, em que o primeiro dispositivo compreende uma estação base.
25. Dispositivo de armazenamento passível de leitura por computador que armazena instruções que, quando executadas por um processador, fazem com que o processador efetue operações que compreendem: receber um parâmetro de ganho de predição intercanal e um sinal de áudio codificado a partir de um dispositivo, em que o sinal de áudio codificado compreende um sinal medial codificado; gerar um sinal medial sintetizado com base no sinal medial codificado; gerar um sinal lateral sintetizado intermediário com base no sinal medial sintetizado e no parâmetro de ganho de predição intercanal; e filtrar o sinal lateral sintetizado intermediário para gerar um sinal lateral sintetizado.
26. Dispositivo de armazenamento passível de leitura por computador, de acordo com a reivindicação 25, em que a filtragem é efetuada por um filtro passa-tudo e em que filtrar o sinal lateral sintetizado intermediário utilizando o filtro passa-tudo gera um sinal lateral sintetizado intermediário filtrado.
27. Dispositivo de armazenamento passível de leitura por computador, de acordo com a reivindicação 26 em que as operações compreendem adicionalmente: receber um parâmetro de correlação do dispositivo; e misturar, com base no parâmetro de correlação, o sinal lateral sintetizado intermediário com o sinal lateral sintetizado intermediário filtrado para gerar o sinal lateral sintetizado.
28. Dispositivo de armazenamento passível de leitura por computador, de acordo com a reivindicação 27, em que uma quantidade do sinal lateral sintetizado intermediário filtrado que é misturado com o sinal lateral sintetizado intermediário é aumentada com base em uma diminuição no parâmetro de correlação.
29. Aparelho, que compreende: meios para receber um parâmetro de ganho de predição intercanal e um sinal de áudio codificado, em que o sinal de áudio codificado compreende um sinal medial codificado; meios para gerar um sinal medial sintetizado com base no sinal medial codificado; meios para gerar um sinal lateral sintetizado intermediário com base no sinal medial sintetizado e no parâmetro de ganho de predição intercanal; e meios para filtrar o sinal lateral sintetizado intermediário para gerar um sinal lateral sintetizado.
30. Aparelho, de acordo com a reivindicação 29, em que os meios para receber o parâmetro de ganho de predição intercanal, os meios para gerar o sinal medial sintetizado, os meios para gerar o sinal lateral sintetizado intermediário e meios para filtrar o sinal lateral sintetizado intermediário são integrados dentro de pelo menos um telefone celular, estação base, um dispositivo de comunicação, um computador, um tocador de música, um tocador de vídeo, uma unidade de entretenimento,
um dispositivo de navegação, um assistente pessoal digital (PDA), um decodificador ou um set top-box.
o =) 7 8 z o ã. = = 3 8 8 Ps co E X = o NM Es ST | Sw E= É Tx Pl eo 3 8 2 E OT F/ss le E SIExIT23 o PS z EE É | 2 > >=|/=—|8 || w| o E sê 2 CS 3 EI ZI8 no E s $ se) S|/º SS 5 & Ss o E | é $ EE dE 3 Ss Eb 3 3 Ss = 3 8/8 8 |8|sT 3 Ss e Al os E 5 3 8B;S 82 $/ Eos e =| se =| O ÉS E |) ESSES as — é ES sl SO s2 s ES 8) o E = ES & BS |" 8 2 &
O o sz 3 SN 2 o Ss 57 SS 83 o, os o nV OE Ss 3 o Dm 58 Som ES |E 2 DUO as ES for
GE SR SS 52 [S) a" ba ES o ê O Z ? C & "o
Z ê& 3: ê 8 Ss 83 oe $ DT Om :z & o 8 Som : ZE TOS : ES EQ :
CE TX Z
ES SS É So sr â o q $ = ss ê 2º â 2 E E | EM E É = Q os |S $ a PEIRCE) = 8 |S8S 3 e ESET) = ez2|S ê S o E | 3 &s = = 5 3 sl s 328/58 2 Es sol e SE IZS=S 8 3, Ss E eise o 25| Ss 3 ES||EE 8 Es Ss 3º 2 E 538/58] E o 2 Bo DD s Ss /º8 S 88| ES |: 115 SE) se | Oo $ 2 2 8| Sa Ss 3 = TS$| no Z E = 2o nx 2 ETE s| |3& =2É Ss oa EE: 3 28 o o 8 Ss o E3o Õ 8 ESC
3.e e o Sor E sS5 E pb o TFT239298 T=| = E La 8SSS É a É ESTES & s o s = S2Q2 TST S o = 8 2 4 = Ses25so| 58 |€ É 3 : x FE ES<TH LS 3 ã 3 8 SE 8 =| o = Bã Z =S o = O o 2 [> = 8 =| 5 S| o R as 2 ã É E É EO = É ES 8| |88 |& ê 8 Es $| | £.ºe |E 2º: 2 2 & =s/<5 | |88 ss) E É | e) *s Ez Õ Es q
BR112020006776-8A 2017-10-05 2018-10-01 decodificação de sinais de áudio BR112020006776A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762568719P 2017-10-05 2017-10-05
US62/568,719 2017-10-05
US16/147,208 2018-09-28
US16/147,208 US10580420B2 (en) 2017-10-05 2018-09-28 Encoding or decoding of audio signals
PCT/US2018/053799 WO2019070605A1 (en) 2017-10-05 2018-10-01 DECODING AUDIO SIGNALS

Publications (1)

Publication Number Publication Date
BR112020006776A2 true BR112020006776A2 (pt) 2020-10-06

Family

ID=65993423

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020006776-8A BR112020006776A2 (pt) 2017-10-05 2018-10-01 decodificação de sinais de áudio

Country Status (9)

Country Link
US (1) US10580420B2 (pt)
EP (1) EP3692528B1 (pt)
KR (1) KR102208842B1 (pt)
CN (1) CN111149156B (pt)
AU (1) AU2018345331B2 (pt)
BR (1) BR112020006776A2 (pt)
SG (1) SG11202001641VA (pt)
TW (1) TWI725343B (pt)
WO (1) WO2019070605A1 (pt)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10734001B2 (en) * 2017-10-05 2020-08-04 Qualcomm Incorporated Encoding or decoding of audio signals
US10535357B2 (en) * 2017-10-05 2020-01-14 Qualcomm Incorporated Encoding or decoding of audio signals
US10839814B2 (en) * 2017-10-05 2020-11-17 Qualcomm Incorporated Encoding or decoding of audio signals

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3561810B1 (en) * 2004-04-05 2023-03-29 Koninklijke Philips N.V. Method of encoding left and right audio input signals, corresponding encoder, decoder and computer program product
US7809580B2 (en) 2004-11-04 2010-10-05 Koninklijke Philips Electronics N.V. Encoding and decoding of multi-channel audio signals
MX2007005261A (es) 2004-11-04 2007-07-09 Koninkl Philips Electronics Nv Codificacion y descodificacion de un conjunto de senales.
US9082395B2 (en) * 2009-03-17 2015-07-14 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
EP2323130A1 (en) 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
UA107771C2 (en) * 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction
US9319159B2 (en) 2011-09-29 2016-04-19 Dolby International Ab High quality detection in FM stereo radio signal
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
US9384746B2 (en) * 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
US10360926B2 (en) * 2014-07-10 2019-07-23 Analog Devices Global Unlimited Company Low-complexity voice activity detection
US10157621B2 (en) * 2016-03-18 2018-12-18 Qualcomm Incorporated Audio signal decoding
US10734001B2 (en) * 2017-10-05 2020-08-04 Qualcomm Incorporated Encoding or decoding of audio signals
US10535357B2 (en) * 2017-10-05 2020-01-14 Qualcomm Incorporated Encoding or decoding of audio signals
US10839814B2 (en) * 2017-10-05 2020-11-17 Qualcomm Incorporated Encoding or decoding of audio signals

Also Published As

Publication number Publication date
CN111149156B (zh) 2021-03-19
AU2018345331A1 (en) 2020-03-19
WO2019070605A1 (en) 2019-04-11
SG11202001641VA (en) 2020-04-29
TW201923741A (zh) 2019-06-16
AU2018345331B2 (en) 2021-01-21
EP3692528A1 (en) 2020-08-12
TWI725343B (zh) 2021-04-21
EP3692528B1 (en) 2023-12-06
KR20200040888A (ko) 2020-04-20
US10580420B2 (en) 2020-03-03
EP3692528C0 (en) 2023-12-06
CN111149156A (zh) 2020-05-12
KR102208842B1 (ko) 2021-01-27
US20190108846A1 (en) 2019-04-11

Similar Documents

Publication Publication Date Title
EP3692525B1 (en) Decoding of audio signals
US10891961B2 (en) Encoding of multiple audio signals
TWI802595B (zh) 用於音頻信號之編碼或解碼之計算器件、方法及非暫時性電腦可讀儲存媒體
TWI791632B (zh) 用於音訊信號之編碼或解碼之器件、方法、電腦可讀儲存器件以及裝置
BR112020006776A2 (pt) decodificação de sinais de áudio
BR112019026971A2 (pt) predição residual de banda alta com extensão de largura de banda inter-canal no domínio do tempo

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]