BR112020004703A2 - estimativa de desvio temporal - Google Patents
estimativa de desvio temporal Download PDFInfo
- Publication number
- BR112020004703A2 BR112020004703A2 BR112020004703-1A BR112020004703A BR112020004703A2 BR 112020004703 A2 BR112020004703 A2 BR 112020004703A2 BR 112020004703 A BR112020004703 A BR 112020004703A BR 112020004703 A2 BR112020004703 A2 BR 112020004703A2
- Authority
- BR
- Brazil
- Prior art keywords
- comparison values
- long
- channel
- term smoothed
- value
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 283
- 230000007774 longterm Effects 0.000 claims abstract description 219
- 238000000034 method Methods 0.000 claims abstract description 114
- 230000001364 causal effect Effects 0.000 claims abstract description 92
- 230000004044 response Effects 0.000 claims abstract description 82
- 238000009499 grossing Methods 0.000 claims abstract description 70
- 239000000203 mixture Substances 0.000 claims description 16
- 238000001914 filtration Methods 0.000 claims 4
- 230000000875 corresponding effect Effects 0.000 description 73
- 230000002123 temporal effect Effects 0.000 description 24
- 238000006073 displacement reaction Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 21
- 230000003111 delayed effect Effects 0.000 description 19
- 230000005540 biological transmission Effects 0.000 description 18
- 230000008859 change Effects 0.000 description 17
- 230000007704 transition Effects 0.000 description 13
- 230000003247 decreasing effect Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 238000005070 sampling Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 230000003321 amplification Effects 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 238000012952 Resampling Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000010363 phase shift Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000007670 refining Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 2
- 238000005314 correlation function Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000010287 polarization Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- CVOFKRWYWCSDMA-UHFFFAOYSA-N 2-chloro-n-(2,6-diethylphenyl)-n-(methoxymethyl)acetamide;2,6-dinitro-n,n-dipropyl-4-(trifluoromethyl)aniline Chemical compound CCC1=CC=CC(CC)=C1N(COC)C(=O)CCl.CCCN(CCC)C1=C([N+]([O-])=O)C=C(C(F)(F)F)C=C1[N+]([O-])=O CVOFKRWYWCSDMA-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2227/00—Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
- H04R2227/003—Digital PA systems using, e.g. LAN or internet
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R27/00—Public address systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/305—Electronic adaptation of stereophonic audio signals to reverberation of the listening space
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Steroid Compounds (AREA)
Abstract
Um método de codificação para sinais de áudio multicanal inclui estimar valores de comparação em um codificador indicativos de uma quantidade de incompatibilidade temporal entre um canal de referência e um canal alvo correspondente. O método inclui suavizar os valores de comparação para gerar os primeiros valores de comparação suavizados de curto prazo e de longo prazo. O método inclui calcular um valor de correlação cruzada entre os valores de comparação e os valores de comparação suavizados de curto prazo. O método também inclui ajustar os primeiros valores de comparação suavizados de longo prazo em resposta a comparar o valor de correlação cruzada com um limite. O método adicionalmente inclui estimar um valor de desvio experimental e desviar de modo não causal o canal alvo por um valor de desvio não causal para gerar um canal alvo ajustado. O valor do desvio não causal é baseado no valor do desvio experimental. O método adicionalmente inclui gerar baseado no canal de referência e no canal alvo ajustado, pelo menos um dentre um canal de banda média ou um canal de banda lateral.
Description
”ESTIMATIVA DE DESVIO TEMPORAL” I. Referência Cruzada com Pedidos Relacionados
[001] O presente pedido reivindica a prioridade a partir do Pedido de Patente Provisório U.S. No 62/556,653, denominado “TEMPORAL OFFSET ESTIMATION”, depositado em 11 de Setembro de 2017, do Pedido de Patente U.S. o N 16/115,129, denominado “TEMPORAL OFFSET ESTIMATION”, depositado em 28 de Agosto de 2018, os quais são incorporados neste documento por referência em suas totalidades. II. Campo
[002] A presente revelação é geralmente relacionada com desvio temporal de vários canais. III. Descrição da Técnica Relacionada
[003] Os avanços na tecnologia resultaram em dispositivos de computação menores e mais poderosos. Por exemplo, atualmente existe uma variedade de dispositivos portáteis de computação pessoal, incluindo telefones não cabeados, tais como telefones móveis e smartphones, tablets e computadores laptops que são pequenos, leves e facilmente transportados pelos usuários. Esses dispositivos podem comunicar pacotes de voz e de dados através de redes não cabeadas. Adicionalmente, muitos de tais dispositivos incorporam funcionalidade adicional, tal como uma câmera fotográfica digital, uma câmera de vídeo digital, um gravador digital e um reprodutor de arquivo de áudio. Além disso, tais dispositivos podem processar instruções executáveis, incluindo aplicativos de software, tal como um aplicativo navegador de rede, que podem ser utilizadas para acessar a Internet. Assim, esses dispositivos podem incluir capacidades de computação significativas.
[004] Um dispositivo de computação pode incluir vários microfones para receber sinais de áudio. Geralmente, uma fonte de som está mais próxima de um primeiro microfone do que de um segundo microfone dos vários microfones. Consequentemente, um segundo sinal de áudio recebido a partir do segundo microfone pode ser retardado em relação a um primeiro sinal de áudio recebido a partir do primeiro microfone. Na codificação estéreo, os sinais de áudio a partir dos microfones podem ser codificados para gerar um canal médio e um ou mais canais laterais. O canal médio pode corresponder a uma soma do primeiro sinal de áudio e do segundo sinal de áudio. Um canal lateral pode corresponder a uma diferença entre o primeiro sinal de áudio e o segundo sinal de áudio. O primeiro sinal de áudio pode não estar alinhado temporalmente com o segundo sinal de áudio devido a retardo no recebimento do segundo sinal de áudio em relação ao primeiro sinal de áudio. O desalinhamento (ou "desvio temporal") do primeiro sinal de áudio em relação ao segundo sinal de áudio pode aumentar a magnitude do canal lateral. Devido ao aumento na magnitude do canal lateral, pode ser necessário um número maior de bits para codificar o canal lateral.
[005] Adicionalmente, diferentes tipos de quadro podem fazer com que o dispositivo de computação gere diferentes estimativas de deslocamentos ou desvio temporal. Por exemplo, o dispositivo de computação pode determinar que um quadro vozeado do primeiro sinal de áudio está deslocado por um quadro vozeado correspondente no segundo sinal de áudio por uma quantidade específica. Entretanto, devido a uma quantidade relativamente alta de ruído, o dispositivo de computação pode determinar que um quadro de transição (ou quadro não sonorizado) do primeiro sinal de áudio esteja deslocado por um quadro de transição correspondente (ou quadro não sonorizado correspondente) do segundo sinal de áudio por uma quantidade diferente. Variações nas estimativas de desvio podem causar repetição da amostra e salto de artefato nos limites do quadro. Adicionalmente, a variação nas estimativas de desvio pode resultar em energias mais altas do canal lateral, as quais podem reduzir a eficiência da codificação. IV. Sumário
[006] De acordo com uma implementação das técnicas reveladas neste documento, um método para estimar um deslocamento temporal entre o áudio capturado em vários microfones inclui capturar um canal de referência em um primeiro microfone e capturar um canal alvo em um segundo microfone. O canal de referência inclui um quadro de referência e o canal alvo inclui um quadro alvo. O método também inclui estimar um retardo entre o quadro de referência e o quadro alvo. O método adicionalmente inclui estimar um desvio temporal entre o canal de referência e o canal alvo baseado nos valores de correlação cruzada dos valores de comparação.
[007] De acordo com outra implementação das técnicas reveladas neste documento, um aparelho para estimar um desvio temporal entre o áudio capturado em vários microfones inclui um primeiro microfone configurado para capturar um canal de referência e um segundo microfone configurado para capturar um canal alvo. O canal de referência inclui um quadro de referência e o canal alvo inclui um quadro alvo. O aparelho também inclui um processador e uma memória armazenando instruções que são executáveis para fazer com que o processador estime um retardo entre o quadro de referência e o quadro alvo. As instruções também são executáveis para fazer com que o processador estime um desvio temporal entre o canal de referência e o canal alvo baseado nos valores de correlação cruzada dos valores de comparação.
[008] De acordo com outra implementação das técnicas reveladas neste documento, um meio não temporário legível por computador inclui instruções para estimar um desvio temporal entre o áudio capturado em vários microfones. As instruções, quando executadas por um processador, fazem com que o processador execute operações, incluindo estimar um retardo entre um quadro de referência e um quadro alvo. O quadro de referência é incluído em um canal de referência capturado em um primeiro microfone e o quadro alvo é incluído em um canal alvo capturado em um segundo microfone. As operações também incluem estimar um desvio temporal entre o canal de referência e o canal alvo baseado nos valores de correlação cruzada dos valores de comparação.
[009] De acordo com outra implementação das técnicas reveladas neste documento, um aparelho para estimar um desvio temporal entre o áudio capturado em vários microfones inclui meio para capturar um canal de referência e meio para capturar um canal alvo. O canal de referência inclui um quadro de referência e o canal alvo inclui um quadro alvo. O aparelho também inclui meio para estimar um retardo entre o quadro de referência e o quadro alvo. O aparelho adicionalmente inclui meio para estimar um desvio temporal entre o canal de referência e o canal alvo baseado nos valores de correlação cruzada dos valores de comparação.
[010] De acordo com outra implementação das técnicas reveladas neste documento, um método de desviar de forma não causal um canal inclui estimar valores de comparação em um codificador. Cada valor de comparação é indicativo de uma quantidade de incompatibilidade temporal entre um canal de referência capturado anteriormente e um canal alvo capturado anteriormente correspondente. O método também inclui suavização dos valores de comparação para gerar valores de comparação suavizados de curto prazo e os primeiros valores de comparação suavizados de longo prazo. O método também inclui calcular um valor de correlação cruzada entre os valores de comparação e os valores de comparação suavizados de curto prazo. O método também inclui comparar o valor de correlação cruzada com um limite e ajustar os primeiros valores de comparação suavizados de longo prazo para gerar segundos valores de comparação suavizados de longo prazo, em resposta a determinar que o valor da correlação cruzada excede o limite. O método adicionalmente inclui estimar um valor de desvio experimental baseado nos valores de comparação suavizados. O método também inclui desviar de forma não causal um canal alvo por um valor de desvio não causal para gerar um canal alvo ajustado que está alinhado temporalmente com um canal de referência. O valor do desvio não causal é baseado no valor do deslocamento experimental. O método adicionalmente inclui gerar, baseado no canal de referência e no canal alvo ajustado, pelo menos um de um canal de banda média ou um canal de banda lateral.
[011] De acordo com outra implementação das técnicas reveladas neste documento, um aparelho para desviar não causalmente um canal inclui um primeiro microfone configurado para capturar um canal de referência e um segundo microfone configurado para capturar um canal alvo. O aparelho também inclui um codificador configurado para estimar valores de comparação. Cada valor de comparação é indicativo de uma quantidade de incompatibilidade temporal entre um canal de referência capturado anteriormente e um canal alvo capturado anteriormente correspondente. O codificador também está configurado para suavizar os valores de comparação para gerar valores de comparação suavizados de curto prazo e os primeiros valores de comparação suavizados de longo prazo. O codificador é adicionalmente configurado para calcular um valor de correlação cruzada entre os valores de comparação e os valores de comparação suavizados de curto prazo. O codificador é adicionalmente configurado para comparar o valor de correlação cruzada com um limite e ajustar os primeiros valores de comparação suavizados de longo prazo para gerar segundos valores de comparação suavizados de longo prazo, em resposta a determinar que o valor da correlação cruzada excede o limite. O codificador é adicionalmente configurado para estimar um valor de desvio experimental baseado nos valores de comparação suavizados. O codificador também é configurado para desviar não causalmente um canal alvo por um valor de desvio não causal para gerar um canal alvo ajustado que está alinhado temporalmente com um canal de referência. O valor do deslocamento não causal é baseado no valor do deslocamento experimental. O codificador é adicionalmente configurado para gerar, baseado no canal de referência e no canal alvo ajustado, pelo menos um dentre um canal de banda média ou um canal de banda lateral.
[012] De acordo com outra implementação das técnicas reveladas neste documento, um meio não temporário legível por computador inclui instruções para desviar não causalmente um canal. As instruções, quando executadas por um codificador, fazem com que o codificador execute operações, incluindo a estimativa de valores de comparação. Cada valor de comparação é indicativo de uma quantidade de incompatibilidade temporal entre um canal de referência capturado anteriormente e um canal alvo capturado anteriormente correspondente. As operações também incluem a suavização dos valores de comparação para gerar valores de comparação suavizados de curto prazo e os primeiros valores de comparação suavizados de longo prazo. As operações também incluem calcular um valor de correlação cruzada entre os valores de comparação e os valores de comparação suavizados de curto prazo. As operações também incluem ajustar os primeiros valores de comparação suavizados de longo prazo para gerar segundos valores de comparação suavizados de longo prazo, em resposta a determinar que a correlação cruzada excede o limite. As operações também incluem estimar um valor de desvio experimental baseado nos valores de comparação suavizados. As operações também incluem desviar não causalmente um canal alvo por um valor de desvio não causal para gerar um canal alvo ajustado que está alinhado temporalmente com um canal de referência. O valor do desvio não causal é baseado no valor do desvio experimental. As operações também incluem gerar, baseado no canal de referência e no canal alvo ajustado, pelo menos um dentre um canal de banda média ou um canal de banda lateral.
[013] De acordo com outra implementação das técnicas reveladas neste documento, um aparelho para desviar não causalmente um canal inclui meio para estimar valores de comparação. Cada valor de comparação é indicativo de uma quantidade de incompatibilidade temporal entre um canal de referência capturado anteriormente e um canal alvo capturado anteriormente correspondente. O aparelho também inclui meio para suavizar os valores de comparação para gerar valores de comparação suavizados de curto prazo e meio para suavizar os valores de comparação para gerar os primeiros valores de comparação suavizados de longo prazo. O aparelho também inclui meio para calcular um valor de correlação cruzada entre os valores de comparação e os valores de comparação suavizados de curto prazo. O aparelho também inclui meio para comparar o valor de correlação cruzada com um limite, e meio para ajustar os primeiros valores de comparação suavizados de longo prazo para gerar segundos valores de comparação suavizados de longo prazo, em resposta a determinar que o valor da correlação cruzada excede o limite. O aparelho também inclui meio para estimar um valor de desvio experimental baseado nos valores de comparação suavizados. O aparelho também inclui meio para desviar não causalmente um canal alvo por um valor de desvio não causal para gerar um canal alvo ajustado que está alinhado temporalmente com um canal de referência. O valor do deslocamento não causal é baseado no valor do deslocamento experimental. O aparelho também inclui meio para gerar, baseado no canal de referência e no canal alvo ajustado, pelo menos um dentre um canal de banda média ou um canal de banda lateral. V. Breve Descrição dos Desenhos
[014] A FIG. 1 é um diagrama de blocos de um exemplo ilustrativo particular de um sistema que inclui um dispositivo operável para codificar vários canais;
[015] A FIG. 2 é um diagrama ilustrando outro exemplo de um sistema que inclui o dispositivo da FIG. 1;
[016] A FIG. 3 é um diagrama ilustrando exemplos particulares de amostras que podem ser codificadas pelo dispositivo da FIG. 1;
[017] A FIG. 4 é um diagrama ilustrando exemplos particulares de amostras que podem ser codificadas pelo dispositivo da FIG. 1;
[018] A FIG. 5 é um diagrama ilustrando um exemplo particular de um equalizador temporal e uma memória;
[019] A FIG. 6 é um diagrama ilustrando um exemplo particular de um comparador de sinal;
[020] A FIG. 7 é um diagrama ilustrando exemplos particulares de ajustar um subconjunto de valores de comparação suavizados de longo prazo baseado no valor de correlação cruzada de valores de comparação particulares;
[021] A FIG. 8 é um diagrama ilustrando outro exemplo particular de ajustar um subconjunto de valores de comparação suavizados de longo prazo;
[022] A FIG. 9 é um fluxograma ilustrando um método particular de ajustar um subconjunto de valores de comparação suavizados de longo prazo baseado em um parâmetro de ganho particular;
[023] A FIG. 10 representa gráficos ilustrando valores de comparação para quadros vozeados, quadros de transição e quadros não vozeados;
[024] A FIG. 11 é um fluxograma ilustrando um método particular de desviar não causalmente um canal baseado em um desvio temporal entre o áudio capturado em vários microfones;
[025] A FIG. 12 é um fluxograma ilustrando outro método particular de desviar não causalmente um canal baseado em um desvio temporal entre o áudio capturado em vários microfones;
[026] A FIG. 13 é um diagrama de blocos de um exemplo ilustrativo particular de um dispositivo que é operável para codificar vários canais; e
[027] A FIG. 14 é um diagrama de blocos de uma estação base que é operável para codificar vários canais. VI. Descrição Detalhada
[028] Sistemas e dispositivos operáveis para codificar vários sinais de áudio são revelados. Um dispositivo pode incluir um codificador configurado para codificar os vários sinais de áudio. Os vários sinais de áudio podem ser capturados simultaneamente no tempo utilizando vários dispositivos de gravação, por exemplo,
vários microfones. Em alguns exemplos, os vários sinais de áudio (ou áudio de multicanal) podem ser sinteticamente (por exemplo, artificialmente) gerados por multiplexar vários canais de áudio que são gravados ao mesmo tempo ou em tempos diferentes. Como exemplos ilustrativos, a gravação ou multiplexação simultânea dos canais de áudio pode resultar em uma configuração de 2 canais (ou seja, Estéreo: Esquerdo e Direito), uma configuração de 5.1 canais (Esquerdo, Direito, Central, Surround Esquerdo, Surround Direito e canais de ênfase de baixa frequência (LFE)), uma configuração de 7.1 canais, uma configuração de
7.1 + 4 canais, um configuração 22.2 canais ou uma configuração de N canais
[029] Os dispositivos de captura de áudio em salas de teleconferência (ou salas de telepresença) podem incluir vários microfones que adquirem áudio espacial. O áudio espacial pode incluir fala, bem como áudio de fundo que é codificado e transmitido. A fala / áudio a partir de uma dada fonte (por exemplo, um locutor) pode chegar aos vários microfones em momentos diferentes, dependendo de como os microfones estão dispostos, bem como de onde a fonte (por exemplo, o locutor) está localizada em relação aos microfones e as dimensões da sala. Por exemplo, uma fonte de som (por exemplo, um locutor) pode estar mais próxima de um primeiro microfone associado com o dispositivo do que de um segundo microfone associado com o dispositivo. Assim, um som emitido pela fonte de som pode alcançar o primeiro microfone mais cedo do que o segundo microfone. O dispositivo pode receber um primeiro sinal de áudio via o primeiro microfone e pode receber um segundo sinal de áudio via o segundo microfone.
[030] A codificação de mid-side (MS) e a codificação estéreo paramétrico (PS) são técnicas de codificação estéreo que podem proporcionar maior eficiência em relação às técnicas de codificação de mono duplo. Na codificação mono-duplo, o canal (ou sinal) Esquerdo (L) e o canal (ou sinal) Direito (R) são codificados independentemente, sem fazer uso da correlação entre canais. A codificação MS reduz a redundância entre um par de canais L / R correlacionados por transformar o canal Esquerdo e o canal Direito em um canal de soma e um canal de diferença (por exemplo, um canal lateral) antes da codificação. O sinal de soma e o sinal de diferença são codificados em forma de onda na codificação MS. São gastos relativamente mais bits no sinal de soma do que no sinal lateral. A codificação PS reduz a redundância em cada sub- banda, transformando os sinais L / R em um sinal de soma e em um conjunto de parâmetros laterais. Os parâmetros laterais podem indicar uma diferença de intensidade entre canais (IID), uma diferença de fase entre canais (IPD), uma diferença de tempo entre canais (ITD) etc. O sinal de soma é uma forma de onda codificada e transmitida junto com os parâmetros laterais. Em um sistema híbrido, o canal lateral pode ser codificado em forma de onda nas faixas mais baixas (por exemplo, menor do que 2 quilohertz (kHz)) codificado PS nas faixas mais altas (por exemplo, maior ou igual a 2 kHz) onde a preservação de fase entre canais é perceptivelmente menos crítica.
[031] A codificação MS e a codificação PS podem ser feitas no domínio da frequência ou no domínio da sub- banda. Em alguns exemplos, o canal Esquerdo e o canal Direito podem não estar correlacionados. Por exemplo, o canal Esquerdo e o canal Direito podem incluir sinais sintéticos não correlacionados. Quando o canal Esquerdo e o canal Direito não estão correlacionados, a eficiência de codificação da codificação MS, da codificação PS, ou ambas, pode se aproximar da eficiência de codificação da codificação mono-duplo.
[032] Dependendo da configuração de gravação, pode existir um desvio temporal entre um canal Esquerdo e um canal Direito, além de outros efeitos espaciais, tal como eco e reverberação da sala. Se o desvio temporal e a incompatibilidade de fase entre os canais não forem compensados, o canal de soma e o canal de diferença podem conter energias comparáveis, reduzindo os ganhos de codificação associados com as técnicas MS ou PS. A redução nos ganhos de codificação pode ser baseada na quantidade de desvio temporal (ou fase). As energias comparáveis do sinal de soma e do sinal de diferença podem limitar a utilização da codificação MS em alguns quadros onde os canais são desviados temporalmente, mas são altamente correlacionados. Na codificação estéreo, um canal Médio (por exemplo, um canal de soma) e um canal Lateral (por exemplo, um canal de diferença) podem ser gerados baseados na seguinte fórmula:
[033] onde M corresponde ao canal Médio, S corresponde ao canal Lateral, L corresponde ao canal Esquerdo e R corresponde ao canal Direito.
[034] Em alguns casos, o canal Médio e o canal Lateral podem ser gerados baseados na seguinte fórmula:
[035] onde c corresponde a um valor complexo que depende da frequência. Gerar o canal Médio e o canal Lateral baseados na Fórmula 1 ou na Fórmula 2 pode ser referido como executar um algoritmo de "redução". Um processo inverso de gerar o canal Esquerdo e o canal Direito a partir do canal Médio e do canal Lateral baseado na fórmula 1 ou na fórmula 2 pode ser referido como executar um algoritmo de "aumento".
[036] Uma abordagem ad-hoc utilizada para escolher entre a codificação MS ou a codificação mono-duplo para um quadro particular pode incluir gerar um sinal médio e um sinal lateral, calcular energias do sinal médio e do sinal lateral e determinar se é necessário executar a codificação MS baseada nas energias. Por exemplo, a codificação MS pode ser executada em resposta a determinar que a proporção de energias do sinal lateral e do sinal médio é menor do que um limite. Para ilustrar, se um canal Direito for desviado pelo menos pela primeira vez (por exemplo, cerca de 0,001 segundos ou 48 amostras a 48 kHz), uma primeira energia do sinal médio (correspondente à soma do sinal esquerdo e do sinal direito) pode ser comparável com uma segunda energia do sinal lateral (correspondente a uma diferença entre o sinal esquerdo e o sinal direito) para quadros de voz vozeados. Quando a primeira energia é comparável com a segunda energia, um número maior de bits pode ser utilizado para codificar o canal Lateral, reduzindo assim a eficiência de codificação da codificação MS em relação à codificação mono-duplo. A codificação mono-duplo pode, portanto, ser utilizada quando a primeira energia é comparável com a segunda energia (por exemplo, quando a proporção entre a primeira energia e a segunda energia é maior ou igual ao limite). Em uma abordagem alternativa, a decisão entre a codificação MS e a codificação mono-duplo para um quadro particular pode ser tomada baseada na comparação de um limite e valores de correlação cruzada normalizados do canal Esquerdo e do canal Direito.
[037] Em alguns exemplos, o codificador pode determinar um valor de incompatibilidade temporal indicativo de um desvio temporal do primeiro sinal de áudio em relação ao segundo sinal de áudio. O valor de incompatibilidade pode corresponder a uma quantidade de retardo temporal entre o recebimento do primeiro sinal de áudio no primeiro microfone e o recebimento do segundo sinal de áudio no segundo microfone. Adicionalmente, o codificador pode determinar o valor de incompatibilidade em uma base de quadro a quadro, por exemplo, baseado em cada quadro de fala / áudio de 20 milissegundos (ms). Por exemplo, o valor de incompatibilidade pode corresponder a uma quantidade de tempo onde um segundo quadro do segundo sinal de áudio está retardado em relação a um primeiro quadro do primeiro sinal de áudio. Alternativamente, o valor de incompatibilidade pode corresponder a uma quantidade de tempo onde o primeiro quadro do primeiro sinal de áudio está retardado em relação ao segundo quadro do segundo sinal de áudio.
[038] Quando a fonte de som está mais próxima do primeiro microfone do que do segundo microfone, os quadros do segundo sinal de áudio podem estar retardados em relação aos quadros do primeiro sinal de áudio. Nesse caso, o primeiro sinal de áudio pode ser referido como o "sinal de áudio de referência" ou o "canal de referência" e o segundo sinal de áudio retardado pode ser referido como o de "sinal de áudio alvo" ou o "canal alvo". Alternativamente, quando a fonte de som está mais próxima do segundo microfone do que do primeiro microfone, os quadros do primeiro sinal de áudio podem estar retardados em relação aos quadros do segundo sinal de áudio. Nesse caso, o segundo sinal de áudio pode ser referido como o sinal de áudio de referência ou o canal de referência e o primeiro sinal de áudio retardado pode ser referido como o sinal de áudio alvo ou o canal alvo.
[039] Dependendo de onde as fontes de som (por exemplo, locutores) estão localizadas em uma sala de conferência ou telepresença ou de como a posição da fonte de som (por exemplo, locutor) altera em relação aos microfones, o canal de referência e o canal alvo podem alterar a partir de um quadro para outro; similarmente, o valor de retardo temporal também pode alterar de um quadro para outro. Entretanto, em algumas implementações, o valor de incompatibilidade sempre pode ser positivo para indicar uma quantidade de retardo do canal "alvo" em relação ao canal de "referência". Adicionalmente, o valor de incompatibilidade pode corresponder a um valor de "desvio não causal" pelo qual o canal alvo retardado é "recuado" no tempo, de modo que o canal alvo esteja alinhado (por exemplo, alinhado ao máximo) com o canal "referência". O algoritmo de redução para determinar o canal médio e o canal lateral pode ser executado no canal de referência e no canal alvo desviado não causal.
[040] O codificador pode determinar o valor de incompatibilidade baseado no canal de áudio de referência e em vários valores de incompatibilidade aplicados ao canal de áudio alvo. Por exemplo, um primeiro quadro do canal de áudio de referência, X, pode ser recebido em um primeiro tempo (m1). Um primeiro tempo particular do canal de áudio alvo, Y, pode ser recebido em um Segundo tempo (n1) correspondente a um primeiro valor de incompatibilidade, shift1 = n1 – m1. Adicionalmente, um segundo quadro do canal de áudio de referência pode ser recebido em um terceiro tempo (m2). Um segundo quadro particular do canal de áudio alvo pode ser recebido em um quarto tempo (n2) correspondente a um segundo valor de incompatibilidade, por exemplo, shift2 = n2 – m2.
[041] O dispositivo pode executar um enquadramento ou um algoritmo de armazenamento para gerar um quadro (por exemplo, amostra de 20 ms) em uma primeira taxa de amostragem (por exemplo, taxa de amostragem de 32 kHz (ou seja, 640 amostras por quadro)). O codificador pode, em resposta a determinar que um primeiro quadro do primeiro sinal de áudio e um segundo quadro do segundo sinal de áudio chegam ao mesmo tempo no dispositivo, estimar um valor de incompatibilidade (por exemplo, shift1) como igual a zero amostras. Um canal Esquerdo (por exemplo,
correspondente ao primeiro sinal de áudio) e um canal Direito (por exemplo, correspondente ao segundo canal de áudio) podem estar temporalmente alinhados. Em alguns casos, o canal Esquerdo e o canal Direito, mesmo quando alinhados, podem diferir em energia devido a várias razões (por exemplo, a calibragem do microfone).
[042] Em alguns exemplos, o canal Esquerdo e o canal Direito podem não estar temporalmente alinhados devido a várias razões (por exemplo, uma fonte de som, tal como um locutor, pode estar mais próximo de um dos microfones do que outro, e os dois microfones podem ser maiores do que uma distância limite (por exemplo, 1 até 20 centímetros)). Uma localização da fonte de som relativa aos microfones podem introduzir retardos no canal Esquerdo e no canal Direito. Adicionalmente, podem existir uma diferença de ganho, uma diferença de energia ou uma diferença de nível entre o canal Esquerdo e o canal Direito.
[043] Em alguns exemplos, um tempo de chegada dos sinais de áudio nos microfones a partir de várias fontes de som (por exemplo, locutores) pode variar quando os vários locutores estão falando alternativamente (por exemplo, sem sobreposição). Em tal caso, o codificador pode ajustar dinamicamente um valor de incompatibilidade temporal baseado no locutor para identificar o canal de referência. Em alguns outros exemplos, os vários locutores podem estar falando ao mesmo tempo, o que pode resultar em valores de incompatibilidade temporal variados dependendo de quem é o locutor mais barulhento, o mais próximo ao microfone, etc.
[044] Em alguns exemplos, o primeiro sinal de áudio e o segundo sinal de áudio podem ser sintetizados ou gerados artificialmente quando os dois sinais potencialmente apresentam menos (por exemplo, nenhuma) correlação. Deve ser entendido que os exemplos descritos neste documento são ilustrativos e podem ser instrutivos em determinar uma relação entre o primeiro sinal de áudio e o segundo sinal de áudio em situações similares ou diferentes.
[045] O codificador pode gerar valores de comparação (por exemplo, valores de diferença ou valores de correlação cruzada) baseado na comparação de um primeiro quadro do primeiro sinal de áudio e de vários quadros do segundo sinal de áudio. Cada quadro dos vários quadros pode corresponder a um valor de incompatibilidade particular. O codificador pode gerar um primeiro valor de incompatibilidade estimado baseado nos valores de comparação. Por exemplo, o primeiro valor de incompatibilidade estimado pode corresponder a um valor de comparação indicando uma maior similaridade temporal (ou diferença menor) entre o primeiro quadro do primeiro sinal de áudio e um primeiro quadro correspondente do segundo sinal de áudio.
[046] O codificador pode determinar o valor de incompatibilidade final por refinar, em vários estágios, uma série de valores estimados de incompatibilidade. Por exemplo, o codificador pode primeiro estimar um valor de incompatibilidade "experimental" baseado nos valores de comparação gerados a partir de versões estereofônicas pré- processadas e re-amostradas do primeiro sinal de áudio e do segundo sinal de áudio.
O codificador pode gerar valores de comparação interpolados associados com valores de incompatibilidade próximos ao valor de incompatibilidade “experimental” estimado.
O codificador pode determinar um segundo valor de incompatibilidade estimado "interpolado" baseado nos valores de comparação interpolados.
Por exemplo, o segundo valor de incompatibilidade "interpolado" estimado pode corresponder a um valor de comparação interpolado particular que indica uma similaridade temporal maior (ou diferença menor) que os demais valores de comparação interpolados e o primeiro valor de incompatibilidade “experimental” estimado.
Se o segundo valor de incompatibilidade "interpolado" estimado do quadro atual (por exemplo, o primeiro quadro do primeiro sinal de áudio) for diferente de um valor de incompatibilidade final de um quadro anterior (por exemplo, um quadro do primeiro sinal de áudio que precede o primeiro quadro), então o valor de incompatibilidade "interpolado" do quadro atual é adicionalmente "reparado" para aprimorar a similaridade temporal entre o primeiro sinal de áudio e o segundo sinal de áudio desviado.
Em particular, um terceiro valor de incompatibilidade “reparado” estimado pode corresponder a uma medição mais precisa da similaridade temporal por pesquisar em torno do segundo valor de incompatibilidade "interpolado" estimado do quadro atual e o valor de incompatibilidade estimado final do quadro anterior.
O terceiro valor de incompatibilidade "reparado" estimado é adicionalmente condicionado para estimar o valor de incompatibilidade final por limitar quaisquer alterações espúrias no valor de incompatibilidade entre os quadros e adicionalmente controlados para não comutar a partir de um valor de incompatibilidade negativo para um valor de incompatibilidade positivo (ou vice-versa) em dois quadros sucessivos (ou consecutivos) como descrito neste documento.
[047] Em alguns exemplos, o codificador pode abster-se de comutar entre um valor de incompatibilidade positivo e um valor de incompatibilidade negativo ou vice- versa em quadros consecutivos ou em quadros adjacentes. Por exemplo, o codificador pode estabelecer o valor de incompatibilidade final para um valor particular (por exemplo, 0) indicando que não há desvio temporal baseado no valor de incompatibilidade "interpolado" ou "reparado" estimado do primeiro quadro e um valor de incompatibilidade final ou "interpolado" ou "reparado" estimado correspondente em um quadro particular que precede o primeiro quadro. Para ilustrar, o codificador pode definir o valor de incompatibilidade final do quadro atual (por exemplo, o primeiro quadro) para indicar nenhum desvio temporal, ou seja, shift1 = 0, em resposta a determinar que um dentre os valores de incompatibilidade “experimental” ou "interpolado” ou “reparado” estimado do quadro atual é positivo e o outro do valor de incompatibilidade "experimental” “interpolado ou “reparado”" ou "final" estimado do quadro anterior (por exemplo, o quadro que precede o primeiro quadro) é negativo. Alternativamente, o codificador também pode definir o valor de incompatibilidade final do quadro atual (por exemplo, o primeiro quadro) para indicar nenhum desvio temporal, ou seja, shiftl = 0, em resposta a determinar que um dentre o valor de incompatibilidade "experimental" ou "interpolado"
ou "reparado" estimado do quadro atual é negativo e o outro do valor de incompatibilidade "experimental" ou "interpolado" ou "reparado" ou "final" estimado do quadro anterior (por exemplo, o quadro que precede o primeiro quadro) é positivo.
[048] O codificador pode selecionar um quadro do primeiro sinal de áudio ou do segundo sinal de áudio como "referência" ou "alvo" baseado no valor de incompatibilidade. Por exemplo, em resposta a determinar que o valor de incompatibilidade final é positivo, o codificador pode gerar um canal de referência ou indicador de sinal possuindo um primeiro valor (por exemplo, 0) indicando que o primeiro sinal de áudio é um sinal de "referência" e que o segundo sinal de áudio é o sinal "alvo". Alternativamente, em resposta a determinar que o valor de incompatibilidade final é negativo, o codificador pode gerar o canal de referência ou o indicador de sinal possuindo um segundo valor (por exemplo, 1) indicando que o segundo sinal de áudio é o sinal de "referência" e que o primeiro sinal de áudio é o sinal "alvo".
[049] O codificador pode estimar um ganho relativo (por exemplo, um parâmetro de ganho relativo) associado com o sinal de referência e com o sinal alvo desviado não causal. Por exemplo, em resposta a determinar que o valor de incompatibilidade final é positivo, o codificador pode estimar um valor de ganho para normalizar ou equalizar os níveis de potência ou de energia do primeiro sinal de áudio em relação ao segundo sinal de áudio que é deslocado pelo valor de incompatibilidade não causal (por exemplo, um valor absoluto do valor de incompatibilidade final).
Alternativamente, em resposta a determinar que o valor de incompatibilidade final é negativo, o codificador pode estimar um valor de ganho para normalizar ou equalizar os níveis de potência do primeiro sinal de áudio desviado não causal em relação ao segundo sinal de áudio. Em alguns exemplos, o codificador pode estimar um valor de ganho para normalizar ou equalizar os níveis de energia ou potência do sinal de "referência" em relação ao sinal "alvo" desviado não causal. Em outros exemplos, o codificador pode estimar o valor de ganho (por exemplo, um valor de ganho relativo) baseado no sinal de referência em relação ao sinal alvo (por exemplo, o sinal alvo não desviado).
[050] O codificador pode gerar pelo menos um sinal codificado (por exemplo, um sinal médio, um sinal lateral ou ambos) baseado no sinal de referência, no sinal alvo, no valor de incompatibilidade não causal e no parâmetro de ganho relativo. O sinal lateral pode corresponder a uma diferença entre as primeiras amostras do primeiro quadro do primeiro sinal de áudio e as amostras selecionadas de um quadro selecionado do segundo sinal de áudio. O codificador pode selecionar o quadro selecionado baseado no valor de incompatibilidade final. Menos bits podem ser utilizados para codificar o canal lateral devido à diferença reduzida entre as primeiras amostras e as amostras selecionadas em comparação com outras amostras do segundo sinal de áudio que correspondem a um quadro do segundo sinal de áudio que é recebido pelo dispositivo ao mesmo tempo onde o primeiro quadro. Um transmissor do dispositivo pode transmitir o pelo menos um sinal codificado, o valor de incompatibilidade não causal, o parâmetro de ganho relativo, o canal de referencia ou indicador de sinal, ou uma combinação destes.
[051] O codificador pode gerar pelo menos um sinal codificado (por exemplo, um sinal médio, um sinal lateral ou ambos) baseado no sinal de referência, no sinal alvo, no valor de incompatibilidade não causal, no parâmetro de ganho relativo, nos parâmetros de banda baixa de um quadro particular do primeiro sinal de áudio, nos parâmetros de banda alta do quadro particular ou em uma combinação dos mesmos. O quadro particular pode preceder o primeiro quadro. Alguns parâmetros de banda baixa, parâmetros de banda alta ou uma combinação dos mesmos, de um ou mais quadros precedentes podem ser utilizados para codificar um sinal médio, um sinal lateral, ou ambos, do primeiro quadro. Codificar o sinal médio, lateral ou ambos, baseado nos parâmetros da banda baixa, nos parâmetros de banda alta, ou em uma combinação deles, pode aprimorar as estimativas do valor de incompatibilidade não causal e do parâmetro de ganho relativo entre canais. Os parâmetros de banda baixa, os parâmetros de banda alta, ou uma combinação dos mesmos, podem incluir um parâmetro de altura, um parâmetro de vozeamento, um parâmetro de tipo de codificador, um parâmetro de energia de banda baixa, um parâmetro de energia de banda alta, um parâmetro de inclinação, um parâmetro de ganho de altura, um parâmetro de ganho FCB, um parâmetro de modo de codificação, um parâmetro de atividade de voz, um parâmetro de estimativa de ruído, um parâmetro de relação sinal-ruído, um parâmetro de formantes, um parâmetro de decisão de fala / música, o desvio não causal, o parâmetro de ganho entre canais ou uma combinação dos mesmos. Um transmissor do dispositivo pode transmitir pelo menos um sinal codificado, o valor de não correspondência não causal, o parâmetro de ganho relativo, o indicador do canal de referência (ou sinal), ou uma combinação dos mesmos.
[052] Com referência à FIG. 1, um exemplo ilustrativo particular de um sistema é revelado e geralmente designado 100. O sistema 100 inclui um primeiro dispositivo 104 acoplado comunicativamente, via uma rede 120, com um segundo dispositivo 106. A rede 120 pode incluir uma ou mais redes não cabeadas, uma ou mais redes cabeadas ou uma combinação delas.
[053] O primeiro dispositivo 104 pode incluir um codificador 114, um transmissor 110, uma ou mais interfaces de entrada 112 ou uma combinação dos mesmos. Uma primeira interface de entrada das interfaces de entrada 112 pode ser acoplada com um primeiro microfone 146. Uma segunda interface de entrada da(s) interface(s) de entrada 112 pode ser acoplada com um segundo microfone 148. O codificador 114 pode incluir um equalizador temporal 108 e pode ser configurado para dowm mix e codificar vários sinais de áudio, conforme descrito neste documento. O primeiro dispositivo 104 também pode incluir uma memória 153 configurada para armazenar dados de análise 190. O segundo dispositivo 106 pode incluir um decodificador 118. O decodificador 118 pode incluir um dispositivo de equilíbrio temporal 124 que é configurado para up mix e renderizar os vários canais. O segundo dispositivo 106 pode ser acoplado com um primeiro alto-falante 142, um segundo alto-falante 144 ou com ambos.
[054] Durante a operação, o primeiro dispositivo 104 pode receber um primeiro sinal de áudio 130 (por exemplo, um primeiro canal) via a primeira interface de entrada a partir do primeiro microfone 146 e pode receber um segundo sinal de áudio 132 (por exemplo, um segundo canal) via a segunda interface de entrada do segundo microfone 148. Como utilizado neste documento, "sinal" e "canal" podem ser utilizados de forma intercambiável. O primeiro sinal de áudio 130 pode corresponder a um canal direito ou um canal esquerdo. O segundo sinal de áudio 132 pode corresponder ao outro do canal direito ou do canal esquerdo. No exemplo da FIG. 1, o primeiro sinal de áudio 130 é um canal de referência e o segundo sinal de áudio 132 é um canal alvo. Assim, de acordo com as implementações descritas neste documento, o segundo sinal de áudio 132 pode ser ajustado para se alinhar temporalmente com o primeiro sinal de áudio 130. Entretanto, como descrito abaixo, em outras implementações, o primeiro sinal de áudio 130 pode ser o canal alvo e o segundo sinal de áudio 132 pode ser o canal de referência.
[055] Uma fonte de som 152 (por exemplo, um usuário, um orador, um ruído de ambiente, um instrumento musical, etc.) pode estar mais próximo do primeiro microfone 146 do que do segundo microfone 148. Consequentemente, um sinal de áudio a partir da fonte de som 152 pode ser recebido na(s) interface(s) de entrada 112 via o primeiro microfone 146 em um tempo anterior do que via o segundo microfone 148. Esse retardo natural na aquisição de sinal multicanal através dos vários microfones pode introduzir um desvio temporal entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132.
[056] O equalizador temporal 108 pode ser configurado para estimar um deslocamento temporal entre o áudio capturado nos microfones 146, 148. O deslocamento temporal pode ser estimado baseado em um retardo entre um primeiro quadro 131 (por exemplo, um "quadro de referência") do primeiro sinal de áudio 130 e um segundo quadro 133 (por exemplo, um "quadro alvo") do segundo sinal de áudio 132, onde o segundo quadro 133 inclui conteúdo substancialmente similar ao primeiro quadro 131. Por exemplo, o equalizador temporal 108 pode determinar uma correlação cruzada entre o primeiro quadro 131 e o segundo quadro 133. A correlação cruzada pode medir a similaridade dos dois quadros em função da defasagem de um quadro em relação ao outro. Baseado na correlação cruzada, o equalizador temporal 108 pode determinar o retardo (por exemplo, defasagem) entre o primeiro quadro 131 e o segundo quadro 133. O equalizador temporal 108 pode estimar o deslocamento temporal entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 baseado no retardo e nos dados de histórico de retardos.
[057] Os dados de histórico podem incluir retardos entre os quadros capturados a partir do primeiro microfone 146 e os quadros correspondentes capturados a partir do segundo microfone 148. Por exemplo, o equalizador temporal 108 pode determinar uma correlação cruzada (por exemplo, uma defasagem) entre os quadros anteriores associados com o primeiro sinal de áudio 130 e os quadros correspondentes associados com o segundo sinal de áudio 132.
[058] Cada defasagem pode ser representada por um "valor de comparação". Ou seja, um valor de comparação pode indicar um desvio de tempo (k) entre um quadro do primeiro sinal de áudio 130 e um quadro correspondente do segundo sinal de áudio 132. De acordo com a revelação apresentada neste documento, o valor de comparação pode indicar adicionalmente uma quantidade de incompatibilidade temporal ou uma medida da similaridade ou dissimilaridade entre um primeiro quadro de referência de um canal de referência e um primeiro quadro alvo correspondente de um canal alvo. Em algumas implementações, a função de correlação cruzada entre o quadro de referência e o quadro alvo pode ser utilizada para medir a similaridade dos dois quadros em função da defasagem de um quadro em relação ao outro. De acordo com uma implementação, os valores de comparação (por exemplo, os valores de correlação cruzada) para quadros anteriores podem ser armazenados na memória
153. Um suavizador 190 do equalizador temporal 108 pode "suavizar" (ou calcular a média) os valores de comparação através de um conjunto de quadros de longo prazo e utilizar os valores de comparação suavizados de longo prazo para estimar um deslocamento temporal (por exemplo, "desvio") entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132.
[059] Para ilustrar, se CompValN(k) representa o valor de comparação em um desvio de k para o quadro N, o quadro N pode possuir valores de comparação a partir de k=T_MIN (um desvio mínimo) até k=T_MAX (um desvio máximo). A suavização pode ser executada de modo que um valor de comparação suavizado de longo prazo CompValLTN(k) seja representado por CompValLTN(k)=f(CompValN(k), CompValN-1(k), CompValLTN-2(k),...). A função na equação acima pode ser uma função de todos (ou de um subconjunto) de valores de comparação anteriores no desvio (k). Uma representação alternativa pode ser CompValLTN(k)=g (CompValN(k), CompValN- 1(k), CompValLTN-2(k),...). As funções ou podem ser filtros simples de resposta ao impulso finita (FIR) ou filtros de resposta ao impulso infinita (IIR), respectivamente. Por exemplo, a função pode ser um filtro IIR de coeficiente único, de modo que o valor de comparação suavizado de longo prazo CompValLTN(k) seja representado por CompValLTN(k)=(1-α)* CompValN(k)+(α)* CompValLTN-1(k), onde α ∈ (0, 1,0). Assim, o valor de comparação suavizado de longo prazo CompValLTN(k) pode ser baseado em uma mistura ponderada do valor de comparação instantâneo CompValN(k) no quadro N e os valores de comparação suavizados de longo prazo CompValLTN-1(k) para um ou mais quadros anteriores. À medida que o valor de α aumenta, a quantidade de suavização no valor de comparação suavizado de longo prazo aumenta. Em algumas implementações, os valores de comparação podem ser valores de correlação cruzada normalizados. Em outras implementações, os valores de comparação podem ser valores de correlação cruzada não normalizados.
[060] As técnicas de suavização descritas acima podem normalizar substancialmente a estimativa de desvio entre quadros vozeados, quadros não vozeados e quadros de transição. As estimativas de desvio normalizadas podem reduzir a repetição da amostra e o salto de artefato nos limites do quadro. Adicionalmente, as estimativas de desvio normalizadas podem resultar em energias reduzidas do canal lateral, o que pode aprimorar a eficiência da codificação.
[061] O equalizador temporal 108 pode determinar um valor de incompatibilidade final 116 (por exemplo, um valor de incompatibilidade não causal) indicativo do desvio (por exemplo, uma incompatibilidade não causal ou uma mudança não causal) do primeiro sinal de áudio 130 (por exemplo, "referência") em relação ao segundo sinal de áudio 132 (por exemplo, "alvo"). O valor de incompatibilidade final 116 pode ser baseado no valor de comparação instantânea CompValN(k) e no valor de comparação suavizado de longo prazo CompValLTN-1(K). Por exemplo, a operação de suavização descrita acima pode ser executada em um valor de incompatibilidade experimental, em um valor de incompatibilidade interpolado, em um valor de incompatibilidade reparado ou em uma combinação dos mesmos, como descrito em relação à FIG. 5. O primeiro valor de incompatibilidade 116 pode ser baseado no valor de incompatibilidade experimental, no valor de incompatibilidade interpolado e no valor de incompatibilidade reparado, conforme descrito com respeito à FIG. 5. Um primeiro valor (por exemplo, um valor positivo) do valor de incompatibilidade final 116 pode indicar que o segundo sinal de áudio 132 está retardado em relação ao primeiro sinal de áudio 130. Um segundo valor (por exemplo, um valor negativo) do valor de incompatibilidade final 116 pode indicar que o primeiro sinal de áudio 130 está retardado em relação ao segundo sinal de áudio 132. Um terceiro valor (por exemplo, 0) do valor de incompatibilidade final 116 pode indicar nenhum retardo entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132.
[062] Em algumas implementações, o terceiro valor (por exemplo, 0) do valor de incompatibilidade final 116 pode indicar que o retardo entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 mudou de sinal. Por exemplo, um primeiro quadro particular do primeiro sinal de áudio 130 pode preceder o primeiro quadro 131. O primeiro quadro particular e um segundo quadro particular do segundo sinal de áudio 132 podem corresponder ao mesmo som emitido pela fonte de som 152. O retardo entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 pode comutar de ter o primeiro quadro particular retardado em relação ao segundo quadro particular para possuir o segundo quadro 133 retardado em relação ao primeiro quadro 131. Alternativamente, o retardo entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 pode comutar a partir de ter o segundo quadro particular retardado em relação ao primeiro quadro particular possuindo o primeiro quadro 131 retardado em relação ao segundo quadro 133. O equalizador temporal 108 pode estabelecer o valor de incompatibilidade final 116 para indicar o terceiro valor (por exemplo, 0) em resposta a determinar que o retardo entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 comutou de sinal.
[063] O equalizador temporal 108 pode gerar um indicador de sinal de referência 164 baseado no valor de incompatibilidade final 116. Por exemplo, o equalizador temporal 108 pode, em resposta a determinar que o valor de incompatibilidade final 116 indica um primeiro valor (por exemplo, um valor positivo), gerar o indicador de sinal de referência 164 possuindo um primeiro valor (por exemplo, 0) indicando que o primeiro sinal de áudio 130 é um sinal de "referência". O equalizador temporal 108 pode determinar que o segundo sinal de áudio 132 corresponde a um sinal "alvo" em resposta a determinar que o valor de incompatibilidade final 116 indica o primeiro valor (por exemplo, um valor positivo). Alternativamente, o equalizador temporal 108 pode, em resposta a determinar que o valor de incompatibilidade final 116 indica um segundo valor (por exemplo, um valor negativo), gerar o indicador de sinal de referência 164 possuindo um segundo valor (por exemplo, 1) indicando que o segundo sinal de áudio 132 é o sinal de "referência". O equalizador temporal 108 pode determinar que o primeiro sinal de áudio 130 corresponde ao sinal "alvo" em resposta a determinar que o valor de incompatibilidade final 116 indica o segundo valor (por exemplo, um valor negativo). O equalizador temporal 108 pode, em resposta a determinar que o valor de incompatibilidade final 116 indica um terceiro valor (por exemplo, 0), gerar o indicador de sinal de referência 164 possuindo um primeiro valor (por exemplo, 0) indicando que o primeiro sinal de áudio 130 é um sinal de "referência". O equalizador temporal 108 pode determinar que o segundo sinal de áudio 132 corresponde a um sinal "alvo" em resposta a determinar que o valor de incompatibilidade final 116 indica o terceiro valor (por exemplo, 0). Alternativamente, o equalizador temporal 108 pode, em resposta a determinar que o valor de incompatibilidade final 116 indica o terceiro valor (por exemplo, 0), gerar o indicador de sinal de referência 164 possuindo um segundo valor (por exemplo, 1) indicando que o segundo sinal de áudio 132 é um sinal de "referência". O equalizador temporal 108 pode determinar que o primeiro sinal de áudio 130 corresponde a um sinal "alvo" em resposta a determinar que o valor de incompatibilidade final 116 indica o terceiro valor (por exemplo, 0). Em algumas implementações, o equalizador temporal 108 pode, em resposta a determinar que o valor de incompatibilidade final 116 indica um terceiro valor (por exemplo, 0), deixar o indicador de sinal de referência 164 inalterado. Por exemplo, o indicador de sinal de referência 164 pode ser o mesmo que um indicador de sinal de referência correspondendo ao primeiro quadro particular do primeiro sinal de áudio 130. O equalizador temporal 108 pode gerar um valor de incompatibilidade não causal 162 indicando um valor absoluto do valor de incompatibilidade final 116.
[064] O equalizador temporal 108 pode gerar um parâmetro de ganho 160 (por exemplo, um parâmetro de ganho codec) baseado em amostras do sinal "alvo" e baseado em amostras do sinal "referência". Por exemplo, o equalizador temporal 108 pode selecionar amostras do segundo sinal de áudio 132 baseado no valor de incompatibilidade não causal
162. Alternativamente, o equalizador temporal 108 pode selecionar amostras do segundo sinal de áudio 132 independente do valor de incompatibilidade não causal 162. O equalizador temporal 108 pode, em resposta a determinar que o primeiro sinal de áudio 130 é o sinal de referência, determinar o parâmetro de ganho 160 das amostras selecionadas baseado nas primeiras amostras do primeiro quadro 131 do primeiro sinal de áudio 130. Alternativamente, o equalizador temporal 108 pode, em resposta a determinar que o segundo sinal de áudio 132 é o sinal de referência, determinar o parâmetro de ganho 160 das primeiras amostras baseado nas amostras selecionadas.
Como um exemplo, o parâmetro de ganho 160 pode ser baseado em uma das seguintes Equações:
Equação 1a
Equação 1b
Equação 1c
Equação 1d
Equação 1e
Equação 1f
[065] onde gD corresponde ao parâmetro de ganho relativo 160 para processamento de down mix, Ref(n) corresponde a amostras do sinal de "referência", N1 corresponde ao valor de incompatibilidade não causal 162 do primeiro quadro 131 e Tar g(n + N1) corresponde a amostras do sinal "alvo". O parâmetro de ganho 160 (gD) pode ser modificado, por exemplo, baseado em uma das Equações la - 1f, para incorporar uma lógica de suavização/histerese de longo prazo para evitar grandes saltos no ganho entre os quadros. Quando o sinal alvo inclui o primeiro sinal de áudio 130, as primeiras amostras podem incluir amostras do sinal alvo e as amostras selecionadas podem incluir amostras do sinal de referência. Quando o sinal alvo inclui o segundo sinal de áudio 132, as primeiras amostras podem incluir amostras do sinal de referência e as amostras selecionadas podem incluir amostras do sinal alvo.
[066] Em algumas implementações, o equalizador temporal 108 pode gerar o parâmetro de ganho 160 baseado no tratamento do primeiro sinal de áudio 130 como um sinal de referência e no tratamento do segundo sinal de áudio 132 como um sinal alvo, independentemente do indicador de sinal de referência 164. Por exemplo, o equalizador temporal 108 pode gerar o parâmetro de ganho 160 com base em uma das Equações la – 1f onde Ref(n) corresponde a amostras (por exemplo, as primeiras amostras) do primeiro sinal de áudio 130 e Targ(n + N1) corresponde a amostras (por exemplo, as amostras selecionadas) do segundo sinal de áudio 132. Em implementações alternativas, o equalizador temporal 108 pode gerar o parâmetro de ganho 160 baseado no tratamento do segundo sinal de áudio 132 como um sinal de referência e no tratamento do primeiro sinal de áudio 130 como um sinal alvo, independentemente do indicador de sinal de referência
164. Por exemplo, o equalizador temporal 108 pode gerar o parâmetro de ganho 160 baseado em uma das Equações la - lf onde Ref(n) corresponde a amostras (por exemplo, as amostras selecionadas) do segundo sinal de áudio 132 e Targ(n + N1) corresponde a amostras (por exemplo, as primeiras amostras) do primeiro sinal de áudio 130.
[067] O equalizador temporal 108 pode gerar um ou mais sinais codificados 102 (por exemplo, um canal médio, um canal lateral ou ambos) baseado nas primeiras amostras, nas amostras selecionadas e no parâmetro de ganho relativo 160 para processamento de down mix. Por exemplo, o equalizador temporal 108 pode gerar o sinal médio baseado em uma das seguintes Equações: Equação 2a Equação 2b
[068] onde M corresponde ao canal médio, gD corresponde ao parâmetro de ganho relativo 160 para processamento de down mix, Ref(n) corresponde a amostras do sinal de "referência", N1 corresponde ao valor de incompatibilidade não causal 162 do primeiro quadro 131, e Targ(n + N1) corresponde a amostras do sinal "alvo".
[069] O equalizador temporal 108 pode gerar o canal lateral baseado em uma das seguintes Equações:
Equação 3a Equação 3b
[070] onde S corresponde ao canal lateral, gD corresponde ao parâmetro de ganho relativo 160 para processamento de down-mix, Ref(n) corresponde a amostras do sinal de "referência", N1 corresponde ao valor de incompatibilidade não causal 162 do primeiro quadro 131 e Targ(n + N1) corresponde a amostras do sinal "alvo".
[071] O transmissor 110 pode transmitir os sinais codificados 102 (por exemplo, o canal médio, o canal lateral ou ambos), o indicador de sinal de referência 164, o valor de incompatibilidade não causal 162, o parâmetro de ganho 160 ou uma combinação dos mesmos, via a rede 120, para o segundo dispositivo 106. Em algumas implementações, o transmissor 110 pode armazenar os sinais codificados 102 (por exemplo, o canal médio, o canal lateral ou ambos), o indicador de sinal de referência 164, o valor de incompatibilidade não causal 162, o parâmetro de ganho 160, ou uma combinação dos mesmos, em um dispositivo da rede 120 ou em um dispositivo local para adicionalmente processar ou decodificar posteriormente.
[072] O decodificador 118 pode decodificar os sinais codificados 102. O dispositivo de equilíbrio temporal 124 pode executar up-mix para gerar um primeiro sinal de saída 126 (por exemplo, correspondente ao primeiro sinal de áudio 130), um segundo sinal de saída 128 (por exemplo, correspondente ao segundo sinal de áudio 132), ou ambos. O segundo dispositivo 106 pode emitir o primeiro sinal de saída 126 via o primeiro alto-falante 142. O segundo dispositivo 106 pode emitir o segundo sinal de saída 128 via o segundo alto-falante 144.
[073] O sistema 100 pode, assim, permitir que o equalizador temporal 108 codifique o canal lateral utilizando menos bits do que o sinal médio. As primeiras amostras do primeiro quadro 131 do primeiro sinal de áudio 130 e as amostras selecionadas do segundo sinal de áudio 132 podem corresponder ao mesmo som emitido pela fonte de som 152 e, portanto, uma diferença entre as primeiras amostras e as amostras selecionadas pode ser menor do que entre as primeiras amostras e outras amostras do segundo sinal de áudio 132. O canal lateral pode corresponder à diferença entre as primeiras amostras e as amostras selecionadas.
[074] Com referência à FIG. 2, uma implementação ilustrativa particular de um sistema é revelada e geralmente designada 200. O sistema 200 inclui um primeiro dispositivo 204 acoplado, via a rede 120, com o segundo dispositivo 106. O primeiro dispositivo 204 pode corresponder ao primeiro dispositivo 104 da FIG. 1. O sistema 200 difere a partir do sistema 100 da FIG. 1, pelo fato de que o primeiro dispositivo 204 está acoplado com mais de dois microfones. Por exemplo, o primeiro dispositivo 204 pode ser acoplado ao primeiro microfone 146, um N-ésimo microfone 248 e com um ou mais microfones adicionais (por exemplo, o segundo microfone 148 da FIG. 1). O segundo dispositivo 106 pode ser acoplado com o primeiro alto-falante 142, com um Y-ésimo alto-falante 244, com um ou mais alto-falantes adicionais (por exemplo, o segundo alto-falante 144) ou com uma combinação dos mesmos. O primeiro dispositivo 204 pode incluir um codificador 214. O codificador 214 pode corresponder ao codificador 114 da FIG. 1. O codificador 214 pode incluir um ou mais equalizadores temporais 208. Por exemplo, os equalizadores temporais 208 podem incluir o equalizador temporal 108 da FIG. 1
[075] Durante a operação, o primeiro dispositivo 204 pode receber mais de dois sinais de áudio. Por exemplo, o primeiro dispositivo 204 pode receber o primeiro sinal de áudio 130 via o primeiro microfone 146, um N-ésimo sinal de áudio 232 via o N-ésimo microfone 248 e um ou mais sinais de áudio adicionais (por exemplo, o segundo sinal de áudio 132) via os microfones adicionais (por exemplo, o segundo microfone 148).
[076] O equalizador (equalizadores) temporal 208 pode gerar um ou mais indicadores de sinal de referência 264, valores de incompatibilidade finais 216, valores de incompatibilidade não causais 262, parâmetros de ganho 260, sinais codificados 202 ou uma combinação dos mesmos. Por exemplo, o equalizador (equalizadores) temporal 208 pode determinar que o primeiro sinal de áudio 130 é um sinal de referência e que cada um dos N-ésimos sinais de áudio 232 e os sinais de áudio adicionais são um sinal alvo. O equalizador (equalizadores) temporal 208 pode gerar o indicador de sinal de referência 164, os valores de incompatibilidade finais 216, os valores de incompatibilidade não causais 262, os parâmetros de ganho
260 e os sinais codificados 202 correspondentes ao primeiro sinal de áudio 130 e cada um dentre o N-ésimo sinal de áudio 232 e os sinais de áudio adicionais.
[077] Os indicadores de sinal de referência 264 podem incluir o indicador de sinal de referência 164. Os valores de incompatibilidade finais 216 podem incluir o valor de incompatibilidade final 116 indicativo de um desvio do segundo sinal de áudio 132 em relação ao primeiro sinal de áudio 130, um segundo valor de incompatibilidade final indicativo de um desvio do N-ésimo sinal de áudio 232 em relação ao primeiro sinal de áudio 130, ou ambos. Os valores de incompatibilidade não causal 262 podem incluir o valor de incompatibilidade não causal 162 correspondente a um valor absoluto do valor de incompatibilidade final 116, um segundo valor de incompatibilidade não causal correspondendo a um valor absoluto do segundo valor de incompatibilidade final, ou ambos. Os parâmetros de ganho 260 podem incluir o parâmetro de ganho 160 de amostras selecionadas do segundo sinal de áudio 132, um segundo parâmetro de ganho de amostras selecionadas do N-ésimo sinal de áudio 232, ou ambos. Os sinais codificados 202 podem incluir pelo menos um dos sinais codificados 102. Por exemplo, os sinais codificados 202 podem incluir o canal lateral correspondente às primeiras amostras do primeiro sinal de áudio 130 e as amostras selecionadas do segundo sinal de áudio 132, um segundo canal lateral correspondente às primeiras amostras e as amostras selecionadas do N-ésimo sinal de áudio 232, ou ambos. Os sinais codificados 202 podem incluir um canal médio correspondente às primeiras amostras, às amostras selecionadas do segundo sinal de áudio 132 e às amostras selecionadas do N-ésimo sinal de áudio 232.
[078] Em algumas implementações, o equalizador (equalizadores) temporal 208 pode determinar vários sinais de referência e sinais alvo correspondentes, como descrito com referência à FIG. 11. Por exemplo, os indicadores de sinal de referência 264 podem incluir um indicador de sinal de referência correspondente para cada par de sinal de referência e de sinal alvo. Para ilustrar, os indicadores de sinal de referência 264 podem incluir o indicador de sinal de referência 164 correspondente ao primeiro sinal de áudio 130 e ao segundo sinal de áudio 132. Os valores de incompatibilidade finais 216 podem incluir um valor de incompatibilidade final correspondente a cada par de sinal de referência e de sinal alvo. Por exemplo, os valores de incompatibilidade finais 216 podem incluir o valor de incompatibilidade final 116 correspondente ao primeiro sinal de áudio 130 e ao segundo sinal de áudio 132. Os valores de incompatibilidade não causal 262 podem incluir um valor de incompatibilidade não causal correspondente a cada par de sinal de referência e de sinal alvo. Por exemplo, os valores de incompatibilidade não causal 262 podem incluir o valor de incompatibilidade não causal 162 correspondente ao primeiro sinal de áudio 130 e ao segundo sinal de áudio 132. Os parâmetros de ganho 260 podem incluir um parâmetro de ganho correspondente a cada par de sinal de referência e de sinal alvo. Por exemplo, os parâmetros de ganho 260 podem incluir o parâmetro de ganho 160 correspondente ao primeiro sinal de áudio 130 e ao segundo sinal de áudio 132. Os sinais codificados 202 podem incluir um canal médio e um canal lateral correspondente a cada par de sinal de referência e de sinal alvo. Por exemplo, os sinais codificados 202 podem incluir os sinais codificados 102 correspondentes ao primeiro sinal de áudio 130 e ao segundo sinal de áudio 132.
[079] O transmissor 110 pode transmitir os indicadores de sinal de referência 264, os valores de incompatibilidade não causal 262, os parâmetros de ganho 260, os sinais codificados 202 ou uma combinação dos mesmos, via a rede 120, para o segundo dispositivo 106. O decodificador 118 pode gerar um ou mais sinais de saída baseado nos indicadores de sinal de referência 264, nos valores de incompatibilidade não causal 262, nos parâmetros de ganho 260, nos sinais codificados 202 ou em uma combinação dos mesmos. Por exemplo, o decodificador 118 pode emitir um primeiro sinal de saída 226 via o primeiro alto-falante 142, um Y-ésimo sinal de saída 228 via o Y- ésimo alto-falante 244, um ou mais sinais de saída adicionais (por exemplo, o segundo sinal de saída 128) via um ou mais alto-falantes adicionais (por exemplo, o segundo alto-falante 144) ou uma combinação dos mesmos.
[080] O sistema 200 pode, assim, permitir que o equalizador (equalizadores) temporal 208 codifique mais de dois sinais de áudio. Por exemplo, os sinais codificados 202 podem incluir vários canais laterais que são codificados utilizando menos bits do que os canais médios correspondentes por gerar os canais laterais baseados nos valores de incompatibilidade não causal 262.
[081] Com referência à FIG. 3, exemplos ilustrativos de amostras são apresentados e geralmente designados 300. Pelo menos um subconjunto das amostras 300 pode ser codificado pelo primeiro dispositivo 104, como descrito neste documento. As amostras 300 podem incluir as primeiras amostras 320 correspondentes ao primeiro sinal de áudio 130, as segundas amostras 350 correspondentes ao segundo sinal de áudio 132, ou ambas. As primeiras amostras 320 podem incluir uma amostra 322, uma amostra 324, uma amostra 326, uma amostra 328, uma amostra 330, uma amostra 332, uma amostra 334, uma amostra 336, uma ou mais amostras adicionais ou uma combinação das mesmas. As segundas amostras 350 podem incluir uma amostra 352, uma amostra 354, uma amostra 356, uma amostra 358, uma amostra 360, uma amostra 362, uma amostra 364, uma amostra 366, uma ou mais amostras adicionais ou uma combinação das mesmas.
[082] O primeiro sinal de áudio 130 pode corresponder a vários quadros (por exemplo, um quadro 302, um quadro 304, um quadro 306 ou uma combinação dos mesmos). Cada um dos vários de quadros pode corresponder a um subconjunto de amostras (por exemplo, correspondente a 20 ms, tal como 640 amostras em 32 kHz ou 960 amostras em 48 kHz) das primeiras amostras 320. Por exemplo, o quadro 302 pode corresponder à amostra 322, a amostra 324, uma ou mais amostras adicionais ou uma combinação das mesmas. O quadro 304 pode corresponder à amostra 326, a amostra 328, a amostra 330, a amostra 332, uma ou mais amostras adicionais ou uma combinação das mesmas. O quadro 306 pode corresponder à amostra 334, a amostra 336, uma ou mais amostras adicionais ou uma combinação das mesmas.
[083] A amostra 322 pode ser recebida na interface(s) de entrada 112 da FIG. 1 aproximadamente ao mesmo tempo em que a amostra 352. A amostra 324 pode ser recebida na interface(s) de entrada 112 da FIG. 1 aproximadamente ao mesmo tempo em que a amostra 354. A amostra 326 pode ser recebida na interface(s) de entrada 112 da FIG. 1 aproximadamente ao mesmo tempo em que a amostra 356. A amostra 328 pode ser recebida na interface(s) de entrada 112 da FIG. 1 aproximadamente ao mesmo tempo em que a amostra 358. A amostra 330 pode ser recebida na interface(s) de entrada 112 da FIG. 1 aproximadamente ao mesmo tempo em que a amostra 360. A amostra 332 pode ser recebida na interface(s) de entrada 112 da FIG. 1 aproximadamente ao mesmo tempo em que a amostra 362. A amostra 334 pode ser recebida na interface(s) de entrada 112 da FIG. 1 aproximadamente ao mesmo tempo em que a amostra 364. A amostra 336 pode ser recebida na interface(s) de entrada 112 da FIG. 1 aproximadamente ao mesmo tempo em que a amostra 366.
[084] Um primeiro valor (por exemplo, um valor positivo) do valor de incompatibilidade final 116 pode indicar que o segundo sinal de áudio 132 está retardado em relação ao primeiro sinal de áudio 130. Por exemplo, um primeiro valor (por exemplo, +X ms ou +Y amostras, onde X e Y incluem números reais positivos) do valor de incompatibilidade final 116 pode indicar que o quadro 304 (por exemplo, as amostras 326 até 332) corresponde às amostras 358 até 364. As amostras 326 até 332 e as amostras 358 até 364 podem corresponder ao mesmo som emitido pela fonte de som 152. As amostras 358 até 364 podem corresponder a um quadro 344 do segundo sinal de áudio 132. Ilustração de amostras com hachura em uma ou mais das FIGS. 1 até 14 pode indicar que as amostras correspondem ao mesmo som. Por exemplo, as amostras 326 até 332 e as amostras 358 até 364 são ilustradas com hachura na FIG. 3 para indicar que as amostras 326 até 332 (por exemplo, o quadro 304) e as amostras 358 até 364 (por exemplo, o quadro 344) correspondem ao mesmo som emitido a partir da fonte de som 152.
[085] Deve-se entendido que um deslocamento temporal de Y amostras, como apresentado na FIG. 3, é ilustrativo. Por exemplo, o deslocamento temporal pode corresponder a um número de amostras, Y, que é maior ou igual a 0. Em um primeiro caso onde o deslocamento temporal Y = 0 amostras, as amostras 326 até 332 (por exemplo, correspondendo ao quadro 304) e as amostras 356 até 362 (por exemplo, correspondentes ao quadro 344) podem apresentar alta similaridade sem qualquer deslocamento de quadro. Em um segundo caso onde o deslocamento temporal Y = 2 amostras, o quadro 304 e o quadro 344 podem ser deslocados por 2 amostras. Nesse caso, o primeiro sinal de áudio 130 pode ser recebido antes do segundo sinal de áudio 132 na(s) interface(s) de entrada 112 por Y = 2 amostras ou X = (2 / Fs) ms, onde Fs corresponde à taxa de amostragem em kHz. Em alguns casos, o deslocamento temporal, Y, pode incluir um valor não inteiro, por exemplo, Y = 1,6 amostras correspondendo a X = 0,05 ms em 32 kHz.
[086] O equalizador temporal 108 da FIG. 1 pode gerar os sinais codificados 102 por codificar as amostras 326 até 332 e as amostras 358 até 364, como descrito com referência à FIG. 1. O equalizador temporal 108 pode determinar que o primeiro sinal de áudio 130 corresponde a um sinal de referência e que o segundo sinal de áudio 132 corresponde a um sinal alvo.
[087] Com referência à FIG. 4, exemplos ilustrativos de amostras são apresentados e geralmente designados como 400. Os exemplos 400 diferem a partir dos exemplos 300, pois o primeiro sinal de áudio 130 é retardado em relação ao segundo sinal de áudio 132.
[088] Um segundo valor (por exemplo, um valor negativo) do valor de incompatibilidade final 116 pode indicar que o primeiro sinal de áudio 130 é retardado em relação ao segundo sinal de áudio 132. Por exemplo, o segundo valor (por exemplo, -X ms ou -Y amostras, onde X e Y incluem números reais positivos) do valor de incompatibilidade final 116 pode indicar que o quadro 304 (por exemplo, as amostras 326 até 332) corresponde às amostras 354 até 360. As amostras 354 até 360 podem corresponder ao quadro 344 do segundo sinal de áudio 132. As amostras 354 até 360 (por exemplo, o quadro 344) e as amostras 326 até 332 (por exemplo, o quadro 304) podem corresponder ao mesmo som emitido a partir da fonte de som
152.
[089] Deve ser entendido que um deslocamento temporal de –Y amostras, como apresentado na FIG. 4, é ilustrativo. Por exemplo, o deslocamento temporal pode corresponder a um número de amostras, -Y, que é menor ou igual a 0. Em um primeiro caso onde o deslocamento temporal Y = 0 amostras, as amostras 326 até 332 (por exemplo, correspondentes ao quadro 304) e as amostras 356 até 362 (por exemplo, correspondentes ao quadro 344) podem apresentar alta similaridade sem qualquer deslocamento de quadro. Em um segundo caso onde o deslocamento temporal Y = -6 amostras, o quadro 304 e o quadro 344 podem ser deslocados por 6 amostras. Neste caso, o primeiro sinal de áudio 130 pode ser recebido subsequentemente ao segundo sinal de áudio 132 na(s) interface(s) de entrada 112 por Y = -6 amostras ou X = (-6 / Fs) ms, onde Fs corresponde à taxa de amostragem em kHz. Em alguns casos, o deslocamento temporal, Y, pode incluir um valor não inteiro, por exemplo, Y = -3,2 amostras correspondentes a X = -0,1 ms em 32 kHz.
[090] O equalizador temporal 108 da FIG. 1 pode gerar os sinais codificados 102 por codificar as amostras 354 até 360 e as amostras 326 até 332, como descrito com referência à FIG. 1. O equalizador temporal 108 pode determinar que o segundo sinal de áudio 132 corresponde a um sinal de referência e que o primeiro sinal de áudio 130 corresponde a um sinal alvo. Em particular, o equalizador temporal 108 pode estimar o valor de incompatibilidade não causal 162 a partir do valor de incompatibilidade final 116, como descrito com referência à FIG. 5. O equalizador temporal 108 pode identificar (por exemplo, designar) um dentre o primeiro sinal de áudio 130 ou o segundo sinal de áudio 132 como um sinal de referência e o outro do primeiro sinal de áudio 130 ou o segundo sinal de áudio 132 como um sinal alvo em um sinal do valor de incompatibilidade final
116.
[091] Com referência à FIG. 5, um exemplo ilustrativo de um equalizador temporal e uma memória é apresentado e geralmente designado 500. O sistema 500 pode ser integrado ao sistema 100 da FIG. 1. Por exemplo, o sistema 100, o primeiro dispositivo 104 da FIG. 1, ou ambos, podem incluir um ou mais componentes do sistema 500. O equalizador temporal 108 pode incluir um re-amostrador 504, um comparador de sinal 506, um interpolador 510, um refinador de desvio 511, um analisador de alteração de desvio 512, um gerador de desvio absoluto 513, um designador de sinal de referência 508, um gerador de parâmetro de ganho 514, um gerador de sinal 516 ou uma combinação dos mesmos.
[092] Durante a operação, o re-amostrador 504 pode gerar um ou mais sinais re-amostrados. Por exemplo, o re- amostrador 504 pode gerar um primeiro sinal re-amostrado 530 por re-amostrar (por exemplo, amostragem descendente ou amostragem ascendente) o primeiro sinal de áudio 130 baseado em um fator (D) de re-amostragem (por exemplo, amostragem descendente ou amostragem ascendente) (por exemplo, > 1). O re-amostrador 504 pode gerar um segundo sinal re-amostrado 532 por re-amostrar o segundo sinal de áudio 132 baseado no fator de re-amostragem (D). O re- amostrador 504 pode proporcionar o primeiro sinal re- amostrado 530, o segundo sinal re-amostrado 532, ou ambos, para o comparador de sinal 506. O primeiro sinal de áudio 130 pode ser amostrado em uma primeira taxa de amostragem (Fs) para gerar as amostras 320 da FIG. 3. A primeira taxa de amostragem (Fs) pode corresponder a uma primeira taxa (por exemplo, 16 quilohertz (kHz)) associada com a largura de banda de banda larga (WB), uma segunda taxa (por exemplo, 32 kHz) associadas com a largura de banda de banda super larga (SWB), uma terceira taxa (por exemplo, 48 kHz) associada com a largura de banda de banda completa (FB) ou outra taxa. O segundo sinal de áudio 132 pode ser amostrado na primeira taxa de amostra (Fs) para gerar as segundas amostras 350 da FIG. 3.
[093] O comparador de sinal 506 pode gerar valores de comparação 534 (por exemplo, valores de diferença, valores de similaridade, valores de coerência ou valores de correlação cruzada), um valor experimental de incompatibilidade 536, ou ambos, conforme adicionalmente descrito com referência à FIG. 6. Por exemplo, o comparador de sinal 506 pode gerar os valores de comparação 534 baseado no primeiro sinal re-amostrado 530 e nos vários de valores de incompatibilidade aplicados ao segundo sinal re-amostrado 532, como adicionalmente descrito com referência à FIG. 6. O comparador de sinal 506 pode determinar o valor de incompatibilidade experimental 536 baseado nos valores de comparação 534, como adicionalmente descrito com referência à FIG. 6. De acordo com uma implementação, o comparador de sinal 506 pode recuperar valores de comparação para quadros anteriores dos sinais re-amostrados 530, 532 e pode modificar os valores de comparação 534 baseado em uma operação de suavização de longo prazo utilizando os valores de comparação para quadros anteriores. Por exemplo, os valores de comparação 534 podem incluir o valor de comparação suavizado de longo prazo CompValLTN(k) para um quadro atual (N) e pode ser representado por CompValLTN(k)=(1-α)* CompValN(k)+(α)* CompValLTN-1(k), onde α ∈ (0, 1,0). Assim, o valor de comparação suavizado de longo prazo CompValLTN(k) pode ser baseado em uma mistura ponderada do valor de comparação instantâneo CompValN(k) no quadro N e dos valores de comparação suavizados de longo prazo CompValLTN-1(k) para um ou mais quadros anteriores. À medida que o valor de α aumenta, a quantidade de suavização no valor de comparação suavizada de longo prazo aumenta. Os parâmetros de suavização (por exemplo, o valor de α) podem ser controlados/adaptados para limitar a suavização dos valores de comparação durante partes de silêncio (ou durante ruído de fundo que pode causar oscilação na estimativa de desvio). Por exemplo, os valores de comparação podem ser suavizados baseados em um fator de suavização mais alto (por exemplo, α = 0,995); caso contrário, a suavização pode ser baseada em α = 0,9. O controle dos parâmetros de suavização (por exemplo, α) pode basear-se em se a energia de fundo ou a energia de longo prazo está abaixo de um limite, baseado em um tipo de codificador ou baseado em estatísticas de valor de comparação.
[094] Em uma implementação particular, o valor dos parâmetros de suavização (por exemplo, α) pode ser baseado no nível do sinal de curto prazo (EST) e no nível do sinal de longo prazo (ELT) dos canais. Como exemplo, o nível do sinal de curto prazo pode ser calculado para o quadro (N) que está sendo processado (EST (N)) como a soma da soma dos valores absolutos das amostras de referência com amostragem descendente e a soma dos valores absolutos das amostras alvo com amostragem descendente. O nível de sinal de longo prazo pode ser uma versão suavizada dos níveis de sinal de curto prazo. Por exemplo, ELT(N)=0,6* ELT(N-1)+0,4* EST(N). Adicionalmente, o valor dos parâmetros de suavização (por exemplo, α) pode ser controlado de acordo com um pseudocódigo descrito a seguir.
[095] Estabeleça α para um valor inicial (por exemplo, 0,95). se EST > 4 * ELT, modifique o valor de α (por exemplo, α = 0,5) se EST > 2 * ELT e EST ≤ 4 * ELT, modifique o valor de α (por exemplo, α = 0,7)
[096] Em uma implementação particular, o valor dos parâmetros de suavização (por exemplo, α) pode ser controlado baseado na correlação dos valores de comparação suavizados de curto prazo e de longo prazo. Por exemplo, quando os valores de comparação do quadro atual são muito similares aos valores de comparação suavizados de longo prazo, isso é uma indicação de um locutor estacionário e isso poderia ser utilizado para controlar os parâmetros de suavização para adicionalmente aumentar a suavização (por exemplo, aumentar o valor de α). Por outro lado, quando os valores de comparação em função dos vários valores de desvio não se assemelham aos valores de comparação suavizados de longo prazo, os parâmetros de suavização podem ser ajustados (por exemplo, adaptados) para reduzir a suavização (por exemplo, diminuir o valor de α).
[097] Em uma implementação particular, o comparador de sinal 506 pode estimar valores de comparação suavizados de curto prazo (CompValSTN(k)) por suavizar os valores de comparação dos quadros nas proximidades do quadro atual que está sendo processado. Ex: . Em outras implementações, os valores de comparação suavizados de curto prazo podem ser os mesmos que os valores de comparação gerados no quadro que está sendo processado (CompValN(k)).
[098] O comparador de sinal 506 pode estimar um valor de correlação cruzada dos valores de comparação suavizados de curto e de longo prazo. Em algumas implementações, o valor de correlação cruzada (CrossCorr_CompValN) dos valores de comparação suavizados de curto e de longo prazo pode ser um valor único estimado para cada quadro (N) o qual é calculado como CrossCorr_CompValN = (∑kCompValSTN(k) * CompValLTN-1(k)) / Fac. Onde 'Fac' é um fator de normalização escolhido de modo que o CrossCorr_CompValN seja restrito entre 0 e 1. Como um exemplo não limitativo, o Fac pode ser calculado como:
[099] O comparador de sinal 506 pode estimar outro valor de correlação cruzada dos valores de comparação para um único quadro ("valores de comparação instantâneos") e valores de comparação suavizados de curto prazo. Em algumas implementações, o valor de correlação cruzada (CrossCorr_CompValN) dos valores de comparação para o quadro N ("valores de comparação instantâneos para o quadro N") e os valores de comparação suavizados de curto prazo (por exemplo, CompValSTN(k)) podem um valor único estimado para cada quadro (N) o qual é calculado como CrossCorr_CompValN = (∑kCompValSTN(k)*CompValN(k))/Fac. Onde 'Fac' é um fator de normalização escolhido de modo que o
CrossCorr_CompValN está restrito entre 0 e 1. Como um exemplo não limitativo, o Fac pode ser calculado como: Fac=
[0100] O primeiro sinal re-amostrado 530 pode incluir menos amostras ou mais amostras do que o primeiro sinal de áudio 130. O segundo sinal re-amostrado 532 pode incluir menos amostras ou mais amostras do que o segundo sinal de áudio 132. Determinar os valores de comparação 534 baseado em menos amostras dos sinais re-amostrados (por exemplo, o primeiro sinal re-amostrado 530 e o segundo sinal re-amostrado 532) pode utilizar menos recursos (por exemplo, tempo, número de operações ou ambos) do que nas amostras dos sinais originais (por exemplo, o primeiro sinal de áudio 130 e o segundo sinal de áudio 132). Determinar os valores de comparação 534 baseado em mais amostras dos sinais re-amostrados (por exemplo, o primeiro sinal re-amostrado 530 e o segundo sinal re-amostrado 532) pode aumentar a precisão do que nas amostras dos sinais originais (por exemplo, o primeiro sinal de áudio 130 e o segundo sinal de áudio 132). O comparador de sinal 506 pode proporcionar os valores de comparação 534, o valor de incompatibilidade experimental 536 ou ambos, para o interpolador 510.
[0101] O interpolador 510 pode estender o valor de incompatibilidade experimental 536. Por exemplo, o interpolador 510 pode gerar um valor de incompatibilidade interpolado 538. Por exemplo, o interpolador 510 pode gerar os valores de comparação interpolados correspondendo a valores de incompatibilidade que são próximos ao valor de incompatibilidade experimental 536 interpolando os valores de comparação 534. O interpolador 510 pode determinar o valor de incompatibilidade interpolado 538 baseado nos valores de comparação interpolados e nos valores de comparação 534. Os valores de comparação 534 podem ser baseados em uma granularidade mais grossa dos valores de incompatibilidade. Por exemplo, os valores de comparação 534 podem ser baseados em um primeiro subconjunto de um conjunto de valores de incompatibilidade, de modo que uma diferença entre um primeiro valor de incompatibilidade do primeiro subconjunto e cada segundo valor de incompatibilidade do primeiro subconjunto seja maior ou igual a um limite (por exemplo, ≥ 1). O limite pode ser baseado no fator de re-amostragem (D).
[0102] Os valores de comparação interpolados podem ser baseados em uma granularidade mais fina de valores de incompatibilidade que são próximos ao valor de incompatibilidade experimental re-amostrado 536. Por exemplo, os valores de comparação interpolados podem ser baseados em um segundo subconjunto do conjunto de valores de incompatibilidade de modo que uma diferença entre um valor de incompatibilidade mais alto do segundo subconjunto e o valor de incompatibilidade experimental re-amostrado 536 seja menor do que o limite (por exemplo, ≥ 1), e uma diferença entre um valor de incompatibilidade mais baixo do segundo subconjunto e o valor de incompatibilidade experimental re-amostrado 536 seja menor do que o limite. Determinar os valores de comparação 534 baseado na granularidade mais grossa (por exemplo, o primeiro subconjunto) do conjunto de valores de incompatibilidade pode utilizar menos recursos (por exemplo, tempo, operações ou ambos) do que determinar os valores de comparação 534 baseado em uma granularidade mais fina (por exemplo, todos) do conjunto de valores de incompatibilidade. Determinar os valores de comparação interpolados correspondentes ao segundo subconjunto de valores de incompatibilidade pode estender o valor de incompatibilidade experimental 536 baseado em uma granularidade mais fina de um conjunto menor de valores de incompatibilidade que são próximos do valor de incompatibilidade experimental 536 sem determinar valores de comparação correspondentes para cada valor de incompatibilidade do conjunto de valores de incompatibilidade. Assim, determinar o valor experimental de incompatibilidade 536 baseado no primeiro subconjunto de valores de incompatibilidade e determinar o valor de incompatibilidade interpolado 538 baseado nos valores de comparação interpolados pode equilibrar a utilização de recursos e o refinamento do valor de incompatibilidade estimado. O interpolador 510 pode proporcionar o valor de incompatibilidade interpolado 538 para o refinador de desvio 511.
[0103] De acordo com uma implementação, o interpolador 510 pode recuperar valores de comparação/incompatibilidade interpolados para quadros anteriores e pode modificar o valor de comparação/incompatibilidade interpolado 538 baseado em uma operação de suavização de longo prazo utilizando os valores de comparação/incompatibilidade interpolados para quadros anteriores. Por exemplo, o valor de incompatibilidade/comparação interpolado 538 pode incluir um valor de incompatibilidade/comparação interpolado de longo prazo InterValLTN(k) para um quadro atual (N) e pode ser representado por InterValLTN(k)=(1—α)* InterValN(k)+ (α) *InterValLTN-1(k), onde α ∈ (0, 1,0). Assim, o valor de incompatibilidade/comparação interpolado de longo prazo InterValLTN(k) pode ser baseado em uma mistura ponderada do valor de comparação/incompatibilidade interpolado instantâneo InterValN(k) no quadro N e os valores de comparação/incompatibilidade interpolados de longo prazo InterValLTN-1(k) para um ou mais quadros anteriores. À medida que o valor de α aumenta, a quantidade de suavização do valor de comparação suavizado de longo prazo aumenta.
[0104] O refinador de desvio 511 pode gerar um valor de incompatibilidade reparado 540 por refinar o valor de incompatibilidade interpolado 538. Por exemplo, o refinador de desvio 511 pode determinar se o valor de incompatibilidade interpolado 538 indica que uma mudança em um desvio entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 é maior do que um limite de alteração de desvio. A alteração no desvio pode ser indicada por uma diferença entre o valor de incompatibilidade interpolado 538 e um primeiro valor de incompatibilidade associado com o quadro 302 da FIG. 3. O refinador de desvio 511 pode, em resposta a determinar que a diferença é menor ou igual ao limite, estabelecer o valor de incompatibilidade reparado 540 para o valor de incompatibilidade interpolado 538. Alternativamente, o refinador de desvio 511 pode, em resposta a determinar que a diferença é maior do que o limite, determinar vários valores de incompatibilidade que correspondem a uma diferença que é menor ou igual ao limite de alteração de desvio. O refinador de desvio 511 pode determinar valores de comparação baseado no primeiro sinal de áudio 130 e nos vários valores de incompatibilidade aplicados ao segundo sinal de áudio 132. O refinador de desvio 511 pode determinar o valor de incompatibilidade reparado 540 baseado nos valores de comparação. Por exemplo, o refinador de desvio 511 pode selecionar um valor de incompatibilidade dos vários valores de incompatibilidade baseado nos valores de comparação e no valor de incompatibilidade interpolado. O refinador de desvio 511 pode definir o valor de incompatibilidade reparado 540 para indicar o valor de incompatibilidade selecionado. Uma diferença diferente de zero entre o primeiro valor de incompatibilidade correspondente ao quadro 302 e o valor de incompatibilidade interpolado 538 pode indicar que algumas amostras do segundo sinal de áudio 132 correspondem aos dois quadros (por exemplo, o quadro 302 e o quadro 304). Por exemplo, algumas amostras do segundo sinal de áudio 132 podem ser duplicadas durante a codificação. Alternativamente, a diferença diferente de zero pode indicar que algumas amostras do segundo sinal de áudio 132 não correspondem nem ao quadro 302 nem ao quadro
304. Por exemplo, algumas amostras do segundo sinal de áudio 132 podem ser perdidas durante a codificação. Estabelecer os valores de incompatibilidade reparados 540 para um dos vários valores de incompatibilidade pode impedir uma grande alteração nos desvios entre quadros consecutivos (ou adjacentes), e portanto, reduzir uma quantidade de perda de amostra ou de duplicação de amostra durante a codificação. O refinador de desvio 511 pode proporcionar o valor de incompatibilidade reparado 510 para o analisador de alteração de desvio 512. Em algumas implementações, o refinador de desvio 511 pode ajustar o valor de incompatibilidade interpolado 528. O refinador de desvio 511 pode determinar o valor de incompatibilidade reparado 540 baseado no valor de incompatibilidade interpolado ajustado 538.
[0105] De acordo com uma implementação, o refinador de desvio pode recuperar os valores de incompatibilidade reparados para quadros anteriores e pode modificar o valor de incompatibilidade reparado 540 baseado em uma operação de suavização de longo prazo utilizando os valores de incompatibilidade reparados para quadros anteriores. Por exemplo, o valor de incompatibilidade reparado 540 pode incluir um valor de incompatibilidade reparado de longo prazo AmendValLTN(k) para um quadro atual (N) e pode ser representado por AmendValLTN(k)=(1-α)* AmendValN (k)+(α)* AmendValLTN-1(k), onde α ∈ (0, 1,0). Assim, o valor de incompatibilidade reparado de longo prazo AmendValLTN(k) pode ser baseado em uma mistura ponderada do valor de incompatibilidade reparado instantâneo AmendValN(k) no quadro N e dos valores de incompatibilidade reparados de longo prazo AmendValN-1(k) para um ou mais quadros anteriores. À medida que o valor de α aumenta, a quantidade de suavização no valor de comparação suavizado de longo prazo aumenta.
[0106] O analisador de alteração de desvio 512 pode determinar se o valor de incompatibilidade reparado 540 indica uma mudança ou inversão na temporização entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132, conforme descrito com referência à FIG. 1. Em particular, uma inversão ou comutação na temporização pode indicar que, para o quadro 302, o primeiro sinal de áudio 130 é recebido na(s) interface(s) de entrada 112 antes do segundo sinal de áudio 132 e, para um quadro subsequente (por exemplo, o quadro 304 ou o quadro 306), o segundo sinal de áudio 132 é recebido na(s) interface(s) de entrada antes do primeiro sinal de áudio 130. Alternativamente, uma inversão ou comutação na temporização pode indicar que, para o quadro 302, o segundo sinal de áudio 132 é recebido na(s) interface(s) de entrada 112 antes do primeiro sinal de áudio 130 e, para um quadro subsequente (por exemplo, o quadro 304 ou o quadro 306), o primeiro sinal de áudio 130 é recebido na(s) interface(s) de entrada antes do segundo sinal de áudio 132. Em outras palavras, uma inversão ou comutação na temporização pode indicar que um valor de incompatibilidade final correspondente ao quadro 302 possui um primeiro sinal de que é distinto de um segundo sinal do valor de incompatibilidade reparado 540 correspondente ao quadro 304 (por exemplo, uma transição de positivo para negativo ou vice-versa). O analisador de alteração de desvio 512 pode determinar se o retardo entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 comutou o sinal baseado no valor de incompatibilidade reparado 540 e no primeiro valor de incompatibilidade associado com o quadro 302. O analisador de alteração de desvio 512 pode, em resposta a determinar que o retardo entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 comutou o sinal, estabelecer o valor de incompatibilidade final 116 como um valor (por exemplo, 0) indicando que não há desvio de tempo. Alternativamente, o analisador de alteração de desvio 512 pode estabelecer o valor de incompatibilidade final 116 para o valor de incompatibilidade reparado 540 em resposta a determinar que o retardo entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132 não comutou o sinal. O analisador de alteração de desvio 512 pode gerar um valor de incompatibilidade estimado por refinar o valor de incompatibilidade reparado 540. O analisador de alteração de desvio 512 pode estabelecer o valor de incompatibilidade final 116 para o valor de incompatibilidade estimado. Definir o valor de incompatibilidade final 116 para indicar que não há desvio de tempo pode reduzir a distorção em um decodificador por abster-se de desviar o tempo do primeiro sinal de áudio 130 e do segundo sinal de áudio 132 em direções opostas para quadros consecutivos (ou adjacentes) do primeiro sinal de áudio 130. O analisador de alteração de desvio 512 pode proporcionar o valor de incompatibilidade final 116 para o designador de sinal de referência 508, para o gerador de desvio absoluto 513, ou para ambos.
[0107] O gerador de desvio absoluto 513 pode gerar o valor de incompatibilidade não causal 162 por aplicar uma função absoluta ao valor de incompatibilidade final 116. O gerador de desvio absoluto 513 pode proporcionar o valor de incompatibilidade 162 ao gerador de parâmetro de ganho 514.
[0108] O designador de sinal de referência 508 pode gerar o indicador de sinal de referência 164. Por exemplo, o indicador de sinal de referência 164 pode possuir um primeiro valor indicando que o primeiro sinal de áudio 130 é um sinal de referência ou um segundo valor indicando que o segundo sinal de áudio 132 é o sinal de referência. O designador de sinal de referência 508 pode proporcionar o indicador de sinal de referência 164 para o gerador de parâmetro de ganho 514.
[0109] O designador de sinal de referência 508 pode adicionalmente determinar se o valor de incompatibilidade final 116 é igual a 0. Por exemplo, o designador de sinal de referência 508 pode, em resposta a determinar que o valor de incompatibilidade final 116 possui o valor particular (por exemplo, 0) indicando que não há desvio de tempo, deixar o indicador do sinal de referência 164 inalterado. Para ilustrar, o indicador de sinal de referência 164 pode indicar que o mesmo sinal de áudio (por exemplo, o primeiro sinal de áudio 130 ou o segundo sinal de áudio 132) é um sinal de referência associado com o quadro 304 e com o quadro 302.
[0110] O designador de sinal de referência 508 pode adicionalmente determinar que o valor de incompatibilidade final 116 é diferente de zero, em 1202, determinando se o valor de incompatibilidade final 116 é maior do que 0, em 1206. Por exemplo, o designador de sinal de referência 508 pode, em resposta a determinar que o valor de incompatibilidade final 116 possui um valor particular (por exemplo, um valor diferente de zero) indicar um desvio no tempo, determinar se o valor de incompatibilidade final 116 possui um primeiro valor (por exemplo, um valor positivo) indicando que o segundo o sinal de áudio 132 está retardado em relação ao primeiro sinal de áudio 130 ou um segundo valor (por exemplo, um valor negativo) indicando que o primeiro sinal de áudio 130 está retardado em relação ao segundo sinal de áudio 132.
[0111] O gerador de parâmetro de ganho 514 pode selecionar amostras do sinal alvo (por exemplo, o segundo sinal de áudio 132) baseado no valor de incompatibilidade não causal 162. Para ilustrar, o gerador de parâmetro de ganho 514 pode selecionar as amostras 358 até 364 em resposta a determinar que o valor de incompatibilidade não causal 162 possui um primeiro valor (por exemplo, + X ms ou + Y amostras, onde X e Y incluem números reais positivos). O gerador de parâmetro de ganho 514 pode selecionar as amostras 354 até 360 em resposta a determinar que o valor de incompatibilidade não causal 162 possui um segundo valor (por exemplo, -X ms ou -Y amostras). O gerador de parâmetro de ganho 514 pode selecionar as amostras 356 até 362 em resposta a determinar que o valor de incompatibilidade não causal 162 possui um valor (por exemplo, 0) indicando que não há desvio de tempo.
[0112] O gerador de parâmetro de ganho 514 pode determinar se o primeiro sinal de áudio 130 é o sinal de referência ou o segundo sinal de áudio 132 é o sinal de referência baseado no indicador de sinal de referência 164. O gerador de parâmetro de ganho 514 pode gerar o parâmetro de ganho 160 baseado nas amostras 326 até 332 do quadro 304 e nas amostras selecionadas (por exemplo, as amostras 354 até 360, as amostras 356 até 362 ou as amostras 358 até 364) do segundo sinal de áudio 132, como descrito com referência à FIG. 1. Por exemplo, o gerador de parâmetro de ganho 514 pode gerar o parâmetro de ganho 160 baseado em uma ou mais dentre a Equação la a Equação 1f, onde gD corresponde ao parâmetro de ganho 160, Ref(n) corresponde a amostras do sinal de referência, e Targ (n + N1) corresponde a amostras do sinal alvo. Para ilustrar, Ref(n) pode corresponder às amostras 326 até 332 do quadro 304 e Targ (n + tN1) pode corresponder às amostras 358 até 364 do quadro 344 quando o valor de incompatibilidade não causal 162 possuir um primeiro valor (por exemplo, +X ms ou +Y amostras, onde X e Y incluem números reais positivos). Em algumas implementações, Ref(n) pode corresponder a amostras do primeiro sinal de áudio 130 e Targ (n + N1) pode corresponder a amostras do segundo sinal de áudio 132, como descrito com referência à FIG. 1. Em implementações alternativas, Ref(n) pode corresponder a amostras do segundo sinal de áudio 132 e Targ (n + N1) pode corresponder a amostras do primeiro sinal de áudio 130, como descrito com referência à FIG. 1.
[0113] O gerador de parâmetro de ganho 514 pode proporcionar o parâmetro de ganho 160, o indicador de sinal de referência 164, o valor de incompatibilidade não causal 162, ou uma combinação dos mesmos, para o gerador de sinal 516. O gerador de sinal 516 pode gerar os sinais codificados 102, como descrito com referência à FIG. 1. Por exemplo, os sinais codificados 102 podem incluir um primeiro quadro de sinal codificado 564 (por exemplo, um quadro de canal médio), um segundo quadro de sinal codificado 566 (por exemplo, um quadro de canal lateral) ou ambos. O gerador de sinal 516 pode gerar o primeiro quadro de sinal codificado 564 baseado na Equação 2a ou na Equação
2b, onde M corresponde ao primeiro quadro de sinal codificado 564, gD corresponde ao parâmetro de ganho 160, Ref(n) corresponde a amostras do sinal de referência e Targ (n + N1) corresponde a amostras do sinal alvo. O gerador de sinal 516 pode gerar o segundo quadro de sinal codificado 566 baseado na Equação 3a ou na Equação 3b, onde S corresponde ao segundo quadro de sinal codificado 566, gD corresponde ao parâmetro de ganho 160, Ref(n) corresponde a amostras do sinal de referência, e Targ (n + N1) corresponde a amostras do sinal alvo.
[0114] O equalizador temporal 108 pode armazenar o primeiro sinal re-amostrado 530, o segundo sinal re-amostrado 532, os valores de comparação 534, o valor de incompatibilidade experimental 536, o valor de incompatibilidade interpolado 538, o valor de incompatibilidade reparado 540, o valor de incompatibilidade não causal 162, o indicador de sinal de referência 164, o valor de incompatibilidade final 116, o parâmetro de ganho 160, o primeiro quadro de sinal codificado 564, o segundo quadro de sinal codificado 566 ou uma combinação dos mesmos na memória 153. Por exemplo, os dados de análise 190 pode incluir o primeiro sinal re- amostrado 530, o segundo sinal re-amostrado 532, os valores de comparação 534, o valor de incompatibilidade experimental 536, o valor de incompatibilidade interpolado 538, o valor de incompatibilidade reparado 540, o valor de incompatibilidade não causal 162, o indicador de sinal de referência 164, o valor de incompatibilidade final 116, o parâmetro de ganho 160, o primeiro quadro de sinal codificado 564, o segundo quadro de sinal codificado 566, ou uma combinação dos mesmos.
[0115] As técnicas de suavização descritas acima podem normalizar substancialmente a estimativa de desvio entre quadros vozeados, quadros não vozeados e quadros de transição. As estimativas de desvio normalizadas podem reduzir a repetição da amostra e o salto de artefato nos limites do quadro. Adicionalmente, as estimativas de desvio normalizadas podem resultar em energias reduzidas do canal lateral, o que pode aprimorar a eficiência da codificação.
[0116] Com referência à FIG. 6, um exemplo ilustrativo de um sistema incluindo um comparador de sinal é apresentado e geralmente designado 600. O sistema 600 pode corresponder ao sistema 100 da FIG. 1. Por exemplo, o sistema 100, o primeiro dispositivo 104 da FIG. 1, ou ambos, podem incluir um ou mais componentes do sistema 700.
[0117] A memória 153 pode armazenar vários valores de incompatibilidade 660. Os valores de incompatibilidade 660 podem incluir um primeiro valor de incompatibilidade 664 (por exemplo, -X ms ou -Y amostras, onde X e Y incluem números reais positivos), um segundo valor de incompatibilidade 666 (por exemplo, + X ms ou + Y amostras, onde X e Y incluem números reais positivos) ou ambos. Os valores de incompatibilidade 660 podem variar a partir de um valor menor de incompatibilidade (por exemplo, um valor menor de incompatibilidade, T_MIN) até um valor maior de incompatibilidade (por exemplo, um valor maior de incompatibilidade, T_MAX). Os valores de incompatibilidade 660 podem indicar um desvio temporal esperado (por exemplo,
um desvio temporal máximo esperado) entre o primeiro sinal de áudio 130 e o segundo sinal de áudio 132.
[0118] Durante a operação, o comparador de sinal 506 pode determinar os valores de comparação 534 baseados nas primeiras amostras 620 e os valores de incompatibilidade 660 aplicados às segundas amostras 650. Por exemplo, as amostras 626 até 632 podem corresponder a um primeiro tempo (t). Para ilustrar, a(s) interface(s) de entrada 112 da FIG. 1 pode receber as amostras 626 até 632 correspondentes ao quadro 304 aproximadamente no primeiro tempo (t). O primeiro valor de incompatibilidade 664 (por exemplo, -X ms ou -Y amostras, onde X e Y incluem números reais positivos) pode corresponder a um segundo tempo (t- 1).
[0119] As amostras 654 até 660 podem corresponder ao segundo tempo (t-1). Por exemplo, a(s) interface(s) de entrada 112 pode receber as amostras 654 até 660 aproximadamente no segundo tempo (t-1). O comparador de sinal 506 pode determinar um primeiro valor de comparação 614 (por exemplo, um valor de diferença ou um valor de correlação cruzada) correspondente ao primeiro valor de incompatibilidade 664 baseado nas amostras 626 até 632 e nas amostras 654 até 660. Por exemplo, o primeiro valor de comparação 614 pode corresponder a um valor absoluto de correlação cruzada das amostras 626 até 632 e das amostras 654 até 660. Como outro exemplo, o primeiro valor de comparação 614 pode indicar uma diferença entre as amostras 626 até 632 e as amostras 654 até 660.
[0120] O segundo valor de incompatibilidade 666 (por exemplo, +X ms ou +Y amostras, onde X e Y incluem números reais positivos) pode corresponder a um terceiro tempo (t + 1). As amostras 658 até 664 podem corresponder ao terceiro tempo (t + 1). Por exemplo, a(s) interface(s) de entrada 112 pode receber as amostras 658 até 664 aproximadamente no terceiro tempo (t + 1). O comparador de sinal 506 pode determinar um segundo valor de comparação 616 (por exemplo, um valor de diferença ou um valor de correlação cruzada) correspondente ao segundo valor de incompatibilidade 666 baseado nas amostras 626 até 632 e nas amostras 658 até 664. Por exemplo, o segundo valor de comparação 616 pode corresponder a um valor absoluto de correlação cruzada das amostras 626 até 632 e das amostras 658 até 664. Como outro exemplo, o segundo valor de comparação 616 pode indicar uma diferença entre as amostras 626 até 632 e as amostras 658 até 664. Como outro exemplo, o segundo valor de comparação 616 pode indicar uma diferença entre as amostras 626 até 632 e as amostras 658 até 664. O comparador de sinal 506 pode armazenar os valores de comparação 534 na memória 153. Por exemplo, os dados de análise 190 podem incluir os valores de comparação
534.
[0121] O comparador de sinal 506 pode identificar um valor de comparação selecionado 636 dos valores de comparação 534 que possuem um valor mais alto (ou mais baixo) do que outros valores dos valores de comparação 534. Por exemplo, o comparador de sinal 506 pode selecionar o segundo valor de comparação 616 como o valor de comparação selecionado 636 em resposta a determinar que o segundo valor de comparação 616 é maior ou igual ao primeiro valor de comparação 614. Em algumas implementações, os valores de comparação 534 podem corresponder a valores de correlação cruzada. O comparador de sinal 506 pode, em resposta a determinar que o segundo valor de comparação 616 é maior do que o primeiro valor de comparação 614, determinar que as amostras 626 até 632 possuem uma correlação mais alta com as amostras 658 até 664 do que com as amostras 654 até 660. O comparador de sinal 506 pode selecionar o segundo valor de comparação 616 que indica a correlação mais alta como o valor de comparação selecionado 636. Em outras implementações, os valores de comparação 534 podem corresponder a valores de diferença. O comparador de sinal 506 pode, em resposta a determinar que o segundo valor de comparação 616 é menor que o primeiro valor de comparação 614, determinar que as amostras 626 até 632 possuem uma maior similaridade com (por exemplo, uma menor diferença para) as amostras 658 até 664 do que as amostras 654 até 660. O comparador de sinal 506 pode selecionar o segundo valor de comparação 616 que indica uma diferença menor como o valor de comparação selecionado 636.
[0122] O valor de comparação selecionado 636 pode indicar uma correlação mais alta (ou uma diferença mais baixa) do que os outros valores dos valores de comparação 534. O comparador de sinal 506 pode identificar o valor de incompatibilidade experimental 536 dos valores de incompatibilidade 660 que corresponde ao valor de comparação selecionado 636. Por exemplo, o comparador de sinal 506 pode identificar o segundo valor de incompatibilidade 666 como o valor de incompatibilidade experimental 536 em resposta a determinar que o segundo valor de incompatibilidade 666 corresponde ao valor de comparação selecionado 636 (por exemplo, o segundo valor de comparação 616).
[0123] Referindo-se a FIG. 7, exemplos ilustrativos de ajustar um subconjunto de valores de comparação suavizados de longo prazo são apresentados e geralmente designados como 700. O exemplo 700 pode ser executados pelo equalizador temporal 108, pelo codificador 114, pelo primeiro dispositivo 104 da FIG. 1, pelo(s) equalizador (equalizadores) temporal (temporais) 208, pelo codificador 214, pelo primeiro dispositivo 204 da FIG. 2, pelo comparador de sinal 506 da FIG. 5, ou por uma combinação dos mesmos.
[0124] O canal de referência (“Ref(n)”) 701 pode correspondera um primeiro sinal de áudio 130 e pode incluir vários quadros de referência incluindo um quadro N 710 do canal de referência 701. O canal alvo (“Targ(n)”) 701 pode corresponder a um segundo sinal de áudio 132 e pode incluir vários quadros alvos incluindo um quadro N 720 do canal alvo 702. O codificador 114 ou o equalizador temporal 108 pode estimar valores de comparação 730 para o quadro N 710 do canal de referência 701 e para o quadro N 720 do canal alvo 702. Cada valor de comparação pode ser indicativo de uma quantidade de incompatibilidade temporal, ou de uma medida de similaridade ou de dissimilaridade entre o quadro de referência N 710 do canal de referência 701 e um quadro alvo correspondente N 720 de um canal alvo
702. Em algumas implementações, os valores de correlação cruzada entre o quadro de referência e o quadro alvo podem ser utilizados para medir a similaridade dos dois quadros em função da defasagem de um quadro em relação ao outro. Por exemplo, os valores de comparação para o quadro N (CompValN(k)) 735 podem ser os valores de correlação cruzada entre o quadro N 710 do canal de referência e o quadro N 720 do canal alvo.
[0125] O codificador 114 ou o equalizador temporal 108 pode suavizar os valores de comparação para gerar valores de comparação suavizados de curto prazo. Os valores de comparação suavizados de curto prazo (por exemplo, CompValSTN(k) para o quadro N) podem ser estimados como uma versão suavizada dos valores de comparação dos quadros nas proximidades do quadro N 710 e 720. Para ilustrar, os valores de comparação de curto prazo podem ser gerados como uma combinação linear de vários valores de comparação do quadro atual (quadro N) e os quadros anteriores (por exemplo, CompValSTN(k)= . Em implementações alternativas, uma ponderação não uniforme pode ser aplicada para os vários valores de comparação para o quadro N e para os quadros anteriores.
[0126] O codificador 114 ou o equalizador temporal 108 pode suavizar os valores de comparação para gerar os primeiros valores de comparação suavizados de longo prazo 755 para o quadro N baseado em um parâmetro de suavização. A suavização pode ser executada de modo que os primeiros valores de comparação suavizados de longo prazo CompValLTN(k) (por exemplo, os primeiros valores de comparação suavizados de longo prazo 755) sejam representados por CompValLTN(k)=f (CompValN(k), CompValN-
1(k), CompValN-2(k), ...). A função na equação acima pode ser uma função de todos (ou um subconjunto) os valores de comparação anteriores no desvio (k). Uma representação alternativa deste pode ser CompValLTN(k) = g(CompValN(k), CompValN-1(k), CompValN-2(k), ...). As funções ou g podem ser filtros simples de resposta ao impulso finita (FIR) ou filtros de resposta ao impulso infinita (IIR), respectivamente. Por exemplo, a função g pode ser um filtro IIR de coeficiente único, de modo que os primeiros valores de comparação suavizados de longo prazo 755 sejam representados por CompValLTN(k) = (1 - α) * CompValN(k) + (α) * CompValLTN-1(k), onde α ∈ (0, 1,0). Assim, os valores de comparação suavizados de longo prazo CompValLTN(k) podem ser baseados em uma mistura ponderada dos valores de comparação instantâneos CompValN(k) para o quadro N 710 e 720 e os valores de comparação suavizados de longo prazo CompValLTN-1(k) para um ou mais quadros anteriores.
[0127] O codificador 114 ou o equalizador temporal 108 pode calcular um valor de correlação cruzada dos valores de comparação e dos valores de comparação suavizados de curto prazo. Por exemplo, o codificador 114 ou o equalizador temporal 108 pode calcular um valor de correlação cruzada (CrossCorr_CompValN) 765 dos valores de comparação CompValN(k) 735 para o quadro N 710 e 720 e valores de comparação suavizados de curto prazo CompValSTN(k) 745 para o quadro N 710 e 720. Em algumas implementações, o valor de correlação cruzada (CrossCorr_CompValN) 765 pode ser um valor único estimado, o qual é calculado como CrossCorr_CompValN = ∑k CompValSTN (k) * CompValN(k)) / Fac. Onde 'Fac' é um fator de normalização escolhido de modo que o CrossCorr_CompValN 765 seja restrito entre 0 e 1. Como um exemplo não limitativo, Fac pode ser calculado como: Fac =
[0128] Alternativamente, o codificador 114 ou o equalizador temporal 108 pode calcular um valor de correlação cruzada dos valores de comparação suavizados de curto prazo e de longo prazo. Em algumas implementações, o valor de correlação cruzada (CrossCorr_CompValN) 765 dos valores de comparação suavizados de curto prazo CompValSTN(k) 745 para o quadro N 710 e 720 e os valores de comparação suavizados de longo prazo CompValLTN(k) 755 para o quadro N 710 e 720 pode ser um valor único o qual é calculado como CrossCorr_CompValN = Σk CompValSTN(k) * CompValLTN-1(k)) / Fac. Onde 'Fac' é um fator de normalização escolhido de forma que o CrossCorr_CompValN 765 seja restrito entre 0 e 1. Como um exemplo não limitativo, Fac pode ser calculado como: Fac =
[0129] O codificador 114 ou o equalizador temporal 108 pode comparar o valor de correlação cruzada dos valores de comparação (CrossCorr_CompValN) 765 com um limite e pode ajustar um todo ou alguma parte dos primeiros valores de comparação suavizados de longo prazo 755. Em algumas implementações, o codificador 114 ou o equalizador temporal 108 pode aumentar (ou amplificar ou polarizar) alguns valores de um subconjunto dos primeiros valores de comparação suavizados de longo prazo 755 em resposta a determinar que o valor de correlação cruzada dos valores de comparação (CrossCorr_CompValN) 765 excedem o limite.
Por exemplo, quando o valor de correlação cruzada dos valores de comparação (CrossCorr_CompValN) é maior ou igual a um limite (por exemplo, 0,8), isso pode indicar que o valor de correlação cruzada entre os valores de comparação é bastante forte ou alto, indicando pequenas ou nenhuma variação dos valores de desvio temporal entre os quadros adjacentes.
Portanto, o valor estimado do desvio temporal do quadro atual (por exemplo, o quadro N) não pode estar muito longe dos valores do desvio temporal do quadro anterior (por exemplo, o quadro N - l) ou dos valores do desvio temporal de qualquer outro quadro anterior.
Os valores do desvio temporal podem ser um dentre um valor de incompatibilidade experimental 536, um valor de incompatibilidade interpolado 538, um valor de incompatibilidade reparado 540, um valor de incompatibilidade final 116 ou um valor de incompatibilidade não causal 162. Portanto, o codificador 114 ou o equalizador temporal 108 pode aumentar (ou amplificar ou polarizar) alguns valores de um subconjunto dos primeiros valores de comparação suavizados de longo prazo 755, por exemplo, por um fator de 1,2 (amplificação ou aumento de 20%) para gerar um segundo valor de comparação suavizado de longo prazo.
Essa amplificação ou polarização pode ser implementada por multiplicar um fator de escalonamento ou por adicionar um deslocamento aos valores dentro do subconjunto dos primeiros valores de comparação suavizados de longo prazo 755.
[0130] Em algumas implementações, o codificador 114 ou o equalizador temporal 108 pode amplificar ou polarizar o subconjunto dos primeiros valores de comparação suavizados de longo prazo 755, de modo que o subconjunto possa incluir um índice correspondente ao valor do desvio temporal do quadro anterior (por exemplo, o quadro N - l). Adicionalmente, ou alternativamente, o subconjunto pode adicionalmente incluir um índice em torno da vizinhança do valor do desvio temporal do quadro anterior (por exemplo, o quadro N - l). Por exemplo, a vizinhança pode significar dentro de -delta (por exemplo, delta está na faixa de 1 até 5 amostras em uma concretização preferida) e +delta do valor de desvio temporal do quadro anterior (por exemplo, quadro N - l).
[0131] Com referência à FIG. 8, exemplos ilustrativos de ajustar de um subconjunto de valores de comparação suavizados de longo prazo são apresentados e geralmente designados como 800. O exemplo 800 pode ser executado pelo equalizador temporal 108, pelo codificador 114, pelo primeiro dispositivo 104 da FIG. 1, pelo(s) equalizador (equalizadores) temporal (temporais) 208, pelo codificador 214, pelo primeiro dispositivo 204 da FIG. 2, pelo comparador de sinal 506 da FIG. 5, ou por uma combinação dos mesmos.
[0132] O eixo geométrico x dos gráficos 830, 840, 850 e 860 representa o valor de desvio negativo para o valor de desvio positivo e o eixo geométrico y dos gráficos 830, 840, 850 e 860 representa valores de comparação (por exemplo, os valores de correlação cruzada). Em alguma implementação, o eixo geométrico y dos gráficos 830, 840,
850 e 860 no exemplo 800 pode ilustrar os valores de comparação suavizados de longo prazo CompValLTN(k) 755 para qualquer quadro particular (por exemplo, o quadro N), mas, alternativamente, podem ser os valores de comparação suavizados de curto prazo CompValSTN(k) 745 para qualquer quadro em particular (por exemplo, o quadro N).
[0133] O exemplo 800 ilustra casos apresentando que um subconjunto dos valores de comparação suavizados de longo prazo (por exemplo, os primeiros valores de comparação suavizados de longo prazo CompValLTN(k) 755) pode ser ajustado. Ajustar um subconjunto dos valores de comparação suavizados de longo prazo no exemplo 800 pode incluir o aumento de alguns valores do subconjunto dos valores de comparação suavizados de longo prazo (por exemplo, os primeiros valores de comparação suavizados de longo prazo CompValLTN(k) 755) por um algum fator. Aumentar alguns valores contidos neste documento pode ser referido como "enfatizar" (ou alternadamente "amplificar" ou "polarizar") alguns valores. Ajustar o subconjunto dos valores de comparação suavizados de longo prazo no exemplo 800 também pode incluir diminuir alguns valores do subconjunto dos valores de comparação suavizados de longo prazo (por exemplo, os primeiros valores de comparação suavizados de longo prazo CompValLTN(k) 755) por algum fator. Diminuir alguns valores neste documento pode ser referido como "retirar a ênfase" de alguns valores.
[0134] O Caso #1 na FIG. 8 ilustra um exemplo de ênfase do lado de desvio negativo 830, onde alguns valores de um subconjunto dos valores de comparação suavizados de longo prazo podem ser aumentados (enfatizados ou amplificados ou polarizados) por algum fator. Por exemplo, o codificador 114 ou o equalizador temporal 108 pode aumentar os valores 834 correspondentes à metade esquerda do índice x (um lado de desvio negativo 810) do gráfico (por exemplo, os primeiros valores de comparação suavizados de longo prazo CompValLTN(k) 755) por algum fator (por exemplo, 1,2, o qual indica aumento ou amplificação de 20% em valores), gerando valores aumentados 838. O Caso #2 ilustra outro exemplo de ênfase do lado de desvio positivo 840, onde alguns valores de um subconjunto dos valores de comparação suavizados de longo prazo podem ser aumentados (enfatizados, amplificados ou polarizados) por algum fator. Por exemplo, o codificador 114 ou o equalizador temporal 108 pode aumentar os valores 844 correspondentes à metade direita do índice x (um lado de desvio positivo 820) do gráfico (por exemplo, os primeiros valores de comparação suavizados de longo prazo CompValLTN(k) 755) por algum fator (por exemplo, 1,2, o qual indica aumento ou amplificação de 20% dos valores), gerando valores aumentados 848.
[0135] O Caso #3 na FIG. 8 ilustra um exemplo de ênfase de lado de desvio negativo 850, onde alguns valores de um subconjunto dos valores de comparação suavizados de longo prazo podem ser diminuídos (ter a ênfase retirada) por algum fator. Por exemplo, o codificador 114 ou o equalizador temporal 108 pode diminuir os valores 854 correspondentes à metade esquerda do índice x (um lado de desvio negativo 810) do gráfico (por exemplo, os primeiros valores de comparação suavizados de longo prazo 755) por algum fator (por exemplo, 0,8, o qual indica 20% de diminuição ou retirada de ênfase dos valores), gerando valores diminuídos 858. O Caso #4 ilustra outro exemplo de retirada de ênfase do lado de desvio positivo 860, onde os valores de um subconjunto dos valores de comparação suavizados de longo prazo podem ser diminuídos (ou terem a ênfase retirada) por algum fator. Por exemplo, o codificador 114 ou o equalizador temporal 108 pode diminuir os valores 864 correspondendo à metade direita do índice x (um lado de desvio positivo 820) do gráfico (por exemplo, os valores de comparação suavizados de longo prazo 755) por algum fato (por exemplo, 0,8, o qual indica a diminuição ou retirada de ênfase de 20% nos valores), gerando valores diminuídos 868.
[0136] Quatro casos na FIG. 8 são apresentados somente com propósitos ilustrativos e, portanto, quaisquer variações ou valores ou fatores utilizados neste documento não são pretendidos como sendo exemplos limitativos. Por exemplo, todos os quatro casos na FIG. 8 ilustram ajustar todos os valores na metade esquerda ou direita do eixo geométrico x do gráfico. Entretanto, em algumas implementações, pode ser possível que somente um subconjunto de valores no eixo geométrico x positivo ou negativo possa ser ajustado. Em outro exemplo, todos os quatro casos na FIG. 8 ilustram valores de ajuste por algum fator (por exemplo, um fator de escalonamento). Entretanto, em algumas implementações, vários fatores podem ser utilizados para diferentes regiões do eixo geométrico x dos gráficos no exemplo 800. Adicionalmente, os valores de ajuste por algum fator podem ser implementados por multiplicar um fator de escalonamento ou por adicionar ou subtrair um valor de deslocamento de ou a partir dos valores.
[0137] Com referência à FIG. 9, um método 900 de ajustar um subconjunto de valores de comparação suavizados de longo prazo baseado em um parâmetro de ganho particular é apresentado. O método 900 pode ser executado pelo equalizador temporal 108, pelo codificador 114, pelo primeiro dispositivo 104 da FIG. 1, ou por uma combinação dos mesmos.
[0138] O método 900 inclui calcular um parâmetro de ganho (gD) para um quadro anterior (por exemplo, o quadro N - l), em 910. O parâmetro de ganho em 900 pode ser um parâmetro de ganho 160 na FIG. 1. Em algumas implementações, o equalizador temporal 108 pode gerar o parâmetro de ganho 160 (por exemplo, um parâmetro de ganho ou ganho alvo do codec) baseado em amostras do canal alvo e baseado em amostras do canal de referência. Por exemplo, o equalizador temporal 108 pode selecionar amostras do segundo sinal de áudio 132 baseado no valor de incompatibilidade não causal 162. Alternativamente, o equalizador temporal 108 pode selecionar amostras do segundo sinal de áudio 132 independente do valor de incompatibilidade não causal 162. O equalizador temporal 108 pode, em resposta a determinar que o primeiro sinal de áudio 130 é o canal de referência, determinar o parâmetro de ganho 160 das amostras selecionadas baseado nas primeiras amostras do primeiro quadro 131 do primeiro sinal de áudio 130. Alternativamente, o equalizador temporal 108 pode, em resposta a determinar que o segundo sinal de áudio
132 é o canal de referência, determinar o parâmetro de ganho 160 baseado em uma energia de um quadro de referência do canal de referência e em uma energia de um quadro alvo do canal alvo. Como um exemplo, o parâmetro de ganho 160 pode ser calculado ou gerado baseado em uma ou mais das equações la, lb, lc, 1d, le ou 1f. Em algumas implementações, o parâmetro de ganho 160 (gD) pode ser modificado ou suavizado através de vários quadros por quaisquer algoritmos de suavização conhecidos ou, alternativamente, por histerese para evitar grandes saltos em ganho entre os quadros.
[0139] O codificador 114 ou o equalizador temporal 108 pode comparar o parâmetro de ganho com um limite (por exemplo, Thrl ou Thr2), em 920 e 950. Quando o parâmetro de ganho 160 (gD), baseado em uma ou mais das equações la até 1f , é maior que 1, pode indicar que o primeiro sinal de áudio 130 (ou canal esquerdo) é um canal principal ("um canal de referência") e, portanto, é mais provável que os valores de desvio ("valores de desvio temporal") sejam valores positivos. Os valores de desvio temporal podem ser um dentre um valor de incompatibilidade experimental 536, um valor de incompatibilidade interpolado 538, um valor de incompatibilidade reparado 540, um valor de incompatibilidade final 116 ou um valor de incompatibilidade não causal 162. Portanto, pode ser vantajoso enfatizar (ou aumentar ou amplificar ou polarizar) os valores no lado do desvio positivo e/ou por retirar a ênfase (ou diminuir) dos valores no lado do desvio negativo.
[0140] Quando o parâmetro de ganho 160 (gD), o qual é calculado baseado em uma ou mais das Equações la até 1f, for maior que 1, pode significar que o primeiro sinal de áudio 130 (ou canal esquerdo) é um canal principal ("um canal de referência") e, portanto, é mais provável que os valores de desvio ("valores de desvio temporal") sejam positivos. Os valores de desvio temporal podem ser um dentre um valor de incompatibilidade experimental 536, um valor de incompatibilidade interpolado 538, um valor de incompatibilidade reparado 540, um valor de incompatibilidade final 116 ou um valor de incompatibilidade não causal 162. Portanto, a probabilidade de determinar um valor de desvio não causal correto pode ser vantajosamente aprimorada por enfatizar (ou aumentar ou amplificar ou interpolar) os valores no lado do deslocamento positivo e/ou por retirar a ênfase (ou diminuir) os valores no lado do deslocamento negativo.
[0141] Quando o parâmetro de ganho 160 (gD), o qual é calculado baseado em uma ou mais das Equações la até 1f, for menor que 1, pode significar que o segundo sinal de áudio 130 (ou canal direito) é um canal principal ("um canal de referência") e, portanto, é mais provável que os valores de desvio ("valores de desvio temporal") seriam negativos. A probabilidade de determinar um valor de desvio não causal correto pode ser vantajosamente aprimorada por enfatizar (ou aumentar ou amplificar ou polarizar) os valores no lado do deslocamento negativo e/ou por retirar a ênfase (ou diminuir) dos valores no lado do deslocamento positivo.
[0142] Em algumas implementações, o codificador 114 ou o equalizador temporal 108 pode comparar o parâmetro de ganho 160 (gD) com um primeiro limite (por exemplo, Thrl = 1,2) ou outro limite (por exemplo, Thr2 = 0,8). Para propósitos ilustrativos, a FIG. 9 apresenta a primeira comparação entre o parâmetro de ganho 160 (gD) e um Thrl em 920 vem antes da segunda comparação entre o parâmetro de ganho 160 (gD) e um Thr2 em 950. Entretanto, a ordem entre a primeira comparação 920 e a segunda comparação 950 pode ser invertida sem perda de generalidade. Em algumas implementações, qualquer uma dentre a primeira comparação 920 e a segunda comparação 950 pode ser executada sem a outra comparação.
[0143] O codificador 114 ou o equalizador temporal 108 pode ajustar um primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo para gerar segundos valores de comparação suavizados de longo prazo, em resposta ao resultado da comparação. Por exemplo, quando o parâmetro de ganho 160 (gD) é maior do que um primeiro limite (por exemplo, Thrl = 1,2), o método 900 pode ajustar um subconjunto dos primeiros valores de comparação suavizados de longo prazo em pelo menos um dentre enfatizar o lado do desvio positivo (por exemplo, caso nº 2 830 e 930) e retirar a ênfase no lado do desvio negativo (por exemplo, caso nº 3 840 e 940) para evitar saltos espúrios nos sinais (positivos ou negativos) dos valores de desvio temporal entre os quadros adjacentes. Em algumas implementações, o Caso nº 2 (por exemplo, ênfase no lado do desvio positivo) e o Caso nº 3 (ênfase do lado do desvio negativo) podem ser executados em qualquer ordem entre eles. Alternativamente, quando o Caso nº 2 (por exemplo, ênfase no lado de desvio positivo) foi selecionado para enfatizar o lado do desvio positivo, os valores do outro lado (por exemplo, o lado negativo) podem ser zerados, ao invés de executar o caso nº 3, para reduzir o risco de detectar incorretamente o sinal dos valores de desvio temporal.
[0144] Adicionalmente, quando o parâmetro de ganho 160 (gD) é menor do que um segundo limite (por exemplo, Thr2 = 0,8), o método 900 pode ajustar um subconjunto dos primeiros valores de comparação suavizados de longo prazo por pelo menos um entre enfatizar o lado de desvio negativos (por exemplo, caso nº 1 860 e 960) e retirar a ênfase do lado do desvio positivo (por exemplo, caso nº 4 870 e 970) para evitar saltos espúrios nos sinais (positivos ou negativos) dos valores dos desvios temporal entre quadros adjacentes. Em algumas implementações, o Caso nº 1 (por exemplo, ênfase no lado do desvio negativo) e o Caso nº 4 (retirada de ênfase no lado do desvio positivo) podem ser executados em qualquer ordem entre eles. Alternativamente, quando o Caso nº 1 (por exemplo, a ênfase no lado do desvio negativo) foi selecionado para enfatizar o lado do desvio negativo, os valores do outro lado (por exemplo, lado positivo) podem ser zerados, ao invés de executar o Caso nº 4, para reduzir o risco de detectar o sinal incorreto dos valores de desvio temporal.
[0145] Embora o método 900 apresente que um ajuste pode ser realizado, baseado no parâmetro de ganho 160 (gD), nos valores de um subconjunto dos primeiros valores de comparação suavizados de longo prazo, o ajuste alternativamente pode ser executado em valores de comparação instantâneos ou em valores de um subconjunto dos valores de comparação suavizados de curto prazo. Em algumas implementações, o ajuste de valores pode ser executados utilizando uma janela de suavização (por exemplo, uma janela de dimensionamento suave) em relação a vários valores de defasagem. Em outras implementações, o comprimento de uma janela de suavização pode ser adaptativamente alterado por exemplo, baseado no valor da correlação cruzada dos valores de comparação. Por exemplo, o codificador 114 ou o equalizador temporal 108 pode ajustar o comprimento de uma janela de suavização baseado em um valor de correlação cruzada (CrossCorr_CompValN) 765 dos valores de comparação instantâneos CompValN(k) 735 para o quadro N 710 e 720 e dos valores de comparação suavizados de curto prazo CompValSTN(k) 745 para o quadro N 710 e 720.
[0146] Com referência à FIG. 10, gráficos ilustrando valores de comparação para quadros vozeados, quadros de transição e quadros não vozeados são apresentados. De acordo com a FIG. 10, o gráfico 1002 ilustra valores de comparação (por exemplo, valores de correlação cruzada) para um quadro vozeado processado sem a utilização das técnicas de suavização de longo prazo descritas, o gráfico 1004 ilustra valores de comparação para um quadro de transição processado sem a utilização das técnicas de suavização de longo prazo descritas e o gráfico 1006 ilustra valores de comparação para um quadro não vozeado processado sem utilizar as técnicas de suavização de longo prazo descritas.
[0147] A correlação cruzada representada em cada gráfico 1002, 1004, 1006 pode ser substancialmente diferente. Por exemplo, o gráfico 1002 ilustra que uma correlação cruzada de pico entre um quadro vozeado capturado pelo primeiro microfone 146 da FIG. 1 e um quadro vozeado correspondente capturado pelo segundo microfone 148 da FIG. 1 ocorre em aproximadamente um desvio de 17 amostras. Entretanto, o gráfico 1004 ilustra que uma correlação cruzada de pico entre um quadro de transição capturado pelo primeiro microfone 146 e um quadro de transição correspondente capturado pelo segundo microfone 148 ocorre em aproximadamente um desvio de 4 amostras. Além disso, o gráfico 1006 ilustra que uma correlação cruzada de pico entre um quadro não vozeado capturado pelo primeiro microfone 146 e um quadro não vozeado correspondente capturado pelo segundo microfone 148 ocorre em aproximadamente em um desvio de -3 amostras. Assim, a estimativa de desvio pode ser imprecisa para os quadros de transição e quadros não vozeados devido a níveis relativamente altos de ruído.
[0148] De acordo com a FIG. 10, o gráfico 1012 ilustra valores de comparação (por exemplo, valores de correlação cruzada) para um quadro vozeado processado utilizando as técnicas de suavização de longo prazo descritas, o gráfico 1014 ilustra valores de comparação para um quadro de transição processado utilizando as técnicas de suavização de longo prazo descritas, e o gráfico 1016 ilustra valores de comparação para um quadro não vozeado processado utilizando as técnicas de suavização de longo prazo descritas. Os valores de correlação cruzada em cada gráfico 1012, 1014, 1016 podem ser substancialmente similares. Por exemplo, cada gráfico 1012, 1014, 1016 ilustra que uma correlação cruzada de pico entre um quadro capturado pelo primeiro microfone 146 da FIG. 1 e um quadro correspondente capturado pelo segundo microfone 148 da FIG. 1 ocorre em aproximadamente um desvio de 17 amostras. Portanto, a estimativa de desvio para quadros de transição (ilustrado pelo gráfico 1014) e quadros não vozeados (ilustrados pelo gráfico 1016) pode ser relativamente precisa (ou similar) a estimativa de desvio do quadro vozeado apesar do ruído.
[0149] Com referência à FIG. 11, é apresentado um método 1100 para não causalmente desviar um canal baseado em um deslocamento temporal entre o áudio capturado em vários microfones. O método 1100 pode ser executado pelo equalizador temporal 108, pelo codificador 114, pelo primeiro dispositivo 104 da FIG. 1, ou por uma combinação dos mesmos.
[0150] O método 1100 inclui estimar valores de comparação em um codificador, em 1110. Cada valor de comparação pode ser indicativo de uma quantidade de incompatibilidade temporal, ou de uma medida da similaridade ou dissimilaridade entre um primeiro quadro de referência de um canal de referência e um primeiro quadro alvo correspondente de um canal alvo, em 1110. Em algumas implementações, a função de correlação cruzada entre o quadro de referência e o quadro alvo pode ser utilizada para medir a similaridade dos dois quadros em função da defasagem de um quadro em relação ao outro. Por exemplo, referindo-se à FIG. 1, o codificador 114 ou o equalizador temporal 108 pode estimar valores de comparação (por exemplo, valores de correlação cruzada) indicativos de uma quantidade de incompatibilidade temporal, ou de uma medida da similaridade ou dissimilaridade entre os quadros de referência (capturados mais cedo) e os quadros alvo correspondentes (capturados mais cedo). Para ilustrar, se CompValN(k) representa o valor de comparação em um desvio de k para o quadro N, o quadro N pode possuir valores de comparação de k = T_MIN (um desvio mínimo) até k = T_MAX (um desvio máximo).
[0151] O método 1100 inclui suavização dos valores de comparação para gerar valores de comparação suavizados de curto prazo, em 1115. Por exemplo, o codificador 114 ou o equalizador temporal 108 pode suavizar os valores de comparação para gerar valores de comparação suavizados de curto prazo. Os valores de comparação suavizados de curto prazo (por exemplo, CompValSTN(k) para o quadro N) podem ser estimados como uma versão suavizada dos valores de comparação dos quadros na vizinhança do quadro atual (por exemplo, quadro N) sendo processado. Para ilustrar, os valores de comparação de curto prazo podem ser gerados como uma combinação linear de vários valores de comparação a partir de quadros atuais e de quadros anteriores (por exemplo, CompValSTN(k)= ). Em algumas implementações, uma ponderação não uniforme pode ser aplicada aos vários de valores de comparação para os quadros atuais e anteriores. Em outras implementações, os valores de comparação de curto prazo podem ser os mesmos do que os valores de comparação gerados no quadro que está sendo processado (CompValN(k)).
[0152] O método 1100 inclui suavizar os valores de comparação para gerar os primeiros valores de comparação suavizados de longo prazo baseado em um parâmetro de suavização, em 1120. Por exemplo, o codificador 114 ou o equalizador temporal 108 pode suavizar os valores de comparação para gerar valores de comparação suavizados baseado nos dados históricos do valor de comparação e em um parâmetro de suavização. A suavização pode ser executada de modo que os valores de comparação suavizados de longo prazo CompValLTN(k) sejam representados por CompValLTN(k) = f(CompValN(k), CompValN-1(k), CompValLTN- 1(k), ...). A função na equação acima pode ser uma função de todos (ou um subconjunto) os valores de comparação anteriores no desvio (k). Uma representação alternativa deste pode ser CompValLTN(k) = g (CompValN(k), CompValN-1(k), CompValN-2(k), ...). As funções ou g podem ser filtros simples de resposta ao impulso finita (FIR) ou filtros de resposta ao impulso infinita (IIR), respectivamente. Por exemplo, a função g pode ser um filtro IIR de coeficiente único, de modo que os valores de comparação suavizados de longo prazo CompValLTN(k) sejam representados por CompValLTN(k) = (1 — α) * CompValN(k) + (α) * CompValLTN-1(k), onde α ∈ (0, 1,0). Assim, os valores de comparação suavizados de longo prazo CompValLTN(k) podem ser baseados em uma mistura ponderada dos valores de comparação instantâneos CompValN(k) para o quadro N e nos valores de comparação suavizados de longo prazo CompValLTN- 1(k) para um ou mais quadros anteriores.
[0153] De acordo com uma implementação, o parâmetro de suavização pode ser adaptável. Por exemplo, o método 1100 pode incluir adaptar o parâmetro de suavização baseado em uma correlação de valores de comparação suavizados de curto prazo com valores de comparação suavizados de longo prazo. À medida que o valor de α aumenta, a quantidade de suavização no valor de comparação suavizado de longo prazo aumenta. Um valor do parâmetro de suavização (α) pode ser ajustado baseado em indicadores de energia de curto prazo dos canais de entrada e em indicadores de energia de longo prazo dos canais de entrada. Adicionalmente, o valor do parâmetro de suavização (α) pode ser reduzido se os indicadores de energia de curto prazo forem maiores do que os indicadores de energia de longo prazo. De acordo com outra implementação, um valor do parâmetro de suavização (α) é ajustado baseado na correlação de valores de comparação suavizados de curto prazo com valores de comparação suavizados de longo prazo. Adicionalmente, o valor do parâmetro de suavização (α) pode ser aumentado se a correlação exceder um limite. De acordo com outra implementação, os valores de comparação podem ser valores de correlação cruzada de canais de referência amostrados de forma descendente com o canal alvo amostrados de forma descendente correspondente.
[0154] O método 1100 inclui calcular um valor de correlação cruzada entre os valores de comparação e os valores de comparação suavizados de curto prazo, em 1125.
Por exemplo, o codificador 114 ou o equalizador temporal 108 pode calcular um valor de correlação cruzada dos valores de comparação (CrossCorr_CompValN) 765 entre os valores de comparação para um único quadro ("valores de comparação instantâneos" CompValN(k)) 735 e os valores de comparação suavizados de curto prazo (CompValLTN(k)) 745. O valor de correlação cruzada de valores de comparação (CrossCorr_CompValN) 765 pode ser um valor único estimado para cada quadro (N) e pode corresponder a um grau de correlação cruzada entre dois outros valores de correlação. Por exemplo, o codificador 114 ou o equalizador temporal 108 pode calcular (CrossCorr_CompValN) 765 como CrossCorr_CompValN = ∑k CompValSTN(k) * CompValN(k)) / Fac. Onde 'Fac' é um fator de normalização escolhido de modo que CrossCorr_CompValN seja restrito entre 0 e 1.
[0155] Em implementações alternativas, o método 1100 pode incluir calcular um valor de correlação cruzada entre os valores de comparação suavizados de curto prazo e os valores de comparação suavizados de longo prazo, em 1125. Por exemplo, o codificador 114 ou o equalizador temporal 108 pode calcular um valor de correlação cruzada dos valores de comparação (CrossCorr_CompValN) 765 entre valores de comparação suavizados de curto prazo (CompValSTN (k)) 745 e valores de comparação suavizados de longo prazo (CompValLTN (k)) 755. O valor de correlação cruzada dos valores de comparação {CrossCorr_CompValN) 765 pode ser um valor único estimado para cada quadro (N)) e pode corresponder a um grau de correlação cruzada entre dois outros valores de correlação. Por exemplo, o codificador 114 ou o equalizador temporal 108 pode calcular
(CrossCorr_CompValN) 765 como CrossCorr_CompValN = ∑k CompValSTN (k) * CompValLTN-1 (k))/Fac.
[0156] O método 1100 inclui comparar o valor de correlação cruzada com um limite, em 1130. Por exemplo, o codificador 114 ou o equalizador temporal 108 pode comparar o valor de correlação cruzada (CrossCorr_CompValN) 765 com um limite. O método 1100 também inclui ajustar os primeiros valores de comparação suavizados de longo prazo para gerar os segundos valores de comparação suavizados de longo prazo, em resposta a determinar que o valor da correlação cruzada excede o limite, em 1135. Por exemplo, o codificador 114 ou o equalizador temporal 108 pode ajustar um todo ou alguma parte dos primeiros valores de comparação suavizados de longo prazo 755 baseados no resultado da comparação. Em algumas implementações, o codificador 114 ou o equalizador temporal 108 pode aumentar (ou amplificar ou polarizar) alguns valores de um subconjunto dos primeiros valores de comparação suavizados de longo prazo 755 em resposta a determinar que o valor de correlação cruzada dos valores de comparação (CrossCorr_CompValN) 765 excede o limite. Por exemplo, quando o valor de correlação cruzada dos valores de comparação (CrossCorr_CompValN) for maior ou igual a um limite (por exemplo, 0,8), isto pode indicar que o valor de correlação cruzada entre os valores de comparação é bastante forte ou alto, indicando pequena ou nenhuma variação dos valores de desvio temporal entre os quadros adjacentes. Assim, o valor estimado do desvio temporal do quadro atual (por exemplo, quadro N) não pode estar muito longe dos valores do desvio temporal do quadro anterior
(por exemplo, quadro N - l) ou dos valores do desvio temporal de quaisquer outros quadros anteriores.
Os valores de desvio temporal podem ser um dentre um valor de incompatibilidade experimental 536, um valor de incompatibilidade interpolado 538, um valor de incompatibilidade reparado 540, um valor de incompatibilidade final 116 ou um valor de incompatibilidade não causal 162. Portanto, o codificador 114 ou o equalizador temporal 108 pode aumentar (ou amplificar ou polarizar) alguns valores de um subconjunto dos primeiros valores de comparação suavizados de longo prazo 755, por exemplo, por um fator de 1,2 (amplificação ou aumento de 20%) para gerar um segundo valor de comparação suavizado de longo prazo.
Essa amplificação ou polarização pode ser implementada por multiplicar um fator de escalonamento ou por adicionar um deslocamento aos valores dentro do subconjunto dos primeiros valores de comparação suavizados de longo prazo 755. Em algumas implementações, o codificador 114 ou o equalizador temporal 108 pode amplificar ou polarizar o subconjunto dos primeiros valores de comparação suavizados de longo prazo 755, de modo que o subconjunto possa incluir um índice correspondente ao valor do desvio temporal do quadro anterior (por exemplo, quadro N - l). Adicionalmente, ou alternativamente, o subconjunto pode adicionalmente incluir um índice em torno da vizinhança do valor do desvio temporal do quadro anterior (por exemplo, quadro N - l). Por exemplo, a vizinhança pode significar dentro de -delta (por exemplo, delta está na variação de 1 até 5 amostras em uma concretização preferida) e +delta do valor de desvio temporal do quadro anterior (por exemplo, o quadro N – 1).
[0157] O método 1100 inclui estimar um valor de desvio experimental baseado nos segundos valores de comparação suavizados de longo prazo, em 1140. Por exemplo, o codificador 114 ou o equalizador temporal 108 pode estimar um valor de desvio experimental 536 baseado nos segundos valores de comparação suavizados de longo prazo. O método 1100 também inclui determinar um valor de desvio não causal baseado no valor de desvio experimental, em 1145. Por exemplo, o codificador 114 ou o equalizador temporal 108 pode determinar um valor de desvio não causal (por exemplo, o valor de desvio não causal 162) baseado, pelo menos em parte, no valor do desvio experimental (por exemplo, o valor de incompatibilidade experimental 536, o valor de incompatibilidade interpolado 538, o valor de incompatibilidade reparado 540 ou o valor de incompatibilidade final 116).
[0158] O método 1100 inclui de forma não causal desviar um canal alvo particular pelo valor de desvio não causal para gerar um canal alvo particular ajustado que é alinhado temporalmente com um canal de referência particular, em 1150. Por exemplo, o codificador 114 ou o equalizador temporal 108 pode desviar de forma não causal o canal alvo pelo valor de desvio não causal (por exemplo, o valor de incompatibilidade não causal 162) para gerar um canal alvo ajustado que está alinhado temporalmente com o canal de referência. O método 1100 também inclui gerar pelo menos um dentre um canal de banda média ou um canal de banda lateral baseado no canal de referência particular e no canal alvo particular ajustado, em 1155. Por exemplo, referindo-se à FIG. 11, o codificador 114 pode gerar pelo menos um canal de banda média e um canal de banda lateral baseado no canal de referência e no canal alvo ajustado.
[0159] Com referência à FIG. 12, um método 1200 para de forma não causal desviar um canal baseado em um deslocamento temporal entre o áudio capturado em vários microfones é apresentado. O método 1200 pode ser executado pelo equalizador temporal 108, pelo codificador 114, pelo primeiro dispositivo 104 da FIG. 1, ou por uma combinação dos mesmos.
[0160] O método 1200 inclui estimar valores de comparação em um codificador, em 1210. Por exemplo, o método em 1210 pode ser similar ao método em 1110, como descrito com referência à FIG. 11. O método 1200 também inclui suavizar os valores de comparação para gerar os primeiros valores de comparação suavizados de longo prazo baseado em um parâmetro de suavização, em 1220. Por exemplo, o método em 1220 pode ser similar ao método em 1120, conforme descrito com referência a FIG. 11.
[0161] O método 1200 inclui calcular um parâmetro de ganho a partir de um quadro de referência anterior de um canal de referência e de um quadro alvo anterior correspondente de um canal alvo, em 1225. Em algumas implementações, o parâmetro de ganho do quadro anterior pode ser baseado em uma energia do quadro de referência anterior e em uma energia do quadro alvo anterior. Em algumas implementações, o codificador 114 ou o equalizador temporal 108 pode gerar ou calcular o parâmetro de ganho 160 (por exemplo, um parâmetro de ganho ou ganho alvo do codec) baseado em amostras do canal alvo e baseado em amostras do canal de referência. Por exemplo, o equalizador temporal 108 pode selecionar amostras do segundo sinal de áudio 132 baseado no valor de incompatibilidade não causal 162. Alternativamente, o equalizador temporal 108 pode selecionar amostras do segundo sinal de áudio 132 independente do valor de incompatibilidade não causal 162. O equalizador temporal 108 pode, em resposta a determinar que o primeiro sinal de áudio 130 é o canal de referência, determinar o parâmetro de ganho 160 das amostras selecionadas baseado nas primeiras amostras do primeiro quadro 131 do primeiro sinal de áudio 130. Alternativamente, o equalizador temporal 108 pode, em resposta a determinar que o segundo sinal de áudio 132 é o canal de referência, determinar o parâmetro de ganho 160 baseado em uma energia de um quadro de referência do canal de referência e em uma energia de um quadro alvo do canal alvo. Como um exemplo, o parâmetro de ganho 160 pode ser calculado ou gerado baseado em uma ou mais dentre as equações la, lb, lc, 1d, le ou 1f. Em algumas implementações, o parâmetro de ganho 160 (gD) pode ser modificado ou suavizado através de vários quadros por quaisquer algoritmos de suavização conhecidos ou alternativamente por histerese para evitar grandes saltos n no ganho entre quadros.
[0162] O método 1200 também inclui comparar o parâmetro de ganho com um primeiro limite, em 1230. Por exemplo, o codificador 114 ou o equalizador temporal 108 pode comparar o parâmetro de ganho com um primeiro limite
(por exemplo, Thrl ou Thr2), em 1230. Quando o parâmetro de ganho 160 (gD), baseado em uma ou mais dentre as Equações la até 1f, for maior do que 1, isso pode indicar que o primeiro sinal de áudio 130 (ou canal esquerdo) é um canal principal ("um canal de referência" ) e, portanto, é mais provável que os valores de desvio ("valores de desvio temporal") seriam valores positivos. Os valores de desvio temporal podem ser um dentre um valor de incompatibilidade experimental 536, um valor de incompatibilidade interpolado 538, um valor de incompatibilidade reparado 540, um valor de incompatibilidade final 116 ou um valor de incompatibilidade não causal 162. Portanto, pode ser vantajoso enfatizar (ou aumentar ou amplificar ou polarizar) os valores no lado do desvio positivo e/ou retirar a ênfase (ou diminuir) os valores no lado do desvio negativo. Em algumas implementações, o codificador 114 ou o equalizador temporal 108 pode comparar o parâmetro de ganho 160 (gD) com um primeiro limite (por exemplo, Thrl = 1,2) ou outro limite (por exemplo, Thr2 = 0,8), conforme descrito com referência à FIG. 9.
[0163] O método 1200 também inclui ajustar um primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo, em resposta ao resultado da comparação, para gerar os segundos valores de comparação suavizados de longo prazo, em 1235. Por exemplo, o codificador 114 ou o equalizador temporal 108 pode ajustar um primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo CompValLTN(k) 755 para gerar segundos valores de comparação suavizados de longo prazo, em resposta ao resultado da comparação. Em uma concretização preferida, o primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo corresponde a uma metade positiva (por exemplo, lado de desvio positivo 820) ou a uma metade negativa (por exemplo, lado de desvio negativo 810) dos primeiros valores de comparação suavizados de longo prazo CompValLTN(k) 755, como descrito com referência à FIG. 9. Em algumas implementações, o codificador 114 ou o equalizador temporal 108 pode ajustar um primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo CompValLTN(k) 755 de acordo com quatro exemplos apresentados na FIG. 8 - Caso nº 1 (ênfase do lado do desvio negativo) 830, Caso nº 2 (ênfase do lado do desvio positivo) 840, Caso nº 3 (retirada de ênfase do lado do desvio negativo) 850 e Caso nº 4 (retirada de ênfase do lado do desvio positivo) 860.
[0164] Voltando à FIG. 8, o exemplo 800 ilustra quatro casos que apresentam que um subconjunto dos valores de comparação suavizados de longo prazo (por exemplo, os primeiros valores de comparação suavizados de longo prazo CompValLTN(k) 755) pode ser ajustado baseado no resultado da comparação. Ajustar um subconjunto dos valores de comparação suavizados de longo prazo no exemplo 800 pode incluir aumentar alguns valores do subconjunto dos valores de comparação suavizados de longo prazo (por exemplo, os primeiros valores de comparação suavizados de longo prazo CompValLTN(k) 755) por um algum fator. Por exemplo, as FIGS. 8 e 9 ilustram o exemplo de aumentar alguns valores (por exemplo, Caso nº 1 e Caso nº 2 na FIG. 8) de acordo com algumas condições ilustrativas, como descrito anteriormente com referência a um fluxograma na FIG. 9. Ajustar o subconjunto dos valores de comparação suavizados de longo prazo também pode incluir diminuir alguns valores do subconjunto dos valores de comparação suavizados de longo prazo (por exemplo, os primeiros valores de comparação suavizados de longo prazo 755) por um algum fator. As FIGS. 8 e 9 ilustram o exemplo de diminuir alguns valores (por exemplo, Caso nº 3 e Caso nº 4 na FIG. 8) de acordo com algumas condições ilustrativas, como descrito anteriormente com referência a um fluxograma na FIG. 9.
[0165] Quatro casos na FIG. 8 são apresentados somente para propósitos ilustrativos e, portanto, quaisquer variações ou valores ou fatores utilizados neles não são pretendidos como exemplos limitativos. Por exemplo, todos os quatro casos na FIG. 8 ilustram ajustar valores inteiros na metade esquerda ou direita do eixo geométrico x do gráfico. Entretanto, em algumas implementações, pode ser possível que somente um subconjunto de valores no eixo geométrico x positivo ou negativo possa ser ajustado. Em outro exemplo, todos os quatro casos na FIG. 8 ilustram ajustar valores por um algum fator (por exemplo, um fator de escalonamento). Entretanto, em algumas implementações, vários fatores podem ser utilizados para diferentes regiões do eixo geométrico x dos gráficos no exemplo 800. Adicionalmente, ajustar valores por algum fator pode ser implementado por multiplicar um fator de escalonamento ou por adicionar ou subtrair um valor de deslocamento para ou a partir dos valores.
[0166] O método 1200 inclui estimar um valor de desvio experimental baseado nos segundos valores de comparação suavizados de longo prazo, em 1240. Por exemplo, o método em 1240 pode ser similar ao método em 1140, como descrito com referência à FIG. 11. O método 1200 também inclui determinar um valor de desvio não causal baseado no valor de desvio experimental, em 1245. Por exemplo, o método em 1245 pode ser similar ao método em 1145, como descrito com referência à FIG. 11. O método 1200 inclui de forma não causal desviar um canal alvo particular pelo valor de desvio não causal para gerar um canal alvo particular ajustado que está alinhado temporalmente com um canal de referência particular, em
1250. Por exemplo, o método em 1250 pode ser similar ao método em 1150, como descrito com referência à FIG. 11. O método 1200 também inclui gerar pelo menos um dentre um canal de banda média ou um canal de banda lateral baseado no canal de referência particular e no canal alvo particular ajustado, em 1255. Por exemplo, o método em 1255 pode ser similar ao método em 1155, como descrito com referência à FIG. 11.
[0167] Com referência à FIG. 13, um diagrama de blocos de um exemplo ilustrativo particular de um dispositivo (por exemplo, um dispositivo de comunicação não cabeado) é representado e geralmente designado 1300. Em várias concretizações, o dispositivo 1300 pode possuir menos ou mais componentes do que ilustrado na FIG. 13. Em uma concretização ilustrativa, o dispositivo 1300 pode corresponder ao primeiro dispositivo 104 ou ao segundo dispositivo 106 da FIG. 1. Em uma concretização ilustrativa, o dispositivo 1300 pode executar uma ou mais operações descritas com referência aos sistemas e métodos das FIGS. 1 até 12.
[0168] Em uma concretização particular, o dispositivo 1300 inclui um processador 1306 (por exemplo, uma unidade central de processamento (CPU)). O dispositivo 1300 pode incluir um ou mais processadores 1310 adicionais (por exemplo, um ou mais processadores de sinal digital (DSPs)). Os processadores 1310 podem incluir um decodificador e codificador (CODEC) de mídia (por exemplo, fala e música) 1308 e um cancelador de eco 1312. O CODEC de mídia 1308 pode incluir o decodificador 118, o codificador 114, ou ambos, da FIG. 1. O codificador 114 pode incluir o equalizador temporal 108.
[0169] O dispositivo 1300 pode incluir uma memória 153 e um CODEC 1334. Embora o CODEC de mídia 1308 seja ilustrado como um componente dos processadores 1310 (por exemplo, sistema de circuitos dedicado e/ou código de programação executável), em outras concretizações um ou mais componentes do CODEC de mídia 1308, tais como o decodificador 118, o codificador 114, ou ambos, podem ser incluídos no processador 1306, no CODEC 1334, em outro componente de processamento ou em uma combinação dos mesmos.
[0170] O dispositivo 1300 pode incluir o transmissor 110 acoplado com uma antena 1342. O dispositivo 1300 pode incluir um vídeo 1328 acoplado com um controlador de vídeo 1326. Um ou mais alto-falantes 1348 podem ser acoplados com o CODEC 1334. Um ou mais microfones 1346 pode ser acoplados, via a interface(s) de entrada 112, com o CODEC 1334. Em uma implementação particular, os alto-falantes 1348 podem incluir o primeiro alto-falante 142, o segundo alto-falante 144 da FIG. 1, o Y-ésimo alto-falante 244 da FIG. 2, ou uma combinação dos mesmos. Em uma implementação particular, os microfones 1346 podem incluir o primeiro microfone 146, o segundo microfone 148 da FIG. 1, o N-ésimo microfone 248 da FIG. 2, o terceiro microfone 1146, o quarto microfone 1148 da FIG. 11, ou uma combinação dos mesmos. O CODEC 1334 pode incluir um conversor de digital para analógico (DAC) 1302 e um conversor de analógico para digital (ADC) 1304.
[0171] A memória 153 pode incluir instruções 1360 executáveis pelo processador 1306, pelos processadores 1310, pelo CODEC 1334, por outra unidade de processamento do dispositivo 1300, ou por uma combinação dos mesmos, para executar uma ou mais operações descritas com referência às FIGS. 1 até 12. A memória 153 pode armazenar os dados de análise 190.
[0172] Um ou mais componentes do dispositivo 1300 podem ser implementados via hardware dedicado (por exemplo, sistema de circuitos), por um processador executando instruções para executar uma ou mais tarefas, ou uma combinação dos mesmos. Como um exemplo, a memória 153 ou um ou mais componentes do processador 1306, dos processadores 1310 e/ou do CODEC 1334 podem ser um dispositivo de memória, tais como uma memória de acesso aleatório (RAM), uma memória de acesso aleatório magneto- resistiva (MRAM), uma MRAM de transferência de torque de rotação (STT-MRAM), uma memória flash, memória somente para leitura (ROM), memória somente para leitura programável
(PROM), memória somente para leitura programável apagável (EPROM), memória somente para leitura programável eletricamente apagável (EEPROM), registradores, disco rígido, um disco removível ou uma memória somente para leitura de CD (CD-ROM). O dispositivo de memória pode incluir instruções (por exemplo, as instruções 1360) que, quando executadas por um computador (por exemplo, um processador no CODEC 1334, o processador 1306 e/ou os processadores 1310), podem fazer com que o computador execute uma ou mais operações descritas com referência às FIGS. 1 até 12. Como um exemplo, a memória 153 ou um ou mais componentes do processador 1306, dos processadores 1310 e/ou do CODEC 1334 podem ser um meio não temporário legível por computador que inclui instruções (por exemplo, as instruções 1360) que, quando executadas por um computador (por exemplo, um processador no CODEC 1334, o processador 1306 e/ou os processadores 1310), faz com que o computador execute uma ou mais operações descritas com referência às FIGS. 1 até 12.
[0173] Em uma concretização particular, o dispositivo 1300 pode ser incluído em um dispositivo de sistema em pacote ou de sistema sobre chip (por exemplo, um modem de estação móvel (MSM)) 1322. Em uma concretização particular, o processador 1306, os processadores 1310, o controlador de vídeo 1326, a memória 153, o CODEC 1334 e o transmissor 110 estão incluídos em um sistema em pacote ou no dispositivo de sistema sobre chip 1322. Em uma concretização particular, um dispositivo de entrada 1330, tal como uma tela sensível ao toque e/ou teclado numérico e uma fonte de alimentação 1344 são acoplados com o dispositivo do sistema sobre chip 1322. Além disso, em uma concretização particular, como ilustrado na FIG. 13, o vídeo 1328, o dispositivo de entrada 1330, os alto-falantes 1348, os microfones 1346, a antena 1342 e a fonte de alimentação 1344 são externos ao dispositivo do sistema sobre chip 1322. Entretanto, cada uma dentre o vídeo 1328, a entrada dispositivo 1330, os alto-falantes 1348, os microfones 1346, a antena 1342 e a fonte de alimentação 1344 pode ser acoplado com um componente do dispositivo do sistema sobre chip 1322, tal como uma interface ou um controlador.
[0174] O dispositivo 1300 pode incluir um telefone não cabeado, um dispositivo de comunicação móvel, um telefone móvel, um smartphone, um telefone celular, um computador laptop, um computador de mesa, um computador, um computador tablet, uma caixa decodificadora sinais, um assistente digital pessoal (PDA), um dispositivo de vídeo, uma televisão, um console de jogos, um reprodutor de música, um rádio, um reprodutor de vídeo, uma unidade de entretenimento, um dispositivo de comunicação, uma unidade de dados de localização fixa, um reprodutor de mídia pessoal, um dispositivo de vídeo digital, um reprodutor de disco de vídeo digital (DVD), um sintonizador, uma câmera, um dispositivo de navegação, um sistema decodificador, um sistema codificador ou qualquer combinação dos mesmos.
[0175] Em uma implementação particular, um ou mais componentes dos sistemas descritos neste documento e o dispositivo 1300 podem ser integrados em um sistema ou aparelho de decodificação (por exemplo, um dispositivo eletrônico, um CODEC ou um processador no mesmo), em um sistema ou aparelho de codificação, ou em ambos. Em outras implementações, um ou mais componentes dos sistemas descritos neste documento e o dispositivo 1300 podem ser integrados a um telefone não cabeado, um computador tablet, um computador de mesa, um computador laptop, uma caixa decodificadora de sinais, um reprodutor de música, um reprodutor de vídeo, uma unidade de entretenimento, uma televisão, um console de jogos, um dispositivo de navegação, um dispositivo de comunicação, um assistente pessoal digital (PDA), uma unidade de dados de localização fixa, um reprodutor de mídia pessoal ou outro tipo de dispositivo.
[0176] Deve ser notado que várias funções executadas por um ou mais componentes dos sistemas descritos neste documento e pelo dispositivo 1300 são descritas como sendo executadas por alguns componentes ou módulos. Esta divisão de componentes e módulos é somente para ilustração. Em uma implementação alternativa, uma função executada por um componente ou módulo particular pode ser dividida entre vários componentes ou módulos. Além disso, em uma implementação alternativa, dois ou mais componentes ou módulos dos sistemas descritos neste documento podem ser integrados em um único componente ou módulo. Cada componente ou módulo ilustrado nos sistemas descritos neste documento pode ser implementado utilizando hardware (por exemplo, um dispositivo de arranjo de portas programáveis em campo (FPGA), um circuito integrado específico de aplicação (ASIC), um DSP, um controlador etc.), software (por exemplo, instruções executáveis por um processador), ou qualquer combinação dos mesmos.
[0177] Em conjunto com as implementações descritas, um aparelho inclui meio para capturar um canal de referência. O canal de referência pode incluir um quadro de referência. Por exemplo, o meio para capturar o primeiro sinal de áudio pode incluir o primeiro microfone 146 das FIGS. 1 e 2, o(s) o microfone(s) 1346 da FIG. 13, um ou mais dispositivos / sensores configurados para capturar o canal de referência (por exemplo, um processador executando instruções que são armazenadas em um dispositivo de armazenamento legível por computador) ou uma combinação dos mesmos.
[0178] O aparelho também pode incluir meio para capturar um canal alvo. O canal alvo pode incluir um quadro alvo. Por exemplo, o meio para capturar o segundo sinal de áudio pode incluir o segundo microfone 148 das FIGS. 1 e 2, o(s) microfone(s) 1346 da FIG. 13, um ou mais dispositivos/sensores configurados para capturar o canal alvo (por exemplo, um processador executando instruções que são armazenadas em um dispositivo de armazenamento legível por computador) ou uma combinação dos mesmos.
[0179] aparelho também pode incluir meio para estimar um retardo entre o quadro de referência e o quadro alvo. Por exemplo, o meio para determinar o retardo pode incluir o equalizador temporal 108, o codificador 114, o primeiro dispositivo 104 da FIG. 1, o CODEC de mídia 1308, os processadores 1310, o dispositivo 1300, um ou mais dispositivos configurados para determinar o retardo (por exemplo, um processador executando instruções que são armazenadas em um dispositivo de armazenamento legível por computador) ou uma combinação dos mesmos.
[0180] O aparelho também pode incluir meio para estimar um deslocamento temporal entre o canal de referência e o canal alvo baseado no retardo e baseado em dados históricos de retardo. Por exemplo, o meio para estimar o deslocamento temporal pode incluir o equalizador temporal 108, o codificador 114, o primeiro dispositivo 104 da FIG. 1, o CODEC de mídia 1308, os processadores 1310, o dispositivo 1300, um ou mais dispositivos configurados para estimar o deslocamento temporal (por exemplo, um processador executando instruções que são armazenadas em um dispositivo de armazenamento legível por computador) ou uma combinação dos mesmos.
[0181] Com referência à FIG. 14, um diagrama de blocos de um exemplo ilustrativo específico de uma estação base 1400 é representado. Em várias implementações, a estação base 1400 pode possuir mais componentes ou menos componentes do que ilustrado na FIG.
14. Em um exemplo ilustrativo, a estação base 1400 pode incluir o primeiro dispositivo 104, o segundo dispositivo 106 da FIG. 1, o primeiro dispositivo 134 da FIG. 2, ou uma combinação dos mesmos. Em um exemplo ilustrativo, a estação base 1400 pode operar de acordo com um ou mais dos métodos ou sistemas descritos com referência às FIGS. 1 até
13.
[0182] A estação base 1400 pode fazer parte de um sistema de comunicação não cabeada. O sistema de comunicação não cabeada pode incluir várias estações base e vários dispositivos não cabeados. O sistema de comunicação não cabeada pode ser um sistema da Evolução à Longo Prazo (LTE), um sistema de Acesso Múltiplo por Divisão de Código
(CDMA), um sistema Global para Comunicações Móveis (GSM), um sistema de rede local não cabeada (WLAN) ou outro sistema não cabeado. Um sistema CDMA pode implementar CDMA de banda larga (WCDMA), CDMA 1X, Dados em Evolução Otimizados (EVDO), CDMA Síncrono por Divisão de tempo (TD- SCDMA), ou alguma outra versão de CDMA.
[0183] Os dispositivos não cabeados também podem ser referidos como equipamento de usuário (UE), uma estação móvel, um terminal, um terminal de acesso, uma unidade de assinante, uma estação, etc. Os dispositivos não cabeados podem incluir um telefone celular, um smartphone, um tablet, um modem não cabeado, um assistente digital pessoal (PDA), um dispositivo portátil, um computador laptop, um smartbook, um netbook, um tablet, um telefone não cabeado, uma estação de loop local não cabeada (WLL), um dispositivo Bluetooth, etc. Os dispositivos não cabeados podem incluir ou corresponder ao dispositivo 1400 da FIG. 14.
[0184] Diversas funções podem ser executadas por um ou mais componentes da estação base 1400 (e/ou em outros componentes não apresentados), tal como enviar e receber mensagens e dados (por exemplo, dados de áudio). Em um exemplo particular, a estação base 1400 inclui um processador 1406 (por exemplo, uma CPU). A estação base 1400 pode incluir um transcodificador 1410. O transcodificador 1410 pode incluir um CODEC de áudio 1408. Por exemplo, o transcodificador 1410 pode incluir um ou mais componentes (por exemplo, sistema de circuitos) configurados para executar operações do CODEC de áudio
1408. Como outro exemplo, o transcodificador 1410 pode ser configurado para executar uma ou mais instruções legíveis por computador para executar as operações do CODEC de áudio
1408. Embora o CODEC de áudio 1408 seja ilustrado como um componente do transcodificador 1410, em outros exemplos, um ou mais componentes do CODEC de áudio 1408 podem ser incluídos no processador 1406, em outro componente de processamento ou em uma combinação dos mesmos. Por exemplo, um decodificador 1438 (por exemplo, um decodificador do codificador de voz) pode ser incluído em um processador de dados receptor 1464. Como outro exemplo, um codificador 1436 (por exemplo, um codificador do codificador de voz) pode ser incluído em um processador de dados de transmissão 1482.
[0185] O transcodificador 1410 pode funcionar para transcodificar mensagens e dados entre duas ou mais redes. O transcodificador 1410 pode ser configurado para converter dados de mensagem e de áudio a partir de um primeiro formato (por exemplo, um formato digital) para um segundo formato. Para ilustrar, o decodificador 1438 pode decodificar sinais codificados possuindo um primeiro formato e o codificador 1436 pode codificar os sinais decodificados em sinais codificados possuindo um segundo formato. Adicionalmente, ou alternativamente, o transcodificador 1410 pode ser configurado para executar a adaptação da taxa de dados. Por exemplo, o transcodificador 1410 pode converter de forma descendente uma taxa de dados ou converter de forma ascendente a taxa de dados sem alterar um formato dos dados de áudio. Para ilustrar, o transcodificador 1410 pode converter de forma descendente sinais de 64 kbit/s em sinais de 16 kbit/s.
[0186] O CODEC de áudio 1408 pode incluir o codificador 1436 e o decodificador 1438. O codificador 1436 pode incluir o codificador 114 da FIG. 1, o codificador 214 da FIG. 2 ou ambos. O decodificador 1438 pode incluir o decodificador 118 da FIG. 1
[0187] A estação base 1400 pode incluir uma memória 1432. A memória 1432, tal como um dispositivo de armazenamento legível por computador, pode incluir instruções. As instruções podem incluir uma ou mais instruções executáveis pelo processador 1406, pelo transcodificador 1410 ou por uma combinação dos mesmos, para executar uma ou mais operações descritas com referência aos métodos e sistemas das FIGS. 1 até 13. A estação base 1400 pode incluir vários transmissores e receptores (por exemplo, transceptores), tal como um primeiro transceptor 1452 e um segundo transceptor 1454, acoplados com um arranjo de antenas. O arranjo de antenas pode incluir uma primeira antena 1442 e uma segunda antena
1444. O arranjo de antenas pode ser configurado para se comunicar de modo não cabeado com um ou mais dispositivos não cabeados, tal como o dispositivo 1400 da FIG. 14. Por exemplo, a segunda antena 1444 pode receber um fluxo de dados 1414 (por exemplo, um fluxo de bits) a partir de um dispositivo não cabeado. O fluxo de dados 1414 pode incluir mensagens, dados (por exemplo, dados de fala codificados) ou uma combinação dos mesmos.
[0188] A estação base 1400 pode incluir uma conexão de rede 1460, tal como a conexão de canal de transporte de retorno. A conexão de rede 1460 pode ser configurada para se comunicar com uma rede principal ou com uma ou mais estações base da rede de comunicação não cabeada. Por exemplo, a estação base 1400 pode receber um segundo fluxo de dados (por exemplo, mensagens ou dados de áudio) a partir de uma rede principal via a conexão de rede
1460. A estação base 1400 pode processar o segundo fluxo de dados para gerar mensagens ou dados de áudio e proporcionar as mensagens ou dados de áudio para um ou mais dispositivos não cabeados via um ou mais antenas do arranjo de antenas ou para outra estação base via a conexão de rede
1460. Em uma implementação particular, a conexão de rede 1460 pode ser uma conexão de rede de área ampla (WAN), tal como um exemplo ilustrativo e não limitativo. Em algumas implementações, a rede principal pode incluir ou corresponder a uma Rede Telefônica Pública Comutada (PSTN), uma Rede de backbone de pacote ou ambas.
[0189] A estação base 1400 pode incluir um gateway de mídia 1470 que é acoplado com a conexão de rede 1460 e com o processador 1406. O gateway de mídia 1470 pode ser configurado para converter entre fluxos de mídia de diferentes tecnologias de telecomunicações. Por exemplo, o gateway de mídia 1470 pode converter entre diferentes protocolos de transmissão, diferentes esquemas de codificação ou ambos. Para ilustrar, o gateway de mídia 1470 pode converter a partir de sinais PCM para sinais de Protocolo de Transporte em Tempo Real (RTP), como um exemplo ilustrativo e não limitativo. O gateway de mídia 1470 pode converter dados entre redes comutadas por pacotes (por exemplo, uma rede de Protocolo de Voz Através de Internet (VoIP), um Subsistema de Multimídia IP (IMS), uma rede não cabeada de quarta geração (4G), tal como LTE,
WiMax e UMB, etc.), redes comutadas por circuito (por exemplo, uma PSTN) e redes híbridas (por exemplo, um rede não cabeada de segunda geração (2G), tal como GSM, GPRS, e EDGE, uma rede não cabeada de terceira geração (3G), tal como WCDMA, EV-DO, e HSPA, etc.).
[0190] Adicionalmente, o gateway de mídia 1470 pode incluir uma transcodificação e pode ser configurado para transcodificar dados quando codecs são incompatíveis. Por exemplo, o gateway de mídia 1470 pode transcodificar entre um codec Adaptativo de Multi-Taxa (AMR) e um codec G.711, como um exemplo ilustrativo e não limitativo. O gateway de mídia 1470 pode incluir um roteador e várias interfaces físicas. Em algumas implementações, o gateway de mídia 1470 também pode incluir um controlador (não apresentado). Em uma implementação particular, o controlador de gateway de mídia pode ser externo ao gateway de mídia 1470, externo à estação base 1400, ou ambos. O controlador de gateway de mídia pode controlar e coordenar operações de vários gateways de mídia. O gateway de mídia 1470 pode receber sinais de controle a partir do controlador de gateway de mídia e pode funcionar para fazer a ponte entre diferentes tecnologias de transmissão e pode adicionar capacidades e conexões de serviço para usuário final.
[0191] A estação base 1400 pode incluir um demodulador 1462 que é acoplado aos transceptores 1452, 1454, o processador de dados receptor 1464 e o processador 1406 e o processador de dados receptor 1464 pode ser acoplado ao processador 1406. O demodulador 1462 pode ser configurado para demodular sinais modulados recebidos dos transceptores 1452, 1454 e proporcionar dados demodulados ao processador de dados receptor 1464. O processador de dados receptor 1464 pode ser configurado para extrair uma mensagem ou dados de áudio dos dados demodulados e enviar a mensagem ou os dados de áudio para o processador 1406.
[0192] A estação base 1400 pode incluir um processador de dados de transmissão 1482 e um processador de transmissão de várias entradas e várias saídas (MIMO)
1484. O processador de dados de transmissão 1482 pode ser acoplado com o processador 1406 e com o processador MIMO de transmissão 1484. O processador MIMO de transmissão 1484 pode ser acoplado com os transceptores 1452, 1454 e ao processador 1406. Em algumas implementações, o processador MIMO de transmissão 1484 pode ser acoplado ao gateway de mídia 1470. O processador de dados de transmissão 1482 pode ser configurado para receber as mensagens ou os dados de áudio do processador 1406 e codificar as mensagens ou os dados de áudio baseado em um esquema de codificação, tal como CDMA ou multiplexação por divisão de frequência ortogonal (OFDM), tal como exemplos ilustrativos e não limitativos. O processador de dados de transmissão 1482 pode proporcionar os dados codificados para o processador MIMO de transmissão 1484.
[0193] Os dados codificados podem ser multiplexados com outros dados, tal como dados piloto, utilizando técnicas CDMA ou OFDM para gerar dados multiplexados. Os dados multiplexados podem então ser modulados (isto é, mapeado por símbolos) pelo processador de dados de transmissão 1482 baseado em um esquema de modulação específico (por exemplo, chaveamento binário de desvio de fase ("BPSK"), Chaveamento de desvio de fase em quadratura ("QSPK"), chaveamento de desvio de fase M-ário ("M-PSK"), modulação de amplitude em quadratura M-ário ("M- QAM"), etc.) para gerar símbolos de modulação. Em uma implementação particular, os dados codificados e outros dados podem ser modulados utilizando diferentes esquemas de modulação. A taxa de dados, codificação e modulação para cada fluxo de dados pode ser determinada por instruções executadas pelo processador 1406.
[0194] O processador MIMO de transmissão 1484 pode ser configurado para receber os símbolos de modulação a partir do processador de dados de transmissão 1482 e pode adicionalmente processar os símbolos de modulação e pode executar a conformação de feixe nos dados. Por exemplo, o processador MIMO de transmissão 1484 pode aplicar pesos de conformação de feixe aos símbolos de modulação. Os pesos de conformação de feixe podem corresponder a uma ou mais antenas do arranjo de antenas a partir do qual os símbolos de modulação são transmitidos.
[0195] Durante a operação, a segunda antena 1444 da estação base 1400 pode receber um fluxo de dados
1414. O segundo transceptor 1454 pode receber o fluxo de dados 1414 a partir da segunda antena 1444 e pode proporcionar o fluxo de dados 1414 para o demodulador 1462. O demodulador 1462 pode demodular sinais modulados do fluxo de dados 1414 e proporcionar dados demodulados para o processador de dados receptor 1464. O processador de dados receptor 1464 pode extrair dados de áudio a partir dos dados demodulados e proporcionar os dados de áudio extraídos ao processador 1406.
[0196] O processador 1406 pode proporcionar os dados de áudio ao transcodificador 1410 para transcodificação. O decodificador 1438 do transcodificador 1410 pode decodificar os dados de áudio a partir de um primeiro formato em dados de áudio decodificados e o codificador 1436 pode codificar os dados de áudio decodificados em um segundo formato. Em algumas implementações, o codificador 1436 pode codificar os dados de áudio utilizando uma taxa de dados mais alta (por exemplo, conversão ascendente) ou uma taxa de dados mais baixa (por exemplo, conversão descendente) do que a recebida do dispositivo não cabeado. Em outras implementações, os dados de áudio podem não ser transcodificados. Embora a transcodificação (por exemplo, decodificação e codificação) seja ilustrada como sendo executada por um transcodificador 1410, as operações de transcodificação (por exemplo, decodificação e codificação) podem ser executadas por vários componentes da estação base
1400. Por exemplo, a decodificação pode ser executada pelo processador de dados receptor 1464 e a codificação pode ser executada pelo processador de dados de transmissão 1482. Em outras implementações, o processador 1406 pode proporcionar os dados de áudio para o gateway de mídia 1470 para conversão para outro protocolo de transmissão, esquema de codificação ou ambos. O gateway de mídia 1470 pode proporcionar os dados convertidos para outra estação base ou rede principal via a conexão de rede 1460.
[0197] O codificador 1436 pode estimar um retardo entre o quadro de referência (por exemplo, o primeiro quadro 131) e o quadro alvo (por exemplo, o segundo quadro 133). O codificador 1436 também pode estimar um deslocamento temporal entre o canal de referência (por exemplo, o primeiro sinal de áudio 130) e o canal alvo (por exemplo, o segundo sinal de áudio 132) baseado no retardo e baseado nos dados históricos de retardo. O codificador 1436 pode quantizar e codificar o valor do deslocamento temporal (ou o desvio final) em uma resolução diferente baseado na taxa de amostragem CODEC para reduzir (ou minimizar) o impacto no retardo geral do sistema. Em um exemplo de implementação, o codificador pode estimar e utilizar o deslocamento temporal com uma resolução mais alta para propósitos de down mix de multicanal no codificador, entretanto, o codificador pode quantizar e transmitir em uma resolução mais baixa para uso no decodificador. O decodificador 118 pode gerar o primeiro sinal de saída 126 e o segundo sinal de saída 128 por decodificar os sinais codificados baseado no indicador de sinal de referência 164, no valor de desvio não causal 162, no parâmetro de ganho 160 ou em uma combinação dos mesmos. Os dados de áudio codificados gerados no codificador 1436, tal como dados transcodificados, podem ser proporcionados ao processador de dados de transmissão 1482 ou à conexão de rede 1460 via o processador 1406.
[0198] Os dados de áudio transcodificados a partir do transcodificador 1410 podem ser proporcionados para o processador de dados de transmissão 1482 para codificação de acordo com um esquema de modulação, tal como OFDM, para gerar os símbolos de modulação. O processador de dados de transmissão 1482 pode proporcionar os símbolos de modulação para o processador MIMO de transmissão 1484 para processamento e conformação de feixe adicionais. O processador MIMO de transmissão 1484 pode aplicar pesos de conformação de feixe e pode proporcionar os símbolos de modulação para uma ou mais antenas do arranjo de antenas, tal como a primeira antena 1442 via o primeiro transceptor
1452. Assim, a estação base 1400 pode proporcionar um fluxo de dados transcodificado 1416, que corresponde ao fluxo de dados 1414 recebido do dispositivo não cabeado, para outro dispositivo não cabeado. O fluxo de dados transcodificado 1416 pode possuir um formato de codificação diferente, taxa de dados diferente ou ambos, do que o fluxo de dados 1414. Em outras implementações, o fluxo de dados transcodificado 1416 pode ser proporcionado para a conexão de rede 1460 para transmissão para outra estação base ou para uma rede principal.
[0199] A estação base 1400 pode, portanto, incluir um dispositivo de armazenamento legível por computador (por exemplo, a memória 1432) armazenando instruções que, quando executadas por um processador (por exemplo, o processador 1406 ou o transcodificador 1410), fazem com que o processador execute operações incluindo estimar um retardo entre o quadro de referência e o quadro alvo. As operações também incluem estimar um deslocamento temporal entre o canal de referência e o canal alvo baseado no retardo e nos dados históricos de retardo.
[0200] Os versados na técnica adicionalmente apreciariam que os vários blocos lógicos, configurações, módulos, circuitos e etapas de algoritmos ilustrativos descritos em conexão com as concretizações reveladas neste documento podem ser implementados como hardware eletrônico,
software de computador executado por um dispositivo de processamento como um processador de hardware ou combinações de ambos. Vários componentes, blocos, configurações, módulos, circuitos e etapas ilustrativos foram descritos acima geralmente em termos de sua funcionalidade. Se tal funcionalidade é implementada como hardware ou software executável depende da aplicação particular e das restrições de projeto impostas ao sistema geral. Os versados na técnica podem implementar a funcionalidade descrita de várias maneiras para cada aplicação em particular, mas tais decisões de implementação não devem ser interpretadas como causadoras de um divergência a partir do escopo da presente revelação.
[0201] As etapas de um método ou algoritmo descrito em conexão com as concretizações reveladas neste documento podem ser incorporadas diretamente no hardware, em um módulo de software executado por um processador ou em uma combinação dos dois. Um módulo de software pode residir em um dispositivo de memória, tal como a memória de acesso aleatório (RAM), a memória de acesso aleatório magneto-resistiva (MRAM), a MRAM de transferência de torque de rotação (STT-MRAM), a memória flash, a memória somente para leitura (ROM), a memória somente para leitura programável (PROM), a memória somente para leitura programável apagável (EPROM), memória somente para leitura programável eletricamente apagável (EEPROM), registradores, disco rígido, um disco removível ou uma memória somente para leitura de disco compacto (CD-ROM). Um dispositivo de memória ilustrativo é acoplado com o processador, de modo que o processador possa ler e gravar informações no dispositivo de memória. Em alternativa, o dispositivo de memória pode ser parte integral do processador. O processador e o meio de armazenamento podem residir em um circuito integrado específico de aplicação (ASIC). O ASIC pode residir em um dispositivo de computação ou em um terminal de usuário. Em alternativa, o processador e o meio de armazenamento podem residir como componentes discretos em um dispositivo de computação ou em um terminal do usuário.
[0202] A descrição anterior das implementações reveladas é proporcionada para permitir que um versado na técnica faça ou utilize as implementações reveladas. Várias modificações nessas implementações serão prontamente aparentes para os versados na técnica, e os princípios definidos neste documento podem ser aplicados a outras implementações sem divergir do escopo da revelação. Assim, a presente revelação não é pretendida para ser limitada às implementações apresentadas neste documento, mas deve estar de açodo com o escopo mais amplo possível, consistente com os princípios e os novos aspectos, conforme definido pelas reivindicações a seguir.
Claims (52)
1. Método para codificar sinais de áudio multicanal em um codificador de um dispositivo eletrônico, o método compreendendo: estimar valores de comparação, no codificador, cada valor de comparação indicativo de uma quantidade de incompatibilidade temporal entre um primeiro quadro de referência de um canal de referência e um primeiro quadro alvo correspondente de um canal alvo; suavizar, no codificador, os valores de comparação para gerar valores de comparação suavizados de curto prazo; suavizar, no codificador, os valores de comparação para gerar os primeiros valores de comparação suavizados de longo prazo baseado em um parâmetro de suavização; calcular, no codificador, um valor de correlação cruzada entre os valores de comparação e os valores de comparação suavizados de curto prazo; comparar, no codificador, o valor de correlação cruzada com um limite; ajustar, no codificador, os primeiros valores de comparação suavizados de longo prazo para gerar segundos valores de comparação suavizados de longo prazo, em resposta a determinar que o valor de correlação cruzada excede o limite; estimar, no codificador, um valor de desvio experimental baseado nos segundos valores de comparação suavizados de longo prazo; determinar, no codificador, um valor de desvio não causal baseado no valor de desvio experimental; desviar de forma não causal, no codificador, um canal alvo particular pelo valor de desvio não causal para gerar um canal alvo particular ajustado que está alinhado temporalmente com um canal de referência particular; e gerar, no codificador, pelo menos um dentre um canal de banda média ou um canal de banda lateral baseado no canal de referência particular e no canal alvo particular ajustado.
2. Método, de acordo com a reivindicação 1, em que ajustar os primeiros valores de comparação suavizados de longo prazo compreende aumentar valores de um subconjunto dos primeiros valores de comparação suavizados de longo prazo.
3. Método, de acordo com a reivindicação 2, em que aumentar os valores do subconjunto dos primeiros valores de comparação suavizados de longo prazo compreende aumentar pelo menos um valor de um primeiro índice, em que o primeiro índice corresponde a um valor de desvio não causal de um segundo quadro alvo, o segundo quadro alvo precede imediatamente o primeiro quadro alvo.
4. Método, de acordo com a reivindicação 3, em que o subconjunto dos primeiros valores de comparação suavizados de longo prazo inclui um segundo índice e um terceiro índice, em que o segundo índice é menor que o primeiro índice por um e o terceiro índice é maior que o primeiro índice por um.
5. Método, de acordo com a reivindicação 1, em que os valores de comparação suavizados de curto prazo são adicionalmente baseados em valores de comparação suavizados de curto prazo de pelo menos um quadro anterior.
6. Método, de acordo com a reivindicação 5, em que suavizar os valores de comparação para gerar os valores de comparação suavizados de curto prazo compreende filtragem de resposta ao impulso finita (FIR) dos valores de comparação.
7. Método, de acordo com a reivindicação 1, em que os primeiros valores de comparação suavizados de longo prazo são adicionalmente baseados em uma mistura ponderada dos valores de comparação e dos segundos valores de comparação suavizados de longo prazo de pelo menos um quadro anterior.
8. Método, de acordo com a reivindicação 7, em que suavizar os valores de comparação para gerar os primeiros valores de comparação suavizados de longo prazo compreende a filtragem de resposta ao impulso infinita (IIR) dos valores de comparação.
9. Método, de acordo com a reivindicação 1, em que calcular o valor de correlação cruzada compreende multiplicar cada valor dos valores de comparação por cada valor dos valores de comparação suavizados de curto prazo.
10. Método, de acordo com a reivindicação 1, em que os valores de comparação correspondem aos valores de correlação cruzada dos canais de referência amostrados de forma descendente e dos canais alvo amostrados de forma descendente correspondentes.
11. Método, de acordo com a reivindicação 1, adicionalmente compreendendo adaptar, no codificador, o parâmetro de suavização baseado na variação dos valores de comparação suavizados de curto prazo em relação aos segundos valores de comparação suavizados de longo prazo.
12. Método, de acordo com a reivindicação 1, em que um valor do parâmetro de suavização é ajustado baseado no indicador de energia de curto prazo dos canais de entrada e no indicador de energia de longo prazo dos canais de entrada.
13. Método, de acordo com a reivindicação 1, em que o dispositivo eletrônico compreende um dispositivo móvel.
14. Método, de acordo com a reivindicação 1, em que o dispositivo eletrônico compreende uma estação base.
15. Aparelho para codificação de sinais de áudio multicanal, compreendendo: um primeiro microfone configurado para capturar um primeiro quadro de referência de um canal de referência; um segundo microfone configurado para capturar um primeiro quadro alvo correspondente de um canal alvo; e um codificador configurado para: estimar valores de comparação, cada valor de comparação indicativo de uma quantidade de incompatibilidade temporal entre o primeiro quadro de referência do canal de referência e o primeiro quadro alvo do canal alvo; suavizar os valores de comparação para gerar valores de comparação suavizados de curto prazo; suavizar os valores de comparação para gerar os primeiros valores de comparação suavizados de longo prazo baseados em um parâmetro de suavização; calcular um valor de correlação cruzada entre os valores de comparação e os valores de comparação suavizados de curto prazo; comparar o valor de correlação cruzada com um limite; ajustar os primeiros valores de comparação suavizados de longo prazo para gerar os segundos valores de comparação suavizados de longo prazo, em resposta a determinação de que o valor de correlação cruzada excede o limite; estimar um valor de desvio experimental baseado nos segundos valores de comparação suavizados de longo prazo; determinar um valor de desvio não causal baseado no valor de desvio experimental; desviar de forma não causal um canal alvo particular pelo valor de desvio não causal para gerar um canal alvo particular ajustado que está alinhado temporalmente com um canal de referência particular; e gerar pelo menos um dentre um canal de banda média ou um canal de banda lateral baseado no canal de referência particular e no canal alvo particular ajustado.
16. Aparelho, de acordo com a reivindicação 15, em que o codificador é configurado para ajustar os primeiros valores de comparação suavizados de longo prazo, por aumentar os valores de um subconjunto dos primeiros valores de comparação suavizados de longo prazo.
17. Aparelho, de acordo com a reivindicação 16, em que o codificador é configurado para ajustar os primeiros valores de comparação suavizados de longo prazo, por aumentar pelo menos um valor de um primeiro índice, em que o primeiro índice corresponde a um valor de desvio não causal de um segundo alvo quadro, o segundo quadro alvo precede imediatamente o primeiro quadro alvo.
18. Aparelho, de acordo com a reivindicação 17, em que o subconjunto dos primeiros valores de comparação suavizados de longo prazo inclui um segundo índice e um terceiro índice, em que o segundo índice é menor que o primeiro índice por um e o terceiro índice é maior que o primeiro índice por um.
19. Aparelho, de acordo com a reivindicação 15, em que o codificador é configurado para suavizar os valores de comparação para gerar valores de comparação suavizados de curto prazo por filtrar por resposta ao impulso finita (FIR) os valores de comparação.
20. Aparelho, de acordo com a reivindicação 15, em que os primeiros valores de comparação suavizados de longo prazo são adicionalmente baseados em uma mistura ponderada dos valores de comparação e dos segundos valores de comparação suavizados de longo prazo de pelo menos um quadro anterior.
21. Aparelho, de acordo com a reivindicação 20, em que o codificador é configurado para suavizar os valores de comparação para gerar valores de comparação suavizados de longo prazo por filtrar por resposta ao impulso infinita (IIR) os valores de comparação.
22. Aparelho, de acordo com a reivindicação 15, em que os valores de comparação são valores de correlação cruzada de canais de referência amostrados de forma descendente e canais alvo amostrados de forma descendente.
23. Aparelho, de acordo com a reivindicação 15,
em que o codificador é integrado a um dispositivo móvel.
24. Aparelho, de acordo com a reivindicação 15, em que o codificador é integrado a uma estação base.
25. Meio não temporário legível por computador, compreendendo instruções que, quando executadas por um codificador, fazem com que o codificador execute operações compreendendo: estimar valores de comparação, cada valor de comparação indicativo de uma quantidade de incompatibilidade temporal entre um primeiro quadro de referência de um canal de referência e um primeiro quadro alvo correspondente de um canal alvo; suavizar os valores de comparação para gerar valores de comparação suavizados de curto prazo; suavizar os valores de comparação para gerar os primeiros valores de comparação suavizados de longo prazo baseados em um parâmetro de suavização; calcular um valor de correlação cruzada entre os valores de comparação e os valores de comparação suavizados de curto prazo; comparar o valor de correlação cruzada com um limite; ajustar os primeiros valores de comparação suavizados de longo prazo para gerar os segundos valores de comparação suavizados de longo prazo, em resposta a determinar que o valor de correlação cruzada excede o limite; estimar um valor de desvio experimental baseado nos segundos valores de comparação suavizados de longo prazo;
determinar um valor de desvio não causal baseado no valor de desvio experimental; desviar de modo não causal um canal alvo particular pelo valor de desvio não causal para gerar um canal alvo particular ajustado que está alinhado temporalmente com um canal de referência particular; e gerar pelo menos um dentre um canal de banda média ou um canal de banda lateral baseado no canal de referência particular e no canal alvo particular ajustado.
26. Meio não temporário legível por computador, de acordo com a reivindicação 25, em que as operações adicionalmente compreendem ajustar os primeiros valores de comparação suavizados de longo prazo compreendendo aumentar valores de um subconjunto dos primeiros valores de comparação suavizados de longo prazo.
27. Meio não temporário legível por computador, de acordo com a reivindicação 25, em que aumentar os valores do subconjunto dos primeiros valores de comparação suavizados de longo prazo compreende aumentar pelo menos um valor de um primeiro índice, em que o primeiro índice corresponde a um valor de desvio não causal de um segundo quadro alvo, o segundo quadro alvo precede imediatamente o primeiro quadro alvo.
28. Meio não temporário legível por computador, de acordo com a reivindicação 25, em que calcular o valor de correlação cruzada compreende multiplicar cada valor dos valores de comparação com cada valor dos valores de comparação suavizados de curto prazo.
29. Aparelho para codificação de sinais de áudio multicanal compreendendo:
meio para estimar valores de comparação, cada valor de comparação indicativo de uma quantidade de incompatibilidade temporal entre um primeiro quadro de referência de um canal de referência e um primeiro quadro alvo correspondente de um canal alvo; meio para suavizar os valores de comparação para gerar valores de comparação suavizados de curto prazo; meio para suavizar os valores de comparação para gerar os primeiros valores de comparação suavizados de longo prazo baseados em um parâmetro de suavização; meio para calcular um valor de correlação cruzada entre os valores de comparação e os valores de comparação suavizados de curto prazo; meio para comparar o valor de correlação cruzada com um limite; meio para ajustar os primeiros valores de comparação suavizados de longo prazo para gerar os segundos valores de comparação suavizados de longo prazo, em resposta a determinar que o valor de correlação cruzada excede o limite; meio para estimar um valor de desvio experimental baseado nos segundos valores de comparação suavizados de longo prazo; meio para determinar um valor de desvio não causal baseado no valor de desvio experimental; meio para desviar de modo não causal um canal alvo particular pelo valor de desvio não causal para gerar um canal alvo particular ajustado que está alinhado temporalmente com um canal de referência particular; e meio para gerar pelo menos um dentre um canal de banda média ou um canal de banda lateral baseado no canal de referência particular e no canal alvo particular ajustado.
30. Aparelho, de acordo com a reivindicação 29, em que o meio para ajustar os primeiros valores de comparação suavizados de longo prazo compreende meio para aumentar os valores de um subconjunto dos primeiros valores de comparação suavizados de longo prazo.
31. Aparelho, de acordo com a reivindicação 29, em que o meio para aumentar os valores do subconjunto dos primeiros valores de comparação suavizados de longo prazo compreende meio para aumentar pelo menos um valor de um primeiro índice, em que o primeiro índice corresponde a um valor de desvio não causal de um segundo quadro alvo, o segundo quadro alvo precede imediatamente o primeiro quadro alvo.
32. Aparelho, de acordo com a reivindicação 29, em que o meio para calcular o valor de correlação cruzada compreende meio para multiplicar cada valor dos valores de comparação com cada valor dos valores de comparação suavizados de curto prazo.
33. Método para codificação de sinais de áudio multicanal em um codificador de um dispositivo eletrônico, o método compreendendo: estimar valores de comparação, no codificador, cada valor de comparação indicativo de uma quantidade de incompatibilidade temporal entre um primeiro quadro de referência de um canal de referência e um primeiro quadro alvo correspondente de um canal alvo; suavizar, no codificador, os valores de comparação para gerar os primeiros valores de comparação suavizados de longo prazo baseado em um parâmetro de suavização; calcular, no codificador, um parâmetro de ganho entre um segundo quadro de referência do canal de referência e um segundo quadro alvo correspondente do canal alvo, o parâmetro de ganho baseado em uma energia do segundo quadro de referência e em uma energia do segundo quadro alvo, em que o segundo quadro de referência precede o primeiro quadro de referência e o segundo quadro alvo precede o primeiro quadro alvo; comparar, no codificador, o parâmetro de ganho com um primeiro limite; em resposta à comparação, ajustar, no codificador, um primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo para gerar os segundos valores de comparação suavizados de longo prazo; estimar, no codificador, um valor de desvio experimental baseado nos segundos valores de comparação suavizados de longo prazo; determinar, no codificador, um valor de desvio não causal baseado no valor de desvio experimental; desviar de modo não causal, no codificador, um canal alvo particular pelo valor de desvio não causal para gerar um canal alvo particular ajustado que está alinhado temporalmente com um canal de referência particular; e gerar, no codificador, pelo menos um dentre um canal de banda média ou um canal de banda lateral baseado no canal de referência particular e no canal alvo particular ajustado.
34. Método, de acordo com a reivindicação 33, em que ajustar do primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo compreende enfatizar um lado de desvio positivo dos primeiros valores de comparação suavizados de longo prazo em resposta à comparação de que o parâmetro de ganho é maior do que o primeiro limite.
35. Método, de acordo com a reivindicação 33, em que ajustar o primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo compreende retirar a ênfase um lado de desvio negativo dos primeiros valores de comparação suavizados de longo prazo em resposta à comparação de que o parâmetro de ganho é maior do que o primeiro limite.
36. Método, de acordo com a reivindicação 33, em que ajustar o primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo compreende enfatizar um lado de desvio negativo dos primeiros valores de comparação suavizados de longo prazo em resposta à comparação de que o parâmetro de ganho é menor do que o primeiro limite.
37. Método, de acordo com a reivindicação 33, em que ajustar o primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo compreende retirar a ênfase de um lado de desvio positivo dos primeiros valores de comparação suavizados de longo prazo em resposta à comparação de que o parâmetro de ganho é maior do que o primeiro limite.
38. Aparelho para codificação de sinais de áudio multicanal, compreendendo:
um primeiro microfone configurado para capturar um primeiro quadro de referência de um canal de referência; um segundo microfone configurado para capturar um primeiro quadro alvo de um canal alvo; e um codificador configurado para: estimar valores de comparação, cada valor de comparação indicativo de uma quantidade de incompatibilidade temporal entre o primeiro quadro de referência do canal de referência e o primeiro quadro alvo correspondente do canal alvo; suavizar os valores de comparação para gerar os primeiros valores de comparação suavizados de longo prazo baseados em um parâmetro de suavização; calcular um parâmetro de ganho entre um segundo quadro de referência do canal de referência e um segundo quadro alvo correspondente do canal alvo, o parâmetro de ganho baseado em uma energia do segundo quadro de referência e em uma energia do segundo quadro alvo, em que o segundo quadro de referência precede o primeiro quadro de referência e o segundo quadro alvo precede o primeiro quadro alvo; comparar o parâmetro de ganho com um primeiro limite; em resposta à comparação, ajustar um primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo para gerar os segundos valores de comparação suavizados de longo prazo; estimar um valor de desvio experimental baseado nos segundos valores de comparação suavizados de longo prazo;
determinar um valor de desvio não causal baseado no valor de desvio experimental; desviar de modo não causal um canal alvo particular pelo valor de desvio não causal para gerar um canal alvo particular ajustado que está alinhado temporalmente com um canal de referência particular; e gerar pelo menos um dentre um canal de banda média ou um canal de banda lateral baseado no canal de referência particular e no canal alvo particular ajustado.
39. Aparelho, de acordo com a reivindicação 38, em que o codificador é configurado para ajustar o primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo por enfatizar um lado de desvio positivo dos primeiros valores de comparação suavizados de longo prazo em resposta à comparação de que o parâmetro de ganho é maior do que o primeiro limite.
40. Aparelho, de acordo com a reivindicação 38, em que o codificador está configurado para ajustar o primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo, por retirar a ênfase de um lado de desvio negativo dos primeiros valores de comparação suavizados de longo prazo em resposta à comparação de que o parâmetro de ganho é maior do que o primeiro limite.
41. Aparelho, de acordo com a reivindicação 38, em que o codificador é configurado para ajustar o primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo por enfatizar um lado de desvio negativo dos primeiros valores de comparação suavizados de longo prazo em resposta à comparação de que o parâmetro de ganho é menor do que o primeiro limite.
42. Aparelho, de acordo com a reivindicação 38, em que o codificador é configurado para ajustar o primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo por retirar a ênfase do lado de desvio positivo dos primeiros valores de comparação suavizados de longo prazo em resposta à comparação de que o parâmetro de ganho é maior do que o primeiro limite.
43. Meio não temporário legível por computador, compreendendo instruções que, quando executadas por um codificador, fazem com que o codificador execute operações compreendendo: estimar valores de comparação, cada valor de comparação indicativo de uma quantidade de incompatibilidade temporal entre um primeiro quadro de referência de um canal de referência e um primeiro quadro alvo correspondente de um canal alvo; suavizar os valores de comparação para gerar os primeiros valores de comparação suavizados de longo prazo baseados em um parâmetro de suavização; calcular um parâmetro de ganho entre um segundo quadro de referência do canal de referência e um segundo quadro alvo correspondente do canal alvo, o parâmetro de ganho baseado em uma energia do segundo quadro de referência e em uma energia do segundo quadro alvo, em que o segundo quadro de referência precede o primeiro quadro de referência e o segundo quadro alvo precede o primeiro quadro alvo; comparar o parâmetro de ganho com um primeiro limite;
em resposta à comparação, ajustar, no codificador, um primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo para gerar os segundos valores de comparação suavizados de longo prazo; estimar um valor de desvio experimental baseado nos segundos valores de comparação suavizados de longo prazo; determinar um valor de desvio não causal baseado no valor de desvio experimental; desviar de modo não causal um canal alvo particular pelo valor de desvio não causal para gerar um canal alvo particular ajustado que está alinhado temporalmente com um canal de referência particular; e gerar pelo menos um dentre um canal de banda média ou um canal de banda lateral baseado no canal de referência particular e no canal alvo particular ajustado.
44. Meio não temporário legível por computador, de acordo com a reivindicação 43, em que ajustar o primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo compreende enfatizar um lado de desvio positivo dos primeiros valores de comparação suavizados de longo prazo em resposta à comparação de que o parâmetro de ganho é maior do que o primeiro limite.
45. Meio não temporário legível por computador, de acordo com a reivindicação 43, em que ajustar do primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo compreende retirar a ênfase de um lado de desvio negativo dos primeiros valores de comparação suavizados de longo prazo em resposta à comparação de que o parâmetro de ganho é maior do que o primeiro limite.
46. Meio não temporário legível por computador, de acordo com a reivindicação 43, em que ajustar do primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo compreende enfatizar um lado de desvio negativo dos primeiros valores de comparação suavizados de longo prazo em resposta à comparação de que o parâmetro de ganho é menor do que o primeiro limite.
47. Meio não temporário legível por computador, de acordo com a reivindicação 43, em que ajustar do primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo compreende retirar a ênfase de um lado de desvio positivo dos primeiros valores de comparação suavizados de longo prazo em resposta à comparação de que o parâmetro de ganho é maior do que o primeiro limite.
48. Aparelho para codificação de sinais de áudio multicanal em um codificador de um dispositivo eletrônico, o método compreendendo: meio para estimar valores de comparação, no codificador, cada valor de comparação indicativo de uma quantidade de incompatibilidade temporal entre um primeiro quadro de referência de um canal de referência e um primeiro quadro alvo correspondente de um canal alvo; meio para suavizar, no codificador, os valores de comparação para gerar os primeiros valores de comparação suavizados de longo prazo baseados em um parâmetro de suavização; meio para calcular, no codificador, um parâmetro de ganho entre um segundo quadro de referência do canal de referência e um segundo quadro alvo correspondente do canal alvo, o parâmetro de ganho baseado em uma energia do segundo quadro de referência e em uma energia do segundo quadro alvo, em que o segundo quadro de referência precede o primeiro quadro de referência e o segundo quadro alvo precede o primeiro quadro alvo; meio para comparar o parâmetro de ganho com um primeiro limite; em resposta à comparação, meio para ajustar, no codificador, um primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo para gerar os segundos valores de comparação suavizados de longo prazo; meio para estimar, no codificador, um valor de desvio experimental baseado nos segundos valores de comparação suavizados de longo prazo; meio para determinar, no codificador, um valor de desvio não causal baseado no valor de desvio experimental; meio para desviar de modo não causal, no codificador, um canal alvo particular pelo valor de desvio não causal para gerar um canal alvo particular ajustado que está alinhado temporalmente com um canal de referência particular; e meio para gerar, no codificador, pelo menos um dentre um canal de banda média ou um canal de banda lateral baseado no canal de referência particular e no canal alvo particular ajustado.
49. Aparelho, de acordo com a reivindicação 48, em que o meio para ajustar o primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo compreendem meio para enfatizar um lado de desvio positivo dos primeiros valores de comparação suavizados de longo prazo em resposta à comparação de que o parâmetro de ganho é maior do que o primeiro limite.
50. Aparelho, de acordo com a reivindicação 48, em que o meio para ajustar o primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo compreendem meio para retirar ênfase de um lado de desvio negativo dos primeiros valores de comparação suavizados de longo prazo em resposta à comparação de que o parâmetro de ganho é maior do que o primeiro limite.
51. Aparelho, de acordo com a reivindicação 48, em que o meio para ajustar o primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo compreendem meio para enfatizar um lado de desvio negativo dos primeiros valores de comparação suavizados de longo prazo em resposta à comparação de que o parâmetro de ganho é menor do que o primeiro limite.
52. Aparelho, de acordo com a reivindicação 48, em que o meio para ajustar o primeiro subconjunto dos primeiros valores de comparação suavizados de longo prazo compreendem meio para retirar ênfase de um lado de desvio positivo dos primeiros valores de comparação suavizados de longo prazo em resposta à comparação de que o parâmetro de ganho é maior do que o primeiro limite.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762556653P | 2017-09-11 | 2017-09-11 | |
US62/556,653 | 2017-09-11 | ||
US16/115,129 | 2018-08-28 | ||
US16/115,129 US10891960B2 (en) | 2017-09-11 | 2018-08-28 | Temporal offset estimation |
PCT/US2018/050242 WO2019051399A1 (en) | 2017-09-11 | 2018-09-10 | ESTIMATION OF TIME SHIFT |
Publications (1)
Publication Number | Publication Date |
---|---|
BR112020004703A2 true BR112020004703A2 (pt) | 2020-09-15 |
Family
ID=65632369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112020004703-1A BR112020004703A2 (pt) | 2017-09-11 | 2018-09-10 | estimativa de desvio temporal |
Country Status (10)
Country | Link |
---|---|
US (1) | US10891960B2 (pt) |
EP (1) | EP3682446B1 (pt) |
KR (1) | KR102345910B1 (pt) |
CN (1) | CN111095404B (pt) |
AU (1) | AU2018329187B2 (pt) |
BR (1) | BR112020004703A2 (pt) |
ES (1) | ES2889929T3 (pt) |
SG (1) | SG11202001284YA (pt) |
TW (1) | TWI769304B (pt) |
WO (1) | WO2019051399A1 (pt) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10812310B1 (en) * | 2019-10-17 | 2020-10-20 | Sirius Xm Radio Inc. | Method and apparatus for advanced OFDM triggering techniques |
US11178447B1 (en) * | 2020-05-05 | 2021-11-16 | Twitch Interactive, Inc. | Audio synchronization for audio and video streaming |
US11900961B2 (en) * | 2022-05-31 | 2024-02-13 | Microsoft Technology Licensing, Llc | Multichannel audio speech classification |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6539357B1 (en) * | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US8437720B2 (en) * | 2002-12-02 | 2013-05-07 | Broadcom Corporation | Variable-gain low noise amplifier for digital terrestrial applications |
JP2007506986A (ja) * | 2003-09-17 | 2007-03-22 | 北京阜国数字技術有限公司 | マルチ解像度ベクトル量子化のオーディオcodec方法及びその装置 |
CN1906664A (zh) * | 2004-02-25 | 2007-01-31 | 松下电器产业株式会社 | 音频编码器和音频解码器 |
US7392195B2 (en) * | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
US7974713B2 (en) * | 2005-10-12 | 2011-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Temporal and spatial shaping of multi-channel audio signals |
GB2453117B (en) * | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
CN102301748B (zh) | 2009-05-07 | 2013-08-07 | 华为技术有限公司 | 检测信号延迟的方法、检测装置及编码器 |
US20120314776A1 (en) * | 2010-02-24 | 2012-12-13 | Nippon Telegraph And Telephone Corporation | Multiview video encoding method, multiview video decoding method, multiview video encoding apparatus, multiview video decoding apparatus, and program |
ES2571742T3 (es) * | 2012-04-05 | 2016-05-26 | Huawei Tech Co Ltd | Método de determinación de un parámetro de codificación para una señal de audio multicanal y un codificador de audio multicanal |
US9805725B2 (en) * | 2012-12-21 | 2017-10-31 | Dolby Laboratories Licensing Corporation | Object clustering for rendering object-based audio content based on perceptual criteria |
US9626983B2 (en) * | 2014-06-26 | 2017-04-18 | Qualcomm Incorporated | Temporal gain adjustment based on high-band signal characteristic |
US10693936B2 (en) * | 2015-08-25 | 2020-06-23 | Qualcomm Incorporated | Transporting coded audio data |
ES2904275T3 (es) * | 2015-09-25 | 2022-04-04 | Voiceage Corp | Método y sistema de decodificación de los canales izquierdo y derecho de una señal sonora estéreo |
US10152977B2 (en) | 2015-11-20 | 2018-12-11 | Qualcomm Incorporated | Encoding of multiple audio signals |
US10115403B2 (en) * | 2015-12-18 | 2018-10-30 | Qualcomm Incorporated | Encoding of multiple audio signals |
US10045145B2 (en) | 2015-12-18 | 2018-08-07 | Qualcomm Incorporated | Temporal offset estimation |
US9978381B2 (en) | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
US10304468B2 (en) | 2017-03-20 | 2019-05-28 | Qualcomm Incorporated | Target sample generation |
-
2018
- 2018-08-28 US US16/115,129 patent/US10891960B2/en active Active
- 2018-09-10 EP EP18779509.1A patent/EP3682446B1/en active Active
- 2018-09-10 BR BR112020004703-1A patent/BR112020004703A2/pt unknown
- 2018-09-10 SG SG11202001284YA patent/SG11202001284YA/en unknown
- 2018-09-10 CN CN201880058500.7A patent/CN111095404B/zh active Active
- 2018-09-10 AU AU2018329187A patent/AU2018329187B2/en active Active
- 2018-09-10 WO PCT/US2018/050242 patent/WO2019051399A1/en unknown
- 2018-09-10 KR KR1020207006457A patent/KR102345910B1/ko active IP Right Grant
- 2018-09-10 ES ES18779509T patent/ES2889929T3/es active Active
- 2018-09-11 TW TW107131909A patent/TWI769304B/zh active
Also Published As
Publication number | Publication date |
---|---|
KR20200051609A (ko) | 2020-05-13 |
WO2019051399A1 (en) | 2019-03-14 |
AU2018329187B2 (en) | 2022-09-01 |
AU2018329187A1 (en) | 2020-03-05 |
KR102345910B1 (ko) | 2021-12-30 |
TWI769304B (zh) | 2022-07-01 |
ES2889929T3 (es) | 2022-01-14 |
EP3682446A1 (en) | 2020-07-22 |
EP3682446B1 (en) | 2021-08-25 |
CN111095404A (zh) | 2020-05-01 |
SG11202001284YA (en) | 2020-03-30 |
CN111095404B (zh) | 2021-12-17 |
US10891960B2 (en) | 2021-01-12 |
TW201921338A (zh) | 2019-06-01 |
US20190080703A1 (en) | 2019-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102230623B1 (ko) | 다중의 오디오 신호들의 인코딩 | |
US11094330B2 (en) | Encoding of multiple audio signals | |
US10045145B2 (en) | Temporal offset estimation | |
US11823689B2 (en) | Stereo parameters for stereo decoding | |
BR112019019144A2 (pt) | geração de amostra alvo | |
BR112020004703A2 (pt) | estimativa de desvio temporal | |
KR102708813B1 (ko) | 프레임간 시간 시프트 편차들에 대한 채널 조정 방법의 선택 | |
BR112018012159B1 (pt) | Método de estimativa de deslocamento temporal, aparelho e memória legível por computador | |
BR112018010305B1 (pt) | Codificação de múltiplos sinais de áudio | |
BR112018012154B1 (pt) | Codificação de múltiplos sinais de áudio |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B350 | Update of information on the portal [chapter 15.35 patent gazette] |