BRPI0921082B1 - aparelho de codificação de sinal de áudio, método de codificação e dispositivo de comunicação - Google Patents

aparelho de codificação de sinal de áudio, método de codificação e dispositivo de comunicação Download PDF

Info

Publication number
BRPI0921082B1
BRPI0921082B1 BRPI0921082A BRPI0921082A BRPI0921082B1 BR PI0921082 B1 BRPI0921082 B1 BR PI0921082B1 BR PI0921082 A BRPI0921082 A BR PI0921082A BR PI0921082 A BRPI0921082 A BR PI0921082A BR PI0921082 B1 BRPI0921082 B1 BR PI0921082B1
Authority
BR
Brazil
Prior art keywords
parameter
frames
bits
audio signal
values
Prior art date
Application number
BRPI0921082A
Other languages
English (en)
Inventor
L Francois Holly
Alastair Gibbs Jonathan
P Ashley James
Mittal Udar
Original Assignee
Google Technology Holdings LLC
Motorola Mobility Llc
Motorola Mobility Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google Technology Holdings LLC, Motorola Mobility Llc, Motorola Mobility Inc filed Critical Google Technology Holdings LLC
Publication of BRPI0921082A2 publication Critical patent/BRPI0921082A2/pt
Publication of BRPI0921082B1 publication Critical patent/BRPI0921082B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

aparelho de codificação de sinal de áudio, método de codificação e dispositivo de comunicação aparelho para codificação de pelo menos um parâmetro associado com uma fonte de sinal para transmissão através de k quadros para um decodificador incluindo um processador que é configurado em operação para atribuir um padrão de bits predeterminado para n bits associados com pelo menos um parâmetro de um primeiro quadro de k quadros e definir os n bits associados com pelo menos um parâmetro de cada um dos k-1 os quadros subseqüentes para valores, de modo que os valores dos n bits dos k-1 quadros subseqüentes representem pelo menos um parâmetro. o padrão de bits predeterminado indica o início do pelo menos um parâmetro.

Description

APARELHO DE CODIFICAÇÃO DE SINAL DE ÁUDIO, MÉTODO DE CODIFICAÇÃO E DISPOSITIVO DE COMUNICAÇÃO
CAMPO DA DIVULGAÇÃO
A divulgação refere-se a um aparelho e um método de codificação de pelo menos um parâmetro associado com uma fonte de sinal para transmissão através de uma pluralidade de quadros.
CONTEXTO DA DIVULGAÇÃO
Codificadores baseados em quadro, como codificadores de voz, usam técnicas de processamento de sinal de áudio para modelar um sinal de voz, e algoritmos de compressão de dados genéricos para representar o sinal de voz modelado resultante em um fluxo de bits compacto que é então transmitido através de quadros sequenciais de um decodificador. Cada um dos quadros sequenciais inclui, assim, o sinal de voz codificado e também parâmetros associados com o sinal de voz, quais os parâmetros que são decodificados pelo decodificador e utilizados para aumentar o processamento do sinal de voz decodificado.
No caso da gravação de estéreo, como em conferências de áudio e vídeo, bem como aplicações de radiodifusão, um sinal estéreo pode ser gravado com dois microfones. Quando os dois microfones são espaçados, o sinal gravado a partir de um alto-falante localizado perto de um microfone que de outro, atinge o último microfone com um atraso em relação ao primeiro. A fim de levar em conta o atraso do sinal de voz entre os microfones diferentes, um parâmetro conhecido como o parâmetro de atraso estéreo ou parâmetro de diferença de tempo inter-canal (ITD) pode ser determinado a partir do sinal estéreo gravado e codificado e transmitido
Petição 870190125749, de 29/11/2019, pág.
11/50
2/18 ao longo dos quadros junto com o sinal de voz codificado e outros parâmetros que descrevem aspectos do sinal de voz estéreo. Estes parâmetros transmitidos são utilizados no decodificador para recriar o sinal estéreo. O parâmetro ITD pode melhorar significativamente a qualidade da perspectiva estéreo recriada desde que ITD seja conhecido por ser a influência dominante de percepção sobre a localização estéreo para freqüências abaixo de aproximadamente 1kHz.
Normalmente, os codificadores de voz empregam taxas de quadro de 20 ms, o que significa que cada bit dentro de um quadro de voz consome 50 bits / s, a estrutura de quadro síncrona presta-se à atualização dos parâmetros em múltiplos de 50Hz. Essas taxas de atualização são compatíveis com as taxas de variação experimentadas no trato vocal humano. Por exemplo, é sabido que a forma do trato vocal humano pode ser adequadamente representada por meio de parâmetros (como o parâmetro de Código Preditivo Linear (LPC)) a uma taxa de atualização de cerca de 50 Hz, enquanto que a energia de excitação de voz e forma é melhor modelada em torno de 200 Hz (ou seja, os parâmetros de excitação são atualizados a 200 Hz).
No entanto, como a funcionalidade de codificadores de voz é aumentada para fornecer codificação estéreo e de música, como no codificador de voz conhecida como “Embedded Variable Bit Rate Codec” (EV-VBR), que está atualmente a ser padronizado pela União Internacional de Telecomunicações (ITU), parâmetros adicionais precisam ser codificados que não digam respeito ao trato vocal humano. Alguns destes parâmetros variam em uma taxa mais lenta do que a taxa de quadros e, assim, o envio do mesmo parâmetro
Petição 870190125749, de 29/11/2019, pág. 12/50
3/18 todo quadro, independentemente de se o parâmetro mudou, representa um desperdício de recursos de banda do canal. Alguns destes parâmetros também podem exigir alta precisão, em termos de número de bits, assim como a evolução lenta ao longo do tempo. A fim de alcançar a precisão exigida elevada, sobre-amostragem combinada com uma redução no número de níveis de quantização pode fornecer uma solução clássica, mas este método tem várias desvantagens, devido à necessária filtragem. Propagação de erros podem ocorrer e também pode haver problemas com a instabilidade no valor de saída, devido à realização prática da filtragem, que também pode retardar o efeito das mudanças de parâmetros instantâneos e apresentar dificuldades em manter a sincronização de codificação e decodificação em estruturas codificadoras análise-por-síntese .
Assim, seria vantajoso fornecer um método melhorado para a codificação e transmissão de parâmetros em um esquema de codificação baseado em quadros.
BREVE DESCRIÇÃO DOS DESENHOS
Um aparelho e método de codificação de pelo menos um parâmetro associado com uma fonte de sinal para transmissão através de uma pluralidade de quadros, de acordo com a divulgação agora será descrito, a título de exemplo, apenas com referência aos desenhos de acompanhamento, em que:
A Figura 1 é um diagrama de blocos esquemático de um sistema de comunicação de acordo com uma personificação da divulgação ;
A Figura 2 é um diagrama de blocos esquemático de um aparelho de codificação para sinais de codificação de voz e parâmetros associados com os sinais de voz, de acordo com
Petição 870190125749, de 29/11/2019, pág. 13/50
4/18
uma personificação da divulgação;
A Figura 3 é uma tabela mostrando o número de
possíveis valores que um parâmetro pode ter, de acordo com
uma modalidade da divulgação para diversos valo res de N e
K;
A Figura 4 é uma tabela mostrando as eficiências de
taxa de bits em % para vários valores de N e K, e
A Figura 5 é um diagrama de fluxo de um método de
codificação de pelo menos um parâmetro associado com uma fonte de sinal para transmissão através de uma pluralidade de quadros de acordo com uma personificação da divulgação.
DESCRIÇÃO DETALHADA
Na descrição a seguir, as incorporações da divulgação serão descritas no que diz respeito a um codificador de voz usado como parte de um dispositivo de comunicação em um aplicativo de teleconferência em que um parâmetro ITD é codificado e transmitido através de um link de comunicação de telefonia fixa, a fim de melhorar o sinal estéreo recriado por um decodificador em outro dispositivo de comunicação. Será, contudo, apreciado que a presente divulgação pode ser usada em outros tipos de codificadores / decodificadores, tais como vídeo, ou outros codificadores / decodificadores de áudio, e também podem ser usados em dispositivos de comunicação sem fio, como uma unidade de assinante, um equipamento de usuário sem fio, um telefone móvel ou celular, um dispositivo multimídia ou de vídeo wireless, um terminal de comunicação, um assistente digital pessoal (PDA), um computador portátil, ou um processador de comunicação integrado. Por exemplo, um sinal estéreo pode ser registrado quando um usuário está falando na presença
Petição 870190125749, de 29/11/2019, pág. 14/50
5/18 de um microfone Bluetooth ™ e um microfone de telefone móvel ou vários microfones em um sistema de comunicação sem fio em um carro. Nesses aplicativos, codificação e transmissão do parâmetro ITD pode melhorar a experiência do usuário.
Referindo-se a Figura 1, um sistema de comunicação de 10, como um sistema de teleconferência 10, compreende um dispositivo de comunicação 12, agindo como um dispositivo de transmissão, e tendo uma entrada acoplada aos microfones 101, 103 para a recepção de sinais de voz dos usuários (não mostrados) do sistema de teleconferência 10, um aparelho de codificação 121 para codificar os sinais de voz e parâmetros associados com os sinais de voz em um fluxo de bits para transmissão através de uma pluralidade de quadros e um transmissor 13 para transmitir os quadros a um dispositivo de comunicação 14, agindo como um dispositivo de recepção, via um enlace de comunicação 16. O dispositivo de comunicação de recebimento 14 compreende um receptor 18 para receber os sinais codificados do dispositivo de comunicação de transmissão 12, um aparelho de decodificação 122 acoplado ao receptor 18 para decodificar os sinais codificados recebidos para fornecer sinais de voz decodificados e parâmetros associados com os sinais de voz e para processamento dos sinais de voz decodificados de acordo com os parâmetros de modo a fornecer a um usuário (ou usuários) do dispositivo de comunicação de recebimento 14 uma saída 20 (tal como um par de alto-falantes que podem fazer parte do dispositivo de comunicação 14, como mostrado na Figura 1 ou separados do dispositivo) a recriação dos sinais de voz fornecidos para os microfones 101, 103. Como
Petição 870190125749, de 29/11/2019, pág. 15/50
6/18 será evidente para um habilitado na técnica, apenas os componentes funcionais dos dispositivos de comunicação 12, 14, que são necessários para a compreensão da divulgação foram mostrados e serão descritos.
Em um aplicativo de exemplo, os dois microfones 101, 103 são usados para gravar sinais de voz em uma sala e se encontram com uma distância interna de até 3 metros. Em um aplicativo de teleconferência, quando há um número de pessoas na sala, o uso de dois ou mais microfones podem proporcionar uma melhor cobertura de áudio da sala. O uso de mais de um microfone resulta em sinais de voz sendo fornecidos ao aparelho de codificação 121 em vários canais. Em muitos sistemas de codificação de múltiplos canais e, em especial em muitos sistemas de codificação de múltiplos canais de voz, a codificação de baixo nível é baseada em codificação de um único canal. Nesses sistemas, o sinal de vários canais pode ser convertido para um sinal mono para as camadas inferiores de um codificador para codificar. A geração deste sinal mono é conhecida como down-mixing. Tal down-mixing pode ser associada com os parâmetros que descrevem aspectos do sinal estéreo com relação ao sinal mono. Especificamente, a down-mixing pode gerar informação de diferença de tempo inter-canal (ITD) que caracteriza a diferença de tempo entre os canais esquerdo e direito.
Referindo-se agora também a Figura 2, os microfones 101, 103 são acoplados a um processador de quadro 105 que recebe sinais de voz dos microfones 101, 103 no primeiro e segundo canais. O processador de quadro 105 divide os sinais recebidos em quadros seqüenciais. Em um exemplo, a
Petição 870190125749, de 29/11/2019, pág. 16/50
7/18 freqüência de amostragem é de 16 k amostras / s e a duração de um quadro é de 20 ms, resultando em cada quadro composto por 320 amostras. O processamento de quadro não resulta em um atraso adicional para o caminho da voz.
O processador de quadro 105 é acoplado a um processador ITD 107, que é organizado para determinar um parâmetro ITD ou parâmetro de atraso estéreo entre os sinais de voz através de microfones diferentes 101, 103. O parâmetro ITD é uma indicação do atraso do sinal de voz em um canal com relação ao sinal de voz no outro. Por exemplo, quando um alto-falante que está mais perto do microfone 101 em comparação com o microfone 103 fala, o sinal de voz recebido no microfone 103 será atrasado em comparação com o sinal de voz recebido no microfone 101, devido à localização do falante. Para que o atraso seja contabilizado ara quando o sinal de voz é recriado no dispositivo receptor 14, o parâmetro de atraso é codificado e transmitido para o dispositivo receptor 14. No exemplo, o parâmetro ITD pode ser positivo ou negativo, dependendo de qual dos canais está atrasado em relação ao outro. O atraso geralmente ocorre devido à diferença nos atrasos entre a fonte de voz dominante (ou seja, o orador falando no momento) e os microfones 101, 103.
Na modalidade mostrada na Figura 2, o processador ITD 107 é ainda acoplado a dois atrasos 109, 111. O primeiro atraso 109 é arranjado para introduzir um atraso para o primeiro canal e o atraso segundo 109 é arranjado para introduzir um atraso para o segundo canal. O valor do atraso que é introduzido depende do parâmetro ITD determinado pelo processador ITD 107. Além disso, em um
Petição 870190125749, de 29/11/2019, pág. 17/50
8/18 exemplo específico apenas um dos atrasos é usado a qualquer momento. Assim, dependendo do sinal do parâmetro estimado ITD, o atraso é tanto introduzido para o primeiro quanto para o segundo sinal. A quantidade de atraso é definida especificamente para ser o mais próximo ao parâmetro ITD possível. Como conseqüência, os sinais de voz na saída dos atrasos 109, 111 são estreitamente alinhados no tempo e especificamente terão uma diferença de tempo inter que normalmente será próxima de zero.
Os atrasos 109, 111 são acoplados a um combinador 113 que gera um sinal mono, combinando os dois sinais de saída de atrasos 109, 111. No exemplo, o combinador 113 é uma unidade de somatório simples que soma os dois sinais juntos. Além disso, os sinais são escalados por um fator de 0,5, a fim de manter a amplitude do sinal mono semelhante à amplitude dos sinais individuais antes da combinação. Em modalidades alternativas, os atrasos 109, 111, podem ser omitidos.
Assim, a saída do combinador 113 é um sinal mono que é um down-mix dos dois sinais de voz recebidos nos microfones 101 e 103.
O combinador 113 é acoplado a um codificador mono 115, que realiza a codificação mono do sinal mono para gerar dados de voz codificados. No exemplo específico, o codificador mono é um codificador Excited Linear Prediction” (CELP), em conformidade com o padrão EV-VBR.
O codificador mono 115 é acoplado a um multiplexador de saída 117 que é também acoplado ao processador ITD 107 através de aparelhos 119.
Aparelho 119 ou codificador de parâmetro 119 é
Petição 870190125749, de 29/11/2019, pág. 18/50
9/18 arranjado para codificar pelo menos um parâmetro associado com uma fonte de sinal para transmissão através de k quadros a um decodificador, por exemplo, o aparelho de decodificação 122 do dispositivo de recepção 14. No exemplo aqui descrito, o aparelho 119 é arranjado para codificar o parâmetro ITD associado com os sinais de voz em microfones 101 e 103. Aparelho 119 compreende um processador 119 configurado em operação para atribuir um determinado padrão de bits para n bits associados com o parâmetro ITD de um primeiro quadro de k quadros e definir os n bits associados com o parâmetro ITD de cada uma dos k-1 quadros subseqüentes à valores, de tal forma que os valores de n bits de k-1 quadros subseqüentes representem pelo menos um parâmetro. O padrão de bits predeterminado indica o início de pelo menos um parâmetro.
Em uma modalidade, k e n são inteiros maiores que um e são selecionados de modo que n bits por quadro são dedicados à transmissão do parâmetro ITD com uma taxa de atualização sobre todos os k quadros que serão suficientes para ultrapassar a taxa Nyquist para o parâmetro uma vez que as sobrecargas de esquema foram tidas em conta. A transmissão do parâmetro ITD sobre k quadros é iniciada através do envio de um padrão de bits predefinido com o primeiro quadro usando os n bits disponíveis associados com o parâmetro ITD. Normalmente, o padrão de bits determinado são todos zeros.
Em uma modalidade, os valores de n bits em cada um dos k-1 quadros subseqüentes são selecionados para serem diferentes dos valores de n bits do padrão de bits predeterminado. Há, portanto, 2n-1 valores possíveis para
Petição 870190125749, de 29/11/2019, pág. 19/50
10/18 os n bits que evitam o padrão de bits predeterminado. Os valores de n bits em cada um dos k-1 quadros subseqüentes são usados para construir o parâmetro ITD, começando com o menos significativo, ou dígito mais significativo do parâmetro ITD em base 2n-1. O número de possíveis valores que o parâmetro ITD pode ter é (2n-1) (k-1), dado que os n bits tenham sido transmitidos. Isso leva a uma eficiência de transmissão de 100 / (kn) . (k-1) log2(2n-1) por cento. Para implementações reais, eficiência excede 66% e pode facilmente exceder 85%.
A Figura 3 fornece uma tabela mostrando o número de possíveis valores para os vários valores de n e k. A Figura 4 fornece uma tabela mostrando as eficiências da taxa de bits em % para vários valores de n e k.
Assim, por codificação de parâmetro para n bits por quadro e transmitindo o parâmetro codificado em k-1 quadros, o arranjo de codificação em conformidade com a divulgação pode atualizar os parâmetros em um ritmo mais lento do que a taxa de quadros e também pode usar menos bits em um quadro para transmitir o parâmetro codificado isto é melhoraram a eficiência de transmissão.
Em uma modalidade, o parâmetro é definido para ter um valor em uma escala predeterminada de valores. Em outras palavras, o parâmetro tem um tamanho pré-definido. Por exemplo, o parâmetro ITD pode assumir um valor na faixa de -48 a + 48. De Figura 3, pode-se observar que, para n = 2 e k = 5, 81 valores possíveis podem ser representados, ou seja, + / - 40. Ao transformar o parâmetro ITD da faixa -48 a 48 para a faixa de -40 a 40, o valor do parâmetro ITD pode ser representado por 2 bits por quadro sobre 5
Petição 870190125749, de 29/11/2019, pág. 20/50
11/18 quadros.
No caso em que um parâmetro tem um valor em um intervalo pré-determinado com os n bits de k-1 quadros fornecendo (2n-1) (k-1) valores que incluem o intervalo prédeterminado e que incluem também os valores não abrangidos pelo intervalo pré-determinado, os valores fora do intervalo podem ser usados no aparelho de decodificação 122 para detectar erros no sinal recebido codificado. Por exemplo, se um parâmetro tem um valor na faixa de 1-20 e n é escolhido para ser 2 e k é escolhido para ser 4, como pode ser visto a partir da Figura 3, o número de possíveis valores sobre k-1 quadro é de 27. Assim, os valores de 2127 não estão dentro do intervalo pré-determinado do parâmetro. Quando o aparelho de decodificação 122 decodifica os dois bits dos quatro quadros recebidos e determina que o parâmetro decodificado tem um valor na faixa de 21-27, em seguida, o aparelho de decodificação 122 irá detectar um erro. Uma vez que um erro é detectado, o aparelho conversor 122 pode tomar medidas adequadas. Por exemplo, o aparelho conversor 122 pode ignorar o valor erroneamente recebido e assumir que o valor recebido anteriormente ainda é válido, ou, em alternativa, pode efetuar um procedimento de mitigação de erro apropriado para o parâmetro em questão.
Atribuindo um padrão de bit predeterminado para n bits de um primeiro quadro de k quadros habilita para o padrão de bits predeterminado para indicar o início da transmissão do parâmetro ITD, para que o processador 119 possa iniciar a transmissão assíncrona do parâmetro ITD, a qualquer momento simplesmente arranjando para o padrão de bits
Petição 870190125749, de 29/11/2019, pág. 21/50
12/18 predeterminado para ser enviado no próximo quadro seguido de k-1 quadros subseqüentes. Transmissão assíncrona do parâmetro ITD garante que há mínimos atrasos entre a quando o valor do parâmetro ITD muda e quando o novo valor é transmitido. Por exemplo, quando o valor do parâmetro ITD muda, o padrão de bits predeterminado pode ser enviado no próximo quadro seguido do novo valor para o parâmetro ITD mesmo quando o dispositivo de comunicação 12 não concluiu a transmissão de um valor anterior do parâmetro ITD. A fim de fornecer redundância e evitar propagação do erro, os parâmetros também podem ser repetidos até que eles mudem a cada k quadros. Alternativamente, o processador 119 pode ser configurado para transmitir regularmente todos os k quadros sem transmissões assíncronas.
Assim, no exemplo dado acima, onde o parâmetro ITD pode ter um valor na faixa de -48 a 48 e o padrão predeterminado é 00 bits, o valor do parâmetro ITD é enviado de forma assíncrona, sempre que o parâmetro ITD é atualizado por uma chamada de rotina através do envio de um padrão pré-determinado de bits 00, em um quadro e, em seguida, envia o valor do parâmetro sobre 5 quadros subseqüentes usando 2 bits por quadro. Se nenhuma atualização for feita ou o valor se mantiver constante, o valor do parâmetro ITD é enviado a cada 5 quadros.
Transmissão assíncrona de dados é conhecida, por exemplo, no protocolo de Controle de Enlace de Dados de Alto Nível (HDLC) e modo de transmissão de caractere assíncrono entre um computador e um modem. Nesta última, cada caractere de informação ou byte é individualmente sincronizado ou enquadrado pelo uso de Elementos de Início
Petição 870190125749, de 29/11/2019, pág. 22/50
13/18 e Fim e pode ser transmitido e recebido em intervalos de tempo irregulares e independentes. O protocolo HDLC é projetado para transmissão em série e conta com um marcador de início e fim de 01111110. Confusão no fluxo de bits é evitada pela inserção de um zero após quaisquer cinco 1s consecutivos, salvo em caso de iniciar ou parar o marcador. Um problema com HDLC é que não é uma largura de banda constante desde toda seqüência de 1s em geral requer mais largura de banda do que toda seqüência de 0s. Além disso, essas técnicas conhecidas utilizam marcadores de iniciar e parar e para a transmissão de caracteres ou fluxos de bits seqüenciais de comprimento variável.
Será apreciado que os n bits transmitidos através de k quadros podem ser usados para codificar um parâmetro ou uma pluralidade de parâmetros, tais como uma seqüência de parâmetros, com a pluralidade de parâmetros de comprimento predeterminado. Em outras palavras, com os possíveis valores da pluralidade de parâmetros estando em um intervalo pré-determinado.
A saída do multiplexador 117 multiplexa os dados codificados que representam os sinais de voz codificados do codificador mono 115 e os dados codificados representando o parâmetro ITD codificado do aparelho 119 em um único fluxo de bits de saída. A inclusão do parâmetro ITD no fluxo de bits ajuda o decodificador na recriação de um sinal estéreo a partir de um sinal mono decodificado a partir dos dados de codificação.
Um método de codificação de pelo menos um parâmetro associado com uma fonte de sinal para transmissão através de k quadros a um decodificador de acordo com uma
Petição 870190125749, de 29/11/2019, pág. 23/50
14/18 incorporação da divulgação agora será descrito com referências a Figura 5.
Na etapa 502, os sinais de voz são recebidos em múltiplos canais de respectivos microfones 101, 103 e um parâmetro ITD para os sinais de voz recebidos é determinado, etapa 504. O parâmetro ITD é codificado por aparelhos 119, atribuindo um determinado padrão de bits para n bits associados com o parâmetro ITD de um primeiro quadro de k quadros, passo 506 e definindo os n bits associados com o parâmetro ITD de cada uma dos k-1 quadros subsequentes para valores, de tal forma que os valores de n bits dos k-1 quadros subseqüentes representam pelo menos um parâmetro, uma etapa 508. O padrão de bits predeterminado indica o início do parâmetro ITD. O padrão de bits predeterminado e o parâmetro ITD associado com a fonte de sinal são então transmitidos ao longo dos k quadros para o aparelho de decodificação 122, passo 510. Em uma modalidade, os sinais de voz recebidos são codificados na etapa 512 e, em seguida, os sinais codificados de voz, são transmitidos ao aparelho de decodificação 122 na etapa 514. Na modalidade mostrada na Figura 2, os sinais de voz codificados, o padrão de bits predeterminado e o parâmetro ITD codificados são combinados e transmitidos ao longo dos quadros em um fluxo único bit.
O aparelho de decodificação 122 do dispositivo de comunicação de recebimento 14 recebe o padrão de bit prédeterminado e os valores do parâmetro ITD sobre k-1 quadros, transmitido pelo dispositivo de comunicação de transmissão 12 e é organizado para decodificar as informações recebidas para fornecer um parâmetro ITD
Petição 870190125749, de 29/11/2019, pág. 24/50
15/18 decodificado. O aparelho de decodificação decodifica cada um dos quadros recebidos para determinar o valor de cada bit em um quadro. Quando o aparelho de decodificação detecta o padrão de bits predeterminado (por exemplo, 00) nos n bits associados com o parâmetro ITD, o aparelho de decodificação determina que o quadro incluindo o padrão de bits predeterminado representa o início do parâmetro ITD e é o primeiro quadro dos k quadros subseqüente a partir do qual o parâmetro ITD pode ser determinado. O aparelho de decodif icação, em seguida, pega os valores dos n bits decodificados associados com o parâmetro ITD dos k-1 quadros subseqüentes e combina os valores para obter o parâmetro ITD.
No caso em que os k-1 valores são primeiros dígitos menos significantes enviados, na base de 2n-l, o parâmetro ITD, I, será formado a partir dos valores recebidos, ri, de acordo com a seguinte fórmula:
Figure BRPI0921082B1_D0001
z=l (D
No caso em que os k-1 valores são primeiros dígitos mais significativos enviados, na base de 2n-l, o parâmetro ITD, I, será formada a partir dos valores recebidos, n, de acordo com a seguinte fórmula:
Figure BRPI0921082B1_D0002
7=1 (2)
O aparelho de decodificação também é arranjado para decodificar os sinais de voz recebidos codificados e para
Petição 870190125749, de 29/11/2019, pág. 25/50
16/18 processar os sinais de voz decodificados de acordo com o parâmetro ITD decodificado de modo a fornecer a um usuário (ou usuários) do dispositivo de comunicação de recebimento 14 a recriação dos sinais de voz fornecidos para os microfones 101, 103.
No exemplo descrito acima, o processador 119 codifica o ITD parâmetro. Será apreciado que o processador 119, em conformidade com a presente divulgação pode ser usado para codificar os outros parâmetros que estão associados a uma fonte de sinal ou de sinal(is) a partir de uma fonte e que parâmetros mudam em uma taxa que é inferior à taxa de quadros . Esses outros parâmetros podem incluir uma ou mais das seguintes características: parâmetro de identificação da fonte do sinal, como um rótulo de locutor baseado em uma identificação do locutor local ou, simplesmente, da posição do banco em uma sala, rótulo de câmera, rótulo de microfone ativo, e marca d'água de segurança para identificar o terminal, parâmetro de descrição de função de transferência relacionada cabeçalho (HRTF), parâmetro de descrição de reverberação de sala, parâmetro de medida de relação sinal / ruído (SNR) local, e o parâmetro de inserção de data e hora (para fins de arquivamento ou de verificação). Também será apreciado que o processador 119 possa ser arranjado para codificar mais de um parâmetro para a transmissão
sobre os k quadros. Neste último caso, a pluralidade de
parâmetros são codificados dentro de (2n-1) (k-1) valores
fornecidos pelos n bits do k-1 quadros.
O processador 119 foi apresentado e descrito como um
processador separado do processador de quadro 105, o
processador ITD 107, o codificador mono 115 e o
Petição 870190125749, de 29/11/2019, pág. 26/50
17/18 multiplexador de saída 117. Será apreciado que o número de processadores e a atribuição de funções de processamento aos processadores é uma questão de escolha do projeto para uma pessoa especializada quando implementando um arranjo de codificação de parâmetro de acordo com esta divulgação.
Em resumo, a divulgação presente fornece pelo menos um parâmetro a ser codificado por n bits por quadro e transmitidos através de k-1 quadros com um determinado padrão de bits sendo enviado nos n bits no primeiro quadro dos k quadros para indicar o início do parâmetro. Assim, a codificação técnica de acordo com a divulgação permite a concatenação de informações de parâmetro a partir de múltiplos (k-1) quadros de modo que taxas de atualização mais lentas do que a taxa de quadros (por exemplo, 50 Hz) possam ser alcançadas. Por ter um padrão de bits predeterminado para indicar o início do parâmetro, o arranjo de codificação em conformidade com a divulgação permite que a transmissão do parâmetro seja assíncrona. Ao permitir a transmissão assíncrona dos parâmetros, a transmissão pode começar em qualquer quadro que torna a transmissão robusta e auto-sincronizada com o atraso de transmissão mínimo.
Além disso, por codificação e transmissão de um parâmetro em n bits mais k quadros, o arranjo de codificação em conformidade com a divulgação permite taxa de bits quadro-por-quadro baixa para codificar o parâmetro e por isso há mais bits livres do quadro a serem usados para o envio de outros dados. Além disso, os mesmos n bits são utilizados todos os quadros para transmitir o parâmetro codificado e, portanto, o arranjo de acordo com a
Petição 870190125749, de 29/11/2019, pág. 27/50
18/18 divulgação permite que o parâmetro seja codificado com baixa complexidade.
Uma outra vantagem da divulgação é que problemas de memória e problemas de propagação de instabilidade 5 associadas à realização prática da filtragem necessária para a transmissão super-amostrada são minimizados através da retransmissão de parâmetros regularmente. Além disso, os atrasos previsíveis na transmissão permitem mudanças de parâmetros de baixo atraso, mantendo a sincronização do 10 codificador e do decodificador que é exigida em estruturas codificadoras de análise-por-síntese.
Na descrição acima, a invenção foi descrita com referência a exemplos específicos de incorporações da invenção. Será, no entanto, evidente que várias 15 modificações e alterações podem ser feitas nela sem se afastar do escopo mais amplo da invenção, tal como estabelecido nas reivindicações anexadas.

Claims (7)

  1. REIVINDICAÇÕES
    1. Aparelho de codificação de sinal de áudio para codificação de pelo menos um parâmetro de sinal de áudio associado com uma fonte de sinal para transmissão através de k quadros de um fluxo de bits codificado a um decodificador, o aparelho caracterizado pelo fato de que compreende:
    um processador configurado em operação para:
    atribuir um padrão de bits predeterminado para n bits associados com o pelo menos um parâmetro de sinal de áudio de um primeiro quadro de k quadros, o padrão de bits predeterminado indicando um início do pelo meno s um parâmetro de sinal de áudio ; e
    definir os n bits associados com o pelo menos um parâmetro de sinal de áudio de cada um dos k-1 quadros subseqüentes em valores, de modo que os valores dos n bits dos k-1 quadros subseqüentes representem o pelo menos um parâmetro de sinal de áudio.
  2. 2. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que os valores dos n bits em cada um dos k-1 quadros subseqüentes são selecionados para serem diferentes dos valores dos n bits do padrão de bits predeterminado.
  3. 3. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que os n bits do quadro seguinte ao primeiro quadro representa o dígito menos significativo ou mais significativo do pelo menos um parâmetro de sinal de áudio.
  4. 4. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que o pelo menos um parâmetro de
    Petição 870190125749, de 29/11/2019, pág. 29/50
    2/5
    sinal de áudio tem um valor em um intervalo pré- determinado. 5. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que o pelo menos um parâmetro de sinal de áudio é codificado com (2n-l)(k-1) valores fornecidos pelos n bits dos k-1 quadros. 6. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que o pelo menos um parâmetro de
    sinal de áudio tem um valor em um intervalo pré-determinado e os n bits dos k-1 quadros fornecem (2n-1) (k-1) valores cobrindo o intervalo predeterminado e incluindo valores que não se enquadram no intervalo pré-determinado.
    7. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que o pelo menos um parâmetro de sinal de áudio inclui uma pluralidade de parâmetros.
    8. Aparelho, de acordo com a reivindicação 7, caracterizado pelo fato de que a pluralidade de parâmetros são codificados dentro de (2n-1)(k-1) valores fornecidos pelos n bits dos k-1 quadros.
    9. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que o pelo menos um parâmetro de sinal de áudio inclui pelo menos um dos seguintes parâmetros:
    parâmetro de atraso estéreo, parâmetro de identificação de fonte de sinal, parâmetro de descrição de função de transferência relacionada a cabeçalho (HRTF), parâmetro de descrição de reverberação de sala, parâmetro de medida de taxa de sinal-ruído local, e parâmetro de inserção de data e hora.
    10. Método de codificação de pelo menos um parâmetro
    Petição 870190125749, de 29/11/2019, pág. 30/50
    3/5 de sinal de áudio associado com uma fonte de sinal para transmissão através de k quadros de um fluxo de bits codificado a um decodificador de sinal de áudio, o método caracterizado pelo fato de que compreende:
    atribuir um padrão de bits predeterminado para n bits associados com o pelo menos um parâmetro de sinal de áudio de um primeiro quadro de k quadros, o padrão de bits predeterminado indicando um início do pelo menos um parâmetro de sinal de áudio; e definir os n bits associados com o pelo menos um parâmetro de sinal de áudio de cada um dos k-1 quadros subseqüentes em valores, de modo que os valores dos n bits dos k-1 quadros subseqüentes representem o pelo menos um parâmetro de sinal de áudio.
    11. Método, de acordo com a reivindicação 10, caracterizado pelo fato de que os valores dos n bits em cada um dos k-1 quadros subseqüentes são selecionados para serem diferentes dos valores dos n bits do padrão de bits predeterminado.
    12. Método, de acordo com a reivindicação 10, caracterizado pelo fato de que o pelo menos um parâmetro de sinal de áudio tem um valor em um intervalo prédeterminado.
    13. Método, de acordo com a reivindicação 10, caracterizado pelo fato de que o pelo menos um parâmetro de sinal de áudio é codificado com (2n-l)(k-1) valores fornecidos pelos n bits dos k-1 quadros.
    14. Método, de acordo com a reivindicação 10, caracterizado pelo fato de que o pelo menos um parâmetro de sinal de áudio tem um valor em um intervalo pré-determinado
    Petição 870190125749, de 29/11/2019, pág. 31/50
    4/5 e os n bits dos k-1 quadros fornecem (2n-1) (k-1) valores cobrindo o intervalo predeterminado e incluindo valores que não se enquadram no intervalo pré-determinado
    15. Método, de acordo com a reivindicação 10, caracterizado por compreender ainda a transmissão do padrão de bits predeterminado e do pelo menos um parâmetro de sinal de áudio associado com a fonte de sinal pelos k quadros para o decodificador.
    16. Método, de acordo com a reivindicação 15, caracterizado pelo fato de que uma transmissão de pelo menos um parâmetro de sinal de áudio pode ser iniciada de forma assíncrona, em qualquer quadro, pela transmissão do padrão de bits predeterminado em um primeiro quadro de k quadros, seguido de k-1 quadros subseqüentes para representar o pelo menos um parâmetro de sinal de áudio.
    17. Dispositivo de comunicação caracterizado por compreender:
    uma entrada para receber um sinal a partir de uma fonte de sinal;
    um codificador de áudio, conforme definido na reivindicação 1, configurado para codificar pelo menos um parâmetro de sinal de áudio associado com a fonte de sinal para transmissão pelos de k quadros de um fluxo de bits codificado a um decodificador, o codificador de áudio configurado para:
    atribuir um padrão de bits predeterminado para n bits associados com o pelo menos um parâmetro de sinal de áudio de um primeiro quadro de k quadros, o padrão de bits predeterminado indicando um início do pelo menos um parâmetro de sinal de áudio; e
    Petição 870190125749, de 29/11/2019, pág. 32/50
  5. 5/5 definir os n bits associados com o pelo menos um parâmetro de cada um dos k-1 quadros subseqüentes em valores, de modo que os valores dos n bits dos k-1 quadros subseqüentes representam o pelo menos um parâmetro de sinal 5 de áudio; e um transmissor para transmitir o padrão de bits predeterminado e o pelo menos um parâmetro de sinal de áudio associado com a fonte de sinal pelos k quadros para o decodificador.
  6. 10 18. Dispositivo de comunicação, de acordo com a reivindicação 17, caracterizado pelo fato de que a fonte de sinal é uma fonte de voz e o dispositivo de comunicação compreende ainda um codificador de voz para a codificação de um sinal de voz recebido da fonte de voz, em que o
  7. 15 transmissor é configurado ainda para transmitir o sinal de voz codificado para o decodificador.
BRPI0921082A 2008-11-19 2009-10-26 aparelho de codificação de sinal de áudio, método de codificação e dispositivo de comunicação BRPI0921082B1 (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/273,974 US8725500B2 (en) 2008-11-19 2008-11-19 Apparatus and method for encoding at least one parameter associated with a signal source
PCT/US2009/062008 WO2010059342A1 (en) 2008-11-19 2009-10-26 Apparatus and method for encoding at least one parameter associated with a signal source

Publications (2)

Publication Number Publication Date
BRPI0921082A2 BRPI0921082A2 (pt) 2016-05-31
BRPI0921082B1 true BRPI0921082B1 (pt) 2020-04-07

Family

ID=41611039

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0921082A BRPI0921082B1 (pt) 2008-11-19 2009-10-26 aparelho de codificação de sinal de áudio, método de codificação e dispositivo de comunicação

Country Status (8)

Country Link
US (1) US8725500B2 (pt)
EP (1) EP2359365B1 (pt)
JP (1) JP5713296B2 (pt)
KR (1) KR101235494B1 (pt)
CN (1) CN102216983B (pt)
BR (1) BRPI0921082B1 (pt)
ES (1) ES2395349T3 (pt)
WO (1) WO2010059342A1 (pt)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2413314A1 (en) * 2009-03-24 2012-02-01 Huawei Technologies Co., Ltd. Method and device for switching a signal delay
US8463414B2 (en) 2010-08-09 2013-06-11 Motorola Mobility Llc Method and apparatus for estimating a parameter for low bit rate stereo transmission
AU2011357816B2 (en) * 2011-02-03 2016-06-16 Telefonaktiebolaget L M Ericsson (Publ) Determining the inter-channel time difference of a multi-channel audio signal
US9767822B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
GB2501080A (en) * 2012-04-11 2013-10-16 Sca Ipla Holdings Inc Telecommunication apparatus and methods
US9129600B2 (en) * 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
US9093064B2 (en) 2013-03-11 2015-07-28 The Nielsen Company (Us), Llc Down-mixing compensation for audio watermarking
CN107358959B (zh) * 2016-05-10 2021-10-26 华为技术有限公司 多声道信号的编码方法和编码器

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4899383A (en) * 1987-09-08 1990-02-06 Westinghouse Electric Corp. Apparatus and method for secure digital communication
NL9002401A (nl) * 1990-11-05 1992-06-01 Philips Nv Kommunikatiesysteem en een centrale besturingseenheid en een kommunikatiepost in het kommunikatiesysteem.
US5884269A (en) * 1995-04-17 1999-03-16 Merging Technologies Lossless compression/decompression of digital audio data
US6496798B1 (en) * 1999-09-30 2002-12-17 Motorola, Inc. Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message
JP2001125598A (ja) * 1999-10-29 2001-05-11 Sony Corp 音楽信号符号化方法と符号化処理装置および音楽使用識別システム
JP3871694B2 (ja) * 2001-01-12 2007-01-24 松下電器産業株式会社 伝送システム
US7016340B1 (en) * 2001-10-26 2006-03-21 General Bandwidth Inc. System and method for testing a voice gateway
WO2003107591A1 (en) * 2002-06-14 2003-12-24 Nokia Corporation Enhanced error concealment for spatial audio
US7809018B2 (en) * 2005-12-16 2010-10-05 Coding Technologies Ab Apparatus for generating and interpreting a data stream with segments having specified entry points
US7230550B1 (en) * 2006-05-16 2007-06-12 Motorola, Inc. Low-complexity bit-robust method and system for combining codewords to form a single codeword
CN101506837B (zh) 2006-07-18 2012-03-14 汤姆森特许公司 用于时间同步的方法及系统

Also Published As

Publication number Publication date
CN102216983A (zh) 2011-10-12
WO2010059342A1 (en) 2010-05-27
KR20110086821A (ko) 2011-08-01
EP2359365A1 (en) 2011-08-24
JP2012509505A (ja) 2012-04-19
KR101235494B1 (ko) 2013-02-20
US8725500B2 (en) 2014-05-13
BRPI0921082A2 (pt) 2016-05-31
ES2395349T3 (es) 2013-02-12
JP5713296B2 (ja) 2015-05-07
US20100125453A1 (en) 2010-05-20
EP2359365B1 (en) 2012-09-26
CN102216983B (zh) 2014-03-05

Similar Documents

Publication Publication Date Title
BRPI0921082B1 (pt) aparelho de codificação de sinal de áudio, método de codificação e dispositivo de comunicação
ES2888627T3 (es) Codificación de audio de múltiples flujos
ES2753899T3 (es) Mezclado de trenes de datos de entrada y generación de un tren de datos de salida a partir de los mismos
JP6386376B2 (ja) マルチレート・スピーチ/オーディオ・コーデックのためのフレーム損失隠匿
CN104054317B (zh) 无线声音传输系统和方法
JP4071631B2 (ja) 音声の非活動中に音声伝送システム間の相互運用性のための方法および装置
US9191516B2 (en) Teleconferencing using steganographically-embedded audio data
JP5011305B2 (ja) オーディオデータパケットの生成方法及びその復調方法
JP2009500976A (ja) 会議通話のための空間化機構
BRPI0412889B1 (pt) métodos para a conversão, combinação e decodificação, aparelhos para conversão e para a decodificação, e meio legível por computador
BR112020016948A2 (pt) Métodos e dispositivos para gerar ou decodificar um fluxo de bits compreendendo sinais de áudio imersivos
CN110770824A (zh) 多流音频译码
ES2778076T3 (es) Método y disposición para suavizar ruido estacionario de fondo
TW201040941A (en) Embedding and extracting ancillary data
JP2020525847A (ja) チャネル間位相差パラメータ符号化方法および装置
BR112019014544A2 (pt) Modificação de parâmetro de diferença de fase entre canais
CN114822564A (zh) 音频对象的比特分配方法和装置
KR20100125340A (ko) 배경 잡음 정보를 디코딩하기 위한 방법 및 수단
JP6289178B2 (ja) 通話会議システム
KR100723679B1 (ko) 착신 대기음 구간에서 cdma 이동통신망의 음성슬롯데이터 구조를 이용해 he aac 비트스트림을 전송하는방법
WO2022012677A1 (zh) 音频编解码方法和相关装置及计算机可读存储介质
JP2010034630A (ja) 音声伝送システム
GB2596107A (en) Managing network jitter for multiple audio streams
CN116798438A (zh) 一种多声道信号的编解码方法和编解码设备以及终端设备
CN115691521A (zh) 一种音频信号的编解码方法和装置

Legal Events

Date Code Title Description
B25D Requested change of name of applicant approved

Owner name: MOTOROLA MOBILITY LLC (US)

B25A Requested transfer of rights approved

Owner name: GOOGLE TECHNOLOGY HOLDINGS LLC (US)

B15K Others concerning applications: alteration of classification

Ipc: G10L 19/16 (2013.01)

B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 07/04/2020, OBSERVADAS AS CONDICOES LEGAIS.