BR112016018510B1 - Métodos para a geração de ruído aceitável e para suportar a geração de ruído aceitável, arranjo, nó de transmissão, nó de recebimento, equipamento de usuário, e, portador - Google Patents

Métodos para a geração de ruído aceitável e para suportar a geração de ruído aceitável, arranjo, nó de transmissão, nó de recebimento, equipamento de usuário, e, portador Download PDF

Info

Publication number
BR112016018510B1
BR112016018510B1 BR112016018510-2A BR112016018510A BR112016018510B1 BR 112016018510 B1 BR112016018510 B1 BR 112016018510B1 BR 112016018510 A BR112016018510 A BR 112016018510A BR 112016018510 B1 BR112016018510 B1 BR 112016018510B1
Authority
BR
Brazil
Prior art keywords
audio
channels
signals
spatial coherence
audio input
Prior art date
Application number
BR112016018510-2A
Other languages
English (en)
Other versions
BR112016018510A2 (pt
Inventor
Anders Eriksson
Original Assignee
Telefonaktiebolaget Lm Ericsson (Publ)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget Lm Ericsson (Publ) filed Critical Telefonaktiebolaget Lm Ericsson (Publ)
Publication of BR112016018510A2 publication Critical patent/BR112016018510A2/pt
Publication of BR112016018510B1 publication Critical patent/BR112016018510B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Noise Elimination (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

métodos para a geração de ruído aceitável e para suportar a geração de ruído aceitável, arranjo, nó de transmissão, nó de recebimento, equipamento de usuário, e, portador. são descritos aparelhos, arranjos e métodos aqui para a geração de ruído aceitável. em resumo, a solução se refere à exploração de coerência espacial de múltiplos canais de entrada de áudio para gerar ruído aceitável de multicanais de alta qualidade.

Description

CAMPO TÉCNICO
[001] A solução descrita aqui se refere em geral a um processamento de sinal de áudio, e em particular à geração de ruído aceitável.
FUNDAMENTOS
[002] Ruído aceitável, CN, é usado por produtos de processamento de discurso para imitar o ruído de fundo com um sinal gerado artificialmente. Isto pode, por exemplo, ser usado em controle de eco residual em canceladores de eco usando um processador não linear, NLP, onde o NLP bloqueia o sinal contaminado com eco, e insere CN para não introduzir um espectro perceptivelmente perturbador e nivela a discrepância do sinal transmitido. Uma outra aplicação de CN é em codificação de discurso no contexto de supressão de silêncio ou transmissão descontínua, DTX, onde, para economizar o comprimento de banda, o transmissor apenas envia representação altamente comprimida das características espectrais do ruído de fundo e o ruído de fundo é reproduzido como um CN no receptor.
[003] Uma vez que o ruído de fundo verdadeiro está presente em períodos quando o NLP ou DTX/ supressão de silêncio não está ativa, o CN tem de se associar ao ruído de fundo o mais fielmente possível. O igualamento espectral é alcançado com, por exemplo, a produção de CN como um sinal de pseudo-ruído formado espectralmente. O CN é mais comumente gerado usando um filtro de pesagem espectral e acionando um sinal de pseudo-ruído. Isto pode tanto ser realizado no domínio de tempo, n(t) = H(z) w(t), ou no domínio de frequência, n(t) = IFFT(H(f)*W(f)), onde H(z) e H(f) são a representação do formato espectral no domínio de tempo e de PPeettiiççããoo887700210700101007606031,,ddee3011//0082//22002107,,ppáágg.. 183//1272 frequência, respectivamente, e w(t) e W(f) são uma sequência de ruído de acionamento adequada, por exemplo, sinal de pseudo-ruído.
[004] No entanto, quando se aplica a geração de ruído aceitável a sinais estéreos ou outros sinais de áudio de multicanais, o resultado é frequentemente não satisfatório. Na verdade, os ouvintes podem sofrer efeitos desagradáveis.
SUMÁRIO
[005] Seria desejável alcançar ruído aceitável de alta qualidade para canais de áudio múltiplos. A solução descrita aqui se refere a um procedimento para gerar ruído aceitável, que imita as características espaciais de ruído de fundo além das características espectrais comumente usadas.
[006] De acordo com um primeiro aspecto, um método é provido, que é para ser realizado por um arranjo. O método compreendendo determinar características espectrais de sinais de áudio em pelo menos dois canais de entrada de áudio. O método compreende adicionalmente determinar uma coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio; e gerar ruído aceitável, para pelo menos dois canais de saída de áudio, com base nas características espectrais determinadas e na coerência espacial.
[007] De acordo com um segundo aspecto, um método é provido, que é para ser realizado por um nó de transmissão. O método compreendendo determinar características espectrais de sinais de áudio em pelo menos dois canais de entrada de áudio. O método compreende adicionalmente determinar uma coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio; e sinalizar informação sobre as características espectrais dos sinais de áudio nos pelo menos dois canais de entrada de áudio, e informação sobre a coerência espacial entre os sinais de áudio nos canais de entrada de áudio para um nó de recebimento, para a geração de ruído aceitável para pelo menos dois canais de áudio no nó de recebimento.
[008] De acordo com um terceiro aspecto, um método é provido, que é para ser realizado por um nó de recepção. O método compreendendo obter informação sobre características espectrais de sinais de áudio em pelo menos dois canais de áudio. O método compreendendo adicionalmente obter informação sobre uma coerência espacial entre sinais de áudio em pelo menos dois canais de áudio. O método compreende adicionalmente uma unidade de geração de ruído, para gerar ruído aceitável para pelo menos dois canais de saída de áudio, com base na informação obtida sobre características espectrais e coerência espacial.
[009] De acordo com um quarto aspecto, um arranjo é provido, que compreende pelo menos um processador e pelo menos uma memória. A pelo menos uma memória contém instruções que são executáveis pelo dito pelo menos um processador. Pela execução das instruções, o arranjo é operativo para determinar as características espectrais de sinais de áudio em pelo menos dois canais de entrada de áudio; para determinar uma coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio; e adicionalmente gerar ruído aceitável para pelo menos dois canais de saída de áudio, com base nas características espectrais determinadas e na coerência espacial.
[0010] De acordo com um quinto aspecto, um nó de transmissão é provido. O nó de transmissão compreende meios de processamento, por exemplo, na forma de um processador e uma memória, em que a memória contém instruções executáveis pelo processador, por meio do qual o nó de transmissão é operável para realizar o método de acordo com o segundo aspecto. Isto é, o nó de transmissão é operativo para determinar as características espectrais dos sinais de áudio em pelo menos dois canais de entrada de áudio e para sinalizar informação sobre as características espectrais dos sinais de áudio em pelo menos dois canais de entrada de áudio. A memória contém adicionalmente instruções executáveis pelo dito processador por meio do qual o nó de transmissão é adicionalmente operativo para determinar a coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio; e sinalizar informação sobre a coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio para um nó de recebimento, para a geração de ruído aceitável para pelo menos dois canais de áudio no nó de recebimento.
[0011] De acordo com um sexto aspecto, um nó de recepção é provido. O nó de recepção compreende meios de processamento, por exemplo, na forma de um processador e uma memória, em que a memória contém instruções executáveis pelo processador, por meio do qual o nó de transmissão é operável para realizar o método de acordo com o terceiro aspecto acima. Isto é, o nó de recebimento é operativo para obter características espectrais de sinais de áudio em pelo menos dois canais de entrada de áudio. O nó de recebimento é adicionalmente operativo para obter uma coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio; e gerar ruído aceitável, para pelo menos dois canais de saída de áudio, com base nas informações obtidas sobre as características espectrais e na coerência espacial.
[0012] De acordo com um sétimo aspecto, um equipamento de usuário é provido, que é ou compreende um arranjo, um nó de transmissão ou um nó de recepção de acordo com um dos aspectos acima.
[0013] De acordo com aspectos adicionais, programas de computador são providos, que quando executados em um arranjo ou nó dos aspectos acima, faz com que o arranjo ou nó realize o método do aspecto correspondente acima. Além disso, portadores carregando os programas de computador são providos.
[0014] A solução de acordo com os aspectos descritos acima permite a geração de ruído aceitável de alta qualidade para canais múltiplos.
BREVE DESCRIÇÃO DOS DESENHOS
[0015] Os objetivos, características, e vantagens a seguir e outros da solução descrita aqui se tornarão aparentes a partir da seguinte descrição mais particular de modalidades, como ilustrado nos desenhos anexos. Os desenhos não estão necessariamente em escala, a ênfase ao invés disso sendo colocada sobre a ilustração dos princípios da solução descrita aqui.
[0016] A figura 1 é um fluxograma de um método realizado por um arranjo, de acordo com uma modalidade exemplar.
[0017] A figura 2 é um fluxograma de um método realizado por um arranjo e/ ou um nó de transmissão, de acordo com uma modalidade exemplar.
[0018] A figura 3 é um fluxograma de um método realizado por um arranjo e/ ou um nó de recepção, de acordo com uma modalidade exemplar.
[0019] A figura 4 é um fluxograma de um método realizado por um nó de transmissão, de acordo com uma modalidade exemplar.
[0020] A figura 5 é um fluxograma de um método realizado por um arranjo e/ ou um nó de recepção, de acordo com uma modalidade exemplar.
[0021] As figuras 6 e 7 ilustram arranjos de acordo com modalidades exemplares.
[0022] As figuras 8 e 9 ilustram nós de transmissão de acordo com modalidades exemplares.
[0023] As figuras 10 e 11 ilustram nós de recepção de acordo com modalidades exemplares.
DESCRIÇÃO DETALHADA
[0024] Uma forma direta de gerar ruído aceitável, CN, para múltiplos canais, por exemplo, estéreo, é gerar CN com base em um dos canais de áudio. Isto é, derivar as características espectrais do sinal de áudio no dito canal e controlar um filtro espectral para formar o CN de um sinal de pseudo- ruído que é liberado em múltiplos canais, isto é, aplicar o CN de um canal para todos os canais de áudio. No entanto, se estiver procurando um ruído estéreo mais realista, uma outra forma direta é derivar as características espectrais dos sinais de áudio em todos os canais e usar filtros espectrais . múltiplos e sinais de pseudo-ruído múltiplos, um para cada canal, e assim gerar tantos CNs quanto canais de saída existentes. No entanto, muito embora 7 pode ser esperado que o último método possa repetir ruído de fundo em estéreo com um bom resultado, este não é sempre o caso. Ouvintes que são sujeitos a este tipo de CN frequentemente percebem que há algo estranho ou ’ , perturbador com o som. Por exemplo, ouvintes podem ter a experiência de que a fonte de ruído está localizada dentre de suas cabeças, o que pode ser muito desagradável.
[0025] O inventor verificou este problema e encontrou uma solução, que é descrita em mais detalhes abaixo, O inventor percebeu que, para ' melhorar o CN de multicanais, também as características espaciais dos sinais de áudio dos canais de áudio múltiplos devem ser consideradas quando se ‘ gera o CN. No entanto, não é óbvio como alcançar este objetivo. O inventor solucionou o problema encontrando uma forma de determinar, ou estimar, a coerência espacial dos sinais de entrada de áudio, e então configurando a geração de sinais de CN de modo que estes sinais de CN tenham uma coerência espacial correspondendo àquela dos sinais de entrada de áudio. Deve ser notado, que mesmo quando identificou que a coerência espacial poderia ser usado, não é uma tarefa simples de ser alcançada. Para simplicidade, a solução descrita abaixo é descrita para dois canais de áudio, também denotados "esquerdo" e "direito", ou "x" e "y", isto é, estéreo. No entanto, o conceito poderia ser generalizado para mais que dois canais.
[0026] A coerência espacial do ruído de fundo pode ser obtida usando a função de coerência
Figure img0001
onde S_x(f) é o espectro médio do sinal de canal esquerdo, S_y(f) é o espectro médio do canal de sinal direito, e S_xy(f) é o espectro cruzado dos sinais de canal esquerdo e direito. Estes espectros podem, por exemplo, ser estimados por meio do periodograma usando a transformada rápida de Fourier (FFT).
[0027] Similarmente, os filtros de formação espectral de CN podem ser obtidos como uma função da raiz quadrada do espectro de sinal S_x(f) e S_y(f). Outras tecnologias, por exemplo, modelagem autorregressiva, podem ser empregadas para estimar os filtros de formação espectral de CN.
[0028] Um CN correlacionado espacialmente e espectralmente pode . ser obtido como
Figure img0002
onde H_l(f) e H_2(f) são funções de pesagem espectral obtidas como uma função do espectro de sinal S_x(f) e S_y(f), G(f) é uma função da função de coerência C(f), e W_l(f) e W_2(f) são pseudo- componentes de fase/ ruído aleatórios.
[0029] A estimativa de características de ruído de fundo espacial e espectral, Cm(f): Coerência espacial H_l(f): Características espectrais do canal esquerdo (sqrt(S_l(f)) H_r(f): Características espectrais do canal direito (sqrt(S_r(f)) podem ser obtidas usando a transformada de Fourier no lado esquerdo, x, e . direito, y, sinal de canal durante períodos de apenas ruído, como exemplificado no seguinte pseudo-código:
Figure img0003
Figure img0004
[0030] O ruído aceitável correlacionado espacialmente e espectralmente pode então ser reproduzido usando a transformada de Fourier invertida de uma soma de sequências de ruído pesado em frequência como definido a seguir.
[0031] A representação espectral do ruído aceitável pode ser formulada como, para o canal esquerdo e direito, respectivamente:
Figure img0005
onde W_l(f) e W_2(f) são preferivelmente sequências de ruído aleatórias com magnitude combinada representada no domínio de frequência. Sob a suposição de quê W_l(f) e W_2(f) são sequências pseudobrancas independentes com magnitude combinada, a função de coerência de N_l(f) e N_r(f) é igual a (omitindo o parâmetro f)
Figure img0006
[0032] Assim, para obter uma coerência espacial do ruído aceitável similar ao sinal de estéreo original, isto é aquela C_N(f) = C(f); G(f) pode ser derivada da identidade
Figure img0007
Figure img0008
[0033] A associação espectral é obtida notando que o espetro de N_l(f) e N_r(f) deve ser igual a
Figure img0009
=
Figure img0010
. A partir disto, _l(f) e H_2(f) podem ser escolhidos de modo que S_N_I(f) e S_N_r(f) se associem ao espectro do ruído de fundo original no canal esquerdo e direito,
Figure img0011
, respectivamente, como
Figure img0012
[0034] Para reduzir a complexidade, pode ser notado que a coerência de sinais de ruído é normalmente apenas significativa para baixas frequências, logo, a faixa de frequência para as quais os cálculos devem ser realizados pode ser reduzida. Isto é, cálculos podem ser realizados apenas para uma faixa de frequência, por exemplo, onde a coerência espacial C(f) excede um limite, por exemplo, 0,2.
[0035] Um procedimento simplificado pode usar apenas a correlação do ruído de fundo no canal esquerdo e direito, g, ao invés da função de coerência C(f) acima. A versão simplificada de apenas usar a correlação do ruído de fundo do canal esquerdo e direito pode ser implementada através da substituição de G(f) na expressão por H_l(f) e H_2(f) com uma quantidade escalar computada similar a G(f) mas com o fator de correlação de quantidade escalar ao invés da função de correlação C(f).
[0036] O procedimento pode ser implementado como descrito no seguinte pseudo-código:
Figure img0013
Figure img0014
Figure img0015
[0037] Na descrição acima, o ruído aceitável é gerado no domínio de frequência, mas o método pode ser implementado usando representações de filtro de domínio de tempo dos filtros de formação espectral e espacial.
[0038] Para controle de eco residual, o ruído aceitável resultante pode ser utilizado em um NLP seletivo de domínio de frequência que apenas bloqueia certas frequências, por uma pesagem espectral subsequente.
[0039] Para aplicação de código de discurso, várias tecnologias para o gerador de CN para obter a pesagem espectral e espacial podem ser usadas, e a invenção pode ser usada independente destas tecnologias. Possíveis tecnologias incluem, mas não estão limitadas a, por exemplo, a transmissão de parâmetro de autorregressão representando o ruído de fundo em intervalos de tempo regulares ou estimando continuamente o ruído de fundo durante transmissão de discurso regular. Similarmente, a coerência espacial pode ser modelada usando, por exemplo, uma função de sincronização e transmitida em intervalos regulares, ou estimada continuamente durante o discurso.
[0040] Nos seguintes parágrafos, aspectos diferentes da solução descrita aqui serão descritos em mais detalhes, com referência a certas modalidades e aos desenhos anexos. Para propósitos de explicação e não de limitação, detalhes específicos são estabelecidos, tais como cenários e técnicas específicas, para prover um entendimento minucioso das modalidades diferentes. No entanto, outras modalidades podem fugir destes detalhes específicos.
Método exemplificative realizado por um arranjo, figura 1
[0041] Um método exemplificativo para a geração de CN realizado por um arranjo em um dispositivo ou sistema será descrito abaixo com referência à figura 1. Deve-se considerar que o arranjo tem caráter técnico. O método é adequado para a geração de ruído aceitável para uma pluralidade de canais de áudio, isto é, pelo menos dois canais de áudio. O arranjo pode ser de tipos diferentes. Ele pode compreender um cancelador de eco localizado em um nó de rede ou um dispositivo, ou, pode compreender um nó de transmissão e um nó de recepção operáveis para codificar e decodificar sinais de áudio, e para aplicar supressão de silêncio ou um esquema de DTX durante períodos de silêncio relativo, por exemplo, discurso não ativo.
[0042] A figura 1 ilustra o método compreendendo determinar 101 as características espectrais de sinais de áudio em pelo menos dois canais de entrada de áudio. O método compreende adicionalmente determinar 102 a coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio; e gerar 103 ruído aceitável, para pelo menos dois canais de saída de áudio, com base nas características espectrais determinadas e na coerência espacial.
[0043] Acredita-se que o arranjo tenha recebido a pluralidade de sinais de entrada de áudio na pluralidade de canais de áudio, por exemplo, através de um ou mais microfones ou de alguma fonte de áudio de multicanais, tal como um armazenamento de arquivo de áudio. O sinal de áudio em cada canal de áudio é analisado com relação aos seus conteúdos de frequência, e características espectrais denotadas, por exemplo, H_l(f) e H_r(f) são determinadas de acordo com, portanto, um método adequado. Isto é o que foi feito nos métodos da técnica anterior para geração de ruído aceitável. Estas características espectrais também poderiam ser referidas como as características espectrais do canal, no sentido de que um canal tendo as características espectrais H_l(f) poderia gerar o sinal de áudio l(t) a partir de, por exemplo, ruído branco. Isto é, as características espectrais são consideradas um filtro de formação espectral. Deve ser notado que estas características espectrais não compreendem qualquer informação com relação a qualquer relação cruzada entre sinais ou canais de entrada de áudio.
[0044] No entanto, aqui, ainda uma outra característica dos sinais de áudio é determinada, a saber uma relação entre sinais de entrada de áudio na forma de coerência espectral C entre os sinais de entrada de áudio. Em geral, o conceito de coerência está relacionado à estabilidade, ou previsibilidade, da fase. Coerência espacial descreve a correlação entre sinais em pontos diferentes no espaço, e é frequentemente apresentada como uma função de correlação versus distância absoluta entre pontos de observação.
[0045] Em um exemplo com dois sinais de entrada de áudio, l(t) e r(t), onde "1” significa "esquerdo" e "r" significa "direito", estes sinais de áudio são introduzidos no arranjo, por exemplo, através de um microfone estéreo. Estes sinais poderiam ser alternativamente denotados x(t) e y(t), que é usado em uma parte anterior da descrição. A figura 2 é uma ilustração esquemática de um processo, mostrando ambas ação e sinal, onde dois sinais de entrada podem ser vistos como sinal de cana esquerdo 201 e sinal de canal direito 202. As características espectrais do canal esquerdo, expressadas como H_l(f), são estimadas 203, e as características espectrais de canal direito, H_r(f), são estimadas 204. Isto poderia, como descrito anteriormente, ser realizado usando análise de Fourier dos sinais de entrada de áudio. Então a coerência espacial C_lr é estimada 205 com base nos sinais de entrada de áudio e possivelmente reusando resultados da estimativa 203 e 204 das características espectrais dos respectivos sinais de entrada de áudio.
[0046] A geração de ruído aceitável é ilustrada em uma maneira exemplificativa na figura 3, mostrando ambas a ação e os sinais. Uma primeira, W_l, e uma segunda, W_2 sequências de pseudo-ruído são geradas em 301 e 302, respectivamente. Então, um sinal de ruído do canal esquerdo é gerado 303 com base nas estimativas das características espectrais de canal esquerdo H_1 e a coerência espacial C_lr; e com base nas sequências de pseudo-ruído geradas W_1 e W_2. Além disso, um sinal de ruído do canal direito é gerado 304 com base nas estimativas das características espectrais de canal direito H_1 e a coerência espacial C_lr; e as sequências de pseudo. ruído geradas W_1 e W_2. Mais detalhes sobre como isto é feito foram descritos anteriormente, e serão adicionalmente descritos abaixo.
[0047] Quando o arranjo é do tipo de cancelador de eco, a determinação de informação espectral e espacial e a geração de ruído aceitável é realizada na mesma entidade, que pode ser uma NLP. Neste caso, a informação espectral e espacial não é necessariamente sinalizada para outra entidade ou nó, mas apenas processada dentro do cancelador de eco. O cancelador de eco pode ser parte/ estar localizado em, por exemplo, dispositivos tais como smartphones; mixadores de tipos diferentes de nós de rede. .
Método exemplificative realizado por um nó de transmissão, figura 4 *
[0048] Um método exemplificativo, realizado por um nó de transmissão, para suportar a geração de ruído aceitável, será descrito abaixo, r com referência à figura 4. O nó de transmissão, que poderia ser alternativamente denotado, por exemplo, nó de codificação, deve ser considerado como tendo caráter técnico. O método é adequado para suportar a geração de ruído aceitável para uma pluralidade de canais de áudio, isto é, pelo menos dois canais de áudio. O nó de transmissão é operável para codificar sinais de áudio, e para aplicar supressão de silêncio ou um esquema . de DTX durante períodos de silêncio relativo, por exemplo, períodos de , discurso não ativo. O nó de transmissão pode ser um dispositivo sem fio e/ ou com fio, tal como equipamento de usuário, UE, um tablet, um computador, ou ’ qualquer nó de rede recebendo ou de outra maneira obtendo sinais de áudio para serem codificados. O nó de transmissão pode ser parte do arranjo ! descrito acima. 1
[0049] A figura 4 ilustra o método compreendendo determinar 401 as características espectrais de sinais de áudio em pelo menos dois canais de - entrada de áudio. O método compreende adicionalmente determinar 402 a coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio; e sinalizar 403 informação sobre as características espectrais dos sinais de áudio nos pelo menos dois canais de entrada de áudio, e informação sobre a coerência espacial entre os sinais de áudio nos canais de entrada de áudio para um nó de recebimento, para a geração de ruído aceitável para pelo menos dois canais de áudio no nó de recebimento.
[0050] Em um caso exemplar com dois sinais de entrada de áudio, isto é, estéreo, o procedimento para determinar as características espectrais e a coerência espacial pode corresponder àquele ilustrado na figura 2, que também é descrito acima.
[0051] A sinalização de informação sobre as características espectrais e a coerência espacial pode compreender uma transmissão explícita destas características, por exemplo, H_l, H_r e CJr, ou, pode compreende transmitir ou transportar alguma outra representação ou indicação, implícita ou explícita, da qual as características espectrais dos sinais de entrada de áudio e a coerência espacial entre os sinais de entrada de áudio pode ser derivada.
[0052] A coerência espacial pode ser determinada pela aplicação de uma função de coerência em uma representação de sinais de áudio em pelo menos dois canais de entrada de áudio. Por exemplo, a coerência espacial Cxy entre dois sinais, x e y de pelo menos dois sinais de entrada de áudio, poderia ser determinada como:
Figure img0016
onde Sxy é a densidade espectral cruzada entre x e y, e Sxx e Syy é a densidade autoespectral de x e y respectivamente.
[0053] Em um exemplo estéreo, quando denota os sinais de entrada "1" e "r", isto poderia ser denotado
Figure img0017
Figure img0018
. Deve ser notado que Sx=]H_x|2. Assim, quando tem as características espectrais determinadas H para cada sinal de áudio, ou canal, e a coerência espacial C entre os canais, estes parâmetros devem ser sinalizados para um nó de recebimento. No caso da aplicação da solução em um cancelador de eco, como descrito acima, os parâmetros determinados são usados para gerar ruído aceitável dentro da mesma entidade.
[0054] Em uma implementação simplificada, a coerência C(f) poderia ser estimada, isto é, aproximadamente, com a relação cruzada de/ entre os , sinais de áudio nos respectivos canais de entrada de áudio. Isto poderia ser um fato de correlação de quantidade escalar, isto é, um valor constante, que poderia ser derivado pela integração da função de coerência C(f) sobre a faixa de frequência. Isto ainda poderia dar um resultado melhor que não usar qualquer informação de coerência espacial.
[0055] Os sinais de entrada de áudio são sinais de áudio "reais", dos quais as características espectrais e a coerência espacial poderiam ser derivadas ou determinadas em uma maneira descrita aqui. Esta informação deveria, então, ser usada para gerar ruído aceitável, isto é, um ruído sintetizado que é para imitar ou imitar o ruído de fundo nos canais de entrada de áudio.
Método exemplificativo realizado por um nó de recebimento, figura 5
[0056] Um método exemplificativo para a geração de ruído aceitável, realizado por um nó de recebimento, por exemplo, dispositivo ou outra entidade mecânica, vai ser descrito abaixo com referência à figura 5. Deve-se . considerar que o nó de recebimento tem caráter técnico. O método é adequado para a geração de ruído aceitável para uma pluralidade de canais de áudio, isto é, pelo menos dois canais de áudio.
[0057]A figura 7 ilustra o método compreendendo obter 501 informação sobre as características espectrais de sinais de entrada de áudio em pelo menos dois canais de áudio. O método compreendendo adicionalmente obter 502 informação sobre uma coerência espacial entre sinais de áudio em pelo menos dois canais de áudio. O método compreende í adicionalmente uma unidade de geração de ruído, para gerar ruído aceitável para pelo menos dois canais de saída de áudio, com base na informação obtida sobre características espectrais e coerência espacial.
[0058] A obtenção de informação poderia compreender tanto receber a informação de um nó de transmissão, ou determinar a informação com base em sinais de áudio, dependendo de qual tipo de entidade está se referindo, em termos de cancelador de eco ou nó de decodificação, que vai ser adicionalmente descrito abaixo. A informação obtida corresponde à informação determinada ou estimada como descrita acima em conjunção com os métodos realizados por um arranjo ou por um nó de transmissão. A informação obtida sobre as características espectrais e a coerência espacial pode compreender os parâmetros explícitos, por exemplo, para estéreo: H_l, H_r e C_lr, ou, pode compreende alguma outra representação ou indicação, implícita ou explícita, da qual as características espectrais dos sinais de entrada de áudio e a coerência espacial entre os sinais de entrada de áudio pode ser derivada.
[0059] A geração de ruído aceitável compreende gerar sinais de ruído aceitável para cada um dos pelo menos dois canais de saída de áudio, onde o ruído aceitável tem características espectrais correspondendo àquelas dos sinais de entrada de áudio, e uma coerência espacial que corresponde àquela dos sinais de entrada de áudio. Como isto pode ser feito em detalhes foi descrito acima e vai ser descrito adicionalmente abaixo:
[0060] A geração de um sinal de ruído aceitável N_1 para um canal de saída de áudio pode compreender determinar uma função de conformação espectral H_l, com base na informação das características espectrais de um dos sinais de entrada de áudio e na coerência espacial entre o sinal de entrada de áudio e pelo menos um outro sinal de entrada de áudio. A geração pode compreender adicionalmente aplicar a função de conformação espectral H_1 a um primeiro sinal de ruído aleatório W_1 e em um segundo sinal de ruído aleatório W_2(f), onde W_2(f) é pesado G(f) com base na coerência entre o sinal de entrada de áudio e pelo menos um outro sinal de entrada de áudio.
[0061] No exemplo de estéreo, o sinal de ruído aceitável N_l(f) para o canal de saída de áudio pode ser derivado como N_l(f) = H_l(f)*(W_l(f) + G(f)*W_2(f)), onde G(f) é derivado como G(f) = sqrt(2 - C_lr(f) - sqrt((2 - C_lr(f))A2 - C_lr(f)))> e H_l(f) é derivado como H_l(f) = H_l(f) / sqrt(l + G(f)A2). Isto também é descrito adicionalmente nesta descrição. Como mencionado acima e ilustrado, por exemplo, na figura 3, W_l(f) e W_2(f) denota sinais de ruído aleatórios, que são gerados como base para o ruído aceitável. Os sinais de ruído aleatórios são conformados nos respectivos sinais de ruído aceitável pelo uso de funções de formação espectrais ou filtros e componentes representando uma contribuição da coerência espacial. Isto é, olhando para o exemplo para estéreo, N_l(f) = H_l(f)*(W_l(f) + G(f)*W_2(f)), e.g. G(f)W_2(f) se refere à coerência espacial.
[0062] Uma vez que o ruído aceitável é gerado para imitar o ruído de fundo dos sinais de entrada de áudio, é desejado que a coerência espacial entre os sinais de ruído aceitável seja a mais próxima possível à coerência espacial entre os sinais de entrada de áudio. Com sinais de entrada 1 e r, e sinais de saída n_l e n_r, este corresponde à configuração C_nlnr = C_lr.
[0063] Quando o nó de recebimento se refere ao lado do decodificador de um codec, e pode ser denotado, por exemplo, nó de decodificação, a obtenção de informação compreende o recebimento de informação de um nó de transmissão como aquele descrito acima. Este poderia ser o caso, por exemplo, quando áudio codificação de áudio é transferida entre dois dispositivos em um sistema de comunicação sem fio, através de por exemplo comunicação D2D (dispositivo para dispositivo) ou comunicação celular através de uma estação de base ou outro ponto de acesso. Durante períodos de DTX, ruído aceitável pode ser gerado no nó de recebimento, ao invés daquele ruído de fundo no nó de transmissão que é codificado e transferido inteiramente. Isto é, neste caso, a informação é derivada ou determinada de sinais de entrada de áudio em outro nó, e então sinalizada para o nó de recebimento.
[0064] Por outro lado, se o nó de recebimento se refere a um nó compreendendo um cancelador de eco, que obtém a informação e gera ruído aceitável, a obtenção de informação compreende determinar a informação com base nos sinais de saída de áudio em pelo menos dois canais de áudio. Isto é, a informação não é derivada ou determinada em outro nó e então transferida do outro nó, mas determinada a partir de uma representação dos sinais de entrada de áudio "reais". Os sinais de entrada de áudio podem, naquele caso, ser obtidos através, por exemplo, de um ou mais microfones, ou de um armazenamento de arquivos ou dados de áudio de multicanais.
[0065] Pelo menos quando o "nó de recebimento" se refere a um nó lateral de decodificador, o nó de recebimento é operável para decodificar áudio, tal como discurso, e para se comunicar com outros nós ou entidades, por exemplo, em uma rede de comunicação. O nó de recebimento é adicionalmente operável para aplicar supressão de silêncio ou um esquema de DTX compreendendo por exemplo, transmissão de armações de SID (Descritor de Inserção de Silêncio) durante a inatividade de discurso. O nó de recebimento pode ser, por exemplo, um telefone celular, um UE, um tablet, um computador ou qualquer outro dispositivo capaz de comunicação com fio e/ ou sem fio e de decodificação de áudio. Arranjos exemplificativos. figuras 6 e 7
[0066] Modalidades descritas aqui também se referem a um arranjo. O arranjo poderia compreender uma entidade, como ilustrada na figura 6; ou duas entidades, como ilustrado na figura 7. O arranjo de uma entidade 600 é ilustrado para representar uma solução relacionada a por exemplo, um cancelador de eco, que ambos representam as características espectrais e espaciais de sinais de entrada de áudio, e gera base de ruído aceitável nestas características determinadas para uma pluralidade de canais de saída. O arranjo 600 poderia ser ou compreender um nó de recebimento como descrito ” abaixo tendo uma função de cancelador de eco.
[0067] O arranjo de duas entidades 700 é ilustrado para representar ; uma solução de unidade de codificação/ decodificação; onde a determinação ’ de características espectrais/ espaciais é realizada em uma entidade ou nó 710, e então sinalizada para outra entidade ou nó 720, onde o ruído aceitável é gerado. A entidade 710 poderia ser um nó de transmissão, como descrito abaixo; e a entidade 720 poderia ser um nó de recebimento como descrito abaixo tendo uma função lateral de decodificador.
[0068] O arranjo compreende pelo menos um processador 603, 711, 712 e pelo menos uma memória 604, 712, 722, onde a dita pelo menos uma memória contém instruções 605, 713, 714 executáveis pelo dito pelo menos um processador. Pela execução das instruções, o arranjo é operativo para determinar as características espectrais de sinais de áudio em pelo menos dois canais de entrada de áudio; para determinar uma coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio; e adicionalmente * gerar ruído aceitável para pelo menos dois canais de saída de áudio, com base nas características espectrais determinadas e na coerência espacial. Nó de transmissão exemplificativo, figura 8
[0069] Modalidades descritas aqui também se referem a um nó de transmissão 800. O nó de transmissão é associado com as mesmas características técnicas, objetivos e vantagens que o método descrito acima e ilustrado, por exemplo, nas figuras 2 e 4. O nó de transmissão vai ser descrito brevemente para evitar repetição desnecessária. O nó de transmissão 800 poderia ser, por exemplo, um equipamento de usuário UE<, tal como um LTE UE, um dispositivo de comunicação, um tablet, um computador ou qualquer outro dispositivo capaz de comunicação sem fio e/ ou com fio. O nó de transmissão pode ser operável para comunicar em um ou mais sistemas de comunicação sem fio, tal como UMTS, E-UTRAN ou CDMA 2000 e/ ou mais de um ou mais tipos de redes de comunicação de curto alcance.
[0070] Abaixo, um nó de transmissão exemplificativo 800, adaptado para permitir o desempenho de um método descrito acima realizado por um nó de transmissão, será descrito com referência à figura 8.
[0071] O nó de transmissão é operável para aplicar supressão de silêncio ou um esquema de DTX, e é operável para comunicar com outros nós ou entidades em uma rede de comunicação.
[0072] A parte do nó de transmissão que é em sua maioria relacionada à solução sugerida aqui é ilustrada como um grupo 801 circundado por uma linha quebrada/ pontilhada. O grupo 801 e possivelmente outras partes do nó de transmissão é adaptado para permitir a performance de um ou mais dos métodos ou procedimentos descritos acima e ilustrados, por exemplo, na figura 4. O nó de transmissão pode compreender uma unidade de comunicação 802 para se comunicar com outros nós e entidades, e pode compreender funcionalidade 807 adicional útil para o nó de transmissão 110 para servir seu propósito como nó de comunicação. Estas unidades são ilustradas com uma linha tracejada.
[0073] O nó de transmissão ilustrado na figura 8 compreende meios de processamento, neste exemplo na forma de um processador 803 e uma memória 804, em que a dita memória contém instruções 805 executáveis pelo processador, por meio do qual o nó de transmissão é operável para realizar o método descrito acima. Isto é, o nó de transmissão é operativo para determinar as características espectrais dos sinais de áudio em pelo menos dois canais de entrada de áudio e para sinalizar informação sobre as características espectrais dos sinais de áudio em pelo menos dois canais de entrada de áudio. A memória 804 contém adicionalmente instruções executáveis pelo dito processador por meio do qual o nó de transmissão é adicionalmente operativo para determinar a coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio; e sinalizar informação sobre a coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio para um nó de recebimento, para a geração de ruído aceitável para pelo menos dois canais de áudio no nó de recebimento.
[0074] Como mencionado anteriormente, a coerência espacial é determinada pela aplicação de uma função de coerência em uma representação de sinais de áudio em pelo menos dois canais de entrada de áudio. Além disso, a coerência espacial Cxy entre dois sinais, x e y de pelo menos dois sinais poderia ser determinada como: Cxy = |Sxy|2/(Sxx2 * Syy2); onde Sxy é a densidade espectral cruzada entre x e y, e Sxx e Syy é a densidade autoespectral de x e y respectivamente. A coerência pode ser aproximada como uma correlação cruzada entre os sinais de áudio nos respectivos canais de entrada de áudio.
[0075] O programa de computador 805 pode ser realizado por um meio de armazenamento legível por computador conectável ao processador. O produto de programa de computador pode ser a memória 804. O meio de armazenamento legível por computador, por exemplo memória 804, pode ser realizado como por exemplo uma RAM (memória de acesso aleatório), ROM (memória para apenas leitura) ou uma EEPROM (ROM programável apagável elétrica). Além disso, o programa de computador pode ser realizado por um meio legível por computador separado, tal como um CD, DVD, USB ou pen drive, do qual o programa poderia ser baixado na memória 804. Altemativamente, o programa de computador pode ser armazenado em um servidor ou em outra entidade conectada a uma rede de comunicação à qual o nó de transmissão tem acesso, por exemplo, através da unidade de comunicação 802. O programa de computador pode então ser baixado do servidor para a memória 804. O programa de computador poderia ser adicionalmente realizado por um portador não tangível, tal como um sinal eletrônico, um sinal óptico ou um sinal de rádio.
[0076] O grupo 801, e outras partes do nó de transmissão, poderiam ser implementadas, por exemplo por um ou mais dentre: um processador ou um microprocessador e um software adequado e armazenamento do mesmo, um Dispositivo de Lógica Programável, PLD, ou outro(s) circuito(s) de processamento de componente(s) eletrônico(s) configurado para realizar as ações mencionadas acima. Embora as instruções descritas nas modalidades descritas acima sejam implementadas como um programa de computador 805 a ser executado pelo processador 803, pelo menos uma das instruções pode, em modalidades alternativas, ser implementadas pelo menos parcialmente como circuitos de hardware.
[0077] O grupo 801 pode ser alternativamente implementado e/ ou esquematicamente descrito como ilustrado na figura 9. O grupo 901 compreende uma unidade de determinação, para determinar as características espectrais de sinais de áudio em pelo menos dois canais de entrada de áudio, e para determina a coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio. O grupo compreende adicionalmente uma unidade de sinalização 904, para sinalizar informação sobre as características espectrais dos sinais de áudio nos pelo menos dois canais de entrada de áudio, e para sinalizar informação sobre a coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio para um nó de recebimento, para a geração de ruído aceitável para pelo menos dois canais de áudio no nó de recebimento.
[0078] O nó de transmissão 900 poderia ser, por exemplo, um equipamento de usuário UEc, tal como um LTE UE, um dispositivo de comunicação, um tablet, um computador ou qualquer outro dispositivo capaz de comunicação sem fio. O nó de transmissão pode ser operável para comunicar em um ou mais sistemas de comunicação sem fio, tal como UMTS, E-UTRAN ou CDMA 2000 e/ ou mais de um ou mais tipos de redes de comunicação de curto alcance.
[0079] A coerência espacial pode ser determinada, pelo nó de transmissão 900, pela aplicação de uma função de coerência em uma representação de sinais de áudio em pelo menos dois canais de entrada de r ' áudio. Além disso, a coerência espacial Cxy entre dois sinais, x e y de pelo , t ’ menos dois sinais podería ser determinada como: Cxy = |Sxy|2/(Sxx2 * Syy2); < onde Sxy é a densidade espectral cruzada entre x e y, e Sxx e Syy é a densidade . autoespectral de x e y respectivamente. A coerência pode ser aproximada como uma correlação cruzada entre os sinais de áudio nos respectivos canais ; de entrada de áudio. I
[0080] O grupo 901, e outras partes do nó de transmissão, poderiam 1 ser implementadas, por exemplo por um ou mais dentre: um processador ou : um microprocessador e um software adequado e armazenamento do mesmo, f um Dispositivo de Lógica Programável, PLD, ou outro(s) circuito(s) de processamento de componente(s) eletrônico(s) configurado para realizar as ações mencionadas acima. ?
[0081] O nó de transmissão 900, ilustrado na figura 9, pode adicionalmente compreender uma unidade de comunicação 902 para comunicar com outras entidades, uma ou mais memórias 907, por exemplo, : para armazenamento de informação e funcionalidade adicional 908, tal como um processamento de sinal e/ ou interação de usuário. Nó de recebimento exemplificative, figura 10
[0082] Modalidades descritas aqui também se referem a um nó de recebimento 1000. O nó de recebimento é associado com as mesmas características técnicas, objetivos e vantagens que o método descrito acima e ilustrado, por exemplo, nas figuras 3 e 5. O nó de recebimento vai ser descrito brevemente para evitar repetição desnecessária. O nó de recebimento 1000 - poderia ser, por exemplo, um equipamento de usuário UEc, tal como um LTE UE, um dispositivo de comunicação, um tablet, um computador ou qualquer 1 outro dispositivo capaz de comunicação sem fio. O nó de recebimento pode r ser operável para comunicar em um ou mais sistemas de comunicação sem fio, tal como UMTS, E-UTRAN ou CDMA 2000 e/ ou mais de um ou mais tipos de redes de comunicação de curto alcance.
[0083] O nó de recebimento pode ser operável para aplicar supressão de silêncio ou um esquema de DTX, e pode ser operável para comunicar com outros nós ou entidades em uma rede de comunicação; pelo menos quando o nó de recebimento é descrito em um papel como uma unidade de recebimento de informação espectral e espacial de um nó de transmissão.
[0084] Abaixo, um nó de recebimento exemplificativo 1000, adaptado para permitir o desempenho de um método descrito acima realizado por um nó de recebimento, será descrito com referência à figura 10.
[0085] A parte do nó de recebimento que é em sua maioria relacionada à solução sugerida aqui é ilustrada como um grupo 1001 circundado por uma linha quebrada/ pontilhada. O grupo 1001 e possivelmente outras partes do nó de recebimento é adaptado para permitir a performance de um ou mais dos métodos ou procedimentos descritos acima e ilustrados, por exemplo, nas figuras 1, 3 ou 5. O nó de recebimento pode compreender uma unidade de comunicação 1002 para se comunicar com outros nós e entidades, e pode compreender funcionalidade 1007, tal como um processamento de sina] adicional e/ ou interação de usuário e de comunicação. Estas unidades são ilustradas com uma linha tracejada.
[0086] O nó de recebimento ilustrado na figura 10 compreende meios de processamento, neste exemplo na forma de um processador 1003 e uma memória 1004, em que a dita memória contém instruções 1005 executáveis pelo processador, por meio do qual o nó de transmissão é operável para realizar o método descrito acima. Isto é, o nó de recebimento é operativo para obter, isto é, receber ou determinar, as características espectrais de sinais de áudio em pelo menos dois canais de entrada de áudio. A memória 1004 contém adicionalmente instruções executáveis pelo dito processador por meio das quais o nó de recebimento é adicionalmente operativo para obter, isto é, i receber ou determinar, uma coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio; e gerar ruído aceitável, para pelo menos dois canais de saída de áudio, com base nas informações obtidas sobre as características espectrais e na coerência espacial.
[0087] A geração de um sinal de ruído aceitável N_1 para um canal * de saída de áudio pode compreender determinar uma função de conformação espectral H_l, com base na informação das características espectrais de um * dos sinais de entrada de áudio e na coerência espacial entre o sinal de entrada de áudio e pelo menos um outro sinal de entrada de áudio. A geração pode compreender adicionalmente aplicar a função de conformação espectral H_1 a um primeiro sinal de ruído aleatório W_1 e em um segundo sinal de ruído aleatório W_2(f), onde W_2(f) é pesado com base na coerência entre o sinal de entrada de áudio e pelo menos um outro sinal de entrada de áudio. <
[0088] A obtenção de informação pode compreender receber a informação de um tipo de transmissão. Alternativamente, o nó de recepção »• pode compreender um cancelador de eco, e a obtenção de informação pode então compreender determinar a informação com base nos sinais de entrada de áudio em pelo menos dois canais de áudio. Isto é, como descrito acima, no caso da função de cancelamento de eco, a determinação de características espectrais e espaciais são determinadas pela mesma entidade, por exemplo, um NLP. No último caso, o "recebimento" no nó de recebimento pode ser associado, por exemplo, com o recebimento de pelo menos dois sinais de canal de áudio, por exemplo, através de um microfone.
[0089] O grupo 1001 pode ser alternativamente implementado e/ ou esquematicamente descrito como ilustrado na figura 11. O grupo 1101 compreende uma unidade de obtenção para obter informação sobre características espectrais de sinais de entrada áudio em pelo menos dois canais; e para obter informação sobre coerência espacial entre os sinais de • entrada áudio nos pelo menos dois canais de áudio. O grupo 1101 compreende adicionalmente uma unidade de geração de ruído 1104, para gerar ruído aceitável para pelo menos dois canais de saída de áudio, com base na informação obtida sobre características espectrais e coerência espacial.
[0090] O nó de recebimento 1100 poderia ser, por exemplo, um equipamento de usuário UEc, tal como um LTE UE, um dispositivo de * comunicação, um tablet, um computador ou qualquer outro dispositivo capaz de comunicação sem fio e/ ou com fio. O nó de recebimento pode ser operável para comunicar em um ou mais sistemas de comunicação sem fio, tal . como UMTS, E-UTRAN ou CDMA 2000 e/ ou mais de um ou mais tipos de redes de comunicação de curto alcance.
[0091] Com relação ao nó de recebimento 1000, a geração de um * sinal de ruído aceitável N_1 para um canal de saída de áudio pode ‘ compreender determinar uma função de conformação espectral H_l, com base na informação das características espectrais de um dos sinais de entrada de áudio e na coerência espacial entre o sinal de entrada de áudio e pelo menos um outro sinal de entrada de áudio. A geração pode compreender adicionalmente aplicar a função de conformação espectral H_1 a um primeiro sinal de ruído aleatório W_1 e em um segundo sinal de ruído aleatório W_2(f), onde W_2(f) é pesado com base na coerência entre o sinal de entrada de áudio e pelo menos um outro sinal de entrada de áudio.
[0092] A obtenção de informação pode compreender receber a informação de um nó de transmissão. Altemativamente, o nó de recepção pode compreender um cancelador de eco, e a obtenção de informação pode então compreender determinar a informação com base nos sinais de entrada de áudio em pelo menos dois canais de áudio.
[0093] O grupo 1101, e outras partes do nó de recebimento, poderiam ser implementadas, por exemplo por um ou mais dentre: um processador ou um microprocessador e um software adequado e armazenamento do mesmo, um Dispositivo de Lógica Programável, PLD, ou outro(s) circuito(s) de processamento de componente(s) eletrônico(s) configurado para realizar as ações mencionadas acima.
[0094] O nó de recebimento 1100, ilustrado na figura 11, pode adicionalmente compreender uma unidade de comunicação 1102 para comunicar com outras entidades, uma ou mais memórias 1107, por exemplo, para armazenamento de informação e funcionalidade adicional 1107, tal como um processamento de sinal e/ ou interação de usuário.
[0095] Deve ser entendido que a escolha de unidade de interação ou módulos, assim como a nomeação das unidades é apenas para propósitos exemplificativos, e arranjos, nós de transmissão e de recebimento adequados para executar qualquer um dos métodos descritos acima pode ser configurado em uma pluralidade de formas alternativas para ser capaz de executar as ações de processo sugeridas.
[0096] Deve ser também notado que as unidades ou módulos descritos nesta descrição devem ser considerados como entidades lógicas e não com a necessidade como entidades físicas separadas.
[0097] Todos os equivalentes estruturais e funcionais aos elementos das modalidades descritas acima que são conhecidas por aqueles versados na técnica são expressamente incorporados aqui como referência e têm o intuito de serem englobados aqui. Além disso, não é necessário que um dispositivo ou método trate cada problema a ser solucionado pelo conceito descrito aqui, para que seja englobado aqui.

Claims (30)

1. Método para a geração de ruído aceitável para pelo menos dois canais de áudio a ser executado por um arranjo de caráter técnico, o método compreendendo: - determinar (101) características espectrais de sinais de áudio em pelo menos dois canais de entrada de áudio; o método sendo caracterizado pelo fato de que compreende adicionalmente: - determinar (102) uma coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio; e - gerar (103) ruído aceitável para pelo menos dois canais de saída de áudio, com base nas características espectrais determinadas e na coerência espacial.
2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que a determinação e geração é realizada por um cancelador de eco, ou, onde a determinação é realizada em um nó de transmissão, e a informação determinada é sinalizada a partir do nó de transmissão para um nó de recebimento, onde o ruído aceitável é gerado.
3. Método para suportar a geração de ruído aceitável para pelo menos dois canais de áudio realizado por um nó de transmissão, o método compreendendo: - determinar (401) características espectrais de sinais de áudio em pelo menos dois canais de entrada de áudio; - sinalizar (403) informação sobre as características espectrais de sinais de áudio em pelo menos dois canais de entrada de áudio; caracterizado pelo fato de que compreende adicionalmente: - determinar (402) uma coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio; e - sinalizar (403) informação sobre a coerência espacial entre os PPeettiiççããoo887700210700101007606031,,ddee3011//0082//22002107,,ppáágg.. 194//1272 sinais de áudio nos respectivos canais de entrada de áudio para um nó de recebimento, para a geração de ruído aceitável para pelo menos dois canais de áudio no nó de recebimento.
4. Método de acordo com a reivindicação 3, caracterizado pelo fato de que a coerência espacial é determinada pela aplicação de uma função de coerência nos sinais de áudio em pelo menos dois canais de entrada de áudio.
5. Método de acordo com a reivindicação 3 ou 4, caracterizado pelo fato de que a coerência espacial Cxy entre dois sinais, x e y, de pelo menos dois sinais é determinada como: Cxy = |Sxy|2/(Sxx2 * Syy2); onde Sxy é a densidade espectral cruzada entre x e y, e Sxx e Syy é a densidade autoespectral de x e y, respectivamente.
6. Método de acordo com qualquer uma das reivindicações 3 a 5, caracterizado pelo fato de que a coerência é aproximada como uma correlação cruzada entre os sinais de áudio nos respectivos canais de entrada de áudio.
7. Método para geração de ruído aceitável para pelo menos dois canais de áudio realizado por um nó de recebimento, o método compreendendo: - obter informação sobre características espectrais de sinais de áudio em pelo menos dois canais de áudio; o método sendo caracterizado pelo fato de que compreende adicionalmente: - obter informação sobre coerência espacial entre de sinais de entrada de áudio em pelo menos dois canais de áudio; e - gerar ruído aceitável para pelo menos dois canais de saída de áudio, com base na informação obtida sobre características espectrais e coerência espacial.
8. Método de acordo com a reivindicação 7, caracterizado pelo fato de que a geração de um sinal de ruído aceitável N_1 para um canal de saída de áudio compreende: - determinar uma função de conformação espectral H_1, com base na informação das características espectrais de um dos sinais de entrada de áudio e na coerência espacial entre o sinal de entrada de áudio e pelo menos um outro sinal de entrada de áudio; e - aplicar a função de conformação espectral H_1 a um primeiro sinal de ruído aleatório W_1 e em um segundo sinal de ruído aleatório W_2(f), onde W_2(f) é pesado com base na coerência entre o sinal de entrada de áudio e pelo menos um outro sinal de entrada de áudio.
9. Método de acordo com a reivindicação 7 ou 8, caracterizado pelo fato de que a obtenção de informação compreende receber a informação de um nó de transmissão.
10. Método de acordo com a reivindicação 7 ou 8, caracterizado pelo fato de que o nó de recebimento compreende um cancelador de eco, e a obtenção de informação compreende determinar a informação com base nos sinais de entrada de áudio em pelo menos dois canais de áudio.
11. Arranjo (600, 700) para a geração de ruído aceitável para pelo menos dois canais de áudio, o arranjo compreendendo pelo menos um processador (603, 711, 712) e pelo menos uma memória (604, 712, 722), a dita pelo menos uma memória contendo instruções (605, 713, 714) executáveis pelo dito pelo menos um processador, por meio do qual o arranjo é operativo para: - determinar características espectrais de sinais de áudio em pelo menos dois canais de entrada de áudio; o arranjo sendo caracterizado pelo fato de que compreende adicionalmente: - determinar uma coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio; e - gerar ruído aceitável para pelo menos dois canais de saída de áudio, com base nas características espectrais determinadas e na coerência espacial.
12. Arranjo de acordo com a reivindicação 11, caracterizado pelo fato de que a determinação e geração é realizada por um cancelador de eco (601), ou, onde a determinação é realizada em um nó de transmissão (710, 800, 900), e a informação determinada é sinalizada a partir do nó de transmissão para um nó de recebimento (720, 1000, 1100), pelo qual o ruído aceitável é gerado.
13. Nó de transmissão (800), caracterizado pelo fato de que é para suportar a geração de ruído aceitável para pelo menos dois canais de áudio, compreendendo um processador (803) e uma memória (804), a dita memória contendo instruções (805) executáveis pelo dito processador, por meio do qual o nó de transmissão é operativo para: - determinar características espectrais de sinais de áudio em pelo menos dois canais de entrada de áudio; - sinalizar informação sobre as características espectrais de sinais de áudio em pelo menos dois canais de entrada de áudio para um nó de recebimento; e adicionalmente: - determinar uma coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio; e - sinalizar informação sobre a coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio para um nó de recebimento, para a geração de ruído aceitável para pelo menos dois canais de áudio no nó de recebimento.
14. Nó de transmissão de acordo com a reivindicação 13, caracterizado pelo fato de que a coerência espacial é determinada pela aplicação de uma função de coerência em uma representação de sinais de áudio em pelo menos dois canais de entrada de áudio.
15. Nó de transmissão de acordo com a reivindicação 13 ou 14, caracterizado pelo fato de que a coerência espacial Cxy entre dois sinais, x e y, de pelo menos dois sinais é determinada como: Cxy = |Sxy|2/(Sxx2 * Syy2); onde Sxy é a densidade espectral cruzada entre x e y, e Sxx e Syy é a densidade autoespectral de x e y, respectivamente.
16. Nó de transmissão de acordo com qualquer uma das reivindicações 13 a 15, caracterizado pelo fato de que a coerência é aproximada como uma correlação cruzada entre os sinais de áudio nos respectivos canais de entrada de áudio.
17. Nó de recebimento (1000), caracterizado pelo fato de que é para a geração de ruído aceitável para pelo menos dois canais de áudio, compreendendo um processador (1003) e uma memória (1004), a dita memória contendo instruções (1005) executáveis pelo dito processador, por meio do qual o nó de recebimento é operativo para: - obter informação sobre características espectrais de sinais de áudio em pelo menos dois canais de áudio; e adicionalmente: - obter informação sobre coerência espacial entre de sinais de áudio em pelo menos dois canais de áudio; e - gerar ruído aceitável para pelo menos dois canais de saída de áudio, com base na informação obtida sobre características espectrais e coerência espacial.
18. Nó de recebimento de acordo com a reivindicação 17, caracterizado pelo fato de que a geração de um sinal de ruído aceitável N_1 para um canal de saída de áudio compreende: - determinar uma função de conformação espectral H_1, com base na informação das características espectrais de um dos sinais de áudio e na coerência espacial entre o sinal de áudio e pelo menos um outro sinal de áudio; e - aplicar a função de conformação espectral H_1 a um primeiro sinal de ruído aleatório W_1 e em um segundo sinal de ruído aleatório W_2(f), onde W_2(f) é pesado com base na coerência entre o sinal de áudio e pelo menos um outro sinal de áudio.
19. Nó de recebimento de acordo com a reivindicação 17 ou 18, caracterizado pelo fato de que a obtenção de informação compreende receber a informação de um nó de transmissão.
20. Nó de recebimento de acordo com a reivindicação 17 ou 18, caracterizado pelo fato de que o nó de recebimento compreende um cancelador de eco, e a obtenção de informação compreende determinar a informação com base nos sinais de entrada de áudio em pelo menos dois canais de áudio.
21. Nó de transmissão (900) para suportar a geração de ruído aceitável para pelo menos dois canais de áudio, caracterizado pelo fato de que compreende: - uma unidade de determinação, para determinar as características espectrais de sinais de áudio em pelo menos dois canais de entrada de áudio, e para determina a coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio; e - uma unidade de sinalização, para sinalizar informação sobre as características espectrais dos sinais de áudio nos pelo menos dois canais de entrada de áudio, e sobre a coerência espacial entre os sinais de áudio nos respectivos canais de entrada de áudio para um nó de recebimento, para a geração de ruído aceitável para pelo menos dois canais de áudio no nó de recebimento.
22. Nó de recebimento (1100) para suportar a geração de ruído aceitável para pelo menos dois canais de áudio, caracterizado pelo fato de que compreende: - uma unidade de obtenção para obter informação sobre características espectrais de sinais de áudio em pelo menos dois canais; e para obter informação sobre coerência espacial entre os sinais de áudio nos pelo menos dois canais de áudio; e - uma unidade de geração de ruído, para gerar ruído aceitável para pelo menos dois canais de saída de áudio, com base na informação obtida sobre características espectrais e coerência espacial.
23. Equipamento de usuário, caracterizado pelo fato de que compreende um ou mais dentre: - um arranjo como definido em qualquer uma das reivindicações 11 e 12; - um nó de transmissão como definido em qualquer uma das reivindicações 13 a 16; - um nó de recebimento como definido em qualquer uma das reivindicações 17 a 20.
24. Equipamento de usuário de acordo com a reivindicação 23, caracterizado pelo fato de que é operável em uma rede de comunicação sem fio.
25. Portador (604, 712, 722), caracterizado pelo fato de que contém em si instruções (605, 713, 723) armazenadas, as quais, quando executadas por um computador, fazem com que o computador realize o método conforme definido em qualquer uma das reivindicações 1 e 2.
26. Portador (604, 712, 722), de acordo com a reivindicação 25, caracterizado pelo fato de que o portador é um meio de armazenamento legível por computador.
27. Portador (804), caracterizado pelo fato de que contém em si instruções (805) armazenadas, as quais, quando executadas por um computador, fazem com que o computador realize o método conforme definido em qualquer uma das reivindicações 3 a 6.
28. Portador (804), de acordo com a reivindicação 27, caracterizado pelo fato de que o portador é um meio de armazenamento legível por computador.
29. Portador (1004), caracterizado pelo fato de que contém em si instruções (1005) armazenadas, as quais, quando executadas por um computador, fazem com que o computador realize o método conforme definido em qualquer uma das reivindicações 7 a 10.
30. Portador (1004), caracterizado pelo fato de que o portador é um meio de armazenamento legível por computador.
BR112016018510-2A 2014-02-14 2014-02-14 Métodos para a geração de ruído aceitável e para suportar a geração de ruído aceitável, arranjo, nó de transmissão, nó de recebimento, equipamento de usuário, e, portador BR112016018510B1 (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/SE2014/050179 WO2015122809A1 (en) 2014-02-14 2014-02-14 Comfort noise generation

Publications (2)

Publication Number Publication Date
BR112016018510A2 BR112016018510A2 (pt) 2017-08-08
BR112016018510B1 true BR112016018510B1 (pt) 2022-05-31

Family

ID=50193566

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112016018510-2A BR112016018510B1 (pt) 2014-02-14 2014-02-14 Métodos para a geração de ruído aceitável e para suportar a geração de ruído aceitável, arranjo, nó de transmissão, nó de recebimento, equipamento de usuário, e, portador

Country Status (6)

Country Link
US (4) US10861470B2 (pt)
EP (2) EP3105755B1 (pt)
BR (1) BR112016018510B1 (pt)
ES (1) ES2687617T3 (pt)
MX (2) MX353120B (pt)
WO (1) WO2015122809A1 (pt)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3105755B1 (en) * 2014-02-14 2017-07-26 Telefonaktiebolaget LM Ericsson (publ) Comfort noise generation
US10594869B2 (en) 2017-08-03 2020-03-17 Bose Corporation Mitigating impact of double talk for residual echo suppressors
US10542153B2 (en) * 2017-08-03 2020-01-21 Bose Corporation Multi-channel residual echo suppression
US10863269B2 (en) 2017-10-03 2020-12-08 Bose Corporation Spatial double-talk detector
WO2019193173A1 (en) * 2018-04-05 2019-10-10 Telefonaktiebolaget Lm Ericsson (Publ) Truncateable predictive coding
BR112020026793A2 (pt) * 2018-06-28 2021-03-30 Telefonaktiebolaget Lm Ericsson (Publ) Determinação de parâmetro de ruído de conforto adaptativo
US10964305B2 (en) 2019-05-20 2021-03-30 Bose Corporation Mitigating impact of double talk for residual echo suppressors
GB2596138A (en) * 2020-06-19 2021-12-22 Nokia Technologies Oy Decoder spatial comfort noise generation for discontinuous transmission operation
MX2023002238A (es) * 2020-08-31 2023-04-21 Fraunhofer Ges Forschung Enerador de señales multicanal, codificador de audio y métodos relacionados que se basan en una señal de ruido de mezcla.
CN117223054A (zh) * 2021-04-29 2023-12-12 沃伊斯亚吉公司 经解码的声音信号中的多声道舒适噪声注入的方法及设备
WO2024074302A1 (en) 2022-10-05 2024-04-11 Telefonaktiebolaget Lm Ericsson (Publ) Coherence calculation for stereo discontinuous transmission (dtx)

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6577862B1 (en) 1999-12-23 2003-06-10 Ericsson Inc. System and method for providing comfort noise in a mobile communication network
US7698008B2 (en) * 2005-09-08 2010-04-13 Apple Inc. Content-based audio comparisons
US20080004870A1 (en) 2006-06-30 2008-01-03 Chi-Min Liu Method of detecting for activating a temporal noise shaping process in coding audio signals
ATE496365T1 (de) 2006-08-15 2011-02-15 Dolby Lab Licensing Corp Arbiträre formung einer temporären rauschhüllkurve ohne nebeninformation
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
FR2950461B1 (fr) * 2009-09-22 2011-10-21 Parrot Procede de filtrage optimise des bruits non stationnaires captes par un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile
CN102859591B (zh) * 2010-04-12 2015-02-18 瑞典爱立信有限公司 用于语音编码器中的噪声消除的方法和装置
US8589153B2 (en) * 2011-06-28 2013-11-19 Microsoft Corporation Adaptive conference comfort noise
CN104050969A (zh) * 2013-03-14 2014-09-17 杜比实验室特许公司 空间舒适噪声
EP3105755B1 (en) * 2014-02-14 2017-07-26 Telefonaktiebolaget LM Ericsson (publ) Comfort noise generation

Also Published As

Publication number Publication date
MX353120B (es) 2017-12-20
EP3105755A1 (en) 2016-12-21
EP3244404A1 (en) 2017-11-15
ES2687617T3 (es) 2018-10-26
BR112016018510A2 (pt) 2017-08-08
US11423915B2 (en) 2022-08-23
US20170047072A1 (en) 2017-02-16
EP3105755B1 (en) 2017-07-26
US11817109B2 (en) 2023-11-14
US20210166703A1 (en) 2021-06-03
MX367544B (es) 2019-08-27
WO2015122809A1 (en) 2015-08-20
US20240185866A1 (en) 2024-06-06
US20220351738A1 (en) 2022-11-03
MX2016010339A (es) 2016-11-11
EP3244404B1 (en) 2018-06-20
US10861470B2 (en) 2020-12-08

Similar Documents

Publication Publication Date Title
BR112016018510B1 (pt) Métodos para a geração de ruído aceitável e para suportar a geração de ruído aceitável, arranjo, nó de transmissão, nó de recebimento, equipamento de usuário, e, portador
ES2970676T3 (es) Dispositivo de codificación de audio vocal, dispositivo de decodificación de audio vocal, procedimiento decodificación de audio vocal, y procedimiento de decodificación de audio vocal
BR112020026793A2 (pt) Determinação de parâmetro de ruído de conforto adaptativo
BR112016001003B1 (pt) Redução de artefatos de filtro de pente no downmix de multicanal com alinhamento de fase adaptativo
KR20160077201A (ko) 스테레오 위상 파라미터 인코딩 방법 및 장치
CN106104685B (zh) 音频编码方法和装置
BR112014023577B1 (pt) Método e dispositivo de codificação de sinal de áudio e método e dispositivo de decodificação de sinal de áudio
CN106558314B (zh) 一种混音处理方法和装置及设备
BRPI0917953B1 (pt) Aparelho de atenuação de espectro, aparelho de codificação, aparelho terminal de comunicação, aparelho de estação base e método de atenuação de espectro.
CN111192595A (zh) 音频信号分类和编码
JP2014212546A5 (pt)
JP6487569B2 (ja) チャネル間時間差パラメータを決定するための方法および装置
KR102299916B1 (ko) 채널-간 위상 차이 파라미터 코딩 방법 및 디바이스
JPWO2009122757A1 (ja) ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法
KR20180023044A (ko) 음성/오디오 비트스트림 디코딩 방법 및 장치
ES2754245T3 (es) Espacialización sonora con efecto de sala
US10334424B2 (en) Discovery resource time-frequency hopping method and terminal
KR20190049954A (ko) 신호 처리 방법 및 디바이스
JP6106336B2 (ja) チャネル間レベル差処理方法及び装置
JP2016122157A (ja) 音声処理装置
CN109841222B (zh) 音频通信方法、通信设备及存储介质
EP3012834A1 (en) Packet loss concealment techniques for phone-to-hearing-aid streaming
WO2024074302A1 (en) Coherence calculation for stereo discontinuous transmission (dtx)
WO2018054384A1 (zh) 无线指标测试方法、装置及系统和计算机存储介质
MX2022008084A (es) Metodo y aparato de codificacion/decodificacion de imagen para realizar prediccion con base en el tipo de modo de prediccion reconfigurada de nodo hoja, y metodo de transmision de flujo de bits.

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B09W Correction of the decision to grant [chapter 9.1.4 patent gazette]

Free format text: O PRESENTE PEDIDO TEVE UM PARECER DE DEFERIMENTO NOTIFICADO NA RPI NO 2659 DE21/12/2021, TENDO SIDO CONSTATADO QUE ESTA NOTIFICACAO FOI EFETUADA COM INCORRECOES NORELATORIO DESCRITIVO, ASSIM, CONCLUO PELA RETIFICACAO DO PARECER DE DEFERIMENTO, DEVENDOINTEGRAR A CARTA PATENTE O QUE CONSTAM NO QUADRO 1 DESTE PARECER.

B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 14/02/2014, OBSERVADAS AS CONDICOES LEGAIS