BRPI0621733B1 - método adaptável para extrair pelo menos um sinal, e, aparelho para extrair adaptavelmente pelo menos um sinal - Google Patents

método adaptável para extrair pelo menos um sinal, e, aparelho para extrair adaptavelmente pelo menos um sinal Download PDF

Info

Publication number
BRPI0621733B1
BRPI0621733B1 BRPI0621733A BRPI0621733A BRPI0621733B1 BR PI0621733 B1 BRPI0621733 B1 BR PI0621733B1 BR PI0621733 A BRPI0621733 A BR PI0621733A BR PI0621733 A BRPI0621733 A BR PI0621733A BR PI0621733 B1 BRPI0621733 B1 BR PI0621733B1
Authority
BR
Brazil
Prior art keywords
signals
subband
signal
output
fact
Prior art date
Application number
BRPI0621733A
Other languages
English (en)
Inventor
Claesson Ingvar
Grbic Nedelko
Eriksson Per
Original Assignee
Exaudio Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Exaudio Ab filed Critical Exaudio Ab
Publication of BRPI0621733A2 publication Critical patent/BRPI0621733A2/pt
Publication of BRPI0621733B1 publication Critical patent/BRPI0621733B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/40Arrangements for obtaining a desired directivity characteristic
    • H04R25/407Circuits for combining signals of a plurality of transducers

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Noise Elimination (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Dc Digital Transmission (AREA)

Abstract

método adaptável para extrair pelo menos um sinal, e, aparelho para extrair adaptavelmente pelo menos um sinal. a invenção relaciona-se a um método adaptável para extrair pelo menos de sinais de onda eletromagnética desejados, sinais de onda sonora (40, 42), e quaisquer outros sinais de uma mistura de sinais (40, 42, 44, 46) e suprimir ruído e sinais interferentes para produzir sinais intensificados (50) correspondendo a sinais desejados (10), e um aparelho (70) portanto. se confia no conceito de pelo menos um de uma atenuação de sinais de entrada em cada sub-banda para sinais de tal maneira que todos os sinais desejados (10) sejam atenuados menos que ruído ou sinais de fonte interferentes e/ou uma amplificação de sinais de entrada em cada sub-banda para sinais de fonte de tal maneira que todos os sinais desejados (10) sejam amplificados, e que eles sejam amplificados mais que o ruído e sinais interferentes.

Description

“MÉTODO ADAPTÁVEL PARA EXTRAIR PELO MENOS UM SINAL, E, APARELHO PARA EXTRAIR ADAPTAVELMENTE PELO MENOS UM SINAL”
Campo Técnico [001] A presente invenção pertence a um método adaptável para extrair pelo menos um sinal de sinais de onda eletromagnética desejados, sinais de onda sonora ou quaisquer outros sinais e suprimir outros sinais de ruído e interferentes para produzir sinais intensificados de uma mistura de sinais. Além disso, a invenção pública um aparelho para executar o método. Técnica de Fundamento [002] Algoritmos de extração de sinal (ou intensificação), em geral, visam em criar versões favoráveis de sinais recebidos enquanto ao mesmo tempo atenuar ou cancelar outros sinais de fonte indesejados recebidos por um conjunto de transdutores/sensores. Os algoritmos podem operar em dados de sensor únicos produzindo um ou vários sinais de saída ou podem operar em múltiplos dados de sensor produzindo um ou vários sinais de saída. Um sistema de extração de sinal pode tanto ser um sistema não adaptável fixo que indiferente das variações de sinal de entrada mantém as mesmas propriedades, ou pode ser um sistema adaptativo que pode mudar suas propriedades baseado nas propriedades dos dados recebidos. A operação de filtragem, quando a parte adaptável dos parâmetros estruturais é parada, pode ser tanto linear ou não linear. Além disso, a operação pode ser dependente dos dois estados, sinal ativo e sinal não ativo, isto é, a operação se confia em detecção de atividade de sinal.
[003] Relativo por exemplo à extração de fala, domínios físicos são reconhecidos e assim têm que ser considerados ao reconstruir fala em um ambiente ruidoso. Estes domínios pertencem a seletividade em tempo por exemplo aparecendo em reforço de fala/subtração espectral/TDMA (Acesso Múltiplo por Divisão de Tempo) e outros. O domínio de seletividade de
Petição 870190002663, de 09/01/2019, pág. 7/66 / 28 frequência inclui filtragem de Wiener/filtragem de corte/FDMA (Acesso Múltiplo por Divisão de Frequência) e outros. O domínio de seletividade espacial relaciona-se a Wiener BF (Formação de Feixe)/BSS (Separação de Sinal Cega)/MK (Kurtosis Máximo/Mínimo)/GSC (Cancelador de Lóbulo Lateral Generalizado)/LCMV (Variância Mínima Constrangida Linearmente)/SDMA (Acesso Múltiplo por Divisão Espacial) e outros. Outro domínio existente é o domínio de seletividade de código incluindo por exemplo método de CDMA (Acesso Múltiplo por Divisão de Código), que na realidade é uma combinação do domínio físico supracitado.
[004] Nenhuma pesquisa científica ou achados ainda foram capazes de combinar seletividade de tempo, seletividade de frequência, e seletividade espacial em intensificar/extrair sinais desejados em um ambiente ruidoso. Especialmente, uma tal combinação não foi executada sem pré-suposições ou conhecimento especial sobre o ambiente onde a extração de sinal é realizada. Consequentemente, extração de sinal automática completamente adaptável seria apreciada por aqueles que são qualificados na técnica.
[005] Especialmente os problemas seguintes são encontrados por extração de sinal completamente automática; inter-geometria de sensor e fonte é desconhecida e variável; o número de fontes desejadas é desconhecido; fontes de ruído circunvizinhas têm propriedades espectrais desconhecidas; características de sensor são não ideais e mudam devido a envelhecimento; restrições de complexidade; precisa operar também em cenários de ruído alto.
[006] Trabalho publicado anterior no campo técnico de extração de fala é BLIND SEPARATION AND BLIND DECONVOLUTION: AN INFORMATION-THEORETIC APPROACH para Anthony J. Bell e Terrence J. Sejnowski, em 'Computational Neurobiology Laboratory', 'The Salk Institute', 10010 N. Torrey Pines Road, La Jolla, Califórnia 92037, 07803-2431 45/95 $4.00 0 1995 IEEE.
Petição 870190002663, de 09/01/2019, pág. 8/66 / 28 [007] Separação cega e desconvolução cega são problemas relacionados em aprendizagem não supervisionada. Em separação cega, pessoas diferentes falando, música, etc., são misturadas juntas linearmente por uma matriz. Nada é conhecido sobre as fontes, ou o processo de mistura. O que é recebido é a superposição N delas, xi(t), x2(t), ..., XN(t). A tarefa é assim recuperar as fontes originais achando uma matriz quadrada W que seja uma permutação do inverso de uma matriz desconhecida, A. O problema também foi chamado o problema de festa de coquetel.
[008] Outro trabalho publicado anterior no campo técnico de extração de sinal relaciona-se a Blind Signal Separation: Statistical Principles, JEAN-FRANÇOIS CARDOSO, 'PROCEEDINGS OF THE IEEE', VOL. 86, N° 10, OUTUBRO de 1998.
[009] Separação de sinal cega (BSS) e análise de componente independente (ICA) são técnicas emergentes de processamento de arranjo e análise de dados que visam em recuperar sinais despercebidos ou fontes de misturas observadas (tipicamente, a saída de um arranjo de sensores), explorando só a suposição de independência mútua entre os sinais. A fraqueza das suposições a faz uma abordagem poderosa, mas requer aventurar além de estatísticas de segunda ordem familiares. Os objetivos do documento são revisar algumas das abordagens que foram desenvolvidas recentemente para tratar este problema, ilustrar como elas se originam de princípios básicos, e mostrar como elas se relacionam entre si.
[0010] BSS-ICA/PCA, ICA é equivalente a PCA não linear, se confiando em independência/descorrelação de saída. Todas as fontes de sinal precisam estar ativas simultaneamente, e os sensores gravando os sinais devem igualar ou exceder em número as fontes de sinal. Além disso, o BSS existente e seus iguais só são operáveis em ambientes de baixo ruído.
[0011] Ainda outro trabalho publicado anterior no campo técnico de extração de sinal relaciona-se a BLIND SEPARATION OF DISJOINT
Petição 870190002663, de 09/01/2019, pág. 9/66 / 28
ORTHOGONAL SIGNALS: DEMIXING N SOURCES FROM 2 MIXTURES, Jourjine, A.; Rickard, S.; Yzlmaz O.; 'Proceedings in 2000 IEEE International Conference on Acoustics, Speech, and Signal Processing', Volume 5, Páginas: 2985-2988, 5-9 de junho de 2000.
[0012] Neste artigo científico, os autores apresentam um moderno método para separação cega de qualquer número de fontes usando só duas misturas. O método se aplica quando fontes são (W-) separadas ortogonais, quer dizer, quando os suportes da transformada de Fourier (em janela) de quaisquer dois sinais na mistura são conjuntos separados. É mostrado que, para misturas sem eco de fontes de atenuadas e atrasadas, o método permite estimar os parâmetros de mistura agrupando relações das representações de tempo-frequência das misturas. Estimativas dos parâmetros de mistura são então usadas para dividir a representação de tempo-frequência de uma mistura para recuperar as fontes originais. A técnica é válida até mesmo no caso quando o número de fontes é maior do que o número de misturas. Os resultados gerais são verificados em ambos os sinais de fala e sem fios. Arquivos de som de amostra podem ser achados a: http:// eleceng .ucd.ie/~ srickard/b s s .html.
[0013] Desfazer mistura Ortogonal Separada de BSS se confia em energia de tempo-frequência não sobreposta, onde o número de sensores > o número de fontes. Isso introduz tons musicais, isto é, distorção severa dos sinais, e só opera em ambientes de baixo ruído.
[0014] Diagonalização cumulativa associada de BSS, diagonaliza matrizes cumulativas de ordem mais alta, e os sensores têm que exceder em número ou igualar o número de fontes. Um problema relacionado com isso é sua convergência lenta como também só opera em ambientes de baixo ruído.
[0015] Um trabalho publicado anterior ainda adicional no campo técnico de extração de sinal relaciona-se a ROBUST SPEECH RECOGNITION IN A HIGH INTERFERENCE REAL ROOM
Petição 870190002663, de 09/01/2019, pág. 10/66 / 28
ENVIRONMENT USING BLIND SPEECH EXTRACTION, Koutras, A.; Dermatas, E.; 'Proceedings in 2002 14th International Conference on Digital Signal Processing', Volume 1, Páginas: 167 - 171, 2002.
[0016] Este documento apresenta um moderno método de Extração de
Sinal Cega (BSE) para reconhecimento de fala robusto em um ambiente de espaço real sob a coexistência de fontes de não fala interferentes simultâneas. O método proposto é capaz de extrair a voz do falante visado baseado em um critério de Kurtosis máximo. Experiências de reconhecimento de fonema extensas provaram a eficiência da rede proposta quando usada em uma situação da vida real de um orador falante com a coexistência de várias fontes de não fala (por exemplo, música e ruído), alcançando uma melhoria de reconhecimento de fonema de cerca de 23%, especialmente sob interferência alta. Além disso, comparação da rede proposta a redes de Separação de Fonte Cega (BSS) conhecidas, geralmente usadas em situações semelhantes, mostraram complexidade computacional mais baixa e melhor precisão de reconhecimento da rede de BSE fazendo-a ideal para ser usada como uma extremidade dianteira para sistemas de ASR existentes (Reconhecimento de Fala Automático).
[0017] O critério de Kurtosis máximo extrai uma única fonte com o
Kurtosis mais alto, e o número de sensores > o número de fontes. Suas dificuldades se relacionam a operar vários falantes, e só opera em ambientes de baixo ruído.
[0018] Um trabalho publicado anterior ainda adicional no campo técnico de reconhecimento de sinal relaciona-se a Robust Adaptive Beamforming Based on the Kalman Filter, Amr El-Keyi, Thiagalingam Kirubarajan, e Alex B. Gershman, 'IEEE TRANSACTIONS ON SIGNAL PROCESSING', VOL. 53, N°. 8, Agosto de 2005.
[0019] O documento apresenta uma moderna abordagem para implementar o formador de feixe de resposta sem distorção de variância
Petição 870190002663, de 09/01/2019, pág. 11/66 / 28 mínima robusta menos (MVDR). Este formador de feixe é baseado em otimização de desempenho de pior caso e foi mostrado prover uma robustez excelente contra descasamentos arbitrários, mas ligados à norma no vetor de direção de sinal desejado. Porém, os algoritmos existentes para resolver este problema não têm implementações computacionalmente diretas eficientes online. Neste documento, um novo algoritmo para o formador de feixe de MVDR robusto é desenvolvido, que está baseado no filtro de Kalman constrangido e pode ser implementado on-line com um baixo custo computacional. O algoritmo é mostrado ter desempenho semelhante àquele da implementação baseada em programação de cone de segunda ordem original (SOCP) do formador de feixe de MVDR robusto. Também apresentadas são duas modificações melhoradas do algoritmo proposto para responder adicionalmente por ambientes não estacionários. Estas modificações estão baseadas em troca de modelo e técnicas de fusão de hipótese que ademais melhoram a robustez do formador de feixe contra mudanças ambientais rápidas (abruptas).
[0020] Formação de Feixe Cega se confia em localização de falante passivo junto com formação de feixe convencional (tal como o MVDR), onde o número de sensores > o número de fontes. Um problema relacionado com isto é tal que só opera em ambientes de baixo ruído devido à localização passiva.
Sumário da Invenção [0021] O nome de trabalho do conceito subjacente à presente invenção é Extração de Sinal Cega (BSE). Enquanto as ilustrações e a descrição incluem intensificação de fala como exemplos e concretizações disso, a invenção não está limitada a intensificação de fala per se, mas também inclui detecção e intensificação de sinais eletromagnéticos como também som incluindo vibrações e similar.
[0022] A operação adaptável do BSE de acordo com a presente
Petição 870190002663, de 09/01/2019, pág. 12/66 / 28 invenção se confia em distinguir um ou mais sinais desejados de uma mistura de sinais se eles estiverem separados por algum parâmetro distintivo (medida), por exemplo espacialmente ou temporalmente, tipicamente distinguindo por propriedades estatísticas, a forma das funções de distribuição de probabilidade estatística (pdf), local em tempo ou frequência, etc., de sinais desejados. Sinais com parâmetros distintivos diferentes (medidas), tal como forma das funções de distribuição de probabilidade estatística, dos sinais desejados serão menos favorecidos na saída da operação adaptável. O princípio de extração de sinal de fonte em BSE é válido para qualquer tipo de parâmetros distintivos (medidas) tais como funções de distribuição de probabilidade estatística, contanto que os parâmetros, tal como a forma das funções de distribuição estatística (pdf) dos sinais desejados seja diferente dos parâmetros, tal como a forma das funções de distribuição de probabilidade estatística dos sinais indesejados. Isto implica que várias estruturas de BSE paralelas podem ser implementadas de tal maneira que vários sinais de fonte com parâmetros diferentes, tais como pdf's possam ser extraídos simultaneamente com as mesmas entradas a sensores de acordo com a presente invenção.
[0023] A presente invenção aponta para resolver por exemplo problemas tais como extração de fala completamente automática onde intergeometria de sensor e fonte é desconhecida e variada; o número de fontes de fala é desconhecido; fontes de ruído circunvizinhas têm propriedades espectrais desconhecidas; características de sensor são não ideais e mudam devido a envelhecimento; restrições de complexidade; precisa operar também em cenários de ruído alto, e outros problemas mencionados. Consequentemente, no caso de extração de fala, a presente invenção provê um método e um aparelho que extrai todos os sinais de fonte de fala distintos baseado só em propriedades de fala independentes de falante (forma de distribuição estatística).
Petição 870190002663, de 09/01/2019, pág. 13/66 / 28 [0024] O BSE da presente invenção provê um punhado de propriedades desejáveis tal como ser um algoritmo adaptável; capaz de operar no domínio de seletividade de tempo e/ou no domínio espacial e/ou no domínio temporal; capaz operar em qualquer número (> 0) de transdutores/sensores; sua operação não se confia em detecção de atividade de sinal. Além disso, conhecimento a priori de inter-geometrias de fonte e/ou sensor não é requerido para a operação do BSE, e sua operação não requer um arranjo de transdutor/sensor calibrado. Outra propriedade desejável da operação de BSE é que não se confia em independência estatística das fontes ou descorrelação estatística da saída produzida.
[0025] Além disso, o BSE não precisa de quaisquer sinais de arranjo pré-gravados ou estimativas de parâmetro extraídas do ambiente atual nem se confia em quaisquer sinais ou estimativas de parâmetro extraídas de fontes atuais. O BSE pode operar com sucesso em ambientes de SNIR (relação de sinal para ruído mais interferência) positiva como também negativa e sua operação inclui desfazer reverberação de sinais recebidos.
[0026] Para realizar as vantagens acima mencionadas e outras, a presente invenção pública um método adaptável para extrair pelo menos um sinal de sinais de onda eletromagnética desejados, sinais onda sonora ou quaisquer outros sinais e suprimir ruído e sinais interferentes para produzir sinais intensificados de uma mistura de sinais. O método assim inclui as etapas de:
o pelo menos um de sinais desejados contínuos em tempo, e correspondentemente discretos em tempo, sendo predeterminados por um ou mais parâmetros distintivos, tais como propriedades estatísticas, a forma de suas funções de densidade de probabilidade estatística (pdf), local em tempo ou frequência;
os parâmetros do sinal desejado diferindo do ruído ou parâmetros de sinais de fonte interferentes;
Petição 870190002663, de 09/01/2019, pág. 14/66 / 28 dados de sinal recebidos dos sinais desejados, ruído e interferentes sendo coletados por pelo menos um meio de sensor adequado para esse propósito, amostrando os sinais de entrada contínuos em tempo, ou correspondentemente utilizam os sinais discretos em tempo, para formar um quadro de tempo de sinais de entrada discretos em tempo;
transformar os dados de sinal em um conjunto de sub-bandas;
pelo menos um de atenuar para cada quadro de tempo de sinais de entrada em cada sub-banda para todos os sinais misturados de tal maneira que sinais desejados sejam atenuados menos que ruído e sinais interferentes, e amplificar para cada quadro de tempo de sinais de entrada em cada sub-banda para todos os sinais misturados de tal maneira que sinais desejados sejam amplificados, e que eles sejam amplificados mais do que ruído e sinais de fonte interferentes;
atualizar coeficientes de filtro para cada quadro de tempo de sinais de entrada em cada sub-banda de forma que um critério de erro entre os sinais de entrada filtrados e os sinais de saída transformados seja minimizado; e os sinais de sub-banda sendo filtrados por um conjunto predeterminado de filtros de sub-banda produzindo um número predeterminado de sinais de saída, cada um deles favorecendo os sinais desejados na base de seus parâmetros distintivos; e reconstruir os sinais de sub-banda de saída com uma transformação inversa. Aqui, o termo largura da banda é tipicamente referido como uma largura da banda completa, mas também inclui uma largura da banda um pouco mais estreita do que uma largura da banda completa.
[0027] Em uma concretização da presente invenção, a transformação inclui uma transformação tal que sinais disponíveis na representação digital sejam subdivididos em sinais de sub-banda de largura da banda menor ou
Petição 870190002663, de 09/01/2019, pág. 15/66 / 28 iguala.
[0028] Em uma concretização da presente invenção, o parâmetro para distinguir entre os sinais diferentes na mistura é baseado na pdf.
[0029] Em outra concretização da presente invenção, os dados de sinal recebidos são convertidos em forma digital se forem analógicos.
[0030] Outra concretização inclui que os sinais de saída sejam convertidos a sinais analógicos quando requerido.
[0031] Uma concretização adicional inclui que os níveis de sinal de saída sejam corrigidos devido à mudança em nível de sinal do processo de atenuação/amplificação.
[0032] Ainda outra concretização inclui que as normas de coeficiente de filtro sejam constrangidas a uma limitação entre um valor mínimo e um máximo.
[0033] Uma concretização ainda adicional inclui que uma amplificação de coeficiente de filtro seja realizada quando as normas dos coeficientes de filtro forem mais baixas do que o valor mínimo permitido e uma atenuação de coeficiente de filtro seja realizada quando a norma dos coeficientes de filtro for mais alta do que um valor máximo permitido.
[0034] Ainda uma concretização adicional inclui que a atenuação e amplificação seja conduzindo ao princípio onde os coeficientes de filtro em cada sub-banda são adaptados cegamente para intensificar o sinal desejado no domínio de seletividade de tempo e no domínio temporal como também no espacial.
[0035] Além disso, a presente invenção publica um aparelho para extrair adaptavelmente pelo menos um sinal de sinais de onda eletromagnética desejados, sinais de onda sonora ou quaisquer outros sinais e suprimindo ruído e sinais interferentes para produzir sinais intensificados de uma mistura de sinais. O aparelho assim inclui:
[0036] Um conjunto de funções não lineares que são adaptadas para
Petição 870190002663, de 09/01/2019, pág. 16/66 / 28 capturar propriedades predeterminadas descrevendo a diferença entre os parâmetros distintivos dos sinais desejados e os parâmetros de sinais indesejados, isto é, ruído e sinais de fonte interferentes;
pelo menos um sensor adaptado para coletar dados de sinal de sinais desejados, ruído e sinais interferentes, amostrar os sinais de entrada contínuos em tempo, ou correspondentemente utilizar os discretos em tempo, para formar um quadro de tempo de sinais de entrada discretos em tempo;
um transformador adaptado para transformar os dados de sinal em um conjunto de sub-bandas;
um atenuador adaptado para atenuar cada quadro de tempo de sinais de entrada em cada sub-banda para todos os sinais de uma tal maneira que sinais desejados sejam atenuados menos que ruído e sinais interferentes;
um amplificador adaptado para amplificar cada quadro de tempo de sinais de entrada em cada sub-banda para todos os sinais de uma tal maneira que sinais desejados sejam amplificados, e que eles sejam amplificados mais que ruído e sinais interferentes;
um conjunto de coeficientes de filtro para cada quadro de tempo de sinais de entrada em cada sub-banda, adaptado para ser atualizado de forma que um critério de erro entre os sinais de entrada filtrados linearmente e sinais de saída transformados não linearmente seja minimizado; e um filtro adaptado de forma que os sinais de sub-banda estejam sendo filtrados por um conjunto predeterminado de filtros de subbanda produzindo um número predeterminado dos sinais de saída, cada um deles favorecendo os sinais desejados dados pelos parâmetros distintivos; e uma reconstrução adaptada para executar uma transformação inversa aos sinais de sub-banda de saída.
[0037] Em uma concretização da presente invenção, o transformador é adaptado para transformar ditos dados de sinal tal que sinais disponíveis em
Petição 870190002663, de 09/01/2019, pág. 17/66 / 28 sua representação digital sejam subdivididos em sinais de sub-banda de largura da banda menor, ou igual.
[0038] É apreciado que o aparelho é adaptado para executar concretizações relativas ao método descrito acima, como é aparente do conjunto anexo de reivindicações de aparelho dependentes.
[0039] O BSE é descrito esquematicamente daqui em diante no contexto de intensificação de fala em propagação de onda acústica onde sinais de fala são sinais desejados e ruído e outros sinais interferentes são sinais de fonte indesejados.
Breve Descrição dos Desenhos [0040] Daqui em diante referência é tida aos desenhos acompanhantes juntos com dados exemplos e concretizações descritas para um entendimento melhor da presente invenção, em que:
Figura 1 ilustra esquematicamente dois cenários para fala e ruído de acordo com a técnica anterior;
Figuras 2a-c ilustram esquematicamente um exemplo de seletividade de tempo de acordo com a técnica anterior;
Figura 3 ilustra esquematicamente um exemplo de como seletividade temporal é operada utilizando um filtro digital de acordo com a técnica anterior;
Figuras 4a e 4b ilustram esquematicamente seletividade espacial de acordo com a técnica anterior;
Figuras 5a e 5b ilustra esquematicamente dois sinais resultantes de acordo com a seletividade espacial das Figuras 4a e 4b;
Figura 6 ilustra esquematicamente como sinais de som são coletados espacialmente por três microfones de acordo com a técnica anterior;
Figura 7 ilustra esquematicamente um panorama de esquema de quadro de tempo de Extração de Sinal Cega de acordo com a presente invenção;
Petição 870190002663, de 09/01/2019, pág. 18/66 / 28
Figura 8 ilustra esquematicamente um esquema de quadro de tempo de decomposição de sinal de acordo com a presente invenção;
Figura 9 ilustra esquematicamente uma filtragem executada para produzir uma saída no domínio de transformada de acordo com a presente invenção;
Figura 10 ilustra esquematicamente uma transformada inversa para produzir uma saída de acordo com a presente invenção;
Figura 11 ilustra esquematicamente seletividade de tempo, temporal, e espacial utilizando um arranjo de coeficientes de filtro de acordo com a presente invenção;
Figuras 12a-c ilustram esquematicamente diagramas gráficos de BSE no domínio temporal de filtrar pdf's dos sinais desejados de pdf's dos sinais indesejados de acordo com a presente invenção; e
Figura 13 ilustra esquematicamente um diagrama gráfico de filtrar sinais desejados de acordo com a presente invenção.
Descrição Detalhada de Concretizações Preferidas [0041] A presente invenção descreve a BSE (Extração de Sinal Cega) de acordo com a presente invenção em termos de seu princípio fundamental, operação e notação/seleção de parâmetro algorítmico. Consequentemente, provê um método e um aparelho que extrai todos os sinais desejados, exemplificados como fontes de fala nas Figuras anexas, baseado só nas diferenças na forma da densidade de funções de probabilidade entre os sinais de fonte desejados e sinais de fonte indesejados, tais como ruído e outros sinais interferentes.
[0042] A BSE provê um punhado de propriedades desejáveis tal como ser um algoritmo adaptável; capaz de operar no domínio de seletividade de tempo e/ou domínio espacial e/ou domínio temporal; capaz de operar em qualquer número (> 0) de transdutores/sensores; sua operação não se confia em detecção de atividade de sinal. Além disso, conhecimento a priori de inter
Petição 870190002663, de 09/01/2019, pág. 19/66 / 28 geometrias de fonte e/ou sensor não é requerido para a operação da BSE, e sua operação não requer um arranjo de transdutor/sensor calibrado. Outra propriedade desejável da operação de BSE é que não se confia em independência estatística dos sinais de fonte ou descorrelação estatística dos sinais de saída produzidos.
[0043] Além disso, a BSE não precisa de quaisquer sinais de arranjo pré-gravados ou estimativas de parâmetro do ambiente atual nem se confiam em quaisquer sinais ou estimativas de parâmetro extraídas de fontes atuais. A BSE pode operar com sucesso em ambientes de SNIR positiva como também negativa (relação de sinal para ruído mais interferência) e sua operação inclui desfazer reverberação de sinais recebidos.
[0044] Existem numerosas aplicações para o método e aparelho de
BSE da presente invenção. A operação de BSE pode ser usada para aplicações de extração de sinal diferentes. Estas incluem, mas não estão limitadas a intensificação de sinal em campos acústicos de ar por exemplo telefones pessoais, ambos móveis e estacionários, dispositivos de comunicação de rádio pessoais, auxílios auditivos, telefones de conferência, dispositivos para comunicação pessoal em ambientes ruidosos, isto é, o dispositivo é então combinado com proteção de audição, ferramentas médicas de análise de ultrasom.
[0045] Outra aplicação da BSE relaciona-se a intensificação de sinal em campos eletromagnéticos por exemplo arranjos de telescópio, por exemplo para vigilância cósmica, comunicação de rádio, Detecção de Rádio e Alcance (Radar), ferramentas de análise médicas.
[0046] Uma aplicação adicional caracteriza intensificação de sinal em campos subaquáticos acústicos por exemplo comunicação subaquática acústica, Navegação de Som e Alcance (Sonar).
[0047] Adicionalmente, intensificação de sinal em campos de vibração por exemplo detecção e predição de terremoto, análise vulcânica,
Petição 870190002663, de 09/01/2019, pág. 20/66 / 28 análise de vibração mecânica são outras possíveis aplicações.
[0048] Outro possível campo de aplicação é intensificação de sinal em campos de onda de mar por exemplo detecção de tsunami, análise de corrente marinha, análise de temperatura de mar, análise de salinidade de mar.
[0049] Figura 1 ilustra esquematicamente dois cenários para fala e ruído de acordo com técnica anterior. A metade superior da Figura 1 descreve uma fonte de som 10 (pessoa) gravada por um microfone/sensor/transdutor 12 de uma distância curta e misturado com ruído, indicado como uma seta apontando para o microfone 12. Consequentemente, fala + ruído é gravado pelo microfone 12, e a relação de sinal para ruído (SNR) iguala SNR = x [dB]. A metade inferior da Figura 1 descreve uma pessoa 10 como fonte de som a ser gravada, extraída a uma distância R do microfone/sensor/transdutor
12. Agora o som gravado é a.fala de + ruído, onde α2 é proporcional a 1/R2, e a SNR iguala x + 10.log10 a2[dB].
[0050] Figuras 2a-c ilustram esquematicamente exemplos diferentes de seletividade de tempo de acordo com a técnica anterior. Um microfone 12 está observando x(t) que contém um sinal de fonte desejado adicionado com ruído. Figura 2a ilustra uma chave 14 que pode ser ligada na presença de fala e pode ser desligada em todos os outros períodos de tempo. Figura 2b ilustra uma função multiplicativa a(t) que pode assumir qualquer valor entre 1 e 0. Este valor pode ser controlado pelo padrão de atividade do sinal de fala e assim se torna uma chave macia adaptável.
[0051] Figura 2c ilustra uma transformação de banco de filtro antes de um conjunto de chaves macias adaptáveis, onde cada chave opera em seu sinal de sub-banda de banda estreita individual. As saídas de sub-banda resultantes são então reconstruídas por um banco de filtro de síntese para produzir o sinal de saída.
[0052] Figura 3 ilustra esquematicamente um exemplo de como seletividade temporal, isto é, sinais com periodicidade diferente em tempo são
Petição 870190002663, de 09/01/2019, pág. 21/66 / 28 tratados diferentemente, é operada utilizando um filtro digital 30 de acordo com a técnica anterior. O filtro aplica o operador de atraso de unidade, denotado pelo símbolo z-1. Quando aplicado a uma sequência de valores digitais, este operador provê o valor prévio na sequência. Portanto em efeito introduz um atraso de um intervalo de amostragem. Aplicar o operador z-1 a um valor de entrada (xn) dá a entrada prévia (xn-1). A saída de filtro y(n) é descrita pela fórmula na Figura 3. Por seleção apropriada dos parâmetros ak e bk, as propriedades do filtro digital são definidas.
[0053] Figuras 4a e 4b ilustram esquematicamente problemas relacionados à seletividade espacial de acordo com a técnica anterior, e Figuras 5a e 5b ilustram esquematicamente dois sinais resultantes de acordo com a seletividade espacial das Figuras 4a e 4b.
[0054] As setas na Figura 4a e 4b indicam a propagação de duas ondas idênticas 40, 42 na direção de uma fonte de sinais em frente a dois microfones 12 e duas ondas idênticas 44, 46 em um ângulo aos microfones 12. Na Figura 4a, as ondas em uma direção espacial em frente aos microfones estão em fase. Como as ondas 40, 42 estão em fase e transmitidas da mesma distância à mesma frequência; a amplitude do sinal coletado adiciona à soma de ambas as amplitudes, provendo aqui um sinal de saída de duas vezes a amplitude de ondas 40, 42 como é descrito na Figura 5a.
[0055] As duas ondas 44, 46 na Figura 4b também estão em fase, mas tem que viajar meia diferença de comprimentos de onda para alcançar cada microfone 12 assim cancelando uma a outra quando adicionadas, como é descrito na Figura 5b.
[0056] Este exemplo simples das Figuras 4a-4b, e Figuras 5a-5b provê uma amostra das dificuldades encontradas quando um sinal querido é extraído. Um problema da vida real com por exemplo fala e ruído, seletividade temporal e de tempo, distâncias diferentes de fontes a microfones 12 e frequências múltiplas indica como extremamente difícil e importante é
Petição 870190002663, de 09/01/2019, pág. 22/66 / 28 prover um método de BSE que não precisa de quaisquer sinais de arranjo prégravados ou estimativas de parâmetro extraídas do ambiente atual nem se confia em quaisquer sinais ou estimativas de parâmetro de fontes atuais.
[0057] Figura 6 ilustra esquematicamente como sinais de som são coletados espacialmente por três microfones de todas as direções, onde os microfones 12 captam sinais ambos de fala e ruído em todos os domínios mencionados.
[0058] Agora com referência à Figura 7, este está ilustrando esquematicamente um panorama de esquema de quadro de tempo de extração de sinal cega de acordo com a presente invenção. A BSE 70 opera em número I sinais de entrada, amostrados espacialmente de um campo se propagando de onda física usando transdutores/sensores/microfones 12, criando um número P de sinais de saída que estão alimentando um conjunto de transdutores inversos/sensores inversos tal que outro campo se propagando de onda física seja criado. O campo se propagando de onda física é caracterizado pelo fato de que níveis de sinal desejados são significativamente mais altos do que níveis de sinal de sinais indesejados. O campo de propagação de onda criado pode manter as características espacial do campo de propagação de onda originalmente amostrado espacialmente, ou pode alterar as características espaciais tal que as fontes originais apareçam como elas estão se originando de locais diferentes em relação a seus locais físicos reais.
[0059] A BSE 70 da presente invenção opera como descrito abaixo, por meio de que um objetivo da operação da Extração de Sinal Cega (BSE) é produzir sinais intensificados se originando, parcialmente ou completamente, de fontes desejadas com funções de densidade de probabilidade correspondentes (pdf's) enquanto atenuando ou cancelando sinais se originando, parcialmente ou completamente, de fontes indesejadas com pdf's correspondentes. Um requisito para isto ocorrer é que as formas do pdf indesejadas sejam diferentes das formas dos pdfs' desejados.
Petição 870190002663, de 09/01/2019, pág. 23/66 / 28 [0060] Figura 8 ilustra esquematicamente um esquema de quadro de tempo de decomposição de sinal de acordo com a presente invenção. Os dados recebidos x(t) são coletados por um conjunto de transdutores/sensores 12. Quando os dados recebidos são analógicos em natureza são convertidos em forma digital por conversão analógica para digital (ADC) 12 (isto é realizado na etapa 1 no método/processo/algoritmo descrito abaixo). Os dados são então transformados em sub-bandas xi(k)(n) por uma transformação, etapa 2 no processo descrito abaixo. Esta transformação 82 é tal que os sinais disponíveis na representação digital sejam subdivididos em sinais de subbanda de largura da banda menor (ou igual) Xi(k)(n). Estes sinais de subbanda são filtrados correspondentemente por um conjunto de filtros de subbanda 90 produzindo vários sinais de sub-banda adicionados 92 de sinais de saída yP(k)(n), onde cada um dos sinais de saída favorece sinais com uma forma de pdf específica, etapas 3-9 no processo descrito abaixo.
[0061] Como descrito na Figura 10, estes sinais de saída yP(k)(n) são reconstruídos por uma transformação inversa 100, etapa 10 no processo descrito abaixo. Quando sinais analógicos são requeridos, uma conversão digital para analógica (DAC) 102 é executada, etapa 11 no processo descrito abaixo.
[0062] O núcleo de operação, como o exemplo provido pela Figura
11, é que a cada etapa, isto é, para cada quadro de tempo de dados de entrada 110, seguindo uma etapa de transformação de sub-banda de multicanal, os coeficientes de filtro 112, mostrados como um arranjo de coeficientes de filtro, são atualizados em cada sub-banda tal que todos os sinais sejam atenuados e/ou amplificados. Em 114, os sinais de saída são reconstruídos por uma transformação inversa.
[0063] No caso quando todos os sinais são atenuados, é realizado de tal modo que os sinais com forma desejada dos pdfs sejam atenuados menos que todos os outros sinais. No caso quando todos os sinais são amplificados,
Petição 870190002663, de 09/01/2019, pág. 24/66 / 28 os sinais com a forma desejada dos pdfs são amplificados mais que todos os outros sinais. Isto conduz a um princípio onde os coeficientes de filtro em cada sub-banda são adaptados cegamente para intensificar certos sinais, no domínio de seletividade de tempo e no domínio temporal como também espacial, definido pela forma de seus pdfs correspondentes.
[0064] Quando as formas dos pdfs indesejados são significativamente diferentes dos pdfs do sinal desejado, então a atenuação/amplificação correspondente é significativamente maior. Isto conduz a um princípio onde fontes com pdfs mais distantes dos pdfs desejados estão recebendo mais graus de liberdade (atenção) para serem alterados. A atenuação/amplificação é executada nas etapas 3-4. Quando os sinais de saída são criados tal que eles sejam mais perto à forma desejada dos pdfs, o critério de erro (etapa 4) será menor. A otimização é, portanto, realizada para minimizar o critério de erro para cada sinal de saída. Os coeficientes de filtro são então atualizados na etapa 5. Também há uma necessidade para corrigir o nível dos sinais de saída devido à mudança em nível de sinal do processo de atenuação/amplificação. Isto é executado nas etapas 6 e 7. Desde que cada sub-banda é atualizada de acordo com o método descrito acima, conduz automaticamente a uma filtragem espectral, onde sub-bandas com contribuição maior de energia de sinal indesejada são atenuadas mais.
[0065] Se os coeficientes de filtro forem deixados não constrangidos, eles podem cair possivelmente a zero ou eles podem crescer descontrolados. É, portanto, necessário constranger os coeficientes de filtro por uma limitação entre um valor de norma mínimo e máximo. Para este propósito, há uma amplificação de coeficiente de filtro feita quando as normas de coeficiente de filtro são mais baixas do que um valor permitido mínimo (extração global) e uma atenuação de coeficiente de filtro feita quando a norma dos coeficientes de filtro é mais alta do que um valor permitido máximo (retração global). Isto é executado nas etapas 8 e 9 no algoritmo.
Petição 870190002663, de 09/01/2019, pág. 25/66 / 28
As constantes utilizadas no método/processo de BSE da presente invenção são:
I - denotando o número de transdutores/sensores disponíveis para a operação (indexado por i)
K - denotando o número de sinais de sub-banda transformados (indexado por k)
P - denotando o número de sinais de saída produzidos (indexado por p) n - denotando um índice de tempo feito discreto (isto é, tempo real t = nT, onde T é o período de amostragem)
Li - denotando o comprimento de cada filtro de sub-banda
Levelp - denotando um termo de correção nível usado para manter um nível de sinal de saída desejado para saída n° p λ1 e λ2 - denota parâmetros de ponderação de atualização de coeficiente de filtro
C1 - denota um nível inferior para extração global C2 - denota um nível superior para retração global
Funções utilizadas são:
(k) fp (.) - denota um conjunto de funções não lineares (k, p) g1 (k,p) g2
(.) - denota um conjunto de funções crescentes em nível
(.) - denota um conjunto de funções decrescentes em nível
Variáveis utilizadas são:
(k, p) hi,n (l) - denota uma sequência (filtro) de comprimento Li de coeficientes, válidos a instante de tempo n
~ (k,p) h i,n (l) - denota uma sequência intermediária (filtro) de
comprimento Li de coeficientes, válidos a instante de tempo n (k,p)
ΔΙι i,n (l) denota uma sequência de comprimento Li de
coeficientes (correção), válidos a instante de tempo n ~ (k,p)
Δ i,n (l) - denota uma sequência intermediária de
Petição 870190002663, de 09/01/2019, pág. 26/66 / 28 comprimento Li de coeficientes (correção), válidos a instante de tempo n Sinais são denotados por:
[0066] Os sinais de entrada de transdutor/sensor recebidos xi(t), i = 1, ..., I
Os sinais de entrada de transdutor/sensor amostrados xi(n), i = 1, ..., I
Os sinais de entrada de sub-banda amostrados transformados (k) x; (n), i = 1, ..., I, k = 0, ..., K-1 [0067] As transformadas usadas aqui podem ser qualquer transformada seletiva em frequência por exemplo uma FFT em janela de tempo curto, uma transformada de wavelet, uma transformada banco de filtro de sub-banda, etc.
[0068] Os sinais de entrada de sub-banda amostrados transformados (k) yp (n), p = 1, ..., P, k = 0, ..., K-1
Sinal intermediário:
~ (k) y p (n) = p = 1, ..., P, k = 0, ..., k-1 [0069] Os sinais amostrados de saída transformados inversos yp(n), p = 1, ..., P [0070] As transformadas inversas usadas aqui são o inverso da transformada usada para transformar os sinais de entrada.
[0071] Os sinais de saída contínuos em tempo yp(t), p = 1, ..., P
As etapas de método/processo seguintes tipicamente definem a BSE da presente invenção:
1. Vi, Amostre os sinais de entrada contínuos em tempo xi(t) para formar um conjunto dos sinais de entrada discretos em tempo xi(n)
2. Vi, Transforme os sinais de entrada xi(n) para formar K (k) sinais de sub-banda x(n)
3. Vp, Vk, Compute os sinais de saída de sub-banda
Petição 870190002663, de 09/01/2019, pág. 27/66
22/28 intermediária:
4. Vp, Vk, Compute as condições de correção (onde II.II denota qualquer norma matemática):
δλΙ'Λ) = «S mil) ||£ Σ *£’( - 4 K'-. (') + Δ'*:> ('))-/, (»/'(’)) II ΔΑ>.τ.Ο L í=o
5. Atualize os filtros Vk, Vi, Vp, VI
6. Calcule Vp (onde II.II denota qualquer norma matemática)
Lcvelp =
7. Calcule a saída Vk, Vp = Lev,elp^ Σ x!fc>í’n “ ΐ=1 f=Q
8. (copiar fórmula página 17, linha 11)
CV) = (à&Vo) VLVkNi
9. (copiar fórmula página 17, linha 15) l&Xl') = .<?!/’ (CAo) VI, Vk,VÍ
10. (copiar fórmula página 17, linha 19) ^(0 = ^(0 Vi.Vfc.Vi
11. Vp, Transforme inversa os sinais de saída de sub-banda
Petição 870190002663, de 09/01/2019, pág. 28/66 / 28 (k) yp (n) para formar um quadro de tempo dos sinais de saída yp(n)
12. Vp, Reconstrua os sinais de saída contínuos em tempo, yp(t) através de uma conversão digital para analógica (DAC)
As etapas anteriores são descritas adicionalmente em palavras (Veja Figura 13 ilustrando seção 4):
1. Todos os sinais de entrada são convertidos de forma analógica para digital se precisado.
2. Todos os sinais de entrada são transformados em uma ou mais sub-bandas.
3. Os sinais de entrada de sub-banda são filtrados com os coeficientes de filtro obtidos na última iteração (isto é, a instante de tempo n 1) para formar um sinal de saída intermediário para cada sub-banda k, para todas as saídas p.
4. Esta etapa executa um processo de linearização. Individualmente, para toda sub-banda k e para toda saída p, um conjunto de condições de correção é achado tal que a diferença de norma entre uma filtragem linear dos sinais de entrada de sub-banda e dos sinais de saída intermediários transformados não linearmente produziu seja minimizada. As funções não lineares são escolhidas tal que amostras de saída, que ocupam predominantemente níveis que são esperados de sinais desejados, sejam passadas com valores mais altos (níveis) do que amostras de saída que ocupam predominantemente níveis que são esperados de sinais de indesejados. Deveria ser notado que se a função não linear for substituída pela (k) função linear f p (x) = x, então os termos de correção ótimos sempre seriam iguais a zero, independentemente dos sinais de entrada.
5. Os termos de correção são ponderados (com λ2) e adicionados aos coeficientes ponderados (com λ1) obtidos na última iteração para formar o novo conjunto de filtros intermediários, para toda sub-banda k, todo canal i, toda saída p e para todo índice de parâmetro l.
Petição 870190002663, de 09/01/2019, pág. 29/66 / 28
6. Desde que o processo de linearização pode alterar o nível dos sinais de saída, o inverso das normas de filtro é calculado, para uso subsequente.
7. Os sinais de saída de sub-banda são calculados filtrando os sinais de entrada com o filtro intermediário atual (isto é, a instante de tempo n) e multiplicado com o inverso das normas de filtro, para toda sub-banda k e para todo índice de saída p.
8. Individualmente para todo índice de saída p, se a norma total dos coeficientes combinados abrangendo todo k, i, l cair abaixo (ou igualar) o nível C1, então uma extração global é executada para criar os filtros atuais (isto é, a instante de tempo n) passando os filtros intermediários atuais pelas funções de extração.
9. Individualmente para todo índice de saída p, se a norma total dos coeficientes combinados abrangendo todo k, i, l exceder (ou igualar) o nível C2, então uma retração global é executada para criar os filtros atuais (isto é, a instante de tempo n) passando os filtros intermediários atuais pelas funções de retração.
10. Individualmente para todo índice de saída p, se a norma total dos coeficientes combinados abrangendo todo k, i, l cair entre o nível C1 e C2, então os filtros atuais (isto é, a instante de tempo n) são iguais aos filtros intermediários.
11. Individualmente para todo p, os sinais de saída de subbanda são transformados inversos para formar os sinais de saída.
12. Individualmente para todo p, os sinais de saída contínuos em tempo são formados por conversão digital para analógica.
Requisitos e Colocações (k)
1. A escolha de funções não lineares fp (.) depende das funções de densidade de probabilidade estatística dos sinais desejados, na sub-banda particular k. Assuma que nós temos um número (R) de sinais
Petição 870190002663, de 09/01/2019, pág. 30/66
25/28 estocásticos médios zero, sr(t), r = 1, 2, ..., R, com as funções de densidade de probabilidade correspondentes ρΧΓ(τ), com a variância correspondente σΓ 2, então as funções não lineares deveríam satisfazer (se existirem):
<£= Γ° Τ2ρχι.(τ)άτ >< f fík} (r)2pVr(r)fÍT, G Θ
J — OC 7—|3O (k) [0072] Este requisito significa que todas as funções P (.) atuam para reduzir (quando >) ou aumentar (quando <) a potência (variância) de todos os sinais.
[0073] Sem perda de generalidade, nós assumimos que o pdf correspondendo ao único primeiro sinal é o pdf desejado, isto é, ρχι(τ) na primeira saída, yi(t). Então, é requerido que:
r e [2,3,../Ϊ), VM σ; e Θ [0074] Mais geralmente, se nós desejarmos produzir sinal de fonte n° (k) s na saída n° j, a função não linear fj (.) precisa satisfazer;
/X· roo
-DO J — OO •r € [1,2.... - Ι,ΰ + 1,... Λ], σ; e Θ [0075] Estes requisitos significam que o nível de redução de potência (variância), causada pelas funções não lineares, é tal que os sinais de indesejados sejam reduzidos o máximo.
[0076] Deveria ser notado que os requisitos anteriores podem não ser satisfeitos em geral para qualquer variância de entrada or2. Neste caso, o conjunto Θ de valores permitidos para a variância pode ser reduzido ou (k) alguém pode escolher funções não lineares diferentes P (.) para discrepâncias de entrada diferentes.
[0077] Tipicamente para um ambiente acústico, onde o sinal de fonte
Petição 870190002663, de 09/01/2019, pág. 31/66 / 28 (k) desejado é fala humana, a função não linear pode estar na forma de fp (x) = aitanh(a2x).
dg(k ,p) j (k, P)
2. Requisito: dx > 1, Vx, escolha típica g1 (x) = (1 + a)x, α > 0.
dg 2k, p) j (k, P)
3. Requisito: dx < 1, Vx, escolha típica g2 (x) = (1 - a)x.
Iniciação e Seleção de Parâmetro (k, p) [0078] Os filtros hi,n (l), Vk, Vp podem ser iniciados (isto é, n = 0) como:
(k,p) hi0 (l) = 1, para l=0, i e [1, 2, ..., I] (k,p) h i,0 (l) = 0, para todo outro l e i [0079] Os parâmetros podem em uma concretização exemplar não limitante da presente invenção ser escolhidos de acordo com:
Tipicamente: 1 < K < 1024
Tipicamente: 1 < Li < 64
Tipicamente: 0,01 < α < 0,1
Tipicamente: 0 < α1 < 1
Tipicamente: 0 < α2 < 5
Tipicamente: 0,001 < C1 < 0,1
Tipicamente: 0,1 < C2 < 10
Tipicamente: 0 < λ1 < 1
Tipicamente: 0 < λ2 < 1 [0080] Consequentemente, a presente invenção provê um aparelho 70 extraindo adaptavelmente pelo menos um de sinais de onda eletromagnética desejados, sinais de onda sonora e quaisquer outros sinais de uma mistura de sinais e suprimindo outro ruído e sinais interferentes para produzir sinais intensificados se originando, parcialmente ou completamente, da fonte 10 produzindo os sinais desejados. Por esse meio, funções adaptadas para
Petição 870190002663, de 09/01/2019, pág. 32/66 / 28 determinar a densidade de probabilidade estatística de sinais de entrada desejados contínuos em tempo, ou correspondentemente os discretos em tempo, são incluídos no aparelho. As funções de densidade de probabilidade estatística desejadas diferem das funções de densidade de probabilidade estatística do ruído e sinais interferentes.
[0081] Além disso, o aparelho inclui pelo menos um sensor, adaptado para coletar dados de sinal dos sinais desejados e ruído e interferentes sinais. Uma amostragem é executada, se precisado, nos sinais de entrada de contínuos em tempo pelo aparelho para formar sinais de entrada discretos em tempo. Também incluído no aparelho é um transformador adaptado para transformar os dados de sinal em um conjunto de sub-bandas por uma transformação tal que sinais disponíveis em sua representação digital sejam subdivididos em sinais de sub-banda de largura da banda menor (ou igual).
[0082] Também é incluído no aparelho um atenuador adaptado para atenuar cada quadro de tempo de sinais de entrada em cada sub-banda para todos os sinais de tal maneira que sinais desejados sejam atenuados menos que ruído e sinais interferentes, e/ou um amplificador adaptado para amplificar cada quadro de tempo de sinais de entrada em cada sub-banda para todos os sinais de tal maneira que sinais desejados sejam amplificados, e que eles sejam amplificados mais que ruído e sinais interferentes. O aparelho assim inclui um conjunto de coeficientes de filtro para cada quadro de tempo de sinais de entrada em cada sub-banda, adaptado para ser atualizado de forma que um critério de erro entre os sinais de entrada filtrados linearmente e sinais de saída transformados não linearmente seja minimizado, e um filtro adaptado de forma que os sinais de sub-banda estejam sendo filtrados por um conjunto predeterminado de filtros de sub-banda produzindo um número predeterminado dos sinais de saída, cada um deles favorecendo os sinais desejados, definido pela forma de sua função de densidade de probabilidade estatística. Finalmente, o aparelho inclui uma reconstrução adaptada para
Petição 870190002663, de 09/01/2019, pág. 33/66 / 28 executar uma transformação inversa aos sinais de saída.
[0083] Figuras 12a-b-c ilustram esquematicamente um diagrama gráfico de BSE no domínio temporal de filtrar pdf's dos sinais desejados de pdf's dos sinais indesejados de acordo com a presente invenção. O nível inferior das Figuras 12a-b-c descreve dados entrantes por sub-bandas 2 e 3 tendo um tipo desejado de pdf e sub-bandas 1 e 4 tendo um tipo indesejado de pdf, que será suprimido pelo filtro descrito no nível superior das Figuras 12ab-c quando movido para baixo de acordo com o ensinamento anterior.
[0084] A presente invenção foi descrita por exemplos dados e concretizações não pretendidas para limitar a invenção a essas. Uma pessoa qualificada na técnica reconhece que o conjunto anexo de reivindicações publica outras concretizações de vantagem.

Claims (14)

  1. REIVINDICAÇÕES
    1. Método adaptável para extrair pelo menos um sinal de sinais de onda eletromagnética desejados e sinais de onda sonora (40, 42) de uma mistura de sinais (40, 42, 44, 46) e suprimir ruído e sinais interferentes para produzir sinais intensificados (50) correspondendo a sinais desejados (10), os ditos sinais desejados sendo predeterminados por um ou mais parâmetro(s) distintivo(s), em que um dos ditos parâmetros distintivos é a forma de suas funções de densidade de probabilidade estatística (pdf);
    os ditos parâmetros distintivos dos sinais desejado(s) diferindo dos parâmetros distintivos do ruído e sinais interferentes, o dito método caracterizado pelo fato de compreender as etapas de:
    receber dados de sinal dos ditos sinais desejados (10) e sinais de ruído e interferentes sendo coletados por pelo menos um meio de sensor adequado (12) para esse propósito;
    amostrar (80) os ditos dados de sinais para formar sinais de entrada discretos em tempo xi(n);
    transformar (82) os ditos sinais de entrada discretos em tempo xi(n) em um conjunto de sinais de sub-bandas xi(k)(n), os ditos sinais de subbanda xi(k)(n) sendo linearmente filtrados por um predeterminado conjunto de filtros de sub-banda (90, 112) produzindo um número predeterminado de sinais de saída yp(k)(n), em que cada um dos sinais de saída yp(k)(n) favorece sinais com uma forma de pdf específica; e reconstruir os sinais de saída yp(n) como os sinais intensificados (50) com uma transformação inversa (100, 114);
    atualizar os coeficientes de filtro do dito conjunto de filtros de sub bandas (90, 112), hi,n(k,p)(l), para cada quadro de tempo de sinais de entrada em cada sub-banda;
    em que atualizar os coeficientes de filtro hi,n(k,p)(l) compreende, para cada sub-banda e para cada saída, um conjunto de termos de correção
    Petição 870190002663, de 09/01/2019, pág. 35/66
  2. 2 / 5
    Ahi,n(kp)(l) que é encontrado tal que a diferença de norma entre a filtragem linear dos sinais de entrada de sub-banda e os sinais de saída intermediários não linearmente transformados seja iterativamente minimizada;
    em que as funções para transformar não-linearmente, fp(k)(·), dependem dos pdf's dos sinais desejados em uma sub-banda k, e são escolhidas de forma que amostras de saída, que predominantemente ocupam níveis que são esperados a partir dos sinais desejados, sejam passadas com níveis mais altos do que as amostras de saída que predominantemente ocupam níveis que são esperados a partir de sinais não desejados.
    2. Método, de acordo com reivindicação 1, caracterizado pelo fato de que transformar (82) compreende uma transformação tal que sinais disponíveis em sua representação digital são subdivididos em sinais de subbanda de largura de banda menor, ou igual.
  3. 3. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que os ditos dados de sinal recebidos são convertidos em formato digital se for analógico (80).
  4. 4. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que os sinais de saída são convertidos em sinais analógicos (102) quando requerido.
  5. 5. Método, de acordo com qualquer uma das reivindicações 1 a
    4, caracterizado pelo fato de que os níveis de sinal de saída yp(n) são corrigidos devido à mudança em nível de sinal dos ditos termos de correção Ahi,n(k,p)(l).
  6. 6. Método, de acordo com qualquer uma das reivindicações 1 a
    5, caracterizado pelo fato de que a norma dos ditos coeficientes de filtro é restringida a uma limitação entre um valor mínimo e um máximo.
  7. 7. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que uma amplificação de coeficiente de filtro é alcançada quando as normas de coeficiente de filtro são mais baixas do que o valor mínimo
    Petição 870190002663, de 09/01/2019, pág. 36/66
    3 / 5 permitido e uma atenuação de coeficiente de filtro é alcançada quando a norma dos coeficientes de filtro é mais alta que um valor máximo permitido.
  8. 8. Aparelho para extrair adaptavelmente pelo menos um sinal de sinais de onda eletromagnética desejados e sinais de onda sonora (40, 42) de uma mistura de sinais (40, 42, 44, 46) e suprimir ruído e sinais interferentes para produzir sinais intensificados (50) correspondendo a sinais desejados (10), caracterizado pelo fato de compreender:
    meios para determinar um ou mais parâmetros distintivos de sinais desejados (10), em que um dos parâmetros está na forma de suas funções de densidade de probabilidade estatística (pdf), os ditos parâmetros distintivos diferindo dos parâmetros do ruído e sinais interferentes;
    pelo menos um sensor (12) adaptado para coletar dados de sinal de sinais desejados (10), ruído e sinais interferentes, amostrar os ditos dados de sinais para formar um conjunto de sinais de entrada discretos em tempo xi(n);
    um transformador (82) adaptado para transformar os ditos sinais discretos em tempo xi(n) em um conjunto de sinais de sub-bandas xi(k)(n);
    um conjunto de coeficientes de filtro adaptado de modo que os ditos sinais de sub-banda xi(k)(n) são linearmente filtrados por um predeterminado conjunto de coeficientes de filtros de sub-banda (90, 112) produzindo um predeterminado número dos ditos sinais de saída yp(k)(n), cada um deles favorecendo sinais desejados (10) com uma forma de pdf específica; e uma reconstrução adaptada para executar uma transformação inversa (100) para os ditos sinais de saída de sub-banda yp(k)(n);
    o dito conjunto de coeficientes de filtro para cada quadro de tempo de sinais de entrada em cada sub-banda, adaptado para ser atualizado; em que atualizar o conjunto de coeficientes de filtros hi,n(k,p)(l) compreende, para cada sub-banda e para cada saída, um conjunto de termos de correção
    Petição 870190002663, de 09/01/2019, pág. 37/66
    4 / 5
    Ahi,n(kp)(l) que é encontrado tal que a diferença de norma entre a filtragem linear dos sinais de entrada de sub-banda e os sinais de saída intermediários não linearmente transformados seja iterativamente minimizada;
    em que as funções para transformar não-linearmente, fp(k)(·), dependem dos pdf's dos sinais desejados em uma sub-banda k, e são escolhidas de forma que amostras de saída, que predominantemente ocupam níveis que são esperados a partir dos sinais desejados, sejam passadas com níveis mais altos do que as amostras de saída que predominantemente ocupam níveis que são esperados a partir de sinais não desejados.
  9. 9. Aparelho, de acordo com a reivindicação 8, caracterizado pelo fato de que o transformador (82) é adaptado para transformar os dados de sinal tal que sinais disponíveis em sua representação digital sejam subdivididos em sinais de sub-banda de largura de banda menor, ou igual.
  10. 10. Aparelho, de acordo com a reivindicação 8 ou 9, caracterizado pelo fato de que os dados de sinal recebidos são adaptados para serem convertidos em formato digital se forem analógicos (80).
  11. 11. Aparelho, de acordo com a reivindicação 9 ou 10, caracterizado pelo fato de que os sinais de saída são adaptados para serem convertidos a sinais analógicos (102) quando requerido.
  12. 12. Aparelho, de acordo com a reivindicação 10 ou 11, caracterizado pelo fato de que os níveis de sinal de saída yp(n) são corrigidos devido à mudança em nível de sinal dos ditos termos de correção Ahi,n(k,p)(l).
  13. 13. Aparelho, de acordo com qualquer uma das reivindicações 10 a 12, caracterizado pelo fato de que os coeficientes de filtro são restringidos adaptavelmente a uma limitação entre um valor de norma de coeficiente de filtro mínimo e máximo.
  14. 14. Aparelho, de acordo com a reivindicação 13, caracterizado pelo fato de que uma amplificação de coeficiente de filtro é alcançada quando as normas de coeficiente de filtro são mais baixas do que o valor mínimo
BRPI0621733A 2006-06-05 2006-06-05 método adaptável para extrair pelo menos um sinal, e, aparelho para extrair adaptavelmente pelo menos um sinal BRPI0621733B1 (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2006/005347 WO2007140799A1 (en) 2006-06-05 2006-06-05 Blind signal extraction

Publications (2)

Publication Number Publication Date
BRPI0621733A2 BRPI0621733A2 (pt) 2012-04-24
BRPI0621733B1 true BRPI0621733B1 (pt) 2019-09-10

Family

ID=37307419

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0621733A BRPI0621733B1 (pt) 2006-06-05 2006-06-05 método adaptável para extrair pelo menos um sinal, e, aparelho para extrair adaptavelmente pelo menos um sinal

Country Status (10)

Country Link
US (1) US8351554B2 (pt)
EP (1) EP2030200B1 (pt)
JP (1) JP5091948B2 (pt)
CN (1) CN101460999B (pt)
AU (1) AU2006344268B2 (pt)
BR (1) BRPI0621733B1 (pt)
CA (1) CA2652847C (pt)
ES (1) ES2654519T3 (pt)
NO (1) NO341066B1 (pt)
WO (1) WO2007140799A1 (pt)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100332222A1 (en) * 2006-09-29 2010-12-30 National Chiao Tung University Intelligent classification method of vocal signal
US8135548B2 (en) * 2006-10-26 2012-03-13 Abbott Diabetes Care Inc. Method, system and computer program product for real-time detection of sensitivity decline in analyte sensors
US8892432B2 (en) * 2007-10-19 2014-11-18 Nec Corporation Signal processing system, apparatus and method used on the system, and program thereof
GB2459512B (en) * 2008-04-25 2012-02-15 Tannoy Ltd Control system for a transducer array
WO2009151578A2 (en) * 2008-06-09 2009-12-17 The Board Of Trustees Of The University Of Illinois Method and apparatus for blind signal recovery in noisy, reverberant environments
CN102236050B (zh) * 2010-04-27 2014-05-14 叶文俊 明视物质相关电磁波记录方法及架构
US9818416B1 (en) 2011-04-19 2017-11-14 Deka Products Limited Partnership System and method for identifying and processing audio signals
CN104535969A (zh) * 2014-12-23 2015-04-22 电子科技大学 一种基于干扰噪声协方差矩阵重构的波束形成方法
CN105823492B (zh) * 2016-03-18 2018-08-21 北京卫星环境工程研究所 一种洋流干扰中微弱目标信号提取方法
US10219234B2 (en) * 2016-08-18 2019-02-26 Allen-Vanguard Corporation System and method for providing adaptive synchronization of LTE communication systems
US10429491B2 (en) * 2016-09-12 2019-10-01 The Boeing Company Systems and methods for pulse descriptor word generation using blind source separation
CN106419912A (zh) * 2016-10-20 2017-02-22 重庆邮电大学 一种多导联脑电信号的眼电伪迹去除方法
CN108172231B (zh) * 2017-12-07 2021-07-30 中国科学院声学研究所 一种基于卡尔曼滤波的去混响方法及系统

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4020656A1 (de) * 1990-06-29 1992-01-02 Thomson Brandt Gmbh Verfahren zur uebertragung eines signals
US5500879A (en) * 1992-08-14 1996-03-19 Adtran Blind signal separation and equalization of full-duplex amplitude modulated signals on a signal transmission line
US6236731B1 (en) * 1997-04-16 2001-05-22 Dspfactory Ltd. Filterbank structure and method for filtering and separating an information signal into different bands, particularly for audio signal in hearing aids
US6408269B1 (en) * 1999-03-03 2002-06-18 Industrial Technology Research Institute Frame-based subband Kalman filtering method and apparatus for speech enhancement
US20010046268A1 (en) * 2000-03-06 2001-11-29 Alok Sharma Transceiver channel bank with reduced connector density
CN1148905C (zh) * 2000-06-01 2004-05-05 华为技术有限公司 宽带码分多址中抗深衰减的半盲信道估计方法
JP2002023776A (ja) * 2000-07-13 2002-01-25 Univ Kinki ブラインドセパレーションにおける話者音声と非音声雑音の識別方法及び話者音声チャンネルの特定方法
JP4028680B2 (ja) * 2000-11-01 2007-12-26 インターナショナル・ビジネス・マシーンズ・コーポレーション 観測データから原信号を復元する信号分離方法、信号処理装置、モバイル端末装置、および記憶媒体
US7171008B2 (en) * 2002-02-05 2007-01-30 Mh Acoustics, Llc Reducing noise in audio systems
US20040252772A1 (en) * 2002-12-31 2004-12-16 Markku Renfors Filter bank based signal processing
US7443917B2 (en) * 2003-09-02 2008-10-28 Data Jce Ltd Method and system for transmission of information data over a communication line
JP4529492B2 (ja) * 2004-03-11 2010-08-25 株式会社デンソー 音声抽出方法、音声抽出装置、音声認識装置、及び、プログラム
CN1314000C (zh) * 2004-10-12 2007-05-02 上海大学 基于盲信号分离的语音增强装置

Also Published As

Publication number Publication date
EP2030200B1 (en) 2017-10-18
NO20090013L (no) 2009-02-25
US8351554B2 (en) 2013-01-08
ES2654519T3 (es) 2018-02-14
JP5091948B2 (ja) 2012-12-05
AU2006344268A1 (en) 2007-12-13
CA2652847C (en) 2015-04-21
EP2030200A1 (en) 2009-03-04
NO341066B1 (no) 2017-08-14
BRPI0621733A2 (pt) 2012-04-24
CA2652847A1 (en) 2007-12-13
CN101460999B (zh) 2011-12-14
AU2006344268B2 (en) 2011-09-29
WO2007140799A1 (en) 2007-12-13
US20090257536A1 (en) 2009-10-15
JP2009540344A (ja) 2009-11-19
CN101460999A (zh) 2009-06-17

Similar Documents

Publication Publication Date Title
BRPI0621733B1 (pt) método adaptável para extrair pelo menos um sinal, e, aparelho para extrair adaptavelmente pelo menos um sinal
US9668066B1 (en) Blind source separation systems
US6668062B1 (en) FFT-based technique for adaptive directionality of dual microphones
JP6547003B2 (ja) サブバンド信号の適応混合
EP2393463A1 (en) Multiple microphone based directional sound filter
TW200849219A (en) Systems, methods, and apparatus for signal separation
JP2008233866A (ja) 信号分離装置、および信号分離方法、並びにコンピュータ・プログラム
Spriet et al. Stochastic gradient-based implementation of spatially preprocessed speech distortion weighted multichannel Wiener filtering for noise reduction in hearing aids
Wu et al. A reverberation-time-aware DNN approach leveraging spatial information for microphone array dereverberation
Aroudi et al. Cognitive-driven convolutional beamforming using EEG-based auditory attention decoding
Madhu et al. Localisation-based, situation-adaptive mask generation for source separation
JP2010210728A (ja) 音響信号処理方法及び装置
Zhang et al. Ica-based noise reduction for mobile phone speech communication
Kung et al. Estimation of the noise and reverberation covariance matrices with application in speech enhancement using the multichannel wiener filter
Spriet et al. A unification of adaptive multi-microphone noise reduction systems
Ito et al. A blind noise decorrelation approach with crystal arrays on designing post-filters for diffuse noise suppression
Wang et al. A Novel Speech Enhancement System Based on the Coherence-Based Algorithm and the Differential Beamforming
RU2417460C2 (ru) Выделение сигнала вслепую
Zeng et al. Kronecker Product-Based Beamformer for Microphone Arrays
Meng et al. Deep Kronecker Product Beamforming for Large-scale Microphone Arrays
Pradeep et al. SPEECH ENHANCEMENT USING WEINER FILTER AND SPATIO TEMPORAL PREDICTION FILTER APPROACH
Zou et al. A broadband speech enhancement technique based on frequency invariant beamforming and GSC
Wu et al. A multi-microphone speech enhancement algorithm tested using acoustic vector sensors
Agrawal et al. Dual microphone beamforming algorithm for acoustic signals
CN118714489A (zh) 一种房间环境自适应变焦可听方法及设备

Legal Events

Date Code Title Description
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 6A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: REFERENTE AO DESPACHO 8.6 PUBLICADO NA RPI 2163 DE 19/06/2012.

B08H Application fees: decision cancelled [chapter 8.8 patent gazette]

Free format text: REFERENTE AO DESPACHO 8.6 NA RPI 2163 DE 19/06/2012 E O DEPACHO 8.11 NA RPI 2214 DE 11/06/2013

B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 3A ANUIDADE

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: REFERENTE AO DESPACHO 8.6 PUBLICADO NA RPI 2217 DE 02/07/2013.

B08H Application fees: decision cancelled [chapter 8.8 patent gazette]

Free format text: REFERENTE AOS DESPACHOS 8.6 NA RPI 2217 DE 02/07/2013 E 8.11 NA RPI 2250 DE 18/02/2014.

B15K Others concerning applications: alteration of classification

Free format text: AS CLASSIFICACOES ANTERIORES ERAM: G10L 21/02 , H04R 25/00

Ipc: G10L 21/0208 (2013.01), H04R 3/00 (1968.09), H04R

B06T Formal requirements before examination [chapter 6.20 patent gazette]
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 10/09/2019, OBSERVADAS AS CONDICOES LEGAIS. (CO) 10 (DEZ) ANOS CONTADOS A PARTIR DE 10/09/2019, OBSERVADAS AS CONDICOES LEGAIS