PT2394271T - Método para divisão de canais de sinal e utilização para o aperfeiçoamento vocal utilizando a eletrolaringe - Google Patents

Método para divisão de canais de sinal e utilização para o aperfeiçoamento vocal utilizando a eletrolaringe Download PDF

Info

Publication number
PT2394271T
PT2394271T PT107088825T PT10708882T PT2394271T PT 2394271 T PT2394271 T PT 2394271T PT 107088825 T PT107088825 T PT 107088825T PT 10708882 T PT10708882 T PT 10708882T PT 2394271 T PT2394271 T PT 2394271T
Authority
PT
Portugal
Prior art keywords
signal
frequency
time
vocal
speech
Prior art date
Application number
PT107088825T
Other languages
English (en)
Inventor
Hagmüller Martin
Kubin Gernot
Original Assignee
Heimomed Heinze Gmbh & Co Kg
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Heimomed Heinze Gmbh & Co Kg filed Critical Heimomed Heinze Gmbh & Co Kg
Publication of PT2394271T publication Critical patent/PT2394271T/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Telephone Function (AREA)
  • Prostheses (AREA)

Description

DESCRIÇÃO "Método para separação dos canais de sinal e utilização para o aperfeiçoamento vocal utilizando a eletrolaringe" 0 invento refere-se a um método para aperfeiçoar a qualidade vocal de um aparelho fonador do tipo eletrolaringe (EL), em que o sinal vocal do aparelho fonador é digitalizado através de meios apropriados. Os meios apropriados, por exemplo, são, neste caso, a utilização de equipamento eletrónico, um microfone com o correspondente conversor de analógico para digital, um telefone ou outros métodos.
Uma EL é um aparelho para gerar uma voz artificial, por exemplo, para doentes a quem foi retirada a laringe cirurgicamente. A EL é, neste caso, fixa no lado inferior da mandíbula; um gerador de frequências com uma determinada frequência leva a que o ar vibre na cavidade bucal através das partes moles no lado inferior da mandíbula. Estas vibrações são depois moduladas através dos órgãos de articulação, sendo assim possível uma vocalização. No entanto, visto que usualmente o gerador de audiofrequências apenas trabalha com uma frequência, a voz soa monótona e não natural, ou "robótica".
Além disso, é desvantajoso que a vibração da EL prejudique a perceção do falante ou até mesmo se sobreponha a ela, visto que apenas uma parte do som é articulada na cavidade oral. As partes que saem diretamente do aparelho ou no ponto de transição na garganta sobrepõem-se às partes articuladas e reduzem a inteligibilidade. Este é sobretudo o caso de indivíduos que foram submetidos a radioterapia na zona da garganta, tendo por isso ocorrido um endurecimento da estrutura histológica. Por isso, foram desenvolvidos diferentes métodos para reforçar o sinal útil, portanto as vibrações articuladas, em relação ao sinal parasita, portanto o som direto, ou a vibração não modulada da EL.
Estes métodos são sobretudo aplicados em situações em que o ouvinte não está diretamente exposto ao som emitido, sendo empregues, em vez disso, meios eletrónicos, como, por exemplo, em comunicações telefónicas, no caso de gravações de som ou em geral ao falar através do microfone e amplificador.
Em US 6,359,988 Bl, um sinal vocal da EL é submetido a uma análise cepstral e é sobreposto pela fala de um falante normal, tornando assim possível criar naturalmente a modificação do tom do falante com EL; ao mesmo tempo também se suprime com isso a parte do som direto emitido no sinal. A desvantagem desta solução é sobretudo que a cada fala de um falante com EL é necessária ao mesmo tempo a mesma fala de um falante saudável (ou seja, sem EL) , o que é na prática extremamente difícil de conseguir.
Outra solução é apresentada por US 6,975,984 B2, em que é descrita uma solução para aperfeiçoar um sinal vocal da EL na comunicação telefónica. Neste caso, o sinal vocal é processado num processador de sinal digital, de modo a reconhecer o ruído/zumbido de fundo da EL e a remover o mesmo do sinal vocal. 0 sinal vocal é para isso dividido num componente fónico e num componente afónico e o respetivo processamento é realizado em separado. A parte fónica é sujeita à transformada de Fourier por blocos, a filtragem de frequências (a frequência de fundo e a harmónica são posteriormente reutilizadas), a transformação inversa e, em sequência disso, a subtração de todo o sinal original. Permanece a parte afónica do sinal original. Em alternativa, propõe-se igualmente filtrar a parte fónica através de filtro passa-baixo, no caso de reconhecimento de uma pausa na fala filtrar totalmente e, a seguir, sobrepor a parte afónica. 0 documento "Enhancement of Electrolaryngeal Speech by Adaptive Filtering" de Carol Y. Espy-Wilson et al. (JSLHR, 41: 1253-1264, 1998) descreve um método para o aperfeiçoamento da qualidade vocal de um aparelho fonador do tipo EL. 0 ruído de fundo da EL é neste caso adaptado por meio da filtragem adaptativa do sinal vocal com interferência pelo ruído de fundo da EL (ou o ruído de fundo da EL articulado na forma de fala); noutro passo, os sinais são subtraídos um do outro. Permanece um sinal de erro, que é utilizado no controlo e no ajustamento dos parâmetros de filtro com o objetivo de minimizar o sinal de erro. 0 sinal de erro no presente método é o sinal vocal liberto do ruído de fundo da EL. A assunção neste caso é que de facto o sinal parasita no sinal vocal está correlacionado com o ruído de fundo da EL, o sinal vocal de interesse é, no entanto, independente dos outros sinais, portanto o ruído de fundo de interferência e o sinal vocal provêm efetivamente de fontes diferentes. 0 documento "Enhancement of Electrolarynx Speech Based on Auditory Masking" de Hanjun Liu et al. (IEEE Transactions on Biomedical Engineering, 53(5): 865-874, 2006) descreve um algoritmo de substração para aperfeiçoar o sinal de um aparelho fonador tipo EL, em especial em relação ao ruído ambiente.
Ao contrário de outros métodos, que preveem parâmetros de substração fixos, no caso deste algoritmo adapta-se os parâmetros de subtração no domínio de frequências com base na máscara auditiva. Neste caso, parte-se do princípio que a fala e os ruídos de fundo não estão correlacionados e, por isso, o ruído de fundo pode ser avaliado e pode ser removido no domínio de frequência do sinal.
Estas soluções têm em comum a utilização de métodos com base num modelo, de acordo com o qual a fala e o sinal parasita (portanto, o ruído ambiente, mas também o ruído de fundo da EL) são estatisticamente independentes ou não estão correlacionados.
Com base nesta assunção, a implementação dos referidos métodos é muito dispendiosa. Se for feita uma tentativa para suprimir o som direto com um filtro de rejeição de banda (adaptativo), reduz-se com isso também a qualidade do sinal vocal, que soará então como um sussurro; o sinal vocal e o ruído parasita têm as mesmas harmónicas.
Em US 2005/0004604 Al é descrita uma solução de laringe, na qual se coloca um emissor de som e um microfone diretamente na frente da boca de um utilizador, indo o emissor de som emitir um som com um menor volume e sendo o sinal recebido pelo microfone para fins de processamento posterior. No processamento posterior, o sinal é essencialmente filtrado com um filtro em pente, a fim de reduzir ou a remover as harmónicas do sinal. No entanto, isto afeta muito a qualidade do sinal vocal.
Em WO 2006/099670 AI é descrito um dispositivo para a monitorização das vias respiratórias, introduzindo-se som no domínio de frequências audível nas vias respiratórias de um objeto e determinando-se o estado dos canais respiratórias a partir do som refletido ou processado. É, por exemplo, possível detetar assim uma projeção nas vias respiratórias. Numa variante do invento, verifica-se através da TRF (transformada rápida de Fourier) a ultrapassagem de determinados limiares, tirando-se daí conclusões acerca do tratamento do sinal medido. E um objeto do invento superar as desvantagens acima referidas do estado da técnica e aperfeiçoar a qualidade vocal dos utilizadores da EL no caso da utilização de meios eletrónicos, como, por exemplo, microfones.
Este objeto é conseguido de acordo com o invento por um método do tipo referido no início, com os seguintes passos: a) divisão de um sinal vocal monocanal (S (w, t) , o qual consiste na soma de um componente varável no tempo X (w)H(w, t) e um componente invariável no tempo x(w)F(w) numa série de canais de frequências, através da transferência do domínio de tempos para um domínio de frequências discreto, b) filtragem da frequência de modulação da EL do componente invariável no tempo x(w)F(w) pela filtragem da frequência de modulação de 0 Hz por meio de um filtro passa-alto ou filtro de rejeição de banda, em qualquer canal de frequências, e c) transformação inversa do sinal vocal filtrado do domínio de frequências para o domínio de tempos e integração num sinal de saída monocanal. O invento é um modelo aperfeiçoado da utilização de uma EL, provindo o ruído de fundo da EL articulado na forma de um sinal vocal e as partes inalteradas da EL, que interferem com a perceção do sinal vocal, de uma fonte comum, nomeadamente da EL. Visto que o ruído de fundo não articulado de interferência da EL é reconhecível no domínio de modulação como sinal invariável no tempo, o mesmo pode ser facilmente separado por filtragem por um procedimento apropriado. Ocorre, portanto, uma separação não das fontes de sinal, mas sim dos canais de propagação (de um canal de propagação através dos órgãos de articulação de um falante, outro canal de propagação do ponto de aplicação na garganta do falante diretamente para o ouvido do ouvinte, ou para o microfone ou para meios recetores).
Os especialistas conhecem diversas possibilidades de transferir um sinal monocanal digitalizado no domínio de frequências e proceder assim à sua divisão numa série de canais de frequências. Em cada canal de frequências, a frequência de modulação da EL é suprimida por filtros apropriados, por exemplo, filtros rejeição de banda ou filtros passa-alto, aplicados no valor, e melhora-se assim a qualidade das partes de sinal articuladas.
Os métodos semelhantes do estado da técnica consideram as partes articuladas e as partes não modificadas como provenientes de diferentes fontes e selecionam abordagens correspondentes a este modelo, como, por exemplo, filtragem através de filtros passa-banda, os quais em todo o caso também atenuam o sinal vocal. 0 método de acordo com o invento tem também por objetivo aumentar a inteligibilidade da fala dos utilizadores da EL ou tornar o sinal mais agradável e "humano". 0 objetivo é reduzir ou eliminar o som direto da EL na comunicação através de meios eletrónicos (por exemplo, telefone). 0 método de acordo com o invento pode ser concretizado, por exemplo, por meio de um suporte lógico (software) de extensão, na forma de solução por fios fixa ou também como circuito analógico. A partir dos vários métodos conhecidos para a transferência de um sinal no domínio de frequências ou o inverso, a transferência no passo a) do método de acordo com o invento ocorre favoravelmente por meio da transformada de
Fourier, e a transformação inversa no passo c) ocorre através da transformada inversa de Fourier. A transferência ocorre por blocos (por exemplo, blocos de 20 ms) em intervalos curtos (atualização, por exemplo, a cada 10 ms). A divisão do sinal numa série de canais de frequências ocorre quando da transferência do sinal no domínio de frequências.
Numa variante do invento, a transferência do sinal vocal ocorre no passo a) e a transformação inversa ocorre no passo c) com um banco de filtros correspondente.
Os resultados do método de acordo com o invento podem ainda ser mais melhorados, se antes da filtraqem no passo b) ocorrer uma compressão do sinal e, após o passo b) , ocorrer uma descompressão. Através da compressão, consegue-se evitar que, no caso de grandes amplitudes, as suas alterações são dominantes ao ponto das alterações de pequenas amplitudes não são consideradas. Por meio da compressão tornam-se, portanto, mais visíveis as alterações relativas para o filtro.
Numa outra concretização do método de acordo com o invento, antes da conversão inversa no passo c) ocorre uma retificação dos componentes de sinal negativos.
Seguidamente, o invento é descrito em maior detalhe com base num exemplo de concretização não limitativo, que representado nos desenhos, os quais mostram esquematicamente: na Fig. 1 uma representação simplificada da utilização de uma EL e as vias de sinal em questão, na Fig. 2 uma representação simplificada da situação em que se aplica o método de acordo com o invento, e na Fig. 3 um diagrama de blocos do método de acordo com o invento.
Na Fig. 1 encontram-se esquematicamente os diferentes canais de transmissão de sinal de uma EL 1. Neste caso, uma EL 1 encontra-se disposta na garganta de um falante 2. O som gerado pela EL 1 propaga-se, por um lado, através dos canais vocais normais (nariz e boca) 5 do primeiro falante 2 e é aí articulado na forma de fala; este primeiro sinal 3 é claramente variável ou variante no tempo. Ao ouvido de um ouvinte 4 chega, a par deste sinal variável no tempo 3, também um segundo sinal 6 (na Fig. 1 representado pela linha ponteada) na forma do som direto da EL 1, sendo este sinal 4 em grande medida estacionário e sendo considerado, por isso, invariável no tempo. A segunda parte 6 de todo o sinal, ou seja, o ruido de fundo da EL 1, é percecionada pelo ouvinte 4 como sinal parasita e reduz a inteligibilidade da fala do falante 2. A excitação original por meio da EL 1 é, portanto, transmitida através de duas vias diferentes. 0 invento refere-se ao aperfeiçoamento da qualidade vocal de um aparelho fonador do tipo EL no caso da utilização de meios eletrónicos, em vez de um ouvinte, os sinais serão recebidos, portanto, por exemplo, por um microfone. Para ilustrar a situação inicial, escolheu-se, no entanto, este modelo geral de modo a facilitar a compreensão. A Fig. 2 mostra uma representação de um modelo simplificado da situação, à qual se aplica o método de acordo com o invento para a supressão de um segundo sinal parasita 6 (ver a Fig. 1) . É possível reconhecer facilmente, que o método de acordo com o invento não origina uma separação das fontes de sinal, mas sim dos canais de propagação.
Um sinal de fonte x (w) de uma fonte de sinal 7 propaga-se por duas vias de sinal diferentes. No primeiro canal de sinal, o sinal inicial é modulado por um filtro variável no tempo H (w, t) passando a um sinal variável no tempo x(w)H(w, t) . No segundo canal de sinal, o sinal inicial é apenas modificado por um filtro invariável no tempo F (w) passando a um sinal x(w)F(w).
Os sinais das duas vias são depois somados num recetor 8, por exemplo, o ouvido de um ouvinte, um microfone, etc., num sinal S (w, t) disponível para medição. 0 sinal consiste assim na soma dos componentes, S (w, t) = x(w)H(w, t) + x (w) F (w) É então possível separar as partes de sinal do canal de sinal invariável no tempo e variável no tempo, ao atenuar todas as partes de sinal que variam no tempo ou que são constantes no tempo. Obtém-se, portanto, por exemplo, como resultado apenas a parte variável no tempo SI(w, t)~x(w)H(w, t) .
No caso da aplicação para falar com a EL, a parte de sinal não articulada x(w)F(w) (ou seja, o ruído de fundo da EL) sobrepõe-se ao sinal vocal variável no tempo x(w)H(w, t) e leva por isso a uma perda da inteligibilidade do sinal vocal. A inteligibilidade vocal é aperfeiçoada ao separar-se a parte de sinal variável no tempo da parte de sinal invariável no tempo. A Fig. 3 mostra uma implementação possível do método de acordo com o invento. Neste caso, na entrada pode encontrar-se um sinal vocal digital 9 opcional de um falante com EL. Numa primeiro passo 10 transforma-se, com a aplicação da transformada rápida de Fourier, o sinal vocal 9 por blocos no domínio de frequências e realiza-se assim a sua separação numa série de canais de frequência. O especialista pode escolher dentre os diferentes métodos estabelecidos para a transformação de um sinal do domínio de tempos para o domínio de frequências; além da transformada de Fourier, também se pode aplicar, por exemplo, a conversão cossinusoidal discreta, condição prévia para uma aplicação de acordo com o invento, é, no entanto, que a conversão seja reversível. O sinal é separado com uma determinada taxa de refrescamento (por exemplo, 10 ms) em blocos, por exemplo, de 20 ms de duração, que são por sua vez propagados numa série de canais de frequência 11. O sinal vocal monocanal original 9 é, portanto, dividido numa série de domínios de frequências, que se alteram no decorrer do tempo. O sinal de frequência é complexo, mas, no entanto, é a seguir modificado apenas o valor absoluto, a fase 15 fica inalterada.
No passo 10 também se pode utilizar um banco de filtros, sendo a taxa de amostragem do sinal reduzida após o banco de filtros. A redução da taxa de amostragem corresponde neste caso à formação de blocos quando da aplicação da transformada de Fourier.
Noutro bloco funcional 12 cada canal de frequência 11 é filtrado, por exemplo, com um filtro passa-alto ou filtro de rejeição de banda. Esta filtragem permite separar determinadas frequências, na técnica de som elimina-se interferências de banda estreita com filtros rejeição de banda. Dado que a EL oscila numa determinada frequência, por exemplo, 100 Hz, o sinal parasita, que não é modificado pelos órgãos de articulação de um falante, origina, no domínio de frequências, amplitudes no canal de 100 Hz com a frequência de modulação 0 Hz, ou seja, a amplitude do sinal da EL não é modificada. O sinal parasita é caracterizado por ser perfeitamente invariável no tempo. Para a filtragem do ruído de fundo da EL, utiliza-se um filtro de rejeição de banda ou um filtro passa-alto. Como frequência limite para o filtro passa-alto, utiliza-se neste caso a frequência de modulação da EL; escolhe-se o filtro de rejeição de banda de modo a bloquear com precisão na frequência de modulação da EL.
Na implementação real, poderá naturalmente não se conseguir uma invariância temporal perfeita devido a reflexões, falhas, ruído ambiente e requisitos de construção da EL. Visto que em todo o caso o filtro também não se encontra limitado a apenas uma frequência, cobrindo, em vez disso, uma determinado domínio de frequências, neste caso fica garantido num domínio de frequências de modulação, o funcionamento do método de acordo com o invento.
Num bloco funcional terminal 13, ocorre o retorno dos sinais para o domínio de tempos, por exemplo, através de transformada inversa de Fourier, e a integração dos canais de frequências 11 de novo num canal ocorre por meio de overlap-add. O método overlap-add é neste caso um método conhecido pelos especialistas do processamento de sinais digitais. O resultado é um sinal de saída monocanal 14, no qual o sinal parasita da EL é filtrado ou pelo menos atenuado. O sinal de saída pode ser posteriormente processado.
No caso da aplicação de um banco de filtros no passo 10, ocorre de novo aumento da taxa de amostragem do sinal após a filtragem no passo 12 e ocorre após o seu processamento posterior, como descrito.
Em princípio, estas concretizações representam apenas os componentes mais importantes do método de acordo com o invento; antes da filtragem no bloco 12, o sinal pode ser comprimido, após a filtragem pode estar prevista uma descompressão. Poderá ser também favorável uma retificação antes da conversão inversa no domínio de tempos, dado se poder originar valores negativos não admitidos no processamento. 0 invento pode ser empregue, por exemplo, como aparelho adicional para comunicação telefónica. No caso de um telefone analógico convencional, o aparelho é simplesmente integrado no auscultador. No caso de um telefone com processador de sinal digital integrado, a integração do invento é possível através de um software de extensão. Também é possível a concretização no âmbito de uma solução por fios fixa, por exemplo, também num circuito analógico. 0 método de acordo com o invento também pode ser aplicado no caso da utilização de uma EL, na qual se comuta entre duas ou mais frequências, de modo a conferir à fala um som realístico. Isto aplica-se tanto a saltos de frequência discretos, como também a alterações contínuas da frequência básica com a assunção de que as frequências, entre as quais se alterna, se encontram dentro de uma banda de frequências, na qual o sinal de fundo é separado. A largura do filtro de modulação de frequência determina a rapidez com que se pode alterar a frequência. No caso de alterações contínuas muito lentas, a frequência pode variar, no caso de funcionamento da supressão, em todo o domínio da banda de frequências, não é o tamanho que é determinante, mas sim a velocidade da alteração. Ao ligar e desligar a EL, o que corresponde a uma alteração rápida, a supressão apenas ocorre passados alguns milissegundos, consoante a largura selecionada para o filtro de rejeição de banda ou onde se encontra a frequência básica do filtro passa-alto.
Neste caso, as alterações da frequência básica não podem de qualquer forma ser demasiado grandes. De modo a garantir o funcionamento de acordo com o invento, será necessário, por exemplo, expandir os canais de frequência, nos quais o sinal é separado, ou a filtragem por meio do filtro passa-alto terá de ser aplicada numa frequência algo mais alta.

Claims (5)

  1. REIVINDICAÇÕES
    1 - Método para melhorar a qualidade vocal de um aparelho fonador do tipo eletrolaringe (EL), cujo sinal vocal S(w, t) é digitalizado por meios apropriados, caracterizado por compreender seguintes passos de: a) divisão de um sinal vocal monocanal S (w, t) , o qual consiste na soma de um componente varável no tempo X(w)H(w, t) e um componente invariável no tempo x(w)F(w) numa série de canais de frequência, pela transferência do mesmo do domínio de tempos para um domínio de frequências discreto, b) filtragem do componente invariável no tempo x(w)F(w) pela filtragem da frequência de modulação de 0 Hz por meio de um filtro passa-alto ou filtro de rejeição de banda, em cada canal de frequências, e c) transformação inversa do sinal vocal filtrado do domínio de frequências para o domínio de tempos e integração num sinal de saída de monocanal.
  2. 2 - Método de acordo com a reivindicação 1, caracterizado por a transferência do sinal vocal no passo a) ser efetuada por uma transformada de Fourier e por a transformação inversa ser realizada no passo c) por meio da transformada inversa de Fourier.
  3. 3 - Método de acordo com a reivindicação 1, caracterizado por se realizar a transferência do sinal vocal no passo a) e a síntese dos canais de frequência no passo c) com um banco de filtros.
  4. 4 - Método de acordo com uma das reivindicações 1 a 3, caracterizado por ocorrer uma compressão de sinal antes da filtragem no passo b) e ocorrer uma descompressão após o passo b).
  5. 5 - Método de acordo com uma das reivindicações 1 a 4, caracterizado por ocorrer uma retificação dos componentes de sinal negativos antes da transformação inversa no passo c).
PT107088825T 2009-02-04 2010-02-01 Método para divisão de canais de sinal e utilização para o aperfeiçoamento vocal utilizando a eletrolaringe PT2394271T (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
AT0019309A AT507844B1 (de) 2009-02-04 2009-02-04 Methode zur trennung von signalpfaden und anwendung auf die verbesserung von sprache mit elektro-larynx

Publications (1)

Publication Number Publication Date
PT2394271T true PT2394271T (pt) 2017-04-26

Family

ID=42272699

Family Applications (1)

Application Number Title Priority Date Filing Date
PT107088825T PT2394271T (pt) 2009-02-04 2010-02-01 Método para divisão de canais de sinal e utilização para o aperfeiçoamento vocal utilizando a eletrolaringe

Country Status (10)

Country Link
US (1) US20120004906A1 (pt)
EP (1) EP2394271B1 (pt)
JP (1) JP5249431B2 (pt)
CN (1) CN102341853B (pt)
AT (1) AT507844B1 (pt)
CA (1) CA2749617C (pt)
DK (1) DK2394271T3 (pt)
ES (1) ES2628521T3 (pt)
PT (1) PT2394271T (pt)
WO (1) WO2010088709A1 (pt)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105310806B (zh) * 2014-08-01 2017-08-25 北京航空航天大学 具有语音转换功能的电子人工喉系统及其语音转换方法
US20220293239A1 (en) * 2019-09-24 2022-09-15 Panasonic Intellectual Property Management Co., Ltd. Recipe output method and recipe output system
WO2024158407A1 (en) * 2023-01-24 2024-08-02 Rowan University Mitigation of malicious sonic attacks on voice-based computing devices

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3746789A (en) * 1971-10-20 1973-07-17 E Alcivar Tissue conduction microphone utilized to activate a voice operated switch
US3872250A (en) * 1973-02-28 1975-03-18 David C Coulter Method and system for speech compression
US4139732A (en) * 1975-01-24 1979-02-13 Larynogograph Limited Apparatus for speech pattern derivation
US4343969A (en) * 1978-10-02 1982-08-10 Trans-Data Associates Apparatus and method for articulatory speech recognition
JPH03228097A (ja) * 1989-12-22 1991-10-09 Bridgestone Corp 振動制御装置
US5171930A (en) * 1990-09-26 1992-12-15 Synchro Voice Inc. Electroglottograph-driven controller for a MIDI-compatible electronic music synthesizer device
JPH08265891A (ja) * 1993-01-28 1996-10-11 Tatsu Ifukube 電気人工喉頭
JP3451022B2 (ja) * 1998-09-17 2003-09-29 松下電器産業株式会社 拡声音の明瞭度改善方法及び装置
US20050004604A1 (en) 1999-03-23 2005-01-06 Jerry Liebler Artificial larynx using coherent processing to remove stimulus artifacts
US6359988B1 (en) 1999-09-03 2002-03-19 Trustees Of Boston University Process for introduce realistic pitch variation in artificial larynx speech
JP2001086583A (ja) * 1999-09-09 2001-03-30 Sentan Kagaku Gijutsu Incubation Center:Kk 代用原音発生器とその制御方法
US6975984B2 (en) 2000-02-08 2005-12-13 Speech Technology And Applied Research Corporation Electrolaryngeal speech enhancement for telephony
US7708697B2 (en) 2000-04-20 2010-05-04 Pulmosonix Pty Ltd Method and apparatus for determining conditions of biological tissues
US7191134B2 (en) * 2002-03-25 2007-03-13 Nunally Patrick O'neal Audio psychological stress indicator alteration method and apparatus
CA2399159A1 (en) * 2002-08-16 2004-02-16 Dspfactory Ltd. Convergence improvement for oversampled subband adaptive filters
WO2005031702A1 (en) * 2003-08-11 2005-04-07 Faculté Polytechnique de Mons Method for estimating resonance frequencies
US20050281412A1 (en) * 2004-06-16 2005-12-22 Hillman Robert E Voice prosthesis with neural interface
JP4568826B2 (ja) * 2005-09-08 2010-10-27 株式会社国際電気通信基礎技術研究所 声門閉鎖区間検出装置および声門閉鎖区間検出プログラム
CN100576320C (zh) * 2007-03-27 2009-12-30 西安交通大学 一种自动电子喉的电子喉语音增强系统与控制方法
JP4327241B2 (ja) * 2007-10-01 2009-09-09 パナソニック株式会社 音声強調装置および音声強調方法

Also Published As

Publication number Publication date
CN102341853A (zh) 2012-02-01
DK2394271T3 (en) 2017-07-10
US20120004906A1 (en) 2012-01-05
EP2394271B1 (de) 2017-03-22
ES2628521T3 (es) 2017-08-03
JP2012517031A (ja) 2012-07-26
CN102341853B (zh) 2014-06-04
CA2749617C (en) 2016-11-01
AT507844B1 (de) 2010-11-15
JP5249431B2 (ja) 2013-07-31
EP2394271A1 (de) 2011-12-14
WO2010088709A1 (de) 2010-08-12
AT507844A1 (de) 2010-08-15
CA2749617A1 (en) 2010-08-12

Similar Documents

Publication Publication Date Title
Liu et al. Electrolarynx in voice rehabilitation
JP2017142485A (ja) ヘッドセットユーザの音声活動の存在又は不存在に応じてアクティブノイズコントロール、閉塞防止制御、及び、受動減衰相殺を伴うオーディオヘッドセット
US9288593B2 (en) Visually-based fitting of hearing devices
Maruri et al. V-speech: Noise-robust speech capturing glasses using vibration sensors
KR20110107833A (ko) 이어피스를 위한 음향의 인­이어 검출
JP2012231468A (ja) 特に「ハンズフリー」電話システム向けの近接音声信号を雑音除去するための手段を有するマイクロホンとイヤホンの組合せ型のオーディオ・ヘッドセット
KR101963871B1 (ko) 소리 제어를 통한 지각 능력 향상 장치 및 방법
WO2022231977A1 (en) Recovery of voice audio quality using a deep learning model
WO2019079948A1 (en) HEADER AND METHOD FOR PERFORMING AN ADAPTIVE SELF-ACCORD FOR A HEADPHONES
Pandey et al. Enhancement of alaryngeal speech using spectral subtraction
JP7576780B2 (ja) 耳装着型デバイス、及び、再生方法
PT2394271T (pt) Método para divisão de canais de sinal e utilização para o aperfeiçoamento vocal utilizando a eletrolaringe
JP6764125B2 (ja) 音響出力装置
US12495241B2 (en) Apparatus and method for treating misophonia
KR102184649B1 (ko) 치과 치료용 소리 제어 시스템 및 방법
US20040158431A1 (en) Medical hearing aid analysis system
WO2020208926A1 (ja) 信号処理装置、信号処理方法及びプログラム
CN115398934A (zh) 再现音频信号时主动抑制闭塞效应的方法、装置、耳机及计算机程序
JP7052814B2 (ja) 信号処理装置
KR100778143B1 (ko) 후두 임피던스 신호를 이용하는 넥마이크를 구비한 골도헤드셋
JP2012194510A (ja) 音声処理装置
KR100681484B1 (ko) 인공 후두장치
Kabir et al. Enhancement of alaryngeal speech utilizing spectral subtraction and minimum statistics
Irvin Toward Natural Singing Via External Prosthesis
CN120303954A (zh) 语音处理系统、语音处理方法以及程序