PT2394271T - Método para divisão de canais de sinal e utilização para o aperfeiçoamento vocal utilizando a eletrolaringe - Google Patents
Método para divisão de canais de sinal e utilização para o aperfeiçoamento vocal utilizando a eletrolaringe Download PDFInfo
- Publication number
- PT2394271T PT2394271T PT107088825T PT10708882T PT2394271T PT 2394271 T PT2394271 T PT 2394271T PT 107088825 T PT107088825 T PT 107088825T PT 10708882 T PT10708882 T PT 10708882T PT 2394271 T PT2394271 T PT 2394271T
- Authority
- PT
- Portugal
- Prior art keywords
- signal
- frequency
- time
- vocal
- speech
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 36
- 210000000867 larynx Anatomy 0.000 title description 2
- 230000001755 vocal effect Effects 0.000 claims description 25
- 238000001914 filtration Methods 0.000 claims description 17
- 230000009466 transformation Effects 0.000 claims description 8
- 238000012546 transfer Methods 0.000 claims description 7
- 230000002441 reversible effect Effects 0.000 claims description 5
- 230000010354 integration Effects 0.000 claims description 4
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 230000006837 decompression Effects 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 claims description 2
- 238000003786 synthesis reaction Methods 0.000 claims 1
- 230000003071 parasitic effect Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 210000000214 mouth Anatomy 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 2
- 244000045947 parasite Species 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002565 electrocardiography Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 210000001847 jaw Anatomy 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 210000004373 mandible Anatomy 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Telephone Function (AREA)
- Prostheses (AREA)
Description
DESCRIÇÃO "Método para separação dos canais de sinal e utilização para o aperfeiçoamento vocal utilizando a eletrolaringe" 0 invento refere-se a um método para aperfeiçoar a qualidade vocal de um aparelho fonador do tipo eletrolaringe (EL), em que o sinal vocal do aparelho fonador é digitalizado através de meios apropriados. Os meios apropriados, por exemplo, são, neste caso, a utilização de equipamento eletrónico, um microfone com o correspondente conversor de analógico para digital, um telefone ou outros métodos.
Uma EL é um aparelho para gerar uma voz artificial, por exemplo, para doentes a quem foi retirada a laringe cirurgicamente. A EL é, neste caso, fixa no lado inferior da mandíbula; um gerador de frequências com uma determinada frequência leva a que o ar vibre na cavidade bucal através das partes moles no lado inferior da mandíbula. Estas vibrações são depois moduladas através dos órgãos de articulação, sendo assim possível uma vocalização. No entanto, visto que usualmente o gerador de audiofrequências apenas trabalha com uma frequência, a voz soa monótona e não natural, ou "robótica".
Além disso, é desvantajoso que a vibração da EL prejudique a perceção do falante ou até mesmo se sobreponha a ela, visto que apenas uma parte do som é articulada na cavidade oral. As partes que saem diretamente do aparelho ou no ponto de transição na garganta sobrepõem-se às partes articuladas e reduzem a inteligibilidade. Este é sobretudo o caso de indivíduos que foram submetidos a radioterapia na zona da garganta, tendo por isso ocorrido um endurecimento da estrutura histológica. Por isso, foram desenvolvidos diferentes métodos para reforçar o sinal útil, portanto as vibrações articuladas, em relação ao sinal parasita, portanto o som direto, ou a vibração não modulada da EL.
Estes métodos são sobretudo aplicados em situações em que o ouvinte não está diretamente exposto ao som emitido, sendo empregues, em vez disso, meios eletrónicos, como, por exemplo, em comunicações telefónicas, no caso de gravações de som ou em geral ao falar através do microfone e amplificador.
Em US 6,359,988 Bl, um sinal vocal da EL é submetido a uma análise cepstral e é sobreposto pela fala de um falante normal, tornando assim possível criar naturalmente a modificação do tom do falante com EL; ao mesmo tempo também se suprime com isso a parte do som direto emitido no sinal. A desvantagem desta solução é sobretudo que a cada fala de um falante com EL é necessária ao mesmo tempo a mesma fala de um falante saudável (ou seja, sem EL) , o que é na prática extremamente difícil de conseguir.
Outra solução é apresentada por US 6,975,984 B2, em que é descrita uma solução para aperfeiçoar um sinal vocal da EL na comunicação telefónica. Neste caso, o sinal vocal é processado num processador de sinal digital, de modo a reconhecer o ruído/zumbido de fundo da EL e a remover o mesmo do sinal vocal. 0 sinal vocal é para isso dividido num componente fónico e num componente afónico e o respetivo processamento é realizado em separado. A parte fónica é sujeita à transformada de Fourier por blocos, a filtragem de frequências (a frequência de fundo e a harmónica são posteriormente reutilizadas), a transformação inversa e, em sequência disso, a subtração de todo o sinal original. Permanece a parte afónica do sinal original. Em alternativa, propõe-se igualmente filtrar a parte fónica através de filtro passa-baixo, no caso de reconhecimento de uma pausa na fala filtrar totalmente e, a seguir, sobrepor a parte afónica. 0 documento "Enhancement of Electrolaryngeal Speech by Adaptive Filtering" de Carol Y. Espy-Wilson et al. (JSLHR, 41: 1253-1264, 1998) descreve um método para o aperfeiçoamento da qualidade vocal de um aparelho fonador do tipo EL. 0 ruído de fundo da EL é neste caso adaptado por meio da filtragem adaptativa do sinal vocal com interferência pelo ruído de fundo da EL (ou o ruído de fundo da EL articulado na forma de fala); noutro passo, os sinais são subtraídos um do outro. Permanece um sinal de erro, que é utilizado no controlo e no ajustamento dos parâmetros de filtro com o objetivo de minimizar o sinal de erro. 0 sinal de erro no presente método é o sinal vocal liberto do ruído de fundo da EL. A assunção neste caso é que de facto o sinal parasita no sinal vocal está correlacionado com o ruído de fundo da EL, o sinal vocal de interesse é, no entanto, independente dos outros sinais, portanto o ruído de fundo de interferência e o sinal vocal provêm efetivamente de fontes diferentes. 0 documento "Enhancement of Electrolarynx Speech Based on Auditory Masking" de Hanjun Liu et al. (IEEE Transactions on Biomedical Engineering, 53(5): 865-874, 2006) descreve um algoritmo de substração para aperfeiçoar o sinal de um aparelho fonador tipo EL, em especial em relação ao ruído ambiente.
Ao contrário de outros métodos, que preveem parâmetros de substração fixos, no caso deste algoritmo adapta-se os parâmetros de subtração no domínio de frequências com base na máscara auditiva. Neste caso, parte-se do princípio que a fala e os ruídos de fundo não estão correlacionados e, por isso, o ruído de fundo pode ser avaliado e pode ser removido no domínio de frequência do sinal.
Estas soluções têm em comum a utilização de métodos com base num modelo, de acordo com o qual a fala e o sinal parasita (portanto, o ruído ambiente, mas também o ruído de fundo da EL) são estatisticamente independentes ou não estão correlacionados.
Com base nesta assunção, a implementação dos referidos métodos é muito dispendiosa. Se for feita uma tentativa para suprimir o som direto com um filtro de rejeição de banda (adaptativo), reduz-se com isso também a qualidade do sinal vocal, que soará então como um sussurro; o sinal vocal e o ruído parasita têm as mesmas harmónicas.
Em US 2005/0004604 Al é descrita uma solução de laringe, na qual se coloca um emissor de som e um microfone diretamente na frente da boca de um utilizador, indo o emissor de som emitir um som com um menor volume e sendo o sinal recebido pelo microfone para fins de processamento posterior. No processamento posterior, o sinal é essencialmente filtrado com um filtro em pente, a fim de reduzir ou a remover as harmónicas do sinal. No entanto, isto afeta muito a qualidade do sinal vocal.
Em WO 2006/099670 AI é descrito um dispositivo para a monitorização das vias respiratórias, introduzindo-se som no domínio de frequências audível nas vias respiratórias de um objeto e determinando-se o estado dos canais respiratórias a partir do som refletido ou processado. É, por exemplo, possível detetar assim uma projeção nas vias respiratórias. Numa variante do invento, verifica-se através da TRF (transformada rápida de Fourier) a ultrapassagem de determinados limiares, tirando-se daí conclusões acerca do tratamento do sinal medido. E um objeto do invento superar as desvantagens acima referidas do estado da técnica e aperfeiçoar a qualidade vocal dos utilizadores da EL no caso da utilização de meios eletrónicos, como, por exemplo, microfones.
Este objeto é conseguido de acordo com o invento por um método do tipo referido no início, com os seguintes passos: a) divisão de um sinal vocal monocanal (S (w, t) , o qual consiste na soma de um componente varável no tempo X (w)H(w, t) e um componente invariável no tempo x(w)F(w) numa série de canais de frequências, através da transferência do domínio de tempos para um domínio de frequências discreto, b) filtragem da frequência de modulação da EL do componente invariável no tempo x(w)F(w) pela filtragem da frequência de modulação de 0 Hz por meio de um filtro passa-alto ou filtro de rejeição de banda, em qualquer canal de frequências, e c) transformação inversa do sinal vocal filtrado do domínio de frequências para o domínio de tempos e integração num sinal de saída monocanal. O invento é um modelo aperfeiçoado da utilização de uma EL, provindo o ruído de fundo da EL articulado na forma de um sinal vocal e as partes inalteradas da EL, que interferem com a perceção do sinal vocal, de uma fonte comum, nomeadamente da EL. Visto que o ruído de fundo não articulado de interferência da EL é reconhecível no domínio de modulação como sinal invariável no tempo, o mesmo pode ser facilmente separado por filtragem por um procedimento apropriado. Ocorre, portanto, uma separação não das fontes de sinal, mas sim dos canais de propagação (de um canal de propagação através dos órgãos de articulação de um falante, outro canal de propagação do ponto de aplicação na garganta do falante diretamente para o ouvido do ouvinte, ou para o microfone ou para meios recetores).
Os especialistas conhecem diversas possibilidades de transferir um sinal monocanal digitalizado no domínio de frequências e proceder assim à sua divisão numa série de canais de frequências. Em cada canal de frequências, a frequência de modulação da EL é suprimida por filtros apropriados, por exemplo, filtros rejeição de banda ou filtros passa-alto, aplicados no valor, e melhora-se assim a qualidade das partes de sinal articuladas.
Os métodos semelhantes do estado da técnica consideram as partes articuladas e as partes não modificadas como provenientes de diferentes fontes e selecionam abordagens correspondentes a este modelo, como, por exemplo, filtragem através de filtros passa-banda, os quais em todo o caso também atenuam o sinal vocal. 0 método de acordo com o invento tem também por objetivo aumentar a inteligibilidade da fala dos utilizadores da EL ou tornar o sinal mais agradável e "humano". 0 objetivo é reduzir ou eliminar o som direto da EL na comunicação através de meios eletrónicos (por exemplo, telefone). 0 método de acordo com o invento pode ser concretizado, por exemplo, por meio de um suporte lógico (software) de extensão, na forma de solução por fios fixa ou também como circuito analógico. A partir dos vários métodos conhecidos para a transferência de um sinal no domínio de frequências ou o inverso, a transferência no passo a) do método de acordo com o invento ocorre favoravelmente por meio da transformada de
Fourier, e a transformação inversa no passo c) ocorre através da transformada inversa de Fourier. A transferência ocorre por blocos (por exemplo, blocos de 20 ms) em intervalos curtos (atualização, por exemplo, a cada 10 ms). A divisão do sinal numa série de canais de frequências ocorre quando da transferência do sinal no domínio de frequências.
Numa variante do invento, a transferência do sinal vocal ocorre no passo a) e a transformação inversa ocorre no passo c) com um banco de filtros correspondente.
Os resultados do método de acordo com o invento podem ainda ser mais melhorados, se antes da filtraqem no passo b) ocorrer uma compressão do sinal e, após o passo b) , ocorrer uma descompressão. Através da compressão, consegue-se evitar que, no caso de grandes amplitudes, as suas alterações são dominantes ao ponto das alterações de pequenas amplitudes não são consideradas. Por meio da compressão tornam-se, portanto, mais visíveis as alterações relativas para o filtro.
Numa outra concretização do método de acordo com o invento, antes da conversão inversa no passo c) ocorre uma retificação dos componentes de sinal negativos.
Seguidamente, o invento é descrito em maior detalhe com base num exemplo de concretização não limitativo, que representado nos desenhos, os quais mostram esquematicamente: na Fig. 1 uma representação simplificada da utilização de uma EL e as vias de sinal em questão, na Fig. 2 uma representação simplificada da situação em que se aplica o método de acordo com o invento, e na Fig. 3 um diagrama de blocos do método de acordo com o invento.
Na Fig. 1 encontram-se esquematicamente os diferentes canais de transmissão de sinal de uma EL 1. Neste caso, uma EL 1 encontra-se disposta na garganta de um falante 2. O som gerado pela EL 1 propaga-se, por um lado, através dos canais vocais normais (nariz e boca) 5 do primeiro falante 2 e é aí articulado na forma de fala; este primeiro sinal 3 é claramente variável ou variante no tempo. Ao ouvido de um ouvinte 4 chega, a par deste sinal variável no tempo 3, também um segundo sinal 6 (na Fig. 1 representado pela linha ponteada) na forma do som direto da EL 1, sendo este sinal 4 em grande medida estacionário e sendo considerado, por isso, invariável no tempo. A segunda parte 6 de todo o sinal, ou seja, o ruido de fundo da EL 1, é percecionada pelo ouvinte 4 como sinal parasita e reduz a inteligibilidade da fala do falante 2. A excitação original por meio da EL 1 é, portanto, transmitida através de duas vias diferentes. 0 invento refere-se ao aperfeiçoamento da qualidade vocal de um aparelho fonador do tipo EL no caso da utilização de meios eletrónicos, em vez de um ouvinte, os sinais serão recebidos, portanto, por exemplo, por um microfone. Para ilustrar a situação inicial, escolheu-se, no entanto, este modelo geral de modo a facilitar a compreensão. A Fig. 2 mostra uma representação de um modelo simplificado da situação, à qual se aplica o método de acordo com o invento para a supressão de um segundo sinal parasita 6 (ver a Fig. 1) . É possível reconhecer facilmente, que o método de acordo com o invento não origina uma separação das fontes de sinal, mas sim dos canais de propagação.
Um sinal de fonte x (w) de uma fonte de sinal 7 propaga-se por duas vias de sinal diferentes. No primeiro canal de sinal, o sinal inicial é modulado por um filtro variável no tempo H (w, t) passando a um sinal variável no tempo x(w)H(w, t) . No segundo canal de sinal, o sinal inicial é apenas modificado por um filtro invariável no tempo F (w) passando a um sinal x(w)F(w).
Os sinais das duas vias são depois somados num recetor 8, por exemplo, o ouvido de um ouvinte, um microfone, etc., num sinal S (w, t) disponível para medição. 0 sinal consiste assim na soma dos componentes, S (w, t) = x(w)H(w, t) + x (w) F (w) É então possível separar as partes de sinal do canal de sinal invariável no tempo e variável no tempo, ao atenuar todas as partes de sinal que variam no tempo ou que são constantes no tempo. Obtém-se, portanto, por exemplo, como resultado apenas a parte variável no tempo SI(w, t)~x(w)H(w, t) .
No caso da aplicação para falar com a EL, a parte de sinal não articulada x(w)F(w) (ou seja, o ruído de fundo da EL) sobrepõe-se ao sinal vocal variável no tempo x(w)H(w, t) e leva por isso a uma perda da inteligibilidade do sinal vocal. A inteligibilidade vocal é aperfeiçoada ao separar-se a parte de sinal variável no tempo da parte de sinal invariável no tempo. A Fig. 3 mostra uma implementação possível do método de acordo com o invento. Neste caso, na entrada pode encontrar-se um sinal vocal digital 9 opcional de um falante com EL. Numa primeiro passo 10 transforma-se, com a aplicação da transformada rápida de Fourier, o sinal vocal 9 por blocos no domínio de frequências e realiza-se assim a sua separação numa série de canais de frequência. O especialista pode escolher dentre os diferentes métodos estabelecidos para a transformação de um sinal do domínio de tempos para o domínio de frequências; além da transformada de Fourier, também se pode aplicar, por exemplo, a conversão cossinusoidal discreta, condição prévia para uma aplicação de acordo com o invento, é, no entanto, que a conversão seja reversível. O sinal é separado com uma determinada taxa de refrescamento (por exemplo, 10 ms) em blocos, por exemplo, de 20 ms de duração, que são por sua vez propagados numa série de canais de frequência 11. O sinal vocal monocanal original 9 é, portanto, dividido numa série de domínios de frequências, que se alteram no decorrer do tempo. O sinal de frequência é complexo, mas, no entanto, é a seguir modificado apenas o valor absoluto, a fase 15 fica inalterada.
No passo 10 também se pode utilizar um banco de filtros, sendo a taxa de amostragem do sinal reduzida após o banco de filtros. A redução da taxa de amostragem corresponde neste caso à formação de blocos quando da aplicação da transformada de Fourier.
Noutro bloco funcional 12 cada canal de frequência 11 é filtrado, por exemplo, com um filtro passa-alto ou filtro de rejeição de banda. Esta filtragem permite separar determinadas frequências, na técnica de som elimina-se interferências de banda estreita com filtros rejeição de banda. Dado que a EL oscila numa determinada frequência, por exemplo, 100 Hz, o sinal parasita, que não é modificado pelos órgãos de articulação de um falante, origina, no domínio de frequências, amplitudes no canal de 100 Hz com a frequência de modulação 0 Hz, ou seja, a amplitude do sinal da EL não é modificada. O sinal parasita é caracterizado por ser perfeitamente invariável no tempo. Para a filtragem do ruído de fundo da EL, utiliza-se um filtro de rejeição de banda ou um filtro passa-alto. Como frequência limite para o filtro passa-alto, utiliza-se neste caso a frequência de modulação da EL; escolhe-se o filtro de rejeição de banda de modo a bloquear com precisão na frequência de modulação da EL.
Na implementação real, poderá naturalmente não se conseguir uma invariância temporal perfeita devido a reflexões, falhas, ruído ambiente e requisitos de construção da EL. Visto que em todo o caso o filtro também não se encontra limitado a apenas uma frequência, cobrindo, em vez disso, uma determinado domínio de frequências, neste caso fica garantido num domínio de frequências de modulação, o funcionamento do método de acordo com o invento.
Num bloco funcional terminal 13, ocorre o retorno dos sinais para o domínio de tempos, por exemplo, através de transformada inversa de Fourier, e a integração dos canais de frequências 11 de novo num canal ocorre por meio de overlap-add. O método overlap-add é neste caso um método conhecido pelos especialistas do processamento de sinais digitais. O resultado é um sinal de saída monocanal 14, no qual o sinal parasita da EL é filtrado ou pelo menos atenuado. O sinal de saída pode ser posteriormente processado.
No caso da aplicação de um banco de filtros no passo 10, ocorre de novo aumento da taxa de amostragem do sinal após a filtragem no passo 12 e ocorre após o seu processamento posterior, como descrito.
Em princípio, estas concretizações representam apenas os componentes mais importantes do método de acordo com o invento; antes da filtragem no bloco 12, o sinal pode ser comprimido, após a filtragem pode estar prevista uma descompressão. Poderá ser também favorável uma retificação antes da conversão inversa no domínio de tempos, dado se poder originar valores negativos não admitidos no processamento. 0 invento pode ser empregue, por exemplo, como aparelho adicional para comunicação telefónica. No caso de um telefone analógico convencional, o aparelho é simplesmente integrado no auscultador. No caso de um telefone com processador de sinal digital integrado, a integração do invento é possível através de um software de extensão. Também é possível a concretização no âmbito de uma solução por fios fixa, por exemplo, também num circuito analógico. 0 método de acordo com o invento também pode ser aplicado no caso da utilização de uma EL, na qual se comuta entre duas ou mais frequências, de modo a conferir à fala um som realístico. Isto aplica-se tanto a saltos de frequência discretos, como também a alterações contínuas da frequência básica com a assunção de que as frequências, entre as quais se alterna, se encontram dentro de uma banda de frequências, na qual o sinal de fundo é separado. A largura do filtro de modulação de frequência determina a rapidez com que se pode alterar a frequência. No caso de alterações contínuas muito lentas, a frequência pode variar, no caso de funcionamento da supressão, em todo o domínio da banda de frequências, não é o tamanho que é determinante, mas sim a velocidade da alteração. Ao ligar e desligar a EL, o que corresponde a uma alteração rápida, a supressão apenas ocorre passados alguns milissegundos, consoante a largura selecionada para o filtro de rejeição de banda ou onde se encontra a frequência básica do filtro passa-alto.
Neste caso, as alterações da frequência básica não podem de qualquer forma ser demasiado grandes. De modo a garantir o funcionamento de acordo com o invento, será necessário, por exemplo, expandir os canais de frequência, nos quais o sinal é separado, ou a filtragem por meio do filtro passa-alto terá de ser aplicada numa frequência algo mais alta.
Claims (5)
- REIVINDICAÇÕES1 - Método para melhorar a qualidade vocal de um aparelho fonador do tipo eletrolaringe (EL), cujo sinal vocal S(w, t) é digitalizado por meios apropriados, caracterizado por compreender seguintes passos de: a) divisão de um sinal vocal monocanal S (w, t) , o qual consiste na soma de um componente varável no tempo X(w)H(w, t) e um componente invariável no tempo x(w)F(w) numa série de canais de frequência, pela transferência do mesmo do domínio de tempos para um domínio de frequências discreto, b) filtragem do componente invariável no tempo x(w)F(w) pela filtragem da frequência de modulação de 0 Hz por meio de um filtro passa-alto ou filtro de rejeição de banda, em cada canal de frequências, e c) transformação inversa do sinal vocal filtrado do domínio de frequências para o domínio de tempos e integração num sinal de saída de monocanal.
- 2 - Método de acordo com a reivindicação 1, caracterizado por a transferência do sinal vocal no passo a) ser efetuada por uma transformada de Fourier e por a transformação inversa ser realizada no passo c) por meio da transformada inversa de Fourier.
- 3 - Método de acordo com a reivindicação 1, caracterizado por se realizar a transferência do sinal vocal no passo a) e a síntese dos canais de frequência no passo c) com um banco de filtros.
- 4 - Método de acordo com uma das reivindicações 1 a 3, caracterizado por ocorrer uma compressão de sinal antes da filtragem no passo b) e ocorrer uma descompressão após o passo b).
- 5 - Método de acordo com uma das reivindicações 1 a 4, caracterizado por ocorrer uma retificação dos componentes de sinal negativos antes da transformação inversa no passo c).
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| AT0019309A AT507844B1 (de) | 2009-02-04 | 2009-02-04 | Methode zur trennung von signalpfaden und anwendung auf die verbesserung von sprache mit elektro-larynx |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| PT2394271T true PT2394271T (pt) | 2017-04-26 |
Family
ID=42272699
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PT107088825T PT2394271T (pt) | 2009-02-04 | 2010-02-01 | Método para divisão de canais de sinal e utilização para o aperfeiçoamento vocal utilizando a eletrolaringe |
Country Status (10)
| Country | Link |
|---|---|
| US (1) | US20120004906A1 (pt) |
| EP (1) | EP2394271B1 (pt) |
| JP (1) | JP5249431B2 (pt) |
| CN (1) | CN102341853B (pt) |
| AT (1) | AT507844B1 (pt) |
| CA (1) | CA2749617C (pt) |
| DK (1) | DK2394271T3 (pt) |
| ES (1) | ES2628521T3 (pt) |
| PT (1) | PT2394271T (pt) |
| WO (1) | WO2010088709A1 (pt) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105310806B (zh) * | 2014-08-01 | 2017-08-25 | 北京航空航天大学 | 具有语音转换功能的电子人工喉系统及其语音转换方法 |
| US20220293239A1 (en) * | 2019-09-24 | 2022-09-15 | Panasonic Intellectual Property Management Co., Ltd. | Recipe output method and recipe output system |
| WO2024158407A1 (en) * | 2023-01-24 | 2024-08-02 | Rowan University | Mitigation of malicious sonic attacks on voice-based computing devices |
Family Cites Families (20)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3746789A (en) * | 1971-10-20 | 1973-07-17 | E Alcivar | Tissue conduction microphone utilized to activate a voice operated switch |
| US3872250A (en) * | 1973-02-28 | 1975-03-18 | David C Coulter | Method and system for speech compression |
| US4139732A (en) * | 1975-01-24 | 1979-02-13 | Larynogograph Limited | Apparatus for speech pattern derivation |
| US4343969A (en) * | 1978-10-02 | 1982-08-10 | Trans-Data Associates | Apparatus and method for articulatory speech recognition |
| JPH03228097A (ja) * | 1989-12-22 | 1991-10-09 | Bridgestone Corp | 振動制御装置 |
| US5171930A (en) * | 1990-09-26 | 1992-12-15 | Synchro Voice Inc. | Electroglottograph-driven controller for a MIDI-compatible electronic music synthesizer device |
| JPH08265891A (ja) * | 1993-01-28 | 1996-10-11 | Tatsu Ifukube | 電気人工喉頭 |
| JP3451022B2 (ja) * | 1998-09-17 | 2003-09-29 | 松下電器産業株式会社 | 拡声音の明瞭度改善方法及び装置 |
| US20050004604A1 (en) | 1999-03-23 | 2005-01-06 | Jerry Liebler | Artificial larynx using coherent processing to remove stimulus artifacts |
| US6359988B1 (en) | 1999-09-03 | 2002-03-19 | Trustees Of Boston University | Process for introduce realistic pitch variation in artificial larynx speech |
| JP2001086583A (ja) * | 1999-09-09 | 2001-03-30 | Sentan Kagaku Gijutsu Incubation Center:Kk | 代用原音発生器とその制御方法 |
| US6975984B2 (en) | 2000-02-08 | 2005-12-13 | Speech Technology And Applied Research Corporation | Electrolaryngeal speech enhancement for telephony |
| US7708697B2 (en) | 2000-04-20 | 2010-05-04 | Pulmosonix Pty Ltd | Method and apparatus for determining conditions of biological tissues |
| US7191134B2 (en) * | 2002-03-25 | 2007-03-13 | Nunally Patrick O'neal | Audio psychological stress indicator alteration method and apparatus |
| CA2399159A1 (en) * | 2002-08-16 | 2004-02-16 | Dspfactory Ltd. | Convergence improvement for oversampled subband adaptive filters |
| WO2005031702A1 (en) * | 2003-08-11 | 2005-04-07 | Faculté Polytechnique de Mons | Method for estimating resonance frequencies |
| US20050281412A1 (en) * | 2004-06-16 | 2005-12-22 | Hillman Robert E | Voice prosthesis with neural interface |
| JP4568826B2 (ja) * | 2005-09-08 | 2010-10-27 | 株式会社国際電気通信基礎技術研究所 | 声門閉鎖区間検出装置および声門閉鎖区間検出プログラム |
| CN100576320C (zh) * | 2007-03-27 | 2009-12-30 | 西安交通大学 | 一种自动电子喉的电子喉语音增强系统与控制方法 |
| JP4327241B2 (ja) * | 2007-10-01 | 2009-09-09 | パナソニック株式会社 | 音声強調装置および音声強調方法 |
-
2009
- 2009-02-04 AT AT0019309A patent/AT507844B1/de not_active IP Right Cessation
-
2010
- 2010-02-01 WO PCT/AT2010/000032 patent/WO2010088709A1/de not_active Ceased
- 2010-02-01 PT PT107088825T patent/PT2394271T/pt unknown
- 2010-02-01 JP JP2011548504A patent/JP5249431B2/ja not_active Expired - Fee Related
- 2010-02-01 DK DK10708882.5T patent/DK2394271T3/en active
- 2010-02-01 EP EP10708882.5A patent/EP2394271B1/de not_active Not-in-force
- 2010-02-01 CN CN201080010113.XA patent/CN102341853B/zh not_active Expired - Fee Related
- 2010-02-01 ES ES10708882.5T patent/ES2628521T3/es active Active
- 2010-02-01 US US13/147,893 patent/US20120004906A1/en not_active Abandoned
- 2010-02-01 CA CA2749617A patent/CA2749617C/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| CN102341853A (zh) | 2012-02-01 |
| DK2394271T3 (en) | 2017-07-10 |
| US20120004906A1 (en) | 2012-01-05 |
| EP2394271B1 (de) | 2017-03-22 |
| ES2628521T3 (es) | 2017-08-03 |
| JP2012517031A (ja) | 2012-07-26 |
| CN102341853B (zh) | 2014-06-04 |
| CA2749617C (en) | 2016-11-01 |
| AT507844B1 (de) | 2010-11-15 |
| JP5249431B2 (ja) | 2013-07-31 |
| EP2394271A1 (de) | 2011-12-14 |
| WO2010088709A1 (de) | 2010-08-12 |
| AT507844A1 (de) | 2010-08-15 |
| CA2749617A1 (en) | 2010-08-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Liu et al. | Electrolarynx in voice rehabilitation | |
| JP2017142485A (ja) | ヘッドセットユーザの音声活動の存在又は不存在に応じてアクティブノイズコントロール、閉塞防止制御、及び、受動減衰相殺を伴うオーディオヘッドセット | |
| US9288593B2 (en) | Visually-based fitting of hearing devices | |
| Maruri et al. | V-speech: Noise-robust speech capturing glasses using vibration sensors | |
| KR20110107833A (ko) | 이어피스를 위한 음향의 인이어 검출 | |
| JP2012231468A (ja) | 特に「ハンズフリー」電話システム向けの近接音声信号を雑音除去するための手段を有するマイクロホンとイヤホンの組合せ型のオーディオ・ヘッドセット | |
| KR101963871B1 (ko) | 소리 제어를 통한 지각 능력 향상 장치 및 방법 | |
| WO2022231977A1 (en) | Recovery of voice audio quality using a deep learning model | |
| WO2019079948A1 (en) | HEADER AND METHOD FOR PERFORMING AN ADAPTIVE SELF-ACCORD FOR A HEADPHONES | |
| Pandey et al. | Enhancement of alaryngeal speech using spectral subtraction | |
| JP7576780B2 (ja) | 耳装着型デバイス、及び、再生方法 | |
| PT2394271T (pt) | Método para divisão de canais de sinal e utilização para o aperfeiçoamento vocal utilizando a eletrolaringe | |
| JP6764125B2 (ja) | 音響出力装置 | |
| US12495241B2 (en) | Apparatus and method for treating misophonia | |
| KR102184649B1 (ko) | 치과 치료용 소리 제어 시스템 및 방법 | |
| US20040158431A1 (en) | Medical hearing aid analysis system | |
| WO2020208926A1 (ja) | 信号処理装置、信号処理方法及びプログラム | |
| CN115398934A (zh) | 再现音频信号时主动抑制闭塞效应的方法、装置、耳机及计算机程序 | |
| JP7052814B2 (ja) | 信号処理装置 | |
| KR100778143B1 (ko) | 후두 임피던스 신호를 이용하는 넥마이크를 구비한 골도헤드셋 | |
| JP2012194510A (ja) | 音声処理装置 | |
| KR100681484B1 (ko) | 인공 후두장치 | |
| Kabir et al. | Enhancement of alaryngeal speech utilizing spectral subtraction and minimum statistics | |
| Irvin | Toward Natural Singing Via External Prosthesis | |
| CN120303954A (zh) | 语音处理系统、语音处理方法以及程序 |