PT1264303E - Processamento de voz - Google Patents

Processamento de voz Download PDF

Info

Publication number
PT1264303E
PT1264303E PT01915443T PT01915443T PT1264303E PT 1264303 E PT1264303 E PT 1264303E PT 01915443 T PT01915443 T PT 01915443T PT 01915443 T PT01915443 T PT 01915443T PT 1264303 E PT1264303 E PT 1264303E
Authority
PT
Portugal
Prior art keywords
representation
filter
linear prediction
parameter
vector
Prior art date
Application number
PT01915443T
Other languages
English (en)
Inventor
Jani Rotola-Pukkila
Hannu Mikkola
Janne Vainio
Original Assignee
Nokia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=8557866&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=PT1264303(E) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Nokia Corp filed Critical Nokia Corp
Publication of PT1264303E publication Critical patent/PT1264303E/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Devices For Executing Special Programs (AREA)
  • Executing Machine-Instructions (AREA)

Description

1
DESCRIÇÃO "PROCESSAMENTO DE VOZ" A invenção refere-se genericamente à tecnologia da descodificação digital de voz codificada. A invenção refere-se especialmente à tecnologia da geração de um sinal de saida de frequência de banda larga a partir de um sinal de entrada codificado de frequência de banda estreita.
Os sistemas telefónicos digitais têm-se baseado tradicionalmente em procedimentos de codificação e descodificação de voz estandardizados, com ritmos de amostragem fixos, a fim de garantirem a compatibilidade entre pares transmissor-receptor arbitrariamente seleccionados. A evolução de redes celulares digitais de segunda geração e os seus terminais de funcionalidades aperfeiçoadas resultaram numa situação em que não pode ser garantida uma total compatibilidade de um para um, no que se refere aos ritmos de amostragem, isto é, o codificador de voz do terminal transmissor pode usar um ritmo de amostragem de entrada, que é diferente do ritmo de amostragem de saida do codificador de voz no terminal.
Também a previsão linear ou análise PB (LP - Low Pass -Passa-Baixos) do sinal de voz original pode ser executada num sinal que possui uma banda de frequências mais estreita do que o verdadeiro sinal de entrada, devido a restrições de complexidade. 0 descodificador de voz do terminal de recepção avançado tem de ser capaz de gerar um filtro PB com uma banda de frequências mais larga do que a utilizada na análise e de produzir um sinal de saida de banda larga a partir de parâmetros de entrada de banda estreita. A geração de um filtro PB de banda larga a partir da 2 informação de banda estreita existente possui também uma capacidade de aplicação mais vasta. A Figura 1 ilustra um principio conhecido para a conversão de um sinal de voz codificado de banda estreita numa corrente de amostras codificadas de banda larga, que pode ser usado na síntese da voz com um ritmo de amostragem elevado. Na extremidade transmissora um sinal de voz original foi sujeito a uma filtragem passa-baixos (LPF -Low Pass Filtering) no bloco 101. O sinal resultante, numa sub-banda de baixa-frequência foi codificado num codificador de banda estreita 102. Na extremidade receptora o sinal codificado é introduzido num descodificador de banda estreita 103, cuja saída é uma corrente de amostras, que representa a sub-banda de baixa-frequência com um ritmo de amostragem relativamente baixo. A fim de aumentar o ritmo da amostragem, o sinal é recebido num interpolador de ritmos de amostragem 104.
As frequências mais elevadas, que estão em falta a partir do sinal, são calculadas tomando-se o filtro PB (não representado separadamente) do bloco 103 e utilizando-o para implementar um filtro PB como parte de um codificador de voz 105, o qual utiliza um sinal de ruído branco como sua entrada. Por outras palavras, a curva da resposta de frequência do filtro PB na sub-banda de baixa-frequência é esticada na direcção do eixo da frequência, para cobrir uma banda de frequências mais larga, na geração de uma sub-banda de alta frequência sinteticamente produzida. A energia do ruído branco é ajustada de modo a que a energia da saída do codificador de voz seja apropriada. A saída do codificador de voz 105 é filtrada por passa-altos (HPF -High Pass Filter - Filtro Passa-Altos) no bloco 106, a fim 3 de se evitar uma sobreposição excessiva com o verdadeiro sinal de voz na sub-banda de baixa-frequência. As sub-bandas de baixa e alta-frequência são combinadas no bloco de adição 107 e a combinação é levada para um sintetizador de voz (não representado) para a geração do sinal acústico de saída final.
Pode-se considerar uma situação exemplar, em que o ritmo de amostragem original do sinal de voz foi de 12,8 kHz e o ritmo de amostragem à saída do descodificador deveria ser de 16 kHz. A análise PB foi executada para frequências de entre 0 e 6400 Hz, isto é de zero à frequência de Nyquist, que é metade do ritmo de amostragem original. Consequentemente o descodificador de banda estreita 103 implementa um filtro PB, cuja resposta de frequência abrange entre 0 e 6400 Hz. A fim de se gerar a sub-banda de alta-frequência, a resposta de frequência do filtro PB é esticada no codificador de voz 105 de modo a cobrir uma banda de frequências entre 0 e 8000 Hz, onde o limite superior é agora a frequência de Nyquist em relação ao desejado ritmo mais elevado de amostragem.
Um determinado grau de sobreposição é geralmente desejável, embora não seja necessário, entre as sub-bandas de baixa e alta-frequência; a sobreposição pode auxiliar a conseguir-se uma qualidade áudio subjectiva óptima. Vamos assumir que uma sobreposição de 10% (isto é, 800 Hz) constitui o objectivo a atingir. Isso significa que no descodificador de banda estreita 103 toda a resposta de frequência de 0 a 6400 Hz (isto e, 0 - 0,5FS = 12,8 kHz) do filtro PB é utilizada e no codificador de voz 105 efectivamente apenas a resposta de frequência de 5600 a 8000 Hz (isto é, 0,35FS - 0,5FS com o ritmo de amostragem Fs = 16 kHz) do filtro PB 4 é usada. Aqui "efectivamente" significa que, por causa do filtro passa-altos 106, a extremidade inferior da resposta de frequência não tem qualquer efeito sobre a saída do ramo superior do processamento do sinal. A resposta de frequência do filtro PB de banda larga na gama dos 5600 a 8000 Hz é uma cópia esticada da resposta de frequência do filtro PB de banda estreita na gama de 4480 a 6400 Hz.
Os inconvenientes das disposições de acordo com a técnica anterior tornam-se notados numa situação em que a resposta de frequência do filtro PB de banda estreita tem um pico na sua região superior, próxima da frequência de Nydquist original. A Figura 2 ilustra tal situação. A curva a traço fino 201 representa a resposta de frequência de um filtro LB de 0 a 8000 Hz, que seria usada na análise de um sinal de voz com um ritmo de amostragem de 16 kHz. A curva a traço cheio 202 representa a resposta de frequência combinada que a disposição da Figura 1 produziria. As linhas tracejadas 203 e 204 a 4480 Hz e 6400 Hz delimitam respectivamente a porção da resposta de frequência de um filtro PB de banda estreita, que é copiada e esticada para o intervalo entre 5600 Hz e 8000 Hz no filtro PB de banda larga implementado no codificador de voz. Um pico a aproximadamente 4400 Hz na resposta de frequência de banda estreita e uma descida continua a partir daí em direcção ao limite superior da banda de frequências, faz com que a curva de resposta de frequências combinadas 202 difira notavelmente da resposta de frequência 201 de um filtro PB de banda larga ideal. São conhecidas diversas disposições da técnica anterior para complementar o princípio da Figura 1, a fim de ultrapassar o inconveniente acima apresentado. A publicação 5 da patente US 5.978.759 descreve um dispositivo destinado a expandir a voz de banda estreita para voz em banda larga por meio da utilização de um livro de códigos ou tabela de consultas. Um conjunto de parâmetros caracteristico do filtro LB de banda estreita são extraídos e levados como uma chave de procura para uma tabela de consultas, de modo que os parâmetros característicos do correspondente filtro PB de banda larga podem ser lidos a partir da entrada correspondente ou aproximadamente correspondente na tabela de consultas. Uma solução semelhante é conhecida através da publicação de patente número JP 10124089A. Uma abordagem ligeiramente diferente é conhecida da publicação da patente número US 5.455.888, onde as frequências mais elevadas são geradas por meio da utilização de um banco de filtros que, no entanto, é seleccionado por meio da utilização de uma espécie de tabela de consulta. A publicação de patente número US 5.581.652 propõe a reconstrução de voz de banda larga a partir de voz de banda estreita por meio da utilização de livros de códigos, de modo que é explorada a natureza de forma de onda dos sinais. Além disso, no pedido de patente internacional publicado número WO 99/49454A1 é descrito um processo, em que o sinal de voz é transformado em domínio de frequência, os picos característicos do sinal do domínio de frequência são identificados e é seleccionado um conjunto de parâmetros de filtro de banda larga com base numa tabela de conversão. Uma publicação WO 98/57436 sugere a replicação espectral para gerar um sinal de banda mais alta por meio da transposição de uma parte adequada do sinal de banda inferior. 0 uso de uma tabela de consulta na busca das características de um filtro de banda larga adequado pode ajudar a evitar desastres do tipo dos mostrados na Figura 6 2, mas simultaneamente envolve um considerável grau de inflexibilidade. Podem ser implementados, ou apenas um número limitado de possíveis filtros de banda larga ou uma memória muito grande tem de ser atribuída apenas para este fim. Aumentando o número de configurações de filtros de banda larga armazenados para escolher aumenta também o tempo que tem de ser atribuído para a busca e o estabelecimento de qual o correcto, o que não é desejável no funcionamento em tempo real, como é o da telefonia de voz .
Constitui um objecto da presente invenção apresentar um descodificador de voz e um processo para descodificar a voz, onde a expansão de uma banda de frequências é feita de uma maneira flexível, que é económica em termos de computação e imita bem as características que seriam obtidas pela utilização à partida de uma largura de banda mais larga.
Os objectos da invenção são atingidos por meio da geração de um filtro PB de banda larga a partir de um de banda estreita, de modo que a extrapolação com base em determinadas regularidades é utilizada nos pólos do filtro PB de banda estreita.
De acordo com a invenção, um dispositivo e um processo de tratamento de voz são, respectivamente, definidos nas Reivindicações 1 e 9.
Existem diversas formas de apresentação bem conhecidas para os filtros PB. É especialmente conhecida uma chamada representação de domínio de frequência, onde um filtro PB pode ser representada com um vector de FEL (LSF - Line 7
Spectral Frequency - Frequência Espectral de Linha). A representação do domínio de frequência tem a vantagem de ser independente do ritmo de amostragem.
De acordo com a invenção um filtro PB de banda estreita é dinamicamente usado como base para a construção de um filtro PB de banda larga por meio de extrapolação. A invenção envolve especialmente a conversão do filtro PB de banda estreita na sua representação do domínio de frequência e a formação de uma representação de domínio de frequência de um filtro PB de banda larga por meio da extrapolação da do filtro PB de banda estreita. Um filtro RI I (I IR - Infinite Impulse Response - Resposta de Impulso Infinito) de uma ordem suficientemente elevada é preferivelmente usado para a extrapolação, a fim de tirar vantagem das regularidades características do filtro PB de banda estreita. A odem do filtro PB de banda larga é seleccionada, de preferência, de modo que a relação entre as ordens dos filtros PB de banda larga e de banda estreita seja praticamente igual à relação entre as frequências de amostragem de banda larga e de banda estreita. Um determinado conjunto de coeficientes é necessário para o filtro RI I; de preferência estes são obtidos por meio da análise da auto-correlação de um vector de diferença, que reflecte as diferenças entre elementos adjacentes na representação do vector do filtro PB de banda estreita. A fim de assegurar que o filtro PB de banda larga não dá origem a uma amplificação excessiva, próxima da frequência de Nyquist, é vantajoso colocar determinadas limitações ao(s) ultimo(s) elemento(s) da representação do vector do filtro PB de banda larga. Especialmente a diferença entre o último elemento da representação do vector e a frequência 8 de Nyquist, proporcionada à frequência de amostragem, deverá manter-se aproximadamente a mesma. Estas limitações são facilmente definidas através de definições diferenciais de modo que a diferença entre elementos adjacentes , na representação do vector, seja controlada.
As caracteristicas novas, que são consideradas como caracteristicas da invenção, são apresentadas em particular nas reivindicações anexas. A própria invenção, no entanto, tanto no que se refere à sua construção como ao seu processo de funcionamento, juntamente com objectos e vantagens adicionais da mesma, serão melhor entendidos a partir da descrição que se segue de formas de realização especificas, quando lidas em conjugação com os desenhos juntos. A Fig.1 ilustra um descodificador de voz conhecido, A Fig.2 mostra uma resposta de frequência desvantajosa de um filtro PB de banda larga conhecido. A Fig.3a ilustra o princípio da invenção, A Fig.3b ilustra a aplicação do princípio da Fig.3a a um descodificador de voz, A Fig.4 mostra um pormenor da dispositivo da Fig.3b, A Fig.5 mostra um pormenor do dispositivo da Fig.4, A Fig.6 mostra uma resposta de frequência vantajosa de um filtro PB de acordo com a invenção e 9 A Fig.7 ilustra um radiotelefone digital de acordo com uma forma de realização da invenção.
As Figuras 1 e 2 foram descritas no âmbito da descrição da técnica anterior, de maneira que a descrição da invenção, que se segue e as suas formas de realização vantajosas se concentram nas Figuras 3a a 6. Os mesmos indicadores de referência são utilizados nos desenhos para partes semelhantes. A Fig.3a ilustra a utilização de um sinal de entrada de banda estreita num bloco de extracção 310. Os parâmetros do filtro LB de banda estreita são levados para um bloco de extrapolação 301 onde a extrapolação é usada para produzir os parâmetros de um filtro LB de banda larga correspondente. Estes são levados para um codificador de voz 105, o qual utiliza alguns sinais de banda larga como sua entrada. O codificador de voz 105 gera um filtro LB de banda larga a partir dos parâmetros e utiliza-os para converter o sinal de entrada de banda larga num sinal de saída de banda larga. Também o bloco de extracção 310 pode fornecer uma saída, a qual é uma saída de banda estreita. A Fig.3b mostra como o princípio da Fig.3a pode ser aplicado a um descodificador de voz que sob outros aspectos é conhecido. Uma comparação entre a Fig.l e a Fig.3b mostra a adição trazida através da invenção, a um princípio, que noutros aspectos é conhecido, para converter um sinal de voz codificado de banda estreita numa corrente descodificada de amostras de banda larga. A invenção não tem qualquer efeito na extremidade transmissora: o sinal de voz original é filtrado passa-baixos no bloco 101 e o sinal resultante, numa sub-banda de baixa-frequência, é 10 codificado num codificador de banda estreita 102. Também o ramo inferior da extremidade receptora pode bem ser o mesmo: o sinal codificado é introduzido num descodificador de banda estreita 103 e a fim de aumentar o ritmo de amostragem da sub-banda de baixa-frequência da sua saida, o sinal é levado para um interpolador de ritmos de amostragem 104. No entanto, o filtro PB de banda estreita utilizado no bloco 103 não é levado directamente para o codificador de voz 105 mas antes para um bloco de extrapolação 301, onde é gerado um filtro PB de banda larga. A curva da resposta de frequência do filtro PB na sub-banda de baixa-frequência não é simplesmente esticado até cobrir uma banda de frequências mais larga; nem as caracteristicas do filtro PB de banda estreita são usadas como chave de busca em qualquer livraria de filtros PB de banda larga anteriormente gerados. A extrapolação que é executada no bloco 301 significa a geração de um filtro PB de banda larga único e não apenas a selecção da correspondência mais aproximada de entre um conjunto de alternativas. É um processo verdadeiramente adaptativo, no sentido em que por meio da selecção de um algoritmo de extrapolação adequado é possivel assegurar uma relação única entre cada entrada de filtro PB de banda estreita e a correspondente saida de filtro PB de banda larga. O processo de extrapolação funciona mesmo quando pouco se sabe antecipadamente acerca dos filtros PB de banda estreita, que serão encontrados como informação de entrada. Isso constitui uma vantagem clara em relação a todas as soluções baseadas em tabelas de consulta, uma vez que tais tabelas apenas podem ser construídas quando é mais ou menos conhecido, em que categorias irão cair os filtros PB de banda estreita. Adicionalmente, o processo de extrapolação de acordo com a 11 invenção requer apenas uma quantidade limitada de memória, porque apenas o próprio algoritmo precisa de ser armazenado. A utilização do filtro LB de banda larga obtido do bloco 301 na geração de uma sub-banda de alta-frequência sinteticamente produzida pode seguir o padrão conhecido como tal da técnica anterior. Ruído branco é introduzido como dados de entrada no codificador de voz 105, o qual usa o filtro PB de banda larga na produção de uma corrente de amostras, que representa a sub-banda de alta-frequência. A energia do ruído branco é ajustada de modo que a energia da saída do codificador de voz seja apropriada. A saída do codificador de voz 105 é filtrada passa-altos no bloco 106 e as sub-bandas de baixa e alta-frequência são combinadas no bloco de combinação 107. A combinação está pronta para ser levada para um sintetizador de voz (não representado) para gerar o sinal acústico de saída final. A Fig.4 Ilustra um exemplo de uma forma de implementar o bloco de extrapolação 301. Um bloco de conversão de PB para FEL 401 converte o filtro PB de banda estreita obtido do descodificador 103 em domínio de frequência. A verdadeira extrapolação é efectuada no domínio da frequência por um bloco extrapolador 402. A sua saída está acoplada a um bloco de conversão de FEL para LB 403, o qual executa uma conversão invertida, quando comparada com a efectuada no bloco 401. Adicionalmente há, acoplado entre a saída do bloco 403 e uma entrada de controlo do codificador de voz 105, um bloco controlador do ganho 404, cuja tarefa é escalar o ganho do filtro PB de banda larga para um nível apropriado. 12 A Fig.5 ilustra um exemplo de uma forma de implementar o extrapolador 402. A sua entrada está acoplada à saida do bloco de conversão LB para FEL 401, de modo que uma representação de vector fn do filtro LB de banda estreita é obtida como entrada para o extrapolador 402. A fim de executar a extrapolação, um filtro de extrapolação é gerado por meio da análise do vector fn num bloco gerador de filtro 501. O filtro pode também ser descrito com um vector, que aqui é indicado como o vector b. Por meio da utilização do filtro gerado no bloco 501, a representação do vector fn do filtro LB de banda estreita, é convertida para uma representação de vector fw do filtro LB de banda larga no bloco 502. Finalmente, para se poder garantir que o filtro PB de banda larga não inclui excessiva amplificação, próxima da frequência de Nyquist, em relação ao ritmo de amostragem mais elevado, a representação do vector fw do filtro LB de banda larga é sujeita a determinadas funções limitadoras no bloco 503, antes de passar para o bloco de conversão de FEL para PB 403.
Iremos agora fornecer uma análise pormenorizada das operações executadas nos diversos blocos funcionais introduzidos acima, nas Figs. 4 e 5. Toma-se como um facto que o descodificador 103 implementa e utiliza um filtro PB no decurso da descodificação do sinal de voz de banda estreita. Este filtro PB é designado como o filtro PB de banda estreita e caracteriza-se através de um conjunto de coeficientes de filtro PB. É igualmente um facto que praticamente todos os descodificadores de voz de alta qualidade (e codificadores) usam determinados vectores conhecidos como vectores FEL e FEI para quantificar os coeficientes de filtro PB, de modo que funcionalmente a conversão de LB para FEL apresentada como bloco 401 na 13
Fig.4 pode mesmo ser uma parte do descodificador 103. Ao longo de toda esta descrição falamos acerca de vectores FEL por uma questão de consistência, mas é evidente para um técnico do ramo a forma de aplicar a descrição e também o uso dos vectores FEL.
Os vectores FEL podem ser representados, tanto no domínio dos co-senos, onde o vector é de facto chamado o vector de PEL (LSP - Line Spectral Pair - Par Espectral de linha) , como no domínio da frequência. A representação do domínio dos co-senos (o vector PEL) está dependente do ritmo de amostragem mas a representação do domínio da frequência não está, por isso se, por exemplo, o descodif icador 103 for algum tipo de descodif icador de voz comercial, que apenas oferece um vector FEL como informação de entrada ao bloco de extrapolação 301, é preferível converter primeiramente o vector PEL num vector FEL. A conversão é facilmente executada de acordo com a conhecida fórmula f fu(i)^orccos{(i„(i))—J^O -1. <í> π onde o índice n indica geralmente "banda estreita", fn(i) é o i:° elemento do vector FEL de banda estreita, q„(i) é o i;° elemento do vector PEL de banda estreita. FSrI1 é o ritmo de amostragem de banda estreita e nn é a ordem do filtro PB de banda estreita. Seguindo a definição dos vectores PEL e FEL, nn é também o número de elementos nos vectores PEL e FEL de banda estreita.
Na forma de realização apresentada nas Figs. 3b, 4 e 5, a verdadeira extrapolação tem lugar no bloco 502 por meio da utilização de um filtro de extrapolação de La ordem gerado 14 no bloco 501. Por agora apenas se assume que o bloco 501 fornece ao bloco 502 um vector de filtro b; voltaremos mais tarde à geração do vector de filtro. Uma fórmula vantajosa para gerar o vector FEL de banda larga fw é s .....»„ (2í /Λ*)-* ~ .....«» ~1 onde o índice w indica geralmente "banda larga", fw(i) é o i:° elemento do vector FEL de banda larga, k é um índice de soma, L é a ordem do filtro de extrapolação e b(J-l)-k) é o ((j—1)—k)0 elemento do vector do filtro de extrapolação. Por outras palavras, o número de elementos que há no vector FEL de banda larga é exactamente o mesmo do início do vector FEL de banda larga. O resto dos elementos do vector FEL de banda larga é calculado de modo que cada novo elemento seja uma soma ponderada dos elementos L anteriores no vector FEL de banda larga. Os elementos de ponderação são os elementos do vector de filtro de extrapolação na ordem convolucional, de modo que no cálculo de f„(i), o elemento fw(i-L) que é o elemento anterior mais distante, que contribui para a soma, é ponderado com b(L-l) e o elemento fw(i-l) , que é o elemento anterior mais próximo, que contribui para a soma, é ponderado com b(0). A fórmula de extrapolação (2) não limita o valor de nw , isto é, a ordem do filtro PB de banda larga. Para se preservar a precisão da extrapolação, é vantajoso seleccionar os valores de n„ de modo que 15 15 (3) f
* Λ, IV
F Α S */ί ο que significa que as ordens dos filtros PB são escalonadas de acordo com as magnitudes relativas das frequências de amostragem. A exigência de que o filtro PB de banda larga não deva produzir uma amplificação excessiva nas frequências próximas da frequência de Nyquist 0,5FS,W pode ser formulada com a ajuda da diferença entre o último de cada vector de filtro PB e a correspondente frequência de Nyquist, em que a diferença é ainda escalada com a frequência de amostragem, de acordo com a fórmula o-st.„ -/.k -1) _ 0-51, -/„(«„ - i) F “ r · ' '.*·» · s.n
As limitações fornecidas acima (3) e (4) ao filtro PB de banda larga restringem a selecção de nw e a definição do filtro de extrapolação. Exactamente como é que as restrições são implementadas é uma matéria de rotina de experimentação oficinal. Uma abordagem vantajosa é definir um vector de diferença D de modo que £(*)“/«(*')-/«{*“ O** *«*.....i5) e limitar um tanto o vector de diferença, por exemplo exigindo que nenhum elemento D (k) presente no vector de diferença D possa ser maior do que um valor limite predeterminado, ou que a soma dos elementos elevados ao 16 quadrado (D(k))2 do vector de diferença D não possa ser maior do que um determinado valor limite. Um filtro PB tem tipicamente caracteristicas ou de filtro passa-baixos ou de filtro passa-altos, não caracteristicas de filtro passa-bandas ou de paragem de bandas. 0 valor limite predeterminado pode ter uma relação com esse facto, de tal maneira que se o filtro PB de banda estreita tiver caracteristicas de filtro passa-baixos, o valor limite é aumentado. Se, por outro lado, o filtro PB de banda estreita tiver caracteristicas de passa-altos, o valor limite é reduzido. Outras limitações aplicáveis, que se referem ao vector de diferença D, são facilmente detectáveis pelos técnicos do ramo.
Descrever-se-ão a seguir algumas maneiras vantajosas de gerar o vector de filtro b. As localizações dos pólos do filtro PB tendem a ter alguma relação uma com a outra, de modo que o vector de diferença D, cujos elementos descrevem a diferença entre elementos de vector PB adjacentes, compreende uma determinada regularidade. Pode-se calcular uma função de auto-correlação
onde
(6) (?) e encontrar o seu máximo, isto é, o valor do índice k, que produz o mais elevado grau de auto-correlação. Podemos 17 indicar esse valor de índice k como m. Uma forma vantajosa de definir o vector de filtro b é então j U*0 l?(k) f8> | L& » m- 1
J \ -1. k ~ w [ 0Λ £ l,m)
Desta maneira o vector de filtro b segue a regularidade do filtro PB de banda estreita. Mesmo os novos elementos do filtro PB de banda larga extrapolado herdam esta característica através da utilização do filtro b no processo de extrapolação. É naturalmente possível que a função de auto-correlação (6) não tenha um máximo claro. Para tomar esses casos em consideração podemos definir que o vector de filtro de extrapolação b deve modelar todas as regularidades no filtro PB de banda estreita de acordo com a sua importância. A auto-correlação pode ser usada como um veículo para tal definição, por exemplo de acordo com a fórmula |i acb(*-i)-4Cb(*) *(*)= 1-—..........— i .*•=0.* * I, t-1 (9) A definição mais geral (9) converge para a definição mais simples fornecida acima (8) se houver um pico máximo claro na função de auto-correlação. 18 0 vector FEL, representação do filtro PB de banda larga, está pronto para ser convertido num filtro PB de banda larga real, que pode ser usado para processar sinais que possuem um ritmo de amostragem FS/W. Para os casos em que o vector PEL, representação do filtro PB de banda larga, seja preferível, pode ser executada uma conversão de FEL para PEL de acordo com a fórmula
UOJ
Deverá notar-se que o domínio co-seno em que a conversão (10) é executada possui a frequência de Nyquist a 0,5FSfW enquanto que o domínio co-seno do qual foi feita a conversão de banda estreita (1) tinha uma frequência de Nyquist de 0,5Fs.n. O ganho geral do filtro PB de banda larga obtido tem de ser ajustado de uma maneira que é conhecida das soluções da técnica anterior. O ajustamento do ganho pode ter lugar no bloco de extrapolação 301, conforme se mostra no sub-bloco 404 na Fig.4, ou pode fazer parte do codificador de voz 105. Como diferença em relação à solução da técnica anterior da Fig.l, pode notar-se que o ganho geral do filtro PB de banda larga, gerado de acordo com a invenção, pode ser deixado ser maior do que o do filtro PB de banda larga da técnica anterior, porque grandes divergências da resposta de frequência ideal, como a que é mostrada na Fig.2, não é provável que ocorram e não há necessidade de se criarem defesas contra elas. 19 A Fig.6 ilustra uma frequência de resposta típica 601, que poderia ser obtida com um filtro PB de banda larga gerado por meio de extrapolação de acordo com a invenção. A resposta de frequência 601 segue muito aproximadamente a curva ideal 201, que representa a resposta de frequência de um filtro PB de 0 a 8000 Hz, o qual seria utilizado na análise de um sinal de voz com um ritmo de amostragem de 16 kHz. A abordagem de extrapolação tende a modelar as tendências de uma escala maior do espectro de amplitude com bastante precisão e localiza correctamente os picos na resposta de frequência. Uma vantagem significativa da invenção em relação à disposição da técnica anterior representada nas Figs. 1 e 2 é também que a resposta de frequência do filtro PB de banda larga é contínua, isto é, não tem quaisquer modificações instantâneas na magnitude, como a dos 5600 Hz da resposta de frequência do filtro PB de banda larga da técnica anterior.
Um descodificador de voz apenas, não é suficiente para traduzir o espírito da invenção em vantagens concebíveis para u utilizador humano. A Fig.7 ilustra um radiotelefone digital, em que uma antena 701 está acoplada a um filtro duplex 702, o qual por sua vez está acoplado, tanto a um bloco de recepção 703 como a um bloco transmissor 704, para receber e transmitir digitalmente voz codificada através de uma interface rádio. O bloco de recepção 703 e o bloco de transmissão 704 estão ambos acoplados a um bloco de controlo 707 para encaminharem, respectivamente, informação de controlo recebida e informação de controlo a ser transmitida. Adicionalmente, o bloco de recepção 703 e o bloco de transmissão 704 estão acoplados a um bloco de banda de base 705, o qual compreende a função de frequência de banda de base para o processamento, respectivamente, da 20 voz recebida e da voz a ser transmitida. 0 bloco de banda de base 705 e o bloco de controlo 707 estão acoplados a uma interface de utilizador 706, a qual tipicamente é constituída por um microfone, um altifalante, um teclado e um visor (não especificamente representados na Fig.7).
Uma parte do bloco da banda de base 705 está representada na Fig.7 em mais pormenor. A última parte do bloco de recepção 703 é um descodificador de canais, cuja saída é constituída por quadros de voz de canal descodificado, que necessitam de ser sujeitos a uma descodificação e síntese de voz. Os quadros de voz obtidos do descodif icador de canais são temporariamente armazenados numa memória temporária de quadros 710 e lidos a partir dela para o próprio descodificador de voz 711. Este último implementa um algoritmo de descodificação de voz lido a partir de uma memória 712. De acordo com a invenção, quando o descodif icador de voz 711 verifica que o ritmo de amostragem de um sinal de voz que entra deve ser elevado, emprega um processo de extrapolação de filtro PB descrito acima para produzir o filtro PB de banda larga necessário para a geração da sub-banda de alta frequência sinteticamente produzida.
Tipicamente, o bloco de banda de base 705 é um CIEA (ASIC -Application Specific Integrated Circuit - Circuito Integrado Especifico da Aplicação). A utilização da invenção ajuda a reduzir a complicação e o consumo de energia do CIEA porque apenas uma quantidade limitada de memória e um número fraccional de acessos de memória são necessários para a utilização do descodificador de voz, especialmente quando comparados com os da técnica anterior, onde grandes tabelas de consulta eram usadas para armazenar 21 uma variedade de filtros PB de banda larga previamente calculados. A invenção não coloca exigências excessivas ao desempenho do CIEA porque os cálculos acima descritos são relativamente fáceis de executar.
Lisboa, 23 de Novembro de 2006

Claims (17)

1 REIVINDICAÇÕES 1. Dispositivo de processamento de voz, constituído por uma entrada para receber um sinal codificado de previsão linear de voz, que representa uma primeira banda de frequências, meios (103, 310) para extrair, do sinal codificado de previsão linear de voz, informação que descreve um primeiro filtro de previsão linear associado à primeira banda de frequências e um codificador de voz (105) para converter um sinal de entrada num sinal de saída, que representa uma segunda banda de frequências, o qual compreende meios (301) para gerar um segundo filtro de previsão linear, a ser utilizado pelo codificador de voz (105) na segunda banda de frequências, por meio da extrapolação da representação de um vector do primeiro filtro de previsão linear, em que a referida extrapolação envolve a utilização de elementos de vector obtidos de uma auto-correlação de um vector de diferença, cujos elementos descrevem a diferença entre coeficientes de domínio de frequências adjacentes do primeiro filtro de previsão linear.
2. Dispositivo de processamento de voz de acordo com a Reivindicação 1, caracterizado pelo facto de compreender meios (401) para converter a informação, que descreve um primeiro filtro de previsão linear 2 numa primeira representação de parâmetros no domínio das frequências, meios (402) para extrapolar a referida primeira representação de parâmetros para uma segunda representação de parâmetros no domínio das frequências, e meios (403) para converter a referida segunda representação de parâmetros num segundo filtro de previsão linear.
3. Dispositivo de processamento de voz de acordo com a Reivindicação 2, caracterizado pelo facto de os referidos meios (402) para extrapolar a referida primeira representação de parâmetros para a segunda representação de parâmetros no domínio das frequências, compreender um filtro de resposta de impulso infinita (502).
4. Dispositivo de processamento de voz de acordo com a Reivindicação 3, caracterizado pelo facto de compreender meios (501) para derivar uma representação de vector do referido filtro de resposta de impulso infinita da referida representação do primeiro parâmetro.
5. Dispositivo de processamento de voz de acordo com a Reivindicação 2, caracterizado pelo facto de compreender meios (404, 503) para limitar a representação do referido segundo parâmetro.
6. Dispositivo de processamento de voz de acordo com a Reivindicação 1, caracterizado pelo facto de compreender 3 um descodificador (103) para converter a previsão linear de um sinal de voz codificado numa primeira corrente de amostras com um primeiro ritmo de amostragem e que representa uma primeira banda de frequências, um codificador de voz (105) para converter um sinal de entrada numa segunda corrente de amostras, que possui um segundo ritmo de amostragem e que representa uma segunda banda de frequências, meios de combinação (107) para combinar a primeira e a segunda correntes de amostras numa forma processada, e meios (301) para gerar um segundo filtro de previsão linear , a ser usado pelo codificador de voz (105) na segunda banda de frequências, com base num primeiro filtro de previsão linear, usado pelo descodificador (103) na primeira banda de frequências.
7. Dispositivo de processamento de voz de acordo com a Reivindicação 6, caracterizado pelo facto de compreender - um interpolador de ritmo de amostragem (104) acoplado entre o descodificador (103) e os meios de combinação (107) e - um filtro passa-altos (106) acoplado entre o codificador de voz (105) e os meios de combinação (107) . 4
8. Radiotelefone digital, caracterizado pelo facto de compreender um dispositivo de processamento de voz (711) de acordo com a Reivindicação 1.
9. Processo para processar digitalmente voz codificada, que compreende os passos de: extrair (103), da previsão linear de um sinal de voz codificado, informação que descreve um primeiro filtro de previsão linear com uma primeira banda de frequênciass e converter (105) um sinal de entrada num sinal de saída, que representa uma segunda banda de frequênciass, o que compreende a geração (301) de um segundo filtro de previsão linear, a ser usado na conversão do sinal de entrada no sinal de saída, por meio da extrapolação de uma representação de vector do primeiro filtro de previsão linear, em que a referida extrapolação envolve a utilização dos elementos do vector obtidos de uma auto-correlação de um vector de diferença, cujos elementos descrevem a diferença entre coeficientes de domínios de frequência adjacentes do primeiro filtro de previsão linear.
10. Processo de acordo com a Reivindicação 9, que compreende os passos de: - converter (103) um sinal codificado de previsão linear de voz numa primeira corrente de amostras, que tem o primeiro ritmo de amostragem e que representa uma primeira banda de frequências, 5 converter (105) um sinal de entrada numa segunda corrente de amostras, que possui um segundo ritmo de amostragem e que representa uma segunda banda de frequências, e combinar (107) as primeira e segunda correntes de amostras numa forma processada, caracterizado pelo facto de compreender o passo de: gerar (301) um segundo filtro de previsão linear, a ser usado pelo codificador de voz na segunda banda de frequências, com base no primeiro filtro de previsão linear usado pelo descodificador na sua primeira banda de frequências.
11. Processo de acordo com a Reivindicação 10, caracterizado pelo facto de compreender os passos de: converter (401) o primeiro filtro de previsão linear numa primeira representação de parâmetros no domínio das frequências, extrapolar (402) a referida primeira representação de parâmetros para uma segunda representação de parâmetros no domínio das frequências, e converter (403) a referida segunda representação de parâmetros, no segundo filtro de previsão linear.
12. Processo de acordo com a Reivindicação 10, caracterizado pelo facto de o passo de extrapolação (402) da referida representação do primeiro parâmetro para a segunda representação de parâmetros no domínio 6 das frequências, compreender o subpasso de filtrar (502) a referida primeira representação de parâmetros com um filtro de resposta de impulso infinito.
13. Processo de acordo com a reivindicação 12, caracterizado pelo facto de compreender o passo de calcular (501) uma representação de vector para o referido filtro de resposta de impulso infinito a partir de uma regularidade observada na representação do primeiro parâmetro.
14. Processo de acordo com a Reivindicação 13, caracterizado pelo facto de o passo de extrapolação (402) da referida primeira representação de parâmetros para a segunda representação de parâmetros no domínio das frequências, compreender o subpasso de determinar (502) os valores da referida segunda representação de parâmetros como
em que fw(i) é o i:° valor da referida representação do segundo parâmetro, k é um índice de soma, L é a ordem do referido filtro de resposta de impulso infinito e £>((i-l)-k) é o ((i-l)-k):0 elemento da representação do vector para o referido filtro de resposta de impulso infinito.
15. Processo de acordo com a Reivindicação 14, caracterizado pelo facto de compreender o subpasso de calcular (501) a representação do vector para o 7 referido filtro de resposta de impulso infinito, de maneira que 1,& =0
l,k ~ iw-1 «*1,λ « m e m é o valor do índice k que produz um valor máximo de uma função de auto-correlação ACÀk)~ Σ(οί0~^dÍP(í-*)« em que
» ·£>(»)=/.(*)-/.(*- i).t - 0,...¾ -í, fn(i)é o i:° elemento da primeira representação de parâmetros e nT1 é o número de elementos da primeira representação de parâmetros.
16. Processo de acordo com a Reivindicação 14, caracterizado pelo facto de compreender o subpasso de calcular (501) a representação do vector para o filtro de resposta de impulso infinito, de modo que 1 b(k) Í~1 δ em que 4C0(*) - Í(fl(<) - μΒχΐ3{ί-ί)-μΒ).ί = 1.....L,
D{k) = f,(k)-fÁk - l)-k = O·-»» ~ >» ún(i) é o i:° elemento da primeira representação do parâmetro e nri é o número de elementos da primeira representação do parâmetro.
17. Processo de acordo com a Reivindicação 14, caracterizado pelo facto de compreender o passo de limitar (503) a referida segunda representação do vector para preencher as condições
e
onde n„ é o número de elementos da segunda representação do parâmetro, nri é o número de elementos da primeira representação do parâmetro, Fs,w é a segunda frequência de amostragem, Fs,n é a primeira frequência de amostragem, fn(i) é o i:° elemento da primeira 9 representação do parâmetro e fw(i) é i:° elemento da segunda representação do parâmetro. Lisboa, 23 de Novembro de 2006
PT01915443T 2000-03-07 2001-03-06 Processamento de voz PT1264303E (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FI20000524A FI119576B (fi) 2000-03-07 2000-03-07 Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin

Publications (1)

Publication Number Publication Date
PT1264303E true PT1264303E (pt) 2007-01-31

Family

ID=8557866

Family Applications (1)

Application Number Title Priority Date Filing Date
PT01915443T PT1264303E (pt) 2000-03-07 2001-03-06 Processamento de voz

Country Status (15)

Country Link
US (1) US7483830B2 (pt)
EP (1) EP1264303B1 (pt)
JP (2) JP2003526123A (pt)
KR (1) KR100535778B1 (pt)
CN (1) CN1193344C (pt)
AT (1) ATE343835T1 (pt)
AU (1) AU2001242539A1 (pt)
BR (1) BRPI0109043B1 (pt)
CA (1) CA2399253C (pt)
DE (1) DE60124079T2 (pt)
ES (1) ES2274873T3 (pt)
FI (1) FI119576B (pt)
PT (1) PT1264303E (pt)
WO (1) WO2001067437A1 (pt)
ZA (1) ZA200205089B (pt)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3467469B2 (ja) * 2000-10-31 2003-11-17 Necエレクトロニクス株式会社 音声復号装置および音声復号プログラムを記録した記録媒体
US6889182B2 (en) 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
US8712768B2 (en) * 2004-05-25 2014-04-29 Nokia Corporation System and method for enhanced artificial bandwidth expansion
ATE406652T1 (de) * 2004-09-06 2008-09-15 Matsushita Electric Ind Co Ltd Skalierbare codierungseinrichtung und skalierbares codierungsverfahren
DE602004020765D1 (de) * 2004-09-17 2009-06-04 Harman Becker Automotive Sys Bandbreitenerweiterung von bandbegrenzten Tonsignalen
BRPI0515814A (pt) * 2004-12-10 2008-08-05 Matsushita Electric Ind Co Ltd dispositivo de codificação de banda larga, dispositivo de predição de lsp de banda larga, dispositivo de codificação de banda escalonável, método de codificação de banda larga
EP2107557A3 (en) * 2005-01-14 2010-08-25 Panasonic Corporation Scalable decoding apparatus and method
EP1864281A1 (en) * 2005-04-01 2007-12-12 QUALCOMM Incorporated Systems, methods, and apparatus for highband burst suppression
JP4899359B2 (ja) * 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US20140214431A1 (en) * 2011-07-01 2014-07-31 Dolby Laboratories Licensing Corporation Sample rate scalable lossless audio coding
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
BR122020015614B1 (pt) 2014-04-17 2022-06-07 Voiceage Evs Llc Método e dispositivo para interpolar parâmetros de filtro de predição linear em um quadro de processamento de sinal sonoro atual seguindo um quadro de processamento de sinal sonoro anterior
PT3136384T (pt) 2014-04-25 2019-04-22 Ntt Docomo Inc Dispositivo de conversão do coeficiente de previsão linear e método de conversão do coeficiente de previsão linear
KR102002681B1 (ko) * 2017-06-27 2019-07-23 한양대학교 산학협력단 생성적 대립 망 기반의 음성 대역폭 확장기 및 확장 방법
CN108198571B (zh) * 2017-12-21 2021-07-30 中国科学院声学研究所 一种基于自适应带宽判断的带宽扩展方法及系统
CN116110409B (zh) * 2023-04-10 2023-06-20 南京信息工程大学 一种ASIP架构的大容量并行Codec2声码器系统及编解码方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0685607A (ja) 1992-08-31 1994-03-25 Alpine Electron Inc 高域成分復元装置
JP2779886B2 (ja) 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
DE4343366C2 (de) 1993-12-18 1996-02-29 Grundig Emv Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen
JP3230791B2 (ja) 1994-09-02 2001-11-19 日本電信電話株式会社 広帯域音声信号復元方法
JP3230790B2 (ja) 1994-09-02 2001-11-19 日本電信電話株式会社 広帯域音声信号復元方法
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
DE69619284T3 (de) * 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
JP2798003B2 (ja) * 1995-05-09 1998-09-17 松下電器産業株式会社 音声帯域拡大装置および音声帯域拡大方法
JPH0955778A (ja) * 1995-08-15 1997-02-25 Fujitsu Ltd 音声信号の広帯域化装置
JP3301473B2 (ja) 1995-09-27 2002-07-15 日本電信電話株式会社 広帯域音声信号復元方法
EP0878790A1 (en) 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
EP0945852A1 (en) 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Speech synthesis
JP3541680B2 (ja) * 1998-06-15 2004-07-14 日本電気株式会社 音声音楽信号の符号化装置および復号装置
US6539355B1 (en) * 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
JP2000305599A (ja) * 1999-04-22 2000-11-02 Sony Corp 音声合成装置及び方法、電話装置並びにプログラム提供媒体
CN1335980A (zh) * 1999-11-10 2002-02-13 皇家菲利浦电子有限公司 借助于映射矩阵的宽频带语音合成

Also Published As

Publication number Publication date
DE60124079T2 (de) 2007-03-08
AU2001242539A1 (en) 2001-09-17
EP1264303A1 (en) 2002-12-11
JP2003526123A (ja) 2003-09-02
ES2274873T3 (es) 2007-06-01
WO2001067437A1 (en) 2001-09-13
DE60124079D1 (de) 2006-12-07
BRPI0109043B1 (pt) 2017-06-06
BR0109043A (pt) 2003-06-03
KR100535778B1 (ko) 2005-12-12
CN1416561A (zh) 2003-05-07
JP2007156506A (ja) 2007-06-21
KR20020081388A (ko) 2002-10-26
EP1264303B1 (en) 2006-10-25
CA2399253A1 (en) 2001-09-13
US20010027390A1 (en) 2001-10-04
CN1193344C (zh) 2005-03-16
FI20000524A0 (fi) 2000-03-07
FI20000524A (fi) 2001-09-08
JP4777918B2 (ja) 2011-09-21
ZA200205089B (en) 2003-04-30
FI119576B (fi) 2008-12-31
ATE343835T1 (de) 2006-11-15
US7483830B2 (en) 2009-01-27
CA2399253C (en) 2010-11-23

Similar Documents

Publication Publication Date Title
JP4777918B2 (ja) 音声処理装置及び音声を処理する方法
RU2469422C2 (ru) Способ и устройство для формирования уровня улучшения в системе кодирования звука
JP6636574B2 (ja) 雑音信号処理方法、雑音信号生成方法、符号化器、および、復号化器
TW412719B (en) Method and apparatus for reproducing speech signals and method for transmitting same
CN101512639B (zh) 用于语音/音频发送器和接收器的方法和设备
JP4864201B2 (ja) 音声信号の量子化ノイズをマスクするためのシステムと方法
RU2752127C2 (ru) Усовершенствованный квантователь
JP7297368B2 (ja) 周波数帯域拡張方法、装置、電子デバイスおよびコンピュータプログラム
JPS6161305B2 (pt)
JP2004101720A (ja) 音響符号化装置及び音響符号化方法
BRPI0607246B1 (pt) método para gerar uma seqüência de amostras de encobrimento com relação à transmissão de um sinal de áudio digitalizado, dispositivo de armazenamento de programa, e, arranjo para receber um sinal de áudio digitalizado
BRPI0715516A2 (pt) sistemas, mÉtodos e equipamentos para limitar fator de ganho
WO2011047578A1 (zh) 频带扩展方法及装置
WO2014190649A1 (zh) 信号解码方法及设备
KR102156846B1 (ko) 디지털 오디오 신호 내의 프리-에코의 효과적인 감쇠
TW200926148A (en) An encoder
Bhatt et al. A novel approach for artificial bandwidth extension of speech signals by LPC technique over proposed GSM FR NB coder using high band feature extraction and various extension of excitation methods
JP4734859B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP4574320B2 (ja) 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体
JP2005114814A (ja) 音声符号化・復号化方法、音声符号化・復号化装置、音声符号化・復号化プログラム、及びこれを記録した記録媒体
JPH0481199B2 (pt)
Gao et al. A 1.7 KBPS waveform interpolation speech coder using decomposition of pitch cycle waveform.
JPS60219823A (ja) 音声符号化装置および音声復号化装置
JPH0632033B2 (ja) 音声符号化方法
JPWO2009038170A1 (ja) 音声処理装置、音声処理方法、プログラム及び音楽・メロディ配信システム