BRPI0109043B1 - dispositivo de processamento de voz, e, método para processar a voz codificada digitalmente - Google Patents

dispositivo de processamento de voz, e, método para processar a voz codificada digitalmente Download PDF

Info

Publication number
BRPI0109043B1
BRPI0109043B1 BRPI0109043A BR0109043A BRPI0109043B1 BR PI0109043 B1 BRPI0109043 B1 BR PI0109043B1 BR PI0109043 A BRPI0109043 A BR PI0109043A BR 0109043 A BR0109043 A BR 0109043A BR PI0109043 B1 BRPI0109043 B1 BR PI0109043B1
Authority
BR
Brazil
Prior art keywords
filter
linear prediction
frequency band
parametric representation
representation
Prior art date
Application number
BRPI0109043A
Other languages
English (en)
Other versions
BR0109043A (pt
Inventor
Mikkola Hannu
Rotola-Pukkila Jani
Vainio Janne
Original Assignee
Nokia Corp
Nokia Technologies Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=8557866&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BRPI0109043(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Nokia Corp, Nokia Technologies Oy filed Critical Nokia Corp
Publication of BR0109043A publication Critical patent/BR0109043A/pt
Publication of BRPI0109043B1 publication Critical patent/BRPI0109043B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Devices For Executing Special Programs (AREA)
  • Executing Machine-Instructions (AREA)

Abstract

"dispositivo de processamento de voz, e, método para processar a voz codificada digitalmente." decodificador de voz compreende um decodificador (103) para converter o sinal de voz codificado de predição linear no primeiro fluxo de amostragem possuindo uma primeira taxa de amostragem e representando a primeira banda de freqüência. adicionalmente, este compreende um vocodificador (105) para converter um sinal de entrada em um segundo fluxo de amostragem possuindo a segunda taxa de amostragem e representando a segunda banda de freqüência, e um dispositivo combinador (107) para combinar o primeiro e o segundo fluxos de amostragem na forma processada. este compreende também um dispositivo (301) para gerar o segundo filtro de predição linear, a ser usado pelo vocodificador (105) na segunda banda de freqüência, com base no primeiro filtro de predição linear usado pelo decodificador (103) na primeira banda de freqüência. a extrapolação através de um filtro de resposta de impulso infinito é o método preferível para gerar o segundo filtro de predição linear.

Description

“DISPOSITIVO DE PROCESSAMENTO DE VOZ, E, MÉTODO PARA PROCESSAR A VOZ CODIFICADA DIG1TALMENTE”.
Campo da Invenção À invenção relaciona em geral a tecnologia de decodificaçao da voz codificada digi talmente. Especial mente a invenção relaciona a tecnologia de gerar uni sinal de saída decodificado de batida de frequência larga de um sinal de entrada codificado de banda de frequência estreita.
Descrição da Técnica Anterior Os sistemas de telefonia digitais têm tradicionalmente confiado na codificação de voz padronizada e nos procedimentos de decodificação com taxas de amostragens fixas, para assegurar a compatibilidade entre os pares transmíssor-receptor selecionados arbitrariamente. A evolução da segunda geração das redes celulares digitais e dos seus terminais aperfeiçoados funcional mente tem resultado em uma situação, onde uma compatibilidade um-para-um completa em relação às taxas de amostragem não podem ser garantidas, isto é, o codificador de voz no terminal de transmissão pode usar unia taxa de entrada de amostragem que é diferente da taxa de amostragem de saída do codificador de voz no terminal. Também, a predição linear ou a análise de PL do sinal de voz original pode ser executada em um sinal que lem uma banda de frequência mais estreita do que o sinal de entrada atual por acusa das restrições de complexidade. O decoditleador de voz de um terminal de recepção avançado deve ser capaz de gerar um filtro PL, com uma banda de frequência mais larga que a usada na análise, e produzir um sinal de saída de banda larga dos parâmetros de entrada de banda estreita. A geração de um filtro de PL de banda larga a partir da informação de banda estreita existente também tem uma aplicabilidade mais ampla. A FIGURA 1 ilustra um princípio conhecido para converter um sinal de voz codificado de banda estreita em um fluxo de amostragem decodificado de banda larga, que pode ser usado em síntese de voz com uma taxa de amostragem alta. Na extremidade de transmissão o sinal de voz original tem sido sujeito a filtro passa-baixo (FPB) no bloco 101. O sinal resultante em uma sub-banda de frequência baixa tem sido codificado em uni codificador de banda estreita 102. Na extremidade de recepção, o sinal codificado é alimentado em um decoditleador 103 de banda estreita, a saída do qual é um fluxo de amostragem que representa a sub-banda de frequência baixa com uma taxa de amostragem relativamente baixa. Para aumentar a taxa de amostragem, o sinal é levado ao interpolador de taxa de amostragem 104.
As frequências mais altas que são perdidas do sinal são tomando o filtro PL (não apresentado separadamente) do bloco 103 e usando este para implementar um filtro PL como uma parte do vocodificador 105, o qual usa um sinal de ruído branco como sua entrada. Em outras palavras, a curva de resposta de frequência do filtro PL na sub-banda de frequência baixa é esticada na direção do eixo de frequência para cobrir uma banda de frequência mais larga na geração de uma sub-banda de frequência alta produzida sinteticamente. A potência do ruído branco é ajustada de forma que a potência de saída do vocodificador seja apropriada. A saída do vocodificador 105 é aplicada a um filtro passa-alta (FPA) no bloco 106, para prevenir a sobreposição excessiva com o sinal de voz atual na sub-banda de frequência baixa. As sub-bandas de frequência baixas e altas são combinadas no bloco 107 de soma e a combinação é elevada a um sintetizador de voz (não apresentado) para gerar o sinal de saída acústico final.
Podemos considerar uma situação exemplar onde a taxa de amostragem original do sinal de voz era de 12.8 kHz e a taxa de amostragem à saída do codificador deveria ser de 16kHz. A análise de PL foi executada para as frequências de 0 a 6400 Hz, isto é de zero para a frequência de Nyquist, que é a metade da taxa de amostragem original. Por conseguinte, o decodificador de banda estreita 103 implementa um filtro PL de resposta de frequência, a qual abrange de 0 a 6400 kHz. Para gerar a sub-banda de frequência alta, a resposta de frequência do filtro de PL é esticada no vocodificador 105 para cobrir uma banda de frequência de 0 a 8000 Hz, onde o limite superior é agora a frequência de Nyquist relativa à taxa de amostragem mais alta desejada.
Um certo grau de sobreposição é normalmente desejável, embora não necessário, entre as sub-bandas de frequência baixas e altas; a sobreposição pode ajudar a alcançar uma quantidade de áudio subjetiva ótima. Vamos assumir a uma sobreposição de 10% (isto é, 800 Hz) é apontada. Isto significa que no decodificador 103 de banda estreita, a resposta de frequência total de 0 a 6400 Hz (isto é, 0 - 0.5 Fs com taxa de amostragem de FS=12.8 kHz) do filtro de PL é usada, e no vocodificador 105 efetivamente apenas a resposta de frequência de 5600 a 8000 Hz (isto é, 0.35 Fs - 0.5 Fs com a taxa de amostragem de Fs=16 kHz) do filtro de PL é usada. Aqui “efetivamente” significa que por causa do filtro de passagem alta 106, a extremidade inferior da resposta de frequência não tem um efeito na saída da ramificação do processamento de sinal superior. A resposta de frequência do filtro PL de banda larga na gama de 5600 a 8000 Hz é uma cópia esticada da resposta de frequência do filtro de PL de banda estreita na gama de 4480 a 6400 Hz.
As desvantagens da disposição da técnica anterior se tomam aparentes em uma situação onde a resposta de frequência do filtro de PL de banda estreita tem um cume em sua região superior, perto da frequência de Nyquist original. A FIGURA 2 ilustra tal situação. A curva fina 201 representa a resposta de frequência do filtro de PL de 0 a 8000 Hz que seria usado na análise de um sinal de voz com uma taxa de amostragem de 16 kHz. A curva 202 grossa representa a resposta de frequência combinada que a disposição da FIGURA 1 produziría. As linhas tracejadas 203 e 204 delimitam respectivamente a 4480 Hz e 6400 Hz a parte da resposta de frequência de um filtro de PL de banda estreita, que é copiado e estirado no intervalo de 5600 Hz a 8000 Hz no filtro de PL implementado no vodificador. Um cume de aproximadamente 4400 Hz na resposta de frequência de banda estreita e o contínuo declive deste para o limite superior da banda de frequência ocasiona uma curva de resposta de frequência combinada 202, a qual difere notavelmente da resposta de frequência 201 de um filtro de PL de banda larga ideal.
Várias disposições da técnica anterior são conhecidas para complementar o princípio da FIGURA 1, para superar a desvantagem apresentada acima. A publicação da patente US 5,978,759 descreve um aparelho para ampliar a voz de banda estreita para voz de banda larga, usando um livro de código e uma tabela de pesquisa. Um grupo de características de parâmetros para o filtro PL de banda larga é extraído e levado como uma chave de procura para a tabela de pesquisa, de forma que os parâmetros característicos do filtro de PL de banda larga correspondente podem ser lidos de uma entrada correspondente ou aproximadamente correspondente na tabela de pesquisa. Uma solução semelhante é conhecida do número de publicação patente JP 10124089A. Uma aproximação ligeiramente diferente é conhecida do número de publicação US 5,455,888, onde as frequências mais altas são geradas usando um banco de filtro que, porém, é selecionado usando um tipo de tabela de pesquisa. O número de publicação US 5,581,652 propõem a reconstrução de voz de banda larga da voz de banda estreita usando os livros códigos, de forma que a natureza das formas de onda dos sinais é explorada, Além disso, no número de aplicação de patente internacional publicado W099/49454A1 ê estreito um método onde um sinal de voz é transformado no domínio da frequência, os eutnes característicos do sinal do domínio da frequência são identificados e um grupo de parâmetros do filtro de banda larga é selecionado com base numa tabela conversão. O uso da tabela de pesquisa na busca das características do filtro de banda larga adequado pode ajudar a evitar os desastres do tipo apresentado na FIGURA 2, mas simultaneamente envolve um grau considerável de inflexibilidade. Apenas um número limitado de possíveis filtros de banda larga pode ser implementado ou uma memória muito grande deve ser alocada somente para este propósito. Ao aumentar o número das configurações do filtro de banda larga armazenada para a escolha, também aumenta o tempo que deve ser alocado para procurar e estabelecer o correto dentre eles, o que não é desejável na operação de tempo-real tal como na telefonia de voz.
Resumo da Invenção É um objeto da presente invenção apresentar um decodiftcador de voz e um método para decodificar a voz. onde a expansão de uma banda de frequência é feita de uma. forma flexível, a qual é econômica processual mente e imita bem as características que seriam obtidas original mente usando uma largura de banda mais larga.
Os objetivos da invenção são alcançados pela geração de um filtro PL de banda larga apartir de uma banda estreita, de forma que a extrapolação com base em certas regularidades nos polos do filtro de PL de banda estreita é utilizada.
De acordo com a invenção, o dispositivo dc processamento de voz inclui: - uma entrada para receber um sinal de voz codificado de predição linear representando a primeira banda de frequência; - dispositivo para extrair, do sinal dc voz. codificado dc predição linear a informação descrevendo o primeiro filtro de predição linear associado com a primeira banda de frequência e; - um vocodificador para converter um sinal de entrada em um sinal de saída representando a segunda banda de frequência, é caracterizado pelo fato de que o dispositivo compreendente: - dispositivo para gerar o segundo filtro de predição linear, a ser usado pelo vocodificador na segunda banda de frequência, com base na informação descrevendo o primeiro filtro de predição linear. A invenção também se aplica a um telefone de rádio digital, o qual é caracterizado pelo fato de que inclui ao menos um dispositivo de processamento de voz do tipo mencionado acima.
Adicionalmente, a invenção se aplica a um método de decodificação de voz, o qual inclui os passos de: - extrair do sinal de voz codificado de predição linear, a informação descrevendo o primeiro filtro de predição linear associado com a primeira banda de frequência e; - converter o sinal de entrada no sinal de saída representando a segunda banda de frequência, é caracterizado pelo fato de que compreende ainda os passos de: - gerar o segundo filtro de predição linear, a ser usado na conversão do sinal de entrada para o sinal de saída com base na informação extraída descrevendo o primeiro filtro de predição linear associado com a primeira banda de frequência. Várias formas conhecidas de apresentação existem para os filtros de PL. Especialmente, é conhecida uma representação denominada de domínio da frequência, onde um filtro de PL pode ser representado com um vetor FLE (Frequência de Linha Espectral) ou um vetor FIE (Frequência Imitância Espectral). A representação do domínio da frequência tem a vantagem de ser independente da taxa de amostragem.
De acordo com a invenção, um filtro de PL de banda estreita é dinamicamente usado como base para construir o filtro PL de banda larga por meio da extrapolação. Especialmente, a invenção envolve a conversão do filtro PL de banda estreita em sua representação do domínio da frequência , e formando uma representação do domínio da frequência de um filtro PL de banda larga pela extrapolação do filtro de PL de banda estreita. Um filtro RII (Resposta de Impulso Infinita) de uma ordem alta o suficiente é preferivelmente usado para a extrapolação para levar vantagens da característica de regularidades para o filtro de PL de banda estreita. A ordem do filtro de PL de banda larga é preferivelmente selecionada, de forma que a relação das ordens do filtro PL de banda larga e de banda estreita é essencial mente igual à relação das frequências de amostragem de banda larga e de banda estreita. Um grupo determinado de coeficientes é necessário para o filtro de RII; estes são obtidos preferivelmente pela análise de autoeorrelaçao do vetor de diferença que reflete as diferenças entre os elementos adjacentes na representação vetorial do filtro de PL de banda estreita.
Para assegurar que o filtro de PL de banda larga nio alcance a amplificação excessiva perto da frequência de Nyquist, é vantajoso colocar certas limitações ao último elemento(s) da representação vetorial de filtro de PL de banda larga. Especial mente, a diferença entre o último elemento na representação vetorial e a frequência de Nyquist proporciona à frequência de amostragem» deveria ficar aproximadamente as mesmas. Estas limitações são facilmente definidas através das definições diferenciais, de forma que a diferença entre os elementos adjacentes na representação vetorial é controlada.
Breve Descrição dos Desenhos Âs novas características que são consideradas como característica da invenção são agrupadas em particular nas reivindicações apensas. Porém, a própria invenção será melhor compreendida, ambos como a sua construção e o seu método de operação, junto com os objetos adicionais e suas vantagens» da descrição a seguir das incorporações especificas quando lidas em conjunto com os desenhos apensos, FIGURA I- ilustra um decodificado!’ de voz conhecido; FIGURA 2- apresenta uma resposta de frequência desvantajosa de um filtro PL de banda larga conhecido; FIGURA 3a- ilustra o princípio da invenção; FIGURA 3b- ilustra a aplicação do princípio da FIGURA 3a em um decodificador de voz; FUGURA 4- apresenta um detalhe da disposição da FIGURA 3b; FIGURA 5- apresenta um detalhe da disposição da FIGURA 4; e FIGURA 6- apresenta uma resposta de frequência vantajosa do filtro de PL de acordo com a invenção.
Descrição Detalhada da Invenção As figuras 1 e 2 foram descritas na descrição da técnica anterior, assim a descrição a seguir da invenção e as suas incorporações vantajosas se concentrarão nas FIGURAS 3a a 6. Os mesmos números de referência são usados para as partes semelhantes nos desenhos. A FIGURA 3a ilustra o uso de um sinal de entrada de banda estreita para extrair os parâmetros do filtro de PL de banda estreita no bloco 310 de extração. Os parâmetros do filtro PL de banda estreita são levados ao bloco de extrapolação 301, onde a extrapolação é usada para produzir os parâmetros do filtro de PL de banda larga correspondente. Estes são levados ao vocodificador 105 usando algum sinal de banda larga como sua entrada. O vocodificador 105 gera um filtro PL de banda larga dos parâmetros e os usa para converter o sinal de entrada de banda larga em um sinal de saída de banda larga. Também, o bloco 310 de extração pode dar uma saída, que é uma saída de banda estreita. A FIGURA 3b apresenta como princípio da FIGURA 3 a pode ser aplicado, para um decodificador de voz conhecido. Uma comparação entre a FIGURA 1 e a FIGURA 3b apresenta a adição trazida através da invenção, em um principio conhecido para converter um sinal de voz codificado de banda estreita em um fluxo de amostragem decodificado de banda larga. A invenção não tem efeito na extremidade de transmissão: o sinal de voz original é filtrado no bloco 101 do filtro passa-baixa e o sinal resultante em uma sub-banda de frequência baixa codificada no codificador de banda estreita 102. Também, a ramificação inferior na extremidade de recepção pode ser a mesma: o sinal codificado é alimentado em um decodificador de banda estreita 103, e para aumentar a taxa de amostragem da saída da sub-banda de frequência baixa, o sinal é levado ao interpolador de taxa de amostragem 104. Contudo, o filtro de PL de banda estreita usado no bloco 103 não é levado diretamente ao vocodificador 105, mas ao bloco de extrapolação 301 onde um filtro de PL de banda larga é gerado.
Acurva de resposta de frequência do filtro de PL na sub-banda de frequência baixa não é simplesmente estirada para cobrir uma banda de frequência mais larga; nem as características do filtro PL de banda estreita são usadas como uma chave de busca para qualquer biblioteca dos filtros de PL de banda larga previamente gerada. A extrapolação é executada no bloco 301 gerando um filtro de PL de banda larga não apenas selecionando a associação mais próxima de um grupo de alternativas. É um método verdadeiramente adaptável pela seleção de um algoritmo de extrapolação adequado, que é possível para assegurar uma relação única entre cada entrada do filtro PL de banda estreita e a saída do filtro PL de banda larga correspondente. O método de extrapolação trabalha mesmo quando pouco é conhecido anteriormente sobre os filtros de PL de banda estreita, que serão encontrados como informação de entrada. Esta é uma vantagem clara sobre todas as soluções baseadas nas tabelas de pesquisas, uma vez que tais tabelas apenas podem ser construídas quando esta for mais ou menos conhecida, na qual as categorias do filtro de PL de banda estreita cairão. Adicionalmente, o método de extrapolação de acordo com a invenção requer apenas uma quantidade limitada de memória, porque apenas o próprio algoritmo necessita ser armazenado. O uso do filtro PL de banda larga obtido do bloco 301 na geração de uma sub-banda de frequência alta produzida sinteticamente pode seguir o padrão conhecido tal como da técnica anterior. O ruído branco é alimentado como dados de entrada no vocodificador 105, usando o filtro PL de banda larga produzindo um fluxo de amostragem que representa a sub-banda de frequência alta. A potência do ruído branco é ajustada, de forma que a potência de saída do vocodificador seja apropriada. A saída do vocodificador 105 é filtrada no bloco 106 do filtro passa-alta e, as sub-bandas de frequência baixa e alta são combinadas no bloco 107 de soma. A combinação está pronta para ser levada a um sintetizador de voz (não mostrado) para gerar o sinal de saída acústico final. A FIGURA 4 ilustra um modo exemplar de implementar o bloco de extrapolação 301. O bloco conversão de PL para FLE 401 converte o filtro de PL de banda estreita obtido do decodificador 103 no domínio da frequência. A extrapolação atual é feita no domínio da frequência pelo bloco de extrapolação 402. A saída deste é acoplado o bloco de conversão FLE para o PL 403 que executa a conversão inversa comparada à feita no bloco 401. Adicionalmente o bloco do controlador de ganho 404 é, acoplado entre a saída do bloco 403 e a entrada de controle do vocodificador 105, a tarefa do qual é escalar o ganho do filtro de PL de banda a um nível apropriado. A FIGURA 5 ilustra um modo exemplar de implementar o extrapolador 402. A entrada deste é acoplado à saída do bloco conversão de PL para FLE 401, assim a representação vetorial fn do filtro de PL de banda estreita é obtida como uma entrada ao extrapolador 402. Para executar a extrapolação, um filtro de extrapolação é gerado pela análise do vetor fn em um bloco gerador de filtro 501. O filtro também pode ser descrito como um vetor que aqui é denotado como o vetor b. Ao usar o filtro gerado no bloco 501, a representação vetorial fn do filtro de PL de banda estreita é convertida a uma representação vetorial fw do filtro de PL de banda larga no bloco 502. Finalmente para assegurar que o filtro de PL de banda larga não inclua uma amplificação excessiva próximo da frequência de Nyquist relativa à taxa de amostragem mais alta, a representação vetorial fw do filtro de PL de banda larga é sujeitada a certas funções de limitação no bloco 503 antes de passar para o bloco de conversão de FLE para o PL 403.
Proveremos uma análise detalhada das operações executadas nos vários blocos funcionais introduzidos nas FIGURAS 4 e 5 acima. É tomado como um fato que o decodificador 103 implementa e utiliza um filtro PL no curso de decodificação do sinal de voz de banda estreita. Este filtro PL é designado como o filtro de PL de banda estreita, e é caracterizado através de que um grupo de coeficientes do filtro PL. É igualmente um fato que, praticamente todos os decodificadores de voz de qualidade alta (codificadores) usam certos vetores conhecidos como os vetores FLE ou FIE para quantizar os coeficientes do filtro PL, assim funcionalmente a conversão PL para FLE mostra no bloco 401 na FIGURA 4 pode até mesmo ser uma parte do decodificador 103. Ao longo desta descrição, nós falaremos sobre os vetores FLE por motivo de consistência, mas é direto para a uma pessoa qualificada na técnica aplicar a descrição ao uso dos vetores de FIE.
Os vetores de FLE podem ser representados em ambos domínios de co-seno, onde o vetor é denominado de vetor PLE (Par de Linha Especial), ou no domínio de frequência. A representação do domínio do co-seno (o vetor PLE) é dependente da taxa de amostragem, mas a representação do domínio de frequência não é, assim se, por exemplo, o decodificador 103 é algum tipo de um decodificador de voz acionário, que só oferece um vetor PLE como uma informação de entrada para o bloco de extrapolação 301, é preferível converter o vetor PLE primeiro em um vetor FLE. A conversão é feita facilmente de acordo com a fórmula conhecida: (1) onde a subscrição n geralmente denota “banda estreita", í'n (í) é o elemento de i-ésimo elemento do vetor de FLE qn (i) é o elemento i-ésimo do vetor de PLE de banda estreita, f,.„ é a mesma taxa de amostragem da banda estreita e n„ é a ordem do filtro de PL de banda estreita. Seguindo a definição dos vetores PLE e de FLE. n„ também é o número de elementos nos vetores de PLE de banda estreita e FLE.
Na incorporação apresentada nas FIGURAS 3b, 4 e 5, a extrapolação atual acontece no bloco 502 usando uma ordem L-ésimo de extrapolação do filtro gerada no bloco 501. Para o momento assumimos que o bloco 501 proporciona para o bloco 502 um vetor de filtro b; nós retomaremos depois à geração do vetor dc filtro. Uma fórmula vantajosa para gerar vetor fw FLE de banda larga é: (2) onde a subscrição w gera!mente denota “ banda larga”, fvv (i) é o eleemnto de i-ésimo elemento do vetor de FLE, k é um índice de soma, L é a ordem do filtro de extrapolação e b((i-l)4c) é o «i-l)4c)-ésimo elemento do vetor de filtro de extrapolação. Em outras palavras, tantos elementos quanto existirem no vetor de FLE de banda estreita é exatamente o mesmo no começo do vetor de FLE de banda larga, O resto dos elementos no vetor de FLE de banda larga é calculado de forma que cada elemento novo é uma soma ponderada dos elementos L prévios no vetor de FLE de banda larga. Os pesos são os elementos do vetor do filtro de extrapolação em uma ordem convolutional, de forma que calculando fw (i), o elemento f„ (ϊ-L) que é o elemento prévio mais distante contribuindo para a soma é ponderado com b(L-l) e o elemento fw (i-1) o qual é o elemento prévio mais próximo contribuindo para a soma é ponderado com b(0). A fórmula de extrapolação (2) não limita o valor de nUl isto é a ordem do filtro de PL de banda larga, Para preservar a precisão da extrapolação, é vantajoso selecionar o valor de nw de forma que: (3) Significando que as ordens dos filtros de PL são escaladas de acordo com as magnifudes relativas das frequências de amostragem. A exigência de que o filtro de banda larga não deveria produzir uma amplificação excessiva nas frequências próximas da frequência de Nyquist 0.5 f„,w pode ser formulada com a ajuda da diferença entre o último elemento de cada vetor do filtro PL e a frequência de Nyquist correspondente, onde a diferença é escalada com a frequência de amostragem, de acordo com a fórmula: (4) As limitações (3) e (4) determinadas acima para o filtro PL de banda larga restringe a seleção de nw e a definição do filtro de extrapolação. Exatamente como as restrições são implementadas é uma questão de experimentação de uma rotina de trabalho. Uma aproximação vantajosa é definir um vetor de diferença D de forma que: (5) E para limitar o vetor de diferença de alguma maneira, por exemplo, requerendo que nenhum elemento D(k) no vetor de diferença D possa ser maior que um valor limite predeterminado, ou que a soma dos elementos quadrados (DCk))a do vetor de diferença D não possa ser maior que uni valor limite predeterminado. Um filtro de PL tem tipicamente características de filtro passa-baixá ou passa-alia, e não características de filtro passa-faixa ou rejeita-faixa. O valor limite predeterminado pode ter uma relação para este fato, de tal modo que se o filtro de PL tenha as características do filtro passa-baixa, o valor limite é aumentado. Por outro lado. se o filtro de PL banda estreita tem características de filtro passa-alta. o valor limite é diminuído. Outras limitações aplicáveis que recorrem ao vetor de diferença D são facilmente projetadas por uma pessoa qualificada na arte. A seguir descreveremos alguns modos vantajosos de gerar o vetor de filtro b. Os locais dos polos do filtro PL tendem a ter alguma correlação entre si. de forma que o vetor da diferença D dos elementos os quais descrevem a diferença entre os elementos de vetor adjacentes inclui uma certa regularidade. Podemos calcular a função de auto-correi ação: (6) ¢7) e acha seu máximo, isto é o valor do índice k que produz o grau mais alto da auto-correlaçio. Podemos denotar este valor do índice k corno m. Um modo vantajoso de definir o vetor do filtro b é então: (8) Deste modo o vetor filtro b segue a regularidade do filtro PL de banda estreita. Até mesmo os elementos novos do filtro PL de banda larga extrapolado herdam esta característica pelo uso do filtro b no procedimento de extrapolação. É naturalmente possível que a função de autocorrelação (6) não tenha um máximo claro. Levando em conta estes casos podemos definir que o vetor do filtro de extrapolação b tem que modelar todas as regul and ades no filtro PL de banda estreita de acordo com a importância deles, A autocorrelação pode ser usada como um veículo de tal definição, por exemplo, de acordo com a fórmula abaixo: (9) À definição mais geral (9) converge para a definição acima determinada mais simples (8) se existir um cume máximo claro na função de autocorrelação, A representação vetorial FLE do filtro de PL de banda larga está pronto para se convertido no filtro PL atual de banda larga, que pode ser usado para processar os sinais que têm uma taxa de amostragem f%.w. Para estes casos onde a representação vetorial PLE do filtro de PL de banda é preferível, uma conversão FLE para PLE pode ser executada de acordo com a fórmula: (10) Deveria ser observado que o domínio do eo-seno no qual a conversão(IO) é executada tem frequência de Nyquist de 0.5 FMV, enquanto o domínio do eo-seno do qual a conversão de banda estreita 91) foi feita para a frequência de Nyquist I O ganho global do filtro PL de banda larga obtido deve ser ajustado de certo modo conhecido tal como das soluções da técnica anterior. O ajuste o ganho pode ocorrer no bloco de extrapolação 301 corno apresentado no sub-bloco 404 na FIGURA 4, ou pode ser uma parte do vocodíficador 105. Corno uma diferença para a solução cia técnica anterior da FIGURA I, que pode ser observado que o ganho global do filtro de PL de banda larga gerado de acordo com a invenção pode ser permitido ser maior que o ganho do filtro PL de banda larga da técnica anterior, porque grandes divergências da resposta de frequência ideal, como apresentadas na FIGURA 2, não são prováveis de ocorrer e não necessita ser consideradas. A FIGURA 6 ilustra unia resposta típica de frequência 601 que podería ser obtida com um filtro de PL de banda larga gerado pela extrapolação de acordo com a invenção. A resposta da frequência 601 segue a curva 201 ideal bem perto, representando a resposta de frequência do filtro PL de 0 a 8000 Hz. que seria usado na analise de um sinal de voz com uma taxa de amostragem 16 kHz. A aproximação de extrapolação tende a modelar as tendências de escalas maiores do espectro de amplitude com bastante precisão e localizar os cumes corretamente na resposta de frequência. Uma vantagem significante da invenção em relação a disposição da técnica anterior ilustrada nas FIGURAS I e 2 é que a resposta de frequência do filtro de PL de banda larga ê continuo, isto é, não tem nenhuma mudança instantânea na magnitude como de 5600 Hz na resposta de frequência do filtro de PL de banda larga da técnica anterior. O decodificador de voz apenas não é bastante para traduzir o espírito da invenção nas vantagens concebíveis para o usuário humano. A FIGURA 7 ilustra um telefone de rádio digital onde uma antena 701 é acoplada a um filtro duplex 702, o qual é acoplado a ambos o bloco receptor 703 e o bloco transmissor 704 para receber e transmitir a voz codificada digitalmente sobre a interface de rádio. O bloco receptor 703 e o bloco transmissor 704 são ambos acoplados ao bloco controlador 707 para respectivamente carregar a informação de controle recebida e a informação de controle a ser transmitida. Adicionalmente, o bloco receptor 703 e o bloco transmissor 704 são acoplados ao bloco de banda base 705, que inclui a frequência de banda base que funciona respectivamente para processar a voz recebida e a voz a ser transmitida. O bloco de banda base 705 e o bloco do controlador 707 são tipicamente acoplados a interface do usuário 706 consistindo em um microfone, um alto-falante, um teclado complementar e um visor (não especificamente apresentado na FIGURA 7).
Uma parte do bloco de banda base 705 é apresentada em maiores detalhes na FIGURA 7. A última parte do bloco receptor 703 é um decodificador de canal à saída do qual consiste dos quadros de canal de voz decodificados que necessitam serem sujeitados a decodificação e síntese de voz. Os quadros de voz obtidos do decodificador de canal são temporariamente armazenados na memória de quadro 710 e lidos desta para o decodificador de voz atual 711. O ultimo implementa um algoritmo de decodificação de voz lido da memória 712. De acordo com a invenção, quando o decodificador de voz 711 acha que a taxa de amostragem de um sinal de voz entrante deveria ser elevada, este emprega o método do filtro de PL de extrapolação descrito acima para produzir o filtro de PL requerido na geração da sub-banda de frequência alta produzida sinteticamente. O bloco de banda base 705 é tipicamente um ASIC (Circuito Integrado de Aplicação Específica) relativamente grande. O uso da invenção ajuda a reduzir a complicação e o consumo de energia do ASIC, porque apenas uma quantidade limitada de memória e um número fracionário de acessos de memória são necessários para o uso do decodificador de voz, especialmente quando comparado ás soluções da técnica anterior, onde amplas tabelas de pesquisas foram usadas para armazenar uma variedade de filtros de PL de banda larga pré-calculados. A invenção não impõe exigências excessivas ao desempenho do ASIC, porque os cálculos descritos acima relativamente fáceis de executar.
REIVINDICAÇÕES

Claims (16)

1. Dispositivo de processamento de voz compreendendo: - uma entrada para receber um sinal de voz codificado de predição linear representando uma primeira banda de frequência; - dispositivo (103, 310) para extrair, do sinal de voz codificado de predição linear, a informação que descreve o primeiro filtro de predição linear associado com a primeira banda de frequência; e - um vocodificador (105) para converter um sinal de entrada em um sinal de saída representando uma segunda banda de frequência, CARACTERIZADO pelo fato de que o dispositivo compreende: - um dispositivo (301) para gerar um segundo filtro de predição linear a ser usado pelo vocodificador (105) na segunda banda de frequência, com base na informação descrita no primeiro filtro de predição linear pela extrapolação de uma representação vetorial do primeiro filtro de predição linear.
2. Dispositivo de processamento de voz de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que o dispositivo (301) compreende: - dispositivo (401) para converter a informação descrevendo o primeiro filtro de predição linear em uma primeira representação paramétrica no domínio da frequência; - dispositivo (402) para extrapolar a dita primeira representação paramétrica em uma segunda representação paramétrica no domínio da frequência; e - dispositivo (403) para converter a dita segunda representação paramétrica no segundo filtro de predição linear.
3. Dispositivo de processamento de voz de acordo com a reivindicação 2, CARACTERIZADO pelo fato de que o dispositivo (402) para extrapolar a primeira representação paramétrica na segunda representação paramétrica no domínio da frequência compreende um filtro de resposta de impulso infinito (502).
4. Dispositivo de processamento de voz de acordo com a reivindicação 3, CARACTERIZADO pelo fato de que o dispositivo (501) deriva a representação vetorial do filtro de resposta de impulso da primeira representação paramétrica.
5. Dispositivo de processamento de voz de acordo com a reivindicação 2, CARACTERIZADO pelo fato de que compreende os dispositivos (404, 503) para limitar a segunda representação paramétrica.
6. Dispositivo de processamento de voz de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que: - o dispositivo (103, 310) para extrair do sinal de voz codificado de predição linear a informação descrevendo o primeiro filtro de predição linear associado com a primeira banda de frequência compreende um decodificador (103) para converter o sinal de voz codificado de predição linear em um primeiro fluxo de amostragem possuindo uma primeira taxa de amostragem e representando a primeira banda de frequência; - o vocodificador (105) para converter o sinal de entrada em um sinal de saída representando uma segunda banda de frequência converte o sinal de entrada no segundo fluxo de amostragem possuindo a segunda taxa de amostragem e representando a segunda banda de frequência; - o dispositivo (301) para gerar um segundo filtro de predição linear, a ser usado pelo vocodificador (105) na segunda banda de frequência, com base na informação descrita no primeiro filtro de predição linear pela extrapolação de uma representação vetorial do primeiro filtro de predição linear gera o segundo filtro de predição linear com base no primeiro filtro de predição linear usado pelo decodificador (103) na primeira banda de frequência; e sendo que compreende adicionalmente: - um dispositivo de combinação (107) para combinar o primeiro e o segundo fluxos de amostragem na forma processada.
7. Dispositivo de processamento de voz de acordo com a reivindicação 6, CARACTERIZADO pelo fato de que compreende: - um interpolador (104) de taxa de amostragem acoplado entre o decodificador (103) e o dispositivo combinador (107); e - um filtro passa alta (106) acoplado entre o vocodificador (105) e o dispositivo combinador (107).
8. Método para processar digitalmente a voz codificada, compreendendo as etapas de: - extrair (103) do sinal de voz codificado de predição linear, a informação descrevendo o primeiro filtro de predição linear associado com uma primeira banda de frequência e; - converter (105) o sinal de entrada no sinal de saída representando uma segunda banda de frequência, CARACTERIZADO pelo fato de que compreende ainda as etapas de: - gerar (301) um segundo filtro de predição linear, a ser usado na conversão do sinal de entrada para o sinal de saída com base na informação extraída descrevendo o primeiro filtro de predição linear, associado com a primeira banda de frequência pela extrapolação de uma representação de vetor do primeiro filtro de predição linear.
9. Método de acordo com a reivindicação 8, CARACTERIZADO pelo fato de que compreende : - a etapa extrair (103) o sinal de voz de codificação de predição linear, a informação descrevendo o primeiro filtro de predição linear associado com a primeira banda de frequência compreendendo converter (103) em um decodificador o sinal de voz codificado de predição linear em um primeiro fluxo de amostragem possuindo uma primeira taxa de amostragem e representando a primeira banda de frequência; - a etapa converter (105) o sinal de entrada ao sinal de saída que representa a segunda banda de frequência compreendendo a conversão (105) em um vocodificador, o sinal de entrada em um segundo fluxo de amostragem possuindo uma segunda taxa de amostragem e representando a segunda banda de frequência, - a etapa gerar (301) o segundo filtro de predição linear compreendo gerar o segundo filtro de predição linear a ser usado pelo vocodificador na segunda banda de frequência, com base no primeiro filtro de predição linear usado pelo decodificador na primeira banda de frequência, e sendo que o método compreende ainda: - a etapa combinar (107) o primeiro e o segundo fluxos de amostragem na forma processada.
10. Método de acordo com a reivindicação 9, CARACTERIZADO pelo fato de que a etapa de gerar (301) compreende as etapas de: - converter (401) o primeiro filtro de predição linear em uma primeira representação paramétrica no domínio da frequência; - extrapolar (402) a dita primeira representação paramétrica em uma segunda representação paramétrica no domínio da frequência, e - converter (403) a dita segunda representação paramétrica no segundo filtro de predição linear.
11, Método de acordo com a reivindicação 9, CARACTERIZADO pelo fato de que a etapa de extrapolação (402) da primeira representação paramétrica em uma segunda representação paramétrica no domínio da frequência compreende a sub-etapa de filtrar (502) a dita primeira representação paramétrica com um filtro de resposta de impulso infinito.
12, Método de acordo com a reivindicação 11, CARACTERIZADO pelo fato de que a etapa de extrapolação (402) da primeira representação paramétrica em uma segunda representação paramétrica compreende ainda a etapa de calcular (501) uma representação vetorial para um filtro de resposta de impulso infinito a partir de uma regularidade observada na primeira representação paramétrica do primeiro filtro de predição linear, um filtro PL de banda estreita.
13. Método de acordo com a reivindicação 12, CARACTERIZADO pelo fato de que a etapa de extrapolação (402) da primeira representação paramétrica em uma segunda representação paramétrica no domínio da frequência compreende a sub-etapa de determinar (502) os valores da segunda representação paramétrica como: em que; fw (i) é o i-ésimo elemento da segunda representação paramétrica, k c o índícc do somatório, L é a ordem do filtro de resposta de impulso infinito, e b((i-l)-k) é o elemento ((i-l)-k) i-ésimo elemento da representação vetorial para o filtro de resposta de impulso infinito.
14. Método de acordo com a reivindicação 13, CARACTERIZADO pelo fato dc que compreende a sub-eiapa de calcular (501) a representação vctorial para o filtro de resposta de impulso infinito de forma que: e m é o valor do índice k, o qual produz o valor máximo da função de auto- correlação: em que: fn (i) é o í-ésimo elemento da primeira representação paramêtriea, e nn c o número de elementos na primeira representação paramêtriea,
15, Método de acordo com. a reivindicação 13, C AR .AC TERIZA D O pelo fato de que compreende a sub-etapa de calcular (501) a representação vetorial para o filtro de resposta dc impulso infinito de tal forma que: em que: fn é o i-ésimo elemento da primeira representação paramétrica, e nn é o número de elementos na primeira representação paramétrica,
16. Método de acordo cora a reivindicação 13, CARACTERIZADO pelo fato de que compreende a etapa de limitar (503) a representação do segundo vetor para. preencher as condições: em que: IV é o número de elementos na segunda representação paramétrica, η,, é o número de elementos na primeira representação paramétrica, fs,w é a segunda frequência de amostragem, fs n é a primeira frequência de amostragem, fn (i) é o i-ésimo elemento da primeira representação paramétrica e fw(i) é o i-ésimo elemento de segunda representação paramétrica.
BRPI0109043A 2000-03-07 2001-03-06 dispositivo de processamento de voz, e, método para processar a voz codificada digitalmente BRPI0109043B1 (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI20000524A FI119576B (fi) 2000-03-07 2000-03-07 Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
PCT/FI2001/000222 WO2001067437A1 (en) 2000-03-07 2001-03-06 Speech decoder and a method for decoding speech

Publications (2)

Publication Number Publication Date
BR0109043A BR0109043A (pt) 2003-06-03
BRPI0109043B1 true BRPI0109043B1 (pt) 2017-06-06

Family

ID=8557866

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0109043A BRPI0109043B1 (pt) 2000-03-07 2001-03-06 dispositivo de processamento de voz, e, método para processar a voz codificada digitalmente

Country Status (15)

Country Link
US (1) US7483830B2 (pt)
EP (1) EP1264303B1 (pt)
JP (2) JP2003526123A (pt)
KR (1) KR100535778B1 (pt)
CN (1) CN1193344C (pt)
AT (1) ATE343835T1 (pt)
AU (1) AU2001242539A1 (pt)
BR (1) BRPI0109043B1 (pt)
CA (1) CA2399253C (pt)
DE (1) DE60124079T2 (pt)
ES (1) ES2274873T3 (pt)
FI (1) FI119576B (pt)
PT (1) PT1264303E (pt)
WO (1) WO2001067437A1 (pt)
ZA (1) ZA200205089B (pt)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3467469B2 (ja) * 2000-10-31 2003-11-17 Necエレクトロニクス株式会社 音声復号装置および音声復号プログラムを記録した記録媒体
US6889182B2 (en) 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
US8712768B2 (en) * 2004-05-25 2014-04-29 Nokia Corporation System and method for enhanced artificial bandwidth expansion
ATE406652T1 (de) * 2004-09-06 2008-09-15 Matsushita Electric Ind Co Ltd Skalierbare codierungseinrichtung und skalierbares codierungsverfahren
DE602004020765D1 (de) * 2004-09-17 2009-06-04 Harman Becker Automotive Sys Bandbreitenerweiterung von bandbegrenzten Tonsignalen
BRPI0515814A (pt) * 2004-12-10 2008-08-05 Matsushita Electric Ind Co Ltd dispositivo de codificação de banda larga, dispositivo de predição de lsp de banda larga, dispositivo de codificação de banda escalonável, método de codificação de banda larga
EP2107557A3 (en) * 2005-01-14 2010-08-25 Panasonic Corporation Scalable decoding apparatus and method
EP1864281A1 (en) * 2005-04-01 2007-12-12 QUALCOMM Incorporated Systems, methods, and apparatus for highband burst suppression
JP4899359B2 (ja) * 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US20140214431A1 (en) * 2011-07-01 2014-07-31 Dolby Laboratories Licensing Corporation Sample rate scalable lossless audio coding
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
BR122020015614B1 (pt) 2014-04-17 2022-06-07 Voiceage Evs Llc Método e dispositivo para interpolar parâmetros de filtro de predição linear em um quadro de processamento de sinal sonoro atual seguindo um quadro de processamento de sinal sonoro anterior
PT3136384T (pt) 2014-04-25 2019-04-22 Ntt Docomo Inc Dispositivo de conversão do coeficiente de previsão linear e método de conversão do coeficiente de previsão linear
KR102002681B1 (ko) * 2017-06-27 2019-07-23 한양대학교 산학협력단 생성적 대립 망 기반의 음성 대역폭 확장기 및 확장 방법
CN108198571B (zh) * 2017-12-21 2021-07-30 中国科学院声学研究所 一种基于自适应带宽判断的带宽扩展方法及系统
CN116110409B (zh) * 2023-04-10 2023-06-20 南京信息工程大学 一种ASIP架构的大容量并行Codec2声码器系统及编解码方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0685607A (ja) 1992-08-31 1994-03-25 Alpine Electron Inc 高域成分復元装置
JP2779886B2 (ja) 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
DE4343366C2 (de) 1993-12-18 1996-02-29 Grundig Emv Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen
JP3230791B2 (ja) 1994-09-02 2001-11-19 日本電信電話株式会社 広帯域音声信号復元方法
JP3230790B2 (ja) 1994-09-02 2001-11-19 日本電信電話株式会社 広帯域音声信号復元方法
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
DE69619284T3 (de) * 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
JP2798003B2 (ja) * 1995-05-09 1998-09-17 松下電器産業株式会社 音声帯域拡大装置および音声帯域拡大方法
JPH0955778A (ja) * 1995-08-15 1997-02-25 Fujitsu Ltd 音声信号の広帯域化装置
JP3301473B2 (ja) 1995-09-27 2002-07-15 日本電信電話株式会社 広帯域音声信号復元方法
EP0878790A1 (en) 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
EP0945852A1 (en) 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Speech synthesis
JP3541680B2 (ja) * 1998-06-15 2004-07-14 日本電気株式会社 音声音楽信号の符号化装置および復号装置
US6539355B1 (en) * 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
JP2000305599A (ja) * 1999-04-22 2000-11-02 Sony Corp 音声合成装置及び方法、電話装置並びにプログラム提供媒体
CN1335980A (zh) * 1999-11-10 2002-02-13 皇家菲利浦电子有限公司 借助于映射矩阵的宽频带语音合成

Also Published As

Publication number Publication date
DE60124079T2 (de) 2007-03-08
AU2001242539A1 (en) 2001-09-17
EP1264303A1 (en) 2002-12-11
JP2003526123A (ja) 2003-09-02
ES2274873T3 (es) 2007-06-01
PT1264303E (pt) 2007-01-31
WO2001067437A1 (en) 2001-09-13
DE60124079D1 (de) 2006-12-07
BR0109043A (pt) 2003-06-03
KR100535778B1 (ko) 2005-12-12
CN1416561A (zh) 2003-05-07
JP2007156506A (ja) 2007-06-21
KR20020081388A (ko) 2002-10-26
EP1264303B1 (en) 2006-10-25
CA2399253A1 (en) 2001-09-13
US20010027390A1 (en) 2001-10-04
CN1193344C (zh) 2005-03-16
FI20000524A0 (fi) 2000-03-07
FI20000524A (fi) 2001-09-08
JP4777918B2 (ja) 2011-09-21
ZA200205089B (en) 2003-04-30
FI119576B (fi) 2008-12-31
ATE343835T1 (de) 2006-11-15
US7483830B2 (en) 2009-01-27
CA2399253C (en) 2010-11-23

Similar Documents

Publication Publication Date Title
BRPI0109043B1 (pt) dispositivo de processamento de voz, e, método para processar a voz codificada digitalmente
TW412719B (en) Method and apparatus for reproducing speech signals and method for transmitting same
RU2469422C2 (ru) Способ и устройство для формирования уровня улучшения в системе кодирования звука
US7191121B2 (en) Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
US8417515B2 (en) Encoding device, decoding device, and method thereof
ES2287122T3 (es) Procedimiento y aparato para cuantificar de manera predictiva habla sonora.
KR100726960B1 (ko) 음성 처리에서의 인위적인 대역폭 확장 방법 및 장치
JP3513292B2 (ja) 雑音荷重フィルタリング方法
ES2711524T3 (es) Generación de señal de excitación de banda alta
US10460739B2 (en) Post-quantization gain correction in audio coding
JP4570250B2 (ja) 信号の量子化変換係数をエントロピーエンコードするシステムと方法
JPS6161305B2 (pt)
JP6368029B2 (ja) 雑音信号処理方法、雑音信号生成方法、符号化器、復号化器、並びに符号化および復号化システム
BRPI0609530A2 (pt) método e equipamento para encodificar e decodificar uma porção de banda alta de um sinal de fala
JP2009244886A (ja) 情報源符号化システムの性能向上装置
BRPI0715516A2 (pt) sistemas, mÉtodos e equipamentos para limitar fator de ganho
CN102682777A (zh) 一种衰减因子的获取方法和获取装置
WO2006041055A1 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
US5504834A (en) Pitch epoch synchronous linear predictive coding vocoder and method
US7359853B2 (en) Method and system for low bit rate voice encoding and decoding applicable for any reduced bandwidth requirements including wireless
Lombard et al. Frequency-domain comfort noise generation for discontinuous transmission in evs
JP2005114814A (ja) 音声符号化・復号化方法、音声符号化・復号化装置、音声符号化・復号化プログラム、及びこれを記録した記録媒体
Crochiere et al. Frequency domain techniques for speech coding
Patel et al. Bandwidth Extension of Speech Signals Using Quadrature Mirror Filter (QMF)

Legal Events

Date Code Title Description
B15K Others concerning applications: alteration of classification

Free format text: A CLASSIFICACAO ANTERIOR ERA: G10L 19/00

Ipc: G10L 19/02 (2013.01), G10L 19/16 (2013.01)

B15K Others concerning applications: alteration of classification

Free format text: AS CLASSIFICACOES ANTERIORES ERAM: G10L 19/02 , G10L 19/16

Ipc: G10L 21/038 (2013.01), G10L 19/16 (2013.01), G10L

B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B25A Requested transfer of rights approved

Owner name: NOKIA TECHNOLOGIES OY (FI)

B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]
B22O Other matters related to patents and certificates of addition of invention: legal action concerning patent

Free format text: INPI NO 52402.009874/2023-06 ORIGEM: JUIZO FEDERAL DA 13A VF DO RIO DE JANEIRO (TRF2) PROCESSO NO: 5038282-47.2023.4.02.5101 NULIDADE DA PATENTE DE INVENCAO AUTOR: OBR TECNOLOGIA LTDA. E USINA DE VENDAS SOLUCOES COMERCIAIS EM DISTRIBUICAO LTDA. REU(S): NOKIA TECHNOLOGIES E INSTITUTO NACIONAL DA PROPRIEDADE INDUSTRIAL ? INPI

B19A Notification of judicial decision: notification of judicial decision

Free format text: (INPI NO 52402.009874/2023-06 ORIGEM: JUIZO FEDERAL DA 13A VF DO RIO DE JANEIRO (TRF2) PROCESSO NO: 5038282-47.2023.4.02.5101 AUTOR: OBR TECNOLOGIA LTDA. E USINA DE VENDAS SOLUCOES COMERCIAIS EM DISTRIBUICAO LTDA. REU(S): NOKIA TECHNOLOGIES E INSTITUTO NACIONAL DA PROPRIEDADE INDUSTRIAL (INPI ). DECISAO: "DEFIRO O PEDIDO DE ANTECIPACAO DOS EFEITOS DA TUTELA, DETERMINANDO A SUSPENSAO DOS EFEITOS DAS REIVINDICACOES 1, 2, 6, 7, 8, 9 E 10 DA PATENTE DE INVENCAO PI 0109043-7, PARA "DISPOSITIVO DE PROCESSAMENTO DE VOZ, E, METODO PARA PROCESSAR A VOZ CODI?CADA DIGITALMENTE", APENAS EM RELACAO AS EMPRESAS AUTORAS, ATE ULTERIOR DECISAO DO PRESENTE JUIZO"