BR112015018023B1 - Aparelho e método para sintetizar um sinal de áudio, decodificador, codificador e sistema - Google Patents

Aparelho e método para sintetizar um sinal de áudio, decodificador, codificador e sistema Download PDF

Info

Publication number
BR112015018023B1
BR112015018023B1 BR112015018023-0A BR112015018023A BR112015018023B1 BR 112015018023 B1 BR112015018023 B1 BR 112015018023B1 BR 112015018023 A BR112015018023 A BR 112015018023A BR 112015018023 B1 BR112015018023 B1 BR 112015018023B1
Authority
BR
Brazil
Prior art keywords
audio signal
code
spectral
codebook
slope
Prior art date
Application number
BR112015018023-0A
Other languages
English (en)
Other versions
BR112015018023A2 (pt
Inventor
Fuchs Guillaume
Backstrom Tom
Geiger Ralf
Jaegers Wolfgang
Ravelli Emmanuel
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V.
Publication of BR112015018023A2 publication Critical patent/BR112015018023A2/pt
Publication of BR112015018023B1 publication Critical patent/BR112015018023B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

APARELHO E MÉTODO PARA SINTETIZAR UM SINAL DE ÁUDIO, DECODIFICADOR, CODIFICADOR, SISTEMA E PROGRAMA DE COMPUTADOR Um método e um aparelho para sintetizar um sinal de áudio são descritos. Uma inclinação espectral é aplicada ao código de um codebook (202) utilizado para sintetizar uma estrutura atual do sinal de áudio. A inclinação espectral é baseada na inclinação espectral da estrutura atual do sinal de áudio. Ainda, um decodificador de áudio operando de acordo com a abordagem inventiva é descrito. Figura 3

Description

DESCRIÇÃO
[0001] A presente invenção se refere ao campo de codificação de áudio, mais especificamente ao campo para sintetizar um sinal de áudio. As aplicações se referem a codificação de fala, particularmente a técnica da codificação de fala chamada codificação preditiva linear excitada por código (CELP | code excited linear predictive). As aplicações fornecem uma abordagem para compensação de inclinação adaptativa na formação dos códigos de uma CELP em um codebook inovador ou fixo.
[0002] O esquema de codificação de CELP é amplamente utilizado em comunicações de fala e é uma forma eficiente para codificar a fala. CELP sintetiza um sinal de áudio pela condução em um filtro preditivo linear (por exemplo, filtro de síntese de LPC 1/A(z)) a soma de duas excitações. Uma excitação está surgindo do passado codificado, que é chamada de codebook adaptativo, e a outra contribuição está surgindo de um codebook fixo ou inovador que é povoado pelos códigos fixos. Um problema com o esquema de codificação de CELP é que em baixas taxas de bit o codebook inovador não é povoado suficiente para modelar eficientemente a estrutura de fala de modo que a qualidade perceptual seja degradada e o sinal de saída sintetizado emite o som com ruído.
[0003] Para mitigar as perturbações de codificação, diferentes soluções já foram propostas e são descritas na referência [1] e na referência [2]. Nestas referências, os códigos do codebook inovador são de forma adaptativa e espectral. Formados pela melhoria das regiões espectrais correspondentes aos formatos da estrutura atual do sinal de áudio. As posições de formato e as formas podem ser deduzidas diretamente dos coeficientes de LPC que são coeficientes disponíveis tanto no codificador quanto no decodificador. A melhoria do formato dos códigos c(n) do codebook inovador são feitos por uma operação simples de filtragem:
Figure img0001
[0004] Neste processo de filtragem fe(n) é a resposta de impulso do filtro tendo a seguinte função de transferência:
Figure img0002
[0005] onde w1 e w2 são duas constantes de ponderação que enfatizam mais ou menos a estrutura formântica da função de transferência Fe(z). Os códigos formados resultantes do codebook inovador herdam uma característica do sinal de fala e dos sons com menos ruído do sinal sintetizado.
[0006] No esquema de codificação de CELP é ainda comum para adicionar uma inclinação espectral aos códigos do codebook inovador, que é feita pela filtragem dos códigos do codebook inovador como segue:
Figure img0003
[0007] O fator β é relacionado à voz da estrutura de áudio anterior, e a voz pode ser estimada da contribuição de energia do codebook adaptativo. Por exemplo, se a estrutura anterior tem voz, espera-se que a estrutura atual também terá voz e que os códigos terão mais energia nas frequências baixas, ou seja, o espectro tem inclinação negativa.
[0008] É um objeto da presente invenção fornecer uma abordagem melhorada para sintetizar um sinal de áudio.
[0009] Este objeto é obtido por um aparelho, de acordo com a reivindicação 1, e por um método, de acordo com a reivindicação 19.
[0010] A presente invenção fornece um aparelho para sintetizar um sinal de áudio que compreende uma unidade de processamento configurada para aplicar uma inclinação espectral ao código de codebook utilizado para sintetizar uma estrutura atual do sinal de áudio, em que a inclinação espectral é baseada na inclinação espectral da estrutura atual do sinal de áudio.
[0011] A presente invenção fornece um método para sintetizar um sinal de áudio, o método compreendendo aplicar uma inclinação espectral ao código de um codebook utilizado para sintetizar uma estrutura atual do sinal de áudio, em que a inclinação espectral é determinada com base na inclinação espectral da estrutura atual do sinal de áudio.
[0012] Os inventores do presente pedido observaram que a sintetização de um sinal de áudio pode ser ainda melhorada tanto em taxas de bit baixas quanto em mais altas explorando a natureza da inclinação espectral do sinal de áudio na sintetização do sinal para melhorar o ganho de codificação alcançável. De acordo com as aplicações, a presente invenção fornece uma codificação de fala, por exemplo, utilizando a técnica de codificação de fala de CELP, que permite melhorar o ganho de codificação de CELP, assim melhorando a qualidade perceptual do sinal decodificado ou sintetizado. A abordagem inventiva é baseada na constatação dos inventores que esta melhoria pode ser obtida adaptando a inclinação espectral dos códigos de um codebook, por exemplo, os códigos do codebook inovador de CELP, como uma função da inclinação espectral do sinal de entrada real atualmente processado. A abordagem inventiva é vantajosa por, além do ganho de codificação melhorado, em baixas taxas de bit, onde o codebook inovador não é povoado suficiente pata modelar eficientemente a fina estrutura da fala, ainda segue a outra melhoria do formato. Em taxas de bit mais altas, onde o codebook inovador é suficientemente povoado, aplicar a abordagem inventiva melhorará o ganho de codificação. Mais especificamente, em taxas de bit mais altas a melhoria do formato não pode ser necessária, pois o codebook inovador é grande o suficiente para modelar corretamente a fina estrutura da fala, e outro melhoramento do formato tornará o som do sinal sintetizado muito sintético. Entretanto, os ótimos códigos não são espectralmente planos e adicionar uma inclinação espectral melhorará o ganho de codificação. De acordo com as aplicações, a inclinação ideal para aplicar ao códigos do codebook inovador é estimada mais precisamente, mais especificamente, é correlacionada à inclinação da estrutura atual do sinal de entrada.
[0013] De acordo com as aplicações, a inclinação espectral da estrutura atual do sinal de áudio é determinada com base na informação do envelope espectral para a estrutura atual do sinal de áudio, em que a informação do envelope espectral pode ser definida pelos coeficientes de LPC. Esta aplicação é desvantajosa, pois permite determinar a inclinação espectral da estrutura atual com base na informação prontamente disponível tanto no codificador quanto no decodificador, a saber, os coeficientes de LPC.
[0014] De acordo com outras aplicações, a inclinação espectral da estrutura atual do sinal de áudio, com base nos coeficientes de LPC, pode ser determinada com base em uma resposta de impulso infinito truncada do filtro de síntese de LPC. De acordo com as aplicações, o truncamento pode ser determinado pelo tamanho do codebook inovador, ou seja, pelo número de códigos no codebook inovador. Esta abordagem é vantajosa, pois permite se referir diretamente à determinação da inclinação espectral ao tamanho real do codebook inovador.
[0015] De acordo com outras aplicações, a resposta de impulso infinito pode ser de um filtro de síntese de LPC tendo uma função de transferência não ponderada ou uma função de transferência ponderada. Utilizando a função de transferência não ponderada permite uma determinação simplificada da inclinação espectral, enquanto utiliza a função de transferência ponderada é vantajoso, pois permite uma inclinação espectral tendo um declive mais próximo à inclinação ideal.
[0016] De acordo com as aplicações, a inclinação espectral determinada é aplica ao respectivo código pela filtragem do código do codebook com base em uma função de transferência que inclui a inclinação espectral. Esta aplicação é vantajosa, pois por um processo de filtragem simples a melhoria pode ser obtida.
[0017] Ainda de acordo com outra aplicação, a inclinação espectral da estrutura atual pode ser combinada com um fator relacionado à voz da estrutura anterior do sinal de áudio, por exemplo, pela filtragem do código do codebook com base em uma função de transferência incluindo a inclinação espectral e o fator. Esta abordagem é vantajosa, pois fornece uma possibilidade para obter uma melhor estimativa da inclinação ideal.
[0018] A presente invenção fornece um decodificador de áudio compreendendo o aparelho inventivo para sintetizar um sinal de áudio.
[0019] A presente invenção fornece um decodificador de áudio para decodificar um sinal de áudio, em que o decodificador de áudio é configurado para aplicar uma inclinação espectral ao código de um codebook utilizado para sintetizar uma estrutura atual do sinal de áudio, em que a inclinação espectral é baseada na inclinação espectral da estrutura atual do sinal de áudio.
[0020] A presente invenção fornece um codificador para codificar um sinal de áudio, em que o codificador de áudio é configurado para determinar de uma inclinação espectral de uma estrutura atual do sinal de áudio uma inclinação espectral para um código de um codebook que representa uma estrutura atual do sinal de áudio.
[0021] A presente invenção fornece um sistema, compreendendo o decodificador de áudio inventivo e o codificador de áudio inventivo.
[0022] A presente invenção fornece um meio de computador não transitório que armazena instruções para realizar, ao executar em um computador, o método inventivo para sintetizar um sinal de áudio.
[0023] As aplicações da presente invenção agora serão descritas em mais detalhes com referência aos desenhos anexos, nos quais:
[0024] A Figura 1 mostra uma representação esquemática do aparelho inventivo para sintetizar um sinal de áudio de acordo com uma primeira aplicação;
[0025] A Figura 2 mostra um diagrama em blocos simplificado de um sintetizador de sinal de acordo com uma segunda aplicação da invenção, que opera com base no esquema de CELP;
[0026] A Figura 3 mostra um diagrama em blocos simplificado de um sintetizador de sinal de acordo com outra aplicação da presente invenção, novamente aplicando o esquema de codificação de CELP que incorpora a voz de uma estrutura anterior;
[0027] A Figura 4 mostra uma aplicação de um decodificador, por exemplo, um decodificador de fala operando de acordo com os ensinamentos da presente invenção; e
[0028] A Figura 5 mostra uma aplicação de um codificador, por exemplo, um codificador de fala operando de acordo com os ensinamentos da presente invenção.
[0029] A seguir, as aplicações da abordagem inventiva serão descritas. É observado que na descrição subsequente elementos/etapas semelhantes são referidos pelos mesmos sinais de referência.
[0030] A figura 1 mostra uma representação esquemática do aparelho inventivo para sintetizar um sinal de áudio de acordo com uma primeira aplicação. O aparelho 100 recebe em uma entrada 102 um sinal codificado, por exemplo, um sinal de áudio codificado, como um sinal de fala. Para codificar o sinal de áudio, o aparelho 100 compreende um codebook 104 incluindo uma pluralidade de códigos. Para sintetizar o sinal, ao processar uma estrutura atual, com base no sinal codificado recebido na entrada 102, um código ou palavra código apropriado é selecionado do codebook 104 e fornecido ao sintetizador ou filtro de síntese 106. De acordo com a presente invenção, o aparelho compreende a unidade de processamento 108 que determina, com base na inclinação espectral da estrutura atual do sinal de áudio, ou seja, a estrutura do sinal de áudio atualmente processada pelo aparelho 100, uma inclinação espectral a ser aplicada ao código c(n) lido do codebook 104, como é esquematicamente representado em 110, O código modificado c(n)*Y é aplicado ao filtro de síntese 106 que gera com base no código modificado um sinal sintetizado que é fornecido à saída 112 do aparelho 100, A unidade de processamento 108 pode determinar a inclinação espectral com base na informação do envelope espectral para a estrutura atual, por exemplo, coeficientes de filtro para o filtro de síntese 106 que estão disponíveis no aparelho 100.
[0031] De acordo com outras aplicações, uma compensação de inclinação adaptativa para formar os códigos de um codebook inovador de CELP será descrita. A figura 2 mostra um diagrama em blocos simplificado de um sintetizador de sinal 200 de acordo com uma segunda aplicação da invenção, que opera com base no esquema de CELP. De acordo com o esquema de CELP, o sintetizador 200 inclui um codebook fixo ou inovador 202 e um codebook adaptativo 204. Dependente do sinal codificado, para uma estrutura atual que é atualmente processada pelo sintetizador 200, um código é emitido dos respectivos codebooks 202 e 204. O sintetizador 200 compreende um somador ou combinador 206 para combinar os códigos recebidos dos respectivos codebooks 202 e 204. A saída do somador 206 é conectada a um filtro de síntese de LPC 208 para sintetizar o sinal de áudio de saída e emitir em uma saída 210, De acordo com as aplicações, o sintetizador 200 pode incluir um primeiro amplificador 212 para multiplicar uma contribuição do codebook fixo 202 por um ganho de código desejado. Ainda, um segundo amplificador 214 pode ser fornecido para multiplicar a contribuição do codebook adaptativo 204 de acordo com um ganho de tom, pois a contribuição do codebook adaptativo modela o tom da fala. De acordo com outra aplicação ainda um armazenamento do coeficiente de LPC 216, como uma memória ou semelhante, pode ser fornecido para armazenar os coeficientes de LPC que são disponíveis no decodificador incluindo o sintetizador 200, Os coeficientes de LPC são fornecidos ao filtro de síntese 208 para fornecer a filtragem de síntese de LPC desejada.
[0032] O sintetizador 200 inclui o filtro 218 que é conectado entre o codebook fixo 202 e o primeiro amplificador 212. O filtro 218 recebe do armazenamento 216 os coeficientes de LPC para a estrutura atual. Por meios da estrutura inventiva a inclinação da estrutura de áudio que é atualmente processada é recuperada dos coeficientes de LPC já transmitidos que são armazenados no armazenamento 216. De acordo com a aplicação da figura 2, assume-se que fs(n) é a resposta de impulso do filtro de síntese de LPC 208 tendo a função de transferência Fs(z) = 1M(z), e a inclinação é determinada como segue pelo filtro 218:
Figure img0004
[0033] onde N é o tamanho do truncamento da resposta de impulso infinito fs(n). De acordo com uma aplicação, N é igual ao tamanho do codebook inovador, ou seja, N é igual ao número de códigos ou palavras código armazenados no codebook inovador. A inclinação espectral é aplicada, de acordo com a aplicação da figura 2, ao código c(n) recuperado do codebook fixo 202 por uma operação de filtragem fornecida no filtro 218. A operação de filtragem é definida como segue:
Figure img0005
[0034] onde ft1(n) é a resposta de impulso da seguinte função de transferência:
Figure img0006
[0035] A aplicação da figura 2 é vantajosa, pois permite melhorar a qualidade perceptual do sinal decodificado melhorando o ganho de codificação. A melhoria do ganho de codificação é obtida pela filtragem de uma palavra código ou código recuperado do codebook fixo 202 por uma função de transferência incluindo uma inclinação espectral que é determinada com base na resposta de impulso da função de transferência do filtro de síntese de LPC 208.
[0036] De acordo com uma terceira aplicação, para melhorar mais a inclinação espectral a estar mais próxima a uma inclinação ideal, ou seja, para estar mais próxima à inclinação da estrutura atual real do sinal de entrada, o filtro de síntese de LPC 208 tem a seguinte função de transferência:
Figure img0007
[0037] com w1 = 0,8 e w2 = 0,9. Neste caso, a inclinação espectral é definida como segue:
Figure img0008
[0038] As constantes de ponderação w1 e w2 são utilizados para controlar a dinâmica do envelope espectral. Por exemplo, se w1 = 0 e w2 = 1, então Fe(z) segue de forma próxima o envelope do sinal verdadeiro. A inclinação espectral resultante Y mostrará uma alta dinâmica e pode flutuar muito. Essa pode ser a solução para taxas de bit muito baixas onde o codebook definitivamente não possui estrutura de inclinação. Entretanto, foi observado perceptualmente que é melhor deduzir a inclinação espectral Y de uma versão nivelada do envelope espectral. Um bom nivelamento foi observado ser obtido com os valores acima w1 = 0,8 e w2 = 0,9, que mostra um bom equilíbrio para uma grande faixa de taxas de bit. De acordo com as aplicações, w1 e w2 são dependentes da taxa de bit. Em taxas muito altas se o codebook for grande o suficiente e puder modelar quaisquer inclinações espectrais Y, um pode desligar a influência da inclinação espectral Y definindo w1 = w2 = 1.
[0039] Quando comparado com a segunda aplicação, que produz uma inclinação tendo um declive mais íngreme do que a inclinação ideal teria, a terceira aplicação utilizando uma função de transferência “ponderada” fornecer uma inclinação que é mais próxima à inclinação da estrutura atual real.
[0040] A figura 3 mostra outro diagrama em blocos simplificado de um sintetizador de sinal 200’ de acordo com uma quarta aplicação da presente invenção, novamente aplicando o esquema de codificação de CELP. Quando comparado às aplicações descritas com relação à figura 2, a aplicação descrita com relação à figura 3 ainda aplica o fator mencionado acima relacionado à voz de uma estrutura anterior. Como pode ser visto da figura 3, a estrutura do sintetizador 200’ é substancialmente a mesma que a estrutura do sintetizador 200 da figura 2, exceto que além de um estimador de voz 220 ser fornecido, ele recebe a saída no amplificador 214 e as contribuições combinadas dos codebooks adaptativos e inovadores emitidos pelo somador 206. O estimador de voz emite um sinal ao filtro 280 de modo que o código ou palavra código obtido do codebook inovador 202 seja modificado com base em uma inclinação determinada (veja a figura 2 e a descrição acima) combinada com um fator de voz. Mais especificamente, de acordo com a aplicação da figura 3, a inclinação espectral determinada é combinada com o fator β que se refere a voz da estrutura anterior. A abordagem descrita com relação à figura 3 é vantajosa, pois permite obter uma estimativa ainda melhor da inclinação a ser aplicada à palavra código quando comparada às aplicações descritas com relação às figuras 1 e 2. A modificação do código ou formação do código podem ainda ser consideradas como uma operação de filtragem utilizando uma função de transferência como segue:
Figure img0009
[0041] onde a e b são constantes. Em uma aplicação preferida, a = 0,5 e b = 0,25. O fator β pode ser deduzido da voz de uma estrutura anterior como segue:
Figure img0010
[0042] e o fator real β pode ser determinado como segue:
Figure img0011
[0043] As constantes a e b são aplicadas para controlar a mistura de inclinação de voz β e a inclinação espectral Y- Conforme mencionado acima com relação às constantes de ponderação w1 e w2, para taxas de bit médias ou baixas, pode ser relevante formar o codebook afinando as baixas frequências ou altas frequências com base na inclinação espectral Y. Também foi observado que quanto mais voz o sinal tiver melhor para afinar as altas frequências. As constantes a e b podem ser utilizadas para normalizar os fatores de inclinação β e Y e ponderar suas tensões a fim de combinar os dois efeitos conforme desejado. De acordo com as aplicações, as constantes a e b podem ser encontradas empiricamente avaliando a qualidade perceptual. Isso fornece sobre a mesma tensão em ambos os fatores: Y é limitado entre -1 e 1, assim b^Y está entre -0,25 e 0,25 e β é limitado entre 0 e 0,5 assim a • β é limitado entre 0 e 0,25. Como para as constantes de ponderação w1 e w2, ainda as constantes a e b podem se tornar dependentes da taxa de bit.
[0044] De acordo com a quarta aplicação, a síntese de áudio conforme mostrado na figura 3 é de modo que a contribuição do codebook adaptativo é multiplicada por um ganho chamado ganho de tom, pois a contribuição modela o tom da fala. O código inovador é primeiro filtrado por Ft2(z) para adicionar a inclinação espectral ao código, em que a inclinação, conforme descrito acima, é correlacionada a inclinação da estrutura atual do sinal a ser sintetizado. A saída do filtro 218 é multiplicada pelo ganho de código, e as duas contribuições, a contribuição multiplicada do codebook adaptativo e a contribuição multiplicada modificada do codebook inovador são resumidos pelo somador 206 antes de serem filtrados pelo filtro de síntese para gerar o sinal de saída sintetizado na saída 210.
[0045] A figura 4 mostra uma aplicação de um decodificador, por exemplo um decodificador de fala operando de acordo com os ensinamentos da presente invenção. O decodificador 300 inclui um sintetizador 100, 200, 200’ de acordo com uma das aplicações descritas acima. O decodificador tem uma entrada 302 que recebe um sinal codificado que é processado pelo decodificador e o sintetizador para gerar em uma saída 304 do decodificador 300 um sinal decodificado.
[0046] A figura 5 mostra uma aplicação de um codificador, por exemplo, um codificador de fala operando de acordo com os ensinamentos da presente invenção. O codificador 400 inclui uma unidade de processamento 402 para codificar um sinal de áudio. Ainda, a unidade de processamento determinar de uma inclinação espectral de uma estrutura atual da informação do sinal de áudio (por exemplo, dos coeficientes de LPC disponíveis no codificador) que representa uma inclinação espectral para um código de um, codebook no decodificador que representa uma estrutura atual do sinal de áudio. Esta informação pode ser transmitida junto com os códigos do sinal de áudio ao lado do decodificador onde pode ser aplicado na sintetização do sinal de áudio. A inclinação espectral pode ser determinada no codificador em uma forma descrita acima com relação às figuras de 1 a 3 e pode ser aplicada no decodificador conforme descrito acima com relação às figuras de 1 a 3. Assim, as aplicações da invenção fornecem o codificador de áudio acima conforme mostrado na figura 5 junto com um decodificador de áudio para decodificar um sinal de áudio, em que o decodificador de áudio não precisa necessariamente determinar a inclinação espectral, ainda, é configurado para aplicar a inclinação espectral recebida do codificador ao código de um codebook utilizado para sintetizar uma estrutura atual do sinal de áudio. Por exemplo, o decodificador pode ter um sintetizador como o nas figuras de 1 a 3, exceto que a unidade de processamento 108 ou filtro 218 recebem a inclinação calculada e transmitida do codificador. A inclinação recebida pode ser armazenada, por exemplo, no armazenamento 216 ou em outro armazenamento.
[0047] Embora alguns aspectos foram descritos no contexto de um aparelho, é claro que estes aspectos também representam uma descrição do método correspondente, onde um bloco ou dispositivo corresponde a uma etapa do método ou um recurso de uma etapa do método. Analogamente, os aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco ou item ou recurso correspondente de um aparelho correspondente. Algumas ou todas as etapas do método podem ser executadas (ou utilizando) por um aparelho de hardware, como, por exemplo, um microprocessador, um computador programável ou um circuito eletrônico. Em algumas aplicações, uma ou mais das etapas do método mais importantes podem ser executadas por tal aparelho.
[0048] Dependendo de certas exigências da implementação, as aplicações da invenção podem ser implementadas em hardware ou em software. A implementação pode ser realizada utilizando um meio de armazenamento não transitório como um meio de armazenamento digital, por exemplo, um disquete, um DVD, um Blu-Ray, um CD, uma memória ROM, uma PROM, e EPROM, uma EEPROM ou uma memória FLASH, tendo sinais de controle eletronicamente legíveis armazenados nelas, que cooperam (ou podem cooperar) com um sistema de computador programável de modo que o respectivo método seja realizado. Assim, o meio de armazenamento digital pode ser legível por computador.
[0049] Algumas aplicações de acordo com a invenção compreendem um transportador de dados tendo sinais de controle eletronicamente legíveis, que podem cooperar com um sistema de computador programável, de modo que um dos métodos descritos aqui seja realizado.
[0050] Geralmente, as aplicações da presente invenção podem ser implementadas como um produto do programa de computador com um código do programa, o código do programa sendo operativo para realizar um dos métodos quando o produto do programa de computador é executado em um computador. O código do programa pode, por exemplo, ser armazenado em um transportador legível por máquina.
[0051] Outra aplicação do método inventivo é, assim, um transportador de dados (ou um meio de armazenamento digital, ou um meio legível por computador) compreendendo, gravado nele, o código do programa para realizar um dos métodos descritos aqui. O transportador de dados, o meio de armazenamento digital ou o meio gravado são tipicamente tangíveis e/ou não transitório.
[0052] Outra aplicação compreende um meio de processamento, por exemplo, um computador ou um dispositivo lógico programável, configurado para, ou programado, para realizar um dos métodos descritos aqui.
[0053] Em algumas aplicações, um dispositivo lógico programável (por exemplo, uma matriz de campo de portas programáveis) pode ser utilizado para realizar algumas ou todas as funcionalidades dos métodos descritos aqui. Em algumas aplicações, uma matriz de campo de portas programáveis pode cooperar com um microprocessador a fim de realizar um dos métodos descritos aqui. Geralmente, os métodos são preferivelmente realizados por qualquer aparelho de hardware.
[0054] As aplicações descritas acima são meramente ilustrativas para os princípios da presente invenção. Entende- se que as modificações e variações das disposições e detalhes descritos aqui serão evidentes aos técnicos no assunto. É a intensão, assim, ser limitada apenas pelo escopo das reivindicações da patente iminentes e não pelos detalhes específicos apresentados em forma de descrição e explicação das aplicações neste documento.
REFERÊNCIAS
[0055] [1] Recomendação ITU-T G.718 : “Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s”
[0056] [2] Patente Norte-Americana 6,678,651 B2, “Short-Term Enhancement in CELP Speech Coding”.

Claims (26)

1. Um aparelho para sintetizar um sinal de áudio, compreendendo: uma unidade de processamento (108, 110, 218) configurado para aplicar uma inclinação espectral ao código de um codebook (104, 202) utilizado para sintetizar uma estrutura atual do sinal de áudio, caracterizado pela inclinação espectral ser baseada na inclinação espectral da estrutura atual do sinal de áudio, em que o aparelho é configurado para determinar a inclinação espectral da estrutura atual do sinal de áudio com base na informação do envelope espectral para a estrutura atual do sinal de áudio, e em que a unidade de processamento (108, 110, 218) é configurada para aplicar a inclinação espectral pela filtragem do código do codebook (104, 202) com base em uma função de transferência que modela a inclinação espectral.
2. O aparelho, de acordo com a reivindicação 1, caracterizado pela informação do envelope espectral ser definida pelos coeficientes de LPC, e em que a inclinação espectral da estrutura atual do sinal de áudio é definida como segue:
Figure img0012
com: fs(n) a resposta de impulso infinito de um filtro de síntese de LPC (106, 208) tendo a função de transferência Fs(z) = 1/A (z), e N o tamanho do truncamento da resposta de impulso infinito fs(n).
3. O aparelho, de acordo com a reivindicação 1, caracterizado pela informação do envelope espectral ser definida pelos coeficientes de LPC, e em que a inclinação espectral da estrutura atual do sinal de áudio é definida como segue:
Figure img0013
com: fe(n) a resposta de impulso infinito de um filtro de síntese de LPC (106, 208) tendo a função de transferência
Figure img0014
N o tamanho do truncamento da resposta de impulso infinito fs(n), e w1, w2 constantes de ponderação para definir a estrutura formântica da função de transferência Fe(z).
4. O aparelho, de acordo com a reivindicação 2 ou 3, caracterizado por N ser igual ao número de códigos no codebook (104, 202).
5. O aparelho, de acordo com a reivindicação 1, caracterizado pela função de transferência incluindo a inclinação espectral ser definida como segue:
Figure img0015
com: Y inclinação espectral.
6. O aparelho, de acordo com qualquer uma das reivindicações de 1 a 5, caracterizado pela unidade de processamento (108, 110, 218) ainda ser configurada para combinar a inclinação espectral determinada da estrutura atual do sinal de áudio com um fator relacionado à voz da estrutura anterior do sinal de áudio.
7. O aparelho, de acordo com a reivindicação 6, caracterizado pelo fator relacionado à voz da estrutura anterior do sinal de áudio ser definido como segue:
Figure img0016
com:
Figure img0017
8. O aparelho, de acordo com a reivindicação 6 ou 7, caracterizado pela unidade de processamento (108, 110, 218) ser configurada para aplicar a inclinação espectral pela filtragem do código do codebook (104, 202) com base em uma função de transferência incluindo a inclinação espectral e o fator relacionado à voz da estrutura anterior do sinal de áudio.
9. O aparelho, de acordo com a reivindicação 8, caracterizado pela função de transferência incluindo a inclinação espectral ser definida como segue:
Figure img0018
com: a, b constantes.
10. O aparelho, de acordo com qualquer uma das reivindicações de 1 a 19, caracterizado pelo sinal de áudio ser um sinal de fala, em que a unidade de processamento para aplicar a inclinação espectral compreende um filtro (218), e em que o aparelho ainda compreende: um codebook adaptativo (204), um codebook fixo (202), o filtro (218) acoplado ao codebook fixo (202), o filtro (218) sendo configurado para aplicar a inclinação espectral determinada ao código do codebook fixo (202) para obter um código filtrado do codebook fixo (202) , um somador (206) acoplado ao codebook adaptativo (204) e ao filtro (218), o somador (206) configurado para combinar um código do codebook adaptativo (204) e o código filtrado do codebook fixo (202) para obter um código combinado, e um filtro de síntese de LPC (208) acoplado ao somador (206).
11. O aparelho, de acordo com a reivindicação 10, caracterizado por compreender: um amplificador de ganho de tom (214) acoplado entre o codebook adaptativo (204) e o somador (206), o amplificador de ganho de tom (214) configurado para multiplicar o código do codebook adaptativo (204) com um ganho de tom, e um amplificador de ganho de código (212) acoplado entre o filtro (218) e o somador (206), o amplificador de ganho de código (212) configurado para multiplicar o código filtrado do codebook fixo (202) com um ganho de código.
12. O aparelho, de acordo com a reivindicação 10 ou 11, caracterizado por compreender: um estimador de voz (220) acoplado ao codebook adaptativo (204) e ao somador (206), o estimador de voz (220) configurado para emitir um fator relacionado à voz da estrutura anterior do sinal de áudio ao filtro (218), e um armazenamento (216) configurado para armazenar coeficientes de LPC que descrevem a informação do envelope espectral para a estrutura atual do sinal de áudio, o armazenamento (216) sendo acoplado ao filtro (218).
13. Um decodificador de áudio, caracterizado por compreender um aparelho para sintetizar um sinal de áudio, de acordo com qualquer uma das reivindicações 1 ou 12.
14. Um sistema, caracterizado por compreender: um decodificador de áudio, de acordo com a reivindicação 13, e um codificador de áudio configurado para determinar de uma inclinação espectral de uma estrutura atual do sinal de áudio uma inclinação espectral para um código de um codebook (104, 202) que representa uma estrutura atual do sinal de áudio.
15. Um método para sintetizar um sinal de áudio, o método compreendendo: aplicar uma inclinação espectral ao código de um codebook (104, 202) utilizado para sintetizar uma estrutura atual do sinal de áudio, caracterizado pela inclinação espectral ser determinada com base na inclinação espectral da estrutura atual do sinal de áudio, em que a inclinação espectral da estrutura atual do sinal de áudio ser determinada com base na informação do envelope espectral para a estrutura atual do sinal de áudio, e em que a aplicação da inclinação espectral compreende filtragem do código do codebook (104, 202) com base em uma função de transferência que modela a inclinação espectral.
16. O método, de acordo com a reivindicação 15, caracterizado pela informação do envelope espectral ser definida pelos coeficientes de LPC, e em que a inclinação espectral da estrutura atual do sinal de áudio é determinada como segue:
Figure img0019
com: fs(n) a resposta de impulso infinito de um filtro de síntese de LPC (106, 208) tendo a função de transferência Fs(z) = 1/A (z), e N o tamanho do truncamento da resposta de impulso infinito fs(n).
17. O método, de acordo com a reivindicação 15, caracterizado pela informação do envelope espectral ser definida pelos coeficientes de LPC, e em que a inclinação espectral da estrutura atual do sinal de áudio é determinada como segue:
Figure img0020
com: fe(n) a resposta de impulso infinito de um filtro de síntese de LPC (106, 208) tendo a função de transferência ,
Figure img0021
N o tamanho do truncamento da resposta de impulso infinito fs(n), e w1, w2 constantes de ponderação para definir a estrutura formântica da função de transferência Fβ(z).
18. O método, de acordo com a reivindicação 16 ou 17, caracterizado por N ser igual ao número de códigos no codebook (104, 202).
19. O método, de acordo com a reivindicação 15 caracterizado pela função de transferência incluindo a inclinação espectral ser determinada como segue:
Figure img0022
com: Y inclinação espectral.
20. O método, de acordo com qualquer uma das reivindicações de 15 a 19, caracterizado por compreender a combinação da inclinação espectral determinada da estrutura atual do sinal de áudio com um fator relacionado à voz da estrutura anterior do sinal de áudio.
21. O método, de acordo com a reivindicação 20, caracterizado pelo fator relacionado à voz da estrutura anterior do sinal de áudio ser determinado como segue:
Figure img0023
22. O método, de acordo com a reivindicação 20 ou 21, caracterizado pela aplicação da inclinação espectral compreender a filtragem do código do codebook (104, 202) com base em uma função de transferência incluindo a inclinação espectral e o fator relacionado à voz da estrutura anterior do sinal de áudio.
23. O método, de acordo com a reivindicação 22, caracterizado pela função de transferência incluindo a inclinação espectral ser determinada como segue:
Figure img0024
com: a, b constantes.
24. O método, de acordo com qualquer uma das reivindicações de 15 a 23, caracterizado pelo sinal de áudio ser um sinal de fala, e em que a síntese do sinal de áudio compreende uma estrutura do sinal de áudio: aplicar a inclinação espectral determinada ao código de um codebook fixo (202) para obter um código filtrado do codebook fixo (202), combinar um código de um codebook adaptativo (204) e o código filtrado do codebook fixo (202) para obter um código combinado, e filtrar o código combinado por um filtro de síntese de LPC (208).
25. O método, de acordo com a reivindicação 24, caracterizado por compreender multiplicar o código do codebook adaptativo (204) com um ganho de tom, e multiplicar o código filtrado do codebook fixo (202) com um ganho de código.
26. O método, de acordo com a reivindicação 24 ou 25, caracterizado por compreender: com base no código do codebook adaptativo (204) e o código combinado, gerar um fator relacionado à voz da estrutura anterior do sinal de áudio, e armazenar coeficientes de LPC que descrevem a informação do envelope espectral para a estrutura atual do sinal de áudio.
BR112015018023-0A 2013-01-29 2014-01-28 Aparelho e método para sintetizar um sinal de áudio, decodificador, codificador e sistema BR112015018023B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361758098P 2013-01-29 2013-01-29
US61/758,098 2013-01-29
PCT/EP2014/051592 WO2014118156A1 (en) 2013-01-29 2014-01-28 Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program

Publications (2)

Publication Number Publication Date
BR112015018023A2 BR112015018023A2 (pt) 2017-08-22
BR112015018023B1 true BR112015018023B1 (pt) 2022-06-07

Family

ID=50033504

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112015018023-0A BR112015018023B1 (pt) 2013-01-29 2014-01-28 Aparelho e método para sintetizar um sinal de áudio, decodificador, codificador e sistema

Country Status (20)

Country Link
US (3) US10431232B2 (pt)
EP (1) EP2951819B1 (pt)
JP (1) JP6082126B2 (pt)
KR (1) KR101737254B1 (pt)
CN (1) CN105009210B (pt)
AR (1) AR094683A1 (pt)
AU (1) AU2014211524B2 (pt)
BR (1) BR112015018023B1 (pt)
CA (1) CA2899059C (pt)
ES (1) ES2626977T3 (pt)
HK (1) HK1217564A1 (pt)
MX (1) MX347316B (pt)
MY (1) MY183444A (pt)
PL (1) PL2951819T3 (pt)
PT (1) PT2951819T (pt)
RU (1) RU2618919C2 (pt)
SG (1) SG11201505903UA (pt)
TW (1) TWI544481B (pt)
WO (1) WO2014118156A1 (pt)
ZA (1) ZA201506318B (pt)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2626977T3 (es) * 2013-01-29 2017-07-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, procedimiento y medio informático para sintetizar una señal de audio

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
JP3522012B2 (ja) * 1995-08-23 2004-04-26 沖電気工業株式会社 コード励振線形予測符号化装置
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
US6385573B1 (en) * 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6480822B2 (en) * 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6463410B1 (en) * 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6242748B1 (en) 1999-08-10 2001-06-05 Edax, Inc. Methods and apparatus for mounting an X-ray detecting unit to an electron microscope
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6678651B2 (en) * 2000-09-15 2004-01-13 Mindspeed Technologies, Inc. Short-term enhancement in CELP speech coding
US6996523B1 (en) 2001-02-13 2006-02-07 Hughes Electronics Corporation Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system
CN1320966C (zh) 2002-05-20 2007-06-13 松下电器产业株式会社 清洗方法及清洗装置
US20060089836A1 (en) * 2004-10-21 2006-04-27 Motorola, Inc. System and method of signal pre-conditioning with adaptive spectral tilt compensation for audio equalization
US7475103B2 (en) 2005-03-17 2009-01-06 Qualcomm Incorporated Efficient check node message transform approximation for LDPC decoder
AU2006232364B2 (en) * 2005-04-01 2010-11-25 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding
TWI317933B (en) * 2005-04-22 2009-12-01 Qualcomm Inc Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same
EP1722360B1 (en) 2005-05-13 2014-03-19 Harman Becker Automotive Systems GmbH Audio enhancement system and method
US7454335B2 (en) * 2006-03-20 2008-11-18 Mindspeed Technologies, Inc. Method and system for reducing effects of noise producing artifacts in a voice codec
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
EP2063418A4 (en) * 2006-09-15 2010-12-15 Panasonic Corp AUDIO CODING DEVICE AND AUDIO CODING METHOD
RU2439721C2 (ru) * 2007-06-11 2012-01-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Аудиокодер для кодирования аудиосигнала, имеющего импульсоподобную и стационарную составляющие, способы кодирования, декодер, способ декодирования и кодированный аудиосигнал
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
CA2699316C (en) * 2008-07-11 2014-03-18 Max Neuendorf Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing
ES2453098T3 (es) * 2009-10-20 2014-04-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Códec multimodo de audio
AU2011241424B2 (en) * 2010-04-14 2016-05-05 Voiceage Evs Llc Flexible and scalable combined innovation codebook for use in CELP coder and decoder
US9294060B2 (en) * 2010-05-25 2016-03-22 Nokia Technologies Oy Bandwidth extender
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US9706314B2 (en) * 2010-11-29 2017-07-11 Wisconsin Alumni Research Foundation System and method for selective enhancement of speech signals
JP5328883B2 (ja) * 2011-12-02 2013-10-30 パナソニック株式会社 Celp型音声復号化装置およびcelp型音声復号化方法
EP3067890B1 (en) * 2013-01-29 2018-01-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
ES2626977T3 (es) * 2013-01-29 2017-07-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, procedimiento y medio informático para sintetizar una señal de audio
RU2648953C2 (ru) * 2013-01-29 2018-03-28 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Наполнение шумом без побочной информации для celp-подобных кодеров
CN110223704B (zh) * 2013-01-29 2023-09-15 弗劳恩霍夫应用研究促进协会 对音频信号的频谱执行噪声填充的装置
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
MX355091B (es) * 2013-10-18 2018-04-04 Fraunhofer Ges Forschung Concepto para codificar una señal de audio y decodificar una señal de audio usando información de conformación espectral relacionada con la voz.
KR20160070147A (ko) * 2013-10-18 2016-06-17 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 결정론적 및 잡음 유사 정보를 사용하는 오디오 신호의 인코딩 및 오디오 신호의 디코딩을 위한 개념
CN104751849B (zh) * 2013-12-31 2017-04-19 华为技术有限公司 语音频码流的解码方法及装置
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
US9672843B2 (en) * 2014-05-29 2017-06-06 Apple Inc. Apparatus and method for improving an audio signal in the spectral domain
US9373342B2 (en) * 2014-06-23 2016-06-21 Nuance Communications, Inc. System and method for speech enhancement on compressed speech
CN106228991B (zh) * 2014-06-26 2019-08-20 华为技术有限公司 编解码方法、装置及系统
CN106486129B (zh) * 2014-06-27 2019-10-25 华为技术有限公司 一种音频编码方法和装置

Also Published As

Publication number Publication date
MX347316B (es) 2017-04-21
CA2899059A1 (en) 2014-08-07
TW201435862A (zh) 2014-09-16
AR094683A1 (es) 2015-08-19
CN105009210B (zh) 2018-04-10
RU2618919C2 (ru) 2017-05-12
MY183444A (en) 2021-02-18
EP2951819B1 (en) 2017-03-01
TWI544481B (zh) 2016-08-01
HK1217564A1 (zh) 2017-01-13
AU2014211524A1 (en) 2015-09-17
US11996110B2 (en) 2024-05-28
BR112015018023A2 (pt) 2017-08-22
US20190378528A1 (en) 2019-12-12
US20150332694A1 (en) 2015-11-19
EP2951819A1 (en) 2015-12-09
AU2014211524B2 (en) 2016-07-07
KR20150112028A (ko) 2015-10-06
US11373664B2 (en) 2022-06-28
US20220293114A1 (en) 2022-09-15
CA2899059C (en) 2018-05-15
KR101737254B1 (ko) 2017-05-17
JP6082126B2 (ja) 2017-02-15
PL2951819T3 (pl) 2017-08-31
CN105009210A (zh) 2015-10-28
RU2015136788A (ru) 2017-03-06
ZA201506318B (en) 2016-07-27
MX2015009749A (es) 2015-11-06
PT2951819T (pt) 2017-06-06
JP2016509694A (ja) 2016-03-31
SG11201505903UA (en) 2015-08-28
US10431232B2 (en) 2019-10-01
WO2014118156A1 (en) 2014-08-07
ES2626977T3 (es) 2017-07-26

Similar Documents

Publication Publication Date Title
US7877253B2 (en) Systems, methods, and apparatus for frame erasure recovery
US7502734B2 (en) Method and device for robust predictive vector quantization of linear prediction parameters in sound signal coding
US11328739B2 (en) Unvoiced voiced decision for speech processing cross reference to related applications
EP1288915B1 (en) Method and system for waveform attenuation of error corrupted speech frames
US11996110B2 (en) Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program
KR20220045260A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
JP5323144B2 (ja) 復号装置およびスペクトル整形方法
JP5127170B2 (ja) 復号装置およびスペクトル整形方法
WO2012053146A1 (ja) 符号化装置及び符号化方法
JP5323145B2 (ja) 復号装置およびスペクトル整形方法
BR112016008544B1 (pt) Codificador para codificar e decodificador para decodificar um sinal de áudio, método para codificar e método para decodificar um sinal de áudio.

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 28/01/2014, OBSERVADAS AS CONDICOES LEGAIS