BRPI9913756B1 - processos de codificação e decodificação, codificador, decodificador, processos de seleção de arquivo de código para codificação e decodificação e aparelhos de seleção de arquivo de código para codificação e decodificação de bloco de sinal de celp de taxa de bit fixa de multi-dicionário - Google Patents

processos de codificação e decodificação, codificador, decodificador, processos de seleção de arquivo de código para codificação e decodificação e aparelhos de seleção de arquivo de código para codificação e decodificação de bloco de sinal de celp de taxa de bit fixa de multi-dicionário Download PDF

Info

Publication number
BRPI9913756B1
BRPI9913756B1 BRPI9913756A BR9913756A BRPI9913756B1 BR PI9913756 B1 BRPI9913756 B1 BR PI9913756B1 BR PI9913756 A BRPI9913756 A BR PI9913756A BR 9913756 A BR9913756 A BR 9913756A BR PI9913756 B1 BRPI9913756 B1 BR PI9913756B1
Authority
BR
Brazil
Prior art keywords
dictionary
signal block
identification
dictionaries
decoding
Prior art date
Application number
BRPI9913756A
Other languages
English (en)
Other versions
BRPI9913756B8 (pt
BR9913756A (pt
Inventor
Anders Uvliden
Jonas Svedberg
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=20412632&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BRPI9913756(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Publication of BR9913756A publication Critical patent/BR9913756A/pt
Publication of BRPI9913756B1 publication Critical patent/BRPI9913756B1/pt
Publication of BRPI9913756B8 publication Critical patent/BRPI9913756B8/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

"processo de codificação/decodificação, codificador/decodificador, processo de seleção de arquivo de código para codificação/decodificação e aparelho de seleção de arquivo de código para codificação/decodificação de bloco de sinal de celp de taxa de bit fixa de multi-arquivo de código, e, estrutura de multi-arquivo de código algébrica" um codificador/decodificador de bloco de sinal de celp de taxa de bita fixa de multi-arquivo de código inclui um seletor de arquivo de código (22) para selecionar, para cada bloco de sinal, uma identificação de arquivo de código correspondente de acordo com um procedimento de seleção determinístico que é independente de tipo de sinal. incluído também está meio para codificar/decodificar cada bloco de sinal usando um arquivo de código que tem a identificação de arquivo de código selecionada.

Description

“PROCESSOS DE CODIFICAÇÃO E DECODIFICAÇÃO, CODIFICADOR, DECODIFICADOR, PROCESSOS DE SELEÇÃO DE DICIONÁRIO PARA CODIFICAÇÃO E DECODIFICAÇÃO, E APARELHOS DE SELEÇÃO DE DICIONÁRIO PARA CODIFICAÇÃO E DECODIFICAÇÃO DE BLOCO DE SINAL DE CELP DE TAXA DE BIT FIXA DE MULTI-DICIONÁRIO’’ CAMPO TÉCNICO A presente invenção relaciona-se a um processo e aparelho de codificação/decodifícação de bloco de sinal CELP de taxa de bit fixa de multi-dicionário (“multi-codebook”) e uma estrutura de multi-dicionário.
FUNDAMENTOS DA INVENÇÃO
Codificadores de fala CELP usam tipicamente dicionários (“codebooks”) para armazenar vetores de excitação que são destinados para excitar filtros de síntese para produzir um sinal de fala sintético. Para altas taxas de bit estes dicionários contêm uma variedade grande de vetores de excitação para enfrentar um grande espectro de tipos de som. Porém, em baixas taxas de bit, por exemplo, ao redor de 4-7 kbits/s, o número de bits disponíveis para o índice de dicionário é limitado que significa que o número de vetores para escolher deve ser reduzido. Portanto, codificadores de baixa taxa de bit terão uma estrutura de dicionário que é compromisso entre precisão e riqueza. Tais codificadores darão boa qualidade de fala para alguns tipos de som e qualidade pouco aceitável para outros tipos de som.
Para resolver este problema com codificadores de baixa taxa de bit um número de soluções de multi-modo foram apresentadas [1-5].
Referências [1-2] descrevem processos de codificação de taxa de bit variável que usam alocação de bit dinâmica, onde o tipo de som a ser codificado controla o número de bits que são usados para codificar.
Referências [3-4] descrevem processos de codificação de taxa de bit constante que usam vários dicionários de tamanho Igual que são otimizados para tipos de som diferentes. O tipo de som a ser codificado controla dicionário que é usado, Estes processos de codificação da arte prévia todos têm a desvantagem que informação de modo tem que ser transferida do codificador para decodificador para o decodificador usar o modo de decodificação correto. Tal informação de modo, porém, requer largura de banda extra.
Referência [5] descreve um processo de codificação de multi-modo de taxa de bit constante que também usa dicionários de tamanho igual. Neste caso um ganho de dicionário adaptável já determinado do subquadro prévio é usado para trocar de um modo de codificação para outro modo de codificação. Como este parâmetro é transferido de codificador para decodificador de qualquer modo, nenhuma informação de modo extra é requerida. Este processo, porém, é sensível a erros de bit no fator de ganho causado pelo canal de transferência.
SUMÁRIO DA INVENÇÃO
Um objetivo da presente invenção é um esquema de codificação/decodificação no qual codificação é melhorada sem a necessidade de explicitamente transmitir informação de modo de codificação de codificador para decodificador.
Este objetivo é resolvido conforme as reivindicações inclusas.
Brevemente, a presente invenção alcança o objetivo acima usando vários diferentes dicionários de tamanho igual. Cada dicionário é fraco para alguns sinais, mas os outros dicionários não compartilham esta fraqueza para esses sinais. Comutando deterministicamente (sem levar em conta tipo de sinal) entre esses dicionários de bloco de fala para bloco de faia, a qualidade de codificação é melhorada. Não há nenhuma necessidade de transferir informação na qual dicionário foi selecionado para um bloco de fala particular, como ambos codificador e decodificador usam o mesmo algoritmo de comutação determinístico. BREVE DESCRIÇÃO DOS DESENHOS A invenção, junto com objetivos adicionais e vantagens dela, pode ser entendida melhor fazendo referência à descrição seguinte tomada junto com os desenhos acompanhantes, em que: Figura 1 é um diagrama de blocos da parte de síntese de um codificador/decodificador de CELP da arte previa;
Figura 2 é um diagrama de blocos da parte de síntese de um codificador/decodificador de CELP de acordo com a presente invenção;
Figura 3 é um diagrama que ilustra a estrutura de 4 dicionários algébricos diferentes que são projetados de acordo com uma concretização preferida da presente invenção;
Figura 4 é um diagrama de blocos da parte de síntese de outro codificador/decodificador de CELP de acordo com a presente invenção; e Figura 5 é um fluxograma que ilustra o processo de codificação/decodificação de CELP da presente invenção. DESCRIÇÃO DETALHADA DAS CONCRETIZAÇÕES PREFERIDAS Na descrição seguinte e nas reivindicações a expressão "codificador/decodificador" é pretendida significar tanto um codificador ou um decodificador, como a invenção é igualmente aplicável a ambos os casos.
Figura 1 é um diagrama de bloco da parte de síntese de um codificador/decodificador de CELP (Profético Linear Excitado por Código) da arte prévia. Vetores de código selecionados de um dicionário 10 são graduados por um fator de escala G em um bloco de ganho 12 e prosseguidos para um preditor de longo prazo 14 e posteriormente a um preditor de curto prazo 16. O sinal de saída de preditor de curto prazo 16 é o sinal de fala sintética final s(n) (antes de pós-processamento possível). Preditor de longo prazo 14 é controlado através de sinais de controle em uma linha de controle 18, cujos sinais de controle incluem um fator de escala (ganho) e um atraso (defasagem). Semelhantemente preditor de curto prazo 16 é controlado por sinais de controle que representam coeficientes de filtro em uma linha de controle 20, Um codificador determina os sinais de controle em linhas de controle 18, 20 e melhor vetor de dicionário por um procedimento de procura (análise por síntese), enquanto um decodificador determina os mesmos sinais de controle e vetor de dicionário de informação recebida através de um canal de transmissão.
Os princípios básicos da presente invenção serão agora descritos com referência para Figuras 2 e 3.
Figura 2 é um diagrama de bloco da parte de síntese de um codificador/decodificador de CELP de acordo com a presente invenção. Elementos 12-20 correspondem a elementos com a mesma designação de referência no aparelho da arte anterior de Figura 1. Porém, em vez de prover só um dicionário 10 como em Figura 1, o aparelho da presente invenção provê um conjunto de dicionários igualmente dimensionados 10A-D que têm vetores de comprimento igual. Em Figura 2 há 4 dicionários, mas o número de dicionários no conjunto pode ser maior e menor que este número. Porém, o conjunto deveria pelo menos incluir 2 dicionários . Como a taxa de bit é baixa, cada dicionário terá alguns pontos fracos. Portanto, os dicionários são projetados/instruídos de tal modo que dicionários diferentes no conjunto não têm os mesmos pontos fracos.
Um modo de ver um dicionário é considera-lo como um "almofada de agulhas11 (tipicamente de 40 dimensões) na qual as "agulhas" representam vetores de código. Neste modelo um dicionário de estocático não instruído seria representado por uma almofada de agulhas "hiper-esférica" na qual os vetores de código são distribuídos uniformemente em toda "direção" (o dicionário "branco "). O processo de instrução mencionado acima redistribui estes vetores de tal modo que certas "direções" são mais densamente povoadas que outras "direções". A "direções" menos densamente povoadas correspondem aos pontos fracos do dicionário . Cada dicionário é instruído diferentemente de um modo que assegure que os dicionários não tenham pontos fracos comuns.
Freqüentemente um dicionário de estocático é aproximado por um dicionário algébrico, veja [6]. Tal dicionário pode, por exemplo, conter vetores de código que têm um comprimento de 40 amostras. Porém, só muito poucas posições de amostra na verdade têm valores que diferem de zero. Além disso, em muitos tais dicionários algébricos os únicos valores permitidos (diferentes de zero) são + 1 ou - 1.
Figura 3 é um diagrama que ilustra a estrutura de 4 dicionário algébricos diferentes A-D que são projetados de acordo com uma concretização exemplar da presente invenção. Estes dicionários têm um comprimento de 40 amostras e correspondem a um subquadro de 5 ms de fala. Cada dicionário tem 2 pares de trilha TRILHA 0, TRILF1A 1. Cada trilha tem 8 posições de pulso permitidas P. Por exemplo, a segunda trilha no primeiro par de trilha TRILHA 0 em dicionário B permitiu posições de pulso em posições de amostra 3, 8, 13, 18, 23, 28, 33, 38. Como pode ser visto de Figura 3, as outras trilhas em um dicionário têm outras posições de pulso permitidas. Além disso, uma trilha de um dicionário também pode ser achada em outros dicionários, mas em outra trilha. Finalmente, cada dicionário excluiu posições de amostra, que foram excluídas em Figura 3. Estes são os "pontos fracos" do dicionário. Esta estrutura de dicionário é resumida na tabela seguinte: ESTRUTURA DE DICIONÁRIO
Quando um destes dicionários é pesquisado, 1 pulso é posicionado em uma das posições permitidas de trilha 0. e 1 pulso é posicionado em uma das posições permitidas de trilha 1 de um par de trilhas. Esta combinação de pulso é usada como um quadro de vetor de código potencial. O quadro inclui 4 vetores de código possíveis, isto é, 1 vetor que tem 2 pulsos positivos, 1 vetor que tem 2 pulsos negativos e 2 vetores que têm 1 pulso positivo e 1 negativo. Deslocando posições de pulso dentro de cada uma das 2 trilhas no par de trilhas, é possível formar outros tais quadros de vetor de código. Os mesmos princípios se aplicam a par de trilhas 1. Testando cada possível combinação, o melhor vetor de código é selecionado, Este vetor de código é definido por seu par de trilhas correspondente, 2 posições de pulso nas trilhas deste par, e pelos sinais de pulso. Isto exige 1 bit para especificar par de trilhas, 2*3 = 6 bits para especificar posições de pulso (há 8 posições em uma trilha, que requer 3 bits) nas trilhas deste par, e 2 bits para especificar o sinal de cada pulso. Assim, um total de 9 bits define um vetor de código.
Retomando a Figura 2, um seletor de dicionário 22 seleciona um dos dicionários no conjunto para codificar/decodificar um bloco de sinal, por exemplo, um quadro de fala ou subquadro (tipicamente um bloco tem uma duração de 5-10 ms). Isto é feito controlando uma chave 23 com um sinal de controle em uma linha de controle 24. Chave 23 é controlada conforme um procedimento de seleção determinístico que é independente de tipo de sinal. Aqui "determinístico" significa que seletor de dicionários 22 seleciona dicionários do conjunto para codificação/decodificaçâo de cada bloco de sinal, mas faz isto sem qualquer conhecimento de tipo de sinal, e que o algoritmo de seleção é o mesmo para ambos codificador e decodificador e não tem que ser transferido de codificador para decodificador. O codificador determina o melhor vetor do dicionário selecionado conforme o procedimento de procura mencionado acima, enquanto o decodificador seleciona o vetor correspondente no mesmo dicionário usando o "índice" recebido (identificador de vetor de código).
Os dicionários 10A-D todos têm a mesma taxa de bit, seus pontos de desempenho mais fracos não são compartilhados. Comutando deterministicamente entre os dicionários de bloco de sinal para bloco de sinal, as deficiências de cada dicionário serão compensadas com o passar do tempo. Foi achado que a qualidade de som percebida média dos sinais de áudio codificados e posteriormente decodificados de fato aumenta a despeito do fato que tipo de sinal é desconsiderado no algoritmo de comutação. Isto pode ser explicado notando que a distorção resultante de um único dicionário não é repetida em cada subquadro ou bloco. Ao invés disso as distorções variadas serão alisadas. Assim, a distorção deste dicionário (multí) de baixa taxa de bit é percebida menos irritante, como não é repetida continuamente.
Uma concretização do algoritmo de seleção é para consecutivamente e ciclicamente selecionar cada dicionário 10A-D. O codificador e decodificador estão automaticamente em sincronismo se o número de dicionários corresponde ao número de subquadros em um quadro e um contador de dicionário em codificador e decodificador é reajustado a cada quadro. De outra forma sincronização pode ser alcançada reajustando um modulo de n contadores, onde n é o número de dicionários, em ambos codificador e decodificador em estabelecimento de chamada e transferencia de passagem.
Outro algoritmo de seleção é para usar uma seqüência pseudo-aleatória para selecionar dicionários do conjunto. Neste caso, a fonte do algoritmo que gera a seqüência pseudo-aleatória é conhecida para ambos codificador e decodificador. Sincronização entre codificador e decodificador pode, por exemplo, ser alcançada por uma seqüência pseudo-aleatória que é baseada em parâmetros de quadro transmitidos e recebidos que são determinados e analisados antes da pesquisa de dicionário.
Figura 4 é um diagrama de bloco da parte de síntese de outro codificador/decodiíicador de CELP de acordo com a presente invenção. Esta concretização é semelhante à concretização de Figura 2, mas neste caso há vários conjuntos 26A-C de dicionários. Cada conjunto contém dicionários que não compartilham os mesmos pontos fracos, da mesma maneira que em Figura 2, mas cada conjunto também é projetado para enfrentar ambientes diferentes, por exemplo tipos de sinal diferentes ou níveis de sons de fundo. O projeto de cada conjunto pode ser executado, por exemplo, de acordo com os princípios descritos em [5]. Figura 4 ilustra 3 conjuntos de dicionários, mas 2 ou mais que 3 conjuntos também são possíveis.
Como em Figura 2, um dicionário é deterministicamente selecionado para cada bloco de sinal, nesta concretização através de chaves 23 A-C e linhas de controle 24A-C. Porém, antes que um dicionário seja selecionado de um conjunto, um seletor de conjunto 28 determina qual o conjunto usar através de uma chave 29 e uma linha de controle 30. Seletor de conjunto 28 baseia sua seleção em informação contida nos outros parâmetros previamente determinados em linhas 18, 20 e em elemento de ganho 12. Esta informação pode, por exemplo, ser determinada dos parâmetros de LPC (Codificação Profética Linear) ou LTP (Preditor de Longo Prazo) ou de uma combinação de parâmetros de LPC e LTP. Por exemplo, imobilidade detectada de parâmetros de LTP pode ser usada para indicar tipo de sinal.
Devido ao fato que os parâmetros que são usados para seleção de conjunto serão transferidos de codificador para decodificador de qualquer modo, nenhuma largura de banda é perdida para transferir informação de seleção de conjunto. Preferentemente só parâmetros protegidos de canal são usados para detecção de conjunto. Além disso, uma concretização especialmente preferida do codificador/decodificador de Figura 4 usa só as partes dos parâmetros protegidos de canal que têm detecção de erro para determinar o conjunto dicionário para usar. Por exemplo, no sistema de GSM 6 dos 9 bits de atraso e 3 dos 4 bits de ganho dos parâmetros de LTP são providos com detecção de erro. Preferentemente, estes bits são usados para testar imobilidade (por, digamos, 20 ms) para determinar conjunto de dicionário .
Como a seleção de conjunto precede a seleção de dicionário, a concretização de Figura 4 permite um número diferente de dicionários em cada conjunto 26A-C. Isto requer uma linha de controle separada para cada chave 23A-C e um algoritmo de comutação separado em seletor de dicionário 22 para cada conjunto. Se todos os conjuntos têm o mesmo número de dicionários, uma linha de controle comum para todas as chaves pode ser usada. Além disso, esta concretização permite a possibilidade de inverter as seleções de conjunto e dicionário (se permitido por considerações de causalidade).
Tipicamente a funcionalidade de seletores de conjunto e dicionário 22, 28 é implementada por um ou vários microprocessadores ou combinações de micro/processador de sinal.
Figura 5 é um fluxograma que ilustra o processo de codificação/decodificação de CELP da presente invenção. O processo começa em etapa SI selecionando o próximo bloco para ser codificado/decodificado. Etapa S2 seleciona um número de dicionário de acordo com um algoritmo de seleção determinístico. Etapa S3 seleciona/recupera o melhor vetor do dicionário selecionado. Depois disso, o procedimento retoma à etapa SL Se vários conjuntos de dicionário são usados, como na concretização de Figura 3, haverá uma etapa extra S4 (mostrada com linhas tracejadas em Figura 5) que determina o conjunto de dicionário próprio. Esta etapa S4 pode preceder ou seguir depois de etapa S2 (se permitido por considerações de causalidade).
Será entendido por aqueles qualificados na arte que várias modificações e mudanças podem ser feitas à presente invenção sem afastamento do âmbito dela, que é definida pelas reivindicações anexas.
REFERÊNCIAS
[1] M. Yong e A. Gersho, "Vector Excitation Coding with Dynamic Bit Allocation", Proc. GLOBCOM, pp 290-294, Dezembro de 1988.
[2] N. S. Jayant e J. H. Chen, "Speech Coding with Time-Varying Bit Allocation to Excitation and LPC Parameters", Proc. ICASSP, pp 65-68, Maio de 1989.
[3] T. Taniguchi e outros, "Multimode Coding: Application to CELP", Proc. ICASSP, pp 156-159, Maio de 1989.
[4] M. Akamine e K. Miseki, "CELP Coding with an Adaptive Density Pulse Excitation Model", Proc. ICASSP, pp 29-32,1990.
[5] K. Ozawa e M. Serizawa, "High Quality Multi-Pulse Based CELP Speech Coding at 6.4 kb/s and its Subjective Evaluation", Proc. CASSP, pp 153-156, 1998.
[6] J-P Adoul e outros, "Fast CELP Coding Based on Algebraic Codes", Proc. ICASSP, pp 1957-1960,1987.
REIVINDICAÇÕES

Claims (44)

1. Processo de codificação de bloco de sinal de CELP de taxa de bit fixa de multi-dicionário, caracterizado pelo fato de: selecionar, para cada bloco de sinal, uma identificação de dicionário correspondente de acordo com um procedimento de seleção determinístico que é independente de tipo de sinal; e codificar cada bloco de sinal usando um dicionário que tem dita identificação de dicionário selecionada.
2. Processo de codificação de acordo com a reivindicação 1, caracterizado pelo fato de: prover vários conjuntos de dicionários; determinar, para cada bloco de sinal, um conjunto correspondente de dicionários com base em valores previamente determinados de outros parâmetros caracterizantes de bloco de sinal; selecionar, para cada bloco de sinal, uma identificação de dicionário correspondente no conjunto determinado de acordo com um procedimento de seleção determinístico que é independente de tipo de sinal; e codificar cada bloco de sinal usando um dicionário de dito conjunto determinado que tem dita identificação de dicionário selecionada.
3. Processo de codificação de acordo com a reivindicação 2, caracterizado pelo fato de ditos outros parâmetros serem protegidos em canal.
4. Processo de codificação de acordo com a reivindicação 3, caracterizado pelo fato de usar só partes de ditos parâmetros protegidos em canal que permitem detecção de erro.
5. Processo de codificação de acordo com qualquer uma das reivindicações 1 a 4, caracterizado pelo fato de dito procedimento de seleção determinístico ser definido escalonando ciclicamente através de cada identificação de dicionário.
6. Processo de codificação de acordo com qualquer uma das reivindicações 1 a 4, caracterizado pelo fato de dito procedimento de seleção determinístico ser definido pseudo-aleatoriamente escalonando através de cada identificação de dicionário.
7. Processo de codificação de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de ditos dicionários serem dicionários fixos.
8. Processo de codificação de acordo com a reivindicação 7, caracterizado pelo fato de ditos dicionários serem dicionários algébricos.
9. Processo de codificação de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo fato de dito bloco de sinal ser um quadro de áudio.
10. Processo de codificação de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo fato de dito bloco de sinal ser um subquadro de áudio.
11. Codificador de bloco de sinal de CELP de taxa de bit fixa de multí-dicionário, caracterizado pelo fato de compreender; um seletor de dicionário (22) para selecionar, para cada bloco de sinal, uma identificação de dicionário correspondente de acordo com um procedimento de seleção determinístico que é independente de tipo de sinal; e meio para codificar cada bloco de sinal usando um dicionário que tem dita identificação de dicionário selecionada.
12. Codificador de acordo com a reivindicação 11, caracterizado pelo fato de compreender; vários conjuntos (26A-C) de dicionários; um seletor de conjunto (28) para determinar, para cada bloco de sinal, um conjunto correspondente de dicionários com base em valores previamente determinados de outros parâmetros caracterizantes de bloco de sinal; um seletor de dicionário (22) para selecionar, para cada bloco de sinal, uma identificação de dicionário correspondente no conjunto determinado de acordo com um procedimento de seleção determinístico que é independente de tipo de sinal; e meio para codificar cada bloco de sinal usando um dicionário de dito conjunto determinado que tem dita identificação de dicionário selecionada.
13. Codificador de acordo com a reivindicação 11 ou 12, caracterizado pelo fato de dito seletor de dicionário (22) ciclicamente escalonar através de cada identificação de dicionário.
14. Codificador de acordo com a reivindicação 11 ou 12, caracterizado pelo fato de dito seletor de dicionário (22) escalonar pseudo-aleatoriamente através de cada identificação de dicionário.
15. Codificador de acordo com qualquer uma das reivindicações 11 a 14, caracterizado pelo fato de ditos dicionário (10A-D) serem dicionários fixos.
16. Codificador de acordo com a reivindicação 15, caracterizado pelo fato de ditos dicionário (10A-D) serem dicionários algébricos.
17. Processo de seleção de dicionário para codificação de bloco de sinal de CELP de taxa de bit fixa de multi-dicionário, caracterizado pelo fato de compreender: selecionar, para cada bloco de sinal, uma identificação de dicionário correspondente de acordo com um procedimento de seleção detenninístico que é independente de tipo de sinal.
18. Processo de seleção de dicionário de acordo com a reivindicação 17, caracterizado pelo fato de dito procedimento de seleção determinístico ser definido escalonando ciclicamente através de cada identificação de dicionário em um conjunto de dicionários.
19. Processo de seleção de dicionário de acordo com a reivindicação 17, caracterizado pelo fato de dito procedimento de seleção determinístico ser definido pseudo-aleatori amente escalonando através de cada identificação de dicionário em um conjunto de dicionários.
20. Aparelho de seleção de dicionário para codificação de bloco de sinal de CELP de taxa de bit fixa de multi-dicionário, caracterizado pelo fato de compreender: um seletor de dicionário (22) para selecionar, para cada bloco de sinal, uma identificação de dicionário correspondente de acordo com um procedimento de seleção determinístico que é independente de tipo de sinal.
21. Aparelho de seleção de dicionário de acordo com a reivindicação 20, caracterizado pelo fato de dito seletor de dicionário (22) ciclicamente escalonar através de cada identificação de dicionário em um conjunto de dicionários.
22. Aparelho de seleção de dicionário de acordo com a reivindicação 20, caracterizado pelo fato de dito seletor de dicionário (22) pseudo-aleatoriamente escalonar através de cada identificação de dicionário em um conjunto de dicionários.
23. Processo de decodificação de bloco de sinal de CELP de taxa de bit fixa de multi-dicionário, caracterizado pelo fato de: selecionar, para cada bloco de sinal, uma identificação de dicionário correspondente de acordo com um procedimento de seleção determinístico que é independente de tipo de sinal; e decodificar cada bloco de sinal usando um dicionário que tem dita identificação de dicionário selecionada.
24. Processo de decodificação de acordo com a reivindicação 23, caracterizado pelo fato de: prover vários conjuntos de dicionários; determinar, para cada bloco de sinal, um conjunto correspondente de dicionários com base em valores previamente determinados de outros parâmetros caracterizantes de bloco de sinal; selecionar, para cada bloco de sinal, uma identificação d< dicionário correspondente no conjunto determinado de acordo com un procedimento de seleção determinístico que é independente de tipo de sinal; € decodificar cada bloco de sinal usando um dicionário de dite conjunto determinado que tem dita identificação de dicionário selecionada.
25. Processo de decodificação de acordo com a reivindicaçãc 24, caracterizado pelo fato de ditos outros parâmetros serem protegidos eir canal.
26. Processo de decodificação de acordo com reivindicaçãc 25, caracterizado pelo fato de usar só partes de ditos parâmetros protegidos em canal que permitem detecção de erro.
27. Processo de decodificação de acordo com qualquer uma das reivindicações 23 a 26, caracterizado pelo fato de dito procedimento de seleção determinístico ser definido escalonando ciclicamente através de cada identificação de dicionário,
28. Processo de decodificação de acordo com qualquer uma das reivindicações 23 a 27, caracterizado pelo fato de dito procedimento de seleção determinístico ser definido pseudo-aleatoriamente escalonando através de cada identificação de dicionário.
29. Processo de decodificação de acordo com qualquer uma das reivindicações 23 a 27, caracterizado pelo fato de ditos dicionários serem dicionários fixos.
30. Processo de decodificação de acordo com a reivindicação 29, caracterizado pelo fato de ditos dicionários serem dicionários algébricos.
31. Processo de decodificação de acordo com qualquer uma das reivindicações 23 a 30, caracterizado pelo fato de dito bloco de sinal ser um quadro de áudio.
32. Processo de decodificação de acordo com qualquer uma das reivindicações 23 a 30, caracterizado pelo fato de dito bloco de sinal ser um subquadro de áudio.
33. Decodificador de bloco de sinal de CELP de taxa de bit fixa de multi-dicionário, caracterizado pelo fato de compreender: um seletor de dicionário (22) para selecionar, para cada bloco de sinal, uma identificação de dicionário correspondente de acordo com um procedimento de seleção determinístico que é independente de tipo de sinal; e meio para decodificar cada bloco de sinal usando um dicionário que tem dita identificação de dicionário selecionada.
34. Decodificador de acordo com a reivindicação 33, caracterizado pelo fato de compreender: vários conjuntos (26A-C) de dicionários; um seletor de conjunto (28) para determinar, para cada bloco de sinal, um conjunto correspondente de dicionários com base em valores previamente determinados de outros parâmetros caracterizantes de bloco de sinal; um seletor de dicionário (22) para selecionar, para cada bloco de sinal, uma identificação de dicionário correspondente no conjunto determinado de acordo com um procedimento de seleção determinístico que é independente de tipo de sinal; e meio para decodificar cada bloco de sinal usando um dicionário de dito conjunto determinado que tem dita identificação de dicionário selecionada.
35. Decodificador de acordo com reivindicação 33 ou 34, caracterizado pelo fato de dito seletor de dicionário (22) ciclicamente escalonar através de cada identificação de dicionário.
36. Decodificador de acordo com reivindicação 33 ou 34, caracterizado peio fato de dito seletor de dicionário (22) escalonar pseudo-aleatoriamente através de cada identificação de dicionário.
37. Decodificador de acordo com qualquer uma das reivindicações 33 a 36, caracterizado pelo fato de ditos dicionário (10A-D) serem dicionários fixos.
38. Decodificador de acordo com a reivindicação 37, caracterizado pelo fato de ditos dicionário (10A-D) serem dicionários algébricos.
39. Processo de seleção de dicionário para decodificação de bloco de sinal de CELP de taxa de bit fixa de multi-dicionário, caracterizado pelo fato de compreender: selecionar, para cada bloco de sinal, uma identificação de dicionário correspondente de acordo com um procedimento de seleção determinístico que é independente de tipo de sinal.
40. Processo de seleção de dicionário de acordo com reivindicação 39, caracterizado pelo fato de dito procedimento de seleção determinístico ser definido escalonando ciclicamente através de cada identificação de dicionário em um conjunto de dicionários.
41. Processo de seleção de dicionário de acordo com reivindicação 39, caracterizado pelo fato de dito procedimento de seleção determinístico ser definido pseudo-aleatoriamente escalonando através de cada identificação de dicionário em um conjunto de dicionários.
42. Aparelho de seleção de dicionário para decodificação de bloco de sinal de CELP de taxa de bit fixa de multi-dicionário, caracterizado pelo fato de compreender: um seletor de dicionário (22) para selecionar, para cada bloco de sinal, uma identificação de dicionário correspondente de acordo com um procedimento de seleção determinístico que é independente de tipo de sinal.
43. Aparelho de seleção de dicionário de acordo com reivindicação 42, caracterizado pelo fato de dito seletor de dicionário (22) ciclicamente escalonar através de cada identificação de dicionário em um conjunto de dicionários.
44. Aparelho de seleção de dicionário de acordo com reivindicação 42, caracterizado pelo fato de dito seletor de dicionário (22) pseudo-aleatoriamente escalonar através de cada identificação de dicionário em um conjunto de dicionários.
BRPI9913756A 1998-09-16 1999-08-24 processos de codificação e decodificação, codificador, decodificador, processos de seleção de dicionário para codificação e decodificação, e aparelhos de seleção de dicionário para codificação e decodificação de bloco de sinal de celp de taxa de bit fixa de multi-dicionário BRPI9913756B8 (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE9803164A SE521225C2 (sv) 1998-09-16 1998-09-16 Förfarande och anordning för CELP-kodning/avkodning
PCT/SE1999/001432 WO2000016314A2 (en) 1998-09-16 1999-08-24 Celp encoding/decoding method and apparatus

Publications (3)

Publication Number Publication Date
BR9913756A BR9913756A (pt) 2001-06-05
BRPI9913756B1 true BRPI9913756B1 (pt) 2016-07-05
BRPI9913756B8 BRPI9913756B8 (pt) 2016-08-02

Family

ID=20412632

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI9913756A BRPI9913756B8 (pt) 1998-09-16 1999-08-24 processos de codificação e decodificação, codificador, decodificador, processos de seleção de dicionário para codificação e decodificação, e aparelhos de seleção de dicionário para codificação e decodificação de bloco de sinal de celp de taxa de bit fixa de multi-dicionário

Country Status (15)

Country Link
US (2) US7146311B1 (pt)
EP (1) EP1114413B1 (pt)
JP (1) JP4651195B2 (pt)
KR (1) KR100416362B1 (pt)
CN (1) CN1143270C (pt)
AR (1) AR020466A1 (pt)
AU (1) AU756483B2 (pt)
BR (1) BRPI9913756B8 (pt)
CA (1) CA2343191C (pt)
DE (1) DE69929069T2 (pt)
MY (1) MY121083A (pt)
SE (1) SE521225C2 (pt)
TW (1) TW516275B (pt)
WO (1) WO2000016314A2 (pt)
ZA (1) ZA200101866B (pt)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU6725500A (en) * 1999-08-23 2001-03-19 Matsushita Electric Industrial Co., Ltd. Voice encoder and voice encoding method
JP3900000B2 (ja) 2002-05-07 2007-03-28 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
KR100465316B1 (ko) * 2002-11-18 2005-01-13 한국전자통신연구원 음성 부호화기 및 이를 이용한 음성 부호화 방법
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
JP5174651B2 (ja) * 2005-03-09 2013-04-03 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 低演算量符号励振線形予測符号化
US8031583B2 (en) 2005-03-30 2011-10-04 Motorola Mobility, Inc. Method and apparatus for reducing round trip latency and overhead within a communication system
KR100795727B1 (ko) * 2005-12-08 2008-01-21 한국전자통신연구원 Celp기반의 음성 코더에서 고정 코드북 검색 장치 및방법
US8712766B2 (en) * 2006-05-16 2014-04-29 Motorola Mobility Llc Method and system for coding an information signal using closed loop adaptive bit allocation
CA2671068C (en) * 2006-11-29 2015-06-30 Loquendo S.P.A. Multicodebook source-dependent coding and decoding
KR101398836B1 (ko) * 2007-08-02 2014-05-26 삼성전자주식회사 스피치 코덱들의 고정 코드북들을 공통 모듈로 구현하는방법 및 장치
JP2011518345A (ja) * 2008-03-14 2011-06-23 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション スピーチライク信号及びノンスピーチライク信号のマルチモードコーディング
KR101520685B1 (ko) * 2008-07-04 2015-05-15 엘지전자 주식회사 복수의 코드북을 이용하는 다중 셀 환경에서의 셀 간 간섭 제거 방법
US20120008687A1 (en) * 2010-07-06 2012-01-12 Apple Inc. Video coding using vector quantized deblocking filters
US9628821B2 (en) 2010-10-01 2017-04-18 Apple Inc. Motion compensation using decoder-defined vector quantized interpolation filters
CA2929800C (en) * 2010-12-29 2017-12-19 Samsung Electronics Co., Ltd. Apparatus and method for encoding/decoding for high-frequency bandwidth extension
AU2012217158B2 (en) 2011-02-14 2014-02-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
PL2676268T3 (pl) 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
ES2535609T3 (es) 2011-02-14 2015-05-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de audio con estimación de ruido de fondo durante fases activas
CN103493129B (zh) 2011-02-14 2016-08-10 弗劳恩霍夫应用研究促进协会 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法
PT2676267T (pt) * 2011-02-14 2017-09-26 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
BR112013020324B8 (pt) 2011-02-14 2022-02-08 Fraunhofer Ges Forschung Aparelho e método para supressão de erro em fala unificada de baixo atraso e codificação de áudio
PL2676266T3 (pl) 2011-02-14 2015-08-31 Fraunhofer Ges Forschung Układ kodowania na bazie predykcji liniowej wykorzystujący kształtowanie szumu w dziedzinie widmowej

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8500843A (nl) * 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
JPH02250100A (ja) * 1989-03-24 1990-10-05 Mitsubishi Electric Corp 音声符合化装置
JPH0365822A (ja) * 1989-08-04 1991-03-20 Fujitsu Ltd ベクトル量子化符号器及びベクトル量子化復号器
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
JP2796408B2 (ja) * 1990-06-18 1998-09-10 シャープ株式会社 音声情報圧縮装置
JP3151874B2 (ja) * 1991-02-26 2001-04-03 日本電気株式会社 音声パラメータ符号化方式および装置
JPH04333900A (ja) * 1991-05-10 1992-11-20 Matsushita Electric Ind Co Ltd 音声符号化装置
US5371853A (en) * 1991-10-28 1994-12-06 University Of Maryland At College Park Method and system for CELP speech coding and codebook for use therewith
JPH05265496A (ja) * 1992-03-18 1993-10-15 Hitachi Ltd 複数のコードブックを有する音声符号化方法
US5717824A (en) * 1992-08-07 1998-02-10 Pacific Communication Sciences, Inc. Adaptive speech coder having code excited linear predictor with multiple codebook searches
DE4335305A1 (de) * 1993-10-16 1995-04-20 Philips Patentverwaltung Verfahren und Schaltungsanordnung zur Übertragung von Sprachsignalen
JPH07202820A (ja) 1993-12-28 1995-08-04 Matsushita Electric Ind Co Ltd ビットレート制御システム
JP3020819B2 (ja) * 1994-10-20 2000-03-15 ダイワ精工株式会社 魚釣用リ−ル
JPH08179796A (ja) * 1994-12-21 1996-07-12 Sony Corp 音声符号化方法
FR2729245B1 (fr) * 1995-01-06 1997-04-11 Lamblin Claude Procede de codage de parole a prediction lineaire et excitation par codes algebriques
SE506379C3 (sv) * 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
TW321810B (pt) 1995-10-26 1997-12-01 Sony Co Ltd
KR0176788B1 (ko) * 1995-12-27 1999-04-01 구자홍 음성인식의 자동모델 결정방법
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
JPH1020889A (ja) * 1996-07-01 1998-01-23 Matsushita Electric Ind Co Ltd 音声符号化装置および記録媒体
JPH1020891A (ja) * 1996-07-09 1998-01-23 Sony Corp 音声符号化方法及び装置
US6055496A (en) * 1997-03-19 2000-04-25 Nokia Mobile Phones, Ltd. Vector quantization in celp speech coder
TW408298B (en) * 1997-08-28 2000-10-11 Texas Instruments Inc Improved method for switched-predictive quantization
KR19990061297A (ko) * 1997-12-31 1999-07-26 정몽규 자동차의 음성명령 인식방법 및 음성명령 인식장치

Also Published As

Publication number Publication date
MY121083A (en) 2005-12-30
SE9803164L (sv) 2000-03-17
CN1318189A (zh) 2001-10-17
CN1143270C (zh) 2004-03-24
CA2343191A1 (en) 2000-03-23
JP2002525666A (ja) 2002-08-13
DE69929069T2 (de) 2006-07-20
KR20010075133A (ko) 2001-08-09
BRPI9913756B8 (pt) 2016-08-02
US7194408B2 (en) 2007-03-20
EP1114413A2 (en) 2001-07-11
BR9913756A (pt) 2001-06-05
KR100416362B1 (ko) 2004-01-31
TW516275B (en) 2003-01-01
AU6375699A (en) 2000-04-03
US20050096901A1 (en) 2005-05-05
ZA200101866B (en) 2001-09-11
AU756483B2 (en) 2003-01-16
SE9803164D0 (sv) 1998-09-16
EP1114413B1 (en) 2005-12-21
SE521225C2 (sv) 2003-10-14
AR020466A1 (es) 2002-05-15
DE69929069D1 (de) 2006-01-26
JP4651195B2 (ja) 2011-03-16
CA2343191C (en) 2009-10-27
WO2000016314A3 (en) 2000-06-08
WO2000016314A2 (en) 2000-03-23
US7146311B1 (en) 2006-12-05

Similar Documents

Publication Publication Date Title
BRPI9913756B1 (pt) processos de codificação e decodificação, codificador, decodificador, processos de seleção de arquivo de código para codificação e decodificação e aparelhos de seleção de arquivo de código para codificação e decodificação de bloco de sinal de celp de taxa de bit fixa de multi-dicionário
Kroon et al. A class of analysis-by-synthesis predictive coders for high quality speech coding at rates between 4.8 and 16 kbit/s
US5940791A (en) Method and apparatus for speech analysis and synthesis using lattice ladder notch filters
ES2266312T3 (es) Indexacion de posiciones y señales de pulso en codigos de cifrado y descifrado algebraicos para la codificacion de señales de banda ancha.
EP1141947B1 (en) Variable rate speech coding
ES2627212T3 (es) Modificación de palabras de código en diccionario usado para codificación eficaz de datos espectrales de medio digital
ES2380962T3 (es) Procedimiento y aparato para codificación de baja tasa de transmisión de bits de habla sorda de alto rendimiento
BRPI0715516A2 (pt) sistemas, mÉtodos e equipamentos para limitar fator de ganho
KR100310811B1 (ko) 정보 신호 코드화 방법 및 장치
BRPI0714825A2 (pt) Sistemas e métodos para incluir um identificador a um pacote associado a um sinal de fala
BRPI0717495B1 (pt) sistemas, métodos, e equipamentos para recuperação de apagamento de quadro
BRPI0518004B1 (pt) Método para codificar um sinal de fala, dispositivo de codificação, decodificador e sistema de comunicação
JP3054438B2 (ja) 線型予測音声符号器における音源パルスの位置決め方法
EP0186763B1 (en) Method of and device for speech signal coding and decoding by vector quantization techniques
BRPI0015070B1 (pt) método para codificar frames de fala, e, codificador de fala para reduzir sensibilidade às condições de erro de frame
CN104254886B (zh) 自适应编码浊音语音的基音周期
Honkanen et al. Enhanced full rate speech codec for IS-136 digital cellular system
EP0556354A1 (en) Error protection for multimode speech coders
US6704703B2 (en) Recursively excited linear prediction speech coder
Cuperman et al. Backward adaptation for low delay vector excitation coding of speech at 16 kbit/s
KR101008529B1 (ko) 오디오 인코딩에서의 정현파 선택
Bouzid et al. Optimized trellis coded vector quantization of LSF parameters, application to the 4.8 kbps FS1016 speech coder
Loo Intraframe and interframe coding of speech spectral parameters
Burnett et al. Waveform interpolation and analysis-by-synthesis-a good match?
Yang et al. Performance of pitch synchronous multi-band (PSMB) speech coder with error-correction coding

Legal Events

Date Code Title Description
B06A Notification to applicant to reply to the report for non-patentability or inadequacy of the application [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B15K Others concerning applications: alteration of classification

Free format text: A CLASSIFICACAO ANTERIOR ERA: G10L 9/12

Ipc: G10L 19/22 (2013.01)

B16A Patent or certificate of addition of invention granted

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 05/07/2016, OBSERVADAS AS CONDICOES LEGAIS.

B16C Correction of notification of the grant

Free format text: REFERENTE A PUBLICACAO NA RPI 2374 DE 05/07/2016 QUANTO AO TITULO E A FORMATACAO DO DOCUMENTO.