BRPI0720873A2 - Sistemas e métodos para escurecer um primeiro pacote associado a uma primeira taxa de bit para um segundo pacote associado a uma segunda taxa de bit. - Google Patents

Sistemas e métodos para escurecer um primeiro pacote associado a uma primeira taxa de bit para um segundo pacote associado a uma segunda taxa de bit. Download PDF

Info

Publication number
BRPI0720873A2
BRPI0720873A2 BRPI0720873-1A BRPI0720873A BRPI0720873A2 BR PI0720873 A2 BRPI0720873 A2 BR PI0720873A2 BR PI0720873 A BRPI0720873 A BR PI0720873A BR PI0720873 A2 BRPI0720873 A2 BR PI0720873A2
Authority
BR
Brazil
Prior art keywords
packet
rate
bits
bit rate
special
Prior art date
Application number
BRPI0720873-1A
Other languages
English (en)
Inventor
Vivek Rajendran
Ananthapadmanabhan A Kandhadai
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of BRPI0720873A2 publication Critical patent/BRPI0720873A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/16Central resource management; Negotiation of resources or communication parameters, e.g. negotiating bandwidth or QoS [Quality of Service]
    • H04W28/18Negotiating wireless communication parameters
    • H04W28/22Negotiating communication rate
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Description

SISTEMAS E MÉTODOS PARA ESCURECER UM PRIMEIRO PACOTE ASSOCIADO A UMA PRIMEIRA TAXA DE BIT PARA UM SEGUNDO PACOTE ASSOCIADO A UMA SEGUNDA TAXA DE BIT
CAMPO DA TÉCNICA
Os presentes sistemas e métodos se referem em geral à tecnologia de processamento de fala. Mais especificamente, os presentes sistemas e métodos se referem ao escurecimento de um primeiro pacote associado a uma primeira taxa de bits para um segundo pacote associado a uma segunda taxa de bits.
FUNDAMENTO
A transmissão de voz através de técnicas digitais tornou-se muito comum, particularmente em aplicações de telefonia em longa distância ou rádio digital. Isto, por sua vez, gerou interesse em determinar a menor quantidade de informação que pode ser enviada através de um canal enquanto mantém a qualidade captada da fala reconstruída. Dispositivos para compressão da fala encontram uso em muitos campos de telecomunicações. Um exemplo de telecomunicações é a comunicação sem fio. 0 campo das comunicações sem fio possui muitas aplicações incluindo, por exemplo, telefones sem fio, pagers, malhas locais sem fio, telefonia sem fio, tal como sistema de comunicação portátil e celular (PCS), sistemas de telefonia, sistemas de comunicação por satélite e telefonia por Protocolo de Internet (IP) móvel. Uma aplicação particularmente importante é a telefonia sem fio para assinantes móveis.
BREVE DESCRIÇÃO DOS DESENHOS
A Figura 1 ilustra uma configuração de um sistema de comunicação sem fio;
A Figura 2 é um diagrama em blocos ilustrando uma configuração de um ambiente de transmissão de sinal;
A Figura 3 é um diagrama em blocos ilustrando uma configuração de um encodificador multi-modo se comunicando com um decodificador multi-modo;
A Figura 4 é um diagrama em blocos ilustrando uma
configuração de uma função de interfuncionamento (IWF);
A Figura 5 é um diagrama em fluxo ilustrando uma configuração de um método de codificação de fala com taxa variável;
A Figura 6 é um diagrama em fluxo ilustrando uma
configuração de um método de escurecimento de pacote;
A Figura 6A é um diagrama em fluxo ilustrando uma configuração de decodificação de um pacote;
A Figura 7A é um diagrama ilustrando um quadro de fala com voz dividido em subquadros;
A Figura 7B é um diagrama ilustrando um quadro de fala sem voz divido em subquadros;
A Figura 7C é um diagrama ilustrando um quadro de fala transitório divido em subquadros;
A Figura 8 é um gráfico ilustrando os princípios
das técnicas de codificação por período de protótipo de pitch (PPP);
A Figura 9 é um mapa ilustrando o número de bits alocados para vários tipos de pacotes;
A Figura 10 é um diagrama em blocos ilustrando
uma configuração da conversão de um pacote PPP de taxa completa a um pacote PPP especial de meia taxa; e
A Figura 11 é um diagrama em blocos de certos componentes em uma configuração de um dispositivo de comunicações.
DESCRIÇÃO DETALHADA
É descrito um método para escurecer um primeiro pacote associado a uma primeira taxa de bits para um segundo pacote associado a uma segunda taxa de bits. Um primeiro pacote é recebido. 0 primeiro pacote é analisado para determinar uma primeira taxa de bit associada ao primeiro pacote. Os bits associados a pelo menos um parâmetro são descartados do primeiro pacote. Os bits restantes associados a um ou mais parâmetros e um identificador especial são empacotados em um segundo pacote associado a uma segunda taxa de bit. 0 segundo pacote é transmitido.
Um equipamento para escurecer um primeiro pacote associado a uma primeira taxa de bit para um segundo pacote associado a uma segunda taxa de bits é também descrito. 0 equipamento inclui um processador e uma memória em comunicação eletrônica com o processador. Instruções são armazenadas na memória. As instruções são executáveis para: receber um primeiro pacote; analisar o primeiro pacote para determinar uma primeira taxa de bit associada ao primeiro pacote; descartar os bits associados com pelo menos um parâmetro do primeiro pacote; empacotar bits restantes associados com um ou mais parâmetros e um identificador especial em um segundo pacote associado a uma segunda taxa de bit; e transmitir o segundo pacote.
Um sistema que é configurado para escurecer um primeiro pacote associado a uma primeira taxa de bits a um segundo pacote associado a uma segunda taxa de bits é também descrito. 0 sistema inclui um dispositivo para processar e um dispositivo para receber um primeiro pacote. Um dispositivo para analisar o primeiro pacote para determinar uma primeira taxa de bits associada ao primeiro pacote e um dispositivo para descartar bits associados a pelo menos um parâmetro proveniente do primeiro pacote são descritos. São descritos um dispositivo para empacotar bits restantes associados a um ou mais parâmetros e um identificador especial em um segundo pacote associado a uma segunda taxa de bits e um dispositivo para transmitir o segundo pacote.
5 Um meio legível por computador é também descrito.
0 meio é configurado para armazenar um conjunto de instruções executáveis para: receber um primeiro pacote; analisar o primeiro pacote para determinar uma primeira taxa de bits associado ao primeiro pacote; descartar bits 10 associados à pelo menos um parâmetro proveniente do primeiro pacote; empacotar bits restantes associados a um ou mais parâmetros e um identificador especial em um segundo pacote associado a uma segunda taxa de bits; e transmitir o segundo pacote.
Um método para decodificar um pacote é também
descrito. Um pacote é recebido. Um identificador especial incluído no pacote é lido. Uma revelação é feita de que o pacote fosse diminuído a partir de um primeiro pacote associado a uma primeira taxa de bits para um segundo 20 pacote associado a uma segunda taxa de bits. Um modo de decodificação é selecionado para o pacote.
Um método para escurecer um pacote proveniente de uma taxa completa para uma meia taxa é também descrito. Um pacote de taxa completa é recebido. 0 pacote de taxa 25 completa é escurecido para um pacote de meia taxa descartando bits associados a um parâmetro proveniente do pacote de taxa completa. 0 pacote de meia taxa é empacotado com bits associados à informação de sinalização. 0 pacote de meia taxa é transmitido a um decodificador.
Várias configurações dos sistemas e métodos são
agora descritas com relação às figuras, onde números de referência similares indicam elementos idênticos ou funcionalmente similares. As características dos presentes sistemas e método, como descritas e ilustradas de forma geral nas figuras neste documento, poderiam ser arranjadas e projetadas em uma ampla variedade de configurações diferentes. Desse modo, a descrição detalhada abaixo não 5 pretende limitar o escopo dos sistemas e métodos, como reivindicado, porém é meramente representativa das configurações dos sistemas e métodos.
Muitas características das configurações descritas aqui podem ser implementadas como software de computador, hardware eletrônico ou combinações de ambos. Para ilustrar claramente esta permutabilidade de hardware e software, vários componentes serão descritos geralmente em termos de sua funcionalidade. Se tal funcionalidade é implementada como hardware ou software depende da aplicação específica e restrições do projeto impostas no sistema geral. Os versados na técnica podem implementar a funcionalidade descrita em vários caminhos para cada aplicação específica, porém tais decisões de implementação não devem ser interpretadas como causando uma saída do escopo dos presentes sistemas e métodos.
No local onde a funcionalidade descrita for implementada como software de computador, tal software pode incluir qualquer tipo de instrução de computador ou código executável por computador localizado dentro de um 25 dispositivo da memória e/ou transmitido como sinais eletrônicos transmitidos sobre um barramento de sistema ou rede. O software que implementa a funcionalidade associada aos componentes descritos aqui podem compreender uma instrução única ou muitas instruções, e podem ser 30 distribuídas sobre vários segmentos de código diferentes, dentre diferentes programas, e através de vários dispositivos de memória.
Como utilizado aqui, os termos "uma configuração", "configuração", "configurações", "a configuração", "as configurações", "uma ou mais configurações", "algumas configurações", "certas
configurações", "uma configuração", "outra configuração" e 5 similares significam "uma ou mais (mas, não necessariamente todas) as configurações dos sistemas e métodos descritos", a menos que expressamente especificado de outra forma.
0 termo "determinando" (e variações gramaticais do mesmo) é utilizado em um sentido extremamente amplo. 0 termo "determinando" engloba uma variedade ampla de ações e, por conseguinte "determinando" pode incluir calculando, computando, processando, derivando, investigando,
procurando (por exemplo, procurando em uma tabela, uma base de dados ou outra estrutura de dados), averiguando e 15 similares. Também, "determinando" pode incluir recebendo (por exemplo, recebendo informação), acessando (por exemplo, acessando dados em uma memória) e similares. Também, "determinando" pode incluir resolvendo, selecionando, escolhendo, estabelecendo e similares.
A frase "baseada em" não significa "baseada
somente em", a menos que expressamente especificado de outra forma. Em outras palavras, a frase "baseada em" descreve ambos "baseada somente em" e "baseada pelo menos em".
Uma rede celular pode incluir uma rede rádio
composta de um número de células onde cada uma é servida por um transmissor fixo. Estes múltiplos transmissores podem ser referidos como estações rádio base ou estações base. Uma célula pode se comunicar com outras células na 30 rede transmitindo um sinal de fala para uma estação base sobre um canal de comunicações. A célula pode dividir o sinal de fala em múltiplos quadros (por exemplo, 20 milissegundos (ms) do sinal de fala) . Cada quadro pode ser encodificado em um pacote. 0 pacote pode incluir uma certa quantidade de bits que é então transmitido através do canal de comunicações para uma estação base receptora ou uma célula receptora. A estação base receptora ou célula 5 receptora pode desfazer o pacote e decodificar os vários quadros para reconstruir o sinal.
Uma função de interfuncionamento (IWF) em uma estação base pode "escurecer" pacotes de taxa completa (171 bits) a pacotes de meia taxa (80 bits) antes de transmitir 10 o pacote através de um canal de comunicações. O escurecimento pode ser implementado para vários tipos de pacotes, incluindo pacotes em período de protótipo de pitch (PPP) de taxa completa e pacotes de predição linear excitada por código de meia taxa (CELP).
Após escurecer um pacote de taxa completa a um
pacote de meia taxa, a informação de sinalização pode ser adicionada a pacotes de meia taxa. Bits que podem ser desocupados após o escurecimento podem ser utilizados para conduzir informação de sinalização adicional, tais como 20 realização de handoff, mensagens para aumentar a potência de transmissão, etc. 0 pacote resultante, que pode incluir informação de fala escurecida e informação de sinalização, pode ser enviado a um decodificador como um pacote de taxa completa.
Além disso, os pacotes que são transmitidos com
uma alta quantidade de bits podem diminuir a capacidade da rede celular. A qualidade dos sinais de fala reconstruídos pode ser melhorada desempenhando o escurecimento do nível do pacote na estação base. Converter (ou escurecer) pacotes 30 de PPP de taxa completa e de CELP de taxa completa a pacotes de PPP especiais de meia taxa e de CELP especiais de meia taxa e transmitir estes pacotes especiais de meia taxa a um decodif icador pode melhorar a qualidade dos sinais de fala reconstruídos no decodificador quando comparado para apagar os pacotes de PPP de taxa completa ou de CELP de taxa completa. Diminuir pacotes de taxa completa pode também baixar o tráfego da rede.
5 A Figura 1 ilustra um sistema de telefonia sem
fio de acesso múltiplo por divisão de código (CDMA) 100 que pode incluir uma pluralidade de unidades de assinante móvel 102 ou estações móveis 102, uma pluralidade de estações base 104, um controlador de estação base (BSC) 106 e um centro de comutação móvel (MSC) 108. O MSC 108 pode ser configurado para interfacear com uma rede de telefonia pública comutada (PSTN) 110 convencional. O MSC 108 pode também ser configurado para interfacear com o BSC 106. Pode haver mais que um BSC 106 no sistema 100. Cada estação base 104 pode incluir pelo menos um setor (não mostrado) , onde cada setor pode ter uma antena ominidirecional ou uma pontuda em uma direção específica radialmente longe das estações base 104. Alternativamente, cada setor pode incluir duas antenas para recepção de diversidade. Cada estação base 104 pode ser projetada para suportar uma pluralidade de atribuições de freqüência. A intersecção de um setor e uma atribuição de freqüência pode ser referida como um canal CDMA. As unidades de assinante móvel 102 podem incluir telefones com sistema de comunicação portátil (PCS) ou celular.
Durante a operação do sistema de telefonia celular 100, as estações base 104 podem receber conjuntos de sinais por link reverso provenientes de conjuntos de estações móveis 102. As estações móveis 102 podem estar 30 conduzindo chamadas telefônicas ou outras comunicações. Cada sinal do link reverso recebido por uma dada estação base 104 pode ser processado dentro daquela estação base 104. Os dados resultantes podem ser emitidos para o BSC 106. O BSC 106 pode prover alocação de recurso de chamada e funcionalidade de gerenciamento da mobilidade incluindo a orquestração de soft handoffs entre as estações base 104. O BSC 106 pode também rotear os dados recebidos para o MSC 5 108, que provê serviços de roteamento adicionais para interface com o PSTN HO. De forma similar, o PSTN 18 pode interfacear com o MSC 108, e o MSC 108 pode interfacear com o BSC 106, que pode, por sua vez, controlar as estações base 104 para transmitir conjuntos de sinais de link direto 10 para conjuntos de estações móveis 102.
A Figura 2 descreve um ambiente de transmissão de sinal 200 incluindo um encodificador 202, um decodificador 204, um meio de transmissão 206 e uma função de interfuncionamento (IWF) 208. O encodificador 202 pode ser 15 implementado dentro de uma estação móvel 102 ou em uma estação base 104. A IWF 208 pode ser implementada dentro da estação base 104. 0 decodificador 204 pode ser implementado na estação base 104 ou na estação móvel 102. O encodif icador 202 pode encodificar um sinal de fala s (n) 20 210, formando um sinal de fala encodificado senc(n) 212. O sinal de fala encodificado 212 pode ser convertido a um pacote especial encodificado spenc(n) 214 para transmissão através do meio de transmissão 206 para o decodif icador 204. O decodif icador 204 pode esvaziar spenc(n) 214 e 25 decodificar senc (n) 212, deste modo, gerando um sinal de fala sintetizado s (n) 216.
0 termo "codificação" como utilizado aqui pode se referir geralmente a métodos englobando ambas encodificação e decodificação. Em geral, sistemas, métodos e equipamentos 30 de codificação procuram minimizar o número de bits transmitidos através do meio de transmissão 206 (isto é, minimizar a banda larga de spenc(n) 214 enquanto mantém reprodução de fala aceitável (isto é, s (n) 210 =» s (n) 216) . O equipamento pode ser um telefone móvel, um assistente digital pessoal (PDA), um computador Iap top, uma câmera digital, um tocador de música, um dispositivo de jogos, uma estação base ou qualquer outro dispositivo com um processador. A composição do sinal de fala encodificado 212 pode variar de acordo com o modo de codificação de fala particular utilizado pelo encodificador 202. Vários modos de codificação são descritos abaixo.
Os componentes do encodificador 202, do decodificador 204 e da IWF 208 descritos abaixo podem ser implementados como hardware eletrônico, como software de computador ou combinações de ambos. Estes componentes são descritos abaixo em termos de sua funcionalidade. Se a funcionalidade for implementada como hardware ou software pode depender da aplicação especifica e restrições de projeto impostas no sistema geral. O meio de transmissão 206 pode representar muitas mídias de transmissão diferentes, incluindo, mas não limitado a, uma linha de comunicação baseada em terra (Iand), um link entre uma estação base e um satélite, comunicação sem fio entre um telefone celular e uma estação base, ou entre um telefone celular e um satélite.
Cada grupo para uma comunicação pode transmitir dados bem como receber dados. Cada grupo pode utilizar um encodificador 202 e um decodificador 204. No entanto, o ambiente de transmissão de sinal 200 será descrito abaixo como incluindo o encodificador 202 em uma extremidade do meio de transmissão 206 e o decodificador 204 na outra.
Para finalidade desta descrição, s (n) pode incluir um sinal de fala digital obtido durante uma conversação típica incluindo sons vocais diferentes e períodos de silêncio. O sinal de fala s (n) 210 pode ser particionado em quadros, e cada quadro pode ser adicionalmente particionado em subquadros. Esta escolha arbitrariamente de limites de quadro/subquadro pode ser utilizada onde algum processamento de bloco é feito. As operações descritas como sendo desempenhadas em quadros 5 podem ser desempenhadas nos subquadros, neste sentido, o quadro e o subquadro são utilizados aqui permutavelmente. No entanto, s (n) 210 pode não ser particionado em quadros/subquadros se o processo contínuo, ao invés do processo em bloco, for implementado. Como tal, as técnicas 10 de bloco descritas abaixo podem ser estendidas para processamento contínuo.
O sinal s(n) 210 pode ser amostrado digitalmente em 8 kilo-hertz (kHz). Cada quadro pode incluir 20 milissegundos (ms) de dados, ou 160 amostras na taxa de 15 8 kHz amostrada. Cada subquadro pode incluir 53 ou 54 amostras de dados. Enquanto estes parâmetros podem ser adequados para codificação de fala, eles são meramente exemplos e outros parâmetros alternativos adequados poderiam ser utilizados.
A Figura 3 é um diagrama em bloco ilustrando uma
configuração de um encodificador multi-modo 302 se comunicando com um decodificador multi-modo 304 através de um canal de comunicações 306. O canal de comunicações 306 pode incluir uma interface de radio frequência (RF) . O 25 encodificador 302 pode incluir um decodificador associado (não mostrado) . O encodificador 302 e seu decodificador associado podem formar um primeiro codificador de fala. 0 decodificador 304 pode incluir um encodificador associado (não mostrado) . 0 decodificador 304 e seu encodificador 30 associado podem formar um segundo codificador de fala.
O encodificador 302 pode incluir um módulo de cálculo do parâmetro inicial 318, um módulo de determinação da taxa 320, um módulo de classificação de modo 322, uma pluralidade de modos de encodif icação 324, 326, 328 e um módulo de formatação de pacote 330. O número de modos de encodif icação 324, 326, 328 é mostrado como N, que pode significar qualquer número de modos de encodificação 324, 5 326, 328. Para simplicidade, três modos de encodificação 324, 326, 328 são mostrados, com uma linha tracejada indicando a existência de outros modos.
0 decodificador 304 pode incluir um módulo desmontador de pacote 332, uma pluralidade de modos de 10 decodif icação 334, 336, 338 e um filtro de correspondência 340. O número de modos de decodif icação 334, 336, 338 é mostrado como N, que pode significar qualquer número de modos de decodif icação 334, 336, 338. Para simplicidade, três modos de decodif icação 334, 336, 338 são mostrados, 15 com uma linha tracejada indicando a existência de outros modos de decodificação .
Um sinal de fala, s(n) 310, pode ser provido para o módulo de cálculo do parâmetro inicial 318. O sinal de fala 310 pode ser dividido em blocos de amostras referidos 20 como quadros. O valor n pode designar o número de quadros ou o valor n pode designar um número de amostras em um quadro. Em uma configuração alternativa, um sinal de erro residual de predição linear (LP) pode ser utilizado no lugar do sinal de fala 310. O sinal de erro residual de LP 25 pode ser utilizado pelos codificadores de fala, tal como um codificador de predição linear de código excitado (CELP).
0 módulo de cálculo do parâmetro inicial 318 pode derivar vários parâmetros baseados no quadro atual. Em um aspecto, estes parâmetros incluem pelo menos um dos 30 seguintes: coeficientes de filtro de codificação prevista linear (LPC), coeficientes de par espectral linear (LSP), funções de autocorrelação normalizada (NACFs), intervalo de malha aberta, taxas atravessando zero, energias da banda e o sinal de formação residual.
0 módulo de cálculo do parâmetro inicial 318 pode ser acoplado ao módulo de classificação do modo 322. 0 módulo de classificação do modo 322 pode dinamicamente comutar entre os modos de encodificação 324, 326, 328. 0 módulo de cálculo do parâmetro inicial 318 pode prover parâmetros ao módulo de classificação do modo 322. 0 módulo de classificação do modo 322 pode ser acoplado ao módulo de determinação da taxa 320. O módulo de determinação da taxa 320 pode aceitar um sinal de comando de taxa. O sinal de comando de taxa pode direcionar o encodificador 302 a encodificar o sinal de fala 310 em uma taxa particular. Em um aspecto, a taxa particular inclui uma taxa completa que pode indicar que o sinal de fala 310 é para ser codificado utilizando cento e setenta e um bits. Em outro exemplo, a taxa específica inclui uma meia taxa que pode indicar que o sinal de fala 310 é para ser codificado utilizando oitenta bits. Em um exemplo, a taxa específica inclui uma oitava taxa que pode indicar que o sinal de fala 310 é para ser codificado utilizando dezesseis bits.
Como previamente estipulado, o módulo de classificação do modo 322 pode ser acoplado para comutar dinamicamente entre os modos de encodificação 324, 326, 328 25 em uma base quadro por quadro a fim de selecionar o modo de encodif icação mais apropriado 324, 326, 328 para o quadro atual. 0 módulo de classificação do modo 322 pode selecionar um modo de encodificação específica 324, 326, 328 para o quadro atual comparando os parâmetros com 30 valores de teto e/ou limites predefinidos. Além disso, o módulo de classificação do modo 322 pode selecionar um modo de encodif icação específico 324, 326, 328 baseado no sinal de comando de taxa recebido a partir do módulo de determinação de taxa 320. Por exemplo, o modo de encodif icação A 324 pode encodificar o sinal de fala 310 utilizando cento e setenta e um bits enquanto o modo de encodif icação B 326 pode encodificar o sinal de fala 310 5 utilizando oitenta bits.
Com base no conteúdo de energia do quadro, o módulo de classificação do modo 322 pode classificar o quadro como não fala ou fala inativa (por exemplo, ruído de fundo ou pausas entre as palavras) ou fala. Com base na 10 periodicidade do quadro, o módulo de classificação do modo 322 pode classificar quadros de fala como um tipo particular de fala, por exemplo, com voz, sem voz ou transitório.
A fala com voz inclui fala que exibe um grau relativamente alto de periodicidade. Um segmento de fala com voz 702 é mostrado no gráfico da Figura 7A. Como ilustrado, um período de pitch pode ser um componente de um quadro de fala que pode ser utilizado para analisar e reconstruir os conteúdos do quadro. A fala sem voz pode incluir sons consoantes. Um segmento de fala sem voz 704 é mostrado no gráfico da Figura 7B. Quadros de fala transitória podem incluir transições entre falas com voz e sem voz. Um segmento de fala transitória 706 é mostrado no gráfico da Figura 7C. Quadros que são classificados como nem com voz, nem sem voz podem ser classificados como fala transitória. Os gráficos ilustrados nas Figuras 7A, 7B e 7C serão discutidos em detalhes abaixo.
Classificar os quadros de fala pode permitir diferentes modos de encodificação 324, 326, 328 para serem 30 utilizados para encodificar diferentes tipos de fala, resultando em uso mais eficaz da banda larga em um canal compartilhado, tal como o canal de comunicação 306. Por exemplo, como fala com voz é periódico e assim altamente previsto, uma taxa de baixo bit, os modos de encodificação altamente previstos 324, 326, 328 podem ser empregados para encodificar a fala com voz.
0 módulo de classificação do modo 322 pode 5 selecionar um modo de encodif icação 324, 326, 328 para o quadro atual com base na classificação do quadro. Os vários modos de encodificação 324, 326, 328 podem ser acoplados em paralelo. Um ou mais dos modos de encodif icação 324, 326, 328 podem ser operacionais em qualquer dado momento. Em uma 10 configuração, um modo de encodif icação 324, 326, 328 é selecionado de acordo com a classificação do quadro atual.
Os diferentes modos de encodificação 324, 326, 328 podem operar de acordo com diferentes taxas de codificação de bits, diferentes esquemas de codificação ou 15 diferentes combinações de taxa de codificação de bit e esquema de codificação. Como previamente declarado, as várias taxas de codificação utilizadas podem ser de taxa completa, meia taxa, um quarto de taxa e/ou um oitavo de taxa. Os vários esquemas de codificação utilizados podem 20 ser codificação CELP, codificação por periodo de protótipo de pitch (PPP) (ou codificação de interpolação em forma de onda (WI)) e/ou codificação por ruído excitado por predição linear (NELP) . Desse modo, por exemplo, um modo de encodif icação particular 324, 326, 328 pode ser CELP de 25 taxa completa, outro modo de encodif icação 324, 326, 328 pode ser CELP de meia taxa, outro modo de encodif icação 324, 326, 328 pode ser PPP de um quarto de taxa, e outro modo de encodificação 324, 326, 328 pode ser NELP.
De acordo com um modo de encodif icação CELP 324, 326, 328, um modelo de trato vocal linear previsto pode ser excitado com uma versão quantizada do sinal residual LP. Em um modo de encodificação CELP, o quadro atual inteiro pode ser quantizado. O modo de encodificação CELP 324, 326, 328 pode prover para reprodução relativamente precisa da fala, porém ao custo de uma taxa de codificação de bit relativamente alta. 0 modo de encodificação CELP 324, 326, 328, pode ser utilizado para encodificar quadros 5 classificados como fala transitória.
De acordo com o modo de encodif icação NELP 324, 326, 328, um sinal de ruído filtrado, pseudo-aleatório pode ser utilizado para modelar o sinal residual LP. 0 modo de encodif icação NELP 324, 326, 328 pode ser uma técnica 10 relativamente simples que alcança uma baixa taxa de bit. O modo de encodificação NELP 324, 326, 328 pode ser utilizado para encodificar quadros classificados como fala sem voz.
De acordo com o modo de encodif icação PPP 324, 326, 328, um subconjunto dos períodos de pitch dentro de 15 cada quadro pode ser encodificado. Os períodos restantes do sinal de fala podem ser reconstruídos pela interpolação entre estes períodos de protótipo. Em uma implementação de domínio de tempo de codificação PPP, um primeiro conjunto de parâmetros pode ser calculado que descreva como 20 modificar um período de protótipo anterior para se aproximar ao período de protótipo atual. Um ou mais vetores de código (codevectors) podem ser selecionados nos quais, quando somatizados, se aproximam da diferença entre o período de protótipo atual e o período de protótipo 25 anterior modificado. Um segundo conjunto de parâmetros descreve estes vetores de código selecionados. Em uma implementação de domínio da freqüência de codificação PPP, um conjunto de parâmetros pode ser calculado para descrever amplitude e fase espectral do protótipo. De acordo com a 30 implementação da codificação PPP, o decodificador 304 pode sintetizar um sinal de fala de saída 316 reconstruindo um protótipo atual com base nos conjuntos parâmetros descrevendo a amplitude e a fase. O sinal de fala pode ser interpolarizado sobre a região entre o período de protótipo atual reconstruído e um período de protótipo anterior reconstruído. 0 protótipo pode incluir uma parte do quadro atual que será linearmente interpolarizado com protótipos 5 provenientes dos quadros anteriores que foram similarmente posicionados dentro do quadro a fim de reconstruir o sinal de fala 310 ou o sinal residual LP no decodif icador 304 (isto é, um período de protótipo antigo é utilizado como uma previsão do período de protótipo atual).
Codificar o período de protótipo ao invés do
quadro inteiro de fala pode reduzir a taxa de codificação do bit. Quadros classificados como fala com voz podem vantajosamente ser codificados com um modo de codificação PPP 324, 326, 328. Como ilustrado na Figura 7A, a fala com 15 voz pode incluir componentes periódico com variação de tempo mais lenta, que são explorados pelos modos de encodif icação PPP 324, 326, 328. Através da exploração da periodicidade da fala com voz, o modo de encodificação PPP 324, 326, 328 pode alcançar uma taxa de bit menor que o 20 modo de encodificação CELP 324, 326, 328.
O modo de encodificação selecionado 324, 326, 328 pode ser acoplado ao módulo de formatação do pacote 330. O modo de encodificação selecionado 324, 326, 328 pode encodificar, ou quantizar, o quadro atual e prover 25 parâmetros do quadro quantizado 312 para o módulo de formatação do pacote 330. O módulo de formatação do pacote 330 pode montar os parâmetros do quadro quantizado 312 em um pacote formatado 313. O módulo de formatação do pacote 330 pode ser acoplado a um IWF 308. O módulo de formatação 30 do pacote 330 pode prover o pacote formatado 313 para o IWF 308. O IWF 308 pode converter o pacote formatado 313 a um pacote especial 314. Em um exemplo, o pacote formatado 313 inclui um pacote de taxa completa encodificado pelos modos de encodificação CELP, PPP ou NELP 324, 326, 328. 0 IWF 308 pode converter o pacote formatado de taxa completa 313 a um pacote especial de meia taxa 314. Em outras palavras, o pacote formatado de taxa completa (171 bits) 313 pode ser 5 convertido a um pacote de meia taxa que inclui 80 bits. O pacote de meia taxa não necessita ter exatamente metade do número de bits de um pacote de taxa completa. O IWF 308 pode prover o pacote especial de meia taxa 314 a um transmissor (não mostrado) e o pacote especial 314 pode ser 10 convertido a um formato análogo, modulado e transmitido sobre o canal de comunicação 306 para um receptor (também não mostrado) , que recebe, demodula e digitaliza o pacote especial 314, e provê o pacote 314 para o decodificador 304 .
No decodificador 304, o módulo desmontador de
pacote 332 recebe o pacote especial 314 do receptor. O módulo desmontador de pacote 332 pode esvaziar o pacote especial 314 e descobrir que o pacote especial 314 tem sido convertido a partir de um pacote de taxa completa a um de 20 meia taxa. O módulo 332 pode descobrir que o pacote especial tem sido convertido pela leitura de um identificador especial incluído no pacote especial. O módulo desmontador do pacote 332 pode também ser acoplado para comutar dinamicamente entre os modos de decodificação 25 334, 336, 338 em uma base de pacote por pacote. O número de modos de decodificação 334, 336, 338 pode ser o mesmo que o número de modos de encodif icação 324, 326, 328. Cada modo de encodif icação numerado 324, 326, 328 pode estar associado a um respectivo modo de decodificação 30 similarmente numerado 334, 336, 338 configurado para empregar a mesma taxa de codificação de bit e esquema de codificação.
Se o módulo desmontador do pacote 332 detectar o pacote 314, o pacote 314 é desmontado e provido ao modo pertinente de decodif icação 334, 336, 338. Se o módulo desmontador do pacote 332 não detectar um pacote, uma perda de pacote é declarada e um decodificador de apagamento (não 5 mostrado) pode desempenhar o processo de apagamento do quadro. 0 arranjo paralelo de modos de decodificação 334, 336, 338 pode ser acoplado ao filtro de correspondência 340. O modo pertinente de decodificação 334, 336, 338 pode decodificar ou dequantizar o pacote 314 e prover a 10 informação ao filtro de correspondência 340. O filtro de correspondência 340 pode reconstruir ou sintetizar o quadro de fala, emitindo um quadro de fala sintetizado, s (n) 316.
Em uma configuração, os parâmetros quantizados por eles próprios não são transmitidos. Ao contrário, o 15 livro-código, arquiva especificando que os endereços em várias tabelas de busca (LUTs) (não mostrada) no decodificador 304 são transmitidos. 0 decodificador 304 pode receber os arquivos do livro-código e buscar as várias LUTs do livro-código para valores adequados de parâmetro. 20 Do mesmo modo, arquivos do livro-código para parâmetros, tais como, por exemplo, intervalo de pitch, ganho adaptativo do livro-código e LSP podem ser transmitidos, e três LUTs do livro-código associado podem ser buscadas pelo decodificador 304.
De acordo com o modo de encodif icação CELP, os
parâmetros de intervalo de pitch, amplitude, fase e LSP podem ser transmitidos. Os arquivos do livro-código LSP são transmitidos devido ao sinal residual LP que pode ser sintetizado no decodificador 304. Adicionalmente, a 30 diferença entre o valor do intervalo de pitch para o quadro atual e o valor do intervalo de pitch para o quadro anterior pode ser transmitido.
De acordo com o modo de encodificação PPP no qual o sinal de fala 310 é para ser sintetizado no decodificador 304, os parâmetros de intervalo de pitch, amplitude e fase são transmitidos. A taxa de bit mais baixa empregada por técnicas de codificação de fala PPP pode não permitir 5 transmissão de ambos a informação de intervalo de pitch absoluto e valores diferentes do intervalo de pitch relativo.
De acordo com um exemplo, quadros altamente periódicos, tais como quadros de fala com voz são 10 transmitidos com um modo de encodificação PPP de baixa taxa de bit que quantiza a diferença entre o valor de intervalo de pitch para o quadro atual e o valor de intervalo de pitch para o quadro anterior para transmissão, e não quantiza o valor do intervalo de pitch para o quadro atual 15 para transmissão. Devido aos quadros com voz serem altamente periódicos na natureza, transmitindo os valores da diferença como opostos ao valor do intervalo de pitch absoluto pode permitir uma codificação de bit mais baixa para ser alcançada. Em um aspecto, esta quantização é 20 geralmente tal que uma soma pesada dos valores de parâmetro para quadros anteriores é computada, em que a soma dos pesos é uma, e a soma pesada é subtraída do valor do parâmetro para o quadro atual. A diferença pode então ser quanti zada.
A Figura 4 é um diagrama em blocos ilustrando um
exemplo de um IWF 408. O IWF 4 08 pode converter um pacote formatado de taxa completa 413 para um pacote especial de meia taxa 414. O IWF 408 pode receber o pacote formatado 413 e um analisador da taxa de bit 450 pode determinar o 30 número de bits incluídos no pacote formatado 413. Em um aspecto, um pacote formatado de taxa completa 413 inclui cento e setenta e um bits. Um módulo de descarte 452 pode eliminar uma certa quantidade de bits associados a um parâmetro incluído com o pacote formatado 413. Em uma configuração, o bit determinador 456 determina quais bits foram descartados do pacote formatado 413. Por exemplo, o bit determinador 456 pode determinar que bits associados ao 5 parâmetro de alinhamento da banda são para ser descartados. Como tal, o módulo de descarte 452 pode eliminar a quantidade de bits associados a este parâmetro.
O IWF 4 08 pode também incluir um módulo de empacotamento 454. 0 módulo de empacotamento 454 pode 10 empacotar bits restantes que não foram descartados pelo módulo de descarte 452 em um pacote especial 414. Em um aspecto, o módulo de descarte 452 elimina relativamente metade dos bits incluídos com o pacote formatado 413. Como tal, o módulo de empacotamento 454 pode empacotar os bits 15 restantes em um pacote especial 414 que inclui metade do número de bits que foram incluídos com o pacote formatado
413. Um gerador identificador 458 pode prover um identificador especial para o módulo de empacotamento 454. 0 módulo de empacotamento 454 pode incluir os bits
associados com o identificador especial no pacote especial
414. 0 identificador especial pode indicar ao decodificador 304 que um pacote que se aproxima é um pacote especial de meia taxa 414. 0 identificador especial pode incluir um valor de 7 bits que varia entre os valores de 101 e 127. O
identificador especial pode ser um valor ilegal no sentido que um identificador tipicamente atribui um valor de 7 bits ao pacote que varia de 0 a 100. Um pacote com um valor de 7 bits variando entre 101 e 127 pode indicar ao decodificador 304 que o pacote foi convertido de uma taxa completa para 30 uma meia taxa especial após o processo de encodificação.
A Figura 5 é um diagrama em fluxo ilustrando um exemplo de um método de codificação de fala de taxa variável 500. Em um aspecto, o método 500 é implementado por uma estação móvel única 102 que pode ser capacitada para receber um pacote de taxa completa e converter aquele pacote a um pacote especial de meia taxa. Em outros aspectos, o método 500 pode ser implementado por mais de 5 uma estação móvel 102. Em outras palavras, uma estação móvel 102 pode incluir um encodificador para encodificar um pacote de taxa completa enquanto uma estação móvel separada 102, estação base 104, etc. inclui um IWF que pode converter o pacote de taxa completa a um pacote especial de 10 meia taxa. Os parâmetros iniciais de um quadro atual podem ser calculados 502. Em uma configuração, o módulo de cálculo do parâmetro inicial 318 calcula 502 os parâmetros. Os parâmetros podem incluir um ou mais dos seguintes: coeficientes do filtro de codificação prevista (LPC), 15 coeficientes do par espectral linear (LSP), funções de autocorrelação normalizada (NACFs), intervalo de malha aberta, taxas atravessando zero, energias da banda, e o sinal de formação residual.
O quadro atual pode ser classificado 504 como 20 ativo ou inativo. Em uma configuração, o módulo de classificação 322 classifica o quadro atual como incluindo as falas "ativa" ou "inativa". Como descrito acima, s (n) 310 pode incluir periodos de fala e períodos de silencio. A fala ativa pode incluir palavras faladas, enquanto que a 25 fala inativa pode incluir tudo também, por exemplo, ruído, silêncio, pausas.
Uma determinação 506 é feita se o quadro atual for ou não classificado como ativo ou inativo. Se o quadro atual for classificado como ativo, a fala ativa é 30 adicionalmente classificada 508 como quadros com voz, sem voz ou transitório. A fala humana pode ser classificada em muitos caminhos diferentes. Duas classificações da fala podem incluir sons com voz e sem voz. A fala que não for com voz ou sem voz pode ser classificada como fala transitória.
Um modo decodif icador / encodif icador pode ser selecionado 510 com base no modo de classificação do quadro 5 feito nas etapas 506 e 508. Os vários modos decodificador / encodificador podem ser conectados em paralelo, como mostrado na Figura 3. Os diferentes modos decodificador / encodificador operam de acordo com diferentes esquemas de codificação. Certos modos podem ser mais eficazes na partes 10 de codificação do sinal de fala s (n) 310 exibindo certas propriedades.
Como anteriormente explicado, o modo CELP pode ser escolhido para codificar quadros classificados como fala transitória. 0 modo PPP pode ser escolhido para 15 codificar quadros classif içados como fala com voz. 0 modo NELP pode se escolhido para codificar quadros classificados como fala sem voz. A mesma técnica de codificação pode frequentemente ser operada em diferentes taxas de bits, com variação de níveis de desempenho. Os diferentes modos 20 decodificador / encodificador na Figura 3 podem representar diferentes técnicas de codificação, ou as mesmas técnicas de codificação operando em diferentes taxas de bits, ou combinações do acima.
0 modo encodificador selecionado pode encodificar 25 512 o quadro atual e formatar 514 o quadro encodificado em um pacote de acordo com uma primeira taxa. Uma determinação 516 é feita se for desejada informação de sinalização de diminuição e rajada. Além disso, uma determinação 516 é feita se for desejada capacidade adicional da rede 30 adicional. Se nenhuma sinalização ou capacidade adicional da rede for desejada, o pacote pode enviar 520 para o decodificador. Se a sinalização ou capacidade adicional da rede for desejada, o pacote pode ser diminuído 518, na estação base, da primeira taxa para uma segunda taxa e então pode ser empacotada com informação de sinalização antes de ser enviada 520 para o decodif icador. A primeira taxa pode incluir uma quantidade maior de bits que a 5 segunda taxa. Em um aspecto, diminuir 518 o pacote inclui descartar uma certa quantidade de bits proveniente do pacote tal que um número menos de bits seja transmitido para o decodif icador ou a fim de liberar bits que possam ser utilizados para enviar informação de sinalização para o 10 decodificador.
A Figura 6 é um diagrama em fluxo ilustrando um exemplo de um método de diminuição do pacote 600. O método 600 pode ser implementado pelo IWF 208. Um primeiro pacote pode ser recebido 602. 0 primeiro pacote pode ser o pacote 15 formatado 313 recebido do encodificador 302. O primeiro pacote pode ser analisado 604 a fim de determinar uma primeira taxa de bit associada ao primeiro pacote. A primeira taxa de bit pode indicar o número de bits incluídos no primeiro pacote. Em um aspecto, o analisador 20 da taxa de bit 450 analisa o primeiro pacote a fim de determinar a taxa de bit. Os bits associados à pelo menos um parâmetro pode ser descartado 606 do primeiro pacote. Em uma configuração, o módulo de descarte 452 descarta os bits associados a um parâmetro de alinhamento de banda. Na 25 implementação de domínio de freqüência da codificação PPP, uma aproximação de multi banda pode ser adotada para codificar a fase espectral, onde a fase de quantização é transformada na quantização de uma série de comutações da fase linear. Uma transformada de Serie Discreta de Fourier 30 (DFS) pode ser utilizada para transformar o período de protótipo de pitch (PPP) em domínio de freqüência. Uma comutação do alinhamento global pode ser computada entre uma amplitude quantizada, fase DFS não-quantizada e uma amplitude quantizada, fase DFS zero. A amplitude quantizada, fase DFS zero, pode ser comutada pelo negativo deste alinhamento global que pode corresponder à aplicação de uma comutação da fase linear esperada ao PPP 5 representado pela amplitude quantizada, fase DFS zero, para alinhar ao máximo com o PPP meta, o qual pode corresponder à amplitude quantizada, fase DFS verdadeira. Em um aspecto, a comutação da fase linear pode ser insuficiente para capturar a fase verdadeira de todo o alinhamento harmônico 10 focado na banda em adição ao alinhamento global que é computado em múltiplas bandas. Isto pode corresponder aos parâmetros de alinhamento da banda que podem ser descartados.
Os bits restantes no primeiro pacote associado a um ou mais parâmetros podem ser empacotados 608 com um identificador em um segundo pacote. Em um aspecto, o segundo pacote é associado a uma segunda taxa de bit. A segunda taxa de bit pode incluir bits menores que os da primeira taxa de bits. 0 identificador especial pode identificar o segundo pacote como incluindo a segunda taxa de bit. 0 segundo pacote pode ser transmitido 610 a um decodificador. Em um exemplo, o segundo pacote pode ser transmitido 610 a partir de uma primeira estação base a uma segunda estação base. Em outro exemplo, o segundo pacote pode ser transmitido 610 da primeira estação base para outra estação móvel 102.
A Figura 6A é um diagrama em fluxo ilustrando uma configuração de um método 601 para decodificar um pacote. Um pacote pode ser recebido 603 e um identificador especial 30 incluido com o pacote pode ser lido 605. Em um aspecto, o identificador especial é um identificador do intervalo ilegal. Uma descoberta 607 pode ser feita para que o pacote fosse convertido a partir de um primeiro associado à primeira taxa de bits para um segundo pacote associado à segunda taxa de bit. Um modo de decodif icação pode ser selecionado 609 para o pacote e o pacote pode ser decodificado.
A Figura 7A descreve uma parte exemplar do sinal s(n) 310 incluindo fala com voz 702. Os sons com voz podem ser produzidos forçando o ar pela glote com a pressão das cordas vocais ajustadas para que eles vibrem em uma oscilação relaxada, pelo presente produzindo pulsos quase periódicos do ar que excite o trato vocal. Uma medida apropriada na fala com voz é o período de pitch, como mostrado na Figura 7A.
A Figura 7B descreve uma parte exemplar do sinal s (n) 310 incluindo a fala sem voz 704. Os sons sem voz podem ser gerados formando uma constrição em algumas partes no trato vocal (usualmente voltado para a extremidade da boca), e forçando o ar através constrição em uma velocidade suficientemente alta para produzir turbulência. O sinal da fala sem voz resultante remonta o ruído colorido.
A figura 7C descreve uma parte exemplar do sinal s (n) 310 incluindo fala transitória 706 (isto é, fala que nem é com voz nem sem voz) . O exemplo da fala transitória 706 mostrada na Figura 7C pode representar s (n) 310 pela transição entre a fala sem voz e a fala com voz. Muitas classificações diferentes da fala podem ser empregadas de acordo com as técnicas descritas aqui para alcançar resultados compatíveis.
O gráfico da figura 8 ilustra princípios da técnica de codificação PPP. Um quadro único 800 pode incluir um sinal original s (n) 860. Períodos de pitch 862 (ou protótipos em forma de onda) podem ser extraídos do sinal original 860 e encodif içados. Os períodos de pitch encodifiçados 862 podem ser utilizados para gerar um sinal reconstruído 864. 0 sinal reconstruído 864 pode ser uma reconstrução do sinal original 860. Partes 866 do sinal original 860 que não foram encodifiçadas podem ser reconstruídas através da interpolarização entre os períodos 5 de pitch 862.
A Figura 9 é um mapa 900 ilustrando o número de bits alocados a vários tipos de pacotes. O mapa 900 inclui uma pluralidade de parâmetros 902. Cada parâmetro dentro da pluralidade de parâmetros 902 pode utilizar um certo número 10 de bits. Os vários tipos de pacotes ilustrados no mapa 900 podem ter sido encodifiçados utilizando um dos vários modos de encodificação anteriormente discutidos. Os tipos de pacotes podem incluir um CELP de taxa completa (FCELP) 904, um CELP de meia taxa (HCELP) 906, um CELP especial de meia 15 taxa (SPLHCELP) 908, um PPP de taxa completa (FPPP) 910, um PPP especial de meia taxa (SPLHPPP) 912, um PPP de um quarto de taxa (QPPP) 914, um NELP especial de meia taxa (SPLHNELP) 916, um NELP de um quarto de taxa (QNELP) 918 e um encodificador de silêncio 920.
0 FCELP 904 e o FPPP 910 podem ser pacotes com um
total de 171 bits. O pacote FCELP 904 pode ser convertido em um pacote SPLHCELP 908. Em outro aspecto, o pacote FCELP 904 aloca bits para parâmetros tal como índice fixo do livro-código (índice FCB) e um ganho fixo do livro-código 25 (ganho FCB) . Como mostrado, quando o pacote FCELP 904 é convertido em um pacote SPLHCELP 908, bits zero são alocados por parâmetros tal como o índice FCB, o Ganho FCB e um intervalo delta. Em outras palavras, o pacote SPLHCELP 908 é transmitido a um decodificador sem estes bits. O 30 pacote SPLHCELP 908 inclui bits que são alocados por parâmetros tal como um par espectral linear (LSP), um ganho do livro-código adaptativo (ACB), uma identificação especial (ID), um pacote ID especial, um intervalo de pitch e uma informação em modo de bit. 0 número total de bits transmitidos para um decodificador pode ser reduzido de 171 para 80.
Similarmente, o pacote FPPP 910 pode ser convertido a um pacote SPLHPPP 912. Como mostrado, o pacote FPPP 910 aloca bits para parâmetros de alinhamento da banda. Quando o pacote FPPP 910 for convertido a um pacote SPLHPPP 912, os bits alocados para o alinhamento da banda podem ser descartados. Em outras palavras, o pacote SPLHPP 912 é transmitido a um decodificador sem estes bits. O número total de bits transmitidos a um decodificador pode ser reduzido de 171 para 80. Em uma configuração, bits alocados para parâmetros de amplitude e alinhamento global são incluídos no pacote SPLHPPP 912. O parâmetro de amplitude pode indicar a amplitude do espectro do sinal s (n) 310 e o parâmetro do alinhamento global como anteriormente mencionado pode representar a comutação da fase linear que pode apagar o alinhamento máximo. Em um aspecto, o sinal inteiro s (n) 310 varia em uma frequência de 50 Hz a 4 Hz.
Além disso, os pacotes SPLHCELP 908, SPLHPPP 912 e o SPLHNELP 916 podem incluir bits alocados a um parâmetro de intervalo ilegal. O parâmetro de intervalo ilegal pode representar um identificador especial que permite um 25 decodificador reconhecer os pacotes SPLHCELP 908 e o LSPLHPPP 912 como pacotes que foram convertidos de uma taxa completa para meia taxa após encodificação ou um quadro de meia taxa incluindo um quadro NELP.
Várias configurações estão descritas aqui com diferentes números de bits para diferentes parâmetros e pacotes. O número específico de bits associados com cada parâmetro aqui é para fim de exemplo, e não para significar ser limitante. Parâmetros podem incluir mais ou menos bits que os exemplos utilizados aqui.
A Figura 10 é um diagrama em blocos ilustrando a conversão de um pacote do período de protótipo de pitch (PPP) 1002 para um pacote especial PPP de meia taxa (SPLHPPP) 1020. A conversão pode ser implementada por um IWF 1008. O pacote FPPP 1002 pode incluir vários parâmetros que são associados a um certo número de bits. Parâmetros incluídos no pacote FPPP 1002 podem incluir um bit de modo 1004, que pode ser alocado um bit único, um par espectral linear (LSP) 1006, que pode ser alocado 28 bits, um intervalo de pitch 1010, que pode ser alocado 7 bits, uma amplitude 1012, que pode ser alocado 28 bits, um alinhamento global 1014, que pode ser alocado 7 bits, alinhamentos de banda 1016, que pode ser alocados 99 bits e um parâmetro reservado 1018, que pode ser alocadolbit. Em um aspecto, o pacote FPPP 1002 inclui um total de 171 bits.
O IWF 1008 pode converter o pacote FPPP 1002 a um pacote LPLHPPP 1020 como previamente discutido. Uma vez 20 convertido, o pacote SPLHPPP 1020 pode incluir um total de 80 bits. 0 IWF 1008 pode descartar os bits alocados ao alinhamento da banda 1016. Além disso, o IWF 1008 pode incluir um ID especial de meia taxa 1022 no pacote SPLHPPP 1020, que pode ser alocado 2 bits. Adicionalmente, o IWF 25 1008 pode incluir um identificador de intervalo ilegal 1024 com o pacote SPLHPPP 1020 que pode servir como um identificador especial do pacote. O identificador ilegal do pacote 1024 pode ser alocado 7 bits e pode permitir um decodificador reconhecer o pacote como um pacote que foi 30 convertido de um FPPP 1002 para um SPLHPPP 1020. Em uma configuração adicional, os 7 bits alocados ao identificador ilegal de intervalo 1024 podem representar um valor na faixa de 101 a 127. Ainda, o IWF 1008 pode incluir um intervalo adicional que pode ser alocado 7 bits. Isto pode ser o intervalo de pitch q se aproxima do pacote FPPP.
Enquanto os exemplos ilustrados na Figura 10 incluem a conversão do pacote FPPP 1002 para o pacote 5 SPLHPPP 1020, é para ser entendido que o pacote de previsão linear excitado (FCELP) poderia também ser convertido a um pacote CELP especial de meia taxa (SPLHCELP) . A conversão de um pacote FCELP para um pacote SPLHCELP pode ser feita de uma maneira similar como descrita com referência à 10 conversão de um pacote FPPP para um pacote SPLHPPP. O pacote FCELP pode incluir 171 bits e o pacote SPLHCELP pode incluir 80 bits.
A Figura 11 é um diagrama em blocos de certos componentes em um exemplo de um dispositivo de comunicação 15 1102. Em um exemplo mostrado na Figura 11, o dispositivo de comunicação 1102 pode ser uma estação base e/ou uma estação móvel. Os presentes sistemas e métodos podem ser implementados em um dispositivo de comunicação.
Como mostrado, o dispositivo 1102 pode incluir um 20 processador 1160 que controla a operação do dispositivo 1102. Uma memória 1162, que pode incluir ambas a memória somente de leitura (ROM) e a memória de acesso aleatório (RAM), pode prover instruções e dados ao processador 1160. Uma parte da memória 1162 pode também incluir memória de 25 acesso aleatório não-volátil (NVRAM).
O dispositivo 1102 pode também incluir um transmissor 1164 e um receptor 1166 para permitir transmissão e recepção de dados 220 entre o dispositivo 1102 e uma locação remota, tal como um controlador da 30 estação rádio base ou uma estação móvel 102. O transmissor 1164 e o receptor 1166 podem ser combinados em um transceptor 1168. Uma antena 1170 é eletricamente acoplada ao transceptor 1168. O dispositivo 1102 pode também incluir um detector de sinal 1172 utilizado para detectar e quantificar o nivel dos sinais recebidos pelo transceptor 1168. O detector de sinal 1172 detecta tais sinais como 5 energia total, energia piloto por chips de pseudo-ruído (PN) , densidade espectral de potência, e outros sinais. O dispositivo 1102 pode também incluir um determinador de pacote 117 6 utilizado para determinar qual pacote deveria ser convertido de um pacote de taxa completa para um pacote 10 especial de meia taxa.
Os vários componentes do dispositivo 1102 são acoplados juntamente por um sistema de barramento 1178 que pode incluir um barramento de potência, um barramento de sinal de controle, e um barramento de sinal de status além 15 do barramento de dados. Por conseguinte, para fim de clareza, os vários barramentos são ilustrados na Figura 11 como o sistema de barramento 1178.
Informação e sinais podem ser representados utilizando qualquer de uma variedade de diferentes 20 tecnologias e técnicas. Por exemplo, dados, instruções, comandos, informação, sinais, bits, símbolos, e chips que podem ser referenciados por toda a descrição acima podem ser representados por voltagens, correntes, ondas eletromagnéticas, campos ou partículas magnéticas, campos 25 ou partículas ópticas, ou qualquer combinação dos mesmos.
Os vários blocos lógicos, módulos, circuitos, e etapas de algoritmos ilustrativos descritos em conexão com as configurações descritas aqui podem ser implementadas como hardware eletrônico, software de computador, ou 30 combinações dos mesmos. Para ilustrar claramente esta permutabilidade de hardware e software, vários componentes, blocos, módulos, circuitos, e etapas têm sido descritos acima em geral em termos de sua funcionalidade. Se tal funcionalidade é ou não implementada como hardware ou software depende da aplicação específica e restrição de projeto impostas no sistema geral. Os versados na técnica podem implementar a funcionalidade descrita de várias formas para cada aplicação específica, porém tais decisões de implementação não deveriam ser interpretadas como responsáveis por sai do escopo dos presentes sistemas e métodos.
Os vários blocos lógicos, módulos, e circuitos ilustrativos descritos em conexão com as configurações descritas aqui podem ser implementadas ou desempenhadas com um processador de propósito geral, um processador de sinal digital (DSP), um circuito integrado de aplicação específica (ASIC), uma sinal de arranjo de porta programável em campo (FPGA) ou outro dispositivo lógico programável, porta discreta ou lógica de transistor, componentes de hardware discretos, ou qualquer combinação dos mesmos projetados para desempenhar as funções descritas aqui. Um processador de propósito geral pode ser um microprocessador, mas em alternativa, o processador pode ser qualquer processador convencional, controlador, microcontrolador, ou máquina de estado. Um processador pode também ser implementado como uma combinação de dispositivos de computação, por exemplo, uma combinação de um DSP e um microcontrolador, uma pluralidade de microprocessadores, um ou mais microprocessadores em conjunto com um núcleo DSP, ou qualquer outra tal configuração.
As etapas de um método ou algoritmo descritas em conexão com as configurações descritas aqui podem ser moldadas diretamente em hardware, em um módulo de software executadas por um processador, ou em uma combinação dos dois. Um módulo de software pode residir em memória RAM, memória flash, memória ROM, memória somente para leitura programável apagável (EPROM) , memória somente para leitura eletricamente programável apagável (EEPROM), registradores, disco rigido, um disco removível, uma memória somente para leitura de disco compacto (CD-ROM), ou qualquer outra forma 5 de meio de armazenamento conhecido na técnica. Um meio de armazenamento pode ser acoplado ao processador tal que o processador possa Ier informação de, escrever informação para, o meio de armazenamento. Na alternativa, o meio de armazenamento pode ser integral ao processador. 0 processador 10 e o meio de armazenamento podem residir em um ASIC. 0 ASIC pode residir em um terminal de usuário. Na alternativa, o processador e o meio de armazenamento podem residir como componentes discretos em um terminal de usuário.
Os métodos descritos aqui compreendem uma ou mais 15 etapas ou ações para alcançar o método descrito. A etapas e/ou ações do método pode ser permutadas com um outro sem sair do escopo dos presentes métodos e sistemas. Em outras palavras, apesar de uma ordem específica de etapas e ações serem especificadas pela própria operação da configuração, a
2 0 ordem e/ou o uso de etapas e/ou ações podem ser modificadas sem sair do escopo dos presentes métodos e sistemas. Os métodos descritos aqui podem ser implementados em hardware, software ou ambos. Exemplos de hardware e memória pode incluir RAM, ROM, EPROM, EEPROM, memória flash, disco ótico, 25 registradores, disco rígido, um disco removível, um CD-ROM ou qualquer outro tipo de hardware e memória.
Enquanto configurações e aplicações específicas dos presentes métodos e sistemas tem sido ilustras e descritas, é para ser entendido que os sistemas e métodos não estão 30 limitados à configuração e componentes precisos descritos aqui. Várias modificações, trocas, e variações que serão aparentes aos versados na técnica podem ser feitas no arranjo, operação, e detalhes dos métodos e sistemas descritos aqui sem sair do espirito e escopo dos sistemas e métodos reivindicados.

Claims (22)

1. Método para escurecer um primeiro pacote associado a uma primeira taxa de bits para um segundo pacote associado a uma segunda taxa de bits, o método compreendendo: receber um primeiro pacote; analisar o primeiro pacote para determinar uma primeira taxa de bits associada ao primeiro pacote; descartar bits associados a pelo menos um parâmetro do primeiro pacote; empacotar bits restantes associados a um ou mais parâmetros e um identificador especial em um segundo pacote associado a uma segunda taxa de bits; e transmitir o segundo pacote.
2. Método, de acordo com a reivindicação 1, em que o primeiro pacote é um pacote de período de protótipo de pitch (PPP) de taxa completa.
3. Método, de acordo com a reivindicação 1, compreendendo adicionalmente converter um pacote de período de protótipo de pitch (PPP) de taxa completa em um pacote de PPP especial de meia taxa.
4. Método, de acordo com a reivindicação 3, em que o pacote de PPP especial de meia taxa inclui 80 bits.
5. Método, de acordo com a reivindicação 1, em que o primeiro pacote é um pacote de previsão linear excitado por código (CELP) de taxa completa.
6. Método, de acordo com a reivindicação 1, compreendendo adicionalmente converter um pacote de previsão linear excitado por código (CELP) de taxa completa em um pacote de CELP especial de meia taxa.
7. Método, de acordo com a reivindicação 6, em que o pacote de CELP especial de meia taxa inclui 80 bits.
8. Método, de acordo com a reivindicação 1, compreendendo adicionalmente descartar bits associados com um parâmetro de alinhamento de banda.
9. Método, de acordo com a reivindicação 1, em que o identificador especial é um valor de bit 7 entre 101 e 127.
10. Método, de acordo com a reivindicação 1, compreendendo adicionalmente transmitir o segundo pacote de uma primeira estação base para uma segunda estação base.
11. Método, de acordo com a reivindicação 1, compreendendo adicionalmente transmitir o segundo pacote de uma primeira estação base para uma estação móvel.
12. Equipamento para escurecer um primeiro pacote associado a uma primeira taxa de bit para um segundo pacote associado a uma segunda taxa de bit, compreendendo: um processador; uma memória em comunicação eletrônica com o processador; instruções armazenadas na memória, as instruções sendo executáveis para: receber um primeiro pacote; analisar o primeiro pacote para determinar uma primeira taxa de bit associada ao primeiro pacote; descartar bits associados a pelo menos um parâmetro do primeiro pacote; empacotar bits restantes associados a um ou mais parâmetros e um identificador especial em um segundo pacote associado a uma segunda taxa de bits; e transmitir o segundo pacote.
13. Equipamento, de acordo com a reivindicação 12, em que o primeiro pacote é um pacote de período de protótipo de pitch (PPP) de taxa completa.
14. Equipamento, de acordo com a reivindicação12, em que as instruções são adicionalmente executáveis para converter um pacote de periodo de protótipo de pitch (PPP) de taxa completa em um pacote de PPP especial de meia taxa.
15. Equipamento, de acordo com a reivindicação 14, em que o pacote de PPP especial de meia taxa inclui 80 bits.
16. Equipamento, de acordo com a reivindicação12, em que o primeiro pacote é um pacote de previsão linear excitado por código (CELP) de taxa completa.
17. Equipamento, de acordo com a reivindicação12, em que as instruções são adicionalmente executáveis para converter um pacote de previsão linear excitado por código (CELP) de taxa completa em um pacote de CELP especial de meia taxa, em que o pacote de CELP especial de meia taxa inclui 80 bits.
18. Equipamento, de acordo com a reivindicação12, em que as instruções são adicionalmente executáveis para descartar bits associados a um parâmetro de alinhamento de banda.
19. Sistema que é configurado para escurecer um primeiro pacote associado a uma primeira taxa de bits para um segundo pacote associado a uma segunda taxa de bits compreendendo: dispositivo para processamento; dispositivo para receber um primeiro pacote; dispositivo para analisar o primeiro pacote para determinar uma primeira taxa de bits associada ao primeiro pacote; dispositivo para descartar bits associados a pelo menos um parâmetro do primeiro pacote; dispositivo para empacotar bits restantes associados a um ou mais parâmetros e um identificador especial em um segundo pacote associado a uma segunda taxa de bits; e dispositivo para transmitir o segundo pacote.
20. Meio legível por computador configurado para armazenar um conjunto de instruções executáveis para: receber um primeiro pacote, analisar o primeiro pacote para determinar uma primeira taxa de bits associada ao primeiro pacote; descartar bits associados a pelo menos um parâmetro do primeiro pacote; empacotar bits restantes associados a um ou mais parâmetros e um identificador especial em um segundo pacote associado a uma segunda taxa de bits; e transmitir o segundo pacote.
21. Método para decodificar um pacote, o método compreendendo: receber um pacote; Ier um identificador especial incluído no pacote; descobrir que o pacote foi escurecido de um primeiro pacote associado a uma primeira taxa de bit para um segundo pacote associado a uma segunda taxa de bit; e selecionar um modo de decodificação para o pacote.
22. Método para escurecer um pacote de uma taxa completa para meia taxa, o método compreendendo: receber um pacote de taxa completa; escurecer o pacote de taxa completa a um pacote de meia taxa descartando bits associados a um parâmetro proveniente do pacote de taxa completa; empacotar o pacote de taxa completa com bits associados à informação de sinalização; e transmitir o pacote de meia taxa a um decodificador.
BRPI0720873-1A 2007-01-04 2007-12-27 Sistemas e métodos para escurecer um primeiro pacote associado a uma primeira taxa de bit para um segundo pacote associado a uma segunda taxa de bit. BRPI0720873A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/619,798 US8279889B2 (en) 2007-01-04 2007-01-04 Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate
US11/619,798 2007-01-04
PCT/US2007/088926 WO2008085752A1 (en) 2007-01-04 2007-12-27 Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate

Publications (1)

Publication Number Publication Date
BRPI0720873A2 true BRPI0720873A2 (pt) 2014-03-04

Family

ID=39345162

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0720873-1A BRPI0720873A2 (pt) 2007-01-04 2007-12-27 Sistemas e métodos para escurecer um primeiro pacote associado a uma primeira taxa de bit para um segundo pacote associado a uma segunda taxa de bit.

Country Status (10)

Country Link
US (1) US8279889B2 (pt)
EP (1) EP2115740A1 (pt)
JP (1) JP5199281B2 (pt)
KR (1) KR101164834B1 (pt)
CN (1) CN101573752B (pt)
BR (1) BRPI0720873A2 (pt)
CA (1) CA2671881C (pt)
RU (1) RU2440628C2 (pt)
TW (1) TWI358057B (pt)
WO (1) WO2008085752A1 (pt)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9269366B2 (en) * 2009-08-03 2016-02-23 Broadcom Corporation Hybrid instantaneous/differential pitch period coding
US8345617B2 (en) * 2009-08-24 2013-01-01 Qualcomm Incorporated Sending an uplink order to active set base stations
US9564136B2 (en) * 2014-03-06 2017-02-07 Dts, Inc. Post-encoding bitrate reduction of multiple object audio

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit
WO1992003023A1 (en) * 1990-08-06 1992-02-20 Fujitsu Limited Communication equipment having repeat switching function
DE69232202T2 (de) * 1991-06-11 2002-07-25 Qualcomm Inc Vocoder mit veraendlicher bitrate
ZA946674B (en) 1993-09-08 1995-05-02 Qualcomm Inc Method and apparatus for determining the transmission data rate in a multi-user communication system
US5519779A (en) 1994-08-05 1996-05-21 Motorola, Inc. Method and apparatus for inserting signaling in a communication system
JPH08146997A (ja) 1994-11-21 1996-06-07 Hitachi Ltd 符号変換装置および符号変換システム
US6205190B1 (en) * 1996-04-29 2001-03-20 Qualcomm Inc. System and method for reducing interference generated by a CDMA communications device
JP3283200B2 (ja) * 1996-12-19 2002-05-20 ケイディーディーアイ株式会社 符号化音声データの符号化レート変換方法および装置
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6260009B1 (en) * 1999-02-12 2001-07-10 Qualcomm Incorporated CELP-based to CELP-based vocoder packet translation
KR100297875B1 (ko) 1999-03-08 2001-09-26 윤종용 가변 속도 보코더를 사용하는 코드 분할 다중 접속 시스템의 음질 향상을 위한 방법
US6330532B1 (en) * 1999-07-19 2001-12-11 Qualcomm Incorporated Method and apparatus for maintaining a target bit rate in a speech coder
US7606164B2 (en) * 1999-12-14 2009-10-20 Texas Instruments Incorporated Process of increasing source rate on acceptable side of threshold
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6728391B1 (en) * 1999-12-03 2004-04-27 United Parcel Service Of America, Inc. Multi-resolution label locator
US7574351B2 (en) * 1999-12-14 2009-08-11 Texas Instruments Incorporated Arranging CELP information of one frame in a second packet
US7463600B2 (en) * 2000-01-20 2008-12-09 Nortel Networks Limited Frame structure for variable rate wireless channels transmitting high speed data
CN1593062A (zh) * 2000-02-04 2005-03-09 皇家菲利浦电子有限公司 用于位速率变码应用的量化方法
JP3761795B2 (ja) * 2000-04-10 2006-03-29 三菱電機株式会社 ディジタル回線多重化装置
AU2001253752A1 (en) * 2000-04-24 2001-11-07 Qualcomm Incorporated Method and apparatus for predictively quantizing voiced speech
US6584438B1 (en) 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
WO2002001763A1 (en) 2000-06-28 2002-01-03 Samsung Electronics Co. Ltd Reverse data transmission method and apparatus in mobile communication system
US6477502B1 (en) * 2000-08-22 2002-11-05 Qualcomm Incorporated Method and apparatus for using non-symmetric speech coders to produce non-symmetric links in a wireless communication system
CA2395222C (en) 2000-10-21 2008-01-22 Min-Goo Kim Transmitting packet data in mobile communications systems
JP2002229599A (ja) * 2001-02-02 2002-08-16 Nec Corp 音声符号列の変換装置および変換方法
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
JP4022111B2 (ja) * 2002-08-23 2007-12-12 株式会社エヌ・ティ・ティ・ドコモ 信号符号化装置及び信号符号化方法
US7657427B2 (en) * 2002-10-11 2010-02-02 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
KR100711280B1 (ko) * 2002-10-11 2007-04-25 노키아 코포레이션 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치
US7330427B2 (en) * 2003-04-16 2008-02-12 International Business Machines Corporation MMPP analysis of network traffic using a transition window
KR100689365B1 (ko) 2003-07-10 2007-03-02 삼성전자주식회사 이동통신시스템에서 신호 및 부가 데이터 다중화 전송 방법 및 시스템
US7469209B2 (en) * 2003-08-14 2008-12-23 Dilithium Networks Pty Ltd. Method and apparatus for frame classification and rate determination in voice transcoders for telecommunications
US7016409B2 (en) * 2003-11-12 2006-03-21 Sony Corporation Apparatus and method for use in providing dynamic bit rate encoding
KR20070001267A (ko) 2004-04-09 2007-01-03 닛본 덴끼 가부시끼가이샤 음성 통신 방법 및 장치
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
US8355907B2 (en) * 2005-03-11 2013-01-15 Qualcomm Incorporated Method and apparatus for phase matching frames in vocoders
US7725311B2 (en) 2006-09-28 2010-05-25 Ericsson Ab Method and apparatus for rate reduction of coded voice traffic

Also Published As

Publication number Publication date
RU2440628C2 (ru) 2012-01-20
WO2008085752A1 (en) 2008-07-17
CN101573752A (zh) 2009-11-04
TW200844979A (en) 2008-11-16
CA2671881A1 (en) 2008-07-17
US8279889B2 (en) 2012-10-02
TWI358057B (en) 2012-02-11
KR101164834B1 (ko) 2012-07-11
CA2671881C (en) 2013-08-20
KR20090082495A (ko) 2009-07-30
CN101573752B (zh) 2013-06-12
JP5199281B2 (ja) 2013-05-15
US20080165799A1 (en) 2008-07-10
RU2009129690A (ru) 2011-02-10
EP2115740A1 (en) 2009-11-11
JP2010515936A (ja) 2010-05-13

Similar Documents

Publication Publication Date Title
ES2265958T3 (es) Discretizacion de magnitud espectral para un codificador de voz.
US6477502B1 (en) Method and apparatus for using non-symmetric speech coders to produce non-symmetric links in a wireless communication system
US7987089B2 (en) Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
RU2331933C2 (ru) Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах
ES2360176T3 (es) Alisamiento de discontinuidades entre tramas de habla.
RU2704747C2 (ru) Выбор процедуры маскирования потери пакета
ES2257307T3 (es) Metodo y sistema para codificacion de voz en condiciones de borrado de trama.
BRPI0206835B1 (pt) método e equipamento para interoperabilidade entre sistemas de transmissão de voz durante inatividade da fala
BRPI0714825A2 (pt) Sistemas e métodos para incluir um identificador a um pacote associado a um sinal de fala
BR112014017120B1 (pt) Sistemas, métodos aparelho, e mídia legível por computador para controle de limite de criticalidade
BRPI0715211A2 (pt) sistemas, mÉtodos e equipamentos para codificaÇço e decodificaÇço em banda larga de quadros ativos
ES2264420T3 (es) Metodo y aparato para entrelazar metodos de discretizacion de informacion espectral en un codificador de voz.
JP2003505723A (ja) 音声符号器における目標ビットレートを維持する方法および装置
BRPI0015070B1 (pt) método para codificar frames de fala, e, codificador de fala para reduzir sensibilidade às condições de erro de frame
US6434519B1 (en) Method and apparatus for identifying frequency bands to compute linear phase shifts between frame prototypes in a speech coder
BRPI0719728A2 (pt) Sistemas e métodos para normalização dinâmica para reduzir perda em precisão para sinais de baixo nível.
BRPI0720873A2 (pt) Sistemas e métodos para escurecer um primeiro pacote associado a uma primeira taxa de bit para um segundo pacote associado a uma segunda taxa de bit.

Legal Events

Date Code Title Description
B15K Others concerning applications: alteration of classification

Ipc: G10L 19/16 (2013.01), G10L 19/24 (2013.01)

B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06T Formal requirements before examination [chapter 6.20 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]
B12B Appeal against refusal [chapter 12.2 patent gazette]