BRPI0808428A2 - Dispostivo de codificação e método de codificação - Google Patents

Dispostivo de codificação e método de codificação Download PDF

Info

Publication number
BRPI0808428A2
BRPI0808428A2 BRPI0808428-9A BRPI0808428A BRPI0808428A2 BR PI0808428 A2 BRPI0808428 A2 BR PI0808428A2 BR PI0808428 A BRPI0808428 A BR PI0808428A BR PI0808428 A2 BRPI0808428 A2 BR PI0808428A2
Authority
BR
Brazil
Prior art keywords
section
coding
layer
gain
vector
Prior art date
Application number
BRPI0808428-9A
Other languages
English (en)
Inventor
Masahiro Oshikiri
Toshiyuki Morii
Tomofumi Yamanashi
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Publication of BRPI0808428A2 publication Critical patent/BRPI0808428A2/pt
Publication of BRPI0808428A8 publication Critical patent/BRPI0808428A8/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

Relatório Descritivo da Patente de Invenção para "DISPOSITIVO DE CODIFICAÇÃO E MÉTODO DE CODIFICAÇÃO".
CAMPO DA TÉCNICA
A presente invenção refere-se a um aparelho de codificação e 5 um método de codificação utilizados em um sistema de comunicação que codifica e transmite sinais de entrada tais como os sinais de voz. FUNDAMENTOS DA TÉCNICA
É demandado em um sistema de comunicação móvel que os sinais de voz sejam comprimidos para baixas taxas de bits para transmitir 10 para utilizar eficientemente os recursos de onda de rádio, e assim por diante. Por outro lado, é também demandado que um aperfeiçoamento de qualidade em voz de chamada telefônica e um serviço de chamada de alta fidelidade possam ser realizados, e, para atender estas demandas, é preferível não somente prover os sinais de voz de qualidade mas também codificar outros 15 sinais de qualidade do que os sinais de voz, tais como os sinais de áudio de qualidade de bandas mais largas.
A técnica de integrar uma pluralidade de técnicas de codificação em camadas é promissora para estas duas demandas contraditórias. Esta técnica combina em camadas a camada de base para codificar os sinais de 20 entrada em uma forma adequada para os sinais de voz em baixas taxas de bits e uma camada de melhoramento para codificar os sinais diferenciais entre os sinais de entrada e os sinais decodificados da camada de base em uma forma adequada para outros sinais do que a voz. A técnica de executar uma codificação em camadas deste modo tem características de prover uma 25 escalabilidade em fluxos de bits adquiridos de um aparelho de codificação, isto é, adquirir os sinais decodificados de parte de informações de fluxos de bits, e, portanto, é geralmente referida como "codificação escalável (codificação em camadas)".
O esquema de codificação escalável pode suportar flexivelmente a comunicação entre as redes de taxas de bits variáveis graças às suas características, e, consequentemente, é adequado para um ambiente de rede futuro onde várias redes serão integradas pelo IP (Protocolo de Internet). Por exemplo, o Documento Não - Patente 1 descreve uma técnica para realizar uma codificação escalável utilizando a técnica que é padronizada pelo MPEG-4 (Moving Picture Experts Group phase-4). Esta técnica utiliza uma codificação CELP (Predição Linear Excitada em Código) ade5 quada para os sinais de voz, na camada de base, e utiliza uma codificação de transformada tal como AAC (Codificador de Áudio Avançado) e TwinVQ (Quantização de vetor de Intercalação Ponderada de Domínio de Transformada) com relação a sinais residuais que subtraem o sinal decodificado de camada de base do sinal original, na camada de melhoramento.
Ainda, para suportar flexivelmente um ambiente de rede no qual
a velocidade de transmissão flutua dramaticamente devido à transferência entre os diferentes tipos de redes e a ocorrência de congestionamento, a codificação escalável de pequenas escalas de taxa de bits precisa ser realizada e, consequentemente, precisa ser configurada pela provisão de múltipias camadas de taxas de bits mais baixas.
O Documento de Patente 1 e o Documento de Patente 2 descrevem uma técnica de codificação de transformada para transformar um sinal o qual é o alvo a ser codificado, no domínio de frequência e codificar o sinal de domínio de frequência resultante. Em tal codificação de transformada, 20 primeiro, um componente de energia de um sinal de domínio de frequência, isto é, o ganho (isto é, o fator de escala) é calculado e quantizado em uma base por sub-banda, e um componente fino do sinal de domínio de frequência acima, isto é, um vetor de forma, é calculado e quantizado.
Documento Não - Patente 1: "Ali about MPEG-4", escrito e editado por Sukeichi MIKI, a primeira edição, Kogyo Chosakai Publishing, Inc., de Setembro de 1998, páginas 126 a 127.
Documento de Patente 1: Tradução Japonesa do Pedido PCT Aberto à Inspeção Pública Numero 2006-513457.
Documento de Patente 2: Pedido de Patente Japonesa Aberto à Inspeção Pública Numero HEI7-261800 DESCRICÃO DA INVENÇÃO
PROBLEMAS A SEREM RESOLVIDOS PELA INVENÇÃO No entanto, quando dois parâmetros sucessivos são quantizados em ordem, o parâmetro que é quantizado depois é influenciado pela distorção de quantização do parâmetro que é quantizado antes, e portanto está inclinado a mostrar uma distorção de quantização aumentada. Portanto, e5 xiste uma tendência que gera, na codificação de transformada descrita no Documento de Patente 1 e no Documento de Patente 2, para quantizar um ganho e um vetor de forma em ordem, os vetores de forma mostram uma distorção de quantização aumentada e são incapazes de representar a forma espectral precisa. Este problema produz uma deterioração de qualidade 10 significativa com relação a sinais de forte tonalidade tais como as vogais, isto é, os sinais que têm características espectrais em que múltiplas formas de pico são observadas. Este problema torna-se mais distinto quando uma taxa de bits mais baixa é implementada.
É portanto um objeto da presente invenção prover um aparelho 15 de codificação e um método de codificação para codificar precisamente as formas espectrais de sinais de forte tonalidade tais como as vogais, isto é, as formas espectrais de sinais que têm características espectrais em que múltiplas formas de pico são observadas, e aperfeiçoar a qualidade de sinais decodificados tais como a qualidade de som de sinais decodificados.
MEIOS PARA RESOLVER O PROBLEMA
O aparelho de codificação de acordo com a presente invenção emprega uma configuração a qual inclui: uma seção de codificação de camada de base que codifica um sinal de entrada para adquirir os dados codificados de camada de base; uma seção de decodificação de camada de ba25 se que decodifica os dados codificados de camada de base para adquirir um sinal decodificado de camada de base; e uma seção de codificação de camada de melhoramento que codifica um sinal residual que representa uma diferença entre o sinal de entrada e o sinal decodificado de camada de base, para adquirir os dados codificados de camada de melhoramento, e na qual a 30 seção de codificação de camada de melhoramento tem: uma seção de divisão que divide o sinal residual em uma pluralidade de sub-bandas; uma primeira seção de codificação de vetor de forma que codifica a pluralidade de sub-bandas para adquirir as primeiras informações codificadas de forma, e que calcula os ganhos-alvo da pluralidade de sub-bandas; uma seção de formação de vetor de ganho que forma um vetor de ganho utilizando a pluralidade de ganhos-alvo; e uma seção de codificação de vetor de ganho que 5 codifica o vetor de ganho para adquirir as primeiras informações codificadas de ganho.
O método de codificação de acordo com a presente invenção inclui: dividir os coeficientes de transformada adquiridos pela transformação de um sinal de entrada em um domínio de frequência, em uma pluralidade 10 de sub-bandas; codificar os coeficientes de transformada da pluralidade de sub-bandas para adquirir as primeiras informações codificadas de forma e calcular os ganhos-alvo dos coeficientes de transformada da pluralidade de sub-bandas; formar um vetor de ganho utilizando a pluralidade de ganhosalvo; e codificar o vetor de ganho para adquirir as primeiras informações co15 dificadas de ganho.
EFEITOS VANTAJOSOS DA INVENÇÃO
A presente invenção pode codificar mais precisamente as formas espectrais de sinais de forte tonalidade tais como as vogais, isto é, as formas espectrais de sinais que têm características espectrais em que múltipias formas de pico são observadas, e aperfeiçoar a qualidade de sinais decodificados tal como a qualidade de som de sinais decodificados.
BREVE DESCRIÇÃO DOS DESENHOS
Figura 1 é um diagrama de blocos que mostra a configuração principal de um aparelho de codificação de voz de acordo com a Modalidade 1 da presente invenção;
Figura 2 é um diagrama de blocos que mostra a configuração dentro de uma seção de codificação da segunda camada de acordo com a Modalidade 1 da presente invenção;
Figura 3 é um fluxograma que mostra as etapas de processamento de codificação da segunda camada na seção de codificação da segunda camada de acordo com a Modalidade 1 da presente invenção;
Figura 4 é um diagrama de blocos que mostra a configuração dentro de uma seção de codificação de vetor de forma de acordo com a Modalidade 1 da presente invenção;
Figura 5 é um diagrama de blocos que mostra a configuração dentro de uma seção de codificação de vetor de ganho de acordo com a Modalidade 1 da presente invenção;
Figura 6 ilustra em detalhes a operação da seção de arranjo de ganho-alvo de acordo com a Modalidade 1 da presente invenção;
Figura 7 é um diagrama de blocos que mostra a configuração dentro de uma seção de codificação de vetor de ganho de acordo com a Modalidade 1 da presente invenção;
Figura 8 é um diagrama de blocos que mostra a configuração principal de um aparelho de decodificação de voz de acordo com a Modalidade 1 da presente invenção;
Figura 9 é um diagrama de blocos que mostra a configuração dentro de uma seção de decodificação da segunda camada de acordo com a Modalidade 1 da presente invenção;
Figura 10 ilustra um livro de códigos de vetor de forma de acordo com a Modalidade 2 da presente invenção;
Figura 11 ilustra os múltiplos candidatos de vetor de forma incluidos no livro de códigos de vetor de forma de acordo com a Modalidade 2 da presente invenção;
Figura 12 é um diagrama de blocos que mostra a configuração dentro da seção de codificação da segunda camada de acordo com a Modalidade 3 da presente invenção;
Figura 13 ilustra um processamento de seleção de faixa em uma
seção de seleção de faixa de acordo com a Modalidade 3 da presente invenção;
Figura 14 é um diagrama de blocos que mostra a configuração dentro da seção de decodificação da segunda camada de acordo com a Modalidade 3 da presente invenção;
Figura 15 mostra uma variação da seção de seleção de faixa de acordo com a Modalidade 3 da presente invenção; Figura 16 mostra uma variação de um método de seleção de faixa na seção de seleção de faixa de acordo com a Modalidade 3 da presente invenção;
Figura 17 é um diagrama de blocos que mostra uma variação da
configuração da seção de seleção de faixa de acordo com a Modalidade 3 da presente invenção;
Figura 18 ilustra como as informações de faixa são formadas na seção de formação de informações de faixa de acordo com a Modalidade 3 da presente invenção;
Figura 19 ilustra a operação de uma variação de uma seção de
geração de coeficiente de transformada de erro da primeira camada de acordo com a Modalidade 3 da presente invenção;
Figura 20 mostra uma variação do método de seleção de faixa na seção de seleção de faixa de acordo com a Modalidade 3 da presente invenção;
Figura 21 mostra uma variação do método de seleção de faixa na seção de seleção de faixa de acordo com a Modalidade 3 da presente invenção;
Figura 22 é um diagrama de blocos que mostra a configuração dentro da seção de codificação da segunda camada de acordo com a Modalidade 4 da presente invenção;
Figura 23 é um diagrama de blocos que mostra a configuração principal do aparelho de codificação de voz de acordo com a Modalidade 5 da presente invenção;
Figura 24 é um diagrama de blocos que mostra a configuração
principal dentro da seção de codificação da primeira camada de acordo com a Modalidade 5 da presente invenção;
Figura 25 é um diagrama de blocos que mostra a configuração principal dentro da seção de decodificação da primeira camada de acordo com a Modalidade 5 da presente invenção;
Figura 26 é um diagrama de blocos que mostra a configuração principal do aparelho de decodificação de voz de acordo com a Modalidade 5 da presente invenção;
Figura 27 é um diagrama de blocos que mostra a configuração principal do aparelho de codificação de voz de acordo com a Modalidade 6 da presente invenção;
Figura 28 é um diagrama de blocos que mostra a configuração
principal do aparelho de decodificação de voz de acordo com a Modalidade
6 da presente invenção;
Figura 29 é um diagrama de blocos que mostra a configuração principal do aparelho de codificação de voz de acordo com a Modalidade 7 da presente invenção;
Figura 30 ilustra o processamento de selecionar a faixa a qual é o alvo a ser codificado no processamento de codificação no aparelho de codificação de voz de acordo com a Modalidade 7 da presente invenção;
Figura 31 é um diagrama de blocos que mostra a configuração principal do aparelho de decodificação de voz de acordo com a Modalidade
7 da presente invenção;
Figura 32 ilustra um caso onde o alvo a ser codificado é selecionado de candidatos de faixa dispostos a intervalos iguais, no processamento de codificação no aparelho de codificação de voz de acordo com a Modalidade 7 da presente invenção; e
Figura 33 ilustra um caso onde o alvo a ser codificado é selecionado de candidatos de faixa dispostos a intervalos iguais, no processamento de codificação no aparelho de codificação de voz de acordo com a Modalidade 7 da presente invenção.
MELHOR MODO PARA EXECUTAR A INVENÇÃO
Daqui em diante, as modalidades da presente invenção serão explicadas em detalhes com referência aos desenhos acompanhantes. Um aparelho de codificação de voz/aparelho de decodificação de voz será abaixo utilizado como um exemplo de um aparelho de codificação/aparelho de decodificação de acordo com a presente invenção para explicação.
(Modalidade 1)
A figura 1 é um diagrama de blocos que mostra a configuração principal de um aparelho de codificação de voz 100 de acordo com a Modalidade 1 da presente invenção. Um exemplo será explicado onde o aparelho de codificação de voz e o aparelho de decodificação de voz de acordo com a presente modalidade empregam uma configuração escalável em duas ca5 madas. Ainda, a primeira camada constitui a camada de base e a segunda camada constitui a camada de melhoramento.
Na figura 1, o aparelho de codificação de voz 100 tem uma seção de transformação de domínio de frequência 101, uma seção de codificação da primeira camada 102, uma seção de decodificação da primeira camada 103, um subtrator 104, uma seção de codificação da segunda camada 105 e uma seção de multiplexação 106.
A seção de transformação de domínio de frequência 101 transforma um sinal de entrada de domínio de tempo em um sinal de domínio de frequência, e emite os coeficientes de transformada de entrada resultantes para a seção de codificação da primeira camada 102 e o subtrator 104.
A seção de codificação da primeira camada 102 executa um processamento de codificação com relação aos coeficientes de transformada de entrada recebidos da seção de transformação de domínio de frequência 101, e emite os dados codificados da primeira camada resultantes para a 20 seção de decodificação da primeira camada 103 e a seção de multiplexação 106.
A seção de decodificação da primeira camada 103 executa um processamento de decodificação utilizando os dados codificados da primeira camada recebidos da seção de codificação da primeira camada 102, e emite os coeficientes de transformada decodificados da primeira camada resultantes para o subtrator 104.
O subtrator 104 subtrai os coeficientes de transformada decodificados da primeira camada recebidos da seção de decodificação da primeira camada 103, dos coeficientes de transformada de entrada recebidos da se30 ção de transformação de domínio de frequência 101, e emite os coeficientes de transformada de erro da primeira camada resultantes para a seção de codificação da segunda camada 105. A seção de codificação da segunda camada 105 executa um processamento de codificação com relação aos coeficientes de transformada de erro da primeira camada recebidos do subtrator 104, e emite os dados codificados da segunda camada resultantes para a seção de multiplexação 106. Ainda, a seção de codificação da segunda camada 105 será posteriormente descrita em detalhes.
A seção de multiplexação 106 multiplexa os dados codificados da primeira camada recebidos da seção de codificação da primeira camada 102 e os dados codificados da segunda camada recebidos da seção de codificação da segunda camada 105, e emite o fluxo de bits resultante para um canal de transmissão.
A figura 2 é um diagrama de blocos que mostra a configuração dentro da seção de codificação da segunda camada 105.
Na figura 2, a seção de codificação da segunda camada 105 tem uma seção de formação de sub-banda 151, uma seção de codificação de vetor de forma 152, uma seção de formação de vetor de ganho 153, uma seção de codificação de vetor de ganho 154 e uma seção de multiplexação 155.
A seção de formação de sub-banda 151 divide os coeficientes de transformada de erro da primeira camada recebidos do subtrator 104, em 20 M sub-bandas, e emite os M coeficientes de transformada de sub-banda resultantes para a seção de codificação de vetor de forma 152. Aqui, quando os coeficientes de transformada de erro da primeira camada estão representados como ei(k), o m— coeficientes de transformada de sub-banda e(m, k) (onde 0 < m < M-1) são representados pela equação 1 seguinte.
e(m, k) = eAk + F(m))
Equação 1
(0<k<F(m + \)-F(m))
Na equação 1, F(m) representa a frequência no limite de cada
sub-banda, e a relação de 0<F(0)<F(1)<...<F(M)<FH é verdadeira. Aqui, FH representa a frequência mais alta dos coeficientes de transformada de erro da primeira camada, e m assume um inteiro de 0 < m < M-1.
A seção de codificação de vetor de forma 152 executa uma quantização de vetor de forma com relação aos M coeficientes de transformada de sub-banda seqüencialmente recebidos da seção de formação de sub-banda 151, para gerar as informações codificadas de forma das M subbandas e calcula os ganhos-alvo dos M coeficientes de transformada de sub-banda. A seção de codificação de vetor de forma 152 emite as informa5 ções codificadas de forma geradas para a seção de multiplexação 155, e emite os ganhos-alvo para a seção de formação de vetor de ganho 153. Ainda, a seção de codificação de vetor de forma 152 será posteriormente descrita em detalhes.
A seção de formação de vetor de ganho 153 forma um vetor de ganho com os M ganhos-alvo recebidos da seção de codificação de vetor de forma 152, e emite este vetor de ganho para a seção de codificação de vetor de ganho 154. Ainda, a seção de formação de vetor de ganho 153 será posteriormente descrita em detalhes.
A seção de codificação de vetor de ganho 154 executa uma 15 quantização de vetor utilizando o vetor de ganho recebido da seção de formação de vetor de ganho 153 como um valor-alvo, e emite as informações codificadas de ganho resultantes para a seção de multiplexação 155. Ainda, a seção de codificação de vetor de ganho 154 será posteriormente descrita em detalhes.
A seção de multiplexação 155 multiplexa as informações codifi
cadas de forma recebidas da seção de codificação de vetor de forma 152 e as informações codificadas de ganho recebidas da seção de codificação de vetor de ganho 154, e emite o fluxo de bits resultante como os dados codificados da segunda camada para a seção de multiplexação 106.
A figura 3 mostra um fluxograma que mostra as etapas do pro
cessamento de codificação da segunda camada na seção de codificação da segunda camada 105.
Primeiro, na etapa (daqui em diante, abreviada como "ST") 1010, a seção de formação de sub-banda 151 divide os coeficientes de transformada de erro da primeira camada em M sub-bandas para formar M coeficientes de transformada de sub-banda.
A seguir, na ST 1020, a seção de codificação da segunda camada 105 inicializa um contador de sub-bandas m que conta as sub-bandas, para "0".
A seguir, em ST 1030, a seção de codificação de vetor de forma
152 executa uma codificação de vetor de forma com relação aos m— coeficientes de transformada de sub-banda para gerar as m— informações codificadas de forma de sub-banda e gerar o ganho-alvo dos m— coeficientes de transformada de sub-banda.
A seguir em ST 1040, a seção de codificação da segunda camada 105 incrementa o contador de sub-bandas m em um.
A seguir, em ST 1050, a seção de codificação da segunda ca
mada 105 decide se m<M é verdadeiro ou não.
Em ST 1050, quando decidindo que m<M é verdadeiro (ST 1050: "SIM"), a seção de codificação da segunda camada 105 retorna a etapa de processamento para ST 1030.
Em contraste com isto, em ST 1050, quando decidindo que m<M
não é verdadeiro (ST 1050: "NÃO"), a seção de formação de vetor de ganho
153 forma um vetor de ganho utilizando M ganhos-alvo em ST 1060.
A seguir, em ST 1070, a seção de codificação de vetor de ganho
154 executa uma quantização de vetor utilizando o vetor de ganho formado na seção de formação de vetor de ganho 153 como um valor-alvo para gerar
as informações codificadas de ganho.
A seguir, em ST 1080, a seção de multiplexação 155 multiplexa as informações codificadas de forma geradas na seção de codificação de vetor de forma 152 e as informações codificadas de ganho geradas na seção de codificação de vetor de ganho 154.
A figura 4 é um diagrama de blocos que mostra a configuração dentro da seção de codificação de vetor de forma 152.
Na figura 4, a seção de codificação de vetor de forma 152 tem um livro de códigos de vetor de forma 521, uma seção de cálculo de correlação cruzada 522, uma seção de cálculo de autocorrelação 523, uma seção de pesquisa 524 e uma seção de cálculo de ganho-alvo 525.
O livro de códigos de vetor de forma 521 armazena uma pluralidade de candidatos de vetor de forma que representam a forma dos coeficientes de transformada de erro da primeira camada, e emite os candidatos de vetor de forma seqüencialmente para a seção de cálculo de correlação cruzada 522 e a seção de cálculo de autocorrelação 523 com base em um sinal 5 de controle recebido da seção de pesquisa 524. Ainda, geralmente, existem casos onde um livro de códigos de vetor de forma adota o modo de realmente assegurar um espaço de armazenamento e armazenar os candidatos de vetor de forma, e existem casos onde um livro de códigos de vetor de forma, forma os candidatos de vetor de forma de acordo com etapas de processa10 mento predeterminadas. Nos últimos casos, não é necessário realmente assegurar um espaço de armazenamento. Apesar de qualquer um dos livros de códigos de vetor de forma poder ser utilizado na presente modalidade, a presente modalidade será abaixo explicada assumindo que o livro de códigos de vetor de forma 521 que armazena os candidatos de vetor de forma 15 mostrados na figura 4 está provido. Daqui em diante, o is candidato de vetor de forma na pluralidade de candidatos de vetor de forma armazenados no livro de códigos de vetor de forma 521, está representado como c(i, k). Aqui, k representa o ks elemento de uma pluralidade de elementos que formam um candidato de vetor de forma.
A seção de cálculo de correlação cruzada 522 calcula a correla
ção cruzada ccor(i) entre os m— coeficientes de transformada de sub-banda recebidos da seção de formação de sub-banda 151 e o i- candidato de vetor de forma recebido do livro de códigos de vetor de forma 521, de acordo com a equação 2 seguinte, e emite a correlação cruzada ccor(i) para a seção de pesquisa 524 e a seção de cálculo de ganho-alvo 525.
ccor(i)= ^ e(m,k)'c{i,k) Equação 2
A=O
A seção de cálculo de autocorrelação 523 calcula a autocorrelação acor(i) do candidato de vetor de forma c(i, k) recebido do livro de códigos de vetor de forma 521, de acordo com a equação 3 seguinte, e emite a autocorrelação acor(i) para a seção de pesquisa 524 e a seção de cálculo de ganho-alvo 525. F(m+i)-F(m)-\
acor(í) = c(i,k)2 Equação 3
A=O
A seção de pesquisa 524 calcula uma contribuição a representada pela equação 4 seguinte, utilizando a correlação cruzada ccor(i) recebida da seção de cálculo de correlação cruzada 522 e a autocorrelação acor(i) recebida da seção de cálculo de autocorrelação 523, e emite um sinal de 5 controle para o livro de códigos de vetor de forma 521 até que o valor máximo da contribuição A seja encontrado. A seção de pesquisa 524 emite o índice i0pt do candidato de vetor de forma de quando a contribuição A maximiza, como um índice ótimo, para a seção de cálculo de ganho-alvo 525, e emite o índice iopt como as informações codificadas de forma para a seção de 10 multiplexação 155.
[4]
ccor{if _
A =-Equaçao 4
acor(i)
A seção de cálculo de ganho-alvo 525 calcula o ganho-alvo de acordo com a equação 5 seguinte utilizando a correlação cruzada ccor(i) recebida da seção de cálculo de correlação cruzada 522, a autocorrelação 15 acor(i) recebida da seção de cálculo de autocorrelação 523 e o índice ótimo i0pt recebido da seção de pesquisa 524, e emite este ganho-alvo para a seção de formação de vetor de ganho 153.
[5]
ccor(i) gain =-— Equação 5
Ocor(Iopt)
A figura 5 é um diagrama de blocos que mostra a configuração dentro da seção de formação de vetor de ganho 153.
Na figura 5, a seção de formação de vetor de ganho 153 tem a seção de determinação de posição de disposição 531 e a seção de disposição de ganho-alvo 532.
A seção de determinação de posição de disposição 531 tem um contador que assume "0" como um valor inicial, incrementa o valor no contador em um cada vez que um ganho-alvo é recebido da seção de decodificação de vetor de forma 152 e, quando o valor no contador atinge o número total de sub-bandas M, ajusta o valor no contador para zero novamente. Aqui, M é também o comprimento de vetor de um vetor de ganho formado na seção de formação de vetor de ganho 153, e o processamento no contador 5 provido na seção de determinação de posição de disposição 531 é igual a dividir o valor no contador pelo comprimento de vetor do vetor de ganho e encontrar o seu resto. Isto é, o valor no contador assume um inteiro entre "0" e "M-1". Cada vez que o valor no contador é atualizado, a seção de determinação de posição de disposição 531 emite o valor atualizado no contador 10 como as informações de disposição para a seção de disposição de ganhoalvo 532.
A seção de disposição de ganho-alvo 532 tem M armazenamentos temporários que assumem "0" como um valor inicial e uma chave que dispõe o ganho-alvo recebido da seção de decodificação de vetor de forma 15 152, em cada armazenamento temporário candidato,e esta chave dispõe o ganho-alvo recebido da seção de decodificação de vetor de forma 152, em um armazenamento temporário que está designado como um número do valor mostrado pelas informações de disposição recebidas da seção de determinação de posição de disposição 531.
A figura 6 ilustra a operação da seção de disposição de ganho
alvo 532 em detalhes.
Na figura 6, quando as informações de disposição inseridas na chave mostra "0", o ganho-alvo é disposto no O2 armazenamento e, quando as informações de disposição mostram "M-1", o ganho-alvo é disposto no 25 (M-1)- armazenamento. Quando os ganhos-alvo estão dispostos em todos os armazenamentos temporários, a seção de disposição de ganho-alvo 532 emite um vetor de ganho formado com os ganhos-alvo dispostos em M armazenamentos, para a seção de codificação de vetor de ganho 154.
A figura 7 é um diagrama de blocos que mostra a configuração dentro de uma seção de codificação de vetor de ganho 154.
Na figura 7, a seção de codificação de vetor de ganho 154 tem um livro de códigos de vetor de ganho 541, uma seção de cálculo de erro 542 e uma seção de pesquisa 543.
O livro de códigos de vetor de ganho 541 armazena uma pluralidade de candidatos de vetor de ganho que representa um vetor de ganho, e emite os candidatos de vetor de ganho seqüencialmente para a seção de cálculo de erro 542, com base no sinal de controle recebido da seção de pesquisa 543. Ainda, geralmente, existem casos onde um livro de códigos de vetor de ganho adota um modo de realmente assegurar um espaço de armazenamento e armazenar os candidatos de vetor de ganho, e existem casos onde um livro de códigos de vetor de ganho forma os candidatos de vetor de ganho de acordo com etapas de processamento predeterminadas. Nos últimos casos, não é necessário realmente assegurar um espaço de armazenamento. Apesar de qualquer um dos livros de códigos de vetor de ganho poder ser utilizado na presente modalidade, a presente modalidade será abaixo explicada assumindo que o livro de códigos de vetor de ganho 541 que armazena os candidatos de vetor de ganho mostrados na figura 7 está provido. Daqui em diante, o j2 candidato de vetor de ganho da pluralidade de candidatos de vetor de ganho armazenados no livro de códigos de vetor de ganho 541, está representado como g(j, m). Aqui, m representa o m2 elemento de M elementos que formam um candidato de vetor de ganho. A seção de cálculo de erro 542 calcula o erro E(j) de acordo com
a equação 6 seguinte utilizando o vetor de ganho recebido da seção de formação de vetor de ganho 153 e o candidato de vetor de ganho recebido do livro de códigos de vetor de ganho 541, e emite o erro EO) para a seção de pesquisa 543. [6]
M-1
E(j) = X (gv(m) - g(j, m)f Equação 6
m=0
Na equação 6, m representa o número de sub-bandas, e gv(m)
representa um vetor de ganho recebido da seção de formação de vetor de ganho 153.
A seção de pesquisa 543 emite um sinal de controle para o livro de códigos de vetor de ganho 541 até que um valor mínimo do erro E(j) recebido da seção de cálculo de erro 542 seja encontrado, pesquisa pelo índice jopt de quando o erro EO) é minimizado, e emite o índice jopt como as informações codificadas de ganho para a seção de multiplexação 155.
A figura 8 é um diagrama de blocos que mostra a configuração principal do aparelho de decodificação de voz 200 de acordo com a presente 5 modalidade.
Na figura 8, o aparelho de decodificação de voz 200 tem uma seção de demultiplexação 201, uma seção de decodificação da primeira camada 202, uma seção de codificação da segunda camada 203, um somador 204, uma seção de comutação 205, uma seção de transformação de domínio de tempo 206 e um pós-filtro 207.
A seção de demultiplexação 201 demultiplexa o fluxo de bits transmitido do aparelho de codificação de voz 100 através de um canal de transmissão, nos dados codificados da primeira camada e nos dados codificados da segunda camada, e emite os dados codificados da primeira cama15 da e os dados codificados da segunda camada para a seção de decodificação da primeira camada 202 e a seção de codificação da segunda camada 203, respectivamente. No entanto, existem casos, dependendo do estado do canal de transmissão (por exemplo, a ocorrência de congestionamento), onde parte dos dados codificados tais como os dados codificados da segunda 20 camada ou os dados codificados que incluem os dados codificados da primeira camada e os dados codificados da segunda camada, são perdidos. Então, a seção de demultiplexação 201 decide se somente os dados codificados da primeira camada estão incluídos nos dados codificados recebidos ou tanto os dados codificados da primeira camada quanto os dados codifica25 dos da segunda camada estão incluídos, e emite "1" como as informações de camada no primeiro caso, e emite "2" como as informações de camada no último caso. Ainda, quando decidindo que todos os dados codificados incluindo os dados codificados da primeira camada e os dados codificados da segunda camada estão perdidos, a seção de demultiplexação 201 execu30 ta um processamento de compensação predeterminado para gerar os dados codificados da primeira camada e os dados codificados da segunda camada, emite os dados codificados da primeira camada e os dados codificados da segunda camada para a seção de decodificação da primeira camada 202 e a seção de decodificação da segunda camada 203, respectivamente, e emite "2" como as informações de camada, para a seção de comutação 205.
A seção de decodificação da primeira camada 202 executa um 5 processamento de decodificação utilizando os dados codificados da primeira camada recebidos da seção de demultiplexação 201, e emite os coeficientes de transformada decodificados da primeira camada para o somador 204 e a seção de comutação 205.
A seção de decodificação da segunda camada 203 executa um processamento de decodificação utilizando os dados codificados da segunda camada recebidos da seção de demultiplexação 201, e emite os coeficientes de transformada decodificados da primeira camada para o somador 204.
O somador 204 adiciona os coeficientes de transformada decodificados da primeira camada recebidos da seção de decodificação da primei15 ra camada 202 e os coeficientes de transformada de erro da primeira camada recebidos da seção de decodificação da segunda camada 203, e emite os coeficientes de transformada decodificados da segunda camada resultantes para a seção de comutação 205.
A seção de comutação 205 emite os coeficientes de transforma20 da decodificados da primeira camada como os coeficientes de transformada decodificados para a seção de transformação de domínio de tempo 206 quando as informações de camada recebidas da seção de demultiplexação 201 mostram "1", e emite os coeficientes de transformada decodificados da segunda camada como os coeficientes de transformada decodificados para 25 a seção de transformação de domínio de tempo 206 quando as informações de camada mostram "2".
A seção de transformação de domínio de tempo 206 transforma os coeficientes de transformada decodificados recebidos da seção de comutação 205, em um sinal de domínio de tempo, e emite o sinal decodificado resultante para o pós-filtro 207.
O pós-filtro 207 executa um processamento de pós-filtragem tal como ênfase de formato, ênfase de passo e ajuste de inclinação espectral, com relação ao sinal decodificado recebido da seção de transformação de domínio de tempo 206, e emite o resultado como voz decodificada.
A figura 9 é um diagrama de blocos que mostra a configuração dentro da seção de decodificação da segunda camada 203.
Na figura 9, a seção de decodificação da segunda camada 203
tem uma seção demultiplexação 231, um livro de códigos de vetor de forma 232, um livro de códigos de vetor de ganho 233, e um seção de geração de coeficiente de transformada de erro da primeira camada 234.
A seção demultiplexação 231 ainda demultiplexa os dados codi10 ficados da segunda camada recebidos da seção de demultiplexação 201 em informações codificadas em forma e informações codificadas em ganho, e emite as informações codificadas em forma e as informações codificadas em ganho para o livro de códigos de vetor de forma 232 e o livro de códigos de vetor de ganho 233, respectivamente.
O livro de códigos de vetor de forma 232 tem candidatos de ve
tor de forma idênticos a uma pluralidade de candidatos de vetor de forma providos no livro de códigos de vetor de forma 521 na figura 4, e emite o candidato de vetor de forma mostrado pelas informações codificadas de forma recebidas da seção de demultiplexação 231, para a seção de geração de coeficiente de transformada de erro da primeira camada 234.
O livro de códigos de vetor de ganho 233 tem candidatos de vetor de ganho idênticos a uma pluralidade de candidatos de vetor de ganho providos no livro de códigos de vetor de ganho 541 na figura 7, e emite o candidato de vetor de ganho mostrado pelas informações codificadas de ga25 nho recebidas da seção de demultiplexação 231, para a seção de geração de coeficiente de transformada de erro da primeira camada 234.
A seção de geração de coeficiente de transformada de erro da primeira camada 234 multiplica o candidato de vetor de forma recebido do livro de códigos de vetor de forma 232 pelo candidato de vetor de ganho re30 cebido do livro de códigos de vetor de ganho 233 para gerar os coeficientes de transformada de erro da primeira camada, e emite os coeficientes de transformada de erro da primeira camada para o somador 204. Para ser mais específico o me elemento dos M elementos que formam o candidato de vetor de ganho recebido do livro de códigos de vetor de ganho 233, isto é, o ganho-alvo dos m— coeficientes de transformada de sub-banda, é multiplicado pelo m2 candidato de vetor de forma seqüencialmente recebido do livro 5 de códigos de vetor de forma 232. Aqui, como acima descrito, M representa o número total de sub-bandas.
Deste modo, a presente modalidade emprega uma configuração de codificação da forma espectral de um sinal-alvo (isto é, os coeficientes de transformada de erro da primeira camada com a modalidade presente) em 10 uma base por sub-banda (codificação de vetor de forma), então calculando um ganho-alvo (isto é, um ganho ideal) que minimize a distorção entre o sinal-alvo e um vetor de forma codificado e codificando o ganho-alvo (codificação de ganho-alvo). Por este meio, comparado com o esquema como uma técnica convencional de codificação do componente de energia de um sinal15 alvo em uma base por sub-banda (codificação de ganho ou fator de escala) a normalização do sinal-alvo que utiliza o componente de energia codificado e então codificando a forma espectral (codificação de vetor de forma), a presente invenção que codifica o ganho-alvo para minimizar a distorção com relação a um sinal-alvo, pode essencialmente minimizar a distorção de codi20 ficação. Ainda, o ganho-alvo é um parâmetro que pode ser calculado após o vetor de forma ser codificado como mostrado na equação 5, e, portanto, apesar do esquema de codificação como uma técnica convencional para executar uma codificação de vetor de forma temporalmente subsequente à codificação de informações de ganho não poder utilizar o ganho-alvo como o 25 alvo para as informações de ganho de codificação, a presente modalidade torna possível utilizar o ganho-alvo com o alvo para codificar as informações de ganho e pode ainda minimizar a distorção de codificação.
Ainda, a presente modalidade emprega uma configuração de formar e codificar um vetor de ganho utilizando os ganhos-alvo de uma pluralidade de sub-bandas adjacentes. As informações de energia entre as subbandas adjacentes de um sinal-alvo são similares, e a similaridade de ganhos-alvo entre as sub-bandas adjacentes é alta do mesmo modo. Portanto, uma distribuição de densidade não uniformizada de vetores de ganho é produzida no espaço de vetor. Dispondo os candidatos de vetor de ganho incluídos no livro de códigos de ganho a serem adaptados para esta distribuição de densidade não uniformizada, é possível reduzir a distorção de codificação 5 do ganho-alvo.
Deste modo, de acordo com a presente modalidade, é possível reduzir a distorção de codificação do sinal-alvo e, consequentemente, aperfeiçoar a qualidade de som da voz decodificada. Ainda, a presente modalidade pode codificar precisamente as formas espectrais para os espectros de 10 sinais com uma forte tonalidade tal como as vogais de voz e os sinais de música.
Ainda, com uma técnica convencional, a amplitude espectral é controlada pela utilização de dois parâmetros, o ganho de sub-banda e o vetor de forma. Isto pode ser interpretado que a amplitude espectral é repre15 sentada separadamente por dois parâmetros, o ganho de sub-banda e o vetor de forma. Em contraste com isto, com a presente modalidade, a amplitude espectral é controlada somente por um parâmetro do ganho-alvo. Ainda, este ganho-alvo é um ganho ideal que minimiza a distorção de codificação com relação ao vetor de forma codificado. Consequentemente, é possível 20 executar a codificação eficientemente comparada com uma técnica convencional e realizar um som de alta qualidade mesmo quando a taxa de bits é baixa.
Ainda, apesar de um caso ter sido explicado com a presente modalidade como um exemplo onde o domínio de frequência é dividido em 25 uma pluralidade de sub-bandas pela seção de formação de sub-banda 151 e a codificação é executada em uma base por sub-banda, a presente invenção não está limitada a isto. Executando a codificação de vetor de forma temporalmente antes da codificação de vetor de ganho, uma pluralidade de subbandas pode ser codificada coletivamente, de modo que, similar à presente 30 modalidade, é possível prover uma vantagem de codificar mais precisamente as formas espectrais de sinais de forte tonalidade tais como as vogais. Por exemplo, uma configuração pode ser possível onde a codificação de vetor de forma é executada primeiro, então o vetor de forma é dividido em sub-bandas e os ganhos-alvo são calculados em uma base por sub-banda para formar um vetor de ganho e o vetor de ganho é codificado.
Ainda, apesar de um caso ter sido explicado com a presente modalidade como um exemplo onde a seção de codificação da segunda camada 105 tem uma seção de multiplexação 155 (ver figura 2), a presente invenção não está limitada a isto, e a seção de codificação de vetor de forma 152 e a seção de codificação de vetor de ganho 154 podem emitir as informações codificadas de forma e as informações codificadas de ganho diretamente para a seção de multiplexação 106 do aparelho de codificação de voz 100 (ver figura 1). Em contraste com isto, a seção de decodificação da segunda camada 203 pode não incluir a seção de demultiplexação 231 (ver figura 9), e a seção de demultiplexação 201 do aparelho de decodificação de voz 200 (ver figura 8) pode demultiplexar e emitir as informações codificadas de forma e as informações codificadas de ganho utilizando um fluxo de bits, diretamente para o livro de códigos de vetor de forma 232 e o livro de códigos de vetor de ganho 233, respectivamente.
Ainda, apesar de um caso ter sido explicado com a presente modalidade como um exemplo onde a seção de cálculo de correlação cru20 zada 522 calcula a correlação cruzada ccor(i) de acordo com a equação 2, a presente invenção não está limitada a isto, e a seção de cálculo de correlação cruzada 522 pode calcular a correlação cruzada ccor(i) de acordo com a equação 7 seguinte para aumentar a contribuição de um espectro perceptivamente importante. [7]
ccorii)= Hik)-e{m,k)· c(iJc)
Equação 7
Na equação 7, w(k) representa um peso relativo às característi
cas de percepção humana e aumenta quando uma frequência tem uma importância mais alta em características perceptivas.
Ainda, similarmente, a seção de cálculo de autocorrelação 523 pode calcular a autocorrelação acor(i) de acordo com a equação 8 seguinte para aumentar a contribuição de um espectro perceptivamente importante aplicando um grande peso no espectro perceptivamente importante [8]
acor(í) = 2 w(k)-c{ijíf
h=0 Equação 8
Ainda, similarmente, a seção de cálculo de erro 542 pode calcular o erro E(j) de acordo com a equação 9 seguinte para aumentar a contribuição de um espectro perceptivamente importante aplicando um grande peso no espectro perceptivamente importante [9]
M-1
E(J) = X Mm) ■ (gv(m) - g(J,m))2
«=° Equação 9
Como os pesos na equação 7, na equação 8 e na equação 9, por exemplo, pesos podem ser encontrados e utilizados utilizando as características de intensidade perceptiva humana ou um limite de mascaramento perceptivo calculado com base em um sinal de entrada ou um sinal decodifi10 cado de uma camada mais baixa (isto é, um sinal decodificado da primeira camada).
Ainda, apesar de um caso ter sido explicado com a presente modalidade como um exemplo onde a seção de codificação de vetor de forma 152 tem uma seção de cálculo de autocorrelação 523, a presente inven15 ção não está limitada a isto, e, quando os coeficientes de autocorrelação acor(i) calculados de acordo com a equação 3 ou os coeficientes de autocorrelação acor(i) calculados de acordo com a equação 8 tornam-se constantes, a autocorrelação acor(i) pode ser calculada com antecedência e utilizada sem prover a seção de cálculo de autocorrelação 523.
(Modalidade 2)
O aparelho de codificação de voz e o aparelho de decodificação de voz de acordo com a Modalidade 2 da presente invenção empregam a mesma configuração e executam a mesma operação que o aparelho de codificação de voz 100 e o aparelho de decodificação de voz 200 descritos na 25 Modalidade 1, e a Modalidade 2 difere da Modalidade 1 somente no livro de códigos de vetor de forma.
Para explicar o livro de códigos de vetor de forma de acordo com a presente modalidade, a figura 10 ilustra o espectro da vogal Japonesa "o" como um exemplo de uma vogal.
Na figura 10, o eixo geométrico horizontal é a frequência e o eixo geométrico vertical é a energia Iogaritmica do espectro. Como mostrado na figura 10, no espectro de uma vogal, múltiplas formas de pico são observa5 das, mostrando uma forte tonalidade, ainda, Fx é a frequência na qual uma das múltiplas formas de pico está colocada.
A figura 11 ilustra uma pluralidade de candidatos de vetor de forma incluídos no livro de códigos de vetor de forma de acordo com a presente modalidade.
Na figura 11, entre os candidatos de vetor de forma, (a) ilustra
uma amostra (isto é, um pulso) que tem um valor de amplitude "+1" ou "-1" e (b) ilustra uma amostra que tem um valor de amplitude "0". Uma pluralidade de candidatos de vetor de forma mostrada na figura 11 inclui uma pluralidade de pulsos colocados em frequências arbitrárias. Consequentemente, 15 pesquisando por candidatos de vetor de forma mostrados na figura 11, é possível codificar mais precisamente um espectro de tonalidade forte mostrado na figura 10. Para ser mais específico, um candidato de vetor de forma é pesquisado e determinado com relação a um sinal de tonalidade forte mostrado na figura 10 de modo que o valor de amplitude que corresponde à fre20 quência na qual um forma de pico está colocada. Por exemplo, o valor de amplitude na posição de Fx mostrada na figura 10 assume "+1" ou "-1" (isto é, a amostra (a) mostrada na figura 11) e o valor de amplitude da frequência outro que a forma de pico assume "0" (isto é, a amostra (b) mostrada na figura 11).
Com uma técnica convencional de executar a codificação de ga
nho temporalmente antes da codificação de vetor de forma, um ganho de sub-banda é quantizado, um espectro é normalizado utilizando o ganho de sub-banda e então o componente fino (isto é, o vetor de forma do espectro é codificado). Quando a distorção de quantização do ganho de sub-banda tor30 na-se significativa fazendo a taxa de bits mais baixa, o efeito de normalização torna-se pequeno e a faixa dinâmica do espectro normalizado não pode ser diminuída muito. Por este meio, a etapa de quantização na seção de codificação de vetor de forma seguinte precisa ser feita bruta e, portanto, a distorção de quantização aumenta. Devido à influência desta distorção de quantização, a forma de pico de um espectro atenua (isto é, perda da verdadeira forma de pico), e o espectro o qual não forma uma forma de pico é 5 amplificado e aparece como a forma de pico (isto é, aparência de uma falsa forma de pico). Deste modo, a posição de frequência da forma de pico muda, causando uma deterioração de qualidade de som em uma porção de vogal de um sinal de voz com um pico forte e um sinal de música.
Em contraste com isto, a presente modalidade emprega uma 10 configuração de determinar um vetor de forma primeiro, então calcular um ganho-alvo e quantizar este ganho-alvo. Quando alguns elementos de vetores incluem um vetor de forma representado por um pulso de +1 ou -1 como na presente modalidade, a determinação do vetor de forma primeiro significa determinar primeiro a posição de frequência na qual este pulso sob. A posi15 ção de frequência na qual um pulso sobe pode ser determinada sem a influência de quantização de ganho, e, consequentemente, o fenômeno onde a verdadeira forma de pico é perdida ou uma falsa forma de pico aparece não ocorre, de modo que é possível impedir o problema acima descrito com a técnica convencional.
Deste modo, a presente modalidade emprega uma configuração
de determinar o vetor de forma primeiro para executar a codificação de vetor de forma utilizando o livro de códigos de vetor de forma formado com o vetor de forma que inclui um pulso, de modo que é possível especificar a frequência do espectro que tem um pico forte e aumentar um pulso nesta frequên25 cia. Por este meio, é possível codificar os sinais que têm os espectros de tonalidade forte tais como as vogais de sinais de voz e os sinais de música em alta qualidade.
(Modalidade 3)
A Modalidade 3 da presente invenção difere da Modalidade 1 na seleção de uma faixa (isto é, região) de tonalidade forte no espectro de sinal de voz e codificar somente a faixa selecionada.
O aparelho de codificação de voz de acordo com a Modalidade 3 da presente invenção emprega a mesma configuração que o aparelho de codificação de voz 100 de acordo com a Modalidade 1 (ver figura 1), e difere do aparelho de codificação de voz 100 somente na inclusão da seção de codificação da segunda camada 305 ao invés da seção de codificação da 5 segunda camada 105. Portanto, A configuração total do aparelho de codificação de voz de acordo com a presente modalidade não é mostrada, e a sua explicação detalhada será omitida.
A figura 12 é um diagrama de blocos que mostra a configuração dentro da seção de codificação da segunda camada 305 de acordo com a 10 presente modalidade. Ainda, a seção de codificação da segunda camada 305 emprega a mesma configuração básica que a seção de codificação da segunda camada 105 descrita na Modalidade 1 (ver figura 1), e aos mesmos componentes serão atribuídos os mesmos números de referência e a sua explicação será omitida.
A seção de codificação da segunda camada 305 difere da seção
de codificação da segunda camada 105 de acordo com a Modalidade 1 em incluir adicionalmente uma seção de seleção de faixa 351. Ainda a seção de codificação de vetor de forma 352 da seção de codificação da segunda camada 305 difere da seção de codificação de vetor de forma 152 da seção de 20 codificação da segunda camada 105 em parte do processamento, e diferentes números de referência serão atribuídos para mostrar esta diferença.
A seção de seleção de faixa 351 forma uma pluralidade de faixas utilizando um número arbitrário de sub-bandas adjacentes de M coeficientes de transformada de sub-banda recebidos da seção de formação de 25 sub-banda 151, e calcula a tonalidade em cada faixa. A seção de seleção de faixa 351 seleciona a faixa da tonalidade mais forte, e emite as informações de faixa que mostram a faixa selecionada, para a seção de multiplexação
155 e a seção de codificação de vetor de forma 352. Ainda, o processamento de seleção de faixa na seção de seleção de faixa 351 será posteriormente explicado em detalhes.
A seção de codificação de vetor de forma 352 difere da seção de codificação de vetor de forma 152 de acordo com a Modalidade 1 somente na seleção dos coeficientes de transformada de sub-banda incluídos em uma faixa de coeficientes de transformada de sub-banda recebidos da seção de formação de sub-banda 151, com base nas informações de faixa recebidas da seção de seleção de faixa 351, e na execução da quantização de 5 vetor de forma com relação aos coeficientes de transformada de sub-banda selecionados, e a sua explicação detalhada será aqui omitida.
A figura 13 ilustra o processamento de seleção de faixa na seção de seleção de faixa 351.
Na figura 13, o eixo geométrico horizontal é a frequência e o eixo geométrico vertical é a energia logarítmica. Ainda, a figura 13 ilustra um caso onde o número total de sub-bandas M é "8", uma faixa 0 é formada utilizando a 0â sub-banda para a terceira sub-banda, a faixa 1 é formada utilizando a segunda sub-banda até a quinta sub-banda e a faixa 2 é formada utilizando a quarta sub-banda até a sétima sub-banda. Como um indicador para avaliar a tonalidade em uma faixa predeterminada, a seção de seleção de faixa 351 calcula a medida de monotonia espectral (SFM) representada utilizando a razão da média geométrica e da média aritmética de uma pluralidade de coeficientes de transformada de sub-banda incluídos em uma faixa predeterminada. A SFM assume um valor entre "0" e "1" e o valor mais próximo de "0" mostra uma tonalidade forte. Consequentemente, a SFM é calculada em cada faixa e a faixa que tem a SFM mais próxima de "0" é selecionada.
O aparelho de decodificação de voz de acordo com a presente modalidade emprega a mesma configuração que o aparelho de decodifica25 ção de voz 200 de acordo com a Modalidade 1 (ver figura 8), e difere do aparelho de decodificação de voz 200 somente incluindo uma seção de decodificação da segunda camada 403 ao invés da seção de decodificação da segunda camada 203. Portanto, a configuração total do aparelho de decodificação de voz não será ilustrada, e a sua explicação detalhada será omitida. 30 A figura 14 é um diagrama de blocos que mostra a configuração
dentro da seção de decodificação da segunda camada 403 de acordo com a presente modalidade. Ainda, a seção de decodificação da segunda camada 403 emprega a mesma configuração básica que a seção de decodificação da segunda camada 203 descrita na Modalidade 1, e aos mesmos componentes serão atribuídos os mesmos números de referência e a sua explicação será omitida.
5 A seção de demultiplexação 431 e a seção de geração de coefi
ciente de transformada de erro da primeira camada 434 da seção de decodificação da segunda camada 403 difere da seção de demultiplexação 231 e da seção de geração de coeficiente de transformada de erro da primeira camada 234 da seção de decodificação da segunda camada 203 em parte do 10 processamento, e números de referência diferentes serão atribuídos para mostrar esta diferença.
A seção de demultiplexação 431 difere da seção de demultiplexação 231 descrita na Modalidade 1 na demultiplexação e emissão de informações de faixa além das informações codificadas de forma e das informa15 ções codificadas de ganho, para a seção de geração de coeficiente de transformada de erro da primeira camada 434, e a sua explicação detalhada será omitida.
A seção de geração de coeficiente de transformada de erro da primeira camada 434 multiplica o candidato de vetor de forma recebido do 20 livro de códigos de vetor de forma 232, pelo candidato de vetor de ganho recebido do livro de códigos de vetor de ganho 233 para gerar os coeficientes de transformada de erro da primeira camada, dispõe estes coeficientes de transformada de erro da primeira camada na sub-banda incluída dentro da faixa mostrada pelas informações de faixa e emite o resultado para o so25 mador 204.
Deste modo, de acordo com a presente modalidade, o aparelho de codificação de voz seleciona a faixa da tonalidade mais forte e codifica o vetor de forma temporalmente antes do ganho de cada sub-banda na faixa selecionada. Por este meio, as formas espectrais de sinais com tonalidade 30 forte tais como as vogais de voz ou os sinais de música são codificadas mais precisamente e a codificação é executada somente dentro da faixa selecionada, de modo que é possível reduzir a taxa de bits de codificação. Ainda, apesar de um caso ter sido explicado com a presente modalidade como um exemplo onde uma SFM é calculada como um indicador para avaliar a tonalidade dentro de cada faixa predeterminada, a presente invenção não está limitada a isto. Por exemplo, aproveitando a alta asso5 ciação entre a energia média dentro da faixa predeterminada e a intensidade de tonalidade, a energia média de coeficientes de transformada incluídos na faixa predeterminada pode ser calculada como o indicador de avaliação de tonalidade. Por este meio, é possível reduzir a complexidade computacional comparada com o caso onde uma SFM é calculada.
Para ser mais específico, a seção de seleção de faixa 351 calcu
la a energia ER(j) dos coeficientes de transformada de erro da primeira camada ei(k) incluídos na faixa j, de acordo com a equação 10 seguinte. [10]
FRH(J)
eAj)= Σ ei(*)2
k=FRLU) Equação 10
Nesta equação, j representa o identificador para especificar a faixa, FRL(j) representa a frequência mais baixa na faixa j e FRH(j) represen15 ta a frequência mais alta na faixa j. A seção de seleção de faixa 351 calcula as energias ErO) das faixas deste modo, então especifica a faixa onde a energia dos coeficientes de transformada de erro da primeira camada é a mais alta, e codifica os coeficientes de transformada de erro da primeira camada incluídos nesta faixa.
Ainda, a energia dos coeficientes de transformada de erro da
primeira camada pode ser calculada de acordo com a equação 11 seguinte executando uma ponderação levando em conta as características de percepção humana. [11]
FRH(J)
Er(J) = Μ#)·^(Α’')2
^FRL(j) Equação 11
Em tal caso, o peso w(k) é aumentado maior para uma frequência de importância mais alta em características perceptivas de modo que a faixa que inclui esta frequência é provável ser selecionada, e o peso w(k) é diminuído para a frequência de menor importância de modo que a faixa que inclui esta frequência não é provável ser selecionada. Por este meio, uma banda perceptivamente importante é provável ser preferencialmente selecionada, de modo que é possível aperfeiçoar a qualidade de som de voz decodificada. Como este peso w(k), os pesos podem ser encontrados e utilizados utilizando as características de intensidade perceptiva humana ou um limite 5 de mascaramento perceptivo calculado com base, por exemplo, em um sinal de entrada ou um sinal decodificado de uma camada mais baixa (isto é, um sinal decodificado da primeira camada).
Ainda, a seção de seleção de faixa 351 pode ser configurada para selecionar uma faixa de faixas dispostas a frequências mais baixas do que uma frequência predeterminada (isto é, a frequência de referência).
A figura 15 ilustra um método para selecionar na seção de seleção de faixa 351 uma faixa de faixas dispostas a frequências mais baixas do que uma frequência predeterminada (isto é, a frequência de referência).
A figura 15 mostra o caso como um exemplo onde oito candida15 tos de faixa de seleção estão dispostos em bandas mais baixas do que a frequência de referência predeterminada Fy. Estas oito faixas são cada uma formadas com uma banda de um comprimento predeterminado partindo uma de F1, F2,..., e F8 como o ponto de base, e a seção de seleção de faixa 351 seleciona uma faixa destes oito candidatos com base no método de seleção 20 acima descrito. Por este meio, as faixas posicionadas a frequências mais baixas do que a frequência predeterminada Fy são selecionadas. Deste modo, as vantagens de executar a codificação enfatizando a banda de baixa frequência (ou a banda de média - baixa frequência) são como segue.
Na estrutura harmônica a qual é uma característica de um sinal 25 de voz (ou é referida como "estrutura de harmonia"), isto é, na estrutura na qual o espectro mostra picos a dados intervalos de frequência, os picos aparecem agudos em uma banda de baixa frequência comparado com uma banda de alta frequência. Picos similares são vistos no erro de quantização (isto é, os coeficientes de espectro de erro ou de transformada de erro) pro30 duzido no processamento de codificação, e os picos aparecem agudos em uma banda de baixa frequência comparado com uma banda de alta frequência. Portanto, quando a energia de um espectro de erro em uma banda de baixa frequência é mais baixa do que em uma banda de alta frequência, os picos de um espectro de erro são agudos e, portanto, o espectro de erro é provável exceder um limite de mascaramento perceptivo (um limite no qual as pessoas podem perceber um som), causando uma deterioração de quali5 dade de som perceptivo. Isto é, mesmo quando a energia do espectro de erro é baixa, a sensibilidade perceptiva em uma banda de baixa frequência é mais alta do que em uma banda de alta frequência. Consequentemente, a seção de seleção de faixa 351 emprega uma configuração de selecionar uma faixa de candidatos dispostos a frequências mais baixas do que uma 10 frequência predeterminada, de modo que é possível especificar a faixa a qual é o alvo a ser codificado, de uma banda de baixa frequência na qual os picos de espectro de erro são agudos e aperfeiçoar a qualidade de som de voz decodificada.
Ainda, como um método para selecionar a faixa a qual é o alvo a ser codificado, a faixa do quadro corrente pode ser selecionada em associação com a faixa selecionada no quadro passado. Por exemplo, existem métodos de (1) determinar a faixa do quadro corrente de faixas posicionadas nas vizinhanças da faixa selecionada no quadro anterior, (2) redispor os candidatos de faixas para o quadro corrente na vizinhança da faixa selecionada no quadro anterior para determinar a faixa do quadro corrente dos candidatos de faixa redispostos, e (3) transmitir as informações de faixa uma vez a cada diversos quadros e utilizar a faixa mostrada pelas informações de faixa transmitida no passado dentro do quadro no qual as informações de faixa não são transmitidas (transmissão descontínua de informações de faixa).
Ainda, a seção de seleção de faixa 351 pode dividir uma banda inteira em uma pluralidade de bandas parciais com antecedência como mostrado na figura 16 para selecionar uma faixa de cada banda parcial e concatena as faixas selecionadas de cada banda parcial para fazer esta faixa con30 catenada o alvo a ser codificado. A figura 16 ilustra um caso onde o número de bandas parciais é dois, e a banda parcial 1 está configurada para cobrir uma banda de baixa frequência e a banda parcial 2 está configurada para cobrir uma banda de alta frequência. Ainda, a banda parcial 1 e a banda parcial 2 são cada uma formadas com uma pluralidade de faixas. A seção de seleção de faixa 351 seleciona uma faixa de cada uma da banda parcial 1 e da banda parcial 2. Por exemplo, como mostrado na figura 16, a faixa 2 está 5 selecionada na banda parcial 1 e a faixa 4 está selecionada na banda parcial
2. Daqui em diante, as informações que mostram a faixa selecionada da banda parcial 1 são referidas como "informações de faixa de primeira banda parcial", e as informações que mostram a faixa selecionada da banda parcial 2 são referidas como "informações de faixa de segunda banda parcial". A 10 seguir, a seção de seleção de faixa 351 concatena a faixa selecionada da banda parcial 1 e a faixa selecionada da banda parcial 2 para formar uma faixa concatenada. Esta faixa concatenada torna-se a faixa selecionada na seção de seleção de faixa 351, e a seção de codificação de vetor de fora 352 executa uma codificação de vetor de forma com relação a esta faixa 15 concatenada.
A figura 17 é um diagrama de blocos que mostra a configuração da seção de seleção de faixa 351 que suporta o caso onde o número de bandas parciais é N. Na figura 17, os coeficientes de transformada de subbanda recebidos da seção de formação de sub-banda 151 são fornecidos 20 para a seção de seleção de banda parcial 1 511-1 até a seção de seleção de banda parcial N 511-N. Cada seção de seleção de banda parcial n 511-n (onde n = 1 a N) seleciona uma faixa de cada banda parcial n, e emite as informações que mostram a faixa selecionada, isto é, as informações de faixa de enésima banda parcial, para a seção de formação de informações de 25 faixa 512. A seção de formação de informações de faixa 512 adquire a faixa concatenada pela concatenação das faixas mostradas por cada informação de faixa de nâ banda parcial (onde n = 1 a N) recebida da seção de seleção de banda parcial 1 511-1 até a seção de seleção de banda parcial N 511-N. Então, a seção de formação de informações de faixa 512 emite as informa30 ções que mostram a faixa concatenada como as informações de faixa, para a seção de codificação de vetor de forma 352 e a seção de multiplexação 155. A figura 18 ilustra como as informações de faixa são formadas na seção de formação de informações de faixa 512. Como mostrado na figura 18, a seção de formação de informações de faixa 512 forma as informações de faixa dispondo as informações de faixa de primeira banda parcial 5 (isto é, bit A1) até as informações de faixa de Nâ banda parcial (isto é, bit AN) em ordem. Aqui, o comprimento de bit An de cada informação de faixa de nâ banda parcial é determinado com base no número de faixas candidatas incluídas em cada banda parcial n e pode assumir um valor diferente.
A figura 19 ilustra a operação da seção de geração de coeficiente de transformada de erro da primeira camada 434 (ver figura 14) que suporta a seção de seleção de faixa 351 mostrada na figura 17. Aqui, um caso será explicado como um exemplo onde o número de bandas parciais é dois. A seção de geração de coeficiente de transformada de erro da primeira camada 434 multiplexa o candidato de vetor de forma recebido do livro de códigos de vetor de forma 232 como o candidato de vetor de ganho recebido do livro de códigos de vetor de ganho 233 então, a seção de geração de coeficiente de transformada de erro da primeira camada 434 dispões o candidato de vetor de forma acima após a multiplicação de ganho, em cada faixa mostrada por cada informação de faixa de banda parcial 1 e banda parcial 2. O sinal encontrado deste modo é emitido como os coeficientes de transformada de erro da primeira camada.
O método de seleção mostrado na figura 16 determina uma faixa de cada banda parcial e pode dispor pelo menos um espectro decodificado dentro de cada banda parcial. Consequentemente, determinando com ante25 cedência uma pluralidade bandas para as quais a qualidade de som precisa ser aperfeiçoada, é possível aperfeiçoar a qualidade de voz decodificada comparado com o método de seleção de faixa de selecionar somente uma faixa da banda total. Por exemplo, o método de seleção de faixa mostrado na figura 16 é efetivo quando, por exemplo, o aperfeiçoamento de qualidade 30 tanto na banda de baixa frequência quanto na banda de alta frequência precisa ser executado ao mesmo tempo.
Ainda, como uma variação do método de seleção de faixa mostrado na figura 16, uma faixa fixa pode ser selecionada o tempo todo em uma banda parcial específica como ilustrado na figura 20. Com o exemplo mostrado na figura 20, a faixa 4 é selecionada o tempo todo dentro da banda parcial 2 e forma parte da faixa concatenada. Similar ao efeito do método de 5 seleção de faixa mostrado na figura 16, o método de seleção de faixa mostrado na figura 20 pode determinar com antecedência uma banda para qual a qualidade de som precisa ser aperfeiçoada e, por exemplo, as informações de faixa de banda parcial da banda parcial 2 não são requeridas, de modo que é possível reduzir o número de bits para representar as informações de 10 faixa.
Ainda, apesar da figura 20 mostrar um caso como um exemplo onde uma faixa fixa é selecionada o tempo todo em uma banda de alta frequência (banda parcial 2), a presente invenção não está limitada a isto, e a faixa fixa pode ser selecionada o tempo todo em uma banda de baixa fre15 quência (isto é, a banda parcial 1) e, ainda, uma faixa fixa pode ser selecionada o tempo todo na banda parcial da banda de frequência média que não está mostrada na figura 20.
Ainda, como variações dos métodos de seleção de faixa mostrados na figura 16 e na figura 20, as larguras de banda de faixas candidatas incluídas em cada banda parcial podem ser diferentes. A figura 21 ilustra um caso onde a largura de banda da faixa candidata incluída na banda parcial 2 é mais curta do que as faixas candidatas incluídas na banda parcial 1.
(Modalidade 4)
A Modalidade 4 da presente invenção decide o grau de tonalidade em uma base por quadro, e determina a ordem de codificação de vetor de forma e codificação de ganho dependendo do resultado da decisão.
O aparelho de codificação de voz de acordo com a Modalidade 4 da presente invenção emprega a mesma configuração que o aparelho de codificação de voz 100 de acordo com a Modalidade 1 (ver figura 1), e difere 30 do aparelho de codificação de voz 100 somente na inclusão da seção de codificação da segunda camada 505 ao invés da seção de codificação da segunda camada 105. Portanto, A configuração total do aparelho de codificação de voz de acordo com a presente invenção não é mostrada, e a sua explicação detalhada será omitida.
A figura 22 é um diagrama de blocos que mostra a configuração dentro da seção de codificação da segunda camada 505. Ainda, a seção de 5 codificação da segunda camada 505 emprega a mesma configuração básica que a seção de codificação da segunda camada 105 mostrada na figura 1, e aos mesmos componentes serão atribuídos os mesmos números de referência e a sua explicação será omitida.
A seção de codificação da segunda camada 505 difere da seção 10 de codificação da segunda camada 105 de acordo com a Modalidade 1 em incluir adicionalmente uma seção de decisão de tonalidade 551, uma seção de comutação 552, uma seção de codificação de ganho 553, uma seção de normalização 554, uma seção de codificação de vetor de forma 555 e uma seção de comutação 556. Ainda, na figura 22, a seção de codificação de 15 vetor de forma 152, a seção de formação de vetor de ganho 153, e a seção de codificação de vetor de ganho 154 constituem a seqüência de codificação (a) e a seção de codificação de ganho 553, a seção de normalização 554 e a seção de codificação de vetor de forma 555 constituem a seqüência de codificação (b).
A seção de decisão de tonalidade 551 calcula uma SFM como
um indicador para avaliar a tonalidade dos coeficientes de transformada de erro da primeira camada recebidos do subtrator 104, e emite "alta" como as informações de decisão de tonalidade para a seção de comutação 552 e a seção de comutação 556 quando a SFM calculada é menor do que o limite 25 predeterminado e emite "baixa" como as informações de decisão de tonalidade para a seção de comutação 552 e a seção de comutação 556 quando a SFM calculada é igual a ou maior do que o limite predeterminado.
Embora, apesar da presente modalidade ser explicada utilizando a SFM como um indicador para avaliar a tonalidade, a presente invenção não está limitada a isto, e a decisão pode ser tomada utilizando outro indicador tal como a variância dos coeficientes de transformada de erro da primeira camada. Mais ainda, a decisão pode ser executada utilizando outro sinal tal como um sinal de entrada para decidir a tonalidade. Por exemplo, uma análise de altura resulta de um sinal de entrada ou um resultado de codificação do sinal de entrada em uma camada mais baixa (isto é, a seção de codificação da primeira camada com a presente modalidade) pode ser utilizado.
5 A seção de comutação 552 emite seqüencialmente M coeficien
tes de transformada de sub-banda recebidos da seção de formação de subbanda 151, para a seção de codificação de vetor de forma 152 quando as informações de decisão de tonalidade recebidas da seção de decisão de tonalidade 551 mostra "alta", e emite seqüencialmente M coeficientes de 10 transformada de sub-banda recebidos da seção de formação de sub-banda 151, para a seção de codificação de vetor de ganho 553 e a seção de normalização 554 quando as informações de decisão de tonalidade recebidas da seção de decisão de tonalidade 551 mostra "baixa".
A seção de codificação de vetor de ganho 553 calcula a energia 15 média de M coeficientes de transformada de sub-banda recebidos da seção de comutação 552, quantiza a energia média calculada e emite o índice quantizado como as informações codificadas de ganho, para a seção de comutação 556. Ainda, a seção de codificação de vetor de ganho 553 executa um processamento de decodificação de ganho utilizando as informações 20 codificadas de ganho, e emite o ganho decodificado resultante para a seção de normalização 554.
A seção de normalização 554 normaliza os M coeficientes de transformada de sub-banda recebidos da seção de comutação 552 utilizando o ganho decodificado recebido da seção de codificação de ganho 553, e emite o vetor de forma normalizado resultante para a seção de codificação de vetor de forma 555.
A seção de codificação de vetor de forma 555 executa um processamento de codificação com relação ao vetor de forma normalizado recebido da seção de normalização 554, e emite as informações codificadas de forma resultantes para a seção de comutação 556.
A seção de comutação 556 emite as informações codificadas de forma e as informações codificadas de ganho recebidas da seção de codificação de vetor de forma 152 e da seção de codificação de vetor de ganho 154, respectivamente, quando as informações de decisão de tonalidade recebidas da seção de decisão de tonalidade 551 mostram "alta", e emite as informações codificadas de forma e as informações codificadas de ganho 5 recebidas da seção de codificação de ganho 553 e da seção de codificação de vetor de forma 555, respectivamente, quando as informações de decisão de tonalidade recebidas da seção de decisão de tonalidade 551 mostram "baixa".
Como acima o aparelho de codificação de voz de acordo com a 10 presente modalidade executa a codificação de vetor de forma temporalmente antes da codificação de ganho utilizando a seqüência (a) no caso onde a tonalidade dos coeficientes de transformada de erro da primeira camada é "alta", e executa a codificação de ganho temporalmente antes da codificação de vetor de forma utilizando a seqüência (b) no caso onde a tonalidade dos 15 coeficientes de transformada de erro da primeira camada é "baixa".
Deste modo, a presente modalidade muda adaptavelmente a ordem de codificação de ganho e de codificação de vetor de forma de acordo com a tonalidade dos coeficientes de transformada de erro da primeira camada e, consequentemente, pode suprimir tanto a distorção de codifica20 ção de ganho quanto a distorção de codificação de vetor de forma de acordo com um sinal de entrada o qual é o alvo a ser codificado, de modo que é possível aperfeiçoar adicionalmente a qualidade de som de voz decodificada.
(Modalidade 5)
A figura 23 é um diagrama de blocos que mostra a configuração
principal do aparelho de codificação de voz 600 de acordo com a Modalidade 5 da presente invenção.
Na figura 23, o aparelho de codificação de voz 600 tem uma seção de codificação da primeira camada 601, uma seção de decodificação da primeira camada 602, uma seção de retardo 603, um subtrator 604, uma seção de transformação de domínio de frequência 605, uma seção de codificação da segunda camada 606 e uma seção de multiplexação 106. Entre estes componentes, a seção de multiplexação 106 é a mesma que a seção de multiplexação 106 mostrada na figura 1, e, portanto, a sua explicação detalhada será omitida. Ainda, a seção de codificação da segunda camada 606 difere da seção de codificação da segunda camada 305 mostrada na 5 figura 12 em parte do processamento, e números de referência diferentes serão atribuídos para mostrar esta diferença.
A seção de codificação da primeira camada 601 codifica um sinal de entrada, e emite os dados codificados da primeira camada gerados para a seção de decodificação da primeira camada 602 e a seção de multiplexação 106. A seção de codificação da primeira camada 601 será posteriormente descrita em detalhes.
A seção de decodificação da primeira camada 602 executa um processamento de decodificação utilizando os dados codificados da primeira camada recebidos da seção de codificação da primeira camada 601, e emite 15 o sinal decodificado da primeira camada gerado para o subtrator 604. A seção de decodificação da primeira camada 602 será posteriormente descrita em detalhes.
A seção de retardo 603 aplica um retardo predeterminado no sinal de entrada e emite o sinal de entrada para o subtrator 604. A duração de retardo é igual à duração de retardo produzida nos processamentos na seção de codificação da primeira camada 601 e na seção de decodificação da primeira camada 602.
O subtrator 604 calcula a diferença entre o sinal de entrada retardado recebido da seção de retardo 603 e o sinal decodificado da primeira camada recebido da seção de decodificação da primeira camada 602, e emite o sinal de erro resultante para a seção de transformação de domínio de frequência 605.
A seção de transformação de domínio de frequência 605 transforma o sinal de erro recebido do subtrator 604, em um sinal de domínio de frequência, e emite os coeficientes de transformada de erro resultantes para a seção de codificação da segunda camada 606.
A figura 24 é um diagrama de blocos que mostra a configuração principal dentro da seção de codificação da primeira camada 601.
Na figura 24, a seção de codificação da primeira camada 601 tem uma seção de redução de resolução 611 e uma seção de codificação de núcleo 612.
A seção de redução de resolução 611 reduz a resolução do sinal
de entrada de domínio de tempo para converter a taxa de amostragem do sinal de domínio de tempo para uma taxa de amostragem desejada, e emite o sinal de domínio de tempo de resolução reduzida para a seção de codificação de núcleo 612.
A seção de codificação de núcleo 612 executa um processamen
to de codificação com relação ao sinal de entrada convertido na taxa de amostragem desejada, e emite os dados codificados da primeira camada gerados para a seção de decodificação da primeira camada 602 e seção de multiplexação 106.
A figura 25 é um diagrama de blocos que mostra a configuração
principal dentro da seção de decodificação da primeira camada 602.
Na figura 25, a seção de decodificação da primeira camada 602 tem uma seção de decodificação de núcleo 621, uma seção de aumento de resolução 622 e uma seção de adição de componente de banda de alta fre20 quência 623, e substitui um sinal aproximado para uma banda de alta frequência. Isto está baseado em uma técnica de realizar um aperfeiçoamento em qualidade de som de voz decodificada inteiramente representando uma banda de alta frequência de baixa importância perceptiva com um sinal aproximado e ao contrário aumentando o número de bits a serem alocados 25 em uma banda de baixa frequência (ou uma banda de média - baixa frequência) perceptivamente importante para aperfeiçoar a fidelidade desta banda com relação ao sinal original.
A seção de decodificação de núcleo 621 executa um processamento de decodificação utilizando os dados codificados da primeira camada recebidos da seção de codificação da primeira camada 601, e emite o sinal decodificado de núcleo resultante para a seção de aumento de resolução 622. Ainda, a seção de decodificação de núcleo 621 emite os coeficientes de LPC decodificados encontrados no processamento de decodificação, para a seção de adição de componente de banda de alta frequência 623.
A seção de aumento de resolução 622 aumenta a resolução do sinal decodificado recebido da seção de decodificação de núcleo 621 para 5 converter a taxa de amostragem do sinal decodificado para a mesma taxa de amostragem que o sinal de entrada, e emite o sinal decodificado de núcleo de resolução aumentada para a seção de adição de componente de banda de alta frequência 623.
Utilizando um sinal aproximado, a seção de adição de componente de banda de alta frequência 623 compensa um componente de banda de alta frequência o qual ficou faltando devido ao processamento de redução de resolução na seção de redução de resolução 611. Como um método para gerar um sinal aproximado, um método para formar um filtro de síntese com os coeficientes de LPC decodificados encontrados no processamento de decodificação na seção de decodificação de núcleo 621 e seqüencialmente filtrando um sinal de ruído do qual a energia é ajustada, por meio do filtro de síntese e do filtro de passagem de banda, é conhecido. O componente de banda de alta frequência adquirido neste método contribui para o melhoramento da sensação perceptiva de uma banda mas tem uma forma de onda completamente diferente do componente de banda de alta frequência do sinal original, e, portanto, a energia na banda de alta frequência do sinal de erro adquirido no subtrator aumenta.
Quando o processamento de codificação da primeira camada inclui tais características, a energia em uma banda de alta frequência do si25 nal de erro aumenta, de modo que uma banda de baixa frequência que essencialmente tem uma alta sensibilidade perceptiva não é provável ser selecionada. Consequentemente, a seção de codificação da segunda camada 606 de acordo com a presente modalidade seleciona uma faixa de candidatos dispostos em frequências mais baixas do que uma frequência predeter30 minada (isto é, uma frequência de referência), de modo que é possível impedir o problema acima descrito causado por um aumento em energia do sinal de erro em uma banda de alta frequência. Isto é, a seção de codificação da segunda camada 606 executa o processamento de seleção mostrado na figura 15.
A figura 26 é um diagrama de blocos que mostra a configuração principal do aparelho de decodificação de voz 700 de acordo com a Modali5 dade 5 da presente invenção. Entrementes, o aparelho de decodificação de voz 700 tem a mesma configuração básica que o aparelho de decodificação de voz 200 mostrado na figura 8, e aos mesmos componentes serão atribuídos os mesmos números de referência e a sua explicação será omitida.
A seção de decodificação da primeira camada 702 do aparelho 10 de decodificação de voz 700 difere da seção de decodificação da primeira camada 202 do aparelho de decodificação de voz 200 em parte do processamento, e, portanto, diferentes números de referência serão atribuídos. Ainda, a configuração e a operação da seção de decodificação da primeira camada 702 são as mesmas que na seção de decodificação da primeira 15 camada 602 do aparelho de codificação de voz 600, e, portanto, a sua explicação detalhada será omitida.
A seção de transformação de domínio de tempo 706 do aparelho de decodificação de voz 700 difere da seção de transformação de domínio de tempo 206 do aparelho de decodificação de voz 200 somente nas posi20 ções de disposição, mas executa o mesmo processamento, e, portanto, diferentes números de referência serão atribuídos e a sua explicação detalhada será omitida.
Deste modo, a presente modalidade substitui um sinal aproximado tal como o ruído para uma banda de alta frequência no processamento 25 de codificação na primeira camada, ao invés de aumentar o número de bits a serem alocados em uma banda de baixa frequência (ou uma banda de média - baixa frequência) perceptivamente importante para aperfeiçoar a fidelidade com relação ao sinal original desta banda, ainda impedindo um problema devido a um aumento na energia do sinal de erro em uma banda de 30 alta frequência que utiliza a faixa mais baixa do que uma frequência predeterminada como o alvo a ser codificado no processamento de codificação da segunda camada e executando a codificação de vetor de forma temporalmente antes da codificação de ganho, de modo que é possível codificar mais precisamente as formas espectrais de sinais de tonalidade forte tais como as vogais, reduzir adicionalmente a distorção de codificação de vetor de ganho sem aumentar a taxa de bits e, consequentemente, aperfeiçoar adicional5 mente a qualidade de som de voz decodificada.
Ainda, apesar de um caso ter sido explicado como um exemplo onde o subtrator 604 encontra a diferença entre os sinais de domínio de tempo, a presente invenção não está limitada a isto e o subtrator 604 pode encontrar a diferença entre os coeficientes de transformada de domínio de 10 frequência. Em tal caso, os coeficientes de transformada de entrada são encontrados dispondo a seção de transformação de domínio de frequência 605 entre a seção de retardo 603 e o subtrator 604, e os coeficientes de transformada decodificados da primeira camada são encontrados dispondo outra seção de transformação de domínio de frequência entre a seção de decodifi15 cação da primeira camada 602 e o subtrator 604. Então, o subtrator 604 encontra a diferença entre os coeficientes de transformada de entrada e os coeficientes de transformada decodificados da primeira camada, e fornece estes coeficientes de transformada de erro diretamente para a seção de codificação da segunda camada. Esta configuração permite um processamento 20 de subtração adaptável de encontrar a diferença em uma dada banda e não encontrar a diferença em outras bandas, de modo que é possível aperfeiçoar adicionalmente a qualidade de som de voz decodificada.
Ainda, apesar de uma configuração ter sido explicada com a presente modalidade como um exemplo onde as informações relativas a 25 uma banda de alta frequência não são transmitidas para o aparelho de decodificação de voz, a presente invenção não está limitada a isto, e uma configuração pode ser possível onde um sinal de uma banda de alta frequência é codificado a uma baixa taxa de bits comparado com uma banda de baixa frequência e é transmitido para um aparelho de decodificação de voz.
(Modalidade 6)
A figura 27 é um diagrama de blocos que mostra a configuração principal do aparelho de codificação de voz 800 de acordo com a Modalidade 6 da presente invenção. Ainda, o aparelho de codificação de voz 800 emprega a mesma configuração básica que o aparelho de codificação de voz 600 mostrado na figura 23, e aos mesmos componentes serão atribuídos os mesmos números de referência e a sua explicação será omitida.
O aparelho de codificação de voz 800 difere do aparelho de co
dificação de voz 600 por ainda incluir um filtro de ponderação 801.
O filtro de ponderação 801 executa um ponderação perceptiva filtrando um sinal de erro, e emite o sinal de erro após a ponderação, para a seção de transformação de domínio de frequência 605. O filtro de pondera10 ção 801 atenua (torna branco) o espectro de um sinal de entrada ou muda-o para as características espectrais para o espectro atenuado. Por exemplo, a função de transferência de filtro de ponderação w(z) é representada pela equação 12 seguinte utilizando os coeficientes de LPC decodificados adquiridos na seção de decodificação da primeira camada 602. [12]
TO=I-XaO)./.:"
Í=1 Equação 12
Na equação 12, a(i) são os coeficientes de LPC, NP é a ordem
dos coeficientes de LPC, e γ é um parâmetro para controlar o grau de atenuação (tornar branco) do espectro e assume valores na faixa de 0<γ<1. Quando γ é maior, o grau de atenuação torna-se maior, e 0,92, por exemplo, é utilizado para γ.
A figura 28 é um diagrama de blocos que mostra a configuração
principal do aparelho de decodificação de voz 900 de acordo com a Modalidade 6 da presente invenção. Ainda, o aparelho de decodificação de voz 900 tem a mesma configuração básica que o aparelho de decodificação de voz 700 mostrado na figura 26, e aos mesmos componentes serão atribuídos os mesmos números de referência e a sua explicação será omitida.
O aparelho de decodificação de voz 900 difere do aparelho de decodificação de voz 700 por ainda incluir um filtro de síntese 901.
O filtro de síntese 901 está formado com um filtro que tem características espectrais opostas ao filtro de ponderação 801 do aparelho de codificação de voz 800, e executa um processamento de filtragem com relação a um sinal recebido da seção de transformação de domínio de tempo 706 e emite o resultado. A função de transferência B(z) do filtro de síntese 901 é representada utilizando a equação 13 seguinte. [13]
5 dos coeficientes de LPC1 e γ é um parâmetro para controlar o grau de atenuação (tornar branco) do espectro e assume valores na faixa de 0<γ<1. Quando γ é maior, o grau de atenuação torna-se maior, e 0,92, por exemplo, é utilizado para γ.
codificação de voz 800 está formado com um filtro que tem uma característica espectral oposta ao envelope espectral de um sinal de entrada, e o filtro de síntese 901 do aparelho de decodificação de voz 900 está formado com um filtro que tem características opostas ao filtro de ponderação. Consequentemente, o filtro de síntese tem as características similares ao envelope 15 espectral do sinal de entrada. Geralmente, uma maior energia aparece em uma banda de baixa frequência do que em uma banda de alta frequência e no envelope espectral de um sinal de voz, de modo que mesmo quando a banda de baixa frequência e a banda de alta frequência têm uma distorção de codificação igual de um sinal antes que este sinal passe pelo filtro de sín20 tese, a distorção de codificação torna-se maior na banda de baixa frequência após este sinal passar pelo filtro de síntese. Embora, idealmente, o filtro de ponderação 801 do aparelho de codificação de voz 800 e o filtro de síntese 901 do aparelho de decodificação de voz 900 sejam introduzidos de modo que a distorção de codificação não seja ouvida graças ao efeito de masca25 ramento perceptivo, quando a distorção de codificação não puder ser reduzida devido à baixa taxa de bits, o efeito de mascaramento perceptivo não funciona muito e a distorção de codificação é provável ser percebida. Em tal caso, o filtro de síntese 901 do aparelho de decodificação de voz 900 au
NP
Equação 13
Na equação 13, a(i) são os coeficientes de LPC, NP é a ordem
Como acima descrito, o filtro de ponderação 801 do aparelho de menta a energia em uma banda de baixa frequência que inclui a distorção de codificação e, portanto, uma deterioração de qualidade e provável aparecer distintamente. Com a presente modalidade, como descrito na Modalidade 5, a seção de codificação da segunda camada 606 seleciona uma faixa, a qual 5 é o alvo a ser codificado, de candidatos dispostos em frequências mais baixas do que uma frequência predeterminada (isto é, a frequência de referência), de modo que é possível aliviar o problema acima descrito de enfatizar a distorção de codificação em uma banda de baixa frequência e aperfeiçoar a qualidade de som de voz decodificada.
Deste modo, a presente modalidade provê um filtro de pondera
ção no aparelho de codificação de voz, realiza um aperfeiçoamento de qualidade provendo o filtro de síntese no aparelho de decodificação de voz e utilizando um efeito de mascaramento perceptivo e utiliza uma faixa mais baixa do que uma frequência predeterminada como o alvo a ser codificado 15 no processamento de codificação da segunda camada para aliviar um problema de aumentar a energia em uma banda de baixa frequência incluindo a distorção de codificação e executar uma codificação de vetor de forma temporalmente antes da codificação de ganho, de modo que é possível codificar mais precisamente as formas espectrais de sinais de tonalidade forte tais 20 como as vogais, reduzir a distorção de codificação de vetor de ganho e, consequentemente, aperfeiçoar adicionalmente a qualidade de som de voz codificada.
(Modalidade 7)
A seleção da faixa a qual é o alvo a ser codificado em cada ca25 mada de melhoramento será explicada com a Modalidade 7 da presente invenção no caso onde o aparelho de codificação de voz e o aparelho de decodificação de voz estão configurados para incluir três ou mais camadas formadas com uma camada de base e uma pluralidade de camadas de melhoramento.
A figura 29 é um diagrama de blocos que mostra a configuração
principal do aparelho de codificação de voz 1000 de acordo com a Modalidade 7 da presente invenção. O aparelho de codificação de voz 1000 tem uma seção de transformação de domínio de frequência 101, uma seção de codificação da primeira camada 102, uma seção de decodificação da primeira camada 602, um subtrator 604, uma seção de codificação da segunda camada 606, uma 5 seção de decodificação da segunda camada 1001, um somador 1002, um subtrator 1003, uma seção de codificação de terceira camada 1004, uma seção de decodificação de terceira camada 1005, um somador 1006, um subtrator 1007, uma seção de codificação de quarta camada 1008 e uma seção de multiplexação 1009, e está formado com quatro camadas. Entre 10 estes componentes, as configurações e as operações da seção de transformação de domínio de frequência 101 e da seção de codificação da primeira camada 102 estão mostradas na figura 1, as configurações e as operações da seção de decodificação da primeira camada 602, do subtrator 604 e da seção de codificação da segunda camada 606 são como mostrado na figura 15 23, e as configurações e as operações dos blocos que têm os números 1001 a 1009 são similares às configurações e às operações dos blocos 101, 102, 602, 604 e 606 podem ser estimados e, portanto, a explicação detalhada será aqui omitida.
A figura 30 ilustra o processamento de selecionar a faixa a qual 20 é o alvo a ser codificado no processamento de codificação no aparelho de codificação de voz 1000. A figura 30A até a figura 30C ilustram o processamento de selecionar as faixas na codificação da segunda camada na seção de codificação da segunda camada 606, na codificação de terceira camada na seção de codificação de terceira camada 1004 e na codificação de quarta 25 camada na seção de codificação de quarta camada 1008.
Como mostrado na figura 30A, os candidatos de faixa de seleção estão dispostos em bandas mais baixas do que a frequência de referência da segunda camada Fy(L2) na codificação da segunda camada, os candidatos de faixa de seleção estão dispostos em bandas mais baixas do que 30 a frequência de referência de terceira camada Fy(L3) na codificação de terceira camada e os candidatos de faixa de seleção estão dispostos em bandas mais baixas do que a frequência de referência de quarta camada Fy(L4) na codificação de quarta camada. Ainda, a relação de Fy(L2)<Fy(L3)<Fy(L4) é verdadeira entre as frequências de referência das camadas de melhoramento. O número de candidatos de faixa de seleção em cada camada de melhoramento é o mesmo, e um caso onde o número de candidatos de faixa 5 é quatro será descrito como um exemplo. Isto é, em uma camada mais baixa de uma taxa de bits mais baixa (por exemplo, a segunda camada), a faixa a qual é o alvo a ser codificado é selecionada de bandas de baixa frequência de sensibilidades perceptivamente mais altas, e, em uma camada mais alta ou uma taxa de bits mais alta ( por exemplo, a quarta camada), a faixa a 10 qual é o alvo a ser codificado é selecionada de bandas mais largas que incluem até uma banda de alta frequência. Pelo emprego de tal configuração, uma camada mais baixa enfatiza uma banda de baixa frequência e uma camada mais alta cobre uma banda mais larga, de modo que é possível realizar o som de qualidade de sinais de voz.
A figura 31 é um diagrama de blocos que mostra a configuração
principal do aparelho de decodificação de voz 1110 de acordo com a Modalidade 7 da presente modalidade.
Na figura 31, o aparelho de decodificação de voz 1110 tem uma seção de demultiplexação 1101, uma seção de decodificação da primeira 20 camada 1102, uma seção de decodificação da segunda camada 1103, uma seção de soma 1104, uma seção de decodificação de terceira camada 1105, uma seção de soma 1106, uma seção de decodificação de quarta camada 1107, uma seção de soma 1108, uma seção de comutação 1109, uma seção de transformação de domínio de tempo 1110, e um pós-filtro 1111, e está 25 formado com quatro camadas. Entrementes1 as configurações e as operações destes blocos são similares às configurações e às operações de blocos no aparelho de decodificação de voz 200 mostrado na figura 8 e podem ser estimadas, e, portanto, a sua explicação detalhada será omitida.
Deste modo, de acordo com a presente modalidade, o aparelho de codificação de voz escalável seleciona a faixa a qual é o alvo a ser codificado, de bandas de baixa frequência de sensibilidades perceptivas mais altas em uma camada mais baixa de uma taxa de bits mais baixa e seleciona a faixa a qual é o alvo a ser codificado, de bandas mais largas que incluem até uma banda de alta frequência em uma camada mais alta de uma taxa de bits mais alta, para enfatizar a banda de baixa frequência na camada mais baixa e cobrir as bandas mais largas na camada mais alta e executar uma 5 codificação de vetor de forma temporalmente antes da codificação de ganho, de modo que é possível codificar mais precisamente as formas espectrais de sinais de tonalidade forte tais como as vogais, reduzir adicionalmente a distorção de codificação de vetor de ganho sem aumentar a taxa de bits e adicionalmente aperfeiçoar a qualidade de som de voz decodificada.
Ainda, apesar de um caso ter sido explicado com a presente
modalidade como um exemplo onde o alvo a ser codificado é selecionado de candidatos de seleção de faixa mostrados na figura 30 no processamento de codificação em cada camada de melhoramento, a presente invenção não está limitada a isto, e o alvo a ser codificado pode ser selecionado dos can15 didatos de faixa dispostos a intervalos iguais como mostrado na figura 32 e na figura 33.
A figura 32A, a figura 32B e a figura 33 ilustram um processamento de seleção de faixa na codificação da segunda camada, na codificação de terceira camada e na codificação de quarta camada. Como mostrado 20 na figura 32 e na figura 33 o número de candidatos de faixa de seleção varia entre as camadas de melhoramento, e um caso será aqui ilustrado onde os números de candidatos de faixa de seleção são quatro, seis e oito. Em tal configuração, a faixa a qual é o alvo a ser codificado é determinada de bandas de baixa frequência, em uma camada mais baixa, e o número de candi25 datos de faixa de seleção é menor comparado com uma camada mais alta, de modo que é possível reduzir a complexidade computacional e a taxa de bits.
Ainda, como um método para selecionar a faixa a qual é o alvo a ser codificado por cada camada de melhoramento, a faixa da camada corrente pode ser selecionada em associação com a faixa selecionada na camada mais baixa. Por exemplo, existem métodos de (1) determinar a faixa da camada corrente das faixas posicionadas na vizinhança da faixa selecionada na camada mais baixa, (2) redispor os candidatos de faixa para a camada corrente na vizinhança da faixa selecionada na camada mais baixa para determinar a faixa da camada corrente dos candidatos de faixa redispostos e (3) transmitir as informações de faixa uma vez a cada diversos 5 quadros e utilizar a faixa mostrada pelas informações de faixa transmitidas no passado, dentro do quadro no qual as informações de faixa não são transmitidas (transmissão descontínua de informações de faixa).
As modalidades da presente invenção foram explicadas.
Ainda, apesar de uma configuração escalável de duas camadas 10 ter sido explicada como um exemplo da configuração do aparelho de codificação de voz e do aparelho de decodificação de voz, a presente invenção não está limitada a isto, e a configuração escalável de três ou mais camadas pode ser possível. Mais ainda, a presente invenção é também aplicável a um aparelho de codificação de voz que não emprega uma configuração escalá15 vel.
Mais ainda, as modalidades acima descritas podem utilizar o método CELP como o método de codificação da primeira camada.
A seção de transformação de domínio de frequência nas modalidades acima está implementada por FFT, DFT (Transformada de Fourier Discreta), DCT (Transformada de Co-seno Discreta), MDTC (Transformada de Co-seno Discreta Modificada), um filtro de sub-banda e assim por diante.
Apesar das modalidades acima descritas assumirem o sinal de voz como sinais decodificados, a presente invenção não está limitada a isto e, por exemplo, os sinais decodificados podem ser possíveis como sinais de áudio.
Também, apesar de casos terem sido descritos com a modalidade acima como exemplos onde a presente invenção está configurada por hardware, a presente invenção pode também ser realizada por software.
Cada bloco de função empregado na descrição de cada uma das modalidades acima mencionadas pode tipicamente ser implementando com um LSI constituído por um circuito integrado. Estes podem ser chips individuais ou parcialmente ou totalmente contidos em um único chip. "LSI" é aqui adotado mas isto pode também ser referido como "IC", "LSI de sistema", "super LSI", ou "ultra-LSI" dependendo de diferentes extensões de integração.
Ainda, o método de integração de circuito não está limitado a 5 LSIs, e a implementação utilizando um circuito dedicado ou processadores de uso geral é também possível. Após a fabricação do LSI, a utilização de um FPGA (Rede de Portas Programável no Campo) programável ou um processador reconfigurável onde as conexões e os ajustes de células de circuito dentro de um LSI podem ser reconfigurados é também possível.
Ainda, se uma tecnologia de circuito integrado vier a substituir os
LSIs como um resultado do avanço da tecnologia de semicondutor ou uma outra tecnologia derivada, é naturalmente também possível executar a integração de bloco de função utilizando esta tecnologia. A aplicação de biotecnologia é também possível.
As descrições do Pedido de Patente Japonesa Número 2007-
053502, depositado em 02 de Março de 2007, do Pedido de Patente Japonesa Número 2007-133545, depositado em 18 de Maio de 2007, do Pedido de Patente Japonesa Número 2007-185077, depositado em 13 de Julho de 2007, e do Pedido de Patente Japonesa Número 2008-045259, depositado 20 em 26 de Fevereiro de 2008, incluindo as especificações, os desenhos e os resumos são aqui incorporadas por referência em sua totalidade. APLICABILIDADE INDUSTRIAL
O aparelho de codificação de voz e o método de codificação de voz de acordo com a presente invenção são aplicáveis a um aparelho de terminal de comunicação sem fio, um aparelho de estação de base e assim por diante em um sistema de comunicação móvel.

Claims (14)

1. Aparelho de codificação, que compreende: uma seção de codificação de camada de base que codifica um sinal de entrada para adquirir os dados codificados de camada de base; uma seção de decodificação de camada de base que decodifica os dados codificados de camada de base para adquirir um sinal decodificado de camada de base; e uma seção de codificação de camada de melhoramento que codifica um sinal residual que representa uma diferença entre o sinal de entrada e o sinal decodificado de camada de base, para adquirir os dados codificados de camada de melhoramento, em que a seção de codificação de camada de melhoramento compreende: uma seção de divisão que divide o sinal residual em uma pluralidade de sub-bandas; uma primeira seção de codificação de vetor de forma que codifica a pluralidade de sub-bandas para adquirir as primeiras informações codificadas de forma, e que calcula os ganhos-alvo da pluralidade de subbandas; uma seção de formação de vetor de ganho que forma um vetor de ganho utilizando a pluralidade de ganhos-alvo; e uma seção de codificação de vetor de ganho que codifica o vetor de ganho para adquirir as primeiras informações codificadas de ganho.
2. Aparelho de codificação de acordo com a reivindicação 1, em que a primeira seção de codificação de vetor de forma codifica a pluralidade de sub-bandas utilizando um livro de códigos de vetor de forma formado com uma pluralidade de vetor de forma os quais incluem pelo menos um pulso colocado em uma frequência arbitrária.
3. Aparelho de codificação de acordo com a reivindicação 2, em que a primeira seção de codificação de vetor de forma codifica a pluralidade de sub-bandas utilizando as informações de correlação relativas ao candidato de vetor de forma selecionado do livro de códigos de vetor de forma.
4. Aparelho de codificação de acordo com a reivindicação 1, em que: a seção de codificação de camada de melhoramento ainda compreende uma seção de seleção de faixa que calcula as tonalidades de uma pluralidade de faixas formadas utilizando um número arbitrário de subbandas adjacentes e que selecionam uma faixa da tonalidade mais forte da pluralidade de faixas; e a primeira seção de codificação de vetor de forma, a seção de formação de vetor de ganho e a seção de codificação de vetor de ganho operam com relação a uma pluralidade de sub-bandas que formam a faixa selecionada.
5. Aparelho de codificação de acordo com a reivindicação 1, em que: a seção de codificação de camada de melhoramento ainda compreende uma seção de seleção de faixa que calcula as energias médias de uma pluralidade de faixas formadas utilizando um número arbitrário de subbandas adjacentes e selecionam uma faixa da energia média mais alta da pluralidade de faixas; e a primeira seção de codificação de vetor de forma, a seção de formação de vetor de ganho e a seção de codificação de vetor de ganho operam com relação a uma pluralidade de sub-bandas que formam a faixa selecionada.
6. Aparelho de codificação de acordo com a reivindicação 1, em que: a seção de codificação de camada de melhoramento ainda compreende uma seção de seleção de faixa que calcula as energias de ponderação perceptiva de uma pluralidade de faixas formadas utilizando um número arbitrário de sub-bandas adjacentes e que selecionam uma faixa da energia de ponderação perceptiva mais alta da pluralidade de faixas; e a primeira seção de codificação de vetor de forma, a seção de formação de vetor de ganho e a seção de codificação de vetor de ganho operam com relação a uma pluralidade de sub-bandas que formam a faixa selecionada.
7. Aparelho de codificação de acordo com qualquer uma das reivindicações 4 a 6, em que a seção de seleção de faixa seleciona uma de uma pluralidade de faixas em bandas mais baixas do que uma frequência predeterminada.
8. Aparelho de codificação de acordo com qualquer uma das reivindicação 4 a 6, ainda compreendendo a pluralidade de faixas de melhoramento, em que a frequência predeterminada é mais alta em uma camada mais alta.
9. Aparelho de codificação de acordo com a reivindicação 1, em que: a seção de codificação de camada de melhoramento ainda compreende uma seção de seleção de faixa que forma uma pluralidade de faixas 15 utilizando um número arbitrário de sub-bandas adjacentes, que forma uma pluralidade de bandas parciais utilizando um número arbitrário de faixas, que selecionam uma faixa da energia média mais alta de cada uma da pluralidade de bandas parciais e que concatena uma pluralidade de faixas selecionadas para fazer uma faixa concatenada; e a primeira seção de codificação de vetor de forma, a seção de formação de vetor de ganho e a seção de codificação de vetor de ganho operam com relação a uma pluralidade de sub-bandas que formam a faixa concatenada selecionada.
10. Aparelho de codificação de acordo com a reivindicação 9, em que a seção de seleção de faixa seleciona o tempo todo uma faixa fixa a qual é especificada com antecedência, em pelo menos uma da pluralidade de bandas parciais.
11. Aparelho de codificação de acordo com a reivindicação 1, em que: a seção de codificação de camada de melhoramento ainda compreende uma seção de decisão de tonalidade que decide a intensidade de tonalidade do sinal de entrada; e quando a intensidade da tonalidade do sinal de entrada é decidida ser igual a ou maior do que um nível predeterminado, a camada de melhoramento: divide o sinal residual em uma pluralidade de sub-bandas; codifica a pluralidade de sub-bandas para adquirir as primeiras informações codificadas de forma e calcula os ganhos-alvo da pluralidade de sub-bandas; forma um vetor de ganho utilizando a pluralidade de ganhosalvo; e codifica o vetor de ganho para adquirir as primeiras informações codificadas de ganho.
12. Aparelho de codificação de acordo com qualquer uma das reivindicações 1 a 11, em que: a seção de codificação de camada de base compreende: uma seção de redução de resolução que reduz a resolução do sinal de entrada para adquirir um sinal de resolução reduzida; e uma seção de codificação de núcleo que codifica o sinal de resolução reduzida para adquirir os dados codificados de núcleo como dados codificados; e a seção de decodificação de camada de base compreende: uma seção de decodificação de núcleo que decodifica os dados codificados de núcleo para adquirir um sinal decodificado de núcleo; uma seção de aumento de resolução que aumenta a resolução dos dados decodificados de núcleo para adquirir um sinal de resolução aumentada; e uma seção de substituição que substitui o ruído por um componente de banda de alta frequência do sinal de resolução aumentada;
13. Aparelho de codificação de acordo com a reivindicação 1, ainda compreendendo: uma seção de codificação de ganho que codifica os ganhos de coeficientes de transformada da pluralidade de sub-bandas para adquirir as segundas informações codificadas de ganho; uma seção de normalização que normaliza os coeficientes de transformada da pluralidade de sub-bandas utilizando os segundos ganhos decodificados adquiridos pela decodificação das informações codificadas de ganho, para adquirir uma pluralidade de vetores de forma normalizados; uma segunda seção de codificação de vetor de forma que codifica a pluralidade de vetores de forma normalizados para adquirir as segundas informações codificadas de forma; e uma seção de decisão que calcula a tonalidade do sinal de entrada em uma base por quadro, que emite os coeficientes de transformada da pluralidade de sub-bandas para a primeira seção de codificação de vetor de forma quando a tonalidade é decidida ser igual a ou maior do que o limite, e que emite os coeficientes de transformada da pluralidade de sub-bandas para a seção de codificação de ganho quando a tonalidade é decidida ser menor do que o limite.
14. Método de codificação que compreende: dividir os coeficientes de transformada adquiridos pela transformação de um sinal de entrada em um domínio de frequência, em uma pluralidade de sub-bandas; codificar os coeficientes de transformada da pluralidade de subbandas para adquirir as primeiras informações codificadas de forma e calcular os ganhos-alvo dos coeficientes de transformada da pluralidade de subbandas; formar um vetor de ganho utilizando a pluralidade de ganhosalvo; e codificar o vetor de ganho para adquirir as primeiras informações codificadas de ganho.
BRPI0808428A 2007-03-02 2008-02-29 Dispostivo de codificação e método de codificação BRPI0808428A8 (pt)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
JP2007-053502 2007-03-02
JP2007053502 2007-03-02
JP2007-133545 2007-05-18
JP2007133545 2007-05-18
JP2007185077 2007-07-13
JP2007-185077 2007-07-13
JP2008045259A JP4871894B2 (ja) 2007-03-02 2008-02-26 符号化装置、復号装置、符号化方法および復号方法
JP2008-045259 2008-02-26
PCT/JP2008/000408 WO2008120440A1 (ja) 2007-03-02 2008-02-29 符号化装置および符号化方法

Publications (2)

Publication Number Publication Date
BRPI0808428A2 true BRPI0808428A2 (pt) 2014-07-22
BRPI0808428A8 BRPI0808428A8 (pt) 2016-12-20

Family

ID=39808027

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0808428A BRPI0808428A8 (pt) 2007-03-02 2008-02-29 Dispostivo de codificação e método de codificação

Country Status (11)

Country Link
US (3) US8554549B2 (pt)
EP (1) EP2128857B1 (pt)
JP (1) JP4871894B2 (pt)
KR (1) KR101414354B1 (pt)
CN (3) CN102411933B (pt)
AU (1) AU2008233888B2 (pt)
BR (1) BRPI0808428A8 (pt)
MY (1) MY147075A (pt)
RU (3) RU2471252C2 (pt)
SG (2) SG178728A1 (pt)
WO (1) WO2008120440A1 (pt)

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5339919B2 (ja) * 2006-12-15 2013-11-13 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
JP4708446B2 (ja) * 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
KR20090110242A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 신호를 처리하는 방법 및 장치
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
KR101599875B1 (ko) * 2008-04-17 2016-03-14 삼성전자주식회사 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 부호화 방법 및 장치, 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 복호화 방법 및 장치
EP2237269B1 (en) * 2009-04-01 2013-02-20 Motorola Mobility LLC Apparatus and method for processing an encoded audio data signal
JP5764488B2 (ja) 2009-05-26 2015-08-19 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 復号装置及び復号方法
FR2947945A1 (fr) * 2009-07-07 2011-01-14 France Telecom Allocation de bits dans un codage/decodage d'amelioration d'un codage/decodage hierarchique de signaux audionumeriques
FR2947944A1 (fr) * 2009-07-07 2011-01-14 France Telecom Codage/decodage perfectionne de signaux audionumeriques
US9009037B2 (en) * 2009-10-14 2015-04-14 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device, and methods therefor
US8977546B2 (en) * 2009-10-20 2015-03-10 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device and method for both
WO2011058752A1 (ja) 2009-11-12 2011-05-19 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
WO2011058758A1 (ja) 2009-11-13 2011-05-19 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
CN102918590B (zh) * 2010-03-31 2014-12-10 韩国电子通信研究院 编码方法和装置、以及解码方法和装置
JP5714002B2 (ja) * 2010-04-19 2015-05-07 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置、符号化方法及び復号方法
US8751225B2 (en) * 2010-05-12 2014-06-10 Electronics And Telecommunications Research Institute Apparatus and method for coding signal in a communication system
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
CN106409305B (zh) 2010-12-29 2019-12-10 三星电子株式会社 用于针对高频带宽扩展进行编码/解码的设备和方法
CN103329199B (zh) * 2011-01-25 2015-04-08 日本电信电话株式会社 编码方法、编码装置、周期性特征量决定方法、周期性特征量决定装置、程序、记录介质
EP2681734B1 (en) * 2011-03-04 2017-06-21 Telefonaktiebolaget LM Ericsson (publ) Post-quantization gain correction in audio coding
EP2696343B1 (en) 2011-04-05 2016-12-21 Nippon Telegraph And Telephone Corporation Encoding an acoustic signal
PL2697795T3 (pl) 2011-04-15 2015-10-30 Ericsson Telefon Ab L M Kodowanie adaptacyjne typu kształt wzmocnienie
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
US9546924B2 (en) 2011-06-30 2017-01-17 Telefonaktiebolaget Lm Ericsson (Publ) Transform audio codec and methods for encoding and decoding a time segment of an audio signal
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
ES2568640T3 (es) 2012-02-23 2016-05-03 Dolby International Ab Procedimientos y sistemas para recuperar de manera eficiente contenido de audio de alta frecuencia
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
KR101726205B1 (ko) * 2012-11-07 2017-04-12 돌비 인터네셔널 에이비 감소된 복잡성 변환기 snr 계산
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
BR112016020988B1 (pt) * 2014-03-14 2022-08-30 Telefonaktiebolaget Lm Ericsson (Publ) Método e codificador para codificação de um sinal de áudio, e, dispositivo de comunicação
ES2689120T3 (es) * 2014-03-24 2018-11-08 Nippon Telegraph And Telephone Corporation Método de codificación, codificador, programa y soporte de registro
CN110875048B (zh) * 2014-05-01 2023-06-09 日本电信电话株式会社 编码装置、及其方法、记录介质
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
CN106096892A (zh) * 2016-06-22 2016-11-09 严东军 供应链随货单编码及其编码规则和使用方法
BR112019024284A2 (pt) 2017-05-18 2020-06-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dispositivo de rede para gerenciar uma chamada entre terminais de usuário
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
CN110874402B (zh) * 2018-08-29 2024-05-14 北京三星通信技术研究有限公司 基于个性化信息的回复生成方法、设备和计算机可读介质
US11361776B2 (en) * 2019-06-24 2022-06-14 Qualcomm Incorporated Coding scaled spatial components
US11538489B2 (en) 2019-06-24 2022-12-27 Qualcomm Incorporated Correlating scene-based audio data for psychoacoustic audio coding
BR112022003131A2 (pt) * 2019-09-03 2022-05-17 Dolby Laboratories Licensing Corp Banco de filtros de áudio com componentes de descorrelação
CN115171709B (zh) * 2022-09-05 2022-11-18 腾讯科技(深圳)有限公司 语音编码、解码方法、装置、计算机设备和存储介质

Family Cites Families (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03263100A (ja) * 1990-03-14 1991-11-22 Mitsubishi Electric Corp 音声符号化・復号化装置
GB2282943B (en) * 1993-03-26 1998-06-03 Motorola Inc Vector quantizer method and apparatus
KR100269213B1 (ko) * 1993-10-30 2000-10-16 윤종용 오디오신호의부호화방법
JP3186007B2 (ja) 1994-03-17 2001-07-11 日本電信電話株式会社 変換符号化方法、復号化方法
US5684920A (en) * 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
JPH0846517A (ja) 1994-07-28 1996-02-16 Sony Corp 高能率符号化及び復号化システム
IT1281001B1 (it) * 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
CA2213909C (en) * 1996-08-26 2002-01-22 Nec Corporation High quality speech coder at low bit rates
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
JP3063668B2 (ja) 1997-04-04 2000-07-12 日本電気株式会社 音声符号化装置及び復号装置
JP3134817B2 (ja) * 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
DE19747132C2 (de) * 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
KR100304092B1 (ko) * 1998-03-11 2001-09-26 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
JP4281131B2 (ja) 1998-10-22 2009-06-17 ソニー株式会社 信号符号化装置及び方法、並びに信号復号装置及び方法
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
BR9906090A (pt) * 1999-12-22 2001-07-24 Conselho Nacional Cnpq Sìntese de um potente agonista paramagnético (epm-3) do hormÈnio estimulador de melanócito contendo radical livre estável em forma de aminoácido
US7013268B1 (en) * 2000-07-25 2006-03-14 Mindspeed Technologies, Inc. Method and apparatus for improved weighting filters in a CELP encoder
EP1199812A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Perceptually improved encoding of acoustic signals
US7606703B2 (en) * 2000-11-15 2009-10-20 Texas Instruments Incorporated Layered celp system and method with varying perceptual filter or short-term postfilter strengths
US7013269B1 (en) * 2001-02-13 2006-03-14 Hughes Electronics Corporation Voicing measure for a speech CODEC system
US6931373B1 (en) * 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system
CN100346392C (zh) * 2002-04-26 2007-10-31 松下电器产业株式会社 编码设备、解码设备、编码方法和解码方法
JP3881946B2 (ja) * 2002-09-12 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
FR2849727B1 (fr) * 2003-01-08 2005-03-18 France Telecom Procede de codage et de decodage audio a debit variable
JP2004302259A (ja) 2003-03-31 2004-10-28 Matsushita Electric Ind Co Ltd 音響信号の階層符号化方法および階層復号化方法
CA2524243C (en) * 2003-04-30 2013-02-19 Matsushita Electric Industrial Co. Ltd. Speech coding apparatus including enhancement layer performing long term prediction
JP4603485B2 (ja) * 2003-12-26 2010-12-22 パナソニック株式会社 音声・楽音符号化装置及び音声・楽音符号化方法
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
JP4464707B2 (ja) * 2004-02-24 2010-05-19 パナソニック株式会社 通信装置
JP4771674B2 (ja) * 2004-09-02 2011-09-14 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
JP4871501B2 (ja) 2004-11-04 2012-02-08 パナソニック株式会社 ベクトル変換装置及びベクトル変換方法
RU2500043C2 (ru) * 2004-11-05 2013-11-27 Панасоник Корпорэйшн Кодер, декодер, способ кодирования и способ декодирования
US7983904B2 (en) * 2004-11-05 2011-07-19 Panasonic Corporation Scalable decoding apparatus and scalable encoding apparatus
WO2006070760A1 (ja) * 2004-12-28 2006-07-06 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
JP4887288B2 (ja) 2005-03-25 2012-02-29 パナソニック株式会社 音声符号化装置および音声符号化方法
US8433581B2 (en) 2005-04-28 2013-04-30 Panasonic Corporation Audio encoding device and audio encoding method
CN101167126B (zh) 2005-04-28 2011-09-21 松下电器产业株式会社 语音编码装置和语音编码方法
EP1881488B1 (en) * 2005-05-11 2010-11-10 Panasonic Corporation Encoder, decoder, and their methods
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
JP4170326B2 (ja) 2005-08-16 2008-10-22 富士通株式会社 メール送受信プログラムおよびメール送受信装置
US8112286B2 (en) 2005-10-31 2012-02-07 Panasonic Corporation Stereo encoding device, and stereo signal predicting method
JP2007133545A (ja) 2005-11-09 2007-05-31 Fujitsu Ltd 運用管理プログラムおよび運用管理方法
JP2007185077A (ja) 2006-01-10 2007-07-19 Yazaki Corp ワイヤーハーネス固定具
US7835904B2 (en) * 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression
WO2007105586A1 (ja) * 2006-03-10 2007-09-20 Matsushita Electric Industrial Co., Ltd. 符号化装置および符号化方法
US8370138B2 (en) 2006-03-17 2013-02-05 Panasonic Corporation Scalable encoding device and scalable encoding method including quality improvement of a decoded signal
EP2017830B9 (en) * 2006-05-10 2011-02-23 Panasonic Corporation Encoding device and encoding method
EP1887118B1 (de) 2006-08-11 2012-06-13 Groz-Beckert KG Bestückungsset zur Bestückung einer gegebenen Anzahl von Systemteilen einer Strickmaschine, insbesondere einer Rundstrickmaschine
EP2101318B1 (en) * 2006-12-13 2014-06-04 Panasonic Corporation Encoding device, decoding device and corresponding methods
US20100017199A1 (en) * 2006-12-27 2010-01-21 Panasonic Corporation Encoding device, decoding device, and method thereof
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
CN101599272B (zh) * 2008-12-30 2011-06-08 华为技术有限公司 基音搜索方法及装置

Also Published As

Publication number Publication date
EP2128857A1 (en) 2009-12-02
CN103903626B (zh) 2018-06-22
US20130332154A1 (en) 2013-12-12
AU2008233888B2 (en) 2013-01-31
AU2008233888A1 (en) 2008-10-09
CN101622662B (zh) 2014-05-14
US8918314B2 (en) 2014-12-23
RU2009132934A (ru) 2011-03-10
US8554549B2 (en) 2013-10-08
JP2009042734A (ja) 2009-02-26
KR20090117890A (ko) 2009-11-13
SG178727A1 (en) 2012-03-29
US20130325457A1 (en) 2013-12-05
RU2579662C2 (ru) 2016-04-10
EP2128857A4 (en) 2013-08-14
CN101622662A (zh) 2010-01-06
RU2471252C2 (ru) 2012-12-27
RU2012135697A (ru) 2014-02-27
US20100017204A1 (en) 2010-01-21
CN102411933A (zh) 2012-04-11
CN103903626A (zh) 2014-07-02
US8918315B2 (en) 2014-12-23
RU2012135696A (ru) 2014-02-27
RU2579663C2 (ru) 2016-04-10
KR101414354B1 (ko) 2014-08-14
MY147075A (en) 2012-10-31
SG178728A1 (en) 2012-03-29
WO2008120440A1 (ja) 2008-10-09
EP2128857B1 (en) 2018-09-12
BRPI0808428A8 (pt) 2016-12-20
CN102411933B (zh) 2014-05-14
JP4871894B2 (ja) 2012-02-08

Similar Documents

Publication Publication Date Title
BRPI0808428A2 (pt) Dispostivo de codificação e método de codificação
RU2488897C1 (ru) Кодирующее устройство, декодирующее устройство и способ
ES2460893T3 (es) Sistemas, procedimientos y aparato para limitar el factor de ganancia
EP1806736A1 (en) Scalable encoding apparatus, scalable decoding apparatus, and methods thereof
ES2913760T3 (es) Codificador de voz y método de codificación de voz
BRPI0616624A2 (pt) aparelho de codificação de fala e método de codificação de fala
BRPI0612579A2 (pt) pàs-filtro, decodificador e mÉtodo de pàs-filtraÇço
US10770078B2 (en) Adaptive gain-shape rate sharing
JP5236040B2 (ja) 符号化装置、復号装置、符号化方法および復号方法
US20190251979A1 (en) Encoding device, decoding device, encoding method, decoding method, and non-transitory computer-readable recording medium
US20130346073A1 (en) Audio encoder/decoder apparatus
RU2459283C2 (ru) Кодирующее устройство, декодирующее устройство и способ

Legal Events

Date Code Title Description
B25A Requested transfer of rights approved

Owner name: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AME

B15K Others concerning applications: alteration of classification

Ipc: G10L 19/00 (2013.01), G10L 19/005 (2013.01), G10L

B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B11B Dismissal acc. art. 36, par 1 of ipl - no reply within 90 days to fullfil the necessary requirements