BRPI0611430A2 - codificador, decodificador e seus métodos - Google Patents

codificador, decodificador e seus métodos Download PDF

Info

Publication number
BRPI0611430A2
BRPI0611430A2 BRPI0611430-0A BRPI0611430A BRPI0611430A2 BR PI0611430 A2 BRPI0611430 A2 BR PI0611430A2 BR PI0611430 A BRPI0611430 A BR PI0611430A BR PI0611430 A2 BRPI0611430 A2 BR PI0611430A2
Authority
BR
Brazil
Prior art keywords
signal
section
decoded
decoding
coding
Prior art date
Application number
BRPI0611430-0A
Other languages
English (en)
Inventor
Toshiyuki Morii
Kaoru Sato
Tomofumi Yamanashi
Original Assignee
Matsushita Electric Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Ind Co Ltd filed Critical Matsushita Electric Ind Co Ltd
Publication of BRPI0611430A2 publication Critical patent/BRPI0611430A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

CODIFICADOR, DECODIFICADOR E SEUS MéTODOS. A presente invenção refere-se a um codificador que gera um sinal decodificado com uma qualidade aperfeiçoada pela codificação redimensionável pelo cancelamento das características inerentes ao codificador e causando a degradação da qualidade do sinal decodificado. No codificador, a primeira seção de codificação (102) codifica o sinal de entrada após amostragem de taxa reduzida, uma primeira seção de decodificação (103) decodifica a primeira informação codificada enviada a partir da primeira seção de codificação (102), uma seção de ajuste (105) ajusta o primeiro sinal decodificado após amostragem de taxa aumentada por convolução do primeiro sinal de decodificado após amostragem de taxa aumentada e um impulso-resposta para ajuste, um adicionador (107) inverte a polaridade do primeiro sinal decodificado ajustado e adiciona o primeiro sinal decodificado que tem a polaridade invertida em relação ao sinal de entrada, uma segunda seção de codificação (108) codifica o sinal residual enviado a partir do adicionador (107) e uma seção de multiplexação (109) multiplexa a primeira informação codificada enviada a partir da primeira seção de codificação (102) e a segunda informação codificada enviada a partir da segunda seção de codificação (108).

Description

Relatório Descritivo da Patente de Invenção para "CODIFICADOR,DECODIFICADOR E SEUS MÉTODOS".
Campo Técnico
A presente invenção refere-se a um aparelho de codificação,aparelho de decodificação, método de codificação e método de decodifica-ção usados em um sistema de comunicação onde os sinais de entrada sãosubmetidos à codificação redimensionável e transmitidos.
Antecedentes da Técnica
No campo da comunicação digital sem fio, a comunicação porunidades caracterizada pela comunicação da Internet e armazenamento defala, a técnica para codificar e decodificar sinais de falas é essencial para autilização eficaz da capacidade de transmissão de ondas de rádio e meiosde armazenamento, e foi desenvolvido um grande número de esquemas decodificação e decodificação de fala.
Atualmente, um esquema de codificação e decodificação de falaque adota um esquema CELP é colocado em uso prático como uma tendên-cia maior (por exemplo, Documento não patente 1). O esquema de codifica-ção de fala que adota o esquema CELP geralmente armazena modelos desom vocalizado e codifica a fala de entrada com base nos modelos de falaarmazenados de antemão.
Nos últimos anos, na codificação de sinais de fala e sinais detom, está sendo desenvolvida uma técnica de codificação redimensionávelque aplica o esquema CELP e torna possível decodificar sinais de fala e tommesmo a partir de parte da informação codificada e suprimir a deterioraçãode qualidade da fala mesmo quando ocorre uma perda de unidade (por é-xemplo, Documento de Patente 1).
Um esquema de codificação redimensionável geralmente é for-mado com uma camada base e uma multiplicidade de camadas aperfeiçoa-das e as camadas formam uma estrutura em camadas com a camada basesendo a camada inferior. Em cada camada, é codificado um sinal residualque é a diferença entre o sinal de entrada e o sinal de saída de uma camadainferior. De acordo com essa configuração, é possível decodificar fala e tomusando a informação codificada para todas as camadas ou a informaçãocodificada de uma parte de camadas.
Além disso, em uma codificação redimensionável, geralmente, afreqüência de amostragem do sinal de entrada é convertido e é codificado osinal de entrada de amostragem de taxa reduzida. Neste caso, o sinal resi-dual codificado pela camada superior é gerado por amostragem de taxa au-mentada do sinal decodificado da camada inferior e calculada a diferençaentre o sinal de entrada e o sinal decodificado de amostragem de taxa au-mentada.
Documento de Patente 1: Pedido de Patente Japonês aberto à inspeção pú-blica N5 HEI10-97295
Documento de não-patente 1: M.R. Schroeder, B.S.Atal, "Code Excited Li-near Prediction: High Quality Speech at very Low Bit Rate", IEEE proc., I-CASSP'85 pp. 937-940
Descrição da Invenção
2F06074
Problemas a Serem Solucionados pela Invenção
Neste ponto, geralmente, o aparelho de codificação tem caracte-rísticas únicas que causam a deterioração da qualidade de um sinal decodi-ficado. Por exemplo, quando um sinal de entrada de amostragem de taxareduzida é codificado na camada base, a fase do sinal decodificado desloca-se pela conversão da freqüência de amostragem e a qualidade do sinal de-codificado deteriora.
No entanto, o esquema convencional de codificação redimensio-nável efetua a codificação sem levar em consideração as características úni-cas do aparelho de codificação, deteriorando deste modo a qualidade dosinal decodificado na camada inferior devido a características únicas desteaparelho de codificação, tornando o erro entre o sinal decodificado e o sinalde entrada maior e causando a deterioração na eficiência da codificação dacamada superior.
Conseqüentemente, é um objetivo da presente invenção apre-sentar um aparelho de codificação, um aparelho de decodificação, um méto-do de codificação e um método de decodificação que, mesmo quando o apa-relho de codificação tem características únicas, torna possível cancelar ascaracterísticas que afetam o sinal decodificado em um esquema de codifica-ção redimensionável.
Meios para Solucionar o Problema
O aparelho de codificação da presente invenção efetua a codifi-cação redimensionável de um sinal de entrada e adota a configuração quecompreende: uma primeira seção de codificação que codifica o sinal de en-trada e gera a primeira informação codificada; uma primeira seção de deco-dificação que decodifica a primeira informação codificada e gera um primeirosinal decodificado; uma seção de ajuste que ajusta o primeiro sinal decodifi-cado pela convolução do primeiro sinal decodificado e um impulso-respostapara uso de ajuste; uma seção de retardo que retarda o sinal de entrada emsincronização com o primeiro sinal decodificado ajustado; uma seção de adi-ção que calcula um sinal residual que é a diferença entre o sinal de entradaretardado e o primeiro sinal decodificado ajustado; e uma segunda seção decodificação que codifica o sinal residual e gera a segunda informação codifi-cada.
O aparelho dé codificação da presente invenção efetua uma co-dificação redimensionável em um sinal de entrada e adota uma configuraçãoque inclui: uma seção de conversão de freqüência que efetua uma amostra-gem reduzida do sinal de entrada; uma primeira seção de codificação quecodifica o sinal de entrada de amostragem reduzida e gera uma primeira in-formação codificada; uma primeira seção de decodificação que decodifica aprimeira informação codificada e gera um primeiro sinal decodificado; umaseção de conversão de freqüência que efetua uma amostragem de taxa au-mentada do primeiro sinal decodificado; uma seção de ajuste que ajusta oprimeiro sinal decodificado de amostragem intensificada pela convolução doprimeiro sinal decodificado de amostragem de taxa aumentada e um impul-so-resposta para uso de ajuste; uma seção de retardo que retarda o sinal deentrada que está em sincronização com o primeiro sinal decodificado ajusta-do; e uma seção de adição que calcula um sinal residual que é a diferençaentre o sinal de entrada retardado e o primeiro sinal decodificado ajustado; euma segunda seção de codificação que codifica o sinal residual e gera a se-gunda informação codificada.
O aparelho de decodificação da presente invenção decodifica ainformação codificada enviada a partir do aparelho de codificação acimadescrito e adota uma configuração que compreende: uma primeira seção dedecodificação que decodifica a primeira informação codificada e gera umprimeiro sinal decodificado; uma segunda seção de decodificação que deco-difica a segunda informação codificada e gera um segundo sinal decodifica-do; uma seção de ajuste que ajusta o primeiro sinal decodificado pela convo-lução do primeiro sinal decodificado e um impulso-resposta para uso de a-juste; uma seção de adição que adiciona o primeiro sinal decodificado ajus-tado e o segundo sinal decodificado; e uma seção de seleção de sinal queseleciona e envia um dos primeiros sinais decodificados gerados pela pri-meira seção de decodificação e o resultado da adição da seção de adição.
O aparelho de decodificação da presente invenção decodifica ainformação codificada enviada a partir do aparelho de codificação acimadescrito e adota uma configuração que compreende: uma primeira seção dedecodificação que decodifica a primeira informação codificada e gera umprimeiro sinal decodificado; uma segunda seção de decodificação que deco-difica a segunda informação codificada e gera um segundo sinal decodifica-do; uma seção de conversão de freqüência que efetua uma amostragem detaxa aumentada do primeiro sinal decodificado; uma seção de ajuste queajusta o primeiro sinal decodificado de amostragem de taxa aumentada porconvolução do primeiro sinal decodificado de amostragem de taxa aumenta-da e um impulso-resposta para uso de ajuste; uma seção de adição que adi-ciona o primeiro sinal decodificado ajustado e o segundo sinal decodificado;e uma seção de seleção de sinal què seleciona e envia um dos primeirossinais decodificados gerados pela primeira seção de decodificação e o resul-tado da adição da seção de adição.
O método de codificação da presente invenção efetua a codifi-cação redimensionável de um sinal de entrada e compreende: uma primeiraetapa de codificação para codificar o sinal de entrada e gerar a primeira in-formação codificada; uma primeira etapa de decodificação para decodificar aprimeira informação codificada e gerar um primeiro sinal decodificado, umaetapa de ajuste para ajustar o primeiro sinal decodificado pela convolução doprimeiro sinal decodificado e uma resposta de impulso para uso de ajuste;uma etapa de atraso para atrasar o sinal de entrada em sincronia com o pri-meiro sinal decodificado ajustado; uma etapa de adição para calcular umsinal residual que é uma diferença entre o sinal de entrada atrasado e o pri-meiro sinal de decodificação ajustado; e uma segunda etapa de codificaçãopara codificar o sinal residual e gerar uma segunda informação codificada.
O método de decodificação decodifica a informação codificadapelo método de codificação acima descrito e compreende: uma primeira eta-pa de decodificação da decodificação da primeira informação codificada egeração de um primeiro sinal decodificado; uma segunda etapa de decodifi-cação da decodificação da segunda informação codificada e geração de umsegundo sinal decodificado; uma etapa de ajuste do ajuste do primeiro sinaldecodificado por convolução do primeiro sinal decodificado e um impulso-resposta para uso de ajuste; e uma etapa de adição do primeiro sinal decodi-ficado ajustado e o segundo sinal decodificado; e uma etapa de seleção desinal da seleção e envio de um dos primeiros sinais decodificados geradosna primeira etapa de decodificação e o resultado da adição da etapa de adição.
Efeito Vantajoso da Invenção
-De acordo com a presente invenção, pelo ajuste de sinais deco-dificados enyiados é possível cancelar características únicas ao aparelho decodificação e melhorar a qualidade do sinal decodificado e a eficiência dacodificação de camadas superiores.
Breve Descrição dos Desenhos
A figura 1 é um diagrama de bloco que apresenta uma configu-ração principal de um aparelho de codificação e um aparelho de decodifica-ção de acordo com a modalidade 1 da presente invenção.
A figura 2 é um diagrama de bloco que apresenta uma configu-ração interna de uma primeira seção de codificação e uma segunda seçãode codificação de acordo com a modalidade 1 da presente invenção.
A figura 3 simplesmente ilustra o processamento de determina-ção de um retardo de excitação adaptativo.
A figura 4 simplesmente ilustra o processamento de determina-ção de um vetor de excitação fixo.
A figura 5 é um diagrama de bloco que apresenta uma configu-ração interna de uma primeira seção de decodificação e uma segunda seçãode decodificação de acordo com a modalidade 1 da presente invenção.
A figura 6 é um diagrama de bloco que apresenta uma configu-ração interna de uma seção de ajuste de acordo com a modalidade 1 da pre-sente invenção.
A figura 7 é um diagrama de bloco que apresenta uma configu-ração de um aparelho de transmissão de sinal de fala e tom de acordo coma modalidade 2 da presente invenção; e a figura 8 é um diagrama de blocoque apresenta uma configuração de um aparelho de recepção de sinal defala e tom de acordo com a modalidade 2 da presente invenção.
Melhor modo para executar a invenção
As modalidades da presente invenção serão abaixo descritas empormenores com referência aos desenhos que acompanham. Na modalida-de a seguir será descrito um caso onde são efetuadas codificações e decodi-ficações de fala do tipo CELP usando um método de codificação e decodifi-cação de sinal formado de duas camadas. O método de codificação de sinalem camadas compreende uma multiplicidade de métodos de codificação desinal na camada superior e forma uma estrutura em camadas e a multiplici-dade de métodos de codificação de sinal codificam um sinal de diferençaentre o sinal de entrada e o sinal de saída na camada inferior e envia infor-mações codificadas.
A figura 1 é um diagrama de bloco que apresenta uma configu-ração principal do aparelho de codificação 100 e do aparelho de decodifica-ção 150 de acordo com a modalidade 1 da presente invenção. O aparelhode codificação 100 é principalmente configurado com seções de conversãode freqüência 101 e 104, a primeira seção de codificação 102, a primeiraseção de decodificação 103, a seção de ajuste 105, a seção de retardo 106,o adicionador 107, a segunda seção de codificação 108 e a seção de multi-plexação 109. Além disso, o aparelho de decodificação 150 é principalmenteconfigurado com a seção de multiplexação 151, a primeira seção de decodi-ficação 152, a segunda seção de decodificação 153, a seção de conversãode freqüência 154, a seção de ajuste 155, o adicionador 156 e a seção deseleção de sinal 157. A informação codificada enviada a partir do aparelhode codificação 100 é transmitida a partir do aparelho de decodificação 150por meio do canal M.
O processamento dos componentes do aparelho de codificação100 apresentado na figura 1 será descrito abaixo. Os sinais que são sinaisde fala e de tom são aplicados à seção de conversão de freqüência 101 e àseção de retardo 106. A seção de conversão de freqüência 101 converte afreqüência de amostragem do sinal de entrada e envia o sinal de entrada deamostragem de taxa reduzida para a primeira seção de codificação 102.
A primeira seção de codificação 102 codifica o sinal de entradade amostragem de taxa reduzida usando um método de codificação de sinalde fala e tom de esquema CELP e envia a primeira informação codificadagerada pela codificação para a primeira seção de decodificação 103 e para aseção de multiplexação 109.
A primeira seção de decodificação 103 decodifica a primeira in-formação codificada enviada a partir da primeira seção de codificação 102usando um método de decodificação de sinal de fala e tom de esquemaCELP e envia um primeiro sinal decodificado gerado pela decodificação paraa seção de conversão de freqüência 104. A seção de conversão de freqüên-cia 104 converte a freqüência de amostragem do primeiro sinal decodificadoenviado a partir da primeira seção de decodificação 103 e envia o primeirosinal decodificado de amostragem de taxa aumentada para a seção de ajuste 105.
A seção de ajuste 105 ajusta o primeiro sinal decodificado deamostragem de taxa aumentada por convolução do primeiro sinal decodifi-cado de amostragem de taxa aumentada e um impulso-resposta para uso deajuste e envia o primeiro sinal decodificado ajustado ao adicionador 107.
Desse modo, pelo ajuste do primeiro sinal decodificado de amostragem detaxa aumentada na seção de ajuste 105, é possível cancelar as característi-cas únicas ao aparelho de codificação. A configuração interna e o proces-samento da convolução da seção de ajuste 105 serão descritos em porme-nores posteriormente.
A seção de retardo 106 armazena temporariamente o sinal defala e tom em uma memória temporária, extrai o sinal de fala e tom do localda memória temporária em sincronização temporal com o primeiro sinal de-codificado enviado a partir da seção de ajuste 105 e envia o sinal ao adicio-nador 107. O adicionador 107 reverte a polaridade do primeiro sinal decodifi-cado enviado a partir da seção de ajuste 105, adiciona o primeiro sinal decodificado de polaridade invertida ao sinal de entrada enviado a partir daseção de retardo 106 e envia um sinal residual, o qual é o resultado da adi-ção, para a segunda seção de codificação 108.
A segunda seção de codificação 108 codifica o sinal residualenviado a partir do adicionador 107 usando ó método de codificação de sinalde fala e tom pelo esquema CELP e envia a segunda informação codificadagerada pela codificação para a seção de multiplexação 109.
A seção de multiplexação 109 multiplexa a primeira informaçãocodificada enviada a partir da primeira seção de codificação 102 e a segun-da informação codificada enviada a partir da segunda seção de codificação108 e envia o resultado para o canal M como informação multiplexa.
A seguir, será descrito o processamento dos componentes doaparelho de decodificação 150 apresentados na figura 1. A seção de demul-tiplexação 151 demultiplexa a informação multiplexa transmitida a partir doaparelho de codificação 100 para o interior da primeira informação codificadae da segunda informação codificada e envia a primeira informação codifica-da para a primeira seção de decodificação 152 e a segunda informação codi-ficada para a segunda seção de decodificação 153.
A primeira seção de decodificação 152 recebe a primeira infor-mação codificada a partir da seção de demultiplexação 151, decodifica aprimeira informação codificada usando o método de decodificação de sinalde fala e tom pelo esquema CELP e envia um primeiro sinal decodificadoobtido pela decodificação para a seção de conversão de freqüência 154 eseção de seleção de sinal 157.
A segunda seção de decodificação 153 recebe a segunda infor-mação codificada a partir da seção de demultiplexação 151, decodifica asegunda informação codificada usando o método de decodificação de sinalde fala e tom pelo esquema CELP e envia um segundo sinal decodificadoobtido pela decodificação para o adicionador 156.
A seção de conversão de freqüência 154 converte a freqüênciade amostragem do primeiro sinal decodificado enviado a partir da primeiraseção de decodificação 152 e envia o primeiro sinal decodificado de amos-tragem de taxa aumentada para a seção de ajuste 155.
A seção de ajuste 155 ajusta o primeiro sinal decodificado envi-ado a partir da seção de conversão de freqüência 154 usando o mesmo mé-todo conforme a seção de ajuste 105 e envia o primeiro sinal decodificadoajustado para o adicionador 156.
O adicionador 156 adiciona o segundo sinal decodificado envia-do a partir da segunda seção de decodificação 153 e o primeiro sinal decodi-ficado enviado a partir da seção de ajuste 155 e obtém um segundo sinaldecodificado que é o resultado da adição.
A seção de seleção de sinal 157 envia para a etapa subseqüen-te um dos primeiros sinais decodificados enviados a partir da primeira seçãode decodificação 152 e o segundo sinal decodificado enviado a partir do adi-cionador 156, com base em um sinal de controle.
A seguir, o processamento da conversão de freqüência no apa-relho de codificação 100 e o aparelho de decodificação 150 serão descritosem pormenores usando um exemplo no qual a seção de conversão de fre-qüência 101 efetua uma amostragem de taxa reduzida do sinal de entradaque tem uma freqüência de amostragem de 16 kHz para um sinal que temuma freqüência de amostragem de 8 kHz.Neste caso, primeiramente, a seção de conversão de freqüência101 submete o sinal de entrada a um filtro de banda baixa e elimina os com-ponentes de alta freqüência (4 para 8 kHz) de modo que os componentes dafreqüência do sinal de entrada baixam de 0 para 4 kHz. A seção de conver-são de freqüência 101 extrai todas outras amostras do sinal de entrada quepassaram através do filtro de banda baixa e torna uma série da amostra ex-traída um sinal de entrada de amostragem de taxa reduzida.
A seções de conversão de freqüência 104 e 154 efetuam umaamostragem de taxa aumentada do primeiro sinal decodificado que tem umafreqüência de amostragem de 8 kHz para um sina! que tem uma freqüênciade amostragem de 16 kHz. Para ser mais específico, as seções de conver-são de freqüência 104 e 154 inserem amostras que tem valores "0" entre asamostras do primeiro sinal decodificado de 8 kHz e estendem a seqüênciade amostra do primeiro sinal decodificado a um tamanho duplicado. As se-ções de conversão de freqüência 104 e 154 então submetem o primeiro sinaldecodificado estendido ao filtro de banda baixa e eliminam os componentesde alta freqüência (4 para 8 kHz) de modo que os componentes de freqüên-cia do primeiro sinal decodificado baixam de 0 para 4 kHz. As seções deconversão de freqüência 104 e 154 então ajustam-se a capacidade do pri-meiro sinal decodificado que passou através do filtro de banda baixa e tor-nam o primeiro sinal decodificado ajustado um primeiro sinal decodificadocom amostragem de taxa aumentada.
O ajuste da capacidade é efetuado de acordo com as seguintesetapas. As seções de conversão de freqüência 104 e 154 armazenam o coe-ficiente r para o ajuste da capacidade. O valor inicial para o coeficiente r é"1". Além disso, o valor inicial para o coeficiente r pode ser modificado demodo a ser um valor adequado para aparelhos de codificação. O processa-mento a seguir é efetuado por quadro. Primeiramente, a partir da seguinteequação 1, são calculados o RMS (raiz quadrada do valor médio) do primei-ro sinal decodificado antes da extensão e RMS1 do primeiro sinal decodifica-do que tenha passado através do filtro de banda baixa.<formula>formula see original document page 12</formula>
Aqui, ys(i) é o primeiro sinal decodificado antes da extensão eassume os valores entre 0 e N/2-1. Além disso, ys' (i) é o primeiro sinal de-codificado que passou através do filtro de banda baixa, e i assume os valo-res de 0 e N-1. Além disso, N é um tamanho de quadro. A seguir, para cada i(Oa N-1), o coeficiente r é atualizado e a capacidade do primeiro sinal deco-dificado é ajustada por meio da seguinte equação 2.
<formula>formula see original document page 12</formula>
A parte superior da equação 2 é uma equação para atualizar ocoeficiente r e o valor do coeficiente r é submetido ao processamento nopróximo quadro após o ajuste da capacidade ser efetuada no presente qua-dro. A parte inferior da equação 2 é uma equação para efetuar o ajuste dacapacidade usando o coeficiente r. ys" (i) calculado a partir da equação 2 é oprimeiro sinal decodificado após a amostragem de taxa aumentada. Os valo-res de 0.99 e 0.01 na equação 2 podem ser modificados de modo a seremvalores adequados para os aparelhos de codificação. A seguir, na equação2, quando o valor de RMS1 é "0", o processamento é efetuado de modo acalcular o valor de (RMS / RMS'). Por exemplo, quando o valor de RMS1 é"0", o valor de RMS é substituído por RMS1 de modo que o valor de (RMS /RMS') torna-se "1".A seguir, as configurações internas da primeira seção de codifi-cação 102 e da segunda seção de codificação 108 serão descritas usando odiagrama de bloco da figura 2. Além disso, essas seções de codificação têma mesma configuração interna, porém aplicam freqüências de amostragemdiferentes para um sinal de fala e tom a ser codificado. Além disso, a primei-ra seção de codificação 102 e a segunda seção de codificação 108 separamo sinal de fala e tom aplicado em amostras N, cada, (onde N é um númeronatural) e codificam o sinal por quadro usando amostras N como um quadro.O valor de N, muitas vezes, é diferente entre a primeira seção de codificação102 e a segunda seção de codificação 108.
Um dos sinais aplicados e sinais residuais que é o sinal de fala etom, é aplicado à seção de pré-processamento 201. A seção de pré-processamento 201 efetua o processamento de filtro de banda alta que re-move os componentes DC1 o processamento de formatação de ondas queconduz à melhora do desempenho do processamento de codificação subse-qüente e o processamento de pré-ênfase e envia o sinal processado (Xin)para a seção de análise LSP 202 e o adicionador 205.
A seção de análise LSP 202 efetua a análise linear de previsãousando Xin, converte um LPC (Coeficiente Linear de Previsão), que é o re-sultado de análise, para LSP (Pares Espectrais de Linha) e envia os resulta-dos para a seção de quantização LSP 203.
A seção de quantização LSP 203 efetua o processamento dequantização no LSP enviado a partir da seção de análise LSP 202 e enviaLSP quantizados para o filtro de síntese 204. Além disso, a seção de quanti-zação LSP 203 envia um código LSP quantizado (L) que representa LSPquantizados para a seção de multiplexação 214.
O filtro de síntese 204 gera um sinal sintetizado ao efetuar a sín-tese de filtro na excitação enviada a partir do adicionador 211 (posteriormen-te descrito) usando um coeficiente de filtro com base em LSP quantizados eenvia o sinal sintetizado para o adicionador 205.
O adicionador 205 calcula um sinal de erro pela reversão da po-laridade do sinal sintetizado e adição do sinal sintetizado de polaridade re-versa para Xin1 e envia o sinal de erro para a seção de ponderação percep-tual 212.
O registro de códigos de excitação adaptativo 206 armazena emuma memória temporária a excitação enviada anteriormente pelo adiciona-dor 211, elimina as amostras em um quadro a partir da posição de elimina-ção especificada pelo sinal enviado a partir da seção de determinação deparâmetros 213 e envia as amostras para o multiplicador 209 como um vetorde excitação adaptativo. Além disso, o registro de códigos de excitação a-daptativo 206 atualiza a memória temporária toda vez que uma excitação éaplicada a partir do adicionador 211.
A seção de geração de ganho de quantização 207 determina umganho de excitação adaptativo de quantização e um ganho de excitação fixode quantização usando o sinal enviado a partir da seção de determinação deparâmetros 213 e transmite esses ganhos para o multiplicador 209 e o multi-plicador 210, respectivamente.
O registro de códigos de excitação fixa 208 envia um vetor quetem o formato especificado pelo sinal enviado a partir da seção de determi-nação de parâmetros 213 para o multiplicador 210 como um vetor de excita-ção fixa.
O multiplicador 209 multiplica o vetor de excitação adaptativoenviado a partir do registro de códigos de excitação adaptativo 206 pelo ga-nho de excitação adaptativo de quantização enviado a partir da seção degeração de ganho de quantização 207 e envia o resultado ao adicionador211. O multiplicador 210 multiplica o vetor de excitação fixa enviado a partirdo registro de códigos de excitação fixa 208 pelo ganho de excitação fixa dequantização enviada a partir da seção de geração de ganho de quantização207 e envia o resultado ao adicionador 211.
O adicionador 211 recebe o vetor de excitação adaptativo multi-plicado pelo ganho e o vetor de excitação fixa a partir do multiplicador 209 edo multiplicador 210, respectivamente, adiciona o vetor de excitação adapta-tivo multiplicado pelo ganho e o vetor de excitação fixa e envia uma excita-ção que é o resultado da adição, para o filtro de síntese 204 e o registro decódigos de excitação adaptativos 206. A excitação aplicada ao registro decódigos de excitação adaptativos 206 é armazenada na memória temporária.
A seção de ponderação perceptual 212 designa uma pondera-ção perceptual ao sinal de erro enviado a partir do adicionador 205 e envia oresultado à seção de determinação de parâmetros 213 como distorção decodificação.
A seção de determinação de parâmetros 213 seleciona a partirdo registro de código adaptativo 206 um retardo de excitação adaptativo queminimiza a distorção de codificação enviada a partir da seção de ponderaçãoperceptual 212 e envia um código de retardo de excitação adaptativo (A) queindica o resultado da seleção para a seção de multiplexação 214. Aqui, um"retardo de excitação adaptativo" é a posição onde o vetor de excitação a-daptativo é eliminado e será descrito posteriormente em pormenores. Alémdisso, a seção de determinação de parâmetros 213 seleciona a partir do re-gistro de códigos de excitação fixa 208 um vetor de excitação fixa que mini-miza a distorção de codificação enviada a partir da seção de ponderaçãoperceptual 212 e envia um código de vetor de excitação fixa (F) que indica oresultado da seleção para a seção de multiplexação 214. Além disso, a se-ção de determinação de parâmetros 213 seleciona a partir da seção de ge-ração de ganho de quantização 207 um ganho de excitação adaptativo dequantização e um ganho de excitação fixa de quantização que minimiza adistorção de codificação enviada a partir das seções de ponderação percep-tual 212 e envia um código de ganho de excitação de quantização (G) queindica os resultados da seleção para a seção de multiplexação 214.
A seção de multiplexação 214 recebe o código LSP de quantiza-ção (L) a partir da seção de quantização LSP 203, recebe o código de retar-do de excitação adaptativo (A), o código de vetor de excitação fixa (F) e ocódigo de ganho de excitação de quantização (G) a partir da seção de de-terminação de parâmetros 213, multiplexa estas informações e envia o resul-tado como informação codificada. Aqui, a informação codificada enviada apartir da primeira seção de codificação 102 são usadas como primeira infor-mação codificada e a informação codificada enviada a partir da segunda se-ção de codificação 108 é usada como segunda informação codificada.
A seguir, o processamento da determinação de LSP de quanti-zação na seção de quantização LSP 203 será simplesmente descrita usandoum exemplo onde oito bits são designados para o código LSP de quantiza-ção (L) e um LSP é submetido à quantização de vetor.
códigos LSP que armazena 256 tipos de vetores de código LSP 1sp(1) (i) cri-ados antecipadamente. Aqui, 1 é um índice designado a vetores de códigoLSP e assume valores entre 0 e 255. Além disso, o vetor de código LSP 1sp(1) (i) é um vetor N-dimensional e i assume os valores entre 0 e N-1. A seçãode quantização LSP 203 recebe LSPa (i) enviados a partir da seção de aná-lise LSP 202. Aqui, LSPa (i) é um vetor N-dimensional e i assume os valoresentre 0 e N-1.
A seguir, a seção de quantização LSP 203 calcula o erro quadrá-tico er entre LSPa (i) e vetores de código LSPa (i) para a equação 3.
A seguir, a seção de quantização LSP 203 calcula os erros qua-dráticos er para todos os 1 's e determina o valor de 1 que minimiza o erroquadrático er (1min). A seguir, a seção de quantização LSP 203 envia Iminpara a seção de multiplexação 214 como um código LSP quantizado (L) eenvia 1sp (1 min) (i) para o filtro de síntese 204 como um LSP quantizado.
Desse modo, 1sp (1 m,n) (i) calculado pela seção de quantização203 é um "LSP quantizado".
A seguir, o processamento de determinação de um retardo deexcitação adaptativo na seção de determinação de parâmetros 213 serádescrita usando a figura 3.
Nessa figura 3, a memória temporária 301 está estabelecida pa-
A seção de quantização LSP 203 está provida de um registro de(Equação 3)
<formula>formula see original document page 45</formula>ra o registro de código de excitação adaptativo 206, a posição 302 é a posi-ção onde o vetor de excitação adaptativo é eliminado e o vetor 303 é o vetorde excitação adaptativo de eliminação. Além disso, os valores numéricos"41" e "296" são o limite superior e o limite inferior da faixa móvel da posiçãode eliminação 302.
Quando oito bits são designados ao código (A) que representa oretardo de excitação adaptativo, a faixa móvel da posição de eliminação 302pode ser ajustada a um tamanho de "256" (por exemplo, de 41 até 296). A-lém disso, a faixa móvel da posição de eliminação 302 pode ser arbitraria-mente estabelecida.
A seção de determinação de parâmetros 213 desloca a posiçãode eliminação 302 dentro de uma faixa estabelecida e seqüencialmente indi-ca a posição de eliminação 302 para o registro de códigos de excitação a-daptativo 206. O registro de códigos de excitação adaptativo 206 elimina ovetor de excitação adaptativo 303 correspondente a um tamanho de quadrousando a posição dè eliminação 302 indicada pela seção de determinaçãode parâmetros 213 e envia o vetor de excitação adaptativo ao multiplicador209. A seção de determinação dé parâmetros 213 calcula a distorção de co-dificação enviada a partir da seção de ponderação perceptual 212 para ocaso onde o vetor de excitação adaptativo 303 é eliminado em todas as po-sições de eliminação 302 e determina a posição de eliminação 302 que mi-nimiza a -distorção de codificação..
Desse modo, a posição de eliminação 302 da memória temporá-ria calculada pela seção de determinação de parâmetros 213 é o "retardo deexcitação adaptativo".
A seguir, o processamento de determinação de um vetor de ex-citação fixa na seção de determinação de parâmetros 213 será descrita u-sando a figura 4. Aqui, o caso será descrito como um exemplo onde dozebits são designados a um código de vetor de excitação fixa (F).
Na figura 4, a trilha 401, a trilha 402 e a trilha 403 geram, cadauma, um pulso de unidades (onde o valor de amplitude é 1). Além disso, omultiplicador 404, o multiplicador 405 e o multiplicador 406 designam, cadaum, a polaridade para os pulsos de unidades geradas nas trilhas 401 a 403.O adicionador 407 adiciona os três pulsos de unidades gerados e o vetor408 é um "vetor de excitação fixo" composto de três pulsos de unidades.
A posição onde o pulso de unidades pode ser gerado varia entreas trilhas. Na figura 4, a trilha 401 estabelece um pulso de unidades em umadas oito posições {0, 3, 6, 9, 12,15, 18, 21}, a trilha 402 estabelece um pulsode unidades em uma das oito posições {1, 4, 7, 10, 13, 16, 19, 22} e a trilha403 estabelece um pulso de unidades em uma das oito posições {2, 5, 8, 11,14,17,20,23}.
A seguir, os multiplicadores 404 até 406 designam as polarida-des para os pulsos de unidades geradas e o adicionador 407 adiciona ostrês pulsos de unidades gerados, formando com isso o vetor de excitaçãofixo 408, que é o resultado da adição.
Neste exemplo, há oito posições e duas polaridades de positivoe negativo para cada pulso de unidades e a informação de posição de trêsbits e a informação de polaridade de um bit são usadas para representarcada pulso de unidades. Conseqüentemente, o registro de códigos de exci-tação fixa compreende doze bits no total. A seção de determinação de pa-râmetros 213 desloca as posições e as polaridades de geração dos três pul-sos de unidades e seqüencialmente indica as posições e polaridades de ge-ração para o registro de códigos de excitação fixa 208. O registro de códigosde excitação fixa 208 forma o vetor de excitação fixa 408 usando as posi-ções e polaridades de geração indicadas a partir da seção de determinaçãode parâmetros 213 e envia o vetor formado de excitação fixa 408 para o mul-'tiplicador 210. A seção de determinação de parâmetros 213 descobre a dis-torção de codificação enviada a partir da seção de ponderação perceptual212 para todas as combinações de posições e polaridades de geração e de-termina uma combinação de posição e polaridade de geração que minimizaa distorção de codificação. A seção de determinação de parâmetros 213 en-via um código de vetor de excitação fixa (F) que representa a combinação daposição e polaridade de geração que minimiza a distorção de codificaçãopara a seção de multiplexação 214.A seguir, o processamento de determinação na seção de deter-minação de parâmetros 213 do ganho de excitação adaptativo de quantiza-ção e do ganho de excitação fixa de quantização gerados pela seção de ge-ração de ganho de quantização 207 será simplesmente descrito usando umexemplo onde oito bits são designados para o código de ganho de excitaçãode quantização (G). A seção de geração de ganho de quantização 207 estáprovida de um registro de códigos de ganho de excitação que armazena 256tipos de ganho de vetores de código de ganho de excitação (k) (i) criados an-tecipadamente. Aqui, K é um índice designado aos vetores de código de ga-nho de excitação e assume valores entre 0 e 255. Além disso, o ganho devetor de código de ganho de excitação (k) (i) é um vetor bidimensional e i as-sume os valores entre 0 e 1. A seção de determinação de parâmetros 213indica seqüencialmente o valor de k a partir de 0 até 255 para a seção degeração de ganho de quantização 207. A seção de geração de ganho dequantização 207 seleciona o ganho de vetores do código de ganho de exci-tação (k) (i) a partir do registro de códigos de ganho de excitação usando kindicado a partir da seção de determinação de parâmetros 213, envia o ga-nho (k) (0) para o multiplicador 209 como um ganho de excitação adaptativode quantização e envia o ganho (k) (1) para o multiplicador 210 como um ga-nho de excitação fixa de quantização.
Desse modo, o ganho (k) (0) calculado pela seção de geração deganho de quantização 207 é o "ganho de excitação adaptativo de quantização" e o ganho (k) (1) é o "ganho de excitação fixa de quantização".
A seção de determinação de parâmetros 213 calcula a distorçãode codificação enviada a partir da seção de ponderação perceptual 212 paratodos os ks e determina o valor de k que minimiza a distorção de codificação(kmin). A seção de determinação de parâmetros 213 envia kmin para a seçãode multiplexação 214 como um código de ganho de excitação de quantiza-ção (G).
A seguir, a configuração interna da primeira seção de decodifi-cação 103, a primeira seção de decodificação 152 e a segunda seção dedecodificação 153 será descrita usando o diagrama de bloco da figura 5.Essas seções de decodificação tem a mesma configuração interna.
Uma das primeiras informações codificadas e das segundas in-formações codificadas é aplicada à seção de multiplexação 501 como infor-mação codificada. A informação codificada aplicada é demultiplexada emcódigos individuais (L, A, G e F) pela seção de demultiplexação 501. O códi-go LSP quantizado demultiplexado (L)1 o código de retardo de excitação a-daptativo (A)1 o código de ganho de excitação de quantização (G) e o códigode vetor de excitação fixa (F) são enviados para a seção de decodificaçãoLSP 502, o registro de códigos de excitação adaptativo 505, a seção de ge-ração de ganho de quantização 506 e o registro de códigos de excitação fixa507, respectivamente.
A seção de decodificação LSP 502 decodifica LSP quantizado apartir do código LSP quantizado (L) enviado da seção de demultiplexação501 e envia LSP quantizado decodificado para o filtro de síntese 503.
O registro de códigos de excitação adaptativo 505 elimina asamostras em um quadro a partir da posição de eliminação especificada pelocódigo de retardo de excitação adaptativo (A) enviado a partir da seção dedemultiplexação 501 e envia o vetor de eliminação para o multiplicador 508como um vetor de excitação adaptativo. O registro de códigos de excitaçãoadaptativo 505 atualiza a memória temporária cada vez que uma excitação éaplicada a partir do adicionador 510.
A seção de geração de ganho de quantização 506 decodifica oganho de excitação adaptativo de quantização e o ganho de excitação fixade quantização, indicados pelo código de ganho de excitação de quantiza-ção (G), enviados a partir da seção de demultiplexação 501, envia o ganhode excitação adaptativo de quantização para o multiplicador 508 e envia oganho de excitação fixa de quantização para o multiplicador 509.
O registro de códigos de excitação fixa 507 gera um vetor deexcitação fixa especificado pelo código de vetor de excitação fixa (F) enviadoa partir da seção de demultiplexação 501 e envia o vetor de excitação fixa aomultiplicador 509.
O multiplicador 508 multiplica o vetor de excitação adaptativopelo ganho de excitação adaptativo de quantização e fornece o resultado aoadicionador 510. O multiplicador 509 multiplica o vetor de excitação fixa peloganho de excitação fixa de quantização e envia o resultado ao adicionador510.
O adicionador 510 adiciona o vetor de excitação adaptativo mul-tiplicado pelo ganho e o vetor de excitação fixa enviado a partir dos multipli-cadores 508 e 509, gera uma excitação e envia a excitação ao filtro de sín-tese 503 e ao registro de códigos de excitação adaptativa 505. A excitaçãoaplicada ao registro de códigos de excitação adaptativa é armazenada emuma memória temporária.
O filtro de síntese 503 efetua a síntese de filtro usando a excita-ção enviada a partir do adicionador 510 e o coeficiente de filtro decodificadopela seção de decodificação LSP 502, e envia o sinal sintetizado para a se-ção de pós-processamento 504.
A seção de pós-processamento 504 efetua o processamentopara melhorar a qualidade de fala subjetiva tal como ênfase formante e aper-feiçoamento de densidade horizontal e o processamento para aperfeiçoar aqualidade subjetiva de ruído estacionário e fornece o resultado como umsinal decodificado. Aqui, os sinais decodificados enviados a partir da primei-ra seção de decodificação 103 e da primeira seção de decodificação 152 sãoprimeiros sinais decodificados e o sinal decodificado enviado a partir da se-gunda seção de decodjfjcação 153 é um segundo sinal decodificado.
A seguir, as configurações internas da seção de ajuste 105 eseção de ajuste 155 serão descritas usando o diagrama de bloco da figura 6.
A seção de armazenamento 603 armazena o impulso-respostapara uso de ajuste h(i) calculado de antemão através de um método de ave-riguação (posteriormente descrito).
O primeiro sinal decodificado é aplicado à seção de memória601. O primeiro sinal decodificado será expresso como y(i). O primeiro sinaldecodificado y(i) é um vetor N-dimensional e i assume os valores entre η en+N-1. Aqui , N é um tamanho de quadro. Além disso, η é uma amostra lo-calizada no cabeçote de cada quadro e η é um múltiplo integral de N.A seção de memória 601 está provida com uma memória tempo-rária que armazena os primeiros sinais decodificados previamente enviadosa partir das seções de conversão de freqüência 104 e 154. A memória tem-porária provida de uma seção de memória 601 está expressa como ybuf(i).O tamanho da memória temporária ybuf(i) é N+W-1 e i assume os valoresentre 0 e N+W-2. Aqui, W é o tamanho da janela quando a seção de convo-lução 602 efetua a convolução. A seção de memória 601 atualiza a memóriatemporária usando o primeiro sinal decodificado aplicado y(i) a partir da e-quação 4.
<formula>formula see original document page 22</formula>
Ao atualizar a equação 4, parte das memórias temporárias antesda atualização de ybuf(N) para ybuf (N+W-2) é armazenada nas memóriastemporárias ybuf(O) para ybuf(W-2). Os primeiros sinais decodificados y(n)aplicados a y(n+N-1) são armazenados como memórias temporárias ybuf(W-1) para ybuf(N+W-2). A seção de memória 601 fornece todas as memóriastemporárias atualizadas ybuf(i) para a seção de convolução 602.
A seção de convolução 602 recebe a memória temporária ybuf(i)a partir da seção de memória 601 e recebe o impulso-resposta para uso deajuste h(i) a partir da seção de armazenamento 603. O impulso-resposta pa-ra uso de ajuste (i) é um vetor W-dimensional e i assume os valores entre 0e W-1. A seção de convolução 602 ajusta o primeiro sinal decodificado apartir da convolução da equação 5 e calcula o primeiro sinal decodificadoajustado.
<formula>formula see original document page 22</formula>
(Equação 5)
Desse modo, o primeiro sinal decodificado ajustado ya(n-D+i)pode ser calculado pela memória temporária de convolução ybuf(i) paraybuf(i+W-1) e o impulso-resposta para uso de ajuste h(0) para h(W-1). Oimpulso-resposta para uso de ajuste h(i) é obtido de modo a efetuar um erroentre o primeiro sinal decodificado ajustado e o menor sinal de entrada peloajuste efetuado. Aqui, os primeiros sinais decodificados ajustados calculadossão ya(n-D) para ya(n-D+N-1) e, comparados aos primeiros sinais decodifi-cados y(n) para y(n+N-1) aplicados na seção de memória, tem uma ocorrên-cia de retardo de D no tempo (o número de amostras). A seção de convolu-ção 602 envia o primeiro sinal decodificado calculado.
A seguir, será descrito um método de calcular de antemão o im-pulso-resposta para uso de ajuste h (i) através de averiguação. Primeira-mente, um sinal de fala e tom para uso de averiguação é preparado e apli-cado ao aparelho de codificação 100. Aqui, o sinal de fala e tom para uso deaveriguação é expresso como x(i). O sinal de fala e tom para uso de averi-guação é codificado e decodificado. O primeiro sinal decodificado y(i) envia-do a partir da seção de conversão de freqüência 104 é aplicado à seção deajuste 105 por quadro. A seção de memória 601 atualiza a memória tempo-rária por quadro usando a equação 4. O erro quadrático E(n) por unidade dequadro entre o sinal de fala e tom para uso de averiguação usa x(i) e o sinalcalculado pela convolução do primeiro sinal decodificado armazenado emuma memória temporária e o impulso-resposta desconhecido para uso deajuste h(i) é expresso pela equação 6.
<formula>formula see original document page 23</formula>
Aqui, N é o tamanho do quadro. Além disso, η é a amostra loca-lizada no cabeçote de cada quadro e η é um múltiplo integral de Ν. E ainda,W é o tamanho da janela sob convolução.
Quando o número total de quadros é R, a soma total Ea dos er-ros quadráticos E(n) por quadro é expressa pela equação 7.
<formula>formula see original document page 24</formula>
Aqui, a memória temporária ybufk (i) é a memória temporáriaybuf(1) do quadro k. A memória temporária ybuf(i) é atualizada por quadro e,conseqüentemente, o conteúdo da memória temporária é diferente por qua-dro. Além disso, os valores de x(-D) para x(-1) são todos determinados em"0". E ainda, os valores iniciais da memória temporária ybuf (0) para ybuf(n+W-2) são todos determinados em "0".
Com a finalidade de calcular o impulso-resposta para uso de a-juste h(i), é calculado h(i) que minimiza Ea total de erros quadráticos da e-quação 7. Isto é, para todos h(J) da equação 7, é calculado h(j) que satisfazÔEa / ôh (j). A equação 8 é uma equação simultânea derivada de ôEa / ôh (j)= 0. Pelo cálculo de hQ) que satisfaz a equação simultânea da equação 8,pode ser calculado o impulso-resposta verificado para uso de ajuste h(i).
<formula>formula see original document page 24</formula>
... (Equação 8)
A seguir, o vetor V W-dimensional e o vetor H W-dimensionalsão definidos pela equação 9.<formula>formula see original document page 25</formula>
Além disso, quando a matriz Y WxW é definida pela equação 10,a equação 8 pode ser expressa como equação 11.
<formula>formula see original document page 25</formula>
... (Equação 11)
De acordo com isso, com a finalidade de calcular o impulso-resposta para uso de ajuste h (i), o vetor H é calculado a partir da equação 12.
<formula>formula see original document page 25</formula>
... (Equação 12)
Desse modo, ao efetuar a averiguação usando um sinal de fala etom para uso de averiguação, pode ser calculado o impulso-resposta parauso de ajuste h(i). O impulso-resposta para uso de ajuste h (i) é verificado demodo a realizar um erro quadrático entre o primeiro sinal decodificado ajus-tado e o menor sinal de entrada pelo ajuste do primeiro sinal decodificado.Na convolução do impulso-resposta para uso de ajuste h (i) calculado usan-do o método acima descrito e o primeiro sinal decodificado enviado a partirda seção de conversão de freqüência 104, é possível cancelar as caracterís-ticas únicas do aparelho de codificação 100 e efetuar o erro quadrático entreo primeiro sinal decodificado e o menor sinal de entrada.
A seguir, será descrito o processamento de retardo e produçãodo sinal de entrada na seção de retardo 106. A seção de retardo 106 arma-zena o sinal aplicado de fala e tom em uma memória temporária. A seção deretardo 106 extrai o sinal de fala e tom a partir da memória temporária emsincronização temporal com o primeiro sinal decodificado enviado a partir daseção de ajuste 105 e envia o sinal de fala e tom ao adicionador 107 comoum sinal de entrada. Para ser mais específica, quando o sinal de fala e tomaplicado é um de χ (η) até χ (n+N-1), um sinal que tem um retardo de D emtempo (o número de amostras) é extraído a partir da memória temporária e osinal extraído χ (n-D) para χ (n-D+D-1) é enviado ao adicionador 107 comoum sinal de entrada.
Nessa modalidade, foi descrito um caso como um exemplo ondeo aparelho de codificação 100 apresenta duas seções de codificação, porémo número de seções de codificação não é limitado a essas duas e pode sertrês ou mais.
Ademais, nesta modalidade, um caso foi descrito como um e-xemplo onde o aparelho de decodificação 150 possui duas seções de deco-dificação, mas o número de seções de decodificação não é limitado a dois epode ser três ou mais.
Além disso, nesta modalidade, foi descrito um caso onde o vetorde excitação fixa gerado pelo registro de códigos de excitação fixa 208 éformado com pulsos, mas a presente invenção também pode ser aplicada aum caso onde o vetor de excitação fixa é formado com pulsos disseminadose pode obter o mesmo efeito de operação como esta modalidade. Aqui, opulso disseminado não é uma unidade de pulso, porém é um pulso em for-mato de onda que tem um formato específico sobre diversas amostras.
Além disso, nesta modalidade, foi descrito um caso onde a seção de codificação e a seção de decodificação adota um método de codifi-cação e decodificação de sinal de fala e tom do tipo CELP, mas a presenteinvenção também pode ser aplicada para o caso onde a seção de codifica-ção e a seção de decodificação adota um método de codificação e decodifi-cação de sinal de fala e tom sem ser do tipo CELP (por exemplo, modulaçãode codificação de pulso, codificação prevista, quantização de vetor, vocoder(dispositivo de análise e sintetização da voz humana)), e pode obter o mes-mo efeito de operação como o dessa modalidade. Além disso, a presenteinvenção também pode ser aplicada para o caso no qual o método de codifi-cação e decodificação do sinal de fala e tom é diferente entre as seções decodificação e seções de decodificação e pode obter o mesmo efeito de ope-ração como o dessa modalidade.
A figura 7 é um diagrama de bloco que apresenta uma configu-ração do aparelho de transmissão do sinal de fala e tom de acordo com amodalidade 2 da presente invenção que compreende o aparelho de codifica-ção descrito na modalidade 1 acima descrita.
O sinal de fala e tom 701 é convertido a um sinal elétrico peloaparelho de entrada 702 e enviado para um aparelho de conversão A/D 703.O aparelho de conversão A/D 703 converte o sinal (análogo) enviado a partirdo aparelho de entrada 702 para um sinal digital e envia o sinal digital para oaparelho de codificação de sinal de fala e tom 704. O aparelho de codifica-ção de sinal de fala e tom 704 possui o aparelho de codificação 100 apre-sentado na figura 1, codifica o sinal digital de fala e tom enviado a partir doaparelho de conversão A/D 703 e fornece a informação codificada para oaparelho de modulação RF 705. O aparelho de modulação RF 705 convertea informação codificada enviada a partir do aparelho de codificação de sinalde fala e tom 704 para um sinal a ser transmitido em meio de propagação talcomo ondas de rádio e envia o sinal para a antena de transmissão 706. Aantena de transmissão 706 transmite o sinal de saída enviado a partir doaparelho de modulação RF 705 como uma onda de rádio (sinal RF). O sinalRF 707 na figura 7 indica a onda de rádio (sinal RF) transmitida a partir daantena de transmissão 706.
A figura 8 é um diagrama de bloco que apresenta uma configu-ração do aparelho receptor de sinal de fala e tom de acordo com a modali-dade 2 da presente invenção que compreende o aparelho de decodificaçãodescrito na modalidade 1 descrita acima.
O sinal RF 801 é recebido pela antena de recepção 802 e envia-do para o aparelho de demodulação RF 803. O sinal RF 801 na figura 8 indi-ca a onda de rádio recebida pela antena de recepção 802 e é idêntica aosinal RF 707 se o sinal não for atenuado ou o ruído não for sobreposto aosinal no canal.
O aparelho de demodulação RF 803 demodula a informação co-dificada a partir do sinal RF enviado da antena receptora 802 e envia o resul-tado para o aparelho de decodificação de sinal de fala e tom 804. O aparelhode decodificação de sinal de fala e tom 804 possui o aparelho de decodifica-ção 150 apresentado na figura 1, decodifica um sinal de fala e tom a partirda informação codificada enviada a partir do aparelho de demodulação RF803 e envia o sinal de fala e tom para o aparelho de conversão D/A 805. Oaparelho de conversão D/A 805 converte o sinal digital de fala e tom enviadoa partir de um aparelho de decodificação de sinal de fala e tom 804 para umsinal elétrico análogo e envia o sinal para o aparelho de saída 806. O apare-lho de transmissão 806 converte o sinal elétrico a uma vibração de ar e en-via a vibração de ar como ondas de som defnodo a ser audível pelo ouvidohumano. Na figura 8, o número de referência 807 indica as ondas de somenviadas.
Ao estabelecer o aparelho de transmissão de sinal de fala e tomacima descrito e o aparelho receptor de sinal de fala e tom para o aparelhode estação base para o aparelho terminal de comunicação em um sistemade comunicação sem fio é possível obter um sinal de saída com alta qualidade.
Desse modo, de acordo com esta modalidade, o aparelho decodificação e o aparelho de decodificação de acordo com a presente inven-ção podem ser estabelecidos para um aparelho de transmissão de sinal defala e tom e um aparelho de recepção de sinal de fala e tom.
O aparelho de codificação e o aparelho de decodificação de a-cordo com a presente invenção não estão limitados às modalidades 1 e 2acima descritas e podem ser executadas pelo fato de efetuar várias modifi-cações.
O aparelho de codificação e o aparelho de decodificação de a-cordo com a presente invenção podem ser estabelecidos para um aparelhode terminal móvel e um aparelho de estação base em um sistema de comu-nicação móvel e por meio disso é possível estabelecer um aparelho de ter-minal móvel e um aparelho de estação base que têm o mesmo efeito de o-peração conforme acima descrito.
Aqui , foi descrito um caso como um exemplo onde a presenteinvenção é executada com componentes físicos, mas a presente invençãopode ser executada com programas de computador.
A presente aplicação está baseada no Pedido de Patente Japo-nês n9 2005-138151, depositada em 11 de maio de 2005, cujo teor completoda qual está expressamente incorporado por referência no presente documento.
Aplicabilidade industrial
A presente invenção fornece uma vantagem pelo fato de obter um sinal defala decodificado com alta qualidade mesmo quando há características úni-cas a um aparelho de codificação e é adequado para uso como um aparelhode codificação e um aparelho de decodificação em um sistema de comuni-cação onde um sinal de fala e tom é codificado e transmitido.

Claims (12)

1. Aparelho de codificação que efetua uma codificação redi-mensionável em um sinal de entrada, que compreende:uma primeira seção de codificação que codifica o sinal de entra-da e gera uma primeira informação codificada;uma primeira seção de decodificação que decodifica a primeirainformação codificada e gera um primeiro sinal decodificado;uma seção de ajuste que ajusta o primeiro sinal decodificadopela convolução do primeiro sinal decodificado e um impulso-resposta parauso de ajuste;uma seção de retardo que retarda o sinal de entrada em sincro-nização com o primeiro sinal decodificado ajustado;uma seção de adição que calcula um sinal residual que é a dife-rença entre o sinal de entrada retardado e o primeiro sinal decodificado ajus-tado; euma segunda seção de codificação que codifica o sinal residuale gera a segunda informação codificada.
2. Aparelho de codificação que efetua uma codificação redimen-síonável em um sinal de entrada, que compreende:uma seção de conversão de freqüência que efetua uma amos-tragem de taxa reduzida do sinal de entrada;uma primeira seção de codificação que codifica o sinal de entra-da de amostragem de taxa reduzida e gera uma primeira informação codifi-cada;uma primeira seção de decodificação que decodifica a primeirainformação codificada e gera um primeiro sinal decodificado;uma seção de conversão de freqüência que efetua uma amos-tragem de taxa aumentada do primeiro sinal decodificado;uma seção de ajuste que ajusta o primeiro sinal decodificado deamostragem de taxa aumentada pela convolução do primeiro sinal decodifi-cado de amostragem de taxa aumentada e um impulso-resposta para uso deajuste;uma seção de retardo que retarda o sinal de entrada que estáem sincronização com o primeiro sinal decodificado ajustado;uma seção de adição que calcula um sinal residual que compre-ende a diferença entre o sinal de entrada retardado e o primeiro sinal decodi-ficado ajustado; euma segunda seção de codificação que codifica o sinal residuale gera a segunda informação codificada.
3. Aparelho de codificação de acordo com a reivindicação 1, emque o impulso-resposta para uso de ajuste é calculado por averiguação.
4. Aparelho de decodificação que decodifica a informação codifi-cada enviada a partir do aparelho de codificação como definido na reivindi-cação 1, o aparelho de decodificação compreendendo:uma primeira seção de decodificação que decodifica a primeirainformação codificada e gera um primeiro sinal decodificado;uma segunda seção de decodificação que decodifica a segundainformação codificada e gera um segundo sinal decodificado;uma seção de ajuste que ajusta o primeiro sinal decodificadopela convolução do primeiro sinal decodificado e um impulso-resposta parauso de ajuste;uma seção de adição que adiciona o primeiro sinal decodificadoajustado e o segundo sinal decodificado; euma seção de seleção de sinal que seleciona e envia um dosprimeiros sinais decodificados gerados pela primeira seção de decodificaçãoe o resultado da adição da seção de adição.
5. Aparelho de decodificação que decodifica a informação envia-da a partir do aparelho de codificação como definido na reivindicação 2, oaparelho de decodificação compreendendo:uma primeira seção de decodificação que decodifica a primeirainformação codificada e gera um primeiro sinal decodificado;uma segunda seção de decodificação que decodifica a segundainformação codificada e gera um segundo sinal decodificado;uma seção de conversão de freqüência que efetua a amostra-gem de taxa aumentada do primeiro sinal decodificado;uma seção de ajuste que ajusta o primeiro sinal decodificado deamostragem de taxa aumentada pela convolução do primeiro sinal decodifi-cado e um impulso-resposta para uso de ajuste;uma seção de adição que adiciona o primeiro sinal decodificadoajustado e o segundo sinal decodificado; euma seção de seleção de sinal que seleciona e envia um dosprimeiros sinais decodificados gerados pela primeira seção de decodificaçãoe o resultado da adição da seção de adição.
6. Aparelho de decodificação de acordo com a reivindicação 4,em que o impulso-resposta para uso de ajuste é calculado por averiguação.
7. Aparelho de estação base que compreende o aparelho de co-dificação como definido na reivindicação 1.
8. Aparelho de estação base que compreende o aparelho dedecodificação de acordo com a reivindicação 4.
9. Aparelho terminal de comunicação que compreende o apare-lho de codificação como definido na reivindicação 1.
10. Aparelho terminal de comunicação que compreende o apa-relho de decodificação como definido na reivindicação 4.
11. Método de codificação para efetuar a codificação redimen-sionável de um sinal de entrada, que compreende:uma primeira etapa de codificação de codificação do sinal deentrada e geração da primeira informação codificada;uma primeira etapa de decodificação de decodificação da pri-meira informação codificada e a geração de um primeiro sinal decodificado;uma etapa de ajuste de ajuste do primeiro sinal decodificadopor convolução do primeiro sinal decodificado e um impulso-resposta parauso de ajuste;uma etapa de retardo de retardo do sinal de entrada de retardoem sincronização com o primeiro sinal decodificado ajustado;uma etapa de adição de cálculo de um sinal residual que com-preende uma diferença entre o sinal de entrada retardado e o primeiro sinaldecodificado ajustado; euma segunda etapa de codificação de codificação do sinal re-sidual e geração da segunda informação codificada.
12. Método de decodificação de decodificação da informaçãocodificada pelo método de codificação como definido na reivindicação 11, ométodo de decodificação compreendendo:uma primeira etapa de decodificação de decodificação daprimeira informação codificada e a geração de um primeiro sinal decodificado;uma segunda etapa de decodificação de decodificaçãoda segunda informação codificada e a geração de um segundo sinal decodi-ficado;uma etapa de ajuste de ajuste do primeiro sinal decodifi-cado por convolução do primeiro sinal decodificado e um impulso-respostapara uso de ajuste;uma etapa de adição de adição do primeiro sinal decodi-ficado ajustado e o segundo sinal decodificado; euma etapa de seleção de sinal de seleção e envio de um dos primeiros si-nais decodificados gerados na primeira etapa de decodificação e o resultadoda adição da seção de adição.
BRPI0611430-0A 2005-05-11 2006-04-28 codificador, decodificador e seus métodos BRPI0611430A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005-138151 2005-05-11
JP2005138151 2005-05-11
PCT/JP2006/308940 WO2006120931A1 (ja) 2005-05-11 2006-04-28 符号化装置、復号化装置及びこれらの方法

Publications (1)

Publication Number Publication Date
BRPI0611430A2 true BRPI0611430A2 (pt) 2010-11-23

Family

ID=37396440

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0611430-0A BRPI0611430A2 (pt) 2005-05-11 2006-04-28 codificador, decodificador e seus métodos

Country Status (7)

Country Link
US (1) US7978771B2 (pt)
EP (1) EP1881488B1 (pt)
JP (1) JP4958780B2 (pt)
CN (1) CN101176148B (pt)
BR (1) BRPI0611430A2 (pt)
DE (1) DE602006018129D1 (pt)
WO (1) WO2006120931A1 (pt)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4771674B2 (ja) * 2004-09-02 2011-09-14 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
JP5116677B2 (ja) * 2006-08-22 2013-01-09 パナソニック株式会社 軟出力復号器、反復復号装置、及び軟判定値算出方法
JP4871894B2 (ja) 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
RU2439721C2 (ru) * 2007-06-11 2012-01-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Аудиокодер для кодирования аудиосигнала, имеющего импульсоподобную и стационарную составляющие, способы кодирования, декодер, способ декодирования и кодированный аудиосигнал
CN101989429B (zh) * 2009-07-31 2012-02-01 华为技术有限公司 转码方法、装置、设备以及系统
KR101696632B1 (ko) 2010-07-02 2017-01-16 돌비 인터네셔널 에이비 선택적인 베이스 포스트 필터
AU2015200065B2 (en) * 2010-07-02 2016-10-20 Dolby International Ab Post filter, decoder system and method of decoding
JP5492139B2 (ja) 2011-04-27 2014-05-14 富士フイルム株式会社 画像圧縮装置、画像伸長装置、方法、及びプログラム
KR102138320B1 (ko) * 2011-10-28 2020-08-11 한국전자통신연구원 통신 시스템에서 신호 코덱 장치 및 방법
WO2013108343A1 (ja) * 2012-01-20 2013-07-25 パナソニック株式会社 音声復号装置及び音声復号方法
US10115410B2 (en) * 2014-06-10 2018-10-30 Peter Graham Craven Digital encapsulation of audio signals
CN112786001B (zh) * 2019-11-11 2024-04-09 北京地平线机器人技术研发有限公司 语音合成模型训练方法、语音合成方法和装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1085466C (zh) * 1993-09-14 2002-05-22 株式会社金星社 图象解码器中包括半象素单元运动补偿装置的b帧处理装置
JPH1097295A (ja) 1996-09-24 1998-04-14 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法及び復号化方法
KR100938017B1 (ko) 1997-10-22 2010-01-21 파나소닉 주식회사 벡터 양자화 장치 및 방법
KR100351484B1 (ko) 1998-06-09 2002-09-05 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치, 음성 복호화 장치, 음성 부호화 방법 및 기록 매체
JP2000305599A (ja) * 1999-04-22 2000-11-02 Sony Corp 音声合成装置及び方法、電話装置並びにプログラム提供媒体
AUPQ941600A0 (en) * 2000-08-14 2000-09-07 Lake Technology Limited Audio frequency response processing sytem
US7599835B2 (en) * 2002-03-08 2009-10-06 Nippon Telegraph And Telephone Corporation Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program
JP2003280694A (ja) * 2002-03-26 2003-10-02 Nec Corp 階層ロスレス符号化復号方法、階層ロスレス符号化方法、階層ロスレス復号方法及びその装置並びにプログラム
WO2003091989A1 (en) 2002-04-26 2003-11-06 Matsushita Electric Industrial Co., Ltd. Coding device, decoding device, coding method, and decoding method
JP3881946B2 (ja) * 2002-09-12 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
WO2004097796A1 (ja) 2003-04-30 2004-11-11 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置及びこれらの方法
US7693707B2 (en) 2003-12-26 2010-04-06 Pansonic Corporation Voice/musical sound encoding device and voice/musical sound encoding method
JP3598111B2 (ja) 2004-04-09 2004-12-08 三菱電機株式会社 広帯域音声復元装置
JP4445328B2 (ja) 2004-05-24 2010-04-07 パナソニック株式会社 音声・楽音復号化装置および音声・楽音復号化方法

Also Published As

Publication number Publication date
JP4958780B2 (ja) 2012-06-20
EP1881488A4 (en) 2008-12-10
EP1881488B1 (en) 2010-11-10
WO2006120931A1 (ja) 2006-11-16
CN101176148A (zh) 2008-05-07
DE602006018129D1 (de) 2010-12-23
JPWO2006120931A1 (ja) 2008-12-18
US7978771B2 (en) 2011-07-12
EP1881488A1 (en) 2008-01-23
CN101176148B (zh) 2011-06-15
US20090016426A1 (en) 2009-01-15

Similar Documents

Publication Publication Date Title
BRPI0611430A2 (pt) codificador, decodificador e seus métodos
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
JP5413839B2 (ja) 符号化装置および復号装置
US7983904B2 (en) Scalable decoding apparatus and scalable encoding apparatus
EP1818911B1 (en) Sound coding device and sound coding method
US7840402B2 (en) Audio encoding device, audio decoding device, and method thereof
JP5153791B2 (ja) ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法
RU2713605C1 (ru) Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио
US20080297380A1 (en) Signal decoding apparatus and signal decoding method
JP4263412B2 (ja) 音声符号変換方法
WO2004097796A1 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP3881946B2 (ja) 音響符号化装置及び音響符号化方法
JP4445328B2 (ja) 音声・楽音復号化装置および音声・楽音復号化方法
JPWO2006025313A1 (ja) 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法
US8036390B2 (en) Scalable encoding device and scalable encoding method
JP4842147B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
JP4236675B2 (ja) 音声符号変換方法および装置
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP4373693B2 (ja) 音響信号の階層符号化方法および階層復号化方法
RU2776261C1 (ru) Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио

Legal Events

Date Code Title Description
B11A Dismissal acc. art.33 of ipl - examination not requested within 36 months of filing
B11Y Definitive dismissal - extension of time limit for request of examination expired [chapter 11.1.1 patent gazette]
B15K Others concerning applications: alteration of classification

Ipc: G10L 19/24 (2013.01)