BR112016003291B1 - Dispositivos e métodos de processamento de sinal de áudio - Google Patents

Dispositivos e métodos de processamento de sinal de áudio Download PDF

Info

Publication number
BR112016003291B1
BR112016003291B1 BR112016003291-8A BR112016003291A BR112016003291B1 BR 112016003291 B1 BR112016003291 B1 BR 112016003291B1 BR 112016003291 A BR112016003291 A BR 112016003291A BR 112016003291 B1 BR112016003291 B1 BR 112016003291B1
Authority
BR
Brazil
Prior art keywords
isf
discontinuity
lsf
parameters
audio
Prior art date
Application number
BR112016003291-8A
Other languages
English (en)
Other versions
BR112016003291A8 (pt
Inventor
Kimitaka Tsutsumi
Kei Kikuiri
Atsushi Yamaguchi
Original Assignee
Ntt Docomo, Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ntt Docomo, Inc filed Critical Ntt Docomo, Inc
Priority to BR122017020760-1A priority Critical patent/BR122017020760B1/pt
Publication of BR112016003291A8 publication Critical patent/BR112016003291A8/pt
Publication of BR112016003291B1 publication Critical patent/BR112016003291B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/135Vector sum excited linear prediction [VSELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0078Avoidance of errors by organising the transmitted data in a format specifically designed to deal with errors, e.g. location
    • H04L1/0085Formatting with cells
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Circuits Of Receivers In General (AREA)
  • Time-Division Multiplex Systems (AREA)

Abstract

dispositivos e métodos de processamento de sinal de áudio. a presente invenção refere-se a um dispositivo de processamento de sinal de áudio que compreende um detector de descontinuidade configurado para determinar uma ocorrência de uma descontinuidade de um aumento repentino de uma amplitude de áudio decodificado obtida ao decodificar o primeiro pacote de áudio que é recebido de maneira correta depois de uma ocorrência de uma perda de pacote, e um corretor de descontinuidade para corrigir a descontinuidade do áudio decodificado.

Description

Campo Técnico
[0001] A presente invenção refere-se a um dispositivo de processamento de sinal de áudio, a um método de processamento de sinal de áudio e a um programa de processamento de sinal de áudio para o processamento de um sinal de áudio.
Antecedentes da Invenção
[0002] Na transmissão de um sinal de áudio codificado e em pacote através de uma rede de Internet com um telefone de IP (Protocolo de Internet), um pacote pode ser perdido, devido a um congestionamento da rede ou similares (esse fenômeno será chamado a partir daqui de "perda de pacote"). Com uma ocorrência de uma perda de pacote, os códigos de áudio necessário são perdidos resultando em uma falha na decodificação de áudio, causando assim uma descontinuidade do áudio. Uma tecnologia para a prevenção de uma descontinuidade de áudio causada por uma perda de pacote é uma tecnologia de ocultação de perda de pacote de áudio. A tecnologia de ocultação de perda de pacote de áudio é desenvolvida para detectar uma perda de pacote e gerar um pseudosinal de áudio que corresponde ao pacote perdido (que será chamado a partir daqui de "sinal de ocultação").
[0003] Quando uma técnica de codificação de áudio usada é uma técnica para realizar a codificação de áudio ao atualizar os estados internos de codificador/decodificador, os parâmetros de codificação a serem recebidos originalmente não são obtidos e assim, a tecnologia de ocultação de perda de pacote de áudio inclui realizar uma atualização dos estados internos do decodifica- dor pelo uso dos parâmetros gerados de modo artificial, também.
[0004] A codificação de CELP (Predição Linear Excitada de Código) é amplamente usada como uma técnica para realizar a codificação de áudio, ao atualizar os estados internos de codificador/decodificador. Na codificação de CELP, um modelo autorregressivo é presumido, e um sinal de excitação e(n) é filtrado por um filtro de síntese todo em polo a(i) para sintetizar um sinal de áudio. Ou seja, o sinal de áudio s(n) é sintetizado de acordo com a equação abaixo. Na equação abaixo, a(i) representa os coeficientes de predição linear (coeficientes de LP (Predição Linear)) e o grau a ser usado é um valor, como P=16.Equação Matemática 1
Figure img0001
[0005] Na codificação de CELP, os estados internos armazenados incluem parâmetros de ISF (Frequência Espectral de Imitância) como a representação equivalente de maneira matemática dos coeficientes de predição linear, e um sinal de excitação anterior. Com uma ocorrência de uma perda de pacote, esses são gerados de maneira artificial, e surge um desvio dos parâmetros originais que seriam obtidas pela decodificação. Uma inconsistência de um áudio sintetizado causada por um desvio dos parâmetros é percebida como um ruído por um ouvinte, o que degrada significativamente a qualidade subjetiva.
[0006] Os parágrafos abaixo irão descrever uma configuração e uma operação de um decodificador de áudio para executar a ocultação de perda de pacote de áudio, com o uso de um exemplo em que a codificação de CELP é usada como a técnica de codificação de áudio.
[0007] Um diagrama de configuração e uma operação do decodi- ficador de áudio são mostrados na Figura 1 e na Figura 2. Como mostrado na Figura 1, um decodificador de áudio 1 tem uma detector de perda de pacote 11, um decodificador de código de áudio 12, um gerador de sinal de ocultação 13, e um buffer de estado interno 14.
[0008] O detector de perda de pacote 11, ao receber um pacote de áudio corretamente, envia um sinal de controle, e os códigos de áudio incluídos no pacote de áudio, ao decodificador de código de áudio 12 (recepção normal: SIM na etapa S100 na Figura 2). Consequentemente, o decodificador de código de áudio 12 realiza a decodificação dos códigos de áudio e a atualização dos estados internos, conforme descrito abaixo (etapas S200 e S400 na Figura 2). Por outro lado, o detector de perda de pacote 11, ao falhar na recepção de um pacote de áudio corretamente, envia um sinal de controle ao gerador de sinal de ocultação 13 (perda de pacote: NÃO na etapa S100 na Figura 2). Consequentemente, o gerador de sinal de ocultação 13 gera um sinal de ocultação e atualiza os estados internos conforme descrito abaixo (etapas S300 e S400 na Figura 2). Os processos das etapas S100 a S400 na Figura 2 são repetidos até o fim da comunicação (ou até que a etapa S500 resulte em uma determinação de SIM).
[0009] Os códigos de áudio incluem pelo menos os parâmetros de ISF codificadosEquação Matemática 2
Figure img0002
atrasos de intervalo codificados Tjp dos primeiro ao quarto subquadros, ganhos de livro código adaptativos codificados gjp dos primeiro ao quarto subquadros, ganhos de livro código fixos codificados gjc dos primeiro ao quarto subquadros, e vetores de livro código fixos codificados cj(n) dos primeiro ao quarto subquadros. Os parâmetros de ISF podem ser substituídos pelos parâmetros de LSF (frequência espectral de linha) que são a representação equivalente de forma matemática dos mesmos. Embora a discussão abaixo utilize os parâmetros de ISF, a mesma discussão também pode ser verdade para o caso de usar os parâmetros de LSF.
[00010] O buffer de estado interno inclui os últimos parâmetros de ISFEquação Matemática 3
Figure img0003
e, como a representação equivalente deEquação Matemática 4
Figure img0004
parâmetros de ISP (Par Espectral de Imitância)Equação Matemática 5
Figure img0005
parâmetros residuais de ISFEquação Matemática 6
Figure img0006
os últimos atrasos de intervalo Tjp, os últimos ganhos de livro código adaptativos gjp, os últimos ganhos de livro código fixos gjc e um livro código adaptativo u(n). É determinado, dependendo do princípio de design, quantos subquadros dos últimos parâmetros devem ser incluídos. Presume-se, no presente relatório descritivo, que um quadro inclui quatro subquadros, mas outro valor pode ser adotado dependendo do princípio de design.
Caso de Recepção Normal
[00011] A Figura 3 mostra uma configuração funcional de exemplo do decodificador de código de áudio 12. Como mostrado nessa Figura 3, o decodificador de código de áudio 12 tem um decodificador de ISF 120, um processador de estabilidade 121, uma calculadora de coeficiente de LP 122, uma calculadora de livro código adaptativo 123, um decodificador de livro código fixo 124, um decodificador de ganho 125, um sintetizador de vetor de excitação 126, um pós-filtro 127 e um filtro de síntese 128. Deve-se observar, no entanto, que o pós-filtro 127 não é um elemento constitutivo indispensável. Na Figura 3, por conveniência de explicação, o buffer de estado interno 14 é indicado por uma linha pontilhada dupla dentro do decodificador de código de áudio 12. No entanto, o buffer de estado interno 14 não é incluído dentro do decodi- ficador de código de áudio 12, mas é, de fato, o próprio buffer de estado interno 14 mostrado na Figura 1. O mesmo também acontece nos diagramas de configuração do decodificador de código de áudio a partir daqui.
[00012] Um diagrama de configuração da calculadora de coeficiente de LP 122 é mostrado na Figura 4 e um fluxo de processamento de cálculo de coeficientes de LP a partir dos parâmetros de ISF codificados é mostrado na Figura 5. Como mostrado na Figura 4, a calculadora de coeficiente de LP 122 tem um conversor de ISF-ISP 122A, um inter- polador de ISP 122B e um conversor de ISP-LPC 122C.
[00013] Primeiro, descreve-se uma configuração funcional e sua operação associada ao processo para calcular os coeficientes de LP a partir dos parâmetros de ISF codificados (figura5).
[00014] O decodificador de ISF 120 decodifica os parâmetros de ISF codificados para obter os parâmetros residuais de ISFEquação Matemática 7
Figure img0007
e calcula os parâmetros de ISF.Equação Matemática 8
Figure img0008
de acordo com a equação a seguir (etapa S1 na Figura 5). Aqui, médio i representa os vetores médios obtidos com antecedência por aprendizado ou similares. Equação Matemática 9
Figure img0009
[00015] O exemplo do uso de predição MA para o cálculo dos parâmetros de ISF é descrito aqui, mas também é possível adotar uma configuração para executar o cálculo dos parâmetros de ISF com o uso de uma predição AR, conforme descrito abaixo. Aqui, os parâmetros de ISF do quadro imediatamente precedente são indicados porEquação Matemática 10
Figure img0010
e fatores de peso da predição AR por pi.Equação Matemática 11
Figure img0011
[00016] O processador de estabilidade 121 realiza um processo de acordo com a equação abaixo de modo a posicionar uma distância de não menos de 50 Hz entre os elementos dos parâmetros de ISF a fim de garantir a estabilidade do filtro (etapa S2 na Figura 5). Os parâmetros de ISF são indicativos de um espectro de linha que representa o formato de um envelope de espectro de áudio, e à medida que a distância entre eles se torna mais curta, os picos do espectro se tornam maiores, causando a ressonância. Por esse motivo, o processo para garantir a estabilidade se torna necessário para evitar que os ganhos se tornem muito grandes nos picos do espectro. Aqui, min_dist representa uma distância de ISF mínima, e isf_min representa um mínimo de ISF necessário para garantir uma distância de min_dist. isf_min é atualizado de maneira sucessiva ao adicionar a distância de min_dist para um valor de ISF vizinho. Por outro lado, isf_max representa um máximo de ISF necessário para garantir a distância de min_dist. isf_max é atualizado de maneira sucessiva ao subtrair a distância de min_dist de um valor de ISF vizinho.Equação Matemática 12
Figure img0012
[00017] O conversor de ISF-ISP 122A na calculadora de coeficiente de LP 122 converteEquação Matemática 13
Figure img0013
em parâmetros de ISPEquação Matemática 14
Figure img0014
de acordo com a equação a seguir (etapa S3 na Figura 5).Aqui, C é uma constante determinada com antecedência.Equação Matemática 15
Figure img0015
[00018] O interpolador de ISP 122B calcula os parâmetros de ISP para os respectivos subquadros a partir dos últimos parâmetros de ISP Equação Matemática 16
Figure img0016
incluído no buffer de estado interno 14 e nos parâmetros de ISP supracitadosEquação Matemática 17
Figure img0017
de acordo com a equação abaixo (etapa S4 na Figura 5). Outros coeficientes podem ser usados para a interpolação.Equação Matemática 18
Figure img0018
[00019] O conversor de ISP-LPC 122C converte os parâmetros de ISP para os respectivos subquadros em coeficientes de LP Equação Matemática 19
Figure img0019
(etapa S5 na Figura 5). Um procedimento de conversão específico a ser usado pode ser o procedimento de processamento descrito na literatura de não patente 1. O número de subquadros incluído em um sinal de antecipação é presumido ser 4 aqui, mas o número de subquadros pode ser diferente, dependendo do princípio de design.
[00020] A seguir, descreve-se outras configurações e operações no decodificador de código de áudio 12.
[00021] A calculadora de livro código adaptativo 123 decodifica os atrasos de intervalo codificados para calcular os atrasos de intervalo TjP dos primeiro ao quarto subquadros. Em seguida, a calculadora de livro código adaptativo 123 usa o livro código adaptativo u(n) para calcular os vetores de livro código adaptativo para os respectivos subquadros de acordo com a equação abaixo. Os vetores de livro código adaptativo são calculados ao interpolar o livro código adaptativo u(n) por um filtro de FIR Int(i). Aqui, o comprimento do livro código adaptativo é indicado por Nadapt. O filtro Int(i) usado para a interpolação é um filtro de FIR com um comprimento predeterminado 2l + 1, e L' apresenta o número da amostra dos subquadros. Ao usar o filtro de interpolação Int(i), os atrasos de intervalo podem ser utilizados para a precisão das casas decimais. Para os detalhes do filtro de interpolação, o método descrito na literatura de não patente 1 pode ser referenciado.Equação Matemática 20
Figure img0020
[00022] O decodificador de livro código fixo 124 decodifica os vetores de livro código fixos codificados para adquirir os vetores de livro código fixo cj(n) dos primeiro ao quarto subquadros.
[00023] O decodificador de ganho 125 decodifica os ganhos de livro código adaptativos codificados e os ganhos de livro código fixos codificados para adquirir os ganhos de livro código adaptativos e os ganhos de livro código fixos dos primeiro ao quarto subquadros. Por exemplo, a decodificação dos ganhos de livro código adaptativos e dos ganhos de livro código fixos pode ser realizada, por exemplo, pela técnica abaixo descrita na literatura de não patente 1. Uma vez que a técnica abaixo descrita na literatura de não patente 1 não usa a predição de interqua- dro como usada na codificação de ganho de AMR-WB, ela pode acentuar a resistência de perda de pacote.
[00024] Por exemplo, o decodificador de ganho 125 adquire o ganho de livro código fixo de acordo com o fluxo de processamento abaixo.
[00025] Primeiro, o decodificador de ganho 125 calcula a energia do vetor de livro código fixo. Aqui, o comprimento do subquadro é definido como Ns. Equação Matemática 21
Figure img0021
[00026] A seguir, o decodificador de ganho 125 decodifica o parâmetro de ganho quantificado de vetor para adquirir o ganho de livro código adaptativoEquação Matemática 22
Figure img0022
e o ganho de livro código fixo quantificadoEquação Matemática 23
Figure img0023
[00027] Ele, em seguida, calcula um ganho de livro código fixo pre- ditivo conforme descrito abaixo a partir do ganho de livro código fixo quantificado e da energia supracitada do vetor de livro código fixo.Equação Matemática 24
Figure img0024
[00028] Por fim, o decodificador de ganho 125 decodifica o coeficiente de previsãoEquação Matemática 25
Figure img0025
e o multiplica pelo ganho de predição para adquirir o ganho de livro código fixo.Equação Matemática 26
Figure img0026
[00029] O sintetizador de vetor de excitação 126 multiplica o vetor de livro código adaptativo pelo ganho de livro código adaptativo e multiplica o vetor de livro código fixo pelo ganho de livro código fixo e calcula a soma deles para adquirir o sinal de excitação, como expresso pela equação a seguir.Equação Matemática 27
Figure img0027
[00030] O pós-filtro 127 submete os vetores de sinal de excitação, por exemplo, ao pós-processos, como os processos de aumento de intervalo, aumento de ruído e aumento de baixa frequência. O aumento de intervalo, o aumento de ruído e o aumento de baixa frequência podem ser realizados pelo uso das técnicas descritas na literatura de não patente 1.
[00031] O filtro de síntese 128 sintetiza um sinal decodificado com o sinal de excitação como uma fonte de áudio de acionamento, pelo filtro inverso de predição linear.Equação Matemática 28
Figure img0028
[00032] Se uma pré-acentuação for feita no codificador, uma desa- centuação é realizada.Equação Matemática 29
Figure img0029
[00033] Por outro lado, se uma pré-acentuação não for feita no codificador, uma desacentuação não é realizada.
[00034] Os parágrafos abaixo irão descrever a operação com relação à atualização de estado interno.
[00035] A fim de interpolar o parâmetro mediante uma ocorrência de perda de pacote, a calculadora de coeficiente de LP 122 atualiza os estados internos dos parâmetros de ISF pelos vetores calculados pela equação a seguir.Equação Matemática 30
Figure img0030
[00036] Aqui, wi(-j) representa os quadros de parâmetros de ISF j antes, que são armazenados no buffer. wiC representa os parâmetros de ISF em intervalos de discurso obtidos com antecedência por aprendizado ou similares. β é uma constante e pode ser um valor de, por exemplo, 0,75, ao qual o valor não é necessariamente limitado. wiC e βpodem ser variados por um índice para expressar uma propriedade de um quadro alvo de codificação, por exemplo, como na ocultação de ISF descrita na literatura de não patente 1.
[00037] Além disso, a calculadora de coeficiente de LP 122 também atualiza os estados internos dos parâmetros residuais de ISF de acordocom a equação a seguir.Equação Matemática 31
Figure img0031
[00038] O sintetizador de vetor de excitação 126 atualiza os estados internos pelos vetores de sinal de excitação de acordo com a equação abaixo.Equação Matemática 32
Figure img0032
[00039] Além disso, o sintetizador de vetor de excitação 126 atualiza os estados internos dos parâmetros de ganho pela equação a seguir.Equação Matemática 33
Figure img0033
[00040] A calculadora de livro código adaptativo 123 atualiza os estados internos dos parâmetros dos atrasos de intervalo pela equação a seguir.Equação Matemática 34
Figure img0034
[00041] A faixa de j é definida como (-2 < j < Mla), mas os valores diferentes podem ser selecionados como a faixa de j, dependendo do princípio de design.Caso de Perda de Pacote
[00042] A Figura 6 mostra uma configuração funcional de exemplo do gerador de sinal de ocultação 13. Como mostrado nessa Figura 6, o gerador de sinal de ocultação 13 tem um interpolador de coeficiente de LP 130, um interpolador de atraso de intervalo 131, um interpolador de ganho 132, um gerador de sinal de ruído 133, um pós-filtro 134, um filtro de síntese 135, uma calculadora de livro código adaptativo 136 e um sintetizador de vetor de excitação 137. Deve-se observar, no entanto, que o pós-filtro 134 não é um elemento constitutivo indispensável.
[00043] O interpolador de coeficiente de LP 130 calculaEquação Matemática 35
Figure img0035
pela equação a seguir. Com relação a isso, wi(-j) representaos quadros de parâmetros de ISF j antes, que são armazenados no buffer.Equação Matemática 36
Figure img0036
[00044] Nessa equação,Equação Matemática 37
Figure img0037
representa os estados internos dos parâmetros de ISF cal- culados mediante a recepção normal de um pacote. α também é uma constante e pode ser um valor de, por exemplo, 0,9 ao qual o valor não é necessariamente limitado. α pode ser variado por um índice para expressar uma propriedade de um quadro alvo de codificação, por exemplo, como na ocultação de ISF descrito na literatura de não patente 1.
[00045] O procedimento da obtenção dos coeficientes de LP a partir dos parâmetros de ISF é o mesmo que o realizado no caso de recepção normal de um pacote.
[00046] O interpolador de atraso de intervalo 131 usa os parâmetros de estado interno sobre os atrasos de intervaloEquação Matemática 38
Figure img0038
para calcular os valores previstos dos atrasos de intervalo Equação Matemática 39
Figure img0039
[00047] Um procedimento de processamento específico a ser usado pode ser a técnica apresentada na literatura de não patente 1 ■
[00048] A fim de interpolar os ganhos de livro código fixos, o inter- polador de ganho 132 pode usar a técnica de acordo com a equação abaixo, como descrito na literatura de não patente 1.Equação Matemática 40
Figure img0040
[00049] O gerador de sinal de ruído 133 gera o ruído branco para o mesmo comprimento que os vetores de livro código fixo e utiliza o ruído resultante para os vetores de livro código fixo.
[00050] As operações do pós-filtro 134, do filtro de síntese 135, da calculadora de livro código adaptativo 136 e do sintetizador de vetor de excitação 137 são iguais àquelas no caso supracitado de recepção normal de um pacote.
[00051] A atualização de estado interno é a mesma que a realizada no caso de recepção normal de um pacote, exceto para uma atualização dos parâmetros residuais de ISF. A atualização dos parâmetros de ISF é realizada de acordo com a equação a seguir pelo interpolador de coeficiente de LP 130.Equação Matemática 41
Figure img0041
Lista de Citação Literaturas de Patente
[00052] Literatura de patente 1: publicação internacional WO2002/035520
[00053] Literatura de patente 2: publicação internacional WO2008/108080
Literatura de Não Patente
[00054] Literatura de Não Patente 1: recomendação ITU-T G.718, junho de 2008
Sumário da Invenção Problema Técnico
[00055] Como descrito acima, uma vez que a codificação de CELP envolve os estados internos, uma degradação da qualidade de áudio ocorre devido a um desvio entre os parâmetros obtidos pelas interpolações utilizadas mediante uma perda de pacote e os parâmetros que seriam usados para a decodificação. Particularmente, quanto aos parâmetros de ISF, a codificação preditiva intraquadro/interquadro é realizada e assim, há o problema de que uma influência por uma perda de pacote continua mesmo depois da recuperação da perda de pacote.
[00056] De maneira mais específica, um problema de um aumento repentino de energia é identificado no primeiro quadro depois da recuperação de uma perda de pacote que ocorre próximo a uma parte de início de áudio. Isso é causado pela seguinte razão: ou seja, na parte de início de áudio onde a energia do sinal de excitação se torna alta, a resposta ao impulso dos coeficientes de LP calculados a partir dos coeficientes de ISF obtidos pelo processo de interpolação mediante uma perda de pacote tem um ganho mais alto do que aquele que seria originalmente esperado para o decodificador. Isso é percebido, de acordo com o padrão de qualidade subjetivo, como uma descontinuidade não desejada do áudio.
[00057] O método descrito na literatura de patente 1 gera os coeficientes de ISF interpolados para um quadro perdido. No entanto, uma vez que os parâmetros de ISF são gerados por um processo de decodifica- ção normal para o primeiro quadro depois da recuperação a partir da perda, isso falha em suprimir o aumento repentino de energia.
[00058] Por outro lado, o método descrito na literatura de patente 2 transmite um parâmetro de ajuste de ganho (energia residual de predição normalizada) obtido no lado de codificação e utiliza isso para um ajuste de energia no lado de decodificação, controlando assim a energia do sinal de excitação de um quadro de pacote perdido e permitindo a prevenção do aumento repentino de energia.
[00059] A Figura 7 mostra uma configuração funcional de exemplo de um decodificador de áudio 1X implementado pela tecnologia da literatura de patente 2, e a Figura 8 mostra uma configuração funcional de exemplo de um gerador de sinal de ocultação 13X. Na literatura de patente 2, um pacote de áudio inclui as informações auxiliares de pelo menos uma energia residual de predição normalizada em adição aos parâmetros descritos na técnica convencional.
[00060] Um decodificador de energia residual de predição normali- zada decodificador 15 fornecido no sinal de áudio gerador 1X decodifica as informações auxiliares da energia residual de predição normalizada a partir de um pacote de áudio recebido para calcular uma energia residual de predição normalizada de referência, e emite isso ao gerador de sinal de ocultação 13X.
[00061] Uma vez que os elementos do gerador de sinal de ocultação constitutivos 13X, além do ajustador residual de predição normalizada 138, são os mesmos que aqueles na tecnologia convencional supracitada, apenas o ajustador residual de predição normalizada 138 será descrito abaixo.
[00062] O ajustador residual de predição normalizada 138 calcula a energia residual de predição normalizada a partir dos coeficientes de LP emitidos pelo interpolador de coeficiente de LP 130. A seguir, o ajustador residual de predição normalizada 138 calcula um coeficiente de ajuste de ganho de filtro de síntese, com o uso da energia residual de predição normalizada e da energia residual de predição normalizada de referência. Por fim, o ajustador residual de predição normalizada 138 multiplica o sinal de excitação pelo coeficiente de ajuste de ganho de filtro de síntese e emite como o resultado do filtro de síntese 135.
[00063] A tecnologia descrita acima da literatura de patente 2 pode controlar a energia do sinal de ocultação mediante uma ocorrência de uma perda de pacote da mesma maneira que a realizada na recepção normal. No entanto, é difícil garantir uma taxa de bit necessária para a transmissão do parâmetro de ajuste de ganho supracitado no processo de codificação de áudio de taxa baixa de bit. Além disso, uma vez que é o processamento no gerador de sinal de ocultação, é difícil ligar com uma alteração repentina de energia causada por um desacordo dos parâmetros de ISF em um quadro de recuperação.
[00064] Portanto, um objetivo da presente invenção é reduzir uma descontinuidade de áudio que pode ocorrer mediante a recuperação de uma perda de pacote no ponto de partida de áudio e melhorar assim, a qualidade subjetiva.
Solução para o Problema
[00065] Um dispositivo de processamento de sinal de áudio de acordo com uma modalidade da presente invenção compreende: um detector de descontinuidade configurado para determinar uma ocorrência de uma descontinuidade que ocorre com um aumento repentino da amplitude de um áudio decodificado obtido ao decodificar um primeiro pacote de áudio que é recebido de maneira correta depois de uma ocorrência de uma perda de pacote; e um corretor de descontinuidade configurado para corrigir a descontinuidade do áudio decodificado.
[00066] O detector de descontinuidade pode determinar uma ocorrência de uma descontinuidade do áudio decodificado com a energia de um sinal de excitação.
[00067] O detector de descontinuidade pode detectar uma ocorrência de uma descontinuidade do áudio decodificado com ganhos de livro código quantificados usados para o cálculo de um sinal de excitação.
[00068] O dispositivo de processamento de sinal de áudio pode compreender ainda: um decodificador de informação auxiliar configurado para decodificar as informações auxiliares para a determinação em uma ocorrência de uma descontinuidade transmitida a partir de um codificador, e o detector de descontinuidade pode determinar uma ocorrência de uma descontinuidade do áudio decodificado, com o uso das informações auxiliares decodificadas e emitir como um código de informações auxiliares pelo decodificador de informação auxiliar .
[00069] O corretor de descontinuidade pode corrigir os parâmetros de ISF ou os parâmetros de LSF (a partir daqui chamado de "parâmetros de ISF/LSF") de acordo com um resultado da determinação em uma ocorrência de uma descontinuidade.
[00070] De maneira mais específica, o corretor de descontinuidade pode alterar uma distância entre os elementos dos parâmetros de ISF/LSF dados para garantir a estabilidade de um filtro de síntese, de acordo com um resultado da determinação em uma ocorrência de uma descontinuidade.
[00071] Nesse momento, o corretor de descontinuidade pode estender a distância entre os elementos dos parâmetros de ISF/LSF dados para garantir a estabilidade do filtro de síntese para se tornar maior que uma distância comum dada para garantir a estabilidade.
[00072] Para a distância entre os elementos dos parâmetros de ISF/LSF dados para garantir a estabilidade do filtro de síntese, o corretor de descontinuidade pode usar uma distância, que é obtida ao dividir igualmente os parâmetros de ISF/LSF naqueles de um comprimento predeterminado.
[00073] Além disso, o corretor de descontinuidade pode substituir uma parte ou todos os parâmetros de ISF/LSF por vetores predeterminados.
[00074] Um dispositivo de processamento de sinal de áudio de acordo com uma modalidade da presente invenção compreende: um quantificador de ISF/LSF configurado para quantificar os parâmetros de ISF/LSF; um ocultador de ISF/LSF configurado para gerar os parâmetros de ISF/LSF de ocultação, que são as informações de ocultação para os parâmetros de ISF/LSF; um detector de descontinuidade configurado para determinar uma ocorrência de uma descontinuidade que ocorre em um primeiro pacote de áudio que é recebido de maneira correta depois de uma ocorrência de uma perda de pacote, usar as distâncias entre os parâmetros de ISF/LSF quantificados obtidos no processo de quantificação pelo quantificador de ISF/LSF e os parâmetros de ISF/LSF de ocultação gerados pelo ocultador de ISF/LSF; e um codificador de informações auxiliares configurado para codificar as in-formações auxiliares para a determinação em uma ocorrência de uma descontinuidade.
[00075] Um dispositivo de processamento de sinal de áudio de acordo com uma modalidade da presente invenção compreende: um detector de descontinuidade configurado para determinar uma ocorrência de uma descontinuidade que ocorre em um primeiro pacote de áudio que é recebido de maneira correta depois de uma ocorrência de uma perda de pacote; um codificador de informações auxiliares configurado para codificar as informações auxiliares para a determinação em uma ocorrência de uma descontinuidade; e um quantificador de ISF/LSF configurado para usar os últimos parâmetros residuais de ISF/LSF quantificados para a quantificação de ISF/LSF em um determinado quadro quando o detector de descontinuidade não determina uma ocorrência de uma descontinuidade, e para evitar o uso dos últimos parâmetros residuais de ISF/LSF quantificados para a quantificação de ISF/LSF no determinado quadro quando o detector de descontinuidade determina uma ocorrência de uma descontinuidade.
[00076] Um dispositivo de processamento de sinal de áudio de acordo com uma modalidade da presente invenção compreende: um decodifi- cador de informação auxiliar configurado para decodificar e emitir as informações auxiliares para a determinação em uma ocorrência de uma descontinuidade que ocorre em um primeiro pacote de áudio que é recebido de maneira correta depois de uma ocorrência de uma perda de pacote; um corretor de descontinuidade configurado para corrigir a descontinuidade de um áudio decodificado; e um decodificador de ISF/LSF configurado para usar os últimos parâmetros residuais de ISF/LSF quantificados para o cálculo de ISF/LSF em um quadro pertinente quando as informações auxiliares a partir do decodificador de informação auxiliar não indicam uma ocorrência de uma descontinuidade, e para evitar o uso dos últimos parâmetros residuais de ISF/LSF quantificados para o cálculo de ISF/LSF no quadro pertinente quando as in- formações auxiliares a partir do decodificador de informação auxiliar indicam uma ocorrência de uma descontinuidade.
[00077] O dispositivo de processamento de sinal de áudio pode adotar uma configuração na qual o dispositivo de processamento de sinal de áudio que compreende ainda: um determinador de estado de recepção configurado para determinar os estados de recepção de pacote de um número predeterminado de quadros anteriores; o corretor de descontinuidade corrige uma descontinuidade com base em um resultado de determinação dos estados de recepção de pacote também, além de um resultado da determinação em uma ocorrência de uma descontinuidade.
[00078] Agora, o dispositivo de processamento de sinal de áudio de acordo com uma modalidade da presente invenção pode ser considerado como uma invenção associada a um método de processamento de sinal de áudio, e como uma invenção associada a um programa de processamento de sinal de áudio, e pode ser descrita como abaixo.
[00079] Um método de processamento de sinal de áudio de acordo com uma modalidade da presente invenção é um método de processamento de sinal de áudio a ser executado por um dispositivo de processamento de sinal de áudio, que compreende: uma etapa para determinar uma ocorrência de uma descontinuidade de áudio decodificado que ocorre com um aumento repentino da amplitude de um áudio decodificado obtido ao decodificar um primeiro pacote de áudio que é recebido de maneira correta depois de uma ocorrência de uma perda de pacote; e uma etapa para corrigir a descontinuidade do áudio decodificado.
[00080] Um método de processamento de sinal de áudio de acordo com uma modalidade da presente invenção é um método de processamento de sinal de áudio a ser executado por um dispositivo de processamento de sinal de áudio, que compreende: uma etapa para quantificar os parâmetros de ISF/LSF; uma etapa para gerar os parâmetros de ISF/LSF de ocultação que são as informações de ocultação para os parâmetros de ISF/LSF; uma etapa para determinar uma ocorrência de uma descontinuidade que ocorre em um primeiro pacote de áudio que é recebido de maneira correta depois de uma ocorrência de uma perda de pacote, usar as distâncias entre os parâmetros de ISF/LSF quantificados obtido em um processo de quantificação do quantificador de ISF/LSF e os parâmetros de ISF/LSF de ocultação gerados; e uma etapa para codificar as informações auxiliares para a determinação em uma ocorrência de uma descontinuidade.
[00081] Um método de processamento de sinal de áudio de acordo com uma modalidade da presente invenção é um método de processamento de sinal de áudio a ser executado por um dispositivo de processamento de sinal de áudio, que compreende: uma etapa para determinar uma ocorrência de uma descontinuidade que ocorre em um primeiro pacote de áudio que é recebido de maneira correta depois de uma ocorrência de uma perda de pacote; uma etapa para codificar as informações auxiliares para a determinação em uma ocorrência de uma descontinuidade; e uma etapa para usar os últimos parâmetros residuais de ISF/LSF quantificados para a quantificação de ISF/LSF em um determinado quadro quando uma ocorrência de uma descontinuidade não é determinada, e evitar o uso dos últimos parâmetros residuais de ISF/LSF quantificados para a quantificação de ISF/LSF no quadro pertinente quando uma ocorrência de uma descontinuidade é determinada.
[00082] Um método de processamento de sinal de áudio de acordo com uma modalidade da presente invenção é um método de processamento de sinal de áudio a ser executado por um dispositivo de processamento de sinal de áudio, que compreende: uma etapa para decodificar e emitir as informações auxiliares para a determinação em uma ocorrência de uma descontinuidade de áudio decodificado que ocorre em um primeiro pacote de áudio que é recebido de maneira correta depois de uma ocorrência de uma perda de pacote; uma etapa para corrigir a descontinuidade de áudio decodificado; e uma etapa para usar os últimos parâmetros residuais de ISF/LSF quantificados para o cálculo de ISF/LSF em um determinado quadro quando as informações auxiliares não indicam uma ocorrência de uma descontinuidade, e evitar o uso dos últimos parâmetros residuais de ISF/LSF quantificados para o cálculo de ISF/LSF no determinado quadro quando as informações auxiliares indicam uma ocorrência de uma descontinuidade.
[00083] Um programa de processamento de sinal de áudio de acordo com uma modalidade da presente invenção é um programa de processamento de sinal de áudio que programa um computador para operar como: um detector de descontinuidade operável para determinar uma ocorrência de uma descontinuidade de áudio decodificado que ocorre com um aumento repentino de amplitude de um áudio decodificado obtido ao decodificar um primeiro pacote de áudio que é recebido de maneira correta depois de uma ocorrência de uma perda de pacote; e um corretor de descontinuidade operável para corrigir a desconti- nuidade do áudio decodificado.
[00084] Um programa de processamento de sinal de áudio de acordo com uma modalidade da presente invenção é um programa de processamento de sinal de áudio que programa um computador para operar como: um quantificador de ISF/LSF operável para quantificar os parâmetros de ISF/LSF; um ocultador de ISF/LSF operável para gerar os parâmetros de ISF/LSF de ocultação que são as informações de ocultação para os parâmetros de ISF/LSF; um detector de desconti- nuidade operável para determinar uma ocorrência de uma desconti- nuidade que ocorre em um primeiro pacote de áudio que é recebido de maneira correta depois de uma ocorrência de uma perda de pacote, usar as distâncias entre os parâmetros de ISF/LSF quantificados obtido em um processo de quantificação do quantificador de ISF/LSF e os parâmetros de ISF/LSF de ocultação gerados pelo ocultador de ISF/LSF; e um codificador de informações auxiliares operável para codificar as informações auxiliares para a determinação em uma ocorrência de uma descontinuidade.
[00085] Um programa de processamento de sinal de áudio de acordo com uma modalidade da presente invenção é um programa de processamento de sinal de áudio que programa um computador para operar como: um detector de descontinuidade operável para determinar uma ocorrência de uma descontinuidade que ocorre em um primeiro pacote de áudio que é recebido de maneira correta depois de uma ocorrência de uma perda de pacote; um codificador de informações auxiliares operável para codificar as informações auxiliares para a determinação em uma ocorrência de uma descontinuidade; e um quanti- ficador de ISF/LSF operável para usar os últimos parâmetros residuais de ISF/LSF quantificados para a quantificação de ISF/LSF em um quadro pertinente quando o detector de descontinuidade não determina uma ocorrência de uma descontinuidade, e para evitar o uso dos últimos parâmetros residuais de ISF/LSF quantificados para a quantificação de ISF/LSF no quadro pertinente quando o detector de descontinuidade determina uma ocorrência de uma descontinuidade.
[00086] Um programa de processamento de sinal de áudio de acordo com uma modalidade da presente invenção é um programa de processamento de sinal de áudio que programa um computador para operar como: um decodificador de informação auxiliar operável para decodificar e emitir as informações auxiliares para a determinação em uma ocorrência de uma descontinuidade de áudio decodificado que ocorre em um primeiro pacote de áudio que é recebido de maneira correta depois de uma ocorrência de uma perda de pacote; um corretor de descontinuidade operável para corrigir a descontinuidade de áudio decodificado; e um decodificador de ISF/LSF operável para usar os últimos parâmetros residuais de ISF/LSF quantificados para o cálculo de ISF/LSF em um determinado quadro quando as informações auxiliares a partir do decodificador de informação auxiliar não indicam uma ocorrência de uma descontinuidade, e para evitar o uso dos últimos parâmetros residuais de ISF/LSF quantificados para o cálculo de ISF/LSF no quadro pertinente quando as informações auxiliares a partir do decodificador de informação auxiliar indicam uma ocorrência de uma descontinuidade.
Efeitos Vantajosos da Invenção
[00087] A presente invenção como descrito acima pode reduzir uma descontinuidade de áudio que ocorre possivelmente subsequente à recuperação de uma perda de pacote no ponto de partida de áudio e assim, melhorar a qualidade subjetiva.
Breve Descrição dos Desenhos
[00088] a Figura 1 é um diagrama de configuração do decodificador de áudio;
[00089] a Figura 2 é um fluxo de processamento do decodificador de áudio;
[00090] a Figura 3 é um diagrama de configuração funcional do de- codificador de código de áudio;
[00091] a Figura 4 é um diagrama de configuração funcional da calculadora de coeficiente de LP;
[00092] a Figura 5 é um fluxo de processamento para calcular os coeficientes de LP;
[00093] a Figura 6 é um diagrama de configuração funcional do gerador de sinal de ocultação;
[00094] a Figura 7 é um diagrama de configuração do decodificador de áudio da literatura de patente 2;
[00095] a Figura 8 é um diagrama de configuração funcional do ge- rador de sinal de ocultação da literatura de patente 2;
[00096] a Figura 9 é um diagrama de configuração funcional do de- codificador de código de áudio em uma primeira modalidade;
[00097] a Figura 10 é um fluxo de processamento da calculadora de coeficiente de LP na primeira modalidade;
[00098] a Figura 11 é um diagrama de configuração funcional do decodificador de código de áudio na primeira modalidade.
[00099] a Figura 12 é um fluxo de processamento de um segundo processador de estabilidade no exemplo de modificação 1 da primeira modalidade;
[000100] a Figura 13 é um diagrama de configuração funcional do decodificador de código de áudio em uma segunda modalidade;
[000101] a Figura 14 é um diagrama de configuração funcional da calculadora de coeficiente de LP na segunda modalidade;
[000102] a Figura 15 é um fluxo de processamento de cálculo dos coeficientes de LP na segunda modalidade;
[000103] a Figura 16 é um diagrama de configuração de um codificador de áudio na quarta modalidade;
[000104] a Figura 17 é um diagrama de configuração do codificador de áudio na quarta modalidade;
[000105] a Figura 18 é um diagrama de configuração de um anali- sador/codificador de LP na quarta modalidade;
[000106] a Figura 19 é um fluxo de processamento do analisa- dor/codificador de LP na quarta modalidade;
[000107] a Figura 20 é um diagrama de configuração funcional do decodificador de código de áudio na quarta modalidade;
[000108] a Figura 21 é um fluxo de processamento da calculadora de coeficiente de LP na quarta modalidade;
[000109] a Figura 22 é um diagrama de configuração do analisa- dor/codificador de LP na quinta modalidade;
[000110] a Figura 23 é um fluxo de processamento do analisa- dor/codificador de LP na quinta modalidade;
[000111] a Figura 24 é um diagrama de configuração funcional do decodificador de código de áudio na quarta modalidade;
[000112] a Figura 25 é um fluxo de processamento da calculadora de coeficiente de LP na quinta modalidade;
[000113] a Figura 26 é um diagrama de configuração do decodificador de áudio na sétima modalidade;
[000114] a Figura 27 é um fluxo de processamento do decodificador de áudio na sétima modalidade;
[000115] a Figura 28 é um diagrama de configuração funcional do decodificador de código de áudio na sétima modalidade;
[000116] a Figura 29 é um fluxo de processamento de cálculo dos coeficientes de LP na sétima modalidade;
[000117] a Figura 30 é um desenho que mostra um exemplo de configuração de hardware de um computador;
[000118] a Figura 31 é um diagrama de aparência do computador;
[000119] as Figuras 32 (a), (b), (c) e (d) são desenhos que mostram vários exemplos de programas de processamento de sinal de áudio. Descrição das Modalidades
[000120] As modalidades preferidas de um dispositivo de processamento de sinal de áudio, um método de processamento de sinal de áudio e um programa de processamento de sinal de áudio de acordo com a presente invenção serão descritas abaixo em detalhes com o uso dos desenhos. Os mesmos elementos serão indicados por sinais de referência similares na descrição dos desenhos para evitar as descrições duplicadas.
Primeira Modalidade
[000121] O dispositivo de processamento de sinal de áudio na primeira modalidade tem a mesma configuração que o decodificador de áudio 1 supracitado mostrado na Figura 1 e tem uma nova característica no decodificador de código de áudio e assim, o decodificador de código de áudio será descrito abaixo.
[000122] A Figura 9 é um diagrama que mostra uma configuração funcional de um decodificador de código de áudio 12A na primeira modalidade, e a Figura 10 mostra um fluxograma do processo de cálculo de coeficiente de LP. O decodificador de código de áudio 12A mostrado na Figura 9 é configurado ao adicionar um detector de des- continuidade 129 à configuração supracitada da Figura 3. Uma vez que a presente modalidade se difere da tecnologia convencional apenas no processo de cálculo de coeficiente de LP, as operações as respectivas partes associadas ao processo de cálculo de coeficiente de LP serão descritas abaixo.
[000123] Um detector de descontinuidade 129 se refere a um ganho de livro código fixo gc0 adquirido pela decodificação e um ganho de livro código fixo gc-1 incluído nos estados internos e compara uma alteração do ganho com um limite de acordo com a equação a seguir (etapa S11 na Figura 10).Equação Matemática 42
Figure img0042
[000124] -Quando a alteração de ganho excede o limite, o detector detecta uma ocorrência de uma descontinuidade (também referida aqui simplesmente como "detecta uma descontinuidade") e emite um sinal de controle que indica um resultado de detecção de uma ocorrência de descontinuidade ao processador de estabilidade 121.
[000125] A equação a seguir pode ser usada para a comparação entre a alteração de ganho e o limite.Equação Matemática 43
Figure img0043
[000126] Além disso, a comparação entre a alteração de ganho e o limite pode ser feita pela equação a seguir, em que gc(c) representa o máximo entre os ganhos de livro código fixos dos primeiro ao quarto subquadros incluídos no quadra=o atual e gc(p) representa o mínimo entre os ganhos de livro código fixos incluídos nos estados internos.Equação Matemática 44
Figure img0044
[000127] A equação a seguir também pode ser usada.Equação Matemática 45
Figure img0045
[000128] O exemplo acima da primeira modalidade mostra um exemplo no qual uma detecção de descontinuidade é conduzida com o uso do ganho de livro código fixo gc-1 do quarto subquadro do quadro imediatamente precedente (quadro perdido) e o ganho de livro código fixo gc0 do primeiro subquadro do quadro atual. No entanto, a comparação entre a alteração de ganho e o limite pode ser feita com o uso das médias calculadas a partir dos ganhos de livro código fixos incluídos nos estados internos e nos ganhos de livro código fixos incluídos no quadro atual.
[000129] O decodificador de ISF 120 realiza a mesma operação que na tecnologia convencional (etapa S12 na Figura 10).
[000130] O processador de estabilidade 121 corrige os parâmetros de ISF pelo processo a seguir quando o detector de descontinuidade 129 detecta uma descontinuidade (etapa S13 na Figura 10).
[000131] Primeiro, o processador de estabilidade 121 submete os parâmetros de ISFEquação Matemática 46
Figure img0046
armazenados no buffer de estado interno 14 a um processo para expandir uma distância entre dois elementos adjacentes para se tornar M-1 vezes mais ampla que a distância comum. O processo para posicionar uma distância muito ampla que a distância comum fornece um efeito para suprimir os picos e quedas excessivas no envelope de espectro. Aqui, min_dist representa a distância de ISF mínima, e isf_min representa o mínimo de ISF necessário para garantir a distância de min_dist. isf_min é atualizado de maneira sucessiva pela adição da distância de min_dist a um valor de ISF vizinho. Por outro lado, isf_max é o máximo de ISF necessário para garantir a distância de min_dist. isf_max é atualizado de maneira sucessiva ao subtrair a distância de min_dist de um valor de ISF vizinho.Equação Matemática 47
Figure img0047
[000132] A seguir, um processador de estabilidade 121 submete os parâmetros de ISF do quadro atual a um processo para expandir uma distância entre dois elementos adjacentes para se tornar M0 vezes mais ampla que a distância comum. 1 < M0 < M-1 é presumido aqui, mas também é possível definir um de r M-1 e M0 para 1 e o outro para um valor maior que a 1. Equação Matemática 48
Figure img0048
[000133] Além disso, o processador de estabilidade 121 realiza o processo a seguir da mesma maneira que aquele realizado em um processo de decodificação comum, quando o detector de descontinui- dade não detecta a descontinuidade.Equação Matemática 49
Figure img0049
[000134] A distância mínima imposta entre os elementos quando uma descontinuidade é detectada pode variar dependendo da frequência de ISF. A distância mínima imposta entre os elementos quando uma descontinuidade é detectada apenas precisa ser diferente da distância mínima imposta entre os elementos no processo de decodificação comum.
[000135] O conversor de ISF-ISP 122A na calculadora de coeficiente de LP 122 converte os parâmetros de ISFEquação Matemática 50
Figure img0050
nos parâmetros de ISPEquação Matemática 51
Figure img0051
respectivamente, de acordo com a equação a seguir (etapa S14 na Figura 10). Aqui, C é uma constante determinada com antecedência.Equação Matemática 52
Figure img0052
[000136] O interpolador de ISP 122B calcula os parâmetros de ISP para os respectivos subquadros a partir dos últimos parâmetros de ISPEquação Matemática 53
Figure img0053
e os parâmetros de ISP a seguirEquação Matemática 54
Figure img0054
de acordo com a equação a seguir (etapa S15 na Figura 10). Outros coeficientes podem ser usados para a interpolação.Equação Matemática 55
Figure img0055
[000137] O conversor de ISP-LPC 122C converte os parâmetros deISP para os respectivos subquadros nos coeficientes de LPEquação Matemática 56
Figure img0056
(etapa S16 na Figura 10). Aqui, o número de subquadros incluído em um sinal de antecipação foi presumido ser 4, mas o número de subquadros pode ser diferente dependendo do princípio de design. A procedimento de conversão específico a ser usado pode ser o procedimento de processamento descrito na literatura de não patente 1.
[000138] Além disso, o conversor de ISF-ISP 122A atualiza os parâmetros de ISF armazenados no buffer de estado interno 14Equação Matemática 57
Figure img0057
de acordo com a equação a seguir.Equação Matemática 58
Figure img0058
[000139] Nesse momento, mesmo quando uma descontinuidade for detectada, o conversor de ISF-ISP 122A pode realizar o procedimento abaixo para atualizar os parâmetros de ISFEquação Matemática 59
Figure img0059
armazenados no buffer de estado interno, com o uso do resultado de cálculo dos parâmetros de ISF.Equação Matemática 60
Figure img0060
[000140] Como na primeira modalidade acima, uma descontinuidade de áudio decodificado pode ser determinada com os ganhos de livro código quantificados usados no cálculo do sinal de excitação e os parâmetros de ISF/LSF (por exemplo, a distância entre os elementos dos parâmetros de ISF/LSF dados para garantir a estabilidade do filtro de síntese) podem ser corrigidos de acordo com um resultado da determinação para uma descontinuidade. Isso reduz a descontinuidade do áudio que pode ocorrer mediante uma recuperação de uma perda de pacote ni ponto de partida de áudio e assim, melhora a qualidade subjetiva.
Exemplo de Modificação da Primeira Modalidade
[000141] A Figura 11 é um diagrama que mostra uma configuração funcional de um decodificador de código de áudio 12S de acordo com um exemplo de modificação da primeira modalidade. Uma vez que se difere da configuração da tecnologia convencional mostrado na Figura 3 apenas no detector de descontinuidade 129 e no segundo processador de estabilidade 121S, as operações desses serão descritas. O segundo processador de estabilidade 121S tem um ajustador de ganho 121X e um multiplicador de ganho 121Y, e um fluxo de processamento do se- gundo processador de estabilidade 121S é mostrado na Figura 12.
[000142] O detector de descontinuidade 129 se refere ao ganho de livro código fixo gc0 obtido pela decodificação e ao ganho de livro código fixo gc-1 incluídos nos estados internos e compara a alteração de ganho com um limite, da mesma maneira que aquele realizado pelo detector de descontinuidade 129 na primeira modalidade. Em seguida, o detector de descontinuidade 129 envia ao ajustador de ganho 121X, um sinal de controle que inclui as informações sobre se a alteração de ganho excedeu um limite.
[000143] O ajustador de ganho 121X lê, a partir do sinal de controle, as informações sobre se a alteração de ganho excede o limite e quando a alteração de ganho excede o limite, ele emite um ganho predeterminado gon ao multiplicador de ganho 121Y. Por outro lado, quando a alteração de ganho não excede o limite, o ajustador de ganho 121X emite um ganho predeterminado goff ap multiplicador de ganho 121Y. Essa operação do ajustador de ganho 121X corresponde à etapa S18 na Figura 12.
[000144] O multiplicador de ganho 121Y multiplica o sinal sintetizado emitido a partir do filtro de síntese 128 pelo ganho supracitado gon ou pelo ganho goff (etapa S19 na Figura 12) e emite o sinal decodificado resultante.
[000145] Aqui, o decodificador de código de áudio pode ser configurado de modo que a calculadora de coeficiente de LP 122 emite os coeficientes de LP ou os parâmetros de ISF para alimentá-los ao segundo processador de estabilidade 121S (como indicado por uma linha pontilhada a partir da calculadora de coeficiente de LP 122 para o ajustador de ganho 121X na Figura 11). Nesse caso, os ganhos a serem multiplicados são determinados com o uso dos coeficientes de LP ou os parâmetros de ISF calculados pela calculadora de coeficiente de LP 122.
[000146] Ao adicionar o segundo processador de estabilidade 121S ao decodificador de código de áudio 12S e ajustar o ganho, dependendo de se a alteração de ganho excede o limite como descrito no exemplo de modificação acima, um sinal decodificado adequado pode ser obtido.
[000147] O segundo processador de estabilidade 121S pode ser configurado para multiplicar o sinal de excitação pelo ganho calculado supracitado e emitir como resultado ao filtro de síntese 128.Segunda Modalidade
[000148] Um dispositivo de processamento de sinal de áudio de acordo com a segunda modalidade tem a mesma configuração que do decodificador de áudio 1 supracitado na Figura 1 e tem um novo recurso em um decodificador de código de áudio e assim, o decodificador de código de áudio será descrito abaixo. A Figura 13 mostra uma configuração funcional de exemplo do decodificador de código de áudio 12B, a Figura 14 mostra uma configuração funcional de exemplo associada ao processo de cálculo dos coeficientes de LP, e a Figura 15 mostra um fluxo do processo de cálculo dos coeficientes de LP. O decodificador de código de áudio 12B na Figura 13 é configurado ao adicionar o detector de descontinuidade 129 à configuração supracitada mostrada na Figura 3.
[000149] O decodificador de ISF 120 calcula os parâmetros de ISF in da mesma maneira que aquele realizado na tecnologia convencional (etapa S21 na Figura 15).
[000150] O processador de estabilidade 121 realiza o processo de impor uma distância de não menos de 50 Hz entre os elementos dos parâmetros de ISFEquação Matemática 61
Figure img0061
a fim de garantir a estabilidade do filtro da mesma maneiraque aquele realizado na tecnologia convencional (etapa S22 na Figura 15).
[000151] O conversor de ISF-ISP 122A converte os parâmetros de ISF emitidas pelo processador de estabilidade 121 nos parâmetros de ISP da mesma maneira que aquele realizado na primeira modalidade (etapa S23 na Figura 15).
[000152] O interpolador de ISP 122B, da mesma maneira que aquele realizado na primeira modalidade (etapa S24 na Figura 15), calcula os parâmetros de ISP para os respectivos subquadros a partir dos últimos parâmetros de ISPEquação Matemática 62
Figure img0062
e os parâmetros de ISPEquação Matemática 63
Figure img0063
obtidos pela conversão pelo conversor de ISF-ISP 122A.
[000153] O conversor de ISP-LPC 122C, da mesma maneira que aquele realizado na primeira modalidade (etapa S25 na Figura 15), converte os parâmetros de ISP para os respectivos subquadros nos coeficientes de LPEquação Matemática 64
Figure img0064
[000154] Aqui, o número de subquadros incluídos no sinal de antecipação é presumido ser 4, mas o número de subquadros pode ser diferente dependendo do princípio de design.
[000155] O buffer de estado interno 14 atualiza os parâmetros de ISF armazenados nos últimos com os novos parâmetros de ISF.
[000156] O detector de descontinuidade 129 realiza a leitura dos co-eficientes de LP do quarto subquadro no quadro de pacote perdido a partir do buffer de estado interno 14 e calcula os energia da resposta de impulso dos coeficientes de LP do quarto subquadro no quadro de pacote perdido. Os coeficientes de LP do quarto subquadro no quadro de pacote perdido a ser usado podem ser os coeficientes emitidos pelo interpolador de coeficiente de LP 130 incluídos no gerador de sinal de ocultação 13 mostrado na Figura 6 e acumulados no buffer de estado interno 14 mediante a perda de pacote.Equação Matemática 65
Figure img0065
[000157] Em seguida, o detector de descontinuidade 129 detecta uma descontinuidade, por exemplo, pela equação abaixo (etapa S26 na Figura 15).Equação Matemática 66
Figure img0066
[000158] Quando a alteração de ganho não excede o limite (NÃO na etapa S27 da Figura 15), o detector de descontinuidade 129 não detecta uma ocorrência de uma descontinuidade, e o conversor de ISP-LPC 122C emite os coeficientes de LP e finaliza o processo. Por outro lado, quando a alteração de ganho excede o limite (SIM na etapa S27 da Figura 15), o detector de descontinuidade 129 detecta uma ocorrência de uma descontinuidade e envia um sinal de controle indicativo de um resultado da detecção para uma ocorrência de uma descontinuidade ao processador de estabilidade 121. Ao receber o sinal de controle, o processador de estabilidade 121 corrige os parâmetros de ISP da mesma maneira que aquele realizado na primeira modalidade (etapa S28 na Figura 15). As operações subsequentes do conversor de ISF-ISP 122A, do interpolador de ISP 122B, e do conversor de ISP-LPC 122C (etapas S29, S2A e S2B na Figura 15) são as mesmas que acima.
[000159] Como discutido na segunda modalidade acima, uma des- continuidade de áudio decodificado pode ser determinada pela energia do sinal de excitação, e o áudio descontínuo é reduzido para melhorar a qualidade subjetiva da mesma maneira que aquele realizado na primeira modalidade.Terceira Modalidade
[000160] Mediante a detecção de descontinuidade, os parâmetros de ISF podem ser corrigidos por outro método. A terceira modalidade se difere da primeira modalidade apenas quanto ao processador de estabilidade 121 e assim, apenas a operação do processador de estabilidade 121 será descrita.
[000161] Quando o detector de descontinuidade 129 detecta uma descontinuidade, o processador de estabilidade 121 realiza o processo a seguir para corrigir a parâmetros de ISF.
[000162] Com relação aos parâmetros de ISF armazenados no buffer de estado interno 14,Equação Matemática 67
Figure img0067
o processador de estabilidade 121 substitui os parâmetros de ISF até uma dimensão P’ de ordem inferior (0 < P' < P) de acordo com a equação abaixo. Aqui, a definição a seguir é adotada.Equação Matemática 68
Figure img0068
Equação Matemática 69
Figure img0069
[000163] O processador deparâmetros de ISF das dimensões P’ de ordem inferior com os vetores de dimensão P’ obtidos com antecedência ao saber o seguinte.Equação Matemática 70
Figure img0070
[000164] A seguir, quanto aos parâmetros de ISF do quadro atual, o processador de estabilidade 121 pode, como realizado na primeira modalidade, realizar o processo de expandir a distância entre os ele-mentos para se tornar M0 vezes mais ampla que a distância comum ou pode determina-la de acordo com a equação abaixo. Aqui, a definição a seguir é adotada.Equação Matemática 71
Figure img0071
Equação Matemática 72
Figure img0072
[000165] O processadorcom os vetores de dimensão P’ aprendidos com antecedência.Equação Matemática 73
Figure img0073
[000166] Além disso, os vetores de dimensão P' supracitados podem ser aprendidos no processo de decodificação ou podem ser definidos, por exemplo, da seguinte forma.Equação Matemática 74
Figure img0074
[000167] Em um quadro no início da decodificação, no entanto, wi-1 pode ser definido como o vetor de dimensão P’ predeterminado wiinit.
[000168] O buffer de estado interno 14 atualiza os parâmetros de ISF armazenados nos últimos com os novos parâmetros de ISF.
[000169] Como discutido na terceira modalidade acima, a distância obtida ao dividir igualmente os parâmetros de ISF/LSF naqueles de uma dimensão predeterminada pode ser usada como a distância entre os elementos dos parâmetros de ISF/LSF dados para garantir a estabilidade do filtro de síntese, através da qual o áudio descontínuo é reduzido para melhorar a qualidade subjetiva que aquele realizado nas primeira e segunda modalidades.Quarta Modalidade
[000170] Uma quarta modalidade será descrita, na qual o lado de codificação detecta uma ocorrência de uma descontinuidade e transmite um código de determinação de descontinuidade (indicativo de um resultado de detecção) como incluído nos códigos de áudio para o lado de decodificação e também, no qual o lado de decodificação determina a operação do processo de estabilidade, com base no código de determinação de descontinuidade incluído nos códigos de áudio.
Com relação ao Lado de Codificação
[000171] A Figura 16 mostra uma configuração funcional de exemplo do codificador 2, e a Figura 17 é um fluxograma que mostra o processo realizado no codificador 2. Como mostrado na Figura 16, o codificador 2 tem um analisador/codificador de LP 21, um codificador residual 22 e um multiplexador de código 23.
[000172] Uma configuração funcional de exemplo do analisa- dor/codificador de LP 21 entre eles é mostrado na Figura 18, e um flu- xograma que mostra o processo realizado no analisador/codificador de LP 21 é mostrado na Figura 19. Como mostrado na Figura 18, o ana- lisador/codificador de LP 21 tem um analisador de LP 210, um conversor de LP-ISF 211, um codificador de ISF 212, um determinador de descontinuidade 213, um ocultador de ISF 214, um conversor de LP-ISF 215 e um buffer de ISF 216.
[000173] No analisador/codificador de LP 21, o analisador de LP 210 realiza uma análise de predição linear em um sinal de entrada para obter os coeficientes de predição linear (etapa T41 na Figura 17 e etapa U41 na Figura 18). Para o cálculo dos coeficientes de predição linear, uma função de autocorrelação é calculada primeiro a partir do sinal de áudio e, em seguida, o algoritmo de Levinson-Durbin ou similares pode ser aplicado.
[000174] O conversor de LP-ISF 211 converte os coeficientes de predição linear calculados nos parâmetros de ISP da mesma maneira que aquele realizado na primeira modalidade (etapas T42, U42). A conversão dos coeficientes de predição linear em parâmetros de ISF pode ser implementada pelo uso do método descrito na literatura de não patente.
[000175] O codificador de ISF 212 codifica os parâmetros de ISF com o uso de um método predeterminado para calcular os códigos de ISF (etapas T43, U43) e emite os parâmetros de ISF quantificados obtido no processo de codificação ao determinador de descontinuidade 213, o ocultador de ISF 214, e o conversor de LP-ISF 215 (etapa U47). Aqui, os parâmetros de ISF quantificados são iguais aos parâmetros de ISF obtidos em uma quantificação inversa dos códigos de ISF. Um método para codificar pode ser a codificação de vetor, ou a codificação por uma quantificação de vetor ou similares de vetores de erro de ISFs do quadro imediatamente precedente e vetores médios determinados com ante-cedência por aprendizado.
[000176] O determinador de descontinuidade 213 codifica uma ban- deira de determinação de descontinuidade armazenada em um buffer interno (não mostrado) construído no determinador de descontinuidade 213 e emite um código de determinação de descontinuidade resultante (etapa U47). Além disso, o determinador de descontinuidade 213 usa os parâmetros de ISF de ocultação.Equação Matemática 75
Figure img0075
lidos a partir do buffer de ISF 216 e os parâmetros de ISF quantificadosEquação Matemática 76
Figure img0076
para realizar a determinação em uma descontinuidade de acordo com a equação abaixo (etapas T44, U46). Aqui, Thresw representa um limite determinado com antecedência, e P' um número inteiro que satisfaz a equação a seguir (0 < P' < P).Equação Matemática 77
Figure img0077
[000177] O exemplo é descrito acima, no qual a determinação de descontinuidade é feita com o uso de distâncias euclidianas entre os parâmetros de ISF. No entanto, a determinação de descontinuidade pode ser feita por outros métodos.
[000178] O ocultador de ISF 214 calcula os parâmetros de ISF de ocultação a partir dos parâmetros de ISF quantificados pelo mesmo processo que o realizado pelo ocultador de ISF de lado de decodificador e emite os parâmetros de ISF de ocultação resultantes ao buffer de ISF 216 (etapas U44, U45). A operação do processo de ocultação de ISF pode ser realizada por qualquer método, contanto que seja o mesmo processo que aquele da ocultação de perda de pacote de lado de de- codificador.
[000179] O conversor de LP-ISF 215 calcula coeficientes de predição linear quantificados ao converter os parâmetros de ISF quantificados acima e emitir os coeficientes de predição linear quantificados resultantes ao codificador residual 22 (etapa T45). Um método usado para converter os parâmetros de ISF em coeficientes de predição linear quantificados pode ser o método descrito na literatura de não patente.
[000180] O codificador residual 22 filtra o sinal de áudio pelo uso dos coeficientes de predição linear quantificados para calcular os sinais residuais (etapa T46).
[000181] A seguir, o codificador residual 22 codifica os sinais residuais por meios de codificação com o uso de CELP ou TCX (Excitação Codificada de Transformação) ou por meios de codificação que podem ser comutados com o uso de CELP e TCX e emite os códigos residuais resultantes (etapa T47). Uma vez que a operação do codificador residual 22 é menos relevante para a presente invenção, a descrição do mesmo será omitida aqui.
[000182] O multiplexador de código 23 monta os códigos de ISF, o código de determinação de descontinuidade e os códigos residuais em uma ordem predeterminada e emite os códigos de áudio resultantes (etapa T48).
Com relação ao Lado de Codificação
[000183] Um dispositivo de processamento de sinal de áudio de acordo com a quarta modalidade tem a mesma configuração que aquela do decodificador de áudio 1 supracitado na Figura 1 e tem uma nova característica no decodificador de código de áudio e assim, o decodi- ficador de código de áudio será descrito abaixo. A Figura 20 mostra uma configuração funcional de exemplo de um decodificador de código de áudio 12D, e a Figura 21 é um fluxograma que mostra o processo para calcular os coeficientes de LP. O decodificador de código de áudio 12D mostrado na Figura 20 é configurado ao adicionar o detector de des- continuidade 129 à configuração supracitada mostrada na Figura 3.
[000184] O decodificador de ISF 120 decodifica os códigos de ISF e emite os códigos resultantes ao processador de estabilidade 121 e ao buffer de estado interno 14 (etapa S41 na Figura 21).
[000185] O detector de descontinuidade 129 decodifica os códigos de determinação de descontinuidade e emite a resultado de detecção de descontinuidade resultante ao processador de estabilidade 121 (etapa S42 na Figura 21).
[000186] O processador de estabilidade 121 realiza o processo de estabilidade de acordo com o resultado de detecção de descontinui- dade (etapa S43 na Figura 21). O procedimento de processo do processador de estabilidade a ser usado pode ser o mesmo método que o executado na primeira modalidade e na terceira modalidade.
[000187] O processador de estabilidade 121 pode realizar o processo de estabilidade conforme descrito abaixo, com base em outros parâmetros incluídos nos códigos de áudio, além do resultado de detecção de descontinuidade adquirido a partir do código de determinação de descontinuidade. Por exemplo, o processador de estabilidade 121 pode ser configurado para realizar o processo de estabilidade de tal maneira que uma tentativa de estabilidade de ISF é calculada de acordo com a equação abaixo e que quando a estabilidade de ISF excede um limite, mesmo se o código de determinação de descontinuidade mostrar uma detecção de uma descontinuidade, o processo é realizado como se nenhuma descontinuidade fosse detectada. Aqui, C é uma constante determinada com antecedência.Equação Matemática 78
Figure img0078
[000188] O conversor de ISF-ISP 122A na calculadora de coeficiente de LP 122 converte os parâmetros de ISF em parâmetros de ISP pelo mesmo procedimento de processo que aquele realizado na primeira modalidade (etapa S44 na Figura 21).
[000189] O interpolador de ISP 122B calcula os parâmetros de ISP para os respectivos subquadros pelo mesmo procedimento de processo que aquele realizado na primeira modalidade (etapa S45 na Figura 21).
[000190] O conversor de ISP-LPC 122C converte os parâmetros de ISP calculados para os respectivos subquadros nos parâmetros de LPC pelo mesmo procedimento de processo que aquele realizado na primeira modalidade (etapa S46 na Figura 21).
[000191] Na quarta modalidade como descrito acima, o lado de codificação realiza a determinação de descontinuidade (a determinação de descontinuidade com o uso das distâncias euclidianas entre os parâmetros de ISF de ocultação e os parâmetros de ISF quantificados, como um exemplo) codificam as informações auxiliares sobre um resultado de uma determinação e emite as informações codificadas para o lado de decodificação, e o lado de decodificação determina uma descontinui- dade com o uso das informações auxiliares obtidas pela decodificação. Dessa maneira, o processamento adequado pode ser executado acordo com a descontinuidade resultado de determinação feita pelo lado de codificação, enquanto o lado de codificação e o lado de decodificação trabalham em conjunto um com o outro.
Quinta Modalidade Com Relação ao Lado de Codificação
[000192] A configuração funcional do codificador é a mesma que aquela da quarta modalidade mostrado na Figura 16, e o fluxo de processamento do codificador é o mesmo que aquele do fluxo de processamento da quarta modalidade mostrado na Figura 17. Abaixo, será descrito o analisador/codificador de LP de acordo com a quinta moda- lidade que é diferente daquela da quarta modalidade.
[000193] A Figura 22 mostra uma configuração funcional de exemplo do analisador/codificador de LP, e a Figura 23 mostra um fluxo dos processos realizados pelo analisador/codificador de LP. Como mostrado na Figura 22, o analisador/codificador de LP 21S tem o analisador de LP 210, o conversor de LP-ISF 211, o codificador de ISF 212, o determinador de descontinuidade 213, o ocultador de ISF 214, o conversor de LP-ISF 215 e o buffer de ISF 216.
[000194] Nesse analisador/codificador de LP 21S, o analisador de LP 210 realiza a análise de predição linear no sinal de entrada pelo mesmo processo que aquele realizado na quarta modalidade para obter os coeficientes de predição linear (etapa U51 na Figura 23).
[000195] O conversor de LP-ISF 211 converte os coeficientes de predição linear calculados em parâmetros de ISF pelo mesmo processo que aquele realizado na quarta modalidade (etapa U52 na Figura 23). O método descrito na literatura de não patente pode ser usado para a conversão dos coeficientes de predição linear nos parâmetros de ISF.
[000196] O codificador de ISF 212 realiza a leitura da bandeira de determinação de descontinuidade armazenada no buffer interno (não mostrado) do determinador de descontinuidade 213 (etapa U53 na Figura 23).Caso em que a bandeira de determinação de descontinuidade indica a Detecção de Descontinuidade
[000197] O codificador de ISF 212 calcula os códigos de ISF pela quantificação de vetor de parâmetros residuais de ISF ri calculados pela a equação abaixo (etapa U54 na Figura 23). Aqui, os parâmetros de ISF calculados pelo conversor de LP-ISF são indicados por wi e vetores médios, que são médios, obtidos com antecedência por aprendizado.Equação Matemática 79
Figure img0079
[000198] A seguir, o codificador de ISF 212 usa os parâmetros residuais de ISF quantificadosEquação Matemática 80
Figure img0080
[000199] obtidos ao quantificar os parâmetros residuais de ISF ri para atualizar o buffer de parâmetro residual de ISF de acordo com a equação a seguir (etapa U55 na Figura 23).Equação Matemática 81
Figure img0081
Caso em que a bandeira de determinação de descontinuidade não indica a Detecção de Descontinuidade
[000200] O codificador de ISF 212 calcula os códigos de ISF pela quantificação de vetor dos parâmetros residuais de ISF ri calculados pela equação abaixo (etapa U54 na Figura 23). Aqui, os parâmetros residuais de ISF obtidos pela decodificação no quadro imediatamente precedente são indicados como a seguir.Equação Matemática 82
Figure img0082
Equação Matemática 83
Figure img0083
[000201] A seguir, o codificador de ISF 212 usa os parâmetros residuais de ISF quantificadosEquação Matemática 84
Figure img0084
[000202] obtidos pela quantificação dos parâmetros residuais de ISF ri para atualizar o buffer de parâmetro residual de ISF de acordo com a equação a seguir (etapa U55 na Figura 23).Equação Matemática 85
Figure img0085
[000203] Pelo procedimento acima, o codificador de ISF 212 calcula os códigos de ISF e emite os parâmetros de ISF quantificados obtido no processo de codificação ao determinador de descontinuidade 213, ao ocultador de ISF 214 e ao conversor de LP-ISF 215.
[000204] O ocultador de ISF 214 calcula os parâmetros de ISF de ocultação a partir dos parâmetros de ISF quantificados pelo mesmo processo que aquele realizado pelo ocultador de ISF de lado de deco- dificador da mesma maneira as executado na quarta modalidade e os emite ao buffer de ISF 216 (etapas U56, U58 na Figura 23). A operação do processo de ocultação de ISF pode ser realizada por qualquer método, contanto que seja o mesmo processo que aquele da ocultação de perda de pacote de lado de decodificador.
[000205] O determinador de descontinuidade 213 realiza a determinação de uma descontinuidade pelo mesmo processo que aquele realizado na quarta modalidade e armazena um resultado de determinação no buffer interno (não mostrado) do determinador de descontinuidade 213 (etapa U57 na Figura 23).
[000206] O conversor de LP-ISF 215 converte os parâmetros de ISF quantificados, da mesma maneira que aquele realizado na quarta modalidade, para calcular os coeficientes de predição linear quantificados e os emite ao codificador residual 22 (figura 16) (etapa U58 na Figura 23).Com relação ao Lado de Decodificação
[000207] Um dispositivo de processamento de sinal de áudio de acordo com a quinta modalidade tem a mesma configuração que aquela do decodificador de áudio 1 supracitado na Figura 1 e tem uma nova característica no decodificador de código de áudio e assim, o decodi- ficador de código de áudio será descrito abaixo. A Figura 24 mostra uma configuração funcional de exemplo do decodificador de código de áudio 12E, e a Figura 25 mostra um fluxo do processo de cálculo realizado pelos coeficientes de LP. O decodificador de código de áudio 12E mostrado na Figura 24 é configurado ao adicionar o detector de des- continuidade 129 à configuração supracitada mostrada na Figura 3.
[000208] O detector de descontinuidade 129 decodifica os código de determinação de descontinuidade e emite a bandeira de determinação de descontinuidade resultante ao decodificador de ISF 120 (etapa S51 na Figura 25).
[000209] O decodificador de ISF 120 calcula os parâmetros de ISF da seguinte maneira, dependendo do valor da bandeira de determinação de descontinuidade, e emite as parâmetros de ISF ao processador de estabilidade 121 e ao buffer de estado interno 14 (etapa S52 na Figura 25).Caso em que a bandeira de determinação de descontinuidade Indica a Detecção de Descontinuidade
[000210] O decodificador de ISF 120 usa os parâmetros residuais de ISF quantificadosEquação Matemática 86
Figure img0086
[000211] obtidos pela decodificação dos códigos de ISF, e os vetores médios meani obtidos com antecedência por aprendizado para obter os parâmetros de ISF quantificadosEquação Matemática 87
Figure img0087
de acordo com a equação a seguir.Equação Matemática 88
Figure img0088
[000212] A seguir, o decodificador de ISF 120 atualiza os parâmetros residuais de ISF armazenados no buffer de estado interno 14 de acordo com a equação a seguir.Equação Matemática 89
Figure img0089
Caso em que a bandeira de determinação de descontinuidade não Indica a Detecção de Descontinuidade
[000213] O decodificador de ISF 120 realiza a leitura, a partir do buffer de estado interno 14, dos parâmetros residuais de ISFEquação Matemática 90
Figure img0090
obtidos pela decodificação do quadro imediatamente precedente e usa os parâmetros residuais de ISF resultantesEquação Matemática 91
Figure img0091
[000214] os vetores médios meani obtidos com antecedência por aprendizado e os parâmetros residuais de ISF quantificadosEquação Matemática 92
Figure img0092
obtidos pela decodificação dos códigos de ISF para calcularos parâmetros de ISF quantificadosEquação Matemática 93
Figure img0093
de acordo com a equação a seguir.Equação Matemática 94
Figure img0094
[000215] A seguir, o decodificador de ISF 120 atualiza os parâmetros residuais de ISF armazenados no buffer de estado interno 14 de acordo com a equação a seguir.Equação Matemática 95
Figure img0095
[000216] O processador de estabilidade 121 realiza o mesmo processo que aquele realizado na primeira modalidade (etapa S53 na Figura 25) quando uma descontinuidade não é detectada.
[000217] O conversor de ISF-ISP 122A na calculadora de coeficiente de LP 122 converte os parâmetros de ISF em parâmetros de ISP pelo mesmo procedimento de processo como descrito na primeira modalidade (etapa S54 na Figura 25).
[000218] O interpolador de ISP 122B calcula os parâmetros de ISP para os respectivos subquadros pelo mesmo procedimento de processo que aquele realizado na primeira modalidade (etapa S55 na Figura 25).
[000219] O conversor de ISP-LPC 122C, pelo mesmo procedimento de processo que aquele realizado na primeira modalidade (etapa S56 na Figura 25), converte os parâmetros de ISP calculados para os respectivos subquadros em parâmetros de LPC.
[000220] Na quinta modalidade como descrito acima, o lado de codificação é configurado da seguinte maneira: quando a bandeira de determinação de descontinuidade não indica uma detecção de uma des- continuidade, a quantificação de vetor dos parâmetros residuais de ISF é realizada com o uso dos parâmetros residuais de ISF obtidos pela decodificação do quadro imediatamente precedente. Por outro lado, quando a bandeira de determinação de descontinuidade indica uma detecção de uma descontinuidade, o codificador evita usar os parâme- tros residuais de ISF obtidos pela decodificação do quadro imediatamente precedente. De modo similar, o lado de decodificação é configurado da seguinte maneira: quando a bandeira de determinação de descontinuidade não indica uma detecção de uma descontinuidade, os parâmetros de ISF quantificados são calculados com o uso dos parâmetros residuais de ISF obtidos pela decodificação do quadro imediatamente precedente. Por outro lado, quando a bandeira de determinação de descontinuidade indica uma detecção de descontinuidade, o decodificador evita usar os parâmetros residuais de ISF obtidos pela decodificação do quadro imediatamente precedente. Dessa maneira, o processamento adequado de acordo com um resultado de determinação de descontinuidade pode ser executado, enquanto o lado de codificação e o lado de decodificação trabalham em conjunto um com o outro.Sexta Modalidade
[000221] As primeira e sexta modalidades acima podem ser aplicadas em conjunto. Por exemplo, como descrito na quarta modalidade, o lado de decodificação decodifica os código de determinação de desconti- nuidade incluídos nos códigos de áudio a parti do lado de codificação para detectar uma descontinuidade. Quando uma descontinuidade é detectada, ela pode realizar a operação subsequente da seguinte maneira.Para os parâmetros de ISFEquação Matemática 96
Figure img0096
armazenados no buffer de estado interno, os parâmetros de ISF até a dimensão P’ de baixo grau (0 < P' < P) são substituídos de acordo com a equação a seguir como descrito na terceira modalidade.Equação Matemática 97
Figure img0097
de acordo com a equação a seguir como descrito na quinta modalidade.Equação Matemática 98
Figure img0098
[000222] Consequentemente, com o uso dos parâmetros de ISF obtidos como descrito acima, os coeficientes de LP são obtidos pelos processos do conversor de ISF-ISP 122A, do interpolador de ISP 122B e do conversor de ISP-LPC 122C como realizado na primeira modalidade.
[000223] Também é eficaz adotar as combinações opcionais das primeira à quinta modalidades como descrito acima.
Sétima Modalidade
[000224] Pode ser considerado na operação de decodificação de acordo com as primeira à sexta modalidades acima e suas modificações, como o quadro é perdido (por exemplo, se um único quadro é perdido ou se quadros consecutivos são perdidos). Na sétima modalidade, basta que uma detecção de descontinuidade seja feita com o uso, por exemplo, do resultado da decodificação do código de determinação de descontinuidade incluído nos códigos de áudio, e o método de como deve ser realizado não se limita ao que foi dito acima.
[000225] Um dispositivo de processamento de sinal de áudio de acordo com a sétima modalidade tem a mesma configuração que aquela do supracitado decodificador de áudio 1 na Figura 1 e tem uma nova característica no decodificador de código de áudio e assim, o decodificador de código de áudio será descrito abaixo.
[000226] A Figura 26 mostra uma configuração de exemplo do deco- dificador de áudio 1S de acordo com a sétima modalidade, e a Figura 27 mostra um fluxograma dos processos realizados no decodificador de áudio. Como mostrado na Figura 26, além do decodificador de código de áudio 12G supracitado, o gerador de sinal de ocultação 13 e o buffer de estado interno 14, o decodificador de áudio 1S tem uma determinador de estado de recepção 16 que determina os estados de recepção de pacote em alguns quadros anteriores e armazena um histórico de perda de pacote.
[000227] O determinador de estado de recepção 16 determina um estado de recepção de pacote e atualiza as informações de histórico de perda de pacote com base em um resultado de determinação (etapa S50 na Figura 27).
[000228] Quando uma perda de pacote é detectada (NÃO na etapa S100), o determinador de estado de recepção 16 emite um resultado de detecção de perda de pacote do quadro pertinente ao gerador de sinal de ocultação 13, e o gerador de sinal de ocultação 13 gera o sinal de ocultação como descrito acima e atualiza os estados internos (etapas S300, S400). O gerador de sinal de ocultação 13 também pode utilizar as informações de histórico de perda de pacote para a interpolação de parâmetros ou similares.
[000229] Por outro lado, quando nenhuma perda de pacote é detectada (SIM na etapa S100), o determinador de estado de recepção 16 emite as informações de histórico de perda de pacote que incluem um resultado de detecção de perda de pacote do quadro pertinente e dos códigos de áudio incluídos no pacote recebido ao decodificador de código de áudio 12, e o decodificador de código de áudio 12 decodifica os códigos de áudio como descrito antes e atualiza os estados internos (etapas S200, S400).
[000230] Consequentemente, os processos das etapas S50 a S400 são repetidos até que a comunicação termine (ou até que a etapa S500 resulte em uma determinação de SIM).
[000231] A Figura 28 mostra uma configuração funcional de exemplo do decodificador de código de áudio 12G, e a Figura 29 mostra um fluxograma dos processos de cálculo realizados pelos coeficientes de LP. Um exemplo será descrito abaixo com o uso das informações de histórico de perda de pacote apenas para a calculadora de coeficiente de LP 122, mas o decodificador de código de áudio pode ser configurado para usar as informações de histórico de perda de pacote para outros elementos constitutivos.
[000232] Uma vez que o decodificador de código de áudio 12G tem a mesma configuração como descrito na primeira modalidade, exceto para a configuração associada ao processo de cálculo de coeficientes de LP, abaixo será descrita a configuração e sua operação associada ao processo de cálculo de coeficientes de LP.
[000233] O decodificador de ISF 120 decodifica os códigos de ISF da mesma maneira que aquele realizado na primeira modalidade e emite os parâmetros de ISF ao processador de estabilidade 121 (etapa S71 na Figura 29).
[000234] O detector de descontinuidade 129 se refere às informações de histórico de perda de pacote para determinar o estado de recepção (etapa S72). O detector de descontinuidade 129 pode ser desenvolvido, por exemplo, da seguinte maneira: ele armazena um padrão de recepção específico que indica, por exemplo, uma perda de pacote que ocorreu três quadros antes, a recepção normal que ocorreu dois quadros antes e uma perda de pacote que ocorreu um quadro antes. Quando o padrão de recepção é reconhecido, que foi buscado, ele define uma bandeira de estado de recepção como desligada e, de outro modo, define a bandeira de estado de recepção como ligada.
[000235] Além disso, o detector de descontinuidade 129 detecta uma descontinuidade da mesma maneira como descrito em uma das primeira à sexta modalidades.
[000236] Em seguida, o processador de estabilidade 121 realiza o processo de estabilidade de acordo com a bandeira de estado de recepção e um resultado da detecção de descontinuidade, por exemplo, conforme descrito abaixo (etapa S73).
[000237] Quando a bandeira de estado de recepção é desligada, o processador de estabilidade 121 realiza o mesmo processo que aquele realizado quando uma descontinuidade não é detectada, independente do resultado da detecção de descontinuidade.
[000238] Por outro lado, quando a bandeira de recepção é ligada e quando o resultado da detecção de descontinuidade indica que uma descontinuidade não é detectada, o processador de estabilidade 121 realiza o mesmo processo que aquele realizado quando uma descon- tinuidade não é detectada.
[000239] Além disso, quando a bandeira de recepção é ligada e quando o resultado da detecção de descontinuidade é de detecção de descontinuidade, o processador de estabilidade 121 realiza o mesmo processo que aquele realizado quando uma descontinuidade é detectada.
[000240] Consequentemente, as operações (etapas S74 a S76) do conversor de ISF-ISP 122A, do interpolador de ISP 122B e do conversor de ISP-LPC 122C na calculadora de coeficiente de LP 122 são realizadas da mesma maneira que aquele realizado na primeira modalidade.
[000241] Na sétima modalidade como descrito acima, o processo de estabilidade é realizada dependendo do resultado da detecção de descontinuidade e do estado da bandeira de estado de recepção, através dos quais o processamento mais preciso pode ser executado, enquanto é considerado como o quadro foi perdido (por exemplo, se um único quadro foi perdido ou se quadros consecutivos foram perdidos). Com relação aos Programas de Processamento de Sinal de Áudio
[000242] A seguir, descreve-se os programas de processamento de sinal de áudio que programam um computador para operar como um dispositivo de processamento de sinal de áudio de acordo com a presente invenção.
[000243] A Figura 32 é um desenho que mostra várias configurações de exemplo dos programas de processamento de sinal de áudio. A Figura 30 é uma configuração de hardware do computador de exemplo, e a Figura 31 mostra uma vista esquemática de um computador. Os programas de processamento de sinal de áudio P1-P4 (que serão chamados aqui, em geral, de "programa de processamento de sinal de áudio P") mostrados na Figura 32 (a) a (d), respectivamente, pode programar o computador C10 mostrado nas Figuras 31 e 32 para operar como um dispositivo de processamento de sinal de áudio. Deve-se observar que o programa de processamento de sinal de áudio P descrito no presente relatório descritivo pode ser implementado não apenas no computador, como mostrado nas Figuras 31 e 32, mas também em qualquer dispositivo de processamento de informação, como um telefone celular, um assistente pessoal digital, ou computador pessoal portátil.
[000244] O programa de processamento de sinal de áudio P pode ser fornecido em uma forma armazenada em um meio de gravação M. Os exemplos do meio de gravação M incluem os meios de gravação, como o disco flexível, CD-ROM, DVD ou ROM, memórias semicondutoras e assim por diante.
[000245] Como mostrado na Figura 30, o computador C10 tem um dispositivo de leitura C12 como uma unidade de acionamento de disco rígido, uma unidade de acionamento de CD-ROM ou uma unidade de acionamento de DVD, uma memória de trabalho (RAM) C14, uma memória C16 para armazenar um programa armazenado no meio de gravação M, um visor C16, um mouse C20 e um teclado C2 como dispositivos de entrada, um dispositivo de comunicação C24 para executar a transmissão/recepção de dados ou similares e uma unidade de processamento central (CPU) C26 para controlar a execução do programa.
[000246] Quando o meio de gravação M é inserido no dispositivo de leitura C12, o computador C10 se torna acessível para o programa de processamento de sinal de áudio P armazenado no meio de gravação M através do dispositivo de leitura C12 e é capaz de operar como um dispositivo de processamento de sinal de áudio programado pelo programa de processamento de sinal de áudio P.
[000247] O programa de processamento de sinal de áudio P pode ser um fornecido como sinal de dados de computador W sobreposto em uma onda de portadora, como mostrado na Figura 31, transmitido através de uma rede. Nesse caso, o computador C10 armazena o programa de processamento de sinal de áudio P recebido pelo dispositivo de comunicação C24 na memória C16 e, em seguida, executa o programa de processamento de sinal de áudio P.
[000248] O programa de processamento de sinal de áudio P pode ser configurado ao adotar várias configurações mostradas na Figura 32 (a) a (d). Essas correspondem às configurações citadas nas reivindicações 18 a 21 associadas aos programas de processamento de sinal de áudio, como apresentado no escopo das reivindicações. Por exemplo, o programa de processamento de sinal de áudio P1 mostrado na Figura 32 (a) tem um módulo de detecção de descontinuidade P11 e um módulo de correção de descontinuidade P12. O programa de processamento de sinal de áudio P2 mostrado na Figura 32 (b) em um módulo de quantificação de ISF/LSF P21, um módulo de ocultação de ISF/LSF P22, um módulo de detecção de descontinuidade P23 e um módulo de codificação de informações auxiliares P24. O programa de processamento de sinal de áudio P3 mostrado na Figura 32 (c) tem um módulo de detecção de descontinuidade P31, um módulo de codificação de informações auxiliares P32 e um módulo de quantificação de ISF/LSF P33. O pro- grama de processamento de sinal de áudio P4 mostrado na Figura 32 (d) tem o módulo de decodificação de informações auxiliares P41, um módulo de correção de descontinuidade P42 e um módulo de decodi- ficação de ISF/LSF P43.
[000249] Ao implementar as várias modalidades descritas acima, a qualidade subjetiva pode ser aprimorada ao reduzir um áudio descontínuo que pode ocorrer na recuperação de uma perda de pacote no ponto de partida de áudio.
[000250] O processador de estabilidade, que é o primeiro recurso da invenção, é configurado de modo que quando uma descontinuidade é detectada no primeiro pacote que é recebido de maneira correta depois de uma perda de pacote ocorre, por exemplo, uma distância entre os elementos dos parâmetros de ISF é definida de forma mais ampla que o normal, através da qual pode evitar que o ganho dos coeficientes de LP se torne muito grande. Uma vez que pode evitar tanto que o ganho do coeficiente de LP quanto a energia do sinal de excitação aumentem, uma descontinuidade do sinal sintetizado é reduzida, através da qual uma degradação da a qualidade subjetiva pode ser suprimida. Além disso, o processador de estabilidade pode reduzir uma descontinuidade do sinal sintetizado ao multiplicar o sinal sintetizado pelo ganho calculado mediante o uso dos coeficientes de LP ou similares.
[000251] O detector de descontinuidade, que é o segundo recurso da invenção, monitora o ganho do sinal de excitação incluído no primeiro capote que é recebido de maneira correta depois de uma perda de pacote ocorre e determina uma descontinuidade para um pacote cujo ganho do sinal de excitação aumentou mais do que um determinado nível.Lista de Referência11 , 1S, 1X decodificador de áudio;12 detector de perda de pacote; 13 , 12A, 12B, 12D, 12E, 12G, 12S decodificador de código de áudio;14 , 13X gerador de sinal de ocultação;15 buffer de estado interno;16 decodificador de energia residual de predição normalizada decodi- ficador;17 determinador de estado de recepção;21 , 21S analisador/codificador;22 codificador residual;23 multiplexador de código;120 decodificador de ISF;121 , 121S processador de estabilidade;121X ajustador de ganho;121Y multiplicador de ganho;122 calculadora de coeficiente de LP;122A conversor de ISF-ISP;122B interpolador de ISP;122C conversor de ISP-LPC;123 calculadora de livro código adaptativo;124 decodificador de livro código fixo;125 decodificador de ganho;126 sintetizador de vetor de excitação;127 pós-filtro;128 filtro de síntese;129 detector de descontinuidade;130 interpolador de coeficiente de LP;131 interpolador de atraso de intervalo;132 interpolador de ganho;133 gerador de sinal de ruído;134 pós-filtro;135 filtro de síntese; 136 calculadora de livro código adaptativo;137 sintetizador de vetor de excitação;138 ajustador residual de predição normalizada;210 analisador de LP;211 conversor de LP-ISF;212 codificador de ISF;213 determinador de descontinuidade;214 ocultador de ISF;215 conversor de LP-ISF;216 ISF buffer;C10 computador;C12 dispositivo de leitura;C14 memória de trabalho;C16 memória;C18 visor;C20 mouse;C22 teclado;C24 dispositivo de comunicação;C26 CPU;M meio de gravação;P1 a P4 programa de processamento de sinal de áudios;P11 módulo de detecção de descontinuidade;P12 módulo de correção de descontinuidade;P21 módulo de quantificação de ISF/LSF;P22 módulo de ocultação de ISF/LSF;P23 módulo de detecção de descontinuidade;P24 módulo de codificação de informações auxiliares;P31 módulo de detecção de descontinuidade;P32 módulo de codificação de informações auxiliares;P33 módulo de quantificação de ISF/LSF; P41 módulo de decodificação de informações auxiliares;P42 módulo de correção de descontinuidade;P43 ISF/LSF módulo de decodificação;W sinal de dados de computador.

Claims (10)

1. Método de processamento de sinal de áudio executado por umdispositivo de processamento de sinal de áudio caracterizado pelo fato de que compreende:uma etapa de estimação de descontinuidade causada por um aumento repentino de uma amplitude de um áudio decodificado obtida ao decodificar um pacote de áudio que é recebido de maneira correta pela primeira vez depois de uma ocorrência de uma perda de pacote;uma etapa de correção de uma descontinuidade de um áudio decodificado;em que uma etapa de correção altera intervalos entre os elementos de parâmetros de ISF/LSF para ser maior do que em condições normais de acordo com os resultados da estimação de descontinuidade.
2. Método de processamento de sinal de áudio, de acordo com areivindicação 1, caracterizado pelo fato de que uma etapa de correção gera um intervalo maior que o intervalo normalmente disposto para garantia de estabilidade como intervalo entre os elementos de parâmetros de ISF/LSF.
3. Método de processamento de sinal de áudio, de acordo com areivindicação 1, caracterizado pelo fato de que uma etapa de correção usa um intervalo obtido por dividir igualmente os parâmetros de ISF/LSF até uma dimensão predeterminada como um intervalo entre os elementos de parâmetros de ISF/LSF.
4. Método de processamento de sinal de áudio, de acordo com areivindicação 1, caracterizado pelo fato de que uma etapa de correção substitui parte ou todos dos parâmetros de ISF/LSF por um vetor predeterminado.
5. Método de processamento de sinal de áudio, de acordo comqualquer uma das reivindicações 1 a 4, caracterizado pelo fato de que compreende ainda:uma etapa de determinação do estado de recepção para determinar um estado de recepção de pacote de um número predeterminado de quadros do passado;uma etapa de correção que corrige a descontinuidade, com base no resultado da determinação do estado de recepção de pacotes, além do resultado da estimação de descontinuidade.
6. Dispositivo de processamento de sinal de áudio caracterizado pelofato de que compreende:um estimador de descontinuidade que estima a descontinuidade causada por um aumento repentino de uma amplitude de um áudio decodificado obtida ao decodificar um pacote de áudio que é recebido de maneira correta pela primeira vez depois de uma ocorrência de uma perda de pacote;um corretor de descontinuidade que corrige a descontinuidade de um áudio decodificado;em que o corretor de descontinuidade altera intervalos entre os elementos de parâmetros de ISF/LSF para ser maior do que em condições normais de acordo com os resultados da estimação de descontinuidade.
7. Método de processamento de sinal de áudio executado por umdispositivo de processamento de sinal de áudio caracterizado pelo fato de que compreende:uma etapa de quantificação de parâmetros de ISF/LSF;uma etapa de geração de parâmetros de ocultação de ISF/LSF que são informações de ocultação relacionadas a parâmetros de ISF/LSF;uma etapa de estimação de descontinuidade causada em um pacote de áudio que é recebido de maneira correta pela primeira vez depois de uma ocorrência de uma perda de pacote, utilizando a distância entre parâmetros quantificados de ISF/LSF obtidos no processo de quantificação de parâmetros de ISF/LSF e parâmetros de ocultação de ISF/LSF gerados;uma etapa de codificação de informações auxiliares sobre a descontinuidade.
8. Dispositivo de processamento de sinal de áudio caracterizado pelofato de que compreende:um quantificador de ISF/LSF que quantifica parâmetros de ISF/LSF;um ocultador de ISF/LSF que gera parâmetros de ocultação de ISF/LSF que são informações de ocultação relacionadas a parâmetros de ISF/LSF;um estimador de descontinuidade que estima a descontinuidade causada em um pacote de áudio que é recebido de maneira correta pela primeira vez depois de uma ocorrência de uma perda de pacote, utilizando a distância entre parâmetros quantificados de ISF/LSF obtidos no processo de quantificação do quantificador de ISF/LSF e parâmetros de ocultação de ISF/LSF gerados pelo ocultador de ISF/LSF;um codificador de informações auxiliares que codifica informações auxiliares sobre a descontinuidade.
9. Método de processamento de sinal de áudio executado por umdispositivo de processamento de sinal de áudio caracterizado pelo fato de que compreende:uma etapa de decodificação e emissão das informações auxiliares sobre a descontinuidade causada em um pacote de áudio que é recebido de maneira correta pela primeira vez depois de uma ocorrência de uma perda de pacote;uma etapa de correção de descontinuidade de um áudio decodificado;uma etapa de utilização de parâmetros residuais quantificados de ISF/LSF do passado nos cálculos de ISF/LSF no referente quadro, caso as informações auxiliares não exibam a estimativa de descontinuidade, e de evitamento de utilização de parâmetros residuais quantificados de ISF/LSF do passado nos cálculos de ISF/LSF no referente quadro, caso as informações auxiliares exibam a estimativa de descontinuidade.
10. Método de processamento de sinal de áudio executado por umdispositivo de processamento de sinal de áudio caracterizado pelo fato de que compreende:uma etapa de estimação de descontinuidade causada em um pacote de áudio que é recebido de maneira correta pela primeira vez depois de uma ocorrência de uma perda de pacote;uma etapa de codificação de informações auxiliares relacionadas à descontinuidade;uma etapa de utilização de parâmetros residuais quantificados de ISF/LSF do passado na quantificação de ISF/LSF no referente quadro, caso a descontinuidade não seja estimada, e de evitamento de utilização de parâmetros residuais quantificados de ISF/LSF do passado na quantificação de ISF/LSF no referente quadro, caso a descontinuidade seja estimada.
BR112016003291-8A 2013-10-29 2014-10-10 Dispositivos e métodos de processamento de sinal de áudio BR112016003291B1 (pt)

Priority Applications (1)

Application Number Priority Date Filing Date Title
BR122017020760-1A BR122017020760B1 (pt) 2013-10-29 2014-10-10 Dispositivo de processamento de sinal de áudio e método de processamento de sinal de áudio

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013224120A JP5981408B2 (ja) 2013-10-29 2013-10-29 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム
JP2013-224120 2013-10-29
PCT/JP2014/077215 WO2015064346A1 (ja) 2013-10-29 2014-10-10 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム

Publications (2)

Publication Number Publication Date
BR112016003291A8 BR112016003291A8 (pt) 2020-02-04
BR112016003291B1 true BR112016003291B1 (pt) 2022-02-15

Family

ID=53003956

Family Applications (2)

Application Number Title Priority Date Filing Date
BR112016003291-8A BR112016003291B1 (pt) 2013-10-29 2014-10-10 Dispositivos e métodos de processamento de sinal de áudio
BR122017020760-1A BR122017020760B1 (pt) 2013-10-29 2014-10-10 Dispositivo de processamento de sinal de áudio e método de processamento de sinal de áudio

Family Applications After (1)

Application Number Title Priority Date Filing Date
BR122017020760-1A BR122017020760B1 (pt) 2013-10-29 2014-10-10 Dispositivo de processamento de sinal de áudio e método de processamento de sinal de áudio

Country Status (21)

Country Link
US (5) US9799344B2 (pt)
EP (4) EP3065134B1 (pt)
JP (1) JP5981408B2 (pt)
KR (5) KR102155618B1 (pt)
CN (6) CN110164457B (pt)
AU (5) AU2014341476B2 (pt)
BR (2) BR112016003291B1 (pt)
CA (4) CA2918715C (pt)
DK (2) DK3065134T3 (pt)
ES (2) ES2732440T3 (pt)
FI (1) FI3528247T3 (pt)
HK (1) HK1223188A1 (pt)
HU (1) HUE063871T2 (pt)
MX (1) MX347234B (pt)
MY (3) MY179197A (pt)
PL (2) PL3065134T3 (pt)
PT (2) PT3528247T (pt)
RU (5) RU2651234C2 (pt)
SG (1) SG11201600542VA (pt)
TR (1) TR201909126T4 (pt)
WO (1) WO2015064346A1 (pt)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5981408B2 (ja) * 2013-10-29 2016-08-31 株式会社Nttドコモ 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム
JP6914390B2 (ja) * 2018-06-06 2021-08-04 株式会社Nttドコモ 音声信号処理方法
CN110111805B (zh) * 2019-04-29 2021-10-29 北京声智科技有限公司 远场语音交互中的自动增益控制方法、装置及可读存储介质
CN114613372B (zh) * 2022-02-21 2022-10-18 北京富通亚讯网络信息技术有限公司 一种音频传输抗丢包的错误隐藏技术方法

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970011728B1 (ko) * 1994-12-21 1997-07-14 김광호 음향신호의 에러은닉방법 및 그 장치
US6178317B1 (en) * 1997-10-09 2001-01-23 Ibiquity Digital Corporation System and method for mitigating intermittent interruptions in an audio radio broadcast system
US6775649B1 (en) * 1999-09-01 2004-08-10 Texas Instruments Incorporated Concealment of frame erasures for speech transmission and storage system and method
AU7486200A (en) * 1999-09-22 2001-04-24 Conexant Systems, Inc. Multimode speech encoder
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
JP2001228896A (ja) * 2000-02-14 2001-08-24 Iwatsu Electric Co Ltd 欠落音声パケットの代替置換方式
EP1199709A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Error Concealment in relation to decoding of encoded acoustic signals
US7031926B2 (en) 2000-10-23 2006-04-18 Nokia Corporation Spectral parameter substitution for the frame error concealment in a speech decoder
US7590525B2 (en) * 2001-08-17 2009-09-15 Broadcom Corporation Frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
KR100587953B1 (ko) * 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
JP4445328B2 (ja) * 2004-05-24 2010-04-07 パナソニック株式会社 音声・楽音復号化装置および音声・楽音復号化方法
KR100723409B1 (ko) * 2005-07-27 2007-05-30 삼성전자주식회사 프레임 소거 은닉장치 및 방법, 및 이를 이용한 음성복호화 방법 및 장치
ATE527833T1 (de) * 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
US8798172B2 (en) * 2006-05-16 2014-08-05 Samsung Electronics Co., Ltd. Method and apparatus to conceal error in decoded audio signal
CN101496095B (zh) * 2006-07-31 2012-11-21 高通股份有限公司 用于信号变化检测的系统、方法及设备
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US7796626B2 (en) * 2006-09-26 2010-09-14 Nokia Corporation Supporting a decoding of frames
KR20090076964A (ko) 2006-11-10 2009-07-13 파나소닉 주식회사 파라미터 복호 장치, 파라미터 부호화 장치 및 파라미터 복호 방법
KR100862662B1 (ko) * 2006-11-28 2008-10-10 삼성전자주식회사 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치
KR101291193B1 (ko) * 2006-11-30 2013-07-31 삼성전자주식회사 프레임 오류은닉방법
BRPI0808200A8 (pt) 2007-03-02 2017-09-12 Panasonic Corp Dispositivo de codificação de áudio e dispositivo de decodificação de áudio
CN101542593B (zh) * 2007-03-12 2013-04-17 富士通株式会社 语音波形内插装置及方法
CN101681625B (zh) * 2007-06-08 2012-11-07 杜比实验室特许公司 用于从两个输入的音频信号获得两个环绕声音频通道的方法和设备
CN100524462C (zh) * 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
JP4977157B2 (ja) * 2009-03-06 2012-07-18 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
CN101958119B (zh) * 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
EP2584561B1 (en) * 2010-06-21 2018-01-10 III Holdings 12, LLC Decoding device, encoding device, and methods for same
CN101894558A (zh) * 2010-08-04 2010-11-24 华为技术有限公司 丢帧恢复方法、设备以及语音增强方法、设备和系统
PL2975610T3 (pl) * 2010-11-22 2019-08-30 Ntt Docomo, Inc. Sposób i urządzenie do kodowania audio
JP5694745B2 (ja) * 2010-11-26 2015-04-01 株式会社Nttドコモ 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム
JP5981408B2 (ja) * 2013-10-29 2016-08-31 株式会社Nttドコモ 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム
EP3483883A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering

Also Published As

Publication number Publication date
CN110176239A (zh) 2019-08-27
KR20170127076A (ko) 2017-11-20
CN110265045B (zh) 2023-11-14
CA3081225C (en) 2022-10-04
KR102155618B1 (ko) 2020-09-14
CA3081225A1 (en) 2015-05-07
KR101764234B1 (ko) 2017-08-03
ES2732440T3 (es) 2019-11-22
PT3065134T (pt) 2019-07-04
DK3528247T3 (da) 2023-10-02
SG11201600542VA (en) 2016-02-26
RU2651234C2 (ru) 2018-04-18
PL3528247T3 (pl) 2024-02-19
CN110164456A (zh) 2019-08-23
AU2021290404B2 (en) 2023-07-20
PL3065134T3 (pl) 2019-09-30
KR102036704B1 (ko) 2019-10-25
CA2918715A1 (en) 2015-05-07
EP3528248A1 (en) 2019-08-21
RU2680748C1 (ru) 2019-02-26
CN105393303B (zh) 2019-07-16
TR201909126T4 (tr) 2019-07-22
KR20160025000A (ko) 2016-03-07
CN110176239B (zh) 2023-01-03
KR20170087544A (ko) 2017-07-28
EP3065134B1 (en) 2019-05-29
EP3065134A1 (en) 2016-09-07
MY191134A (en) 2022-05-31
CN105393303A (zh) 2016-03-09
CA2918715C (en) 2018-06-12
RU2016120629A (ru) 2017-12-05
US10621999B2 (en) 2020-04-14
CN110164458A (zh) 2019-08-23
KR101978997B1 (ko) 2019-05-15
US20220139411A1 (en) 2022-05-05
AU2021290404A1 (en) 2022-02-03
CN110265045A (zh) 2019-09-20
CA3002931C (en) 2020-07-14
AU2018274861B2 (en) 2020-11-26
US11270715B2 (en) 2022-03-08
CN110164457A (zh) 2019-08-23
CA3168576A1 (en) 2015-05-07
BR122017020760B1 (pt) 2022-02-15
AU2014341476A1 (en) 2016-02-18
AU2018274861A1 (en) 2018-12-20
FI3528247T3 (fi) 2023-10-02
AU2020294314A1 (en) 2021-02-11
RU2018112250A3 (pt) 2019-03-01
WO2015064346A1 (ja) 2015-05-07
KR101798635B1 (ko) 2017-11-16
BR112016003291A8 (pt) 2020-02-04
JP5981408B2 (ja) 2016-08-31
CA3002931A1 (en) 2015-05-07
KR20190040084A (ko) 2019-04-16
US20190051313A1 (en) 2019-02-14
PT3528247T (pt) 2023-09-29
US9799344B2 (en) 2017-10-24
EP3065134A4 (en) 2016-09-07
RU2018112250A (ru) 2019-03-01
US10152982B2 (en) 2018-12-11
US20180068669A1 (en) 2018-03-08
JP2015087456A (ja) 2015-05-07
DK3065134T3 (da) 2019-06-24
HK1223188A1 (zh) 2017-07-21
RU2707727C1 (ru) 2019-11-28
EP3528247B1 (en) 2023-09-06
AU2017204606B2 (en) 2018-09-06
MY179197A (en) 2020-10-30
AU2020294314B2 (en) 2021-10-21
CN110164457B (zh) 2023-01-03
ES2959667T3 (es) 2024-02-27
RU2701075C1 (ru) 2019-09-24
AU2014341476B2 (en) 2017-05-25
MY191135A (en) 2022-05-31
US11749291B2 (en) 2023-09-05
AU2017204606A1 (en) 2017-07-27
RU2682927C2 (ru) 2019-03-22
EP3528247A1 (en) 2019-08-21
MX2016005162A (es) 2016-07-05
KR20190121884A (ko) 2019-10-28
EP3528246A1 (en) 2019-08-21
HUE063871T2 (hu) 2024-02-28
MX347234B (es) 2017-04-19
CN110164456B (zh) 2023-11-14
US20160240202A1 (en) 2016-08-18
US20200234723A1 (en) 2020-07-23

Similar Documents

Publication Publication Date Title
AU2020294314B2 (en) Audio signal processing device, audio signal processing method, and audio signal processing program
JP6691169B2 (ja) 音声信号処理方法及び音声信号処理装置
JP6914390B2 (ja) 音声信号処理方法
JP6133454B2 (ja) 音声信号処理方法及び音声信号処理装置
JP6352487B2 (ja) 音声信号処理方法及び音声信号処理装置

Legal Events

Date Code Title Description
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 10/10/2014, OBSERVADAS AS CONDICOES LEGAIS.