BR112015032013B1 - Método e equipamento para a obtenção de coeficientes do espectropara um quadro de substituição de um sinal de áudio, descodificador de áudio,receptor de áudio e sistema para transmissão de sinais de áudio - Google Patents

Método e equipamento para a obtenção de coeficientes do espectropara um quadro de substituição de um sinal de áudio, descodificador de áudio,receptor de áudio e sistema para transmissão de sinais de áudio Download PDF

Info

Publication number
BR112015032013B1
BR112015032013B1 BR112015032013-9A BR112015032013A BR112015032013B1 BR 112015032013 B1 BR112015032013 B1 BR 112015032013B1 BR 112015032013 A BR112015032013 A BR 112015032013A BR 112015032013 B1 BR112015032013 B1 BR 112015032013B1
Authority
BR
Brazil
Prior art keywords
frame
spectrum
substitution
coefficients
peak
Prior art date
Application number
BR112015032013-9A
Other languages
English (en)
Other versions
BR112015032013A2 (pt
Inventor
Christian Helmrich
Goran Markovic
Bernd Edler
Ralph Sperschneider
Janine Sukowski
Wolfgang Jaegers
Ralf Geiger
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der Angewandten ForschungE.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft zur Förderung der Angewandten ForschungE.V. filed Critical Fraunhofer-Gesellschaft zur Förderung der Angewandten ForschungE.V.
Publication of BR112015032013A2 publication Critical patent/BR112015032013A2/pt
Publication of BR112015032013B1 publication Critical patent/BR112015032013B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

“MÉTODO E EQUIPAMENTO PARA A OBTENÇÃO DE COEFICIENTES DO ESPECTRO PARA UM QUADRO DE SUBSTITUIÇÃO DE UM SINAL DE ÁUDIO, DESCODIFICADOR DE ÁUDIO, RECEPTOR DE ÁUDIO E SISTEMA PARA TRANSMISSÃO DE SINAIS DE ÁUDIO”. Abordagem é descrita para obter coeficientes de espectro para um quadro de substituição (m) de um sinal de áudio. Um componente tonal de um espectro de um sinal de áudio é detectado com base em um pico que existe nos espectros de quadros anteriores a um quadro de substituição (m). Para o componente tonal do espectro, um coeficiente de espectro para o pico (502) e o seu meio exterior no espectro do quadro de substituição (m) é predito, e para o componente não-tonal de espectro, um coeficiente do espectro não-predito para o quadro de substituição (m) ou um coeficiente do espectro correspondente de um quadro anterior ao quadro de substituição (m) é utilizado. Fig. 1

Description

DESCRIÇÃO
[001] Esta invenção diz respeito à área de transmissão de sinais de áudio codificados, mais especificamente em um método e um equipamento para obtenção de coeficientes do espectro para um quadro de substituição de um sinal de áudio, para um descodificador áudio, para um receptor de áudio e para um sistema para transmissão de sinais de áudio. Os modelos dizem respeito em uma abordagem para construção de um espectro para um quadro de substituição baseado em quadros anteriormente recebidos.
[002] Na técnica anterior, várias abordagens são descritas tratando de uma perda de quadros em um receptor de áudio. Por exemplo, quando um quadro se perde no lado receptor de um codec de áudio ou de discurso, simples métodos para a ocultação de perda de quadros tal como descrito na referência [1] podem ser utilizados, tais como: repetição do último quadro recebido, abafamento do quadro perdido, ou parasitagem de sinais.
[003] Adicionalmente, na referência [1] uma técnica avançada utilizando preditores em sub-bandas é apresentada. A técnica de predição é então combinada com parasitagem de sinais, e o ganho da predição é utilizado como um critério de decisão da informação sub-banda para determinar qual o método deverá ser utilizado para os coeficientes espectrais desta sub-banda.
[004] Na referência [2], uma extrapolação do sinal em forma de onda no domínio temporal é utilizada para um domínio codec MDCT (Transformação Discreta de Cossenos Modificada). Este tipo de abordagem pode ser boa para sinais monofónicos incluindo discurso.
[005] Se um atraso do quadro for permitido, uma interpolação dos quadros do meio exterior pode ser utilizada para a construção do quadro perdido. Tal abordagem é descrita na referência [3], em que as magnitudes dos componentes tonais no quadro perdido com um índice m são interpoladas utilizando os quadros envolventes indexados m-1 e m+1. A informação lateral que define os sinais de coeficiente MDCT para componentes tonais é transmitida na sequência de bits. A parasitagem de sinais é utilizada para outros coeficientes não-tonais MDCT. Os componentes tonais são determinados como um número fixo pré-determinado de coeficientes espectrais com as magnitudes mais elevadas. Esta abordagem seleciona n coeficientes espectrais com as magnitudes mais elevadas como os componentes tonais.
Figure img0001
[006] A Fig. 7 ilustra um diagrama de blocos que representa uma abordagem de interpolação sem informação lateral transmitida tal como é por exemplo descrita na referência [4]. A abordagem de interpolação opera com base nos quadros de áudio codificados no domínio de frequências utilizando MDCT (Transformação Discreta de Cossenos Modificada). Um bloco de interpolação de quadros 700 recebe os coeficientes MDCT de um quadro anterior ao quadro perdido e um quadro a seguir ao quadro perdido, mais especificamente na abordagem descrita em relação à Fig. 7, os coeficientes MDCT cm_i (k) do quadro anterior e os coeficientes MDCT cm+1 (k) dos quadros seguintes são recebidos no bloco de interpolação de quadros 700. O bloco de interpolação de quadros 700 gera um coeficiente interpolado MDCT cm (k) para o quadro atual que se perdeu no receptor ou não pode prosseguir no receptor por outros motivos, por exemplo devido a erros nos dados recebidos ou idêntico. O coeficiente interpolado MDCT cm (k) à saída pelo bloco de interpolação de quadros 700 tal como aplicado ao bloco 702 originando uma magnitude de escala na banda do fator de escala e ao bloco 704 originando uma magnitude de escala um estabelecimento de índice, e os respetivos blocos 702 e 704 de saída do coeficiente MDCT cm (fc) escalado pelo fator α(k) e ã(k), respetivamente. O sinal de saída do bloco 702 é introduzido no bloco pseudo espectro 706 gerado com base no sinal de entrada recebido do pseudo espectro Pm (k) introduzido no bloco de deteção de pico 708 um sinal indicador de picos detectados. O sinal fornecido pelo bloco 702 é também aplicado ao bloco de falha aleatória do sinal 712 que, receptivo ao sinal de detecção do pico produzido pelo bloco 708, origina uma falha de sinal do sinal recebido e produz um coeficiente MDCT cm (k) modificado ao bloco de composição do espectro 710. O sinal escalado fornecido pelo bloco 704 é aplicado a um bloco de correção do sinal 714 originando, em resposta ao sinal de detecção do pico originado pelo bloco 708 uma correção do sinal do sinal escalado fornecido pelo bloco 704 e produzindo um coeficiente MDCT cm(k) modificado ao bloco de composição do espectro 710 que, com base nos sinais recebidos, gera o coeficiente MDCT cm (fc) interpolado produzido pelo bloco de composição do espectro 710. Tal como ilustrado na Fig. 7, o sinal de deteção de picos pelo bloco 708 é também fornecido ao bloco 704 gerando o coeficiente MDCT escalado.
[007] A Fig. 7 produz à saída do bloco 714 os coeficientes espectrais cm (X para o quadro perdido associado aos componente tonais, e à saída do bloco 712 os coeficientes espectrais cm(k) para componentes não-tonais são fornecidos de modo que no bloco de composição do espectro 710 com base nos coeficientes espetrais recebidos para os componentes tonais e não-tonais os coeficientes espetrais para o espectro associado ao quadro perdido sejam fornecidos.
[008] A operação da técnica FLC (Ocultação de Perda do Quadro) descrita no diagrama de blocos da Fig. 7 será em seguida ser descrita com maior detalhe.
[009] Na Fig. 7, basicamente quatro módulos podem ser distinguidos:
[010] um módulo de inserção da modulação do ruído (incluindo a interpolação do quadro 700, a magnitude de escala na banda do fator de escala 702 e a falha aleatória do sinal 712),
[011] um módulo de classificação bin MDCT (incluindo o pseudo espectro 706 e a detecção do pico 708),
[012] um módulo de operações de ocultação tonal (incluindo a magnitude de escala no índice 704 e a correção do sinal 714), e
[013] a composição do espectro 710.
[014] A abordagem tem como base a seguinte fórmula geral:
Figure img0002
[015] Cm(k) é derivada de uma interpolação binária (ver bloco 700 “Interpolação do Quadro”)
Figure img0003
[016] α*(k) derivada por uma interpolação de energia utilizando a média geométrica:
[017] banda do fator de escala para todos os componentes (ver bloco 702 “Magnitude de Escala na Banda do Fator de Escala”) e
[018] índice subconjunto para componentes tonais (ver bloco 704 “Magnitude de Escala no Índice”):
Figure img0004
[019] ■ para componentes tonais pode-se ilustrar que a = cos(πft), com fi é a frequência do componente tonal.
[020] As energias E são derivadas com base em um pseudo espectro de energia, derivado por uma simples operação de regulação:
Figure img0005
[021] s*(k) é estabelecido aleatoriamente em ±1 para componentes não- tonais (ver bloco 712 “Falha de Sinal Aleatório”), e em +1 ou -1 para componentes tonais (ver bloco 714 “Correção do Sinal”).
[022] A detecção do pico é efetuada como busca dos máximos locais no pseudo espectro de energia para detectar as posições exatas dos picos espectrais correspondentes às sinusoides subjacentes. Encontra-se baseado no processo de identificação sonora adotado no modelo psico-acústico MPEG- 1 descrito na referência [5]. Destas um índice encontra-se definido dotado da largura de banda de um lóbulo principal de uma janela de análise em termos de binários MDCT e o pico detectado no seu centro. Esses binários são tratados como binários MDCT de sons dominantes de uma sinusoide, e o subconjunto do índice é tratado como um componente tonal individual.
[023] A correlação do sinal muda os sinais de todos os binários de certo componente tonal, ou nenhum. A determinação é executada utilizando uma análise por síntese, isto é, o SFM é derivado para ambas as versões e a versão com o SFM inferior é escolhida. Para a derivação SFM, o espectro de energia é necessário, que por seu lado exige os coeficientes MDST (Transformação Discreta de Cossenos Modificada). Para manter a complexidade viável, apenas os coeficientes MDST para o componente tonal são derivados, utilizando também apenas os coeficientes MDCT deste componente tonal.
[024] A Fig. 8 ilustra um diagrama de blocos de uma técnica FLC global que, quando comparada à abordagem da Fig. 7, é refinada e descrita na referência [6]. Na Fig. 8, os coeficientes MDCT cm_± e cm+1 de um último quadro anterior ao quadro perdido e um primeiro quadro a seguir ao quadro perdido são recebidos em um bloco de classificação do binário MDCT 800. Estes coeficientes são também fornecidos ao bloco de inserção da modulação do ruído 802 e à estimativa MDCT para um bloco de componentes tonais 804. No bloco 804 também o sinal de saída fornecido pelo bloco de classificação 800 é recebido também como os coeficientes MDCT cm_2 e cm+2 da segunda ao último quadro anterior ao quadro perdido e o segundo quadro anterior ao quadro perdido, respetivamente, são recebidos. O bloco 804 gera os coeficientes MDCT cm do quadro perdido para os componentes tonais, e o bloco de inserção da modulação de ruído 802 gera os coeficientes espectrais MDCT para o quadro perdido para cm componentes não tonais. Estes coeficientes são fornecidos ao bloco de composição do espectro 806 gerados na saída dos coeficientes espectrais c;,t para o quadro perdido. O bloco de inserção da modulação de ruído 802 opera em resposta ao sistema iT gerado pelo bloco de estimativa 804.
[025] As modificações seguintes são de interesse relevante em relação à referência [4]:
[026] ■ O pseudo espectro de energia utilizado para a detecção do pico é derivado como
Figure img0006
[027] ■ Para eliminar picos perceptualmente irrelevantes ou parasitas, a detecção do pico é apenas aplicada a uma gama espectral limitada e apenas máximos local que exceda um limiar relativo ao máximo absoluto do pseudo espectro de energia é considerados. Os restantes picos são escolhidos por ordem descendente da sua magnitude, e um número especificado de máximas de topo são classificadas como picos tonais.
[028] ■ A abordagem é baseada na seguinte fórmula geral (com a desta atribuída):
Figure img0007
[029] ■ CmíkP) é derivada como em cima, mas a derivação de a torna-se mais avançada, seguindo a abordagem
Figure img0008
[030] substituindo Em, Em_± e Em+1 com
Figure img0009
[031] em que
Figure img0010
[032] produz uma expressão quadrática em a. Assim, para uma dada estimativa MDCT existem dois candidatos (com sinalizações opostas) para o fator de correção multiplicativa (A1,A2,A3 são as matrizes de transformação). A seleção da melhor estimativa é executada de modo idêntico ao descrito na referência [4].
[033] ■ Esta abordagem avançada exige dois quadros antes e após a perda do quadro de modo a derivar os coeficientes MDST do quadro anterior e posterior.
[034] Uma versão de menos atraso desta abordagem é sugerida na referência [7]:
[035] ■ Como um ponto de partida, a fórmula de interpolação c^ík) = (*) + cm+í (fc)) é reutilizada, mas é aplicada para o quadro m-1, resultando em:
Figure img0011
[036] ■ Depois, o resultado da interpolação é substituído pela verdadeira estimativa (aqui, o fator 2 torna-se parte do fator de correção: a = 2cos(πft)). conduzindo a
Figure img0012
[037] ■ O fator de correção é determinado pela observação de energias de dois quadros anteriores. Do cálculo de energia, os coeficientes MDST do quadro anterior são aproximados como
Figure img0013
[038] ■ Depois, a energia sinusoidal é calculada como
Figure img0014
[039] ■ Do mesmo modo, a energia sinusoidal para o quadro m-2 é calculada e denotada por Em_2 independente de a.
[040] ■ Emprego do requisito de energia
Figure img0015
Produzindo novamente uma expressão quadrática em a.
[041] ■ O processo de seleção para os candidatos calculados é executado como anteriormente, mas a regra de decisão considera apenas o espectro de energia do quadro anterior.
[042] Outra ocultação de perda do quadro de menos atraso no domínio de frequências é descrita na referência [8]. Os ensinamentos da referência [8] podem ser simplificados, sem perda de generalidade, como:
[043] ■ Predição utilizando um DFT de um sinal horário: (a) Obter o espectro DFT do sinal de domínio temporal descodificado que corresponde aos coeficientes do domínio de frequências codificadas recebidos cm. (b) Modular as magnitudes DFT, presumindo uma gama de fase linear, para predizer os coeficientes do domínio de frequências em falta no próximo quadro cm+í
[044] ■ Predição utilizando uma magnitude de estimativa dos espectros de frequência recebidos: (a) Encontrar ('/'„ e Sí„, utilizando Cm como entrada, tal como
Figure img0016
[045] em que Qm(k) é a magnitude do coeficiente DFT que corresponde a Cm(k).
[046] (b) Calcular:
Figure img0017
[047] (c) Executar uma extrapolação linear da magnitude e da fase:
Figure img0018
[048] ■ Utilizar filtros para calcular ('/'„ e Sí„ de Cm e depois prosseguir como em cima para obter Cm+1(k)
[049] ■ Utilizar um filtro adaptável para calcular Cm+1(k):
Figure img0019
[050] A seleção de coeficientes do espectro a serem preditos é mencionada na referência [8] mas não se encontra descrita em detalhe.
[051] Na referência [9] foi reconhecido que, para sinais quase- estacionários, a diferença de fase entre quadros sucessivos é quase constante e depende apenas da frequência fracionada. Contudo, apenas uma extrapolação linear dos dois últimos espectros complexos é utilizada.
[052] Em AMR+WB+ (ver referência [10]) um método descrito na referência [11] é utilizado. O método na referência [11] é uma extensão do método descrito na referência [8] em um sentido em que utiliza também os coeficientes espectrais disponíveis do quadro atual, assumindo que apenas uma parte do quadro atual é perdida. Contudo, a situação de uma perda total de um quadro não é considerada na referência [11].
[053] Outra ocultação da perda do quadro de menos atraso no domínio MDCT é descrita na referência [12]. Na referência [12] é em primeiro lugar determinado se o quadro perdido Pth é um quadro de harmónica múltipla. O quadro perdido Pth é um quadro de harmónica múltipla se mais do que K0 quadros entre quadros K antes do quadro Pth forem dotados de uma planidade do espectro menor do que um valor limiar. Se o quadro perdido Pth for um quadro de harmónica múltipla então os quadros (P - K)th a (P - 2)nd no domínio MDST são utilizados para predizer o quadro perdido Pth. Um coeficiente espectral é um pico se o seu espectro de energia for superior a dois coeficientes de espectro de energia adjacentes. Um pseudo espectro tal como descrito na referência [13] é utilizado para o quadro (P - 1)st.
[054] Um conjunto de coeficientes Sc é construído dos quadros de espectro de energia L1 do seguinte modo:
[055] Obtendo L1 determina S1, ..., SL1 composto por picos em cada um dos quadros Li, um número de picos em cada conjunto sendo Ni, ..., NLI respetivamente. Selecionando um conjunto deL1 determina S1, ., SL1. Para cada coeficiente de pico mj, j = i.Ni no conjunto S, considerando se existe algum coeficiente de frequências entre mj, mj±i , ., mj±k pertencendo a todos os conjuntos de picos. Se existir algum, colocando todas as frequências mj, mj±i, ., mj±k no conjunto de frequência Sc. Se não existir qualquer coeficiente de frequência pertencente a todos os outros conjuntos de picos, colocando diretamente todos os coeficientes de frequências em um quadro no conjunto de quadros Sc. A dita k é um inteiro não negativo. Para todos os coeficientes espectrais no conjunto Sc a fase é predita utilizando os quadros L2 dentre os quadros MDCT-MDST (P - K)th a (P - 2)nd. A predição é feita utilizando uma extrapolação linear (quando L2=2) ou um ajuste linear (quando L2>2). Para a extrapolação linear:
Figure img0020
[056] em que p, t1 e t2 são índices de quadros.
[057] Os coeficientes espectrais não existentes no conjunto Sc são obtidos utilizando uma série de quadros antes do quadro (P - 1)st, sem especificamente explicar como.
[058] É objetivo desta invenção fornecer uma abordagem melhorada para obter coeficientes do espectro para um quadro de substituição de um sinal de áudio.
[059] Este objetivo é obtido através do método da reivindicação 1, de um produto do programa de computador não-transitório da reivindicação 34, de um equipamento da reivindicação 35 ou da reivindicação 36, de um codificador áudio da reivindicação 37, de um receptor de áudio da reivindicação 38 e de um sistema para a transmissão de sinais de áudio da reivindicação 39.
[060] Esta invenção fornece um método para a obtenção de coeficientes do espectro para um quadro de substituição de um sinal de áudio, sendo que o método compreende:
[061] a detecção de um componente tonal de um espectro de um sinal de áudio baseado em um pico existente nos espectros dos quadros anteriores a um quadro de substituição;
[062] para o componente tonal do espectro, predizer coeficientes do espectro para o pico e o seu envolvente no espectro do quadro de substituição; e
[063] para o componente não-tonal do espectro, utilizando um coeficiente do espectro não-predito para o quadro de substituição ou um coeficiente do espectro correspondente de um quadro anterior ao quadro de substituição.
[064] Esta invenção fornece um equipamento para a obtenção de coeficientes do espectro para um quadro de substituição de um sinal de áudio, sendo que o equipamento compreende:
[065] um detector configurado para detectar um componente tonal de um espectro de um sinal de áudio baseado em um pico existente nos espectros de quadros anteriores a um quadro de substituição; e
[066] um preditor configurado para predizer para o componente tonal do espectro dos coeficientes do espectro para o pico e o seu envolvente no espectro do quadro de substituição;
[067] caracterizado por o componente não-tonal do espectro um coeficiente do espectro não-predito para o quadro de substituição ou um coeficiente do espectro correspondente de um quadro anterior ao quadro de substituição ser utilizado.
[068] Esta invenção fornece um equipamento para a obtenção de coeficientes do espectro para um quadro de substituição de um sinal de áudio, sendo que o equipamento é configurado para operar de acordo com o método inovador para obter coeficientes do espectro para um quadro de substituição de um sinal de áudio.
[069] Esta invenção fornece um descodificador áudio, compreendendo um equipamento inovador para a obtenção de coeficientes do espectro para um quadro de substituição de um sinal de áudio.
[070] Esta invenção fornece um receptor de áudio, compreendendo o descodificador áudio inovador.
[071] Esta invenção fornece um sistema para a transmissão de sinais de áudio, sendo que o sistema compreende:
[072] um codificador configurado para gerar um sinal de áudio codificado; e
[073] o descodificador inovador configurado para receber o sinal de áudio codificado, e para descodificar o sinal de áudio codificado.
[074] Esta invenção fornece um produto de programa de computador não- transitório compreendendo um meio lido por computador que armazena instruções que, quando executadas em um computador, executam o método inovador para a obtenção de coeficientes para um quadro de substituição de um sinal de áudio.
[075] A abordagem inovadora é vantajosa pois fornece uma boa ocultação de perda de quadros de sinais tonais com uma boa qualidade e sem a introdução de atraso adicional. O codec inovador de baixo atraso é vantajoso pois atua bem em ambos os sinais de discurso e de áudio e benefícios, por exemplo em um envolvente propício a erros, da boa ocultação da perda de quadros obtida especialmente para sinais tonais estacionários. Uma ocultação de perda de quadros de baixo atraso de sinais monofónicos e polifónicos é proposta, fornecendo bons resultados para sinais tonais sem degradação dos sinais não-tonais.
[076] De acordo com os modelos desta invenção, uma ocultação de componentes tonais melhorada no domínio MDCT é fornecida. Os modelos dizem respeito à codificação áudio e de discurso que inclui um codec do domínio de frequências ou um codec no domínio da troca discurso/frequência, em especial para uma ocultação de perda de quadros no domínio MDCT (Transformação Discreta de Cossenos Modificada). A invenção, de acordo com modelos, propõe um método de menos atraso para a construção de um espectro MDCT para um quadro perdido com base nos quadros anteriormente recebidos, em que o último quadro recebido é codificado no domínio de frequências utilizando MDCT.
[077] De acordo com modelos preferidos, a abordagem inovadora inclui a detecção das partes do espectro tonais, por exemplo utilizando do segundo ao último complexo de espectros para obter a localização ou colocação corretas do pico, utilizando o último espectro real para refinar a decisão se um binário é tonal, e utilizando informação de inclinação para uma melhor detecção de uma inserção ou desvio do tom, em que a informação de inclinação já existe no fluxo de bits ou é derivada no lado do descodificador. Além disso, a abordagem inovadora inclui uma disposição de uma largura do sinal adaptável de uma harmónica a ser ocultada. O cálculo do desvio de fase ou da diferença de fase entre quadros de cada coeficiente espectral que faz parte de uma harmónica é também fornecida, sendo que este cálculo tem como base o último espectro disponível, por exemplo o espectro CMDCT, sem necessidade do segundo ao último CMDCT. De acordo com modelos, a diferença de fase é refinada utilizando os últimos espectros MDCT recebidos, e o refinamento pode ser adaptável, dependendo do número de quadros perdidos consecutivamente. O espectro CMDCT pode ser construído a partir do sinal de domínio temporal descodificado que é vantajoso pois evita a necessidade de qualquer alinhamento com a estrutura codec, e permite que a construção do espectro complexo esteja o mais próxima possível do quadro perdido através da exploração das propriedades de janelas de baixa sobreposição. Modelos da invenção fornecem uma decisão por quadro para utilizar uma ocultação do domínio temporal ou do domínio de frequências.
[078] A abordagem inovadora é vantajosa, pois opera totalmente com base na informação já disponível no lado do receptor quando determina que um quadro foi perdido ou precisa de ser substituído e não há necessidade de informação lateral adicional que precisa ser recebida de modo que não existe fonte para atrasos adicionais que ocorrem em abordagens da técnica anterior dada a necessidade de receber a informação lateral adicional ou derivar a informação lateral adicional da informação concreta existente.
[079] A abordagem inovadora é vantajosa quando comparada com as abordagens da técnica anterior em cima descrita tal como os inconvenientes subsequentemente descritos de tais abordagens, reconhecidos pelos inventores desta invenção, são evitados quando se aplica a abordagem inovadora.
[080] Os métodos para a ocultação da perda de quadros descrita na referência [1] não são suficientemente robustos e não produzem suficientemente bons resultados para sinais tonais.
[081] A extrapolação do sinal em forma de onda no domínio temporal, tal como descrito na referência [2], não pode conter sinais polifónicos e necessita de uma complexidade aumentada para ocultação de todos os sinais estacionários, tonais, como um retardamento da inclinação exato deverá ser determinada.
[082] Na referência [3] um atraso adicional é introduzido e informação lateral significativa é necessária. A seleção do componente tonal é muito simples e irá escolher muitos picos dentre os componentes não-tonais.
[083] O método descrito na referência [4] exige uma antecipação no lado descodificador e por isso introduz um atraso adicional de um quadro. Utilizando o pseudo espectro de energia alisada para a detecção de picos reduz a precisão da localização dos picos. Reduz também a fiabilidade da detecção pois irá detectar picos do ruído que surge em apenas um quadro.
[084] O método descrito na referência [6] exige uma antecipação no lado descodificador e por isso introduz um atraso adicional de dois quadros. A seleção do componente tonal não corresponde a componentes tonais nas dois quadros em separado, mas conta com nu espectro médio, e assim será dotada de demasiados falsos positivos ou falsos negativos tornando possível ajustar os limiares de detecção dos picos. A localização dos picos não será precisa pois o pseudo espectro de energia é utilizado. A gama espectral limitada para a busca de picos parece-se com um envolvente para os problemas descritos que surgem porque o pseudo espectro de energia é utilizado.
[085] O método descrito na referência [7] tem como base no método descrito na referência [6] e por isso tem os mesmos inconvenientes. Apenas ultrapassa o atraso adicional.
[086] Na referência [8] não existe descrição detalhada da decisão se um coeficiente espectral pertence à parte tonal do sinal. Contudo, a sinergia entre a detecção dos coeficientes espectrais tonais e a ocultação é importante e assim uma boa detecção de componentes tonais é importante. Além disso, não foi reconhecida a utilização de filtros dependentes de ambos cm e cm_1 (ou seja cm, cm_± e sm_±, como sm_± podem ser calculados quando cm e cm_± está disponível) para calcular c'ru e . Também, não foi reconhecida a utilização da possibilidade em calcular um espectro complexo que não se encontra alinhado à estrutura do sinal codificado, dada com janelas de baixa sobreposição. Além disso, não foi reconhecida a utilização da possibilidade de calcular a diferença de fase entre quadros apenas baseados no segundo último complexo do espectro.
[087] Na referência [2] pelo menos três quadros anteriores deverão ser armazenados na memória, aumentando assim significativamente os requisitos de memória. A decisão se deverá utilizar-se a ocultação tonal pode estar errada e um quadro com uma ou mais harmónicas pode ser classificado como um quadro sem harmónicas múltiplas. O quadro MDCT recebido em último lugar não é diretamente utilizado para melhorar a predição do espectro MDCT perdido, mas apenas na busca pelos componentes tonais. O número de coeficientes MDCT a serem ocultados para uma harmónica é fixo. Contudo, dependendo do nível de ruído, é desejável ter um número variável de coeficientes MDCT que constituam uma harmónica.
[088] A seguir, modelos desta invenção serão descritos com maior detalhe com referência aos desenhos que acompanham os desenhos, os quais:
[089] A Fig. 1 ilustra um diagrama de blocos simplificado de um sistema para transmissão de sinais de áudio que implementa a abordagem inovadora do lado descodificador,
[090] A Fig. 2 ilustra um fluxograma da abordagem inovadora de acordo com um modelo,
[091] A Fig. 3 é uma representação esquemática das janelas de sobreposição MDCT para quadros adjacentes,
[092] A Fig. 4 ilustra um fluxograma que representa etapas para apanhar um pico de acordo com um modelo,
[093] A Fig. 5 é uma representação esquemática de um espectro de energia de um quadro a partir do qual um ou mais picos são detectados,
[094] A Fig. 6 ilustra um exemplo para um “entre quadros”,
[095] A Fig. 7 ilustra um diagrama de blocos que representa uma abordagem de interpolação sem informação lateral transmitida, e
[096] A Fig. 8 ilustra um diagrama de blocos de um técnica FLC total refinada quando comparada com a Fig. 7.
[097] A seguir os modelos da abordagem inovadora serão descritos com maior detalhe e pode-se observar que nos desenhos que acompanham elementos dotados da mesma ou idêntica funcionalidade são indicados pela mesma sinalização de referência. Nos modelos seguintes da abordagem inovadora serão descritos, de acordo com qual ocultação é executada no domínio de frequências, apenas se os dois últimos quadros recebidos são codificados utilizando MDCT. Detalhes relativos à decisão se se deverá utilizar a ocultação do domínio temporal ou de frequências em uma perda de quadros após a resseção de dois quadros MDCT serão também descritos. Relativamente aos modelos descritos a seguir dever-se-á ter em atenção que o requisito de que os dois últimos quadros são codificados no domínio de frequências não reduz a aplicabilidade da abordagem inovadora tal como em um codec trocado o domínio de frequências será utilizado para sinais tonais estacionários.
[098] A Fig. 1 ilustra um diagrama de blocos simplificado de um sistema para transmissão de sinais de áudio que implementa a abordagem inovadora no lado descodificador. O sistema compreende um codificador 100 que recebe uma entrada 102 de um sinal de áudio 104. O codificador é configurado para gerar, com base no sinal de áudio recebido 104, um sinal de áudio codificado fornecido em uma saída 106 do codificador 100. O codificador pode fornecer o sinal de áudio codificado tais como quadros do sinal de áudio são codificados utilizando MDCT. De acordo com um modelo o codificador 100 compreende uma antena 108 para permitir uma transmissão sem fios do sinal de áudio, tal como indicado no sinal de referência 110. Noutros modelos, o codificador pode fazer sair o sinal de áudio codificado fornecido na saída 106 através de uma ligação com fios, tal como se encontra por exemplo indicado no sinal de referência 112.
[099] O sistema compreende ainda um descodificador 120 dotado de uma entrada 122 na qual o sinal de áudio codificado fornecido pelo codificador 106 é recebido. O codificador 120 pode compreender, de acordo com um modelo, uma antena 124 para receber uma transmissão sem fios 110 do codificador 100. Noutro modelo, a entrada 122 pode fornecer uma ligação à transmissão com fios 112 para receber o sinal de áudio codificado. O sinal de áudio recebido na entrada 122 do descodificador 120 é aplicado a um detector 126 que determina se um segundo quadro do sinal de áudio recebido que vai ser descodificado pelo descodificador 120 precisa ser substituído. Por exemplo, de acordo com modelos, este pode ser o caso quando o detector 126 determina que um quadro que se deverá seguir a um quadro anterior não é recebido no descodificador ou quando é determinado que o quadro recebido possui erros que impedem a descodificação no lado descodificador 120. Se for determinado no detector 126 que um quadro apresentado para descodificação se encontra disponível, o quadro será encaminhado ao bloco de descodificação 128 onde uma descodificação do quadro codificado é executada de modo que na saída do descodificador 130 um fluxo de quadros de áudio descodificados ou um sinal de áudio descodificado 132 pode sair.
[100] No caso em que for determinado no bloco 126 que o quadro atualmente processado precisa de substituição, os quadros anteriores ao quadro atual que precisa de uma substituição e que pode ser buffered nos circuitos de detecção 126 são fornecidos a um detector tonal 134 que determina se o espectro da substituição inclui componentes tonais ou não. No caso de nenhuns componentes tonais serem fornecidos, tal é indicado ao bloco gerador de ruído/de memória 136 que gera coeficientes espectrais que são coeficientes não preditivos e que podem ser gerados utilizando um gerador de ruído ou outro método de geração de ruído convencional, por exemplo parasitagem de sinais ou idêntico. Em alternativa, coeficientes do espectro também pré-definidos para componentes tonais do espectro podem ser obtidos a partir de uma memória, por exemplo uma tabela de consulta. Em alternativa, quando é determinado que o espectro não inclui componentes tonais, em vez de gerar coeficientes do espectro não preditivos, características espectrais correspondentes de um dos quadros anteriores à substituição podem ser selecionadas.
[101] No caso do detector tonal 134 detectar que o espectro inclui componentes tonais, um sinal respetivo é indicado ao preditor 138, de acordo com modelos desta invenção mais tarde descritos, os coeficientes do espectro para o quadro de substituição. Os respetivos coeficientes determinados para o quadro de substituição são fornecidos ao bloco de descodificação 128 onde, com base nestes coeficientes do espectro, uma descodificação do quadro perdido ou de substituição é executada.
[102] Tal como ilustrado na Fig. 1, o detector tonal 134, o gerador de ruído 136 e o preditor 138 definem um equipamento 140 para a obtenção de coeficientes do espectro para um quadro de substituição em um descodificador 120. Os elementos representados podem ser implementados utilizando componentes de hardware e/ou de software, por exemplo unidades de processamento adequadamente programadas.
[103] A Fig. 2 ilustra um fluxograma da abordagem inovadora de acordo com um modelo. Na primeira etapa S200 um sinal de áudio codificado é recebido, por exemplo no descodificador 120 tal como representado na Fig. 1. O sinal de áudio recebido pode ser na forma dos respetivos quadros de áudio que são codificados utilizando MDCT.
[104] Na etapa S202 é determinado se um quadro atual a ser processado pelo descodificador 120 precisa ou não ser substituído. Um quadro de substituição pode ser necessário no lado descodificador, por exemplo no caso de o quadro não puder ser processado devido a um erro nos dados recebidos ou idêntico, ou no caso de o quadro se ter perdido durante a transmissão ao receptor/descodificador 120, ou no caso de o quadro não ter sido recebido a tempo no receptor do sinal de áudio 120, por exemplo devido a um atraso durante a transmissão do quadro do lado codificador na direção do lado descodificador.
[105] No caso de ser determinado na etapa S202, por exemplo pelo detector 126 no descodificador 120, que o quadro a ser atualmente processado pelo descodificador 120 precisa ser substituído, o método prossegue para a etapa S204 na qual é feita uma determinação posterior se uma ocultação do domínio de frequências é necessária ou não. De acordo com um modelo, se a informação de inclinação estiver disponível para os dois últimos quadros e se a inclinação não tiver mudado, é determinado na etapa S204 que uma ocultação do domínio de frequências é desejada. De outro modo, é determinado que uma ocultação do domínio temporal deverá ser aplicada. Em um modelo alternativo, a inclinação pode ser calculada em uma base de sub-quadro utilizando o sinal descodificado, e mais uma vez utilizando a decisão que no caso de a inclinação estar presente e no caso de ser constante nos bus-quadros, a ocultação do domínio de frequências é utilizada, caso contrário a ocultação do domínio temporal é aplicada.
[106] Ainda noutro modelo desta invenção, um detector, por exemplo o detector 126 no descodificador 120, pode estar previsto e pode ser configurado de tal modo que analise adicionalmente o espectro do segundo ao último quadro ou o último quadro ou ambos destes quadros anteriores ao quadro de substituição e para decidir, com base nos picos encontrados, se o sinal é monofónico ou polifónico. No caso de o sinal ser polifónico, a ocultação do domínio de frequências deverá ser utilizada, independentemente da presença de informação de inclinação. Em alternativa, o detector 126 no descodificador 120, pode ser configurado de tal modo que analise adicionalmente o um ou mais quadros anteriores ao quadro de substituição de modo a indicar se um número de componentes tonais no sinal ultrapassa ou não um limite pré- definido. No caso de o número de componentes tonais no sinal ultrapassar o limite a ocultação do domínio de frequências será utilizada.
[107] No caso de ser determinado na etapa S204 que uma ocultação do domínio de frequências deverá ser utilizada, por exemplo aplicando os critérios anteriormente referidos, o método prossegue para a etapa S206, onde uma parte tonal ou um componente tonal de um espectro do sinal de áudio é detectado com base em um ou mais picos existentes nos espectros dos quadros anteriores, em especial um ou mais picos presentes na significativamente mesma localização no espectro do segundo ao último quadro e o espectro do último quadro anterior ao quadro de substituição. Na etapa S208 é determinado se existe uma parte tonal do espectro. No caso de existir uma parte tonal do espectro, o método prossegue para a etapa S210, onde um ou mais coeficientes do espectro para o um ou mais picos e seus envolventes no espectro do quadro de substituição são preditos, por exemplo com base na informação derivável dos quadros anteriores, em especial o segundo ao último quadro e o último quadro. O coeficiente (s) do espectro predito na etapa S210 é (são) encaminhado, por exemplo para o bloco descodificador 128 ilustrado na Fig. 1, de modo que, tal como ilustrado na etapa 212, a descodificação do quadro do sinal de áudio codificado com base nos coeficientes do espectro da etapa 210 possam ser executada.
[108] No caso de ser determinado na etapa S208 que não existe parte tonal do espectro, o método prossegue para a etapa S214, utilizando um coeficiente do espectro não predito para o quadro de substituição ou um coeficiente do espectro correspondente de um quadro anterior ao quadro de substituição, existentes na etapa S212, para a descodificação do quadro.
[109] No caso de ser determinado na etapa S204 que nenhuma ocultação do domínio de frequências é desejável, o método prossegue para a etapa S216 onde uma ocultação do domínio temporal convencional do quadro a ser substituído é executada e com base no coeficiente do espectro gerado pelo processo na etapa S216 o quadro do sinal codificado é descodificado na etapa S212.
[110] No caso de ser determinado na etapa S202 que não existe um quadro de substituição no sinal de áudio atualmente processado, isto é, o quadro atualmente processado pode ser totalmente descodificado utilizando as abordagens convencionais, o meto prossegue diretamente para a etapa S212 para descodificar o quadro do sinal de áudio codificado.
[111] Segue-se uma descrição de detalhes adicionais de acordo com modelos desta invenção.
[112] Cálculo do espectro de energia
[113] Para o segundo último quadro, indexado m - 2 ,, os coeficientes MDST Sm-2 são calculados diretamente do sinal do domínio temporal descodificado.
[114] Para o último quadro é utilizado um espectro MDST estimado, calculado a partir dos coeficientes MDCT Cm-1 do último quadro recebido (ver por ex.: referência [13])
Figure img0021
[115] Os espectros de energia para os quadros m-2 e m -1são calculados do seguinte modo:
Figure img0022
[116] com: Sm-1(k) coeficiente MDST no quadro m-1, Cm-1(k) coeficiente MDCT no quadro m-1, Sm-2 (k) coeficiente MDST no quadro m-2, e Cm-2 (k) coeficiente MDCT no quadro m-2.
[117] Os espectros de energia obtidos são alisados do seguinte modo:
Figure img0023
[118] Detecção de componentes tonais
[119] Os picos existentes nos últimos dois quadros (m-2 e m-1 ) são considerados como representantes de componentes tonais. A existência contínua dos picos permite uma distinção entre componentes tonais e picos aleatórios nos sinais ruidosos.
[120] Informação de inclinação
[121] Pressupõe-se que a informação de inclinação está disponível: • calculada no lado codificador e disponível no fluxo de bits, ou • calculada no lado descodificador.
[122] A informação de inclinação é utilizada apenas se todas as seguintes condições forem cumpridas: • o ganho da inclinação é superior a zero, • o retardamento da inclinação é constante nos últimos dois quadros • a frequência fundamental é superior a 100 Hz
[123] A frequência fundamental é calculada a partir do retardamento da inclinação:
Figure img0024
[124] Se existir F0 = n- F0 para a qual as harmónicas N>5 são as mais fortes no espectro, então F0 é definida em F0' . F0 não é fiável se não existirem picos suficientes nas posições das harmónicas n - F0.
[125] De acordo com um modelo, a informação de inclinação é calculada no alinhamento da estrutura do limite direito da janela MDCT ilustrada na Fig. 3. Este alinhamento é benéfico para a extrapolação das partes tonais de um sinal à medida que a área de sobreposição 300, sendo a parte que necessita de ocultação, é também utilizada para o cálculo do retardamento da inclinação.
[126] Noutro modelo, a informação de inclinação pode ser transferida no fluxo de bits e utilizada pelo codec no canal livre e assim não tem quaisquer custos para a ocultação.
[127] Envolvente
[128] Segue-se a descrição de um procedimento para a obtenção de um envolvente do espectro, necessário para apanhar picos mais tarde descrito.
[129] O envolvente de cada espectro de energia nos últimos dois quadros é calculado utilizando um filtro de movimento integrados de comprimento L:
Figure img0025
[130] O comprimento do filtro depende da frequência fundamental (e pode ser limitada à gama [7,23]):
Figure img0026
[131] Esta ligação entre L e F0 é idêntica ao procedimento descrito na referência [14], contudo, nesta invenção a informação de inclinação do quadro atual é utilizada incluindo uma antecipação, em que a referência [14] utiliza uma inclinação média específica a um orador. Se a frequência fundamental não estiver disponível ou não for fiável, o comprimento do filtro L é 15.
[132] Selecionar um Pico
[133] Os picos são em primeiro lugar procurados no espectro de energia do quadro m - 1 baseado nos limites pré-definidos. Com base na localização dos picos no quadro m - 1, os limites para a busca no espectro de energia do quadro m - 2 são adaptados. Assim os picos existentes em ambos os quadros (m - 1 e m - 2) são encontrados, mas a localização exata é baseada no espectro de energia no quadro m - 2. Esta instrução é importante porque o espectro de energia no quadro m - 1 é calculado apenas em uma estimativa MDST e assim a localização de um pico não é exata. É também importante que o MDCT do quadro m - 1 seja utilizado, tal como é indesejável continuar com tons que existem apenas no quadro m - 2 e não no quadro m - 1. A Fig. 4 ilustra um fluxograma que representa as etapas anteriores para apanhar um pico de acordo com um modelo. Na etapa S400 os picos são procurados no espectro de energia do último quadro m - 1 anterior ao quadro de substituição baseado em um ou mais limites pré-definidos. Na etapa S402, o um ou mais limites são adaptados. Na etapa S404 são procurados picos no espectro de energia do segundo último quadro m - 2 anterior ao quadro de substituição baseado em um ou mais limites adaptados.
[134] A Fig. 5 é uma representação esquemática de um espectro de energia de um quadro a partir do qual um ou mais picos são detectados. Na Fig. 5, o envolvente 500 é ilustrado podendo ser determinado como anteriormente descrito ou podendo ser determinado por outras abordagens conhecidas. Um número de picos candidatos ilustrados é representado pelos círculos na Fig. 5. Descobrir, dentre os picos candidatos, um pico, será em baixo descrito com maior detalhe. A Fig. 5 ilustra um pico 502 encontrado assim como um falso pico 504 e um pico 506 representando ruído. Além disso, um pé esquerdo 508 e um pé direito 510 de um coeficiente do espectro são ilustrados.
[135] De acordo com um modelo, encontrar picos no espectro de energia Pm-1 do último quadro m - 1 anterior ao quadro de substituição é feito utilizando as seguintes etapas (etapa S400 na Fig. 4): • um coeficiente espectral é classificado como um pico tonal candidato se todos os seguintes critérios forem cumpridos:
[136] a razão entre o espectro de energia alisado e o envolvente 500 é superior a certo limite:
Figure img0027
[137] a razão entre o espectro de energia alisado e o envolvente 500 é superior às suas adjacentes, significando que se trata de um máximo local, • os máximos locais são determinados por encontrar o pé esquerdo 508 e o pé direito 510 de um coeficiente do espectro k e por encontrar um máximo entre o pé esquerdo 508 e o pé direito 510. Esta etapa é necessária tal como pode ser observado na Fig. 4, em que o falso pico 504 pode ser provocado por um lóbulo lateral ou por ruído de quantificação.
[138] Os limites para a busca do pico no espectro de energia Pm-2 do segundo último quadro m - 2 são determinados do seguinte modo (etapa S402 na Fig. 4): • nos coeficientes do espectro k e [i -1, i +1] em redor de um pico no índice i em Pm-1
[139] Threshold(k) = (Psmoothedm-1(k) > Envelopem-1(k)) ? 9.21dB:10.56dB se F0 estiver disponível e for fiável então para cada ne [1,N] determina k = |_n■ F0J e frac=n• F0 -k:
[140] Threshold, k) = 8.8 dB+10^ log10 (0.35)
[141] Threshold k -1) = 8.8 dB+10^ log10 (0.35+2 • frac)
[142] Threshold k+1) = 8.8 dB+10^ log10 (0.35+ 2 • (1- frac)) ,
[143] se k e [i -1,i+1] em redor de um pico no índice i em Pm-1 então os limites determinados na primeira etapa são reescritos, • para todos os outros índices:
[144] Threshold(k) = 20.8 dB
[145] Picos tonais são encontrados no espectro de energia Pm-2 do segundo último quadro m - 2 pelas seguintes etapas (etapa S404 na Fig. 4): • um coeficiente espectral é classificado como um pico tonal se:
[146] a razão do espectro de energia e do envolvente for superior ao limite:
Figure img0028
[147] a razão do espectro de energia e do envolvente superior às suas adjacentes, significando que se trata de um máximo local, • máximos locais são determinados por encontrar o pé esquerdo 508 e o pé direito 510 de um coeficiente espectral k e por encontrar um máximo entre o pé esquerdo 508 e o pé direito 510, • o pé esquerdo 508 e o pé direito 510 definem também o envolvente de um pico tonal 502, isto é, os binários espectrais do componente tonal em que o método de ocultação tonal será utilizado.
[148] Utilizando o método anteriormente descrito, revela que o pico direito 506 na Fig. 4 apenas existe em um dos quadros, isto é, não existe em ambos os quadros m - 1 ou m - 2. Por isso, este pico é marcado como ruído e não é selecionado como um componente tonal.
[149] Extração de parâmetros sinusoidais
[150] Para um sinal sinusoidal
Figure img0029
um desvio para N N/2 (a dimensão do salto MDCT) resulta no sinal
[151]
Figure img0030
[152] Assim, existe o desvio de fase Δ^ = π ■( l + Δ l), em que l é o índice de um pico. Por isso, o desvio de fase depende da parte fracional da frequência de entrada mais uma adição adicional de π para coeficientes espectrais ímpares.
[153] A parte fracional da frequência Δl pode ser derivada utilizando um método descrito, por ex.: na referência [15]: dado que a magnitude do sinal em sub-banda k = l é um máximo local. Δl pode ser determinada através do cálculo da razão das magnitudes do sinal nas sub-bandas k = l - 1 e k = l + 1, isto é, por avaliação:
[154]
Figure img0031
[155] em que a aproximação da resposta da magnitude de uma janela é utilizada:
[156]
Figure img0032
[157] em que b é a largura do lóbulo principal. A constante G nesta expressão tem sido ajustada para 27.4/20.0 de modo a minimizar o erro máximo absoluto da estimativa, substituindo a resposta da frequência aproximada e
Figure img0033
[158] b′ = 2 b
[159] leva a:
Figure img0034
[160] Predição MDCT
[161] Para todos os picos do espectro encontrados e seus adjacentes, a predição MDCT é utilizada. Para todos os outros coeficientes do espectro, a parasitagem de sinais ou um método de geração de ruído idêntico pode ser utilizado.
[162] Todos os coeficientes do espectro pertencentes aos picos encontrados e seus adjacentes pertencem ao conjunto designado como K. Por exemplo, na Fig. 5 o pico 502 foi identificado como um pico representando um componente tonal. O adjacente do pico 502 pode ser representado por um número pré-definido de coeficientes espectrais adjacentes, por exemplo pelos coeficientes espectrais entre os do lado esquerdo 508 e os do lado direito 510, mais os coeficientes dos lados 508, 510.
[163] De acordo com modelos, o envolvente do pico é definido por um número pré-definido de coeficientes em redor do pico 502. O envolvente do pico pode compreender um primeiro número de coeficientes à esquerda do pico 502 e um segundo número de coeficientes à direita do pico 502. O primeiro número de coeficientes à esquerda do pico 502 e o segundo número de coeficientes à direita do pico 502 podem ser iguais ou diferentes.
[164] De acordo com modelos que aplicam o padrão EVS, o número pré- definido de coeficientes envolventes pode ser determinado ou fixado em uma primeira etapa, por ex.: antes de detectar o componente tonal. No padrão EVS três coeficientes à esquerda do pico 502, três coeficientes à direita e o pico 502 podem ser utilizados, isto é, todos juntos sete coeficientes (este número foi escolhido por motivos complexos, contudo, qualquer outro número irá também obter resultados).
[165] De acordo com modelos, a dimensão do envolvente do pico é adaptável. O envolvente dos picos identificados como representando um componente tonal pode ser modificado de modo que os envolventes em redor de dois picos não se sobreponham. De acordo com modelos, um pico é sempre considerado apenas com os seus envolventes e juntos definem um componente tonal.
[166] Para a predição dos coeficientes MDCT em um quadro perdido, é utilizado o espectro de energia (a magnitude do espectro complexo) no segundo último quadro:
Figure img0035
[167] O coeficiente MDCT perdido no quadro de substituição é estimado como:
Figure img0036
[168] Segue-se a descrição de um método para o cálculo da fase ym(k) de acordo com um modelo.
[169] Predição da fase
[170] Para todos os picos do espectro encontrados, a frequência fracional Δ l é calculada tal como descrito em cima e o desvio de fase é:
Figure img0037
[171] Δy é o desvio de fase entre os quadros. É igual para os coeficientes em um pico e seus envolventes.
[172] A fase para cada coeficiente do espectro na posição do pico e os envolventes (k e K) é calculada no segundo último quadro recebido utilizando a expressão:
Figure img0038
[173] A fase no quadro perdido é predita como:
[174]
Figure img0039
[175] De acordo com um modelo, um desvio de fase refinado pode ser utilizado. Utilizando a fase calculada Φm-2 (k) para cada coeficiente do espectro na posição do pico e os envolventes permite uma estimativa do MDST no quadro m - 1 que pode ser derivado como:
Figure img0040
[176] com:
[177] Qm-2 (k) espectro de energia (magnitude do espectro complexo) no quadro m-2.
[178] A partir desta estimativa MDST e do MDCT recebido uma estimativa da fase no quadro m - 1 é derivado:
Figure img0041
[179] A fase estimada é utilizada para refinar o desvio de fase:
Figure img0042
[180] com:
[181] Φm-1 (k) - fase do espectro complexo no quadro m-1, e
[182] Φm-2 (k) - fase do espectro complexo no quadro m-2.
[183] A fase no quadro perdido é predita como:
Figure img0043
[184] O refinamento do desvio de fase de acordo com este modelo melhora a predição da sinusoide na presença de um ruído de fundo ou se a frequência da sinusoide mudar. Para sinusoides não sobrepostas com frequência constante e sem ruído de fundo, o desvio de fase é o mesmo para todos os coeficientes MDCT que circundam o pico.
[185] A ocultação utilizada pode ser dotada de diferentes velocidades graduais para a parte tonal e para a parte do ruído. Se a velocidade gradual para a parte tonal do sinal for mais lenta, após múltiplos quadros perdidos, a parte tonal torna-se dominante. As flutuações na sinusoide, devidas aos diferentes desvios de fase dos componentes sinusoides, produzem perturbações desagradáveis.
[186] De modo a ultrapassar este problema, de acordo com modelos, começando a partir do terceiro quadro perdido, a diferença de fase do pico (com índice k) é utilizada para todos os coeficientes espectrais que a circundam (k - l é o índice do pé direito e k + u é o índice do pé direito):
Figure img0044
(a) De acordo com modelos adicionais, está prevista uma transição. Os coeficientes espectrais no segundo quadro perdido com uma elevada atenuação utilizam a diferença de fase do pico, e os coeficientes com pequena atenuação utilizam a diferença de fase corrigida:
Figure img0045
[187] Refinamento da magnitude
[188] De acordo com outros modelos, em vez de aplicar o refinamento do desvio de fase descrito, outra abordagem pode ser aplicada utilizando um refinamento da magnitude:
Figure img0046
[189] em que l é o índice de um pico, a frequência fracionai Δl é calculada tal como descrito em cima. O desvio de fase é:
Figure img0047
[190] Para evitar um aumento da energia, a magnitude refinada, de acordo com modelos adicionais, pode ser limitada pela magnitude do segundo último quadro:
Figure img0048
[191] Ainda, de acordo com ainda modelos adicionais, a diminuição da magnitude pode ser utilizada para abrandá-la:
Figure img0049
[192] Predição da fase utilizando o “entre quadros”
[193] Em vez de basear a predição dos coeficientes espectrais nos quadros anteriores ao quadro de substituição, de acordo com outros modelos, a predição de fase pode utilizar um “entre quadros” (também referido como quadro “intermédio”). A Fig. 6 ilustra um exemplo para um “entre quadros”. Na Fig. 6 o último quadro 600 (m - 1) anterior ao quadro de substituição, o segundo último quadro 602 (m - 2) anterior ao quadro de substituição, e o entre quadros 604 (m - 1,5) são ilustrados juntos com as respetivas janelas MDCT 606 a 610.
[194] Se a sobreposição da janela MDCT for inferior a 50% é possível obter o espectro CMDCT mais próximo do quadro perdido. Na Fig. 6 um exemplo com uma sobreposição da janela MDCT de 24% é obtida. Isto permite obter o espectro CMDCT para o entre quadros 604 (m - 1,5) utilizando a janela a tracejado 610, igual à janela MDCT 606 ou 608 mas com o desvio para metade do comprimento do quadro da estrutura codec. Visto que o entre quadros 604 (m - 1,5) está mais próximo do quadro perdido (m), as suas características do espectro serão mais semelhantes às características do espectro do quadro perdido (m) do que as características do espectro entre o segundo último quadro (m - 2) e o quadro perdido (m).
[195] Neste modelo, o cálculo de ambos os coeficientes MDST Sm-1.5 e os coeficientes MDCT Cm-1.5 é feito diretamente do sinal do domínio temporal descodificado, com o MDST e o MDCT constituindo o CMDCT. Em alternativa, o CMDCT pode ser derivado utilizando operações de matrizes dos coeficientes MDCT envolventes existentes.
[196] O cálculo do espectro de energia é feito tal como descrito em cima, e a detecção de componentes tonais é feita tal como descrito em cima com o quadro m-2nd substituído pelo quadro m-1,5th.
[197] Para urn sinal sinusoidal
Figure img0050
urn desvio para N/4 (dimensão do salto MDCT) resulta no sinal
Figure img0051
[198] Isto resulta no desvio de fase Δ^5 = — •( l + Δ l). Por isso, o desvio de fase depende da parte fracional da frequência de entrada mais adição adicional de (lmod4)—, em que l é o índice de um pico. A detecção da frequência fracional é feita tal como descrita em cima.
[199] Para a predição dos coeficientes MDCT em um quadro perdido, a magnitude do quadro m-1,5 é utilizada:
Figure img0052
[200] O coeficiente MDCT perdido é estimado como:
[201]
Figure img0053
[202] A fase pode ser calculada utilizando:
Figure img0054
[203] Ainda, de acordo com modelos, o refinamento do desvio de fase descrito em cima pode ser aplicado:
Figure img0055
[204] Além disso, a convergência do desvio de fase para todos os coeficientes espectrais envolventes de um pico ao desvio de fase do pico pode ser utilizada tal como descrita em cima.
[205] Apesar de alguns aspetos do conceito descrito terem sido descritos no contexto de um equipamento, está claro que estes aspetos representam também uma descrição do método correspondente, em que um bloco ou dispositivo corresponde a uma etapa do método ou uma característica de uma etapa do método. Do mesmo modo, aspetos descritos no contexto de uma etapa do método representam também uma descrição de um bloco correspondente ou item ou característica de um equipamento correspondente.
[206] Dependendo de certos requisitos de implementação, modelos da invenção podem ser implementados em hardware ou software. A implementação pode ser executada utilizando um meio de armazenamento digital, por exemplo uma disquete, um DVD, Blue-Ray, CD, ROM, PROM, EPROM, EEPROM ou uma memória FLASH dotado de sinais de controlo lidos eletronicamente neles, cooperando (ou que sejam capazes de cooperarem) com um sistema de computador programável de modo eu o respetivo método seja executado. Desse modo, o meio de armazenamento digital pode ser lido por computador.
[207] Alguns modelos de acordo com a invenção compreendem um suporte de dados dotado de sinais de controlo lidos eletronicamente, capaz de cooperar com um sistema de computador programável, de modo que um dos métodos aqui descritos seja executado.
[208] Regra geral, modelos desta invenção podem ser implementados como um produto de programa de computador com um código de programa, sendo que o código do programa é operativo para executar um dos métodos quando o produto do programa de computador corre em um computador. O código do programa pode por exemplo ser armazenado em um suporte automático.
[209] Outros modelos compreendem o programa de computador para executar um dos métodos aqui descritos, armazenados em um suporte automático.
[210] Por outras palavras, um modelo do método inovador é, desse modo, um programa de computador dotado de um código de programa para a execução de um dos métodos aqui descritos, quando o programa de computador funciona em um computador.
[211] Um modelo adicional dos métodos inovadores é, desse modo, um suporte de dados (ou um meio de armazenamento digital, ou um meio lido por computador) compreendendo, neles registados, o programa de computador para a execução de um dos métodos aqui descritos.
[212] Um modelo adicional do método inovador é, desse modo, um fluxo de dados ou uma sequência de sinais que representam o programa de computador para executar um dos métodos aqui descritos. O fluxo de dados ou a sequência de sinais pode por exemplo ser configurado para ser transferido através de uma ligação de comunicação de dados, por exemplo através da Internet.
[213] Um modelo adicional compreende um meio de processamento, por exemplo um computador, ou um dispositivo de lógica programável, configurado ou adaptado para executar um dos métodos aqui descritos.
[214] Um modelo adicional compreende um computador tendo nele instalado o programa de computador para a execução de um dos métodos aqui descritos.
[215] Nalguns modelos, um dispositivo de lógica programável (por exemplo uma rede de portas lógicas programáveis) pode ser utilizado para executar algumas ou todas as funcionalidades dos métodos aqui descritos. Nalguns modelos, uma rede de portas lógicas programáveis pode cooperar com um microprocessador de modo a executar um dos métodos aqui descritos. Regra geral, os métodos são de preferência executados por qualquer equipamento de hardware.
[216] Os modelos descritos em cima são meramente ilustrativos para os princípios desta invenção. Dever-se-á entender que modificações e variações das disposições e os detalhes aqui descritos serão evidentes para outros especialistas na área. É pois finalidade, serem limitados apenas pelo âmbito das reivindicações da patente pendente e não pelos detalhes específicos aqui apresentados como descrição e esclarecimento dos modelos.
[217] Referências da Técnica Anterior
[218] [1] P. Lauber and R. Sperschneider, "Error Concealment for Compressed Digital Audio," in AES 111th Convention, New York, USA, 2001.
[219] [2] C. J. Hwey, "Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment". Patent US 6,351,730 B2, 2002.
[220] [3] S. K. Gupta, E. Choy and S.-U. Ryu, "Encoder-assisted frame loss concealment techniques for audio coding". Patent US 2007/094009 A1.
[221] [4] S.-U. Ryu and K. Rose, "A Frame Loss Concealment Technique for MPEG-AAC," in 120th AES Convention, Paris, France, 2006.
[222] [5] ISO/IEC JTC1/SC29/WG11, Information technology -- Coding of moving pictures and associated, International Organization for Standardization, 1993.
[223] [6] S.-U. Ryu and R. Kenneth, An MDCT domain frame-loss concealment technique for MPEG Advanced Audio Coding, Department od Electrical and Computer Engineering, University of California, 2007.
[224] [7] S.-U. Ryu, Source Modeling Approaches to Enhanced Decoding in Lossy Audio Compression and Communication, UNIVERSITY of CALIFORNIA Santa Barbara, 2006.
[225] [8] M. Yannick, "Method and apparatus for transmission error concealment of frequency transform coded digital audio signals". Patent EP 0574288 B1, 1993.
[226] [9]Y. Mahieux, J.-P. Petit and A. Charbonnier, "Transform coding of audio signals using correlation between successive transform blocks," in Acoustics, Speech, and Signal Processing, 1989. ICASSP-89., 1989.
[227] [10] 3GPP; Technical Specification Group Services and System Aspects, Extended Adaptive Multi-Rate - Wideband (AMR-WB+) codec, 2009.
[228] [11] A. Taleb, "Partial Spectral Loss Concealment in Transform Codecs". Patent US 7,356,748 B2.
[229] [12] C. Guoming, D. Zheng, H. Yuan, J. Li, J. Lu, K. Liu, K. Peng, L. Zhibin, M. Wu and Q. Xiaojun, "Compensator and Compensation Method for Audio Frame Loss in Modified Discrete Cosine Transform Domain". Patent US 2012/109659 A1.
[230] [13] L. S. M. Dauder, "MDCT Analysis of Sinusoids: Exact Results and Applications to Coding Artifacts Reduction," IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING, pp. 302-312, 2004.
[231] [14] D. B. Paul, "The Spectral Envelope Estimation Vocoder," IEEE Transactions on Acoustics, Speech, and Signal Processing, pp. 786-794, 1981.
[232] [15] A. Ferreira, "Accurate estimation in the ODFT domain of the frequency, phase and magnitude of stationary sinusoids," 2001 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, pp. 47-50, 2001.

Claims (37)

1. Método para a obtenção de coeficientes do espectro para um quadro de substituição de um sinal de áudio, o método compreendendo: a detecção (S206) de um componente tonal de um espectro de um sinal de áudio baseado em um pico (502) que existe nos espectros de quadros (m-1, m-2) anteriores a um quadro de substituição (m); para o componente tonal do espectro, predição (S210) de coeficientes do espectro para o pico (502) e seus envolventes no espectro do quadro de substituição (m); e para o componente não tonal do espectro, utilização (S214) de um coeficiente do espectro não predito para o quadro de substituição (m) ou um coeficiente do espectro correspondente de um quadro anterior ao quadro de substituição (m), caracterizado por os coeficientes do espectro para o pico (502) e seus envolventes no espectro do quadro de substituição (m) serem preditos com base em magnitudes do espectro complexo do penúltimo quadro (m-2) anterior ao quadro de substituição (m) e à fase predita do espectro complexo do quadro de substituição (m), a fase do espectro complexo do quadro de substituição (m) ser predita com base na fase do espectro complexo do último quadro (m-1) anterior ao quadro de substituição (m) e um desvio de fase entre o último quadro (m-1) e o penúltimo quadro (m-2) anteriores ao quadro de substituição (m), e a fase do espectro complexo do último quadro (m-1) anterior ao quadro de substituição (m) ser determinada com base na magnitude do espectro complexo do penúltimo quadro (m-2) anterior ao quadro de substituição (m), na fase do espectro complexo do penúltimo quadro (m-2) anterior ao quadro de substituição (m), no desvio de fase entre o último quadro (m-1) e o penúltimo quadro (m-2) anteriores ao quadro de substituição (m) e o espectro real do último quadro (m-1).
2. Método de acordo com a reivindicação 1, caracterizado por o componente tonal ser definido pelo pico e seus envolventes.
3. Método de acordo com qualquer uma das reivindicações 1 ou 2, caracterizado por o envolvente do pico ser definido por um número pré- definido de coeficientes em redor do pico (502).
4. Método de acordo com qualquer uma das reivindicações 1 a 3, caracterizado por o envolvente do pico compreender um primeiro número de coeficientes à esquerda do pico (502) e um segundo número de coeficientes à direita do pico (502).
5. Método de acordo com a reivindicação 4, caracterizado por o primeiro número de coeficientes compreender coeficientes entre um pé esquerdo (508) e o pé esquerdo (502) mais o coeficiente do pé esquerdo (508), e por o segundo número de coeficientes compreender coeficientes entre um pé direito (510) e o pico (502) mais o coeficiente do pé direito (510).
6. Método de acordo com a reivindicação 4 ou 5, caracterizado por o primeiro número de coeficientes no pé esquerdo do pico (502) e o segundo número de coeficientes à direita do pico (502) serem iguais ou diferentes.
7. Método de acordo com a reivindicação 6, caracterizado por o primeiro número de coeficientes à esquerda do pico (502) ser três e o segundo número de coeficientes à direita do pico (502) ser três.
8. Método de acordo com qualquer uma das reivindicações 3 a 7, caracterizado por o número pré-definido de coeficientes em redor do pico (502) ser determinado antes da etapa de detecção do componente tonal.
9. Método de acordo com qualquer uma das reivindicações 1 a 8, caracterizado por a dimensão do envolvente do pico ser adaptável.
10. Método de acordo com a reivindicação 9, caracterizado por o envolvente do pico ser selecionado de modo que os envolventes em redor dos dois picos não se sobreponham.
11. Método de acordo com a reivindicação 1, caracterizado por o desvio de fase entre o último quadro (m-1) e o penúltimo quadro (m-2) anteriores ao quadro de substituição (m) ser um desvio de fase refinado, e o desvio de fase refinado ser determinado com base na fase do espectro complexo do último quadro (m-1) anterior ao quadro de substituição (m) e na fase do espectro complexo do penúltimo quadro (m-2) anterior ao quadro de substituição (m).
12. Método de acordo com a reivindicação 11, caracterizado por o refinamento do desvio de fase ser adaptável com base no número de quadros consecutivamente perdidos.
13. Método de acordo com a reivindicação 12, caracterizado por começando por um terceiro quadro perdido, um desvio de fase determinado para um pico ser utilizado para predizer os coeficientes espectrais envolventes ao pico (502).
14. Método de acordo com a reivindicação 13, caracterizado por para a predição dos coeficientes espectrais em um segundo quadro perdido, um desvio de fase determinado para o pico (502) ser utilizado para predizer os coeficientes espectrais para os coeficientes espectrais envolventes quando o desvio de fase no último quadro (m-1) anterior ao quadro de substituição (m) for igual ou inferior a um limite pré-determinado, e um desvio de fase determinado para os respetivos coeficientes espectrais envolventes ser utilizado para predizer os coeficientes espectrais dos coeficientes espectrais envolventes quando o desvio de fase no último quadro (m-1) anterior ao quadro de substituição (m) é superior ao limite pré-definido.
15. Método para adquirir coeficientes de espectro para um quadro de substituição (m) de um sinal de áudio, o método compreendendo: a detecção (S206) de um componente tonal de um espectro de um sinal de áudio baseado em um pico (502) que existe nos espectros de quadros (m-1, m-2) anteriores a um quadro de substituição (m); para o componente tonal do espectro, predição (S210) de coeficientes do espectro para o pico (502) e seus envolventes no espectro do quadro de substituição (m); e para o componente não tonal do espectro, utilização (S214) de um coeficiente do espectro não predito para o quadro de substituição (m) ou um coeficiente do espectro correspondente de um quadro anterior ao quadro de substituição (m), caracterizado por os coeficientes do espectro para o pico (502) e seus envolventes no espectro do quadro de substituição (m) ser predito com base em magnitudes do espectro complexo do último quadro (m-1) anterior ao quadro de substituição (m) e a fase predita do espectro complexo do quadro de substituição (m), e a fase do espectro complexo do quadro de substituição (m) ser predita com base na fase do espectro complexo do penúltimo quadro (m-2) anterior ao quadro de substituição (m) e no dobro do desvio de fase entre o último quadro (m-1) e o penúltimo quadro (m-2) anterior ao quadro de substituição (m).
16. Método de acordo com a reivindicação 15, caracterizado por as magnitudes do espectro complexo do último quadro (m-1) anterior ao quadro de substituição (m) serem magnitudes refinadas, e as magnitudes refinadas serem determinadas com base em um coeficiente do espectro real do espectro real do último quadro (m-1) anterior ao quadro de substituição (m), na fase do espectro complexo do penúltimo quadro (m-2) anterior ao quadro de substituição (m) e no desvio de fase entre o último quadro (m-1) e o penúltimo quadro (m-2) anterior ao quadro de substituição (m).
17. Método de acordo com a reivindicação 15 ou 16, caracterizado por as magnitudes do espectro complexo do último quadro (m-1) anterior ao quadro de substituição (m) serem magnitudes refinadas, e as magnitudes refinadas serem limitadas pela magnitude do espectro complexo do penúltimo quadro (m-2) anterior ao quadro de substituição (m).
18. Método de acordo com qualquer uma das reivindicações 1 a 17, caracterizado por a detecção de um componente tonal do espectro do sinal de áudio compreender: a procura (S400) de picos no espectro do último quadro (m-1) anterior ao quadro de substituição (m) baseado em um ou mais limites pré- definidos; a adaptação (S402) de um ou mais limites; e a procura (S404) de picos no espectro do penúltimo quadro (m-2) anterior ao quadro de substituição (m) com base em um ou mais limites adaptados.
19. Método de acordo com a reivindicação 18, caracterizado por a adaptação do um ou mais limites compreender a determinação do um ou mais limites para procurar um pico no penúltimo quadro (m-2) anterior ao quadro de substituição (m) em uma região em redor de um pico encontrado no último quadro (m-1) anterior ao quadro de substituição (m) com base no espectro e em um envelope de espectro do último quadro (m-1) anterior ao quadro de substituição (m), ou baseado em uma frequência fundamental calculada de um retardamento da inclinação entre quadros do sinal de áudio.
20. Método de acordo com a reivindicação 19, caracterizado por a frequência fundamental ser para o sinal incluindo o último quadro (m-1) anterior ao quadro de substituição (m) e a antecipação do último quadro (m-1) anterior ao quadro de substituição (m).
21. Método de acordo com a reivindicação 20, caracterizado por a antecipação do último quadro (m-1) anterior ao quadro de substituição (m) ser calculada no lado codificador utilizando a antecipação.
22. Método de acordo com qualquer uma das reivindicações 18 a 21, caracterizado por a adaptação (S402) do um ou mais limites compreender a determinação de um ou mais limites para a procura de um pico no penúltimo quadro (m-2) anterior ao quadro de substituição (m) em uma região não envolvente a um pico encontrado no último quadro (m-1) anterior ao quadro de substituição (m) para um valor limite pré-definido.
23. Método de acordo com qualquer uma das reivindicações 1 a 22, caracterizado por compreender: a determinação (S204), para o quadro de substituição (m), se se deverá aplicar uma ocultação no domínio temporal ou uma ocultação no domínio de frequências utilizando a predição de coeficientes espectrais para componentes tonais do sinal de áudio.
24. Método de acordo com a reivindicação 23, caracterizado por a ocultação no domínio de frequências ser aplicada no caso de o último quadro (m-1) anterior ao quadro de substituição (m) e o penúltimo quadro (m-2) anterior ao quadro de substituição (m) serem dotados de um pitch constante, ou uma análise de um ou mais quadros anteriores ao quadro de substituição (m) indicar que um número de componentes tonais no sinal ultrapassa um limite pré-definido.
25. Método de acordo com qualquer uma das reivindicações 1 a 24, caracterizado por os quadros do sinal de áudio serem codificados utilizando MDCT.
26. Método de acordo com qualquer uma das reivindicações 1 a 25, caracterizado por um quadro de substituição (m) compreender um quadro que não pode ser processado em um receptor do sinal de áudio, devido a um erro nos dados recebidos, ou um quadro que foi perdido durante a transmissão para o receptor do sinal de áudio, ou um quadro que não foi recebido a tempo no receptor do sinal de áudio.
27. Método de acordo com qualquer uma das reivindicações 1 a 26, caracterizado por um coeficiente do espectro não predito ser gerado utilizando um método gerador de ruído, o método gerador de ruído incluindo interferência de sinais, ou utilizando um coeficiente do espectro pré-definido de uma memória, a memória incluindo uma tabela de consulta.
28. Equipamento para a obtenção de coeficientes do espectro para um quadro de substituição (m) de um sinal de áudio, sendo que o equipamento compreende: um detector (134) configurado para detectar um componente tonal de um espectro de um sinal de áudio baseado em um pico que existe nos espectros de quadros anteriores a um quadro de substituição (m); e um preditor (138) configurado para predizer para o componente tonal do espectro os coeficientes do espectro para o pico (502) e seus envolventes no espectro do quadro de substituição (m); caracterizado por utilizar para o componente não tonal do espectro, um coeficiente do espectro não predito para o quadro de substituição (m) ou um coeficiente do espectro correspondente de um quadro anterior ao quadro de substituição (m), os coeficientes do espectro para o pico (502) e seus envolventes no espectro do quadro de substituição (m) serem preditos com base em magnitudes do espectro complexo do penúltimo quadro (m-2) anterior ao quadro de substituição (m) e à fase predita do espectro complexo do quadro de substituição (m), a fase do espectro complexo do quadro de substituição (m) ser predita com base na fase do espectro complexo do último quadro (m-1) anterior ao quadro de substituição (m) e um desvio de fase entre o último quadro (m-1) e o penúltimo quadro (m-2) anteriores ao quadro de substituição (m), e a fase do espectro complexo do último quadro (m-1) anterior ao quadro de substituição (m) ser determinada com base na magnitude do espectro complexo do penúltimo quadro (m-2) anterior ao quadro de substituição (m), na fase do espectro complexo do penúltimo quadro (m-2) anterior ao quadro de substituição (m), no desvio de fase entre o último quadro (m-1) e o penúltimo quadro (m-2) anteriores ao quadro de substituição (m) e o espectro real do último quadro (m-1).
29. Equipamento para a obtenção de coeficientes do espectro para um quadro de substituição (m) de um sinal de áudio, caracterizado por o equipamento estar configurado para operar de acordo com o método tal como descrito em qualquer uma das reivindicações 1 a 27.
30. Descodificador de áudio, caracterizado por compreender um equipamento tal como descrito na reivindicação 28 ou 29.
31. Receptor de áudio, caracterizado por compreender um descodificador de áudio tal como descrito na reivindicação 30.
32. Sistema para a transmissão de sinais de áudio, caracterizado por o sistema compreender: um codificador (100) configurado para gerar o sinal de áudio codificado; e um descodificador (120) tal como descrito na reivindicação 30 configurado para receber o sinal de áudio codificado, e para descodificar o sinal de áudio codificado.
33. Aparelho para adquirir coeficientes de espectro para um quadro de substituição (m) de um sinal de áudio, o aparelho compreendendo: um detector (134) configurado para detectar um componente tonal de um espectro de um sinal de áudio baseado em um pico (502) que existe nos espectros de quadros anteriores a um quadro de substituição (m); e um preditor (138) configurado para predizer para o componente tonal do espectro os coeficientes do espectro para o pico (502) e seus envolventes no espectro do quadro de substituição (m); caracterizado por utilizar para o componente não tonal do espectro, um coeficiente do espectro não predito para o quadro de substituição (m) ou um coeficiente do espectro correspondente de um quadro anterior ao quadro de substituição (m), o coeficiente do espectro para o pico (502) e seus envolventes no espectro do quadro de substituição (m) ser predito com base em magnitudes do espectro complexo do último quadro (m-1) anterior ao quadro de substituição (m) e à fase predita do espectro complexo do quadro de substituição (m), e a fase do espectro complexo do quadro de substituição (m) ser predita com base na fase do espectro complexo do penúltimo quadro (m-2) anterior ao quadro de substituição (m) e duas vezes o desvio de fase entre o último quadro (m-1) e o penúltimo quadro (m-2) anteriores ao quadro de substituição (m).
34. Aparelho para adquirir coeficientes de espectro para um quadro de substituição (m) de um sinal de áudio, caracterizado por ser configurado para operar de acordo com o método da reivindicação 19.
35. Descodificador de áudio, caracterizado por compreender um aparelho de acordo com a reivindicação 33.
36. Descodificador de áudio, caracterizado por compreender um descodificador de áudio (120) de acordo com a reivindicação 34.
37. Sistema para a transmissão de sinais de áudio, caracterizado por compreender: um codificador (100) configurado para gerar o sinal de áudio codificado; e um descodificador (120), tal como descrito na reivindicação 35, configurado para receber o sinal de áudio codificado, e para descodificar o sinal de áudio codificado.
BR112015032013-9A 2013-06-21 2014-06-20 Método e equipamento para a obtenção de coeficientes do espectropara um quadro de substituição de um sinal de áudio, descodificador de áudio,receptor de áudio e sistema para transmissão de sinais de áudio BR112015032013B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP13173161 2013-06-21
EP13173161.4 2013-06-21
EP14167072.9 2014-05-05
EP14167072 2014-05-05
PCT/EP2014/063058 WO2014202770A1 (en) 2013-06-21 2014-06-20 Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals

Publications (2)

Publication Number Publication Date
BR112015032013A2 BR112015032013A2 (pt) 2017-07-25
BR112015032013B1 true BR112015032013B1 (pt) 2021-02-23

Family

ID=50980298

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112015032013-9A BR112015032013B1 (pt) 2013-06-21 2014-06-20 Método e equipamento para a obtenção de coeficientes do espectropara um quadro de substituição de um sinal de áudio, descodificador de áudio,receptor de áudio e sistema para transmissão de sinais de áudio

Country Status (18)

Country Link
US (3) US9916834B2 (pt)
EP (1) EP3011556B1 (pt)
JP (1) JP6248190B2 (pt)
KR (1) KR101757338B1 (pt)
CN (2) CN105408956B (pt)
AU (1) AU2014283180B2 (pt)
BR (1) BR112015032013B1 (pt)
CA (1) CA2915437C (pt)
ES (1) ES2633968T3 (pt)
HK (1) HK1224075A1 (pt)
MX (1) MX352099B (pt)
MY (1) MY169132A (pt)
PL (1) PL3011556T3 (pt)
PT (1) PT3011556T (pt)
RU (1) RU2632585C2 (pt)
SG (1) SG11201510513WA (pt)
TW (1) TWI562135B (pt)
WO (1) WO2014202770A1 (pt)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG11201510513WA (en) * 2013-06-21 2016-01-28 Fraunhofer Ges Forschung Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals
US10424305B2 (en) * 2014-12-09 2019-09-24 Dolby International Ab MDCT-domain error concealment
TWI576834B (zh) * 2015-03-02 2017-04-01 聯詠科技股份有限公司 聲頻訊號的雜訊偵測方法與裝置
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US10504525B2 (en) 2015-10-10 2019-12-10 Dolby Laboratories Licensing Corporation Adaptive forward error correction redundant payload generation
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
EP3246923A1 (en) 2016-05-20 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing a multichannel audio signal
CN106101925B (zh) * 2016-06-27 2020-02-21 联想(北京)有限公司 一种控制方法及电子设备
KR102569784B1 (ko) * 2016-09-09 2023-08-22 디티에스, 인코포레이티드 오디오 코덱의 장기 예측을 위한 시스템 및 방법
RU2652434C2 (ru) * 2016-10-03 2018-04-26 Виктор Петрович Шилов Способ приемопередачи дискретных информационных сигналов
CN106533394B (zh) * 2016-11-11 2019-01-04 江西师范大学 一种基于自适应滤波器幅频响应的高精度频率估计方法
EP3800636B1 (en) * 2017-09-12 2023-03-08 Dolby Laboratories Licensing Corporation Packet loss concealment for critically-sampled filter bank-based codecs using multi-sinusoidal detection
JP6907859B2 (ja) * 2017-09-25 2021-07-21 富士通株式会社 音声処理プログラム、音声処理方法および音声処理装置
CN108055087B (zh) * 2017-12-30 2024-04-02 天津大学 利用长肢领航鲸叫声谐波数量进行编码的通信方法及装置
US10186247B1 (en) 2018-03-13 2019-01-22 The Nielsen Company (Us), Llc Methods and apparatus to extract a pitch-independent timbre attribute from a media signal
JP7307805B2 (ja) * 2019-02-21 2023-07-12 テレフオンアクチーボラゲット エルエム エリクソン(パブル) 周波数領域パケットロス補償のための方法、および関連デコーダ
CN113129910A (zh) * 2019-12-31 2021-07-16 华为技术有限公司 音频信号的编解码方法和编解码装置
CN113111618B (zh) * 2021-03-09 2022-10-18 电子科技大学 一种基于改进的经验小波变换的模拟电路故障诊断方法
CN113655529B (zh) * 2021-08-17 2022-11-29 南京航空航天大学 一种针对高采样率的被动磁信号优化提取和检测方法

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2130952A5 (pt) * 1971-03-26 1972-11-10 Thomson Csf
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
FR2692091B1 (fr) 1992-06-03 1995-04-14 France Telecom Procédé et dispositif de dissimulation d'erreurs de transmission de signaux audio-numériques codés par transformée fréquentielle.
JP3328532B2 (ja) * 1997-01-22 2002-09-24 シャープ株式会社 デジタルデータの符号化方法
US6351730B2 (en) * 1998-03-30 2002-02-26 Lucent Technologies Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6496797B1 (en) * 1999-04-01 2002-12-17 Lg Electronics Inc. Apparatus and method of speech coding and decoding using multiple frames
EP1095370A1 (en) * 1999-04-05 2001-05-02 Hughes Electronics Corporation Spectral phase modeling of the prototype waveform components for a frequency domain interpolative speech codec system
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US7447639B2 (en) * 2001-01-24 2008-11-04 Nokia Corporation System and method for error concealment in digital audio transmission
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
US7356748B2 (en) 2003-12-19 2008-04-08 Telefonaktiebolaget Lm Ericsson (Publ) Partial spectral loss concealment in transform codecs
JP4744438B2 (ja) * 2004-03-05 2011-08-10 パナソニック株式会社 エラー隠蔽装置およびエラー隠蔽方法
JP4698593B2 (ja) * 2004-07-20 2011-06-08 パナソニック株式会社 音声復号化装置および音声復号化方法
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
KR100770839B1 (ko) * 2006-04-04 2007-10-26 삼성전자주식회사 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치
KR101041895B1 (ko) * 2006-08-15 2011-06-16 브로드콤 코포레이션 패킷 손실 후 디코딩된 오디오 신호의 시간 워핑
KR100788706B1 (ko) * 2006-11-28 2007-12-26 삼성전자주식회사 광대역 음성 신호의 부호화/복호화 방법
KR101291193B1 (ko) * 2006-11-30 2013-07-31 삼성전자주식회사 프레임 오류은닉방법
US8935158B2 (en) * 2006-12-13 2015-01-13 Samsung Electronics Co., Ltd. Apparatus and method for comparing frames using spectral information of audio signal
RU2441286C2 (ru) * 2007-06-22 2012-01-27 Войсэйдж Корпорейшн Способ и устройство для обнаружения звуковой активности и классификации звуковых сигналов
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8489396B2 (en) * 2007-07-25 2013-07-16 Qnx Software Systems Limited Noise reduction with integrated tonal noise reduction
US8428957B2 (en) * 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
BRPI0910811B1 (pt) * 2008-07-11 2021-09-21 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio.
EP2346030B1 (en) * 2008-07-11 2014-10-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, method for encoding an audio signal and computer program
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
CN101521012B (zh) * 2009-04-08 2011-12-28 武汉大学 Mdct域信号能量与相位补偿方法及其装置
CN101958119B (zh) * 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
CA2777073C (en) * 2009-10-08 2015-11-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping
AU2010309838B2 (en) * 2009-10-20 2014-05-08 Dolby International Ab Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
WO2013107602A1 (en) * 2012-01-20 2013-07-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for audio encoding and decoding employing sinusoidal substitution
EP4235657A3 (en) * 2012-06-08 2023-10-18 Samsung Electronics Co., Ltd. Method and apparatus for concealing frame error and method and apparatus for audio decoding
CN104718570B (zh) * 2012-09-13 2017-07-18 Lg电子株式会社 帧丢失恢复方法,和音频解码方法以及使用其的设备
US9401153B2 (en) * 2012-10-15 2016-07-26 Digimarc Corporation Multi-mode audio recognition and auxiliary data encoding and decoding
US9478221B2 (en) * 2013-02-05 2016-10-25 Telefonaktiebolaget Lm Ericsson (Publ) Enhanced audio frame loss concealment
WO2014126520A1 (en) * 2013-02-13 2014-08-21 Telefonaktiebolaget L M Ericsson (Publ) Frame error concealment
SG11201510513WA (en) * 2013-06-21 2016-01-28 Fraunhofer Ges Forschung Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals

Also Published As

Publication number Publication date
US20180108361A1 (en) 2018-04-19
CA2915437C (en) 2017-11-28
SG11201510513WA (en) 2016-01-28
MX352099B (es) 2017-11-08
JP6248190B2 (ja) 2017-12-13
EP3011556A1 (en) 2016-04-27
PL3011556T3 (pl) 2017-10-31
AU2014283180A1 (en) 2016-02-11
PT3011556T (pt) 2017-07-13
KR101757338B1 (ko) 2017-07-26
KR20160024918A (ko) 2016-03-07
MX2015017369A (es) 2016-04-06
HK1224075A1 (zh) 2017-08-11
CN105408956B (zh) 2020-03-27
RU2632585C2 (ru) 2017-10-06
CN111627451B (zh) 2023-11-03
US20200020343A1 (en) 2020-01-16
EP3011556B1 (en) 2017-05-03
RU2016101336A (ru) 2017-07-26
CN111627451A (zh) 2020-09-04
US10475455B2 (en) 2019-11-12
MY169132A (en) 2019-02-18
US9916834B2 (en) 2018-03-13
JP2016526703A (ja) 2016-09-05
CN105408956A (zh) 2016-03-16
ES2633968T3 (es) 2017-09-26
AU2014283180B2 (en) 2017-01-05
BR112015032013A2 (pt) 2017-07-25
WO2014202770A1 (en) 2014-12-24
CA2915437A1 (en) 2014-12-24
US11282529B2 (en) 2022-03-22
TWI562135B (en) 2016-12-11
TW201506908A (zh) 2015-02-16
US20160104490A1 (en) 2016-04-14

Similar Documents

Publication Publication Date Title
BR112015032013B1 (pt) Método e equipamento para a obtenção de coeficientes do espectropara um quadro de substituição de um sinal de áudio, descodificador de áudio,receptor de áudio e sistema para transmissão de sinais de áudio
US10269359B2 (en) Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
BR122022008603B1 (pt) Decodificador de áudio e método para fornecer uma informação de áudio decodificada utilizando uma dissimulação de erro que modifica um sinal de excitação no domínio de tempo
BR122020016403B1 (pt) Aparelho de decodificação de sinal de áudio, aparelho de codificação de sinal de áudio, método de decodificação de sinal de áudio e método de codificação de sinal de áudio
BR112016030149B1 (pt) Processador de áudio e método para processamento de um sinal de áudio utilizando correção de fase horizontal
BR112015031603B1 (pt) Aparelho e método para reconstrução de uma estrutura
BR112018067944A2 (pt) ?unidade e método de ocultação de erro, codificador e decodificador de áudio, representação de áudio codificada e seu método, sistema?
BR112014021054A2 (pt) controle de coerência de fase para sinais harmônicos nos codecs de áudio perceptuais
ES2592522T3 (es) Codificación de audio basada en representación de coeficientes auto-regresivos
BR112020009114A2 (pt) aparelho para codificar um sinal de informações que inclui uma pluralidade de quadros, sistema que compreende um lado do codificador e um lado do decodificador, método para determinar um atraso de pitch e programa que compreende instruções
BRPI0813178B1 (pt) Processo de codificação de um sinal de áudio de entrada, processo de decodificação escalável de um sinal de áudio, codificador de sinal de áudio de entrada, e codificador de um sinal de áudio

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 20/06/2014, OBSERVADAS AS CONDICOES LEGAIS.