BR112019020357A2 - aparelho e método para processar um sinal de áudio e meio de armazenamento não transitório - Google Patents

aparelho e método para processar um sinal de áudio e meio de armazenamento não transitório Download PDF

Info

Publication number
BR112019020357A2
BR112019020357A2 BR112019020357A BR112019020357A BR112019020357A2 BR 112019020357 A2 BR112019020357 A2 BR 112019020357A2 BR 112019020357 A BR112019020357 A BR 112019020357A BR 112019020357 A BR112019020357 A BR 112019020357A BR 112019020357 A2 BR112019020357 A2 BR 112019020357A2
Authority
BR
Brazil
Prior art keywords
signal
audio signal
bandwidth
frequency
spectrum
Prior art date
Application number
BR112019020357A
Other languages
English (en)
Inventor
Karampourniotis Antonios
Uhle Christian
havenstein Julia
Herre Jürgen
Hellmuth Oliver
Gampp Patrick
Prokein Peter
Disch Sascha
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of BR112019020357A2 publication Critical patent/BR112019020357A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers without distortion of the input signal
    • H03G3/20Automatic control

Abstract

um aparelho para processar um sinal de áudio compreende um separador para separar uma primeira porção de um espectro do sinal de áudio de uma segunda porção do espectro do sinal de áudio, em que a primeira porção tem uma primeira característica de sinal e a segunda porção tem uma segunda característica de sinal. o aparelho compreende um primeiro extensor de largura de banda para estender uma largura de banda da primeira porção com o uso dos primeiros parâmetros associados à primeira característica do sinal, para obter uma primeira porção estendida e compreende um segundo extensor de largura de banda para estender uma largura de banda da segunda porção com o uso dos segundos parâmetros associados ao segunda característica de sinal, para obter uma segunda porção estendida. o aparelho compreende um combinador configurado para usar a primeira porção estendida e a segunda porção estendida para obter um sinal de áudio combinado estendido.

Description

Relatório Descritivo da Patente de Invenção para “APARELHO E MÉTODO PARA PROCESSAR UM SINAL DE ÁUDIO E MEIO DE ARMAZENAMENTO NÃO TRANSITÓRIO” [0001] Em aplicações multimídia, os sinais de áudio geralmente são codificados usando métodos de codificação perceptiva dedicados, como MPEG1/2 Camada 3 (“mp3”), MPEG2/4 codificação de áudio avançada (AAC), etc. Ao decodificar o sinal de áudio codificado, diversos métodos de processamento podem aplicado de modo a reconstruir o sinal de áudio que foi originalmente codificado. No entanto, devido a operações de codificação com perdas, como quantização perceptivamente adaptada ou técnicas de codificação paramétrica, como Replicação de Largura de Banda Espectral (SBR), é possível obter artefatos no sinal de áudio decodificado que podem ser perturbadores.
[0002] Por um longo tempo, os codificadores de áudio perceptivos foram desenvolvidos para preservar principalmente a qualidade perceptiva dos sinais originais. Se o sinal codificado e não codificado for perceptivamente indistinguível, essa propriedade será chamada de “transparência perceptiva”.
[0003] No entanto, a transparência só pode ser alcançada se a taxa de bits disponível (ou seja, a quantidade de dados utilizados) for alta o suficiente. Nos últimos anos, percebeu-se que, com taxas de bits baixas, o prazer perceptivo se torna mais importante do que a proximidade com o original em um sentido de transparência. Portanto, esquemas de codificação perceptivos bem estabelecidos, como MP3 ou AAC, podem parecer subótimos até o momento, em comparação com as abordagens de codificação modernas que visam o prazer perceptivo.
[0004] A seguir, alguns artefatos de codificação são descritos brevemente.
O ARTEFATO DE BIRDIES [0005] A baixa taxa de bits de codificação transformar, muitas vezes os quantificadores para a codificação das linhas espectrais têm que ser ajustados para uma precisão muito grosseira, de modo que a sua faixa dinâmica seja poliadaptada ao sinal. Como resultado, muitas linhas espectrais são quantizadas para 0 pela zona
Petição 870190097126, de 27/09/2019, pág. 260/383
2/79 morta do quantizador ou para o valor 1, correspondendo à primeira etapa do quantizador. Sobre tempo, linhas espectrais ou grupos de linhas podem alternar entre 0 e 1, introduzindo assim modulação temporal indesejada. Esse artefato é chamado de “birdies”, lembrando o pássaro do Twitter. Portanto, essa forte presença de furos espectrais e ilhas espectrais no tempo é um comportamento indesejável do codec que leva a artefatos perceptivos questionáveis, consulte [2] e [3].
LIMITAÇÃO DA LARGURA DE BANDA [0006] Outro artefato de codificação bem conhecido é a limitação de largura de banda. Se, em condições de codificação com baixa taxa de bits, o orçamento de bits disponível for insuficiente para acomodar a precisão necessária para a transparência, os codecs herdados geralmente introduzem uma passa-baixa estática para limitar a largura de banda do áudio. Isso pode causar uma impressão sonora opaca e abafada, consulte [2] e [3].
ARTEFATO DE PICO TONAL [0007] Esse artefato aparece em conexão com métodos de extensão de largura de banda artificial, como replicação de banda espectral (SBR), consulte [4], quando a taxa de tonalidade/ruído foi superestimada. Nesse caso, os componentes tonais são recriados com muita energia, o que leva a um som metálico, consulte [3].
ARTEFATO DE BATIDA [0008] Assim como o artefato de pico tonal, o artefato de batida aparece em conjunto com a extensão artificial da largura de banda. A batida cria a percepção da rugosidade e emerge de dois componentes tonais com distância de frequência próxima, que pode ser causada pela cópia, conforme usado no SBR, consulte [3].
[0009] Portanto, é um objetivo detectar se o sinal de áudio foi submetido a um processamento com capacidade de introduzir artefatos e/ou reduzir esses artefatos.
[0010] Um exemplo para um método de processamento que pode ser uma fonte de artefatos é a Replicação de Banda Espectral (SBR), sendo um método semiparamétrico para estender a largura de banda de um sinal de áudio no lado do decodificador. Em uma primeira etapa, partes do espectro de sinal passa- baixo
Petição 870190097126, de 27/09/2019, pág. 261/383
3/79 transmitido são replicadas copiando os coeficientes espectrais da região de frequência mais baixa para a mais alta. Em uma segunda etapa, o envelope espectral é ajustado. O ajuste do envelope espectral é realizado de modo que a forma grossa do espectro corresponda a um determinado alvo, enquanto a estrutura fina permanece inalterada. [0011] A detecção de SBR é desejada devido ao fato de que, a partir das informações obtidas, pode-se concluir que [0012] 1) Os sinais foram compactados por meio de codificação de áudio perceptiva (ou seja, com perda). A seguir, é apropriada uma aplicação de métodos de aprimoramento para os tipos de artefato mencionados acima.
[0013] 2) A qualidade do som do sinal pode potencialmente ser aprimorada por métodos dedicados para reduzir a audibilidade dos artefatos que foram introduzidos pelo SBR. Tais métodos se beneficiam do conhecimento sobre a frequência de início na qual o SBR está em vigor.
[0014] A frequência inicial na qual o SBR está em vigor é de interesse para pósprocessamentos que melhoram a qualidade do som, mitigando os artefatos introduzidos pelo SBR. Portanto, é necessário detectar o SBR e estimar a frequência de início do SBR. Em particular, é um desejo determinar se esse aprimoramento é desejado ou não. Por exemplo, não é apropriado para sinais de alta qualidade de som, devido ao fato de que o aprimoramento pode degradar a qualidade do som quando o sinal de áudio é de alta qualidade.
[0015] Um método para a detecção de SBR é descrito no documento n° US 9.117.440 B2. O método descrito opera em sinais de sub-banda que são calculados com o uso de um banco de filtros ou uma transformação de frequência de tempo. Em seguida, quantifica a relação entre várias sub-bandas por meio de correlação cruzada, ou seja, multiplicando as amostras correspondentes e acumulando esses produtos ao longo do tempo.
[0016] Outro exemplo para uma fonte de artefatos é a redução de largura de banda (BR), também chamada de limitação de largura de banda (BL). Quando a largura de banda é severamente limitada, é percebida uma degradação da qualidade do som e
Petição 870190097126, de 27/09/2019, pág. 262/383
4/79 um aprimoramento da qualidade. Essa melhoria de qualidade pode compreender uma extensão de largura de banda (BWE), que deve ser aplicada apenas se necessário, ou seja, quando a largura de banda natural dos sinais tiver sido artificialmente severamente reduzida. Um método para BWE que usa uma estimativa da largura de banda é descrito em [1 ]. A largura de banda é estimada detectando a maior frequência presente no sinal a qualquer momento. Esse método é propenso a erros de detecção de falsos positivos, devido ao fato de que um sinal de áudio pode ter uma largura de banda limitada por natureza, pois o mecanismo que gerou o sinal só gerou energia em frequências mais baixas.
[0017] Resumindo, codificadores de áudio perceptivos são amplamente utilizados, quando o espaço de armazenamento ou a largura de banda de streaming para conteúdo de áudio é limitado. Se a taxa de compactação aplicada for muito alta (e a taxa de dados usada após a compactação for muito baixa), vários artefatos de codificação serão introduzidos que degradam a qualidade de áudio percebida.
[0018] Portanto, é um objetivo da invenção fornecer uma identificação aprimorada de sinais de áudio, compreendendo uma característica sendo obtida pelo processamento de áudio propenso a artefatos e/ou fornecer um conceito para reduzir esses artefatos por meio da aplicação de pós-processamentos dedicados nesse áudio, material.
[0019] Esse objetivo é alcançado pelo objeto de acordo com as reivindicações independentes.
[0020] De acordo com um primeiro aspecto, os inventores constataram que, com o uso de um sinal máximo local derivado dos sinais de áudio e determinando uma similaridade entre os segmentos do sinal máximo local, uma identificação segura e eficiente de uma característica relacionada a um aprimoramento espectral o processamento pode ser obtido de modo que um respectivo pós-processamento possa ser implantado para o respectivo sinal de áudio, de modo a reduzir, por exemplo, o artefato de pico tonal e/ou o artefato de batida. Com base na avaliação do
Petição 870190097126, de 27/09/2019, pág. 263/383
5/79 sinal, uma informação lateral indicando o processamento de áudio implantado pode não ser necessária, de modo que seja possível uma operação às cegas do módulo.
[0021] De acordo com uma modalidade do primeiro aspecto, um aparelho para determinar uma característica predeterminada relacionada a um processamento de aprimoramento espectral de um sinal de áudio compreende um derivador configurado para obter um espectro do sinal de áudio e para obter informações relacionadas a uma estrutura fina do espectro. O aparelho compreende um determinador configurado para determinar uma similaridade na estrutura fina do espectro. O aparelho compreende ainda um processador para fornecer uma informação indicando que o sinal de áudio compreende a característica predeterminada dependente de uma avaliação da similaridade. Para comparar uma similaridade entre os segmentos das informações relacionadas à estrutura fina, pode ser necessário um baixo esforço computacional. Além disso, pode ser obtida uma determinação precisa e segura de segmentos similares, indicando que um processamento espectral de aprimoramento pode ter sido realizado.
[0022] De acordo com uma modalidade adicional do primeiro aspecto, um método para determinar uma característica predeterminada relacionada a um processamento de aprimoramento espectral de um sinal de áudio compreende obter um espectro do sinal de áudio e derivar informações relacionadas a uma estrutura fina do espectro. O método compreende determinar uma similaridade na estrutura fina, como entre segmentos da informação relacionada à estrutura fina e compreende fornecer uma informação indicando que o sinal de áudio compreende a característica predeterminada dependente de uma avaliação da similaridade.
[0023] De acordo com uma modalidade adicional do primeiro aspecto, um meio de armazenamento não transitório foi armazenado em um programa de computador com um código de programa para executar esse método, quando executado em um computador.
[0024] De acordo com um segundo aspecto, os inventores constataram que, ao avaliar um espectro de um sinal de áudio em relação a um declive do espectro, uma
Petição 870190097126, de 27/09/2019, pág. 264/383
6/79 caracterização segura e eficiente do sinal de áudio, de modo a compreender uma característica relacionada a uma limitação artificial da largura de banda o processamento pode ser obtido de modo a permitir um respectivo pós-processamento, por exemplo, para reduzir ou eliminar um artefato de birdies e/ou um artefato de limitação de largura de banda. Com base na avaliação do sinal, uma informação lateral indicando o processamento de áudio implantado pode não ser necessária, de modo que seja possível uma operação às cegas do módulo.
[0025] De acordo com uma modalidade do segundo aspecto, um aparelho para determinar uma característica predeterminada relacionada a um processamento artificial de limitação de largura de banda de um sinal de áudio compreende um avaliador de declive configurado para avaliar um declive de um espectro do sinal de áudio para obter um resultado de avaliação de declive. O aparelho compreende ainda um processador para fornecer uma informação indicando que o sinal de áudio compreende a característica predeterminada dependente de uma avaliação do resultado da avaliação do declive. Baseando a avaliação se o sinal de áudio compreender uma característica relacionada a um processamento de limitação de largura de banda artificial no declive do espectro, por exemplo, uma borda descendente do espectro, uma detecção precisa do processamento de limitação de largura de banda artificial pode ser obtida ao usar um baixo esforço computacional.
[0026] De acordo com outra modalidade do segundo aspecto, um método para determinar uma característica predeterminada relacionada a um processamento artificial de limitação de largura de banda de um sinal de áudio compreende avaliar um declive de um espectro do sinal de áudio para obter um resultado de avaliação de declive. O método compreende fornecer uma informação indicando que o sinal de áudio compreende a característica predeterminada dependente de uma avaliação do resultado da avaliação do declive.
[0027] De acordo com uma modalidade do segundo aspecto, um meio de armazenamento não transitório tem um armazenado em um programa de computador
Petição 870190097126, de 27/09/2019, pág. 265/383
7/79 com um código de programa para executar esse método, quando executado em um computador.
[0028] Ambos, o primeiro e o segundo aspectos permitem discriminar entre sinais de áudio ou quadros dos quais estão sujeitos a um respectivo processamento e sinais de áudio ou quadros dos mesmos que não foram submetidos a fim de evitar o pósprocessamento de quadros não submetidos.
[0029] De acordo com um terceiro aspecto, os inventores constataram que, ao realizar uma extensão de largura de banda para diferentes porções com diferentes características de sinal de um sinal de áudio de maneira diferente, o aprimoramento das diferentes porções e/ou características pode ser realizado independentemente um do outro, a fim de obter uma combinação sinal com alta qualidade compreendendo primeiras porções aprimoradas e aprimorando segundas porções. O processamento das diferentes características do sinal de maneira diferente pode permitir a adaptação do processamento com base nas respectivas características.
[0030] De acordo com uma modalidade do terceiro aspecto, um aparelho para processar um sinal de áudio compreende um separador para separar uma primeira porção de um espectro do sinal de áudio de uma segunda porção do espectro do sinal de áudio. A primeira porção tem uma primeira característica de sinal e a segunda porção tem uma segunda característica de sinal. O aparelho compreende um primeiro extensor de largura de banda para estender uma largura de banda da primeira porção com o uso dos primeiros parâmetros associados à primeira característica do sinal, para obter uma primeira porção estendida. O aparelho compreende um segundo extensor de largura de banda para estender uma largura de banda da segunda porção com o uso dos segundos parâmetros associados à segunda característica do sinal, para obter uma segunda porção estendida. O aparelho compreende ainda um combinador configurado para usar a primeira porção estendida e a segunda porção estendida para obter um sinal de áudio combinado estendido. Isso pode permitir o aprimoramento das diferentes partes com diferentes características de sinal,
Petição 870190097126, de 27/09/2019, pág. 266/383
8/79 independentes umas das outras, de modo a obter um sinal de áudio combinado com alta qualidade.
[0031] De acordo com outra modalidade do terceiro aspecto, um método para processar um sinal de áudio compreende separar uma primeira porção de um espectro do sinal de áudio de uma segunda porção do espectro do sinal de áudio, a primeira porção tendo uma primeira característica de sinal e a segunda porção com uma segunda característica de sinal. O método compreende estender uma largura de banda da primeira porção com o uso dos primeiros parâmetros associados à primeira característica do sinal, para obter uma primeira porção estendida. O método compreende estender uma largura de banda da segunda porção com o uso de um segundo parâmetro associado à segunda característica do sinal, para obter uma segunda porção estendida. O método compreende ainda o uso da primeira porção estendida e da segunda porção estendida para obter um sinal de áudio combinado estendido.
[0032] De acordo com outra modalidade do terceiro aspecto, um meio de armazenamento não transitório foi armazenado em um programa de computador com um código de programa para executar esse método, quando executado em um computador.
[0033] De acordo com um quarto aspecto, os inventores constataram que ao mudar de fase uma porção de um sinal de áudio em relação a uma porção diferente do sinal de áudio, uma rugosidade percebida pode ser reduzida. Em particular, uma porção que pode ser gerada ou copiada para estender a largura de banda pode ser deslocada em fase quando comparada a um espectro não estendido.
[0034] De acordo com uma modalidade do quarto aspecto, um aparelho para processar um sinal de áudio compreende um filtro antirrugosidade para mudar de fase pelo menos uma porção do sinal de áudio, de modo a obter um sinal de mudança de fase. O aparelho compreende um filtro passa-alta configurado para filtrar os sinais com desvio de fase, de modo a obter um primeiro sinal filtrado. O aparelho compreende um filtro passa-baixa configurado para filtrar o sinal de áudio de modo a
Petição 870190097126, de 27/09/2019, pág. 267/383
9/79 obter um segundo sinal filtrado. O aparelho compreende um combinador configurado para combinar o primeiro sinal filtrado e o segundo sinal filtrado, de modo a obter um sinal de áudio aprimorado. O aparelho permite porções de mudança de fase deixadas pelo filtro passa-alta quando comparadas às partes deixadas pelo filtro passa-baixa, de modo que o primeiro sinal filtrado possa compreender porções com deslocamento de fase quando comparado ao sinal de áudio, o segundo sinal filtrado, respectivamente. Isso pode permitir obter uma baixa rugosidade no sinal combinado. [0035] De acordo com outra modalidade do quarto aspecto, um método para processar um sinal de áudio compreende mudança de fase pelo menos uma porção do sinal de áudio, de modo a obter um sinal de mudança de fase. O método compreende filtrar os sinais de mudança de fase com o uso de um filtro passa-alta, de modo a obter um primeiro sinal filtrado. O método compreende ainda filtrar o sinal de áudio com o uso de um filtro passa-baixa, de modo a obter um segundo sinal filtrado. O método compreende ainda combinar o primeiro sinal filtrado e o segundo sinal filtrado, de modo a obter um sinal de áudio aprimorado.
[0036] De acordo com outra modalidade do quarto aspecto, um meio de armazenamento não transitório foi armazenado em um programa de computador que tem um código de programa para executar esse método, quando executado em um computador.
[0037] Modalidades adicionais da presente invenção são definidas nas reivindicações dependentes.
[0038] Para uma compreensão mais completa da presente revelação e das vantagens na mesma, agora é feita referência às seguintes descrições, levando em conjunto com os desenhos anexos, nos quais:
A Figura 1 mostra um diagrama de blocos esquemático de um aparelho para determinar uma característica predeterminada relacionada a um processamento de aprimoramento espectral de um sinal de áudio, de acordo com uma modalidade do primeiro aspecto;
Petição 870190097126, de 27/09/2019, pág. 268/383
10/79
A Figura 2a mostra um gráfico esquemático que ilustra um exemplo de espectro de acordo com uma modalidade do primeiro aspecto, que pode ser derivado de um sinal de áudio a partir do qual o espectro da Figura 1 pode ser obtido;
A Figura 2b mostra um diagrama de exemplo esquemático do sinal máximo local na mesma abcissa de frequência da Figura 2a, de acordo com uma modalidade do primeiro aspecto;
A Figura 3 mostra um gráfico esquemático de acordo com uma modalidade do primeiro aspecto para determinar a similaridade usando uma regra de determinação;
A Figura 4 mostra um exemplo de uma função de similaridade pósprocessada de acordo com uma modalidade do primeiro aspecto, ilustrada como seu valor filtrado;
A Figura 5 mostra um diagrama de blocos esquemático de um aparelho de acordo com uma modalidade do primeiro aspecto que compreende um estimador de frequência;
A Figura 6a mostra uma representação gráfica esquemática de uma matriz de similaridade local exemplificadora de acordo com uma modalidade do primeiro aspecto;
A Figura 6b mostra um diagrama esquemático de uma linha da matriz ilustrada na Figura 6a de acordo com uma modalidade do primeiro aspecto;
A Figura 7 mostra um diagrama de blocos esquemático de um aparelho de acordo com uma modalidade do primeiro aspecto, que compreende uma calculadora de espectro;
A Figura 8 mostra um fluxograma esquemático de um método para determinar uma característica predeterminada relacionada a um processamento de aprimoramento espectral de um sinal de áudio de acordo com uma modalidade do primeiro aspecto;
A Figura 9 mostra um diagrama de blocos esquemático de um aparelho de acordo com uma modalidade do segundo aspecto;
Petição 870190097126, de 27/09/2019, pág. 269/383
11/79
A Figura 10 mostra um diagrama esquemático que ilustra um exemplo de espectro em conexão com uma modalidade do segundo aspecto;
A Figura 11 mostra um diagrama esquemático de um resultado exemplificador de uma função de diferença espectral de acordo com uma modalidade do segundo aspecto;
A Figura 12a mostra um diagrama de blocos esquemático de um aparelho de acordo com uma modalidade do segundo aspecto, que compreende um estimador de energia;
A Figura 12b mostra um exemplo de espectro compreendendo um bordo descendente a uma frequência de corte de acordo com uma modalidade do segundo aspecto;
A Figura 12c mostra um diagrama de blocos esquemático de um aparelho configurado para processar um sinal de áudio que pode ser recebido de um decodificador de acordo com uma modalidade do segundo aspecto;
A Figura 12d mostra um diagrama de blocos esquemático de uma funcionalidade de um processador para determinar pesos espectrais de acordo com uma modalidade do segundo aspecto;
A Figura 12e mostra um diagrama de blocos esquemático de um intensificador de sinal de acordo com uma modalidade do segundo aspecto, configurado para reduzir o artefato de Birdies;
A Figura 12f mostra um fluxograma esquemático de um método para processar um sinal de áudio de acordo com uma modalidade do segundo aspecto;
A Figura 13a mostra um fluxograma esquemático de um método para determinar uma característica predeterminada relacionada a um processamento artificial de limitação de largura de banda de um sinal de áudio, de acordo com uma modalidade do segundo aspecto;
A Figura 13b mostra um fluxograma esquemático de um método adicional para determinar uma característica predeterminada relacionada a um processamento
Petição 870190097126, de 27/09/2019, pág. 270/383
12/79 artificial de limitação de largura de banda de um sinal de áudio de acordo com uma modalidade do segundo aspecto, o método também avalia uma frequência de corte;
A Figura 14 mostra um diagrama de blocos esquemático de um aparelho de acordo com uma modalidade do terceiro aspecto;
A Figura 15 mostra um diagrama esquemático que ilustra um espectro exemplificador que compreende componentes diferentes de acordo com uma modalidade do terceiro aspecto;
A Figura 16 mostra um diagrama de blocos esquemático de um aparelho de acordo com uma modalidade do terceiro aspecto;
A Figura 17a mostra um exemplo de espectro de uma primeira porção do sinal de áudio, de acordo com uma modalidade do terceiro aspecto;
A Figura 17b mostra um diagrama esquemático da primeira porção sendo estendida por um número de duas partes duplicadas de acordo com uma modalidade do terceiro aspecto;
A Figura 17c mostra um exemplo de espectro de magnitude que pode ser obtido a partir de um formador de envelope configurado para moldar pelo menos as porções estendidas da Figura 17b, de acordo com uma modalidade do terceiro aspecto;
A Figura 18 mostra um diagrama de blocos esquemático de um branqueador espectral sendo configurado para branquear o sinal de áudio de acordo com uma modalidade do terceiro aspecto;
A Figura 19 mostra uma funcionalidade de blocos opcionais, sendo um analisador de sinal e uma tabela de consulta do aparelho da Figura 16, de acordo com uma modalidade do terceiro aspecto;
A Figura 20 mostra um fluxograma esquemático de um método de acordo com uma modalidade do terceiro aspecto;
A Figura 21 mostra um diagrama esquemático de um aparelho de acordo com uma modalidade do quarto aspecto;
Petição 870190097126, de 27/09/2019, pág. 271/383
13/79
A Figura 22 mostra um diagrama de blocos esquemático de um aparelho compreendendo um separador de acordo com uma modalidade do quarto aspecto; e
A Figura 23 mostra um fluxograma esquemático de um método para processar um sinal de áudio de acordo com uma modalidade do terceiro aspecto.
[0039] Elementos iguais ou equivalentes ou elementos com funcionalidade igual ou equivalente são indicados na descrição a seguir por números de referência iguais ou equivalentes, mesmo que ocorram em figuras diferentes.
[0040] Deve-se notar também que as modalidades aqui descritas se referem ao processamento de sinal digital. Portanto, todos os sinais são limitados à banda para frequências abaixo da metade da frequência de amostragem devido à amostragem. A limitação de largura de banda (artificial) discutida aqui se refere a limitação de largura de banda adicional, de modo que a largura de banda do sinal seja menor do que a representação digital permitiría.
[0041] O primeiro aspecto e o segundo aspecto dizem respeito à identificação das características do sinal dentro de um sinal de áudio que indica que o respectivo sinal de áudio foi submetido a um processamento específico. Ao identificar as respectivas características e parâmetros relacionados a elas, ações e processamento apropriados podem ser executados ou executados para reduzir ou eliminar artefatos que possam ocorrer em resposta ao processamento. Portanto, os artefatos de redução possivelmente inseridos no sinal de áudio processado podem ser entendidos como relacionados ao primeiro aspecto, ao segundo aspecto, respectivamente.
[0042] O terceiro e quarto aspectos se referem ao pós-processamento de sinais de áudio. Para pós-processamento de sinais de áudio, a fim de melhorar a qualidade do áudio, informações em conexão com o processamento do sinal de áudio realizado anteriormente podem ser usadas, por exemplo, informações derivadas de acordo com o primeiro e o segundo aspecto e/ou podem ser usadas em conexão com diferentes sinais de áudio.
[0043] Portanto, a seguir, será feita referência primeiro ao primeiro e segundo aspecto antes de se referir ao terceiro e quarto aspecto. O escopo do primeiro aspecto
Petição 870190097126, de 27/09/2019, pág. 272/383
14/79 é a melhoria da qualidade do som dos sinais de áudio, em particular dos sinais de áudio que foram codificados usando uma compressão com perda ou outro processamento de sinal. A Replicação de Banda Espectral (SBR) é um método para codificação de áudio paramétrica para sintetizar o conteúdo de alta frequência de partes replicantes do espectro do sinal de áudio a partir de frequências mais baixas, normalmente guiadas por informações secundárias que são transmitidas no fluxo de bits. O conhecimento sobre a presença do SBR e a frequência inicial na qual o SBR está em vigor (ou sinônimo da frequência de corte na qual o sinal foi ilimitado antes do SBR) é usado ou necessário para aprimorar ou melhorar a qualidade do som dos sinais de áudio. Modalidades de acordo com o primeiro aspecto fornecem um conceito de análise para recuperar essas informações de um sinal de áudio depois que elas foram decodificadas sem usar as informações no fluxo de bits. O conceito descrito é capaz de detectar SBR e outros processos que copiam partes do espectro na subbanda inferior e colam-nas em frequências mais altas. Outro exemplo, exceto o SBR para esse método, é, com base na configuração específica, o Intelligent Gap Filling (IGF).
[0044] Quando comparadas com o método revelado no documento US 9.117.440 B2, as modalidades de acordo com o primeiro aspecto melhoram a robustez da análise em relação às modificações do envelope espectral analisando e provavelmente analisando exclusivamente a estrutura fina do espectro. Além disso, tem menos carga computacional, pois o relacionamento é calculado usando a soma de números binários em vez de multiplicação.
[0045] A Figura 1 mostra um diagrama de blocos esquemático de um aparelho 10 para determinar uma característica predeterminada relacionada a um processamento de aprimoramento espectral de um sinal de áudio 12, por exemplo, um SBR e/ou um IGF. O aparelho 10 compreende um derivador 14 configurado para obter um espectro do sinal de áudio 12 e para derivar informações relacionadas a uma estrutura fina do espectro. A estrutura fina pode estar relacionada ao curso das linhas espectrais dentro do espectro. Tais informações podem ser representadas, por exemplo, com o uso de
Petição 870190097126, de 27/09/2019, pág. 273/383
15/79 um sinal máximo local indicando os extremos locais, por exemplo, máximos e/ou mínimos dentro do espectro. Por exemplo, o sinal máximo local pode ter um valor predefinido, como um valor máximo ou um valor mínimo em um local do máximo local e um valor diferente em outros locais. Por exemplo, nos outros locais, o sinal máximo local pode compreender um valor mínimo. Alternativamente, o sinal máximo local pode compreender um valor mínimo no máximo local e um valor máximo em caso contrário. Alternativa ou adicionalmente, o sinal máximo local pode representar os máximos locais e os mínimos locais. Desse modo, a estrutura fina do espectro pode ser mantida enquanto atenua ou exclui outras informações. Apenas a título de exemplo não limitativo, as modalidades aqui descritas podem se referir a um sinal máximo local derivado pelo derivador 14.
[0046] Para derivar o sinal máximo local do espectro, o derivador 14 pode derivar ou computar ou determinar o espectro do sinal de áudio 12. Alternativamente, o derivador 14 pode receber um sinal contendo informações indicando o espectro ou o próprio espectro. Assim, o sinal ilustrado 12 pode ser um sinal no domínio do tempo ou no domínio da frequência. O espectro sendo derivado pelo derivador 14 ou recebido pelo derivador 14 pode ser, por exemplo, um espectro de magnitude ou um espectro de potência. Para derivar ou computar tal espectro, uma transformada de Fourier de curto prazo (STFT) ou outras transformações adequadas podem ser usadas. Utilizando o STFT, o sinal de áudio 12 pode ser dividido ou separado em vários blocos adequados e cada bloco pode ser submetido ao STFT. Isso pode permitir obter uma pluralidade de espectros do sinal de áudio, por exemplo, um espectro para cada bloco.
[0047] Por exemplo, sinais de sub-banda podem ser calculados com o uso de um banco de filtros. SBR é um processamento no qual partes do espectro são replicadas. O mesmo vale para o transporte harmônico. No IGF, algumas partes do espectro, por exemplo, que compreendem uma faixa de alta frequência, são atenuadas ou ajustadas para 0 e depois recarregadas. Quando se refere ao SBR, o envelope espectral pode ser modificado, enquanto a estrutura fina do espectro pode ser
Petição 870190097126, de 27/09/2019, pág. 274/383
16/79 mantida. Portanto, modalidades de acordo com o primeiro aspecto propõem um conceito que é robusto às modificações do envelope espectral. Para este fim, o derivador 14 é configurado para derivar um sinal máximo local do espectro. O sinal máximo local pode ser definido como um vetor de um comprimento específico, por exemplo, de acordo com os compartimentos de frequência no espectro, cujos elementos são configurados para 1 nos índices em que o espectro tem um máximo local e, em caso contrário, definido como 0. É importante mencionar que outras regras podem ser aplicadas. Por exemplo, além dos máximos locais, os mínimos locais podem ser definidos para um valor específico, por exemplo, 1. Alternativa ou adicionalmente, um valor diferente, por exemplo, 0 ou um valor diferente de 1, pode ser usado para indicar os máximos e/ou mínimos locais. Esse processamento pode ser similar a uma operação de clareamento ou lisonjeiro que mantém a estrutura fina e remove todas as outras informações. O sinal máximo local pode permitir melhorar a identificação de similaridades à medida que a comparação pode ser implantada, de modo a focar na estrutura dos segmentos comparados.
[0048] A Figura 2a mostra um gráfico esquemático que ilustra um espectro de exemplo 16 que pode ser derivado do sinal 12 ou pode ser o sinal 12. A abcissa ilustra o índice de frequência k, em que a ordenada ilustra um valor de magnitude X (k) do espectro 16.
[0049] A Figura 2b mostra um diagrama de exemplo esquemático do sinal máximo local Z na mesma frequência abcissa k. Nos compartimentos de frequência /ei a k?, nos quais o espectro 16 compreende os máximos locais 18i a 18?, a função máxima local Z(k) é configurada para um valor máximo normalizado, como 1, e para um valor mínimo normalizado, como 0 em outros locais também. A forma triangular na Figura 2b pode resultar de uma interpolação entre diferentes caixas de frequência para uma melhor compreensão das figuras. O sinal máximo local Z pode compreender um mesmo comprimento que 0 espectro X(k). O derivador de 14 pode ser configurado para proporcionar um contendo informação de sinal 22 que indica 0 valor máximo do sinal Z local (k) a ser derivado do espectro 16.
Petição 870190097126, de 27/09/2019, pág. 275/383
17/79 [0050] O aparelho 10 pode compreender um determinador 24 configurado para determinar uma similaridade C(t) entre segmentos do sinal máximo local. Para a detecção do processamento espectral, a similaridade entre um primeiro segmento do vetor Z(k), k= ko....k e um segundo segmento do vector Z(k + t) pode ser determinada ou calculada pela derivador 24 como uma função do desfasamento ou mudança τ. Por exemplo, a similaridade C(r) pode ser calculada como a soma dos valores absolutos da diferença dos dois vetores, isto é, os segmentos do sinal máximo local.
[0051] Os segmentos a serem comparados podem ter o mesmo comprimento. O comprimento depende da resolução da frequência na qual o espectro e o sinal máximo local foram calculados. A resolução da frequência depende do número de coeficientes espectrais que são calculados. O número de coeficientes para o espectro e o sinal máximo local é de pelo menos 16 ou 16384 no máximo, mas geralmente são escolhidos valores entre 256 e 4096. O valor exato pode ser selecionado dependendo da taxa de amostragem do sinal. O primeiro segmento pode compreender elementos do vetor de sinal máximo local que correspondem, por exemplo, a frequências na faixa entre 2.000 e 15.000 Hz.
[0052] O parâmetro τ pode variar de 1 a um valor máximo possível no sinal, por exemplo, representando a frequência máxima ou uma frequência de pesquisa máxima, por exemplo, relacionada a uma frequência de corte no sinal de áudio 12. Isso pode ser representado como uma regra de determinação : ®ύ'::: V L j- (A 4- (1) [0053] A Figura 3 mostra um gráfico esquemático de acordo com um exemplo que pode ser obtido, em que a determinação da similaridade é feita usando a regra de determinação dada acima. Uma abcissa do gráfico mostra o atraso ou deslocamento τ, em que a ordenada mostra um valor da função de similaridade C(t).
[0054] Ao determinar o valor de similaridade C(r) para uma pluralidade de valores do parâmetro r, o gráfico ilustrado na Figura 3 pode ser obtido. Nas regiões 26i a 263,
Petição 870190097126, de 27/09/2019, pág. 276/383
18/79 variações no sinal podem ser obtidas sendo associadas aos valores n, T2, T3 respectivamente do parâmetro t. Essas variações podem compreender um máximo local e/ou um mínimo local dentro da função de similaridade C(r). Ou seja, deslocando ou aplicando um atraso n, T2, T3, a função de similaridade pode mostrar um máximo ou mínimo local e, portanto, indicando que, ao deslocar um segmento respectivo pelo atraso n, T2, T3, um similar é obtido um sinal que pode ser um indicador para um processamento de aprimoramento espectral. No exemplo dado acima, o atraso máximo ré 20.000 Hz.
[0055] O determinador pode ser configurado para selecionar pelo menos um máximo local e/ou mínimo local dos valores de similaridade e/ou pode selecionar os valores derivados dos mesmos para determinar a similaridade. Em particular, as variações nas regiões 26i, 262 e 263 indicam uma alta similaridade entre os segmentos utilizados no turno indicado pelo parâmetro π, T2, T3, respectivamente.
[0056] Com referência novamente à Figura 1, 0 determinador 24 pode ser configurado para fornecer uma informação ou sinal 28 indicando um resultado da similaridade, por exemplo, os valores η, T2 e/ou Γ3 do parâmetro τ ou valores são derivados disso. O aparelho 10 pode compreender um processador 32 para fornecer uma informação 34 indicando que 0 sinal de áudio 12 compreende a característica predeterminada dependente de uma avaliação da similaridade, por exemplo, avaliando 0 sinal 28. Opcionalmente, a função de análise obtida, ou seja, a função de similaridade, pode ser processada ainda mais, por exemplo, pelo determinante 24 e/ou pelo processador 32. Por exemplo, uma filtragem de passagem de banda pode ser executada para atenuar componentes de deslocamento na função de similaridade e aumentar 0 contraste dos máximos locais de interesse dentro da função de similaridade C(r). O aparelho 10, por exemplo, 0 determinante 24 pode compreender um filtro configurado para filtrar os valores de similaridade, de modo a obter valores de similaridade filtrados ilustrados na Figura 4. O processador 32 pode ser configurado para fornecer as informações 34, de modo a compreender informações que indiquem pelo menos uma das quais 0 sinal de áudio foi submetido ao processamento espectral
Petição 870190097126, de 27/09/2019, pág. 277/383
19/79 de aprimoramento, uma frequência inicial e/ou uma frequência final do processamento espectral de aprimoramento.
[0057] A Figura 4 mostra um exemplo de uma função de similaridade pósprocessada, ilustrada como seu valor filtrado, a saber, na ordenada sobre a abcissa, mostrando o parâmetro t. Por exemplo, um filtro é implantado como um filtro de resposta finita ao impulso (FIR) com coeficientes de filtro h = [-1 2 -1 ]. Isso significa que o k-ésimo elemento de saída do vetor filtrado é calculado por uma combinação linear dos elementos nos índices k-1, k e k+1 ponderados com h(1) =-1, h(2) = 2 e h(3) =-1. Isso pode ser representado com base na regra de determinação:
y (k) = h (1) x_ {k-1} + h (2) x_ {k} + h (3) x_ {k + 1} [0058] Os três maiores máximos locais nos valores de parâmetro n, T2 e T3 são causados pelo processamento do aprimoramento espectral, por exemplo, a replicação da banda espectral. Por exemplo, o processamento de SBR pode ser detectado quando um pequeno número de máximos locais de grande magnitude aparece na função. Um número pequeno pode se referir a um número de no máximo 15, no máximo 10 ou no máximo 5 máximos. De acordo com uma modalidade, no máximo 13 máximos locais devem ser investigados para detectar SBR de acordo com configurações comuns de última geração de SBR.
[0059] A grande magnitude pode se referir a um valor de pelo menos 3 dB quando comparado ao sinal regular, de pelo menos 5 dB ou pelo menos 6 dB. Quando se refere novamente à Figura 3, os máximos locais nas regiões 26 1, 26 2 e 26 3 podem se referir ao sinal ao lado da respectiva região como sendo ruído. Esse ruído pode ser atenuado pelo pós-processamento, a fim de aumentar a determinação máxima conforme descrito em relação à Figura 4. Uma grande magnitude dos máximos locais é definida como sendo maior que um limite. O valor exato do limite pode ser definido, por exemplo, manualmente para estar na faixa de 0, 1 e 10, dependendo do número de valores que foram usados para calcular a função de similaridade. Normalmente, um valor de 5 pode ser usado.
Petição 870190097126, de 27/09/2019, pág. 278/383
20/79 [0060] Ou seja, o processador 32 pode ser configurado para avaliar um número de máximos locais 26 de valores de similaridade ou valores derivados dos mesmos e para avaliar uma amplitude dos máximos locais 26. O processador 32 pode ser configurado para fornecer a informação 34, indicando que o sinal de áudio 12 compreende a característica predeterminada quando o número de máximos 26 que compreende pelo menos um valor limiar de amplitude 27 está abaixo de um valor limiar numérico, isto é, um número local máximo exceder o valor do limiar de amplitude 27 é suficientemente baixo.
[0061] Por outras palavras, a Figura 4 mostra a função de similaridade do pósprocessamento. Os máximos locais são mostrados como um círculo, o máximo global é destacado por uma cruz. O determinante 24 pode ser configurado para selecionar pelo menos um máximo local a partir dos valores de similaridade filtrados. Os sinais harmônicos consistem em um ou mais sinusoides com uma frequência fundamental e seus harmônicos, ou seja, tons parciais cujas frequências são aproximadamente múltiplos inteiros de uma frequência fundamental. Portanto, um ou mais máximos locais podem aparecer na função de similaridade, como uma função de correlação automática (ACF). Para discriminar entre máximos locais correspondentes a tons parciais harmônicos e SBR ou outro processamento de aprimoramento espectral, o intervalo de pesquisa pode ser definido com valores apropriados, sendo nitidamente maior, por exemplo, para SBR do que para termos parciais harmônicos. Assim, o processador 32 pode ser configurado para excluir harmônicos do sinal de áudio da avaliação da similaridade. Isso pode ser feito selecionando as partes do espectro do sinal de áudio que devem ter uma quantidade baixa ou mesmo sem harmônicos.
[0062] Detectar o máximo local nos valores de parâmetro η, Γ2 e Γ3 pode ser um indicador suficiente para a presença do processamento de aprimoramento espectral. No entanto, pode ser vantajoso estimar ainda mais a frequência de início do processamento de aprimoramento espectral, por exemplo, o SBR. O resultado da função de similaridade ou do máximo local pode descrever a mudança na qual uma parte do espectro foi copiada e colada. Para completar, as informações sobre a
Petição 870190097126, de 27/09/2019, pág. 279/383
21/79 frequência de início e parada do espectro da sub-banda de origem ou do espectro da sub-banda de destino podem ser interessantes.
[0063] A Figura 5 mostra um diagrama de blocos esquemático de um aparelho 50 de acordo com uma modalidade. O aparelho 50 pode ser uma versão estendida do aparelho 10 e pode ainda compreender um estimador de frequência 36 configurado para determinar uma frequência de início e/ou uma frequência de parada do processamento de aprimoramento espectral. O estimador de frequência 36 pode ser configurado para fornecer uma informação ou um sinal 38 compreendendo a respectiva informação indicando a frequência de início e/ou a frequência de parada. O estimador de frequência 36 pode ser configurado para usar o sinal máximo local Z (k), por exemplo, obtendo ou recebendo o sinal 22, para determinar uma similaridade de elemento entre um elemento de um primeiro segmento do sinal máximo local e um elemento correspondente de um segundo segmento do sinal máximo local. O segundo segmento pode ser deslocado com respeito ao primeiro segmento por uma série de amostras t. Isso pode ser chamado de análise de similaridade local (LSA). A entrada pode ser a representação da estrutura fina do espectro de magnitude, por exemplo, o sinal máximo local Z(k). O estimador de frequência 36, ao executar LSA, pode operar na similaridade entre os elementos entre o k- ésimo elemento no primeiro vetor Z(k) e o elemento na posição k+τ, Z(k+f). Para esse fim, a matriz de similaridade local pode ser calculada como valor absoluto da diferença dos dois números binários Z(k) e Z(k+r) de acordo com a regra de determinação / ; - *x < < -' (2) [0064] O valor L(k,f) da matriz de similaridade local pode então ser processado por média recursive ao longo do tempo. Isso pode ser realizado de acordo com a regra de determinação.
í Lfe, í ··- t) x (1 — r)..
(3)
Petição 870190097126, de 27/09/2019, pág. 280/383
22/79 em que denota um buffer que armazena a saída da média recursiva do intervalo de tempo anterior (quadro) do sinal de áudio e 0 < b <1 é uma constante de tempo que controla a média temporal. Assim, o estimador de frequência 36 pode ser configurado para submeter a similaridade de elementos de uma pluralidade de elementos para o primeiro e o segundo segmentos a uma média recursiva ao longo do tempo, de modo a obter uma similaridade de elementos médios e para determinar a frequência inicial e/ou o final frequência usando a similaridade do elemento médio. A média temporal pode opcionalmente ser aplicada apenas quando o quadro atual não está silencioso, ou seja, sua energia é maior que um limite 27, caracterizando um quadro silencioso a partir de um quadro não silencioso.
[0065] Um quadro pode ser determinado como silencioso se sua energia for menor que um limite, em que o valor exato do limite pode ser definido dependendo do comprimento do quadro e do intervalo em que os valores da amostra são representados. Em geral, esse limiar pode ser selecionado de forma que seja igual à energia de um sinal de ruído rosa que é dimensionado para ser audível quando reproduzido com um equipamento típico de reprodução de som (um telefone celular ou uma TV) em uma configuração de volume médio a alto.
[0066] Isto é, o estimador de frequência pode ser configurado para submeter o elemento similaridade de uma pluralidade de elementos do primeiro e segundo segmentos com uma média recursiva ao longo do tempo, de modo a obter um elemento similaridade média e para determinar a frequência de arranque e/ou a frequência final usando a similaridade média. Cada amostra do espectro pode ser associada a um quadro. O estimador de frequência pode ser configurado para excluir quadros da média recursiva ao longo do tempo, tendo uma energia espectral abaixo de um nível de limiar de energia 27, estando o nível de limiar de energia 27 relacionado a uma consideração se o quadro ou espectro é silencioso ou não. Desse modo, resultados inconsistentes podem ser evitados com a exclusão de quadros considerados silenciosos, pois esses quadros também podem ser considerados não submetidos ao processamento de áudio.
Petição 870190097126, de 27/09/2019, pág. 281/383
23/79 [0067] Como descrito em conexão com a Figura 4, o resultado da média recursive L(k, r)pode ser processado pela filtragem passa-banda para atenuar o componente de deslocamento e aumentar o contraste dos máximos locais de interesse, por exemplo, convocando cada linha da matriz com um kernel como h = [-1 2 -1], [0068] A Figura 6a mostra uma representação gráfica esquemática de um exemplo de matriz de similaridade local L(k,r), em que uma abcissa ilustra os compartimentos de frequência (posições) k e a ordenada representa o atraso τ. Para uma melhor visibilidade, os valores absolutos da matriz L são mostrados. A unidade para a posição k e atraso τ são caixas de frequência. Por amostra não limitativa, um compartimento de frequência pode ter um valor de 46,9 Hz, em que qualquer outro valor menor ou maior pode ser obtido. Assim, a Figura 4 mostra um exemplo para uma matriz de similaridade pós-processada L(fc, τ) contendo as seguintes informações:
[0069] A similaridade global descrita em conexão com a Figura 4 pode ser obtida em L(fc, τ) somando ao longo do eixo geométrico x (parâmetro k) e obtendo o valor absoluto do resultado. Três linhas horizontais 38i, 382 e 38a no exemplo dado correspondem aos máximos locais da Figura 4. As linhas 38i, 382 e 38a podem corresponder às linhas ao longo das quais o respectivo valor da função L(fc,r), ou seja, a soma dos valores excede um determinado valor limite, por exemplo, 0,1,0,2 ou 0,3 do intervalo de valores que varia de 0 a 1. A posição inicial e a posição final das linhas horizontais correspondem à frequência inicial ksl, ks2, ks3, respectivamente e frequência final kel, ke2, ke3 respectivamente de partes repetidas do espectro.
[0070] A Figura 6b mostra um diagrama esquemático de uma linha da matriz ilustrada na Figura 6a no parâmetro τ2. Na Figura 6b, um gráfico 42a mostra, por exemplo, valores não filtrados, em que um gráfico 42b pode mostrar valores médios ou filtrados. Por exemplo, o gráfico 42b é comparado a um valor limite 27, sendo, por exemplo, 0,2. Um intervalo no qual a matriz de similaridade local L(k,x), seu valor médio, respectivamente, excede o valor limite 27, corresponde à linha horizontal 382 no índice τ2. Alternativa ou adicionalmente, um declive (AL(fc,r)/fc) da matriz de similaridade local pode ser avaliada. Uma aresta ascendente íngreme subindo com
Petição 870190097126, de 27/09/2019, pág. 282/383
24/79 um determinado valor, por exemplo, pelo menos 0,5, pelo menos 1 ou pelo menos 1,5 pode ser identificada como uma aresta que identifica a frequência inicial ks2. Por conseguinte, uma borda afiada íngreme e alta pode identificar a frequência final ke2. Alternativa ou adicionalmente, uma média temporal pode ser executada no espectro de entrada, no espectro de entrada, respectivamente, e no resultado ou resultados finais. Isso pode impedir a detecção de falsos positivos usando a média temporal. Uma média temporal da entrada espectral pode ser dita como um pré-processamento, em que uma média temporal do resultado final pode ser dita como um pósprocessamento. Uma razão para impedir a detecção de falsos positivos é que os máximos locais são tipicamente variáveis no tempo devido a tons parciais. Ou seja, como diferentes tons musicais são tocados em uma melodia ou devido a alterações harmônicas na música, os máximos locais podem variar ao longo do tempo. Em contraste, alguns parâmetros do processamento de aprimoramento espectral, como SBR, podem ser um processo técnico tipicamente invariável no tempo, por exemplo, uma frequência de borda da qual o espectro é ampliado, por exemplo, uma frequência de corte de uma filtragem realizada anteriormente, ou as frequências inicial e final do intervalo de frequências replicado.
[0071] De acordo com um exemplo, para estimar a frequência de início, a matriz LSA L é analisado para identificar a posição inicial e a posição final de cada linha horizontal. A posição inicial ks pode corresponder ao início do espectro que foi replicado. A posição final ke pode corresponder ao final do espectro que foi replicado. A maior posição final do espectro original que foi usada para replicação é o valor estimado para a frequência de início na qual o SBR é eficaz. Pode ser, por exemplo, fce3 na Figura 6a.
[0072] Primeiro, a similaridade global pode ser calculada como v2
C(t) = L(k, t), fc=v1 (4)
Petição 870190097126, de 27/09/2019, pág. 283/383
25/79 em que v± e v2 são parâmetros que determinam um intervalo de valores L(/c,t) e pode ser selecionado, por exemplo, para definir a faixa de L(fc, τ) com um valor dentro de um intervalo mínimo de 500 Hz e máximo de 15 kHz.
[0073] Então, máximos locais mb ou seja, 26 em C(t) são detectados maiores que um limite, veja, por exemplo, a Figura 4. Para cada máximo local, as linhas correspondentes em L(k, τ) são analisados. Por exemplo, o segundo local máximo m2 indexa a linha R2 = L(/c,t2) e é mostrado na Figura 6b. Para esse máximo local, um valor de τ = 133 pode ser válido e pode começar a partir de k = 74 de acordo com a Figura 5.
[0074] O índice inicial ks e o índice final ke podem ser calculados suavizando primeiro as respectivas linhas RL de modo a obter, por exemplo, o gráfico 42b, por exemplo, calculando uma média temporal ou móvel de alguns valores adjacentes, por exemplo, pelo menos 3, pelo menos 5 ou pelo menos 10. Em seguida, são detectadas as posições nas quais a linha suavizada tem as inclinações mais altas e decrescentes mais íngremes. Alternativa ou adicionalmente, o declive que excede um valor limite, como, por exemplo, 0, 2, pode ser um critério para avaliar a respectiva linha. Ou seja, o estimador de frequência 36 pode ser configurado para submeter a similaridade de elemento de uma pluralidade de elementos do primeiro e segundo segmentos a uma média recursive ao longo do tempo, de modo a obter uma similaridade de elemento média 42b e para determinar a frequência inicial e/ou a frequência final usando a similaridade média do elemento 42b. Alternativa ou adicionalmente, o aparelho pode ser configurado para realizar uma média temporal do espectro, do sinal máximo local ou um sinal derivado do mesmo, em que o processador pode ser configurado para fornecer as informações indicando que o sinal de áudio compreende a característica predeterminada com base numa informação média temporal do espectro, o sinal máximo local ou um sinal dele derivado.
[0075] Referindo-nos novamente à Figura 6a, existem três linhas horizontais proeminentes 38i, 382 e 38a para os exemplos dados nos índices τ1; τ2 e τ3. A linha no índice τ2 pode corresponder à primeira parte do espectro que foi replicada como
Petição 870190097126, de 27/09/2019, pág. 284/383
26/79 mostrando o início mais precoce, ou seja, os parâmetros mais baixos ks. A linha horizontal começa no índice fcsl e pode corresponder ao atraso ks2. Portanto, a primeira parte replicada do espectro começa ks2e foi copiado para o índice ks2+ τ2 Por um exemplo não limitativo, Tvpode ser 104, r2.pode ser 133 e r3.pode ser 236. ks2 pode compreender, por exemplo, um valor de 74. Portanto, a primeira parte replicada do espectro começa no índice 74 e pode ter sido copiada para o índice 74 + 133. Portanto, esse índice corresponde à frequência na qual o processamento de aprimoramento espectral (SBR) está em vigor.
[0076] O estimador de frequência 36 descrito em conexão com a Figura 5 pode ser configurado para computar a matriz de similaridade local ou uma descrição de similaridade local diferente. Apenas por exemplo não limitativo, um vetor ou outra linha de valores com uma estrutura predeterminada, como cada linha anexada a uma linha anterior, pode permitir a mesma informação. O estimador de frequência 36 pode determinar uma descrição da similaridade local (matriz de similaridade local L) e pode ser configurado para determinar porções nela, por exemplo, linhas, que indicam o processamento da extensão de largura de banda. Para determinar as partes que indicam o processamento da extensão de largura de banda, um declive do sinal dentro da descrição de similaridade local e/ou atingindo ou excedendo o valor limite 27 pode ser avaliada pelo estimador de frequência 36.
[0077] Embora tenha sido descrito como avaliação de linhas, é claro que a matriz de similaridade local L pode compreender uma estrutura diferente, por exemplo, ter alternado linhas para colunas e vice-versa ou similares. O estimador de frequência pode, portanto, ser configurado para determinar a matriz de similaridade local L como a descrição da similaridade local e para determinar a frequência inicial ks e/ou a frequência final ke do processamento de aprimoramento espectral usando um declive entre os valores (por exemplo, valores adjacentes dentro de uma linha ou coluna) em linhas ou colunas e/ou usando uma avaliação de valores nas linhas ou colunas pelo menos atingindo ou até excedendo o valor limite 27.
Petição 870190097126, de 27/09/2019, pág. 285/383
27/79 [0078] A Figura 7 mostra um diagrama de blocos esquemático de um aparelho 70 estendendo o aparelho 10. Embora sendo explicada como estendendo o aparelho 10, a explicação dada em conexão com a Figura 7 também pode ser usada para estender o aparelho 50. O aparelho 70 pode compreender uma calculadora de espectro 44 configurada para receber o sinal de áudio 12 como um sinal no domínio do tempo e configurada para calcular o espectro a partir do sinal de áudio 12 e para fornecer um sinal 12’ compreendendo o espectro. Baseado nisso, o derivador 14 pode ser configurado para receber o espectro 12’. Alternativamente, o derivador 14 pode ser configurado para derivar o espectro 12’ por si próprio.
[0079] O determinante 14 pode compreender um filtro 46 configurado para filtrar os valores de similaridade, de modo a obter valores de similaridade filtrados, conforme descrito em conexão com as Figuras 3 e 4. O determinante 14 pode ser configurado para selecionar pelo menos um máximo local a partir dos valores de similaridade filtrados para consideração adicional, por exemplo, como índice de linha na matriz de similaridade L(fc, τ). Ou seja, a seleção de um máximo local a partir dos valores de similaridade ou valores derivados dos mesmos pode se referir a um uso adicional do mesmo para determinar uma frequência inicial e/ou uma frequência final do processamento de aprimoramento espectral.
[0080] O aparelho 70 pode compreender um intensificador de sinal 48 configurado para receber o sinal de áudio 12 e receber a informação de que o processamento de aprimoramento espectral foi realizado, por exemplo, ao receber a informação 34. O intensificador de sinal é configurado para reduzir artefatos causados pelo processamento espectral de aprimoramento do sinal de áudio usando as informações 34, isto é, depende da informação que indica que o sinal de áudio compreende a característica predeterminada e, opcionalmente, detalhes adicionais, como a frequência de início e/ou a frequência de parada de um processo de replicação.
[0081] A Figura 8 mostra um fluxograma esquemático de um método 1000 para determinar uma característica predeterminada relacionada a um processamento de aprimoramento espectral de um sinal de áudio. O método 1000 compreende uma
Petição 870190097126, de 27/09/2019, pág. 286/383
28/79 etapa 1100 na qual um espectro do sinal de áudio é obtido e informações relacionadas a uma estrutura fina do espectro são derivadas, por exemplo, o sinal máximo local. Uma etapa 1200 compreende determinar uma similaridade na estrutura fina entre segmentos do sinal máximo local. Uma etapa 1300 compreende fornecer uma informação indicando que o sinal de áudio compreende a característica predeterminada dependente de uma avaliação da similaridade.
[0082] A seguir, será feita referência ao segundo aspecto. De acordo com o segundo aspecto, está no escopo melhorar a qualidade do som dos sinais de áudio, em particular dos sinais de áudio que foram codificados usando compressão com perdas. O conceito descrito está relacionado à largura de banda do sinal de áudio que está limitada em aplicações de processamento de sinal digital. O conceito propõe um conceito de análise de sinal que detecta as presenças de redução (artificial) da largura de banda (BR) e para estimar a frequência de corte na qual o BL está em operação. Os resultados obtidos são utilizados para controlar o processamento subsequente para restaurar a largura de banda por meio da extensão de largura de banda (BWE) e também para controlar a melhoria da qualidade do som por outros meios, como filtragem.
[0083] Para o aprimoramento da qualidade do som, é de extrema importância discriminar entre um sinal que tenha originalmente uma largura de banda baixa (por exemplo, uma nota baixa tocada na bacia) e um sinal que tenha sido limitado por banda por meio de um processamento de sinal, por exemplo, devido a codificação com perdas ou amostragem reduzida. Tal discriminação não é possível analisando o sinal “para encontrar a frequência mais alta presente no sinal”, isto é, determinando a frequência acima da qual apenas energia desprezível está presente, conforme descrito em [1], Por outro lado, o segundo aspecto propõe avaliar informações adicionais, conforme descrito a seguir.
[0084] O objetivo da análise de limitação de largura de banda artificial proposta (ABLA) é dupla:
Petição 870190097126, de 27/09/2019, pág. 287/383
29/79
1) Detectar a presença de redução de largura de banda (BR) no sinal de entrada que provavelmente será causado por compressão com perda ou outro processamento de sinal e, portanto, considerado como um artefato. A saída pode ser, por exemplo, uma variável binária, aqui dita como D em que D = 1 se BL foi detectado e Dde outra forma.
2) Para estimar a frequência de corte da limitação da largura de banda. A quantidade estimada é dita como fc.
[0085] A Figura 9 mostra um diagrama de blocos esquemático de um aparelho de acordo com uma modalidade do segundo aspecto. O aparelho pode ser usado para determinar uma característica predeterminada relacionada a um processamento artificial de limitação de largura de banda de um sinal de áudio. O aparelho 90 compreende um avaliador de declive 52 configurado para avaliar um declive de um espectro do sinal de áudio 12, por exemplo, o espectro 12’. O avaliador de declive 52 pode ser configurado para fornecer um resultado de avaliação de declive 56. O resultado da avaliação de declive 56 pode compreender informações sobre um valor máximo, mínimo ou médio do declive (curva do envelope) de pelo menos uma parte do espectro, sobre bordas ascendentes ou descendentes dentro do espectro ou o declive do mesmo ou outras informações relacionadas à declive 54.
[0086] O aparelho 90 pode, opcionalmente, compreender ainda um avaliador de frequência 58 configurado para avaliar uma frequência de corte fc do espectro de 12’ do sinal de áudio para obter uma informação compreendendo um resultado de avaliação de frequência 62, indicando a frequência de corte fc.
[0087] O aparelho 90 compreende um processador 64 para fornecer uma informação indicando que o sinal de áudio compreende a característica predeterminada relacionada ao processamento de limitação de largura de banda artificial. O processador é configurado para usar o resultado da avaliação de declive para fornecer as informações indicando que o sinal de áudio compreende a característica predeterminada, ou seja, o processador pode fornecer as informações dependentes do resultado da avaliação de declive. Por exemplo, isso pode permitir
Petição 870190097126, de 27/09/2019, pág. 288/383
30/79 uma decisão sobre se o sinal de áudio requer pós-processamento, por exemplo, em termos de uma informação sim/não ou uma decisão binária. Isso pode permitir excluir esses quadros do pós- processamento que são avaliados como não compreendendo a respectiva característica. Esses quadros podem ser identificados como não submetidos à limitação artificial da largura de banda e, portanto, o pós-processamento deve ser evitado. Como opção, o aparelho pode compreender o avaliador de frequência 58 para determinar a frequência de corte. Isso pode permitir a identificação de informações adicionais sendo usadas ou necessárias para o pós-processamento, por exemplo, dos quadros submetidos. Assim, opcionalmente, o processador pode ser configurado para fornecer as informações indicando que o sinal de áudio compreende a característica predeterminada dependente de uma avaliação do resultado da avaliação do declive 56 e do resultado da avaliação da frequência 62. Ao avaliar o resultado da avaliação de declive 56 e o resultado da avaliação de frequência 62 para o espectro 12’ e/ou para outros quadros do sinal de áudio, resultando em outros espectros 12’, o processador 64 pode derivar informações se o sinal de áudio do qual o espectro 12’ derivado foi submetido à limitação artificial da largura de banda. Por exemplo, o avaliador de declive 52 pode ser configurado para avaliar o declive para uma atenuação dentro do espectro. O espectro pode ser quantificado ou avaliado em relação a uma inclinação do declive, isto é, como indicado por um fator de desempate. [0088] A título de exemplo, o avaliador de declive 52 pode ser configurado para avaliar uma atenuação dentro do espectro 12’ e para fornecer o resultado da avaliação de declive 56 de modo a indicar uma medida para a atenuação. O processador 64 pode ser configurado fornecendo a informação 66 indicando que o sinal de áudio compreende a característica predeterminada se a medida para a atenuação for pelo menos um valor limite de declive. Opcionalmente, o aparelho pode compreender um avaliador de reamostragem, por exemplo, sendo parte do processador 64 ou sendo implantado separadamente. O avaliador de reamostragem pode ser configurado para avaliar o sinal de áudio para uma característica predeterminada relacionada a uma amostragem ascendente. A amostragem ascendente pode ser implantada usando
Petição 870190097126, de 27/09/2019, pág. 289/383
31/79 uma frequência de amostragem, por exemplo, uma taxa de amostragem comum pode ser de 11.025 Hz, 22.050 Hz e/ou 32.000 Hz. O aparelho 90 e/ou 120 pode ser configurado para adaptar as faixas de frequência do avaliador de declive 52 e/ou do avaliador de frequência 58 com base na frequência de amostragem, no caso em que a reamostragem é detectada. Ao usar a reamostragem, a faixa de frequência do espectro pode ser adaptada ou aumentada, em que uma baixa taxa de amostragem pode corresponder a uma faixa de baixa frequência e uma alta taxa de amostragem pode permitir que o espectro contenha faixas de alta frequência de acordo com o critério Nyquist. O avaliador de reamostragem pode ser configurado para observar ou avaliar um conjunto específico de taxas de amostragem esperadas e pode avaliar, se a essa frequência houver uma diminuição significativa no espectro e se não houver mais energia significativa acima. Nesse caso, quando uma borda íngreme no declive como descrito anteriormente e uma ausência de energia significativa acima de um valor limite de energia estiver presente, o avaliador de energia pode considerar o sinal de áudio como sendo reamostrado usando a respectiva frequência de reamostragem ou taxa de amostragem. O avaliador de reamostragem pode ser configurado para obter um resultado negativo da avaliação quando, na frequência determinada ou avaliada correspondente à taxa de amostragem, a regra de determinação
X(fc) > limiar aplica-se, o que significa que um valor do espectro na frequência k é maior que um limite, indicando que no ponto k há energia significativa dentro do espectro. Além disso, a regra de determinação
X(fc) < X(k + 1) — parâmetro de compensação pode aplicar, indicando que, com o aumento da frequência k + 1 o espectro, sua energia, respectivamente, aumenta. Essa consideração pode ser normalizada subtraindo o parâmetro de compensação, por exemplo, 0,1,0,2, 0,3, 0,5 ou 1 dB ou um valor diferente, ou seja, o espectro precisa aumentar mais do que o parâmetro de compensação para cumprir a regra de determinação. Isso permite excluir efeitos causados por ruídos ou similares. Assim, a magnitude aumenta em
Petição 870190097126, de 27/09/2019, pág. 290/383
32/79 direção a frequências mais altas no ponto de frequência k acima de uma limitação de largura de banda superior a 0, 5 dB. O limite pode ser, por exemplo, -30 dB, -40 dB, 50 dB ou -60 dB, conforme explicado acima. Isso significa que, para uma decisão negativa, não há atenuação acentuada ou além do respectivo valor de frequência, há uma magnitude aumentada.
[0089] Um resultado positivo da avaliação indicando que o sinal de áudio foi submetido a uma amostragem limitada, limitando a largura de banda no índice de frequência k pode ser determinado, por exemplo, quando a função de diferença espectral s(/c) ou uma função adequada diferente, como descrito acima, entrega um valor que excede ou é pelo menos um valor limite. Assim, a regra de determinação pode aplicar que
S(fc) > limiar a função de diferença espectral pode indicar uma atenuação acentuada e forte e, portanto, pode indicar uma reamostragem. Portanto, quando o máximo de 72 na Figura 11 é disposto em uma taxa de reamostragem/frequência de reamostragem esperada, a presença de uma reamostragem pode ser determinada.
[0090] Além disso, a atenuação pode ser avaliada em relação a uma quantidade, isto é, metade da borda que cai dentro do espectro. Por exemplo, o avaliador de declive 52 pode avaliar o declive 54 em relação a uma diminuição dentro de uma faixa de frequência específica de, por exemplo, 100 Hz, 1 kHz ou 2 kHz e/ou para uma quantidade total da diminuição dentro da borda descendente.
[0091] O processador 64 pode ser configurado para decidir se o espectro 12’ foi submetido à limitação da largura de banda artificial e pode ainda ser configurado para decidir em qual frequência de corte fca dita limitação foi aplicada. Assim, a informação 66 pode compreender a variável D ou uma informação similar e pode ainda compreender informação indicando a frequência de corte, pelo menos, quando o processador 64 determina o espectro 12’ como sendo aplicado ao processamento de limitação de largura de banda artificial.
Petição 870190097126, de 27/09/2019, pág. 291/383
33/79 [0092] A Figura 10 mostra um diagrama esquemático que ilustra um exemplo de espectro 12’ tendo o declive 54. O avaliador de declive 52 pode ser configurado para avaliar o declive 54 em relação a um declive do espectro 12’, de uma borda descendente 68, respectivamente. O avaliador de declive 52 pode ser configurado para fornecer o resultado da avaliação de declive 56, de modo a compreender informações indicando uma medida para a declive. A medida do declive pode ser obtida, por exemplo, ligando uma diminuição ΔΧι da magnitude X(/) e uma faixa de frequência 4/, por exemplo, como a diminuição de ΔΧι por faixa de frequência 4/ ou em termos de faixa de frequência 4/ usado para obter a diminuição ΔΧι.
[0093] O processador 64 pode ser configurado para fornecer as informações indicando que o sinal de áudio compreende a característica predeterminada se a medida para o declive for pelo menos um valor limite de declive. A medida do declive pode aumentar para valores crescentes do termo 4X1/4/ e/ou pode aumentar por valores decrescentes do termo 4//4^/. Por exemplo, o valor do limiar de declive pode compreender um valor igual ou proporcional a pelo menos 25 dB/1 kHz, 30 dB/1 kHz, 40 dB/1 kHz ou 50 dB/1 kHz ou superior.
[0094] O avaliador de declive 52 pode ser configurado para determinar uma função de diferença espectral do espectro 12’, por exemplo, usando uma função de janela que seleciona apenas uma parte do espectro 12’ para uma avaliação. A função de janela pode combinar uma pluralidade de valores de frequência do espectro 12’, o declive 54, respectivamente, e pode permitir que o avaliador de declive 52 determine a medida para a atenuação usando resultados da função de janela. Isso também pode ser chamado de filtragem de janela. Combinando, por exemplo, subtraindo valores de janelas diferentes, uma medida para o declive pode ser obtida. Alternativamente, qualquer outro processo adequado pode ser usado para avaliar a inclinação do declive 54. Alternativa ou adicionalmente, o avaliador de frequência pode ser configurado para avaliar uma atenuação entre um primeiro nível de energia de uma primeira banda de frequência do espectro 12’ e o segundo nível de energia de uma segunda banda de energia do espectro.
Petição 870190097126, de 27/09/2019, pág. 292/383
34/79 [0095] A primeira e a segunda banda de energia podem ser, por exemplo, uma chamada banda de baixa frequência e uma chamada banda de alta frequência. A banda de frequência manual pode ser a banda de frequência que se espera silenciosa após a filtragem passa-baixa, por exemplo, frequências acima de 3 KHz. A região de baixa frequência pode se referir a uma região de frequência com frequências abaixo dessa faixa de frequência. Assim, a primeira banda de energia pode compreender uma primeira faixa de frequência A baixo quando comparado a uma segunda faixa de frequência f2 da segunda banda de frequência. O avaliador de declive 52 pode ser configurado para fornecer o resultado da avaliação de declive 56, de modo a indicar uma medida para a atenuação 2ΙΎ2. O processador 64 pode ser configurado para fornecer a informação 66 se a medida para a atenuação for pelo menos um valor limite de atenuação. O valor do limiar de atenuação pode ser, por exemplo, pelo menos 30 dB, pelo menos 40 dB, pelo menos 50 dB ou pelo menos 60 dB ou até mais alto.
[0096] Em outras palavras, a atenuação pode ser considerada alta, de modo que apenas energia desprezível permaneça após a filtragem na banda de alta frequência. Por exemplo, a magnitude na região de frequência superior f2 está abaixo de -60 dB (valor do limiar de atenuação) menor que a magnitude média na banda passante, ou seja, a região da frequência f±. Uma combinação da avaliação do declive do espectro e a avaliação da quantidade da atenuação pode permitir determinar que 0 quadro atual do espectro 12’ foi submetido à limitação artificial da largura de banda. Dessa forma, se pelo menos uma ou de preferência duas avaliações dão uma sugestão para tal processamento, a variável D pode ser definida como 1. Se pelo menos um ou, de preferência, ambos os critérios de avaliação forem avaliados negativamente, a variável D pode ser definida como 0, ou seja, pode ser determinado que nenhuma limitação artificial da largura de banda foi aplicada.
[0097] Em outras palavras, 0 declive da atenuação pode ser quantificada comparando-se as magnitudes espectrais em uma sub-banda inferior A e as magnitudes espectrais em uma sub-banda mais alta f2 em torno de um índice de frequência k e repetindo isso para todos os índices de frequência no intervalo de
Petição 870190097126, de 27/09/2019, pág. 293/383
35/79 interesse. Um exemplo é a função de diferença espectral S(fc) que pode ser formado de acordo com:
S(fc) = maxX-L — maxX2 [0098] A função de diferença espectral S(fc) pode quantificar a atenuação como a diferença da magnitude máxima da sub-banda inferior e máxima da sub-banda mais alta. O parâmetro k pode se referir a um índice de frequência. X(k) pode denotar um espectro de magnitude. A operação max pode retornar o valor máximo de um vetor, em que X± = (xk-a, ...,xk-b) pode denotar um segmento do espectro abaixo do índice de frequência k e x2 = (xk+b, ...,xk+a) pode se referir a um segmento do espectro acima do índice de frequência k, em que a> b. Um comprimento do vetor, isto é, um número de amostras a serem usadas nos vetores X± e/ou X2 pode ser, por exemplo, 3, 5, 8 ou 10 ou até mais. Em uma modalidade não limitativa, um primeiro segmento de comprimento 7 e um segundo segmento de comprimento 7 são usados em conexão com um intervalo de 5 valores entre os dois segmentos. Por conseguinte, o máximo dos elementos 1,2,3, 4, 5, 6, 7 é determinado e comparado ao máximo do elemento 13, 14, 15, 16, 17, 18, 19.
[0099] Como alternativa, outras funções podem ser usadas, por exemplo, 52(/c) = minXi - max%2 ou uma diferença determinada a partir dos valores médios de X± eX2. [0100] O avaliador de frequência 58 pode ser configurado para determinar uma medida de energia em uma banda de frequência do sinal de áudio e para determinar a frequência de corte fc com base na energia. Por exemplo, o avaliador de frequência pode avaliar a energia em faixas de frequência com valores decrescentes de frequência, ou seja, dentro de faixas decrescentes de frequência. Quando se refere a Figura 10 para a frequência mais superior ilustrado, o avaliador de frequência pode, por exemplo, determinar uma baixa quantidade de energia na gama de frequências f2. Ao avaliar faixas de frequência comparativamente pequenas de vários compartimentos ou mesmo compreendendo apenas um compartimento de frequência, o avaliador de frequência 58 pode determinar com frequência decrescente f e aumento da energia, como indicado, o declive 54. Na frequência de corte fc o avaliador
Petição 870190097126, de 27/09/2019, pág. 294/383
36/79 de frequência 58 pode determinar um forte aumento na energia, por exemplo, pelo menos 30 dB, 40 dB, 50 dB ou mesmo 60 dB quando comparado ao baixo nível de energia na faixa de frequência f2. Com base nisso, ou seja, com base no aumento de energia na faixa de frequência, o avaliador de frequência 58 pode determinar a frequência de corte fc. Isso também pode ser chamado de determinação da frequência de corte fc como a frequência na qual a energia da sub-banda aumenta.
[0101] A Figura 11 mostra um diagrama esquemático de um resultado de exemplo da função de diferença espectral 5(fc). O originado mostra um resultado da função de diferença espectral 5(fc), em que a abcissa mostra o mesmo eixo de frequência, como ilustrado na Figura 10. A função de diferença espectral pode permitir obter uma medida para a inclinação do declive 54. Um máximo local ou mesmo global 72 da função de diferença espectral S(k~) pode indicar uma frequência na qual o declive 54 compreende uma variação mais acentuada, isto é, onde a atenuação é muito acentuada. Portanto, esta medida pode ser usada alternativamente ou além disso pelo avaliador de frequência como uma medida para a frequência de corte fc.
[0102] A diminuição do declive 54 e, portanto, a atenuação podem variar ao longo do grande número de amostras, de modo que a diferença utilizando um valor máximo do respectivo vetor possa proporcionar uma precisão suficiente. Alternativamente, a função de diferença espectral pode ser determinada para valores de frequência única, ou seja, os vetores X± e X2 podem ter um comprimento de 1.
[0103] Para melhorar a qualidade do som, é de importância crucial discriminar entre um sinal que tenha originalmente uma largura de banda baixa (por exemplo, uma nota baixa tocada na bacia) e um sinal que tenha sido limitado por banda por meio de um processamento de sinal, por exemplo, devido a codificação com perdas ou amostragem reduzida. Isso é importante para evitar um sinal com alta qualidade de som de qualquer pós-processamento e aplicar um processamento de aprimoramento somente quando necessário, ou seja, aplicar a extensão de largura de banda subsequente (BWE) apenas para restaurar a energia de alta frequência que foi removida artificialmente do sinal e não processar sinais com baixa largura de banda
Petição 870190097126, de 27/09/2019, pág. 295/383
37/79 por natureza. Para tal finalidade, o sinal pode ser analisado em relação a três características dadas pelo declive da atenuação, a quantidade de atenuação e a frequência de corte. Isso pode ser realizado pelas seguintes etapas de processamento executadas, por exemplo, por um aparelho de acordo com o segundo aspecto.
[0104] A Figura 12a mostra um diagrama de blocos esquemático de um aparelho 120 de acordo com uma modalidade do segundo aspecto. Quando comparado ao aparelho 90, o aparelho 120 é configurado para determinar a característica predeterminada para uma pluralidade de espectros 12i’ a 12a’ que podem ser derivados de vários blocos do sinal de áudio. Ou seja, o sinal de áudio pode ser dividido em blocos e de cada bloco um espectro 12’ pode ser derivado. O avaliador de declive 52 é configurado para avaliar o declive 54 de cada um dos espectros 12i’ a 123’. De acordo com este documento, 0 avaliador de frequência 58 é configurado para avaliar cada um dos espectros 12i’ a 123’.
[0105] O processador 64 pode ser configurado para fornecer a informação 66, indicando que 0 sinal de áudio compreende a característica predeterminada para cada um dos espectros 12i’ a 123’. Um número de blocos nos quais 0 sinal de áudio é dividido pode ser arbitrário. Por exemplo, uma duração de cada bloco no tempo pode ser constante, de modo que 0 número de blocos possa depender da duração do sinal de áudio.
[0106] O aparelho 120 pode compreender um filtro 74 conectado ao avaliador de frequência 58 e configurado para receber 0 resultado da avaliação de frequência 62. O filtro 74 pode ser configurado para fornecer um resultado de avaliação de frequência filtrada 62’. O processador pode ser configurado para fornecer as informações 66, indicando que 0 sinal de áudio compreende a característica predeterminada com base em uma pluralidade de resultados de avaliação de declive 56 para cada um dos espectros 12i’ a 123’ e/ou uma versão filtrada do mesmo e 0 filtrado resultado de avaliação de frequência 62’ associado a uma pluralidade de espectros 12i’ a 123’ do sinal de áudio. A frequência de corte usada para codificar um sinal de áudio pode ser essencialmente invariável no tempo, invariante no tempo ou pode ser um parâmetro
Petição 870190097126, de 27/09/2019, pág. 296/383
38/79 que varia raramente ou com pouca frequência ao longo do tempo, de modo que uma filtragem passa-baixa, um máximo móvel, uma média móvel ou um a filtragem mediana móvel implantada pelo filtro 74 pode permitir obter os valores filtrados 62’ permanecendo inalterados ou constantes ou, pelo menos, alterando a taxas baixas para processamento adicional, por exemplo, quando o avaliador de frequência 58 determina frequências de corte ligeiramente diferentes fc entre os diferentes espectros 12i’ a 123’. Ou seja, um pós-processamento dos valores obtidos fc pode ser realizada por filtragem passa-baixa ou, alternativamente, por uma filtragem diferente.
[0107] De maneira similar, a limitação artificial da largura de banda é geralmente executada para um sinal de áudio completo ou pelo menos uma grande parte dele, de modo que é improvável que uma alteração da característica relacionada ao processamento da limitação da largura de banda artificial esteja presente em um quadro e não esteja presente ou ausente em um quadro subsequente. Portanto, 0 processador 64 pode executar um pós-processamento da variável D ou um resultado ou valor correspondente, por exemplo, usando uma filtragem mediana ou similar para uma pluralidade de quadros, isto é, para uma pluralidade de espectros 12i’ a 123’. O processador pode ser configurado para fornecer a informação 66, indicando que 0 sinal de áudio compreende a característica predeterminada, fornecendo uma informação respectiva para cada pluralidade de quadros do sinal de áudio e para fornecer um resultado combinado ou filtrado 66’ combinando os resultados de os quadros de modo que 0 resultado combinado 66’ seja válido para a pluralidade de quadros sendo submetidos ao filtro e influenciando uma saída do filtro. Por exemplo, ao usar uma filtragem mediana, um número de quadros e/ou espectros 12i’ a 123’ é considerado dentro do respectivo filtro, por exemplo, um filtro 76 conectado ao processador 64 ou fazendo parte do processador 64 ou sendo implantado pelo processador 64. A saída 66’ do filtro 76 pode ser um valor médio filtrado combinado derivado dos quadros considerados. Embora sendo ilustrado como um bloco separado, 0 filtro 76 pode ser implantado ou pode fazer parte de outro bloco de computação.
Petição 870190097126, de 27/09/2019, pág. 297/383
39/79 [0108] Alternativa ou adicionalmente, o aparelho 120 pode compreender um determinador 78 configurado para determinar uma energia E de uma banda de frequência dos espectros 12i’ a 12a’ e para fornecer um sinal 82 indicando uma presença e/ou uma quantidade de energia E dentro da respectiva banda de frequência. O sinal 82 ou um sinal derivado do mesmo pode ser fornecido ao processador 64 de modo que o processador 64 possa ter conhecimento sobre a energia determinada. Pode ser de interesse se estiver na chamada região de alta frequência fh energia está presente ou não. Por exemplo, uma região de alta frequência fh pode ser uma região de frequência com valores de frequência iguais ou superiores a 1 kHz, 2 kHz, 3 kHz, 4 kHz ou um valor diferente, isto é, diferentes frequências limitadoras de largura de banda. Por exemplo, codificadores podem cair ou descartar frequências acima de um determinado valor de frequência. O valor da frequência pode estar de acordo com uma aplicação específica, como 3 kHz ou 4 kHz, para aplicações relacionadas à fala.
[0109] O determinante 78 pode determinar, se os espectros 12i’ a 12a’ compreendem energia ou compreendem energia acima de um certo limite na região de alta frequência fh. No caso em que o determinante 78 determina que o respectivo espectro 12i’ a 12a’ não compreende energia E ou uma quantidade baixa na região de alta frequência fh, uma determinação confiável da frequência de corte e/ou da atenuação pode ser difícil ou até impossível, por exemplo, devido ao fato de que o respectivo quadro não fornece um declive adequada. Ao considerar, apenas por exemplo não limitativo, um espectro silencioso que não tem energia no espectro completo, nem uma frequência de corte nem uma atenuação do declive 54 podem ser determinadas. Essa informação pode ser fornecida pelo sinal 82. O processador pode pular a avaliação do quadro ou espectro real 12i’ a 12a’ e pode ser configurado para fornecer as informações 66 com base em um espectro anterior observado ou avaliado anteriormente, se a energia f está abaixo de um nível de limiar de energia considerado discriminatório entre a energia relevante presente ou ausente. Em termos diferentes,
Petição 870190097126, de 27/09/2019, pág. 298/383
40/79 o processador pode basear sua decisão em um quadro anterior, em um caso em que o espectro real não tem a capacidade de fornecer informações suficientes.
[0110] Em uma etapa opcional, uma partição do sinal de áudio/sinal de entrada em blocos curtos pode ser executada, ou seja, um número de blocos pode ser obtido. Um comprimento de um bloco pode ser, por exemplo, pelo menos 0,5 ms, pelo menos 1 ms ou pelo menos 5 ms e no máximo 1 segundo, 500 ms ou 100 ms. Um exemplo de intervalo compreende valores de pelo menos 2 ms e no máximo 80 ms.
[0111] Opcionalmente, computando um espectro de magnitude para cada bloco, por exemplo, por meio de um banco de transformações ou filtros. Assim, o aparelho 19 pode compreender, por exemplo, um derivador de frequência para derivar um espectro Como um espectro de magnitude, de modo a fornecer o espectro 12’. Para cada bloco pode ser derivado um espectro de acordo ou similar ao espectro ilustrado na Figura 10.
[0112] Opcionalmente, uma filtragem passa-baixa de coeficientes espectrais pode ser realizada com relação ao tempo e à frequência. Por exemplo, uma média móvel ou uma média recursive pode ser realizada, por exemplo, pelo avaliador de declive 52 e/ou pelo avaliador de frequência 58 e/ou um processador implementando ambos, o avaliador de declive 52 e o avaliador de frequência 58. Isso pode permitir a redução de cargas computacionais, pois a atenuação e o declive da atenuação, bem como a frequência de corte, são dispostos dentro de uma faixa de frequência específica, estendida além dos valores de frequência única, de modo que uma avaliação das faixas de frequência permita uma precisão suficiente.
[0113] Opcionalmente, quando o sinal de entrada é mudo ou não contém energia na região de alta frequência, pode ser difícil obter uma estimativa confiável ou ser impossível obter uma estimativa confiável. Portanto, o resultado da detecção do quadro anterior pode ser usado se a energia máxima da sub-banda acima de 3 kHz estiver abaixo de um limite, devido ao fato de que esse quadro não contém as informações desejadas.
Petição 870190097126, de 27/09/2019, pág. 299/383
41/79 [0114] Opcionalmente, detectar se o sinal foi ampliado a partir de uma frequência de amostragem mais baixa, por exemplo, com o uso dos determinantes 78. Um sinal codificado em taxas de bits baixas é tipicamente codificado com uma frequência de amostragem baixa que pode ser menor que a frequência de amostragem na qual a estrutura de processamento atual opera. Quando a amostragem acima ou a reamostragem após a decodificação for detectada, o intervalo de pesquisa da análise de limitação de largura de banda artificial (ABLA) de acordo com o segundo aspecto pode ser modificado de modo que a frequência mais alta a ser detectada seja igual à frequência de amostragem do codificador. Para detectar uma reamostragem, a detecção de reamostragem pode ser realizada para um conjunto de taxas de amostragem comuns, tais como 11.025 Hz, 22.050 Hz, 32.000 Hz e/ou 44.100 Hz. Quando a magnitude máxima dos coeficientes espectrais em um intervalo acima da metade da frequência de amostragem estiver abaixo de um limite, a reamostragem pode ser detectada. Isso é baseado no critério Nyquist, permitindo obter frequências com metade do valor da frequência quando comparado à taxa de amostragem. Portanto, quando a energia está abaixo do limite na metade superior, isso pode ser causado pela taxa de amostragem usada. O processamento ABLA a seguir é modificado para que o intervalo de pesquisa seja modificado de modo que a frequência mais alta a ser detectada seja igual à frequência de amostragem do codificador detectado e, portanto, permitindo pesquisar apenas uma parte do respectivo espectro. A outra porção, por exemplo, a metade superior, pode ser negligenciada como se espera que seja causada pela amostragem superior. A atenuação devido à reamostragem pode ser maior que a atenuação da codificação. A detecção de reamostragem pode garantir que a reamostragem não seja detectada por engano como limitação da largura de banda em uma frequência de corte mais baixa [0115] Computando uma função de detecção, por exemplo, a função de diferença espectral, que quantifica um declive da atenuação sobre a frequência. A função de diferença espectral ou uma versão alternativa quando comparada à Figura 11 pode
Petição 870190097126, de 27/09/2019, pág. 300/383
42/79 ser usada. A função de detecção pode fornecer informações de uma diferença de nível entre as bandas de frequência adjacentes.
[0116] Detectando a limitação de largura de banda artificial (ABL) com o uso de um conjunto de regras que avaliam a função de diferença espectral e a energia da sub-banda e um parâmetro de limite. Começando no índice de frequência k da extremidade superior do intervalo de pesquisa, a magnitude X dos coeficientes espectrais e da função de diferença espectral S(fc) ou uma função ou quantidade similar pode ser testada com relação a um conjunto de condições até que uma condição seja válida ou até que a extremidade inferior do intervalo de pesquisa seja atingida. Todos os limites são parâmetros que podem ser ajustados para alterar o trade-off entre detecções de falso positivo e falso negativo. As condições:
1) . x(/c) > limiar; e
2) . X(fc) < X(k + 1) — parâmetro de compensação E xÇk^limiar maior, ou seja, a magnitude aumenta em direção a frequências mais altas acima de um BL mais do que o parâmetro de compensação, por exemplo, 0,5 dB, quando as magnitudes são maiores que o limite, por exemplo, -60dB, pode levar a uma detecção negativa. Condições de acordo com:
1) . S(/c) > limiar; e
2) A reamostragem foi detectada pode levar a uma detecção positiva.
[0117] Determinando a frequência de corte fc como a frequência na qual a energia da sub-banda aumenta, por exemplo, usando o avaliador de frequência 58.
[0118] Opcionalmente, pós-processamento fc por filtragem passa-baixa, por exemplo, usando o filtro 74.
[0119] Opcionalmente, pós-processamento D por filtragem mediana, por exemplo, usando o filtro 76.
[0120] O aparelho 90 e/ou o aparelho 120 podem ainda compreender um intensificador de sinal, por exemplo, o intensificador de sinal 48 sendo descrito em conexão com o primeiro aspecto. O intensificador de sinal 48 pode ser configurado
Petição 870190097126, de 27/09/2019, pág. 301/383
43/79 para reduzir artefatos causados pelo processamento artificial de limitação de largura de banda do sinal de áudio dependente da informação 66, indicando que o sinal de áudio compreende a característica predeterminada. Ou seja, o intensificador de sinal pode ser adaptado aos artefatos causados pela limitação artificial da largura de banda. [0121] A seguir, será feita referência a um aparelho configurado para suprimir ou pelo menos reduzir o artefato de codificação Birdies e para melhorar a qualidade sonora percebida de acordo com o segundo aspecto. O aparelho ou método respectivo pode ser usado em um caso em que a informação foi derivada de que o sinal de áudio compreende uma característica relacionada a uma limitação artificial da largura de banda e/ou a um processamento de aprimoramento espectral, como uma replicação de banda espectral. Por exemplo, o aparelho pode ser usado em um caso em que pelo menos uma limitação de largura de banda artificial ou replicação de banda espectral foi detectada.
[0122] Assim, quando pelo menos uma das limitações de largura de banda artificial e o processamento de aprimoramento espectral são detectados, o conceito segundo o qual a limitação de largura de banda artificial é detectada pode ser reutilizado ou pode ser usado para detectar regiões íngremes e altamente atenuadas no espectro, que pode ser referido como lacunas espectrais. Um intervalo espectral pode compreender uma primeira e uma segunda aresta. Por conseguinte, uma ilha espectral também pode compreender uma primeira e uma segunda arestas, em que entre as respectivas arestas a fenda ou a ilha pode ser disposta.
[0123] Ao nos referirmos agora à Figura 12b, é mostrado um exemplo de espectro compreendendo a aresta de queda 68 na frequência de corte fc. Além disso, em intervalos de frequência abaixo que frequência de corte fc, um exemplo intervalo espectral 202 e um exemplo ilhas espectrais 204 está disposta. Ao iniciar a partir de baixas frequências, primeiro um bordo descendente 206i e depois um bordo ascendente 2062 são dispostos, em que nas faixas de frequência entre eles, 0 intervalo espectral 202 pode ser disposto. Por conseguinte, a ilha espectral 204 pode ser disposta entre as arestas 2063 e 2064. As bordas podem ser localizadas,
Petição 870190097126, de 27/09/2019, pág. 302/383
44/79 quantificadas e qualificadas com o uso dos ensinamentos aqui revelados para encontrar a borda 68, em particular, uma avaliação de frequência/energia pode ser realizada.
[0124] Em contraste com a frequência de corte fc, um local, uma presença e magnitude da folga 202 e a ilha 204, bem como um número dos mesmos pode variar entre quadros do sinal de áudio. Simplificado, o preenchimento da folga 202 e/ou a atenuação da ilha 204 podem ser realizados após o uso de um conceito para encontrar as arestas 206i a 2064, conforme descrito em conexão com a frequência de corte fc com a exceção de que as respectivas frequências são variáveis. Ou seja, um aparelho ou intensificador de sinal pode ser configurado para preencher uma lacuna espectral e/ou para atenuar uma ilha espectral. Portanto, pesos espectrais podem ser usados, os quais podem ser determinados a partir do próprio sinal de áudio, ou seja, uma informação lateral pode permanecer não necessária. Ao suprimir o artefato de codificação Birdies, a qualidade do som percebido pode ser aprimorada. O conceito introduzido pode ser usado como um conceito de pós-processamento localizado após o decodificador. Pode funcionar às cegas sem ter acesso ao sinal de áudio não compactado e a outras informações secundárias.
[0125] O conceito descrito a seguir para reduzir o artefato de Birdies pode usar um princípio básico chamada ponderação espectral ou atenuação espectral de curto prazo. Portanto, um sinal no domínio do tempo X[n] pode ser transformado em sua representação no domínio da frequência X[k,m], onde ke m denotam a frequência no índice do período de tempo, respectivamente. Nas modalidades descritas, a transformada de Fourier de curto prazo (STFT) pode ser aplicada, mas também outras transformações podem ser usadas. O sinal de saída Vda ponderação espectral pode ser dado na seguinte equação:
Y[k, m]=G[k, m]· X [k, m].
[0126] A representação do domínio de tempo Y [η] o sinal de domínio de frequência Y[n] pode ser calculado por meio de uma transformada inversa, em modalidades, a STFT inversa. A seguir, os sinais no domínio do tempo serão indicados
Petição 870190097126, de 27/09/2019, pág. 303/383
45/79 com letras minúsculas e sinais do domínio de frequência com letras maiúsculas. Os índices k e m ou os sinais no domínio da frequência serão omitidos para melhor legibilidade.
[0127] A Figura 12c mostra um diagrama de blocos esquemático de um aparelho 125 configurado para processar um sinal de áudio 91 que pode ser recebido de um decodificador e que pode ter sido sujeito a limitação artificial de largura de banda e/ou aprimoramento espectral, como replicação de banda espectral. O aparelho 125 compreende o avaliador de declive 52 e o avaliador de frequência 58. O avaliador de declive 52 é configurado para avaliar um declive de um espectro do sinal de áudio 91 para obter um resultado de declive como descrito em conexão com a Figura 9 e/ou 12a. O avaliador de frequência pode ser configurado para avaliar pelo menos uma primeira e uma segunda frequência em, por exemplo, as arestas 206i e 2062 e/ou as arestas 2063 e/ou 2064 circundando, cercando ou cercando 0 respectivo artefato, ou seja, 0 espaço 202 e/ou a ilha espectral 204.
[0128] O aparelho 125 compreende um processador 208 configurado para determinar um peso espectral G e/ou l/V e para processar 0 sinal de áudio 91 pelo menos em uma região espectral entre as respectivas bordas 206i e 2062, 2063 e 2064 respectivamente, com 0 uso dos pesos espectrais Ge/ou l/V O aparelho 125 pode ser configurado para determinar os pesos espectrais Ge/ou l/Vparacada uma das regiões de frequência, compartimentos de frequência e/ou quadros do sinal de áudio 91. Os pesos espectrais G podem ser usados para formar ou moldar um sinal de enchimento S a ser combinado com 0 sinal de áudio, de modo a preencher lacunas espectrais. Os pesos espectrais l/Vpodem ser utilizados para atenuar ilhas espectrais. Ou seja, para reduzir um artefato dentro do intervalo espectral 202, um sinal de preenchimento F pode ser usado. Para reduzir artefatos causados pela ilha espectral 204, pesos espectrais l/V podem ser utilizados para atenuar uma altura da ilha. Para uma pluralidade de valores de frequência dentro do respectivo intervalo espectral 202 e da respectiva ilha espectral 204, uma pluralidade de pesos espectrais pode ser determinada.
Petição 870190097126, de 27/09/2019, pág. 304/383
46/79 [0129] A Figura 12d mostra um diagrama de blocos esquemático de uma funcionalidade que pode ser implantada pelo processador 208 para determinar os pesos espectrais G. As lacunas espectrais podem ser definidas como uma diminuição abrupta, isto é, pelo menos 30dB, pelo menos 40dB ou pelo menos 50dB de áreas de magnitude espectral no domínio da frequência e do tempo/direção. A avaliação adicional ao longo do tempo mostra que as áreas espectrais entre harmônicas de um sinal tonal não são erroneamente detectadas como lacunas espectrais. Em [5], o método de detecção busca zeros perfeitos no domínio espectral. Isso só é possível devido ao fato de que o método está localizado no decodificador e tem acesso ao mesmo banco de filtros e bloqueio do codificador. As modalidades descritas referemse a um pós-processamento do decodificador que avalia mudanças abruptas no espectro relativo usando a diferença de magnitude do espectro X e sua cópia suavizada. O fluxo de sinal para detectar lacunas espectrais e as ilhas espectrais é ilustrado na Figura 12d. STFT ou uma calculadora de espectro diferente 44 pode ser usada para obter uma representação espectral do sinal de áudio 91. Um valor absoluto ex-212 pode ser configurado para emitir o espectro de magnitude X. Um logaritmo 214 é configurado para transformar o espectro de magnitude X no domínio logarítmico, para usar uma transformação logarítmica, como
X=20/ogio(X).
[0130] O espectro de magnitude logarítmica obtido X’ pode ser suavizado por dois filtros passa-baixa em paralelo, em que um primeiro filtro passa-baixa 216a pode ser configurado para suavizar o espectro do sinal de áudio, isto é, o sinal de áudio, no domínio da frequência, de modo para obter um sinal Y’ sendo suavizado no domínio da frequência. Um segundo filtro passa-baixa 216b pode ser configurado para suavizar o espectro de magnitude X’ no domínio do tempo, de modo a obter um sinal suave Z’. Embora seja descrito como suavizado no domínio logarítmico, a suavização também pode ser realizada no domínio linear ou em um domínio diferente. Ou seja, o logaritmo 214 também pode estar ausente ou pode ser arranjado após os filtros passabaixa. Ou seja, o espectro de magnitude logarítmica X’ pode ser suavizado por dois
Petição 870190097126, de 27/09/2019, pág. 305/383
47/79 filtros passa-baixa, tanto na frequência quanto no tempo, o que pode levar aos sinais Y' e Z’, respectivamente. Para o cálculo dos pesos especiais G, os valores lineares podem ser calculados por
Yl
Y = lOzõ.
[0131] Esses valores lineares podem ser comparados com o espectro de magnitude X, de modo a obter um valor de diferença de frequência e/ou um valor de diferença de tempo. O parente t diferenças Δ e Δ f comparar as magnitudes espectrais X para as suas versões suavizadas ao longo do tempo Z’ e Y frequência' pode ser calculado no domínio logarítmico, por exemplo, para cada coeficiente espectral e para cada quadro por
Af=Y-2Olog10(X) e
Δί =Z -201og10(X) em que Δί se refere ao valor da diferença de frequência e At se refere ao valor de diferença de tempo.
[0132] A calculadora de peso espectral 218 pode ser configurada para calcular o peso espectral G de acordo com
... IF Uι.ΔΓ>
.10 aherwise ou seja, o peso espectral G é definido como um valor diferente de zero se o valor da diferença de frequência At for maior ou igual a um limiar da diferença de frequência At e se o valor da diferença de tempo A t for maior ou igual a uma diferença de tempo valor limite At. Embora sendo descritos como requerendo que a diferença de tempo valores At e At são superiores aos seus respectivos valores de patamar At, At, respectivamente, com base em outros valores de patamar ou os limiares sendo escolhido de maneira diferente, o parâmetro de ganho também pode ser Γ quando sendo igual aos valores limite. A seguinte regra de determinação pode ser aplicada:
Figure BR112019020357A2_D0001
Petição 870190097126, de 27/09/2019, pág. 306/383
48/79 em que Δί e parâmetros At limiar denotam, α, β e γ são parâmetros que influenciam as características do cálculo do peso espectral. Todos os parâmetros são parâmetros ajustáveis, κ é um termo usado para aumentar o impacto da ponderação e pode ser calculado de acordo com a regra de determinação ou com base na mesma: 20Zo510(X)+5/ K = 10 20 [0133] Os ganhos espectrais calculados são suavizados ao longo do tempo e da frequência, por exemplo, com o uso de um filtro passa-baixa 222a, 222b, respectivamente. Os ganhos espectrais são subsequentemente utilizados para uma ponderação espectral de um sinal de fonte de preenchimento S, como descrito em conexão com a Figura 12e.
[0134] A Figura 12e mostra um diagrama de blocos esquemático de um intensificador de sinal 200 configurado para reduzir o artefato de Birdies. O processamento pode ser feito, por exemplo, pelo uso do processador 208. O aparelho 200 pode compreender um combinador 224 para combinação de um sinal de fonte de preenchimento S com a ponderação espectral fatores L, por exemplo, por multiplicação, de modo a obter o sinal de enchimento F. O sinal de preenchimento F pode compreender uma estrutura de acordo com a qual compreende apenas valores diferentes de zero em locais onde as lacunas espectrais foram estimadas. Um outro combinador 226 pode ser configurado para combinar o sinal de enchimento Fcom o espectro de magnitude X, por exemplo, por uma soma. Ou seja, o sinal M de enchimento é adicionado ao sinal de entrada X. O sinal da fonte de preenchimento S pode ser obtido ou gerado filtrando o sinal de áudio 91 no domínio do tempo, o que prolonga as informações dos quadros anteriores. Alternativamente, o sinal da fonte de enchimento pode ser obtido copiando os coeficientes espectrais de outras posições dentro de um quadro espectral, copiando coeficientes espectrais de outro canal de áudio que não exibe uma lacuna espectral no local de resposta e/ou copiando coeficientes espectrais de um quadro espectral anterior que não exibe um intervalo espectral.
Petição 870190097126, de 27/09/2019, pág. 307/383
49/79 [0135] Em conceitos conhecidos, por exemplo, a substituição de ruído da ferramenta Substituição de Ruído Perceptivo (PNS) de Codificação de Áudio Avançada (AAC) é usada. Partes do espectro similares a ruídos são substituídas no decodificador por uma sequência pseudoaleatória de valores dimensionados para corresponder a uma determinada energia alvo. O processo é controlado por informações secundárias. Além disso, é conhecida uma técnica denominada preenchimento de ruído. O preenchimento de ruído é usado no codec USAC (Codificação Unificada de Fala e Áudio) para preencher os buracos espectrais causados pela zona morta do quantizador operando sob restrições de um orçamento pequeno. Uma sequência pseudoaleatória de valores é usada para preencher esses zeros espectrais. Além disso, uma técnica chamada Intelligent Gap Filling é conhecida no MPEG-H e 3GPP EVS. Aqui, as lacunas espectrais são preenchidas com ruído ou usando blocos espectrais provenientes de um local espectral remoto. O processo é controlado por informações secundárias. As modalidades descritas neste documento diferem do preenchimento de ruído, de modo que é usada uma distribuição de informações de frequência de tempo dos prazos anteriores para preencher orifícios espectrais. Ao contrário do PNS, o sinal de saída filtrado é preenchido apenas em intervalos espectrais, em vez de bandas PNS inteiras. Em contraste com PNS e IGF (Intelligent Gap Pilling), as modalidades podem ser usadas como processamento não guiado, isto é, sem o uso de informações secundárias.
[0136] O aparelho 200 pode compreender uma calculadora de peso de ilha espectral 228 que também pode ser implantada pelo processador 208. Ilhas espectrais contidas no sinal Z sendo recebidas do combinador 226 e sendo obtidas adicionando espectro de entrada Xe preenchendo o sinal F de acordo com
Z=X+ F pode ser suprimida por meio de ponderação espectral de acordo com Y= W-Z [0137] Como L, l/Vsão pesos espectrais que são recalculadas para cada quadro e m espectral coeficiente k. A fim de preservar o máximo de largura de banda possível,
Petição 870190097126, de 27/09/2019, pág. 308/383
50/79 a supressão de ilhas espectrais é feita após preenchimento de lacunas espectrais. Apenas ilhas espectrais isoladas que não puderam ser conectadas à parte principal do espectro são finalmente suprimidas. Para obter um aprimoramento parcial, a supressão da ilha espectral pode ser realizada sem o preenchimento do espaço espectral. Alternativamente, o preenchimento do espaço espectral pode ser realizado sem o cálculo do peso espectral.
[0138] Para suprimir o cálculo do peso espectral e para calcular o peso espectral l/V, o seguinte ensino pode ser implantado. Ilhas espectrais podem ser definidas como aumento abrupto de áreas de magnitude espectral na direção de frequência e tempo cercadas por valores de magnitude espectral muito baixos. Um aumento de magnitudes pode ser, por exemplo, pelo menos 30 dB, pelo menos 40 dB ou pelo menos 50 dB. As ilhas espectrais podem ser suprimidas atenuando os coeficientes espectrais correspondentes por meio de ponderação espectral. Para derivar os pesos espectrais l/V, um processamento similar ao descrito em conexão com a Figura 12d pode ser realizada. Como descrito para os pesos espectrais L, pode ser determinado o valor de diferença de tempo e a frequência de valor de diferença de At e At. O peso espectral W pode ser derivado com base na regra de determinação:
Figure BR112019020357A2_D0002
em que
Figure BR112019020357A2_D0003
[0139] A p é um limiar que reflete a suposição de que ilhas espectrais são cercadas por coeficientes espectrais de baixa energia. At e At são parâmetros de limite. Como descrito acima, α, β e γ são parâmetros ajustáveis. Em consideração à regra de determinação acima, em faixas da ilha espectral, o peso espectral Ω é determinado permitindo atenuar o sinal Z, Y, respectivamente, ou seja, Ω é um valor menor que 1. Em um intervalo fora da ilha espectral, l/V é um valor de 1, ou seja, nenhuma atenuação é realizada. O aparelho 200 pode compreender um combinador 232, de
Petição 870190097126, de 27/09/2019, pág. 309/383
51/79 modo a combinar os pesos espectrais W com o sinal Z, por exemplo, usando uma multiplicação. Um transformador de sinal 234 pode ser usado para executar ISTFT, isto é, para obter um sinal no domínio do tempo.
[0140] Em outras palavras, o conceito de supressão de Birdies pode ser dividido em preenchimento de lacunas espectrais e supressão de ilhas espectrais. O sinal de enchimento F pode ser calculado por filtragem de um sinal fonte banda larga S preenchimento com pesos espectrais G. F contém apenas valores diferentes de zero, onde lacunas espectrais foram identificadas em X que são determinadas de acordo com
F=G-S [0141] A Figura 12f mostra um fluxograma esquemático de um método 1500 para processar um sinal de áudio. O método 1500 compreende uma etapa 1600 na qual um declive de um espectro do sinal de áudio é avaliado para obter um resultado de relação de declive. Uma etapa 1700 compreende avaliar pelo menos um primeiro e um segundo limite de frequência no qual o espectro compreende um limite, de modo a obter um resultado de avaliação de frequência. Uma etapa 1800 compreende determinar um peso espectral e processar o sinal de áudio em uma região espectral entre o primeiro e o segundo limite de frequência, usando o peso espectral.
[0142] A Figura 13a mostra um fluxograma esquemático de um método 2000 para determinar uma característica predeterminada relacionada a um processamento artificial de limitação de largura de banda de um sinal de áudio. O método 2000 compreende uma etapa 2100 que compreende avaliar um declive de um espectro do sinal de áudio para obter um resultado de avaliação de declive. Uma etapa 2200 compreende fornecer uma informação indicando que o sinal de áudio compreende a característica predeterminada dependente de uma avaliação do resultado da avaliação de declive. As informações 66 fornecidas pelo processador 64 podem conter uma variável aqui mencionada depois de Dque pode ser usado para ativar o processamento de extensão de largura de banda aplicado para melhorar a qualidade do som de um canto de áudio, por exemplo, usando o intensificador de sinal.
Petição 870190097126, de 27/09/2019, pág. 310/383
52/79
Opcionalmente, a frequência de corte fc pode ser determinado, isto é, uma etapa opcional pode compreender a avaliação de uma frequência de corte do espectro do sinal de áudio para obter um resultado de avaliação de frequência de modo que as informações que indicam que o sinal de áudio compreende a característica predeterminada possam ser fornecidas dependentes do declive resultado da avaliação e dependente do resultado da avaliação de frequência. A frequência de corte fc pode ser usado para controlar a extensão de largura de banda (BWE), determinando a faixa de frequência na qual o BWE opera, de modo que ele recupere apenas a região de frequência que está faltando. Isso é ilustrado na Figura 13b, mostrando um fluxograma esquemático de um método 2500 de acordo com outra modalidade, em que o método compreende a etapa 2150 compreendendo a avaliação de uma frequência de corte do espectro do sinal de áudio para obter um resultado de avaliação de frequência [0143] A segunda aplicação em que o ABLA, isto é, a detecção da respectiva característica, pode ser usado ou necessário, é a classificação de um sinal de áudio como um sinal de baixa qualidade sonora devido à compressão com perdas. Essa classificação pode ser baseada apenas na análise descrita ou combinando a mesma com outras informações que podem ser extraídas do sinal de áudio. Exemplos de informações adicionais que podem ser usadas nesse contexto são a largura do sinal estéreo ou a presença de Replicação de Banda Espectral (SBR), ou seja, um método aplicado por codecs com perdas. O ABLA é então usado para ativar outro processamento que melhora a qualidade do som dos sinais com uma compressão com perda, não sendo restrito ao processamento BWE. Exemplos são a filtragem para melhorar a largura estéreo e os componentes de sinal transitório.
[0144] Os resultados da ABLA, ou seja, o parâmetro D e a frequência de corte fc, pode ser utilizada ou pode até ser necessário para a reparação de tais artefatos automaticamente sem ter um operador humano envolvido. Pode ser de importância crucial aplicar a melhoria da qualidade do som apenas a sinais com qualidade de som degradada. Sinais de alta qualidade não devem ser processados dessa maneira,
Petição 870190097126, de 27/09/2019, pág. 311/383
53/79 devido ao fato de que a qualidade do som pode ser afetada negativamente. Modalidades de acordo com o segundo aspecto permitem detectar quadros de áudio ou sinais de áudio sujeitos à limitação da largura de banda artificial com alta precisão. Os sinais de áudio têm uma largura de banda natural determinada pelo processo de geração de som. A largura de banda pode mudar devido a vários processos técnicos, incluindo limitação de largura de banda aplicada para captura, armazenamento, processamento e transmissão do sinal. A limitação da largura de banda é uma filtragem passa-baixa com as características de uma atenuação muito acentuada, uma atenuação muito alta e uma frequência de corte, conforme descrito acima.
[0145] A seguir, será feita referência ao terceiro e quarto aspecto da presente invenção, referindo-se a um conceito de largura de banda que estende um sinal limitado de largura de banda no terceiro aspecto, por exemplo, responsivo a ter determinado limitação artificial de largura de banda de acordo com o segundo aspecto. Assim, modalidades de acordo com o terceiro aspecto podem ser usadas como intensificador de sinal em conexão com o segundo aspecto.
[0146] O conceito de acordo com o terceiro aspecto visa suprimir vários artefatos de codificação para melhorar a qualidade do som percebido. As etapas técnicas podem ser implantadas como pós-processamento e parcialmente implantadas usando o software que pode ser usado pelo decodificador. O conceito pode funcionar às cegas sem ter acesso ao sinal de áudio não compactado e a outras informações secundárias. O processamento de melhoria de baixa taxa de bits de codificação de acordo com o terceiro aspecto compreende ou mesmo consiste, essencialmente, de um pósprocessador, que introduz ou aumenta a agradabilidade perceptual relacionada com conceitos para não-dirigida de pós-processamento de material de áudio que foi précodificado por herança codificadores perceptuais. Assim, o material de áudio pré codificado pode se beneficiar de conceitos modernos de prazer perceptivo.
[0147] As modalidades que são descritas em conexão com o terceiro e quarto aspecto podem usar um princípio básico chamado ponderação espectral ou atenuação espectral de curto prazo. Portanto, um sinal no domínio do tempo x[n] é
Petição 870190097126, de 27/09/2019, pág. 312/383
54/79 transformado em sua representação no domínio da frequência X[/çm] onde k e m doam o índice de frequência e período de tempo, respectivamente. De acordo com modalidades, uma transformada de Fourier de curto prazo (STFT) pode ser aplicada, mas também outras transformações podem ser usadas. O sinal de saída Y da ponderação espectral pode ser dado pela seguinte equação
A .ffi] = .£&] X , em que a representação no domínio do tempo y[n] do sinal no domínio da frequência y[k,m] pode ser calculada por meio de uma transformação inversa, por exemplo, um STFT inverso, isto é, ISTFT. Nas seções a seguir, os sinais no domínio do tempo podem ser indicados com letras minúsculas e sinais do domínio da frequência com letras maiúsculas. Os índices k e m ou os sinais no domínio da frequência serão omitidos para melhor legibilidade. A ponderação espectral será explicada em mais detalhes em conexão com um aspecto que é referido como ponderação espectral, na qual são explicados detalhes dos pesos espectrais G[k,m].
[0148] A Figura 14 mostra um diagrama de blocos esquemático de um aparelho 140 de acordo com uma modalidade do terceiro aspecto. O aparelho 140 é configurado para processar um sinal de áudio e pode receber o espectro 12’ do sinal de áudio para o processamento. O aparelho 140 pode ser configurado para receber a representação no domínio do tempo do sinal de áudio, isto é, o sinal de áudio 12 e pode derivar o espectro 12’, por exemplo, o aparelho 140 pode compreender a calculadora de espectro 44 para tal finalidade.
[0149] O aparelho 140 compreende um separador 92 para separar uma primeira porção 91’a de um espectro 91’ de um sinal de áudio 91 de uma segunda porção 91 ’b do espectro 91’ do sinal de áudio 91. A primeira porção 91’ a tem uma primeira característica de sinal e a segunda porção 91 ’b tem uma segunda característica de sinal. O sinal de áudio 91 podem ser recebidos pelo aparelho 91 no domínio do tempo e/ou no domínio da frequência e pode ser, por exemplo, usando uma frequência de corte fc e pode ser submetida a pós-processamento de largura de banda limitada. Uma característica principal do terceiro aspecto relacionado à extensão de largura de
Petição 870190097126, de 27/09/2019, pág. 313/383
55/79 banda é que o sinal de entrada pode ser dividido em características diferentes, como porções de sinal transiente e sustentado, que são tratadas independentemente, aplicando diferentes configurações de parâmetros para os módulos em cada parte.
[0150] A primeira e a segunda características do sinal podem diferir entre si por meio de diferentes percepções e/ou por diferentes características na faixa de frequência. Embora as modalidades não sejam limitadas aqui, a primeira e a segunda características do sinal podem ser complementares entre si, isto é, removendo, excluindo ou subtraindo uma característica do sinal do espectro comum 91’, a porção restante forma a outra característica. A título de exemplo não limitativo, a primeira característica do sinal pode ser uma faixa de frequência média do espectro e a segunda característica do sinal pode ser uma faixa de frequência lateral do espectro. Alternativamente, a primeira característica do sinal pode ser uma característica direta do sinal de áudio e a segunda característica do sinal pode ser uma característica ambiental do sinal de áudio. De acordo com outra modalidade, a primeira característica do sinal pode ser uma característica tonal do sinal de áudio e a segunda característica do sinal pode ser uma característica do sinal sustentado do sinal de áudio que pode ser referido como transitório ou similar. Alternativamente, a primeira característica do sinal pode ser uma característica de fala do sinal de áudio e a segunda característica de sinal pode ser uma característica de não fala do sinal de áudio. Outras características do sinal também são possíveis. Além disso, é possível formar combinações dos mesmos, isto é, combinar duas ou mais das características acima identificadas. A primeira e a segunda porções 91’a e 91’b podem compreender uma largura de banda comparável ou mesma, frequência de partida e frequência de parada e podem formar, quando combinados entre si o espectro 91’ novamente. Ou seja, a divisão ou separação pode ser feita por meio de decomposição de sinal sustentada por transiente. Alternativa ou adicionalmente, outras regras ou métodos de decomposição são possíveis, como decomposição de sinal no meio do meio, decomposição de sinal ambiente direto ou decomposição em primeiro plano/fundo e/ou decomposição sem fala, etc.
Petição 870190097126, de 27/09/2019, pág. 314/383
56/79 [0151] O aparelho 140 pode compreender um primeiro extensor de largura de banda 94 que se prolonga para uma largura de banda de uma primeira porção 91’a usando primeiros parâmetros 96i associado com o primeiro sinal característico para a obtenção de uma primeira porção 98a estendida. O aparelho 140 compreende ainda um segundo extensor de largura de banda 942 para estender uma largura de banda da segunda porção 91’b com o uso dos segundos parâmetros 962 associados à segunda característica de sinal para obter uma segunda porção estendida 98b. A extensão da largura de banda pode compreender formar partes adicionais ou porções de frequência no espectro a serem combinadas com o sinal original. Isso pode incluir uma cópia e/ou uma geração dessas regiões de frequência adicionais por transposição, alongamento espectral ou geração de sobretons através da aplicação de uma não linearidade. Usando um primeiro e um segundo extensor de largura de banda, as diferentes características de sinal presentes nas diferentes partes 91’a e 91’b podem ser consideradas diferentemente pelo respectivo extensor de largura de banda 94i e 942. Por exemplo, uma largura de banda de uma porção copiada, um número de cópias, uma alternância de cópias, uma configuração espectral de um sinal sendo obtido e/ou características de frequência de porções espectrais geradas artificialmente podem variar entre diferentes características de sinal que podem ser consideradas por usando diferentes conjuntos de parâmetros 96i e 962 em conexão com as diferentes características do sinal. Isso permite uma alta adaptação da extensão da largura de banda à característica do sinal.
[0152] Embora tenha descrito o aparelho 140 como compreendendo um primeiro e um segundo extensor de largura de banda para considerar uma primeira e uma segunda característica de sinal, um aparelho de acordo com outras modalidades pode ser configurado para submeter mais de dois, por exemplo, três, quatro, cinco ou mesmo um número maior, para diferentes extensões de largura de banda. Tal aparelho pode compreender números correspondentes de extensores de largura de banda, mas também pode usar um extensor de largura de banda para pelo menos duas extensões de largura de banda, por exemplo, ao processar sequencialmente
Petição 870190097126, de 27/09/2019, pág. 315/383
57/79 diferentes características de sinal. Por conseguinte, o aparelho 140 pode ser implantado implementando um extensor de largura de banda 94 e para adaptar o extensor de largura de banda com diferentes parâmetros 96i e 962 sequencialmente enquanto processa as diferentes porções 91’a e 91 ’b sequencialmente.
[0153] O aparelho 140 compreende um combinador 102 configurado para usar a primeira e a segunda porções estendidas 98a e 98b para obter um sinal de áudio combinado estendido 104. As porções estendidas 98a e 98b podem ser recebidas do combinador 102 como uma representação no domínio do tempo, de modo que o sinal de áudio combinado 104 também possa estar no domínio do tempo. Alternativamente, as porções estendidas 98a e 98b podem ser recebidas pelo combinador no domínio da frequência, de modo que o sinal de áudio combinado 104 também possa estar no domínio da frequência, de modo a ser convertido no domínio do tempo posteriormente. Alternativamente, o combinador 102 pode ser configurado para transformar cada uma das porções únicas 98a e 98b ou uma versão combinada do mesmo no domínio do tempo e para fornecer o sinal de áudio combinado 104 no domínio do tempo.
[0154] A Figura 15 é um diagrama esquemático que ilustra um espectro de exemplo compreendendo diferentes componentes 106a e 106b. Por exemplo, o componente 106a pode estar relacionado a um sinal transitório do espectro, por exemplo, obtido por uma caixeta. Tais sinais podem ter uma correlação mais alta dentro de um quadro espectral e também podem ter uma largura de banda maior que um sinal sustentado, por exemplo, indicado pela porção espectral 106, que pode se relacionar com uma voz humana. Na Figura 15, pode ser visto que a porção transitória 106a tem uma largura de banda consideravelmente maior do que a porção 106b, por exemplo, uma voz cantante.
[0155] A Figura 16 mostra um diagrama de blocos esquemático de um aparelho 160 de acordo com uma modalidade do terceiro aspecto. A seguir, será feita referência ao sinal de áudio e seus sinais derivados. O sinal de áudio pode estar presente e/ou processado no domínio do tempo e/ou no domínio da frequência, em que ambas as
Petição 870190097126, de 27/09/2019, pág. 316/383
58/79 variantes podem ser transformadas uma em relação à outra por uma conversão de frequência em tempo ou uma conversão de tempo em frequência. Assim, quando se refere ao sinal de áudio, isso pode se referir à representação no domínio do tempo e à representação no domínio da frequência como sinônimo aceitável, sendo explicada de outra forma explicitamente.
[0156] O aparelho 160 compreende o separador 92 sendo configurado para receber a representação no domínio da frequência 91 ’ do sinal de áudio 91. Para este fim, o aparelho 160 pode compreender a calculadora de espectro 44 para obter a representação no domínio da frequência 91’ a partir da representação no domínio do tempo.
[0157] O separador 92 pode compreender um supressor de transientes 108 configurado para receber o sinal de áudio, por exemplo, a representação no domínio da frequência e para reduzir porções transitórias no sinal de áudio 91, de modo a obter um primeiro sinal de áudio modificado. O separador 92 pode ser configurado para obter a primeira porção 98a com base no primeiro sinal de áudio modificado. De acordo com uma modalidade, a primeira porção 98a corresponde ao primeiro sinal de áudio modificado. De acordo com outra modalidade, um processamento da primeira porção modificada é realizado, por exemplo, uma filtragem, amplificação, atenuação ou similar.
[0158] O separador 92 pode compreender um subtrator 112 para subtrair o primeiro sinal de áudio modificado, a primeira porção 91’a, por exemplo, do sinal de áudio 91, de modo a obter um segundo sinal modificado. De acordo com uma modalidade, o segundo sinal modificado é a segunda porção 91 ’b. Como descrito para a primeira porção 91’a, a segunda porção 91’b também pode ser obtida com base no processamento do resultado da subtração obtido. Assim, removendo a primeira porção 91’ a do sinal de áudio 91, a segunda porção 91’b pode ser obtida. Obtendo o primeiro sinal modificado e subtraindo-o do sinal de áudio de modo a obter o segundo sinal modificado, pode ser realizada a decomposição do sinal de áudio nas duas porções.
Petição 870190097126, de 27/09/2019, pág. 317/383
59/79 [0159] O separador 92 pode ser configurado para operar no domínio da frequência ou no domínio do tempo e para processar o sinal de áudio 91 de modo que o supressor de transientes 108 reduz ou elimine porções transitórias e/ou tonais para cada subbanda de um espectro do sinal de áudio 91. Isso pode levar a menos ou mesmo nenhum processamento para sub-bandas que compreendem porções pequenas ou não transitórias ou pequenas ou não tonais (ou seja, barulhentas). O supressor transitório 108 pode compreender um estágio de processamento transitório, um estágio de processamento tonal e/ou um estágio de combinação, de modo a processar uma das características a serem separadas, suprimindo as mesmas ou amplificando as mesmas. A representação no domínio da frequência do sinal de áudio 91 pode compreender uma infinidade de sub-bandas (bandas de frequência), em que o estágio de processamento transitório e/ou o estágio de processamento tonal são configurados para processar cada uma das bandas de frequência. Alternativamente, o espectro obtido por conversão de frequência do sinal de áudio 91 pode ser reduzido, isto é, cortado, para excluir certas faixas de frequência ou faixas de frequência de processamento adicional, como faixas de frequência contendo a característica selecionada ou faltando a característica selecionada. Isso pode permitir um esforço computacional reduzido e, portanto, um processamento mais rápido e/ou mais preciso.
[0160] O estágio de processamento transitório pode ser configurado para determinar para cada uma das bandas de frequência processadas, se a banda de frequência compreende porções transitórias. O estágio de processamento tonal pode ser configurado para determinar para cada uma das bandas de frequência, se o sinal de áudio 91 compreender porções tonais na banda de frequência. O estágio de processamento transitório pode ser configurado para determinar pelo menos para as bandas de frequência compreendendo fatores de ponderação espectral das porções transitórias, em que os fatores de ponderação espectral estão associados à respectiva banda de frequência e podem permitir atenuar/excluir ou amplificar as respectivas porções. Características transitórias e tonais podem ser identificadas por
Petição 870190097126, de 27/09/2019, pág. 318/383
60/79 processamento espectral. Um nível de transitoriedade e/ou tonalidade pode ser medido pelo estágio de processamento transitório e/ou pelo estágio de processamento tonal do separador 92 e pode ser convertido em um peso espectral. O separador 92 pode ser configurado para determinar fatores de ponderação espectral pelo menos para bandas de frequência compreendendo as porções tonais. Os fatores de ponderação espectral podem compreender uma infinidade de valores possíveis, a magnitude dos fatores de ponderação espectral indicando uma quantidade de porções transitórias e/ou tonais na banda de frequência.
[0161 ] Os fatores de ponderação espectral podem compreender um valor absoluto ou relativo. Por exemplo, o valor absoluto pode compreender um valor de energia de som transitório e/ou tonal na banda de frequência. Alternativamente, os fatores de ponderação espectral podem compreender o valor relativo, como um valor entre 0 e 1, o valor 0 indicando que a banda de frequência compreende nenhuma ou quase nenhuma parte transitória ou tonal e o valor 1 indicando a banda de frequência que compreende uma quantidade alta ou porções completamente transitórias e/ou tonais. Os fatores de ponderação espectral podem compreender um dentre vários valores, como um número de 3, 5, 10 ou mais valores (etapas), por exemplo, (0, 0, 3 e 1), (0, 1,0, 2, 1) ou o valor gostar. Um tamanho da escala, um número de etapas entre um valor mínimo e um valor máximo pode pelo menos zero, mas de preferência pelo menos um e mais preferencialmente pelo menos cinco. De preferência, a multiplicidade de valores dos pesos espectrais compreende pelo menos três valores compreendendo um valor mínimo, um valor máximo e um valor que está entre o valor mínimo e o valor máximo. Um número maior de valores entre o valor mínimo e o valor máximo pode permitir uma ponderação mais contínua de cada uma das bandas de frequência. O valor mínimo e o valor máximo podem ser redimensionados para uma escala entre 0 e 1 ou outros valores. O valor máximo pode indicar um nível mais alto ou mais baixo de transitoriedade e/ou tonalidade.
[0162] Um estágio de combinação do separador 92 pode ser configurado para combinar os pesos espectrais para cada uma das bandas de frequência com o sinal
Petição 870190097126, de 27/09/2019, pág. 319/383
61/79 de áudio. O separador 92 pode ser configurado para aplicar os pesos espectrais combinados a cada uma das bandas de frequência. Por exemplo, os pesos espectrais podem ser multiplicados com valores espectrais do sinal de áudio 91 na banda de frequência processada.
[0163] Suprimindo ou excluindo algumas porções/características do sinal de áudio 91, um primeiro sinal modificado que falta a respectiva característica, mas que compreende a outra característica, pode ser obtido. Subtraindo o sinal do sinal de áudio, um sinal inverso compreendendo a característica suprimida e sem a característica do primeiro sinal modificado pode ser obtido por meio do segundo sinal modificado.
[0164] A seguir, será feita referência a um exemplo de configuração dos extensores de largura de banda 94i e 942. Cada um dos extensores de largura de banda 94i e 942 pode compreender um duplicador 114 para duplicar pelo menos uma parte da respectiva porção, pode compreender um formador de envelope 116 que molda pelo menos as porções estendidas geradas pelo duplicador, pode compreender um branqueador 118 para equalização pelo menos as porções estendidas e/ou podem compreender um filtro antirrugosidade 122 para mudar de fase pelo menos uma porção da porção estendida. Cada um desses elementos pode ser organizado em conjunto com outros elementos referenciados. Alternativamente, alguns ou todos esses elementos podem estar ausentes e/ou podem ser substituídos por outros elementos. Por exemplo, em vez de uma cópia realizada pelo duplicador, uma geração artificial de uma largura de banda pode ser implantada pelo extensor de largura de banda, de modo que um gerador de largura de banda possa substituir o duplicador 114. Alternativamente, uma modelagem ou clareamento do espectro pode ser descartada e/ou outro processamento pode ser usado. Além disso, o filtro antirrugosidade 122 é opcional. Embora sendo ilustrado como filtrando um sinal respectivo no domínio do tempo por ser fornecido com a saída de um bloco de transformada Fourier de curto prazo para dentro 124, o filtro antirrugosidade pode ser configurado para operar no domínio da frequência e, portanto, pode ser arranjado
Petição 870190097126, de 27/09/2019, pág. 320/383
62/79 antes um respectivo bloco de transformada de Fourier inverso de curto prazo 124. Assim, além dos blocos dispostos, também uma ordem dos mesmos pode variar.
[0165] Cada um dos extensores de largura de banda 94i e 942 pode compreender um respectivo primeiro e segundo duplicador 114i e 1142. Os duplicadores 114i e 1142 são configurados para duplicar pelo menos uma parte da respectiva primeira ou segunda porção 91’a e 91’b e para combinar pelo menos uma versão da parte duplicada da primeira porção, a segunda porção, respectivamente, com a primeira porção, a segunda porção 91’a, 91’b, respectivamente, de modo a obter uma respectiva porção estendida 126a, 126b, respectivamente.
[0166] Quando nos referimos agora à Figura 17a, é mostrado um exemplo de espectro da primeira porção 91’a, em que a explicação dada se refere à segunda porção 91’b sem qualquer limitação. A porção 91’a pode ter uma energia ou amplitude relevante | %| abaixo da frequência de corte fc e pode compreender uma quantidade baixa de energia ou mesmo nenhuma energia acima da frequência de corte fc. O espectro pode diminuir com o aumento da frequência. Por outras palavras, a Figura 17a mostra o espectro de magnitude | %| de um sinal de banda limitada. A frequência de corte é indicada como fc.
[0167] A Figura 17b mostra um diagrama esquemático da primeira porção 91’a sendo estendida por um número de duas partes duplicadas 128i e 1282. Cada uma das partes duplicadas 128i e 1282 pode ser uma cópia de uma banda de frequência w da primeira porção 91’a sendo copiada para uma faixa de frequência desocupada pela porção 91’a, ou seja, para faixas de frequência acima do ponto de corte frequência fc, em que de preferência as porções duplicadas 128i e 1282 são combinados de modo a solicitar diretamente sobre o sinal original, ou seja, a primeira porção 91’a. A Figura 17b ilustra, portanto, como a cópia é realizada. Os coeficientes espectrais complexos são deslocados do chamado patch de origem wno intervalo de frequência [fc-w,fc] para os patches de destino nos intervalos [fc,fc+w,fc+2w], etc., isto é, para [fc(n-1)w, fc+nw] para cada n, em que n é uma variável que varia de 1 ao número de patches ou número de cópias inseridas. O número n sendo 2 por exemplo
Petição 870190097126, de 27/09/2019, pág. 321/383
63/79 não limitativo na Figura 17b e uma largura DÇda porção duplicada pode ser ajustada pelo aparelho 160 independentemente para cada um dos extensores de largura de banda 94i e 942. Ou seja, a frequência com que o patch de origem wé alterado pode depender da largura de banda desejada e/ou de um número de patches, em que ambos podem ser um parâmetro ajustável. Como na magnitude decrescente do espectro, podem ocorrer etapas ou descontinuidades nos locais onde o adesivo está conectado.
[0168] A parte copiada da primeira e da segunda porção pode variar de uma primeira frequência intermediária, por exemplo, fcópiai da primeira porção 91’a a uma frequência máxima fc da primeira porção. Por conseguinte, a parte copiada da segunda porção pode compreender uma segunda faixa de frequência que varia de uma frequência intermediária igual ou diferente da segunda porção 91’b a uma frequência máxima da segunda porção que também pode ser a frequência de corte c. Com base em diferentes frequências intermediárias, a largura Dfw pode ser diferente. Para obter a mesma largura de banda resultante, portanto, vários patches também podem variar entre os diferentes extensores de largura de banda.
[0169] Para evitar artefatos indesejados, o primeiro extensor de largura de banda pode compreender um primeiro modelador de envelope 116i e o segundo extensor de largura de banda 942 pode compreender um segundo modelador de envelope 1162. Os formadores de envelope 1161 e 1162 podem ser configurados para moldar pelo menos a porção estendida, isto é, porções de frequência acima da frequência de corte fc. A modelagem do envelope, isto é, a realização de modelagem espectral do envelope, pode ser usada com frequência, os espectros de magnitude não são planos, os mesmos tendem a cair em magnitude em direção a frequências mais altas, como ilustrado na Figura 17a. A Figura 17b visualiza 0 espectro de magnitude quando a cópia é realizada sem outras adaptações. Transições abruptas no espectro de magnitude podem aparecer nas frequências fc, fc+w,..., fc+kw. Isso pode levar a uma percepção sonora incrivelmente brilhante que deve ser evitada pelos formadores de envelope 1161 e 1162.
Petição 870190097126, de 27/09/2019, pág. 322/383
64/79 [0170] Para evitar tais efeitos, o declive espectral T, como mostrado na Figura 17b, pode ser estimada calculando-se o declive |x| que foi ajustada por meio de regressão linear ao espectro logarítmico do patch fonte que compreende o intervalo de frequência [fc-w,fc/. Cada patch w pode ser atenuado por um valor kT, ou seja, quanto mais alto o patch for copiado na faixa de frequência, maior será a atenuação. k pode ser um número natural e pode ser a chamada ordem de patch, que começa em 1 e é aumentada para cada patch adicional que é deslocado e, portanto, pode corresponder a n mencionado anteriormente.
[0171] Por outras palavras, a Figura 17b mostra uma cópia dos coeficientes espectrais sem moldar o envelope. A origem da cópia é do intervalo [fc-w,fc], em que wé a largura do patch. Durante a modelagem analógica, a magnitude dos patches de destino copiados no intervalo [fc/c+2w] é atenuado por um múltiplo de T, que significa declive espectral.
[0172] A Figura 17c mostra um exemplo de espectro de magnitude 132a que pode ser obtido a partir do modelador de envelope 1161 sendo configurado para moldar pelo menos as porções estendidas 126i. Com base na interpolação, as magnitudes das porções copiadas 128i e 1282 podem ser moldadas ou atenuadas de modo a obter um espectro homogêneo. A Figura 17c mostra o espectro de magnitude da forma do envelope com a ordem de remendo 2, em que a ordem de remendo pode compreender qualquer valor de 1 ou superior. Cada um dos extensores de largura de banda 49i e 492 pode compreender um branqueador para equalizer pelo menos a primeira porção estendida, a segunda porção estendida, respectivamente. O clareamento espectral pode ser feito aumentando os valores espectrais e diminuindo os picos espectrais.
[0173] Para uma melhor compreensão, a Figura 18 mostra um diagrama de blocos esquemático de um branqueador espectral sendo configurado para branquear o sinal de áudio 91 independentemente. O branqueador pode compreender a calculadora de espectro 44, de modo a obter um espectro do sinal de áudio. O branqueador 134 pode ser configurado para comparar a magnitude X[k,m] de cada coeficiente espectral e prazo com uma versão suavizada em que k é o índice do coeficiente espectral
Petição 870190097126, de 27/09/2019, pág. 323/383
65/79 emo índice de trama. Y[k,m] pode ser derivado suavizando magnitudes espectrais logarítmicas sobre a frequência. Posteriormente, esses valores logarítmicos podem ser transformados no domínio linear usando uma regra de determinação de acordo com
Y!
Y = 10zõ [0174] Os pesos espectrais com valor real G[k,m] podem ser calculados conforme descrito pela regra de determinação:
Figure BR112019020357A2_D0004
[0175] Novamente, o índice k e om são omitidos para uma melhor legibilidade, α 1, 02, βι, β2, γι, γ2 são os parâmetros ajustáveis, que podem ser adaptadas para cada um dos branqueadores de 1181 e 1182 independentemente. O branqueador pode compreender uma calculadora 126 para calcular valores absolutos do espectro. Esses valores podem ser referidos como X, em que os valores são os fornecidos a um calculador 138 para 0 cálculo de todos os pesos espectrais e G são os fornecidos para um caminho de alisamento 142, de modo a obter a versão suavizada Y. Um conversor de frequência 144 pode ser configurado para transformar 0 resultado em um domínio do tempo. Ao se referir agora à Figura 16, pode ser visto que 0 branqueador 1181 e 1182 já pode operar no domínio da frequência, de modo que 0 respectivo branqueador possa ser implantado sem a calculadora de espectro 44 e/ou 0 conversor de frequência 144 ou similares.
[0176] Cada um dos extensores de largura de banda 94i e 942 pode compreender um respectivo filtro antirrugosidade 122i, 1222, respectivamente, para mudança de fase pelo menos uma porção da primeira porção estendida, da segunda porção estendida, respectivamente. Isso pode ser executado como mudança de fase das partes copiadas 128i e 1282 e/ou das versões moldadas 128Ί, 128’2 e/ou das versões embranquecidas 146a e 146b, respectivamente. Ou seja, 0 filtro antirrugosidade é configurado para mudar de fase a respectiva porção estendida ou sinalizar 0 seu
Petição 870190097126, de 27/09/2019, pág. 324/383
66/79 direito de modo a obter um sinal de mudança de fase. O filtro antirrugosidade 122i e 1222 pode ser configurado para aplicar diferentes desvios de fase ao respectivo sinal a ser filtrado. Utilizando a mudança de fase, pode ser obtida uma mudança de fase da porção copiada ou da porção estendida em relação ao sinal original. Alternativamente, o filtro antirrugosidade pode executar uma mudança de fase para o sinal completo fornecido. Isso pode ser implantado, por exemplo, quando a respectiva porção central é substituída posteriormente por uma porção sem mudança de fase, como será descrito a seguir. O filtro antirrugosidade 122i e 1222 pode ser implantado de modo a filtrar um sinal respectivo no domínio do tempo. Portanto, um bloco ISTFT 124i, 1242 pode ser disposto de modo a fornecer um sinal respectivo no domínio do tempo. Alternativamente, o filtro antirrugosidade 122i e 1222 pode ser implantado de modo a filtrar no domínio da frequência. Nesse caso, os blocos ISTFT 124i e 1242 podem estar ausentes ou podem ser dispostos após os filtros antirrugosidade 122i, 1222, respectivamente. A filtragem antirrugosidade pode ser realizada para diminuir a rugosidade percebida, que é principalmente evocada pela cópia. Um filtro que não afeta o timbre do sinal, mas altera principalmente a fase do sinal, pode ser adequado aqui. Por exemplo, dois filtros passa-tudo aninhados podem ser organizados em paralelo e podem ser calculados no domínio do tempo. Os filtros passa-tudo aninhados podem ser entendidos como Hi(z) e Fkfz) denotando funções de transferência de passa-tudo com ganho de unidade de um filtro respectivo, então Hi(H2(z)) e H2(Hi(z)) são filtros passa-tudo.
[0177] Opcionalmente, cada um dos extensores de largura de banda de 94 1 e 94 2 podem compreender um amplificador/atenuador de 148 1,148 2, respectivamente, para aplicar um ganho gt, gs, respectivamente, para amplificar as porções sustentada ou transientes. Um resultado pode ser as porções estendidas 98a e 98b fornecidas ao combinador 102. Como explicado acima, as porções estendidas 98a e 98b podem ser obtidas de maneira diferente e/ou executando apenas algumas das modificações de sinal explicadas.
Petição 870190097126, de 27/09/2019, pág. 325/383
67/79 [0178] Em conexão com o filtro de rugosidade, o aparelho 160 pode compreender um filtro passa-alta 152 para filtrar a primeira porção estendida e a segunda porção estendida 98a e 98b, o sinal combinado 102, respectivamente, e sinonimamente, de modo a obter um sinal filtrado 154. Em paralelo aos extensores de largura de banda 94i e 942, o sinal de áudio 91 pode ser sujeito a um atraso 156 para compensar atrasos de tempo causados pela conversão de tempo para frequência no bloco 44 e conversão de frequência para tempo nos blocos 124i e 1242.0 aparelho 160 pode compreender um filtro passa-baixa 158 configurado para filtrar o sinal de áudio atrasado. O aparelho 160 pode ainda compreender um combinador 162 configurado para combinar o sinal de áudio filtrado passa-baixa e o sinal 154. De acordo com uma modalidade, o aparelho 160 é configurado para coincidir com a frequência superior (frequência de corte Xc) do filtro passa-baixa 158 com uma frequência de borda inferior do filtro passaalta 152, de modo a obter um sinal homogêneo combinado. Em particular, o aparelho 160 pode ser configurado para adaptar a respectiva frequência mais baixa do filtro passa-alta 152 juntamente com a frequência da borda superior (frequência de corte) do filtro passa-baixa 158 que responde e de acordo com o corte determinado frequência de corte do sinal de áudio 91. Assim, com base no filtro passa-alta 152, porções de sinal abaixo da frequência de corte fc pode ser descartado ou fortemente atenuado, de modo que apenas as porções estendidas e com mudança de fase permaneçam. Em contraste, o filtro passa-baixa 158 pode ser usado para descartar, descartar ou atenuar fortemente partes do sinal de áudio 91, porções do mesmo se estendendo respectivamente além da frequência de corte fc. Isso permite que as versões estendidas e copiadas sejam alteradas de fase em relação ao sinal de áudio original 91, sendo atrasadas apenas para compensar outros atrasos nos extensores de largura de banda, exceto os filtros antirrugosidade 122i e 1222. Um sinal de áudio obtido 164 pode ser um sinal de áudio estendido e otimizado.
[0179] Como a filtragem antirrugosidade deve ser aplicada apenas às áreas estendidas da largura de banda do espectro, o sinal resultante pode ser filtrado com alta frequência e adicionado ao sinal de entrada filtrado com baixa frequência e
Petição 870190097126, de 27/09/2019, pág. 326/383
68/79 atrasado. O atraso é usado ou necessário para compensar o atraso introduzido pelo STFT. As frequências de corte dos filtros passa-alta e passa-baixa acima mencionadas podem corresponder à frequência de corte fc como mostrado, por exemplo, na Figura 17a.
[0180] Em relação à Figura 19 em conexão com a Figura 16, é mostrada uma funcionalidade dos blocos opcionais 166 sendo um analisador de sinal e 168 sendo uma tabela de consulta do aparelho 160. O aparelho 160 pode ser uma extensão de largura de banda cega. Pode ser um objetivo de restaurar a largura de banda perdida, conforme descrito e sem ter mais conhecimento, por exemplo, com base em informações secundárias. O analisador de sinal 166 pode ser configurado para detectar, se o sinal foi artificialmente limitado por banda ou não e/ou pode estimar uma frequência de corte fcdo sinal de áudio 91. Ambas as etapas podem ser executadas conforme descrito em conexão com a análise de limitação de largura de banda artificial. Ambos os valores podem ser atualizados para cada quadro. Assim, o sinal de áudio 91 pode compreender uma pluralidade de quadros. O aparelho 160 pode compreender o analisador de sinal 166 configurado para analisar para cada quadro, o espectro do sinal de áudio 91 para uma característica relacionada a uma limitação de largura de banda artificial do sinal de áudio 91 e para determinar uma frequência de corte fc no sinal de áudio 91.
[0181] Com base em diferentes frequências de corte que são esquematicamente referidas como fo, fi, Í2, fa, Í4, respectivamente na Figura 19, diferentes parâmetros estão sendo utilizados para adaptar uma funcionalidade do duplicador 114, o modelador 116, o branqueador 118 e/ou o filtro antirrugosidade 122 podem variar. Por exemplo, um parâmetro p pode ser usado para adaptar o respectivo bloco. Como ilustrado na Figura 19, diferentes frequências de corte podem ser associadas a diferentes parâmetros ou valores diferentes do mesmo parâmetro. Esses valores podem ser armazenados em uma tabela de consulta 168 para fornecer o respectivo parâmetro ao respectivo bloco. Na Figura 16, as conexões tracejadas indicam que um módulo é controlado, por exemplo, em tempo real. Um exemplo de parâmetro pode
Petição 870190097126, de 27/09/2019, pág. 327/383
69/79 ser, mas aqui está um exemplo: um parâmetro pode ser a largura de banda do patch de origem w. Esse parâmetro pode afetar a largura de banda criada artificialmente. Outro parâmetro de exemplo pode ser um constante de tempo de um filtro de suavização que pode ser diferente para diferentes codecs. Uma pluralidade de outros exemplos pode ser usada para controlar os blocos 114,116,118 e/ou 122 no domínio da frequência e/ou no tempo.
[0182] A tabela de consulta pode conter ajustes para alguns ou todos os parâmetros de controle, dependendo dos resultados da análise do sinal. No caso de estimativa da frequência de corte fc, para cada frequência selecionada A um ajuste perceptivo do parâmetro correspondente pode ser executado, o que pode levar a um valor de controle p,·. Note-se que um valor de pi selecionado pode ser diferente para os diferentes extensores de largura de banda, ou seja, o aparelho 160 pode ser configurado para adaptar o respectivo bloco diferente. Os pontos de amostragem da tabela de consulta s/ para um extensor de largura de banda de 94i ou 942s podem ser administrados, por exemplo, como de acordo com
Pi) [0183] Na Figura 19, é mostrado um exemplo para o ajuste de um parâmetro de controle p para cinco frequências de corte foa Í4. De acordo com alguns exemplos, um parâmetro pode ser interpolado quando valores intermediários forem adequados. Nesse caso, entre dois pontos de amostragem no intervalo [fi,fi+i], a interpolação linear pode ser executada de acordo com:
Fa/ôJ - r ¢[0184] Um exemplo para esses valores de interpolação pode ser, por exemplo, uma largura w de um remendo respectivo, conforme explicado em conexão com as Figuras 17a-17c. Os parâmetros que podem permanecer não submetidos a interpolação podem ser, por exemplo, um número de patches limitados, por exemplo, a valores inteiros.
Petição 870190097126, de 27/09/2019, pág. 328/383
70/79 [0185] O aparelho pode ser configurado para usar o primeiro e o segundo parâmetros para um quadro que tem a característica relacionada a uma limitação artificial da largura de banda. Para outros quadros, o aparelho pode ser configurado para o uso de terceiros parâmetros para o primeiro extensor de largura de banda e quartos parâmetros para o segundo extensor de largura de banda, por exemplo, para quadros com uma característica diferente da característica relacionada a uma limitação artificial da largura de banda. Alternativamente, o aparelho pode ser configurado para desativar o primeiro e o segundo extensor de largura de banda para os quadros que têm uma característica diferente da característica relacionada a uma limitação artificial da largura de banda. Assim, o aparelho pode ser configurado para executar a extensão de largura de banda para quadros que são considerados como compreendendo a respectiva característica e pode tratar quadros que são considerados como não compreendendo a característica de maneira diferente usando o terceiro e o quarto parâmetros ou para deixar o respectivo quadro não tratado.
[0186] O aparelho pode assim compreender uma tabela de consulta 168 que compreende uma pluralidade de parâmetros associados a uma pluralidade correspondente de parâmetros de modificação de sinal, como a frequência de corte fc e uma pluralidade de outros parâmetros associados a uma pluralidade correspondente de parâmetros de modificação de sinal fc usado para o primeiro e o segundo extensores de largura de banda 94i, 942 respectivamente. O aparelho pode compreender um analisador de sinal 166 para analisar o espectro para uma modificação aplicada ao sinal de áudio 91. O aparelho 160 pode ser configurado para derivar um parâmetro de modificação associado à modificação, por exemplo, a frequência de corte fc e/ou um parâmetro relacionado ao declive da inclinação. O aparelho pode ser configurado para derivar o respectivo primeiro e/ou segundo parâmetro usando a tabela de consulta e usando o parâmetro de modificação. De acordo com um exemplo, o aparelho pode derivar a frequência de corte do parâmetro de modificação e pode determinar o parâmetro p uma vez para o primeiro extensor de largura de banda e uma vez para o segundo extensor de largura de banda.
Petição 870190097126, de 27/09/2019, pág. 329/383
71/79 [0187] Em conceitos conhecidos, a extensão de largura de banda artificial é uma técnica bem conhecida de codificação de áudio. Além disso, a extensão de largura de banda não guiada é bem conhecida. No entanto, a decomposição semântica antes do cálculo da extensão de largura de banda é desconhecida. A correlação semântica pode ser usada para fins de upmixing espacial, não contendo uma funcionalidade de cópia ou transposição como inevitavelmente encontrada em aplicações de extensão de largura de banda. Portanto, as modalidades de acordo com os terceiros aspectos diferem. Outra técnica é conhecida a partir de uma extensão de largura de banda correlacionada. Aqui, todas as regiões espectrais alvo de banda alta são correlacionadas por meio de decorreladores dedicados ou pela inserção de instâncias correlacionadas de ruído aleatório para serem mutuamente independentes. As presentes modalidades de acordo com o terceiro aspecto ensinam a correlação mútua de partes de sinal decompostas semanticamente, enquanto os conceitos conhecidos compreendem apenas a correlação de diferentes regiões alvo espectrais.
[0188] A Figura 20 mostra um fluxograma esquemático de um método 3000 de acordo com uma modalidade do terceiro aspecto. O método 3000 compreende uma etapa 3100 compreendendo a separação de uma primeira porção de um espectro do sinal de áudio de uma segunda porção do espectro do sinal de áudio, a primeira porção tendo uma primeira característica do sinal e a segunda porção tendo uma segunda característica do sinal. Uma etapa 3200 compreende estender uma largura de banda da primeira porção com o uso dos primeiros parâmetros associados à primeira característica do sinal para obter uma primeira porção estendida. Uma etapa 3300 compreende estender uma largura de banda da segunda porção com o uso dos segundos parâmetros associados à segunda característica do sinal, para obter uma segunda porção estendida. Uma etapa 3400 compreende usar a primeira porção estendida e a segunda porção estendida para obter um sinal de áudio combinado estendido.
[0189] De acordo com o quarto aspecto, a supressão antirrugosidade pode ser realizada como um pós-processamento, por exemplo, após a execução da extensão
Petição 870190097126, de 27/09/2019, pág. 330/383
72/79 de largura de banda com um conceito diferente. Assim, a supressão antirrugosidade ou a filtragem antirrugosidade podem ser usadas para reduzir artefatos, por exemplo, em conexão com o intensificador de sinal 48 ao determinar que a limitação artificial da largura de banda foi executada e que a respectiva extensão também foi executada.
[0190] A Figura 21 mostra um diagrama esquemático de um aparelho 210 de acordo com uma modalidade do quarto aspecto. O aparelho 210 pode ser usado, por exemplo, para processar o sinal de áudio 12 sendo submetido a uma extensão de largura de banda artificial. O aparelho 210 pode compreender o filtro antirrugosidade 122 para mudar de fase pelo menos uma porção do sinal de áudio 12, de modo a obter um sinal de mudança de fase 172. O filtro antirrugosidade 122 pode operar, por exemplo, no domínio do tempo ou, alternativamente, no domínio da frequência. De acordo com uma modalidade, o filtro antirrugosidade 122 pode ser configurado para mudar de fase o sinal de áudio completo 12. O aparelho 210 compreende um filtro passa-alta, por exemplo, o filtro passa-alta 152 para filtrar o sinal de mudança de fase 173, de modo a obter um primeiro sinal filtrado 174. O aparelho 210 compreende um filtro passa-baixa, como o filtro passa-baixa 158, para filtrar o sinal de áudio 12, de modo a obter um segundo sinal filtrado 176. O aparelho 210 compreende ainda um combinador 162 para combinar os sinais 154 e 156, de modo a obter um sinal de áudio aprimorado 178, no qual a rugosidade percebida é reduzida. Como foi descrito em conexão com o aparelho 160, a largura de banda estendida é deslocada de fase em relação ao sinal de áudio 12. Um aspecto é filtrar o sinal de áudio 12, usando o filtro passa-baixa 158, a fim de descartar qualquer parte do sinal que esteja acima da frequência de filtro selecionada, a frequência de corte fc respectivamente. Isso permite reduzir ou limitar efeitos ou superposição de diferentes porções de sinal no sinal combinado 178.
[0191] A Figura 22 mostra um diagrama de blocos esquemático de um aparelho 220 de acordo com uma modalidade do quarto aspecto. Como descrito em conexão com a Figura 16, o aparelho 220 pode compreender o separador 92 para fornecer a primeira e a segunda porções 12’a e 12’b do sinal de áudio 12 no domínio da
Petição 870190097126, de 27/09/2019, pág. 331/383
73/79 frequência. O aparelho 220 pode compreender caminhos diferentes, cada caminho compreendendo, por exemplo não limitative, um branqueador 118i, 1182, respectivamente, juntamente com um filtro antirrugosidade 122i, 1222, respectivamente, operando apenas por exemplo não limitative, no domínio do tempo. Alternativa ou adicionalmente, cada caminho pode compreender um amplificador/atenuador 148. Assim, 0 aparelho 220 pode ser configurado para melhorar 0 sinal de áudio 12 melhorando as diferentes porções 12’ a e 12’b independentemente uma da outra. Para tal finalidade, 0 aparelho 220 pode compreender 0 analisador de sinal 166 e a tabela de consulta 168, conforme descrito em conexão com a Figura 16.
[0192] Em particular, 0 aparelho 220 pode compreender 0 analisador de sinal 166 configurado para determinar uma frequência inicial da extensão da largura de banda no sinal de áudio 12, a frequência inicial da extensão da largura de banda disposta entre uma largura de banda estendida, por exemplo, os adesivos adicionados w de acordo com as Figuras 70a-c ou suas versões processadas, do sinal de áudio 12 e uma largura de banda principal, isto é, a largura de banda original, como a largura de banda do sinal de áudio 91.
[0193] Em conexão com isso, 0 aparelho pode ser configurado para adaptar uma frequência mais baixa do filtro passa-alta 152 e/ou uma frequência superior do filtro passa-baixa 158 de acordo com uma frequência inicial de extensão de largura de banda no sinal de áudio 12. A frequência inicial da extensão da largura de banda pode ser recebida por um canal adicional ou pode ser determinada pelo analisador de sinal 166.
[0194] De acordo com uma modalidade que pode ser combinada com a modalidade independente do aparelho 210 e com cada uma das outras modalidades do quarto aspecto, 0 aparelho pode ser configurado para adaptar 0 filtro de rugosidade e/ou um intensificador de sinal, por exemplo, compreendendo 0 branqueador 118, um modelador de envelope ou similar para melhorar 0 sinal de áudio 12, usando uma frequência inicial de extensão de largura de banda no sinal de áudio. Por exemplo,
Petição 870190097126, de 27/09/2019, pág. 332/383
74/79 com base na frequência de início da extensão de largura de banda no sinal de áudio 12, a tabela de consulta pode fornecer quatro parâmetros diferentes para cada um dos blocos a serem ajustados, como o branqueador 118 e/ou o filtro antirrugosidade 122 e/ou mais blocos.
[0195] De acordo com uma modalidade que pode ser combinada com cada uma das outras modalidades de acordo com o quarto aspecto, o filtro antirrugosidade 122 pode ser disposto em um primeiro caminho e em que o filtro passa-baixa 158 pode ser disposto em um segundo caminho. O segundo caminho pode compreender o branqueador 118 para equalizer um sinal com base em um sinal fornecido ou recebido do filtro antirrugosidade, isto é, uma ordem ou sequência do branqueador e do filtro antirrugosidade pode ser alterada.
[0196] De acordo com uma modalidade adicional do quarto aspecto, que pode ser combinada com cada uma das outras modalidades, o filtro antirrugosidade 122 pode ser disposto em um primeiro caminho e o filtro passa-baixa 158 pode ser disposto em um segundo caminho. O aparelho 220 pode compreender um intensificador de sinal configurado para aprimorar o sinal de áudio no primeiro caminho e pelo menos parcialmente no domínio da frequência, por exemplo, usando o branqueador 118 e/ou o modelador 116. O segundo caminho pode compreender um bloco de atraso, como o atraso 156 para atrasar o sinal de áudio 12 por um atraso correspondente a um atraso no primeiro caminho causado por uma conversão de tempo para frequência e uma conversão de tempo para tempo dentro de uma tolerância gama de, no máximo, ± 10%, ± 5% ou ± 2% e provavelmente excluindo o retardo de filtro antirrugosidade.
[0197] De acordo com uma modalidade adicional, que pode ser combinada com cada uma das outras modalidades de acordo com o quarto aspecto, o filtro antirrugosidade 122 é um primeiro filtro antirrugosidade. O aparelho compreende um separador para receber um espectro do sinal de áudio 12 e para separar uma primeira porção 12’ a do espectro 12’ do sinal de áudio 12 de uma segunda porção 12’b do espectro do sinal de áudio 12. A primeira porção 12’ a tem uma primeira característica de sinal e a segunda porção 12’b tem uma segunda característica de sinal. O aparelho
Petição 870190097126, de 27/09/2019, pág. 333/383
75/79
220 pode ser configurado para fornecer a primeira porção 12’ a para um primeiro caminho com o primeiro filtro antirrugosidade 122 1 e para fornecer a segunda porção 12’b para um terceiro caminho com o segundo filtro antirrugosidade 1222.
[0198] De acordo com uma modalidade adicional que pode ser combinada com a modalidade mencionada anteriormente, o aparelho pode ser configurado para aplicar um primeiro ganho g? para o primeiro caminho e um segundo ganho gs para o terceiro caminho.
[0199] De acordo com uma outra modalidade do quarto aspecto que pode ser combinada com a penúltima e a penúltima modalidade, o aparelho pode ser configurado para ajustar o primeiro filtro antirrugosidade 122i e o segundo filtro antirrugosidade 1222 de maneira diferente entre si usando uma frequência inicial de extensão de largura de banda do sinal de áudio 12.
[0200] De acordo com uma modalidade adicional do quarto aspecto que pode ser combinada com as três últimas modalidades do quarto aspecto, o separador compreende um supressor de transientes, Como o supressor de transientes 108 configurado para receber o sinal de áudio 12 e para reduzir porções transitórias no sinal de áudio 12, de modo a obter um primeiro sinal de áudio modificado. O separador 92 é configurado para obter a primeira porção 12’a com base no primeiro sinal de áudio modificado, por exemplo, usando o primeiro sinal de áudio modificado como a primeira porção 12’a. O separador 92 compreende ainda o subtrator 112 para subtrair o primeiro sinal de áudio modificado do sinal de áudio 12, de modo a obter um segundo sinal modificado. O separador 92 é configurado para obter a segunda porção com base no segundo sinal de áudio modificado, por exemplo, tomando o segundo sinal de áudio modificado como a segunda porção 12’b.
[0201] De acordo com uma modalidade adicional do quarto aspecto, que pode ser combinada com as últimas quatro modalidades, a primeira característica do sinal é uma de a) uma faixa de frequência média do espectro; b) um sinal direto característico do sinal de áudio; c) uma característica tonal do sinal de áudio; e d) uma característica de fala do sinal de áudio. A segunda característica do sinal está de acordo com as
Petição 870190097126, de 27/09/2019, pág. 334/383
76/79 letras utilizadas: a) uma faixa de frequência lateral do espectro; b) um sinal ambiental característico do sinal de áudio; c) um sinal sustentado característico do sinal de áudio; e d) uma característica de não fala do sinal de áudio.
[0202] De acordo com uma modalidade adicional do quarto aspecto, que pode ser combinada com cada uma das outras modalidades do quarto aspecto, o sinal de áudio aprimorado 164 compreende o segundo sinal filtrado sendo deslocado de fase quando comparado ao primeiro sinal filtrado, ou seja, o a região de frequência superior é alterada de fase quando comparada à região de frequência mais baixa.
[0203] A Figura 23 mostra um fluxograma esquemático de um método 4000 para processar um sinal de áudio. O método 4000 compreende uma etapa 4100 compreendendo mudança de fase pelo menos uma porção do sinal de áudio, de modo a obter um sinal de mudança de fase. Uma etapa 4200 compreende filtrar o sinal com desvio de fase com o uso de um filtro passa-alta, de modo a obter um primeiro sinal filtrado. Uma etapa 4300 compreende filtrar o sinal de áudio com o uso de um filtro passa-baixa, de modo a obter um segundo sinal filtrado. Uma etapa 4400 compreende combinar o primeiro sinal filtrado e o segundo sinal filtrado, de modo a obter um sinal de áudio aprimorado. Em outras palavras, a supressão da rugosidade da extensão de largura de banda artificial (ARS) visa reduzir artefatos como o artefato de pico tonal e o artefato de batimento, conforme descrito anteriormente. Como ilustrado na Figura 22, alguns dos métodos ou blocos de ARS também são usados pelo conceito BWE, que já foi descrito anteriormente. Deve-se notar também que esses métodos ou conceitos comuns podem ser usados com diferentes ajustes de parâmetros. Nas seções a seguir, as diferenças entre o aparelho 160 e o aparelho 220 serão descritas. [0204] O analisador de sinal é usado para ativar o ARS na Figura 22, por um lado, detectando se o sinal foi estendido artificialmente ou não pela largura de banda. Por outro lado, uma estimativa em tempo real da frequência inicial (frequência de corte) da extensão de largura de banda artificial pode ser realizada, a qual foi aplicada ao presente sinal. A descrição do sinal analisa se um conceito pode ser realizado de acordo com os outros aspectos aqui descritos. Os resultados do analisador de sinal
Petição 870190097126, de 27/09/2019, pág. 335/383
77/79 são encaminhados para a tabela de consulta 168 para obter uma saída do mesmo, incluindo parâmetros de controle que afetam os módulos mostrados na Figura 22. A tabela de consulta 168 pode compreender ajustes de parâmetros que foram ajustados perceptivamente para várias frequências de início.
[0205] A tabela de consulta para ARS pode ser baseada no mesmo princípio da tabela de consulta BWE descrita em conexão com a Figura 16, com a diferença de que a variável dependente pode ser a estimativa da frequência inicial da BWE. Além disso, os parâmetros controlados podem diferir.
[0206] Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é claro que esses aspectos também representam uma descrição do método correspondente, em que um bloco ou dispositivo corresponde a uma etapa do método ou a um recurso de uma etapa do método. Analogamente, os aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco ou item ou característica correspondente de um aparelho correspondente.
[0207] O sinal de áudio codificado da invenção pode ser armazenado em um meio de armazenamento digital ou pode ser transmitido em um meio de transmissão, como um meio de transmissão sem fio ou um meio de transmissão com fio, como a Internet. [0208] Dependendo de certos requisitos de implantação, as modalidades da invenção podem ser implantadas em hardware ou em software. A implantação pode ser realizada com o uso de um meio de armazenamento digital, por exemplo, um disquete, um DVD, um CD, uma ROM, uma PROM, uma EPROM, uma EEPROM ou uma memória FLASH, com sinais de controle legíveis eletronicamente armazenados nela, os quais cooperam (ou tenham capacidade de cooperar) com um sistema de computador programável, de modo que o método respectivo seja executado.
[0209] Algumas modalidades de acordo com a invenção compreendem um portador de dados com sinais de controle legíveis eletronicamente, que são capazes de cooperar com um sistema de computador programável, de modo que um dos métodos descritos aqui seja realizado.
Petição 870190097126, de 27/09/2019, pág. 336/383
78/79 [0210] Geralmente, as modalidades da presente invenção podem ser implantadas como um produto de programa de computador com um código de programa, sendo o código de programa operacional para executar um dos métodos quando o produto de programa de computador é executado em um computador. O código do programa pode, por exemplo, ser armazenado em um suporte legível por máquina.
[0211] Outras modalidades compreendem o programa de computador para executar um dos métodos descritos neste documento, armazenados em um suporte legível por máquina.
[0212] Em outras palavras, uma modalidade do método inventivo é, portanto, um programa de computador com um código de programa para executar um dos métodos descritos neste documento, quando o programa de computador é executado em um computador.
[0213] Uma modalidade adicional dos métodos inventivos é, portanto, um suporte de dados (ou um meio de armazenamento digital ou um meio legível por computador) compreendendo, gravado nele, o programa de computador para executar um dos métodos aqui descritos.
[0214] Uma modalidade adicional do método inventivo é, portanto, um fluxo de dados ou uma sequência de sinais representando o programa de computador para executar um dos métodos aqui descritos. O fluxo de dados ou a sequência de sinais pode, por exemplo, ser configurado para ser transferido através de uma conexão de comunicação de dados, por exemplo, através da Internet.
[0215] Uma modalidade adicional compreende um meio de processamento, por exemplo, um computador ou um dispositivo lógico programável, configurado ou adaptado para executar um dos métodos aqui descritos.
[0216] Uma modalidade adicional compreende um computador tendo instalado nele o programa de computador para executar um dos métodos aqui descritos.
[0217] Em algumas modalidades, um dispositivo lógico programável (por exemplo, uma matriz de portas programável em campo) pode ser usado para executar algumas ou todas as funcionalidades dos métodos aqui descritos. Em algumas modalidades,
Petição 870190097126, de 27/09/2019, pág. 337/383
79/79 uma matriz de portas programável em campo pode cooperar com um microprocessador para executar um dos métodos descritos aqui. Geralmente, os métodos são preferencialmente realizados por qualquer aparelho de hardware.
[0218] As modalidades descritas acima são meramente ilustrativas para os princípios da presente invenção. Entende-se que modificações e variações dos arranjos e os detalhes aqui descritos serão evidentes para outros especialistas na técnica. É intenção, portanto, limitar-se apenas ao escopo das reivindicações iminentes de patentes e não aos detalhes específicos apresentados por meio de descrição e explicação das modalidades aqui apresentadas.
REFERÊNCIAS [1] M. Arora, J. Lee e S. Park, “High quality blind bandwidth extension of audio for portable player applications,” em Proc, of the AES 120th Conv, 2006.
[2] Markus Erne, “Perceptual audio coders ’’what to listen for?”,” em Audio Engineering Society Convention 111, nov de 2001.
[3] Chia-Ming Chang, Han-Wen Hsu, Kan-Chun Lee, Wen-Chieh Lee, ChiMin Liu, Shou-Hung Tang, Chung-Han Yang e Yung-Cheng Yang, “Compression artifacts in perceptual audio coding,” emudio Engineering Society Convention 121, out de 2006.
[4] Martin Dietz, Lars Liljeryd, Kristofer Kjõrling e Oliver Kunz, “Spectral band replication, a novel approach in audio coding,” em Audio Engineering Society Convention 112, abr de 2002.
[5] Sascha Disch, Andreas Niedermeier, Christian R. Helmrich, Christian Neukam, Konstantin Schmidt, Ralf Geiger, Jeremie Lecomte, Florin Ghido, Frederik Nagel e Bernd Edler, “Intelligent gap filling in perceptual transform coding of audio,” em Audio Engineering Society Convention 141, set de 2016.

Claims (18)

  1. REIVINDICAÇÕES
    1. Aparelho para processar um sinal de áudio, em que o aparelho é caracterizado por compreender:
    um separador (92) para separar uma primeira porção (9Ta) de um espectro (91’) do sinal de áudio (91) de uma segunda porção (91 ’b) do espectro (91’) do sinal de áudio (91), em que a primeira porção (91’a) tem uma primeira característica de sinal e a segunda porção (91 ’b) tem uma segunda característica de sinal;
    um primeiro extensor de largura de banda (94i) para estender uma largura de banda da primeira porção (91 ’b) com o uso dos primeiros parâmetros (96 1) associados à primeira característica do sinal, para obter uma primeira porção estendida (98a, 126a);
    um segundo extensor de largura de banda (94 2) para estender uma largura de banda da segunda porção (91 ’b) com 0 uso dos segundos parâmetros (962) associados à segunda característica do sinal, para obter uma segunda porção estendida (98b, 126b); e um combinador (102) configurado para usar a primeira porção estendida (98a) e a segunda porção estendida (98b) para obter um sinal de áudio combinado estendido (104).
  2. 2. Aparelho, de acordo com a reivindicação 1, caracterizado por 0 primeiro extensor de largura de banda (94i) ser configurado para estender a largura de banda da primeira porção (91 ’a) adicionando componentes espectrais (w) à primeira porção (91’a), em que 0 segundo 0 extensor de largura de banda (942) é configurado para estender a largura de banda da segunda porção (91 ’b) adicionando componentes espectrais (w) à segunda porção (91 ’b).
  3. 3. Aparelho, de acordo com a reivindicação 1 ou 2, caracterizado por 0 primeiro extensor de largura de banda (94i) compreender um primeiro duplicador (114i) para duplicar pelo menos uma parte (w, 128) da primeira porção (91’a) e para combinar pelo menos uma versão (w) da parte duplicada
    Petição 870190097126, de 27/09/2019, pág. 339/383
    2/6 (w, 117) da primeira porção com a primeira porção (91’a), de modo a obter uma porção estendida (126a); e em que o segundo extensor de largura de banda (942) compreende um segundo duplicador (114 2) para duplicar pelo menos uma parte (w, 129) da segunda porção (91’b) e para combinar pelo menos uma versão da parte duplicada (w, 128) da segunda porção com a segunda porção (91’b), de modo a obter uma porção estendida (126b).
  4. 4. Aparelho, de acordo com a reivindicação 3, caracterizado por a parte (w, 128) da primeira porção compreender uma primeira faixa de frequência (Afw) que varia de uma primeira frequência intermediária (fcópia) da primeira porção a uma frequência máxima (fc) da primeira porção; e em que a parte (w, 128) da segunda porção compreende uma segunda faixa de frequência (Afw) que varia de uma segunda frequência intermediária (fcópia) da segunda porção (91’b) a uma frequência máxima (fc) da segunda porção.
  5. 5. Aparelho, de acordo com a reivindicação 4 ou 5, caracterizado por o primeiro extensor de largura de banda (94i) compreender um primeiro modelador de envelope para moldar pelo menos a parte duplicada (w, 128) da primeira porção estendida e em que o segundo extensor de largura de banda (94 2) compreende um segundo modelador de envelope (1162) para modelar pelo menos a parte dedicada da segunda porção estendida (126b).
  6. 6 Aparelho, de acordo com qualquer uma das reivindicações 1 a 5, caracterizado por 0 primeiro extensor de largura de banda (94i) compreender um primeiro branqueador (1181) para equalizer pelo menos a parte duplicada (w, 128) da primeira porção estendida (126a) e em que a segunda largura de banda 0 extensor (94 2) compreende um segundo branqueador (1182) para equalizer pelo menos a parte duplicada (w, 128) da segunda porção estendida (126b).
  7. 7. Aparelho, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado por 0 primeiro extensor de largura de banda (94i) compreender um primeiro filtro antirrugosidade (94, 122i) para deslocamento de fase pelo
    Petição 870190097126, de 27/09/2019, pág. 340/383
    3/6 menos uma porção da primeira porção estendida (126a) e em que a segunda largura de banda o extensor (942) compreende um segundo filtro antirrugosidade (1222) para deslocamento de fase pelo menos uma porção da segunda porção estendida (126b).
  8. 8. Aparelho, de acordo com a reivindicação 7, caracterizado por o primeiro filtro antirrugosidade (122i) ser configurado para deslocamento de fase da primeira porção estendida (w, 128) ou um sinal derivado do mesmo, de modo a obter um sinal de deslocamento de primeira fase; e em que o segundo filtro antirrugosidade (1222) é configurado para deslocamento de fase da segunda porção estendida (w, 128) ou um sinal derivado do mesmo, de modo a obter um sinal deslocado da segunda fase.
  9. 9. Aparelho, de acordo com a reivindicação 7 ou 8, caracterizado por o primeiro filtro antirrugosidade (122i) ser configurado para aplicar uma primeira mudança de fase e em que o segundo filtro antirrugosidade (1222) é configurado para aplicar uma segunda mudança de fase.
  10. 10. Aparelho de acordo com qualquer uma das reivindicações 1 a 9, caracterizado por a primeira característica do sinal ser uma dentre
    a) uma faixa de frequência média do espectro;
    b) um sinal direto característico do sinal de áudio;
    c) uma característica tonal do sinal de áudio; e
    d) uma característica de fala do sinal de áudio e em que a segunda característica do sinal é:
    a) faixa de frequência lateral do espectro;
    b) um sinal ambiental característico do sinal de áudio;
    c) um sinal sustentado característico do sinal de áudio; e
    d) uma característica de não fala do sinal de áudio.
  11. 11. Aparelho, de acordo com qualquer uma das reivindicações 1 a 10, caracterizado por o sinal de áudio (91) compreender uma pluralidade de quadros e em que o aparelho compreende um analisador de sinal (166) configurado para analisar, para cada quadro, o espectro (91’) do sinal de áudio
    Petição 870190097126, de 27/09/2019, pág. 341/383
    4/6 (91) para uma característica relacionada a uma limitação artificial da largura de banda do sinal de áudio (91) e para determinar uma frequência de corte (fc) no sinal de áudio;
    em que o aparelho é configurado para usar o primeiro e o segundo parâmetros (96i, 96¾ para uma estrutura que tem a característica relativa a uma limitação da largura de banda artificial; e em que o aparelho é configurado para o uso de terceiros parâmetros para o primeiro extensor de largura de banda (94i) e quartos parâmetros para o segundo extensor de largura de banda (942) para quadros com uma característica diferente da característica relacionada a uma limitação artificial da largura de banda; ou desativar o primeiro e o segundo extensor de largura de banda (94i, 942) para os quadros que têm uma característica diferente da característica relativa a uma limitação artificial da largura de banda.
  12. 12. Aparelho, de acordo com qualquer uma das reivindicações 1 a 11, em que o aparelho é caracterizado por compreender uma tabela de consulta (168) que compreende uma pluralidade de primeiros parâmetros (p, 96) associados a uma pluralidade correspondente de parâmetros de modificação de sinal (fi-Í4, fc) e uma pluralidade de segundos parâmetros (p, 962) associado a uma pluralidade correspondente de parâmetros de modificação de sinal (fi-Í4, fc); em que 0 aparelho compreende um analisador de sinal (166) para analisar 0 espectro (91’) para uma modificação aplicada ao sinal de áudio (91); em que 0 aparelho é configurado para derivar um parâmetro de modificação (fi-Í4, fc) associado à modificação; e para derivar 0 primeiro parâmetro (96i) e 0 segundo parâmetro (96 2) usando a tabela de consulta (168) e usando 0 parâmetro de modificação (fi-Í4, fc).
  13. 13. Aparelho, de acordo com qualquer uma das reivindicações 1 a 12, caracterizado por 0 separador (92) compreender:
    um supressor de transientes (108) configurado para receber 0 sinal de áudio (91 ’) e para reduzir porções transitórias no sinal de áudio (91), de modo a obter um primeiro sinal de áudio modificado, em que 0 separador (92) é
    Petição 870190097126, de 27/09/2019, pág. 342/383
    5/6 configurado para obter o primeiro porção (91’a) com base no primeiro sinal de áudio modificado;
    um subtrator (112) para subtrair o primeiro sinal de áudio modificado do sinal de áudio (9T) de modo a obter um segundo sinal modificado (91’b), em que o separador (92) é configurado para obter a segunda porção (91 ’b) com base no segundo sinal de áudio modificado.
  14. 14. Aparelho, de acordo com qualquer uma das reivindicações 1 a 13, caracterizado por o combinador (102) ser um primeiro combinador, em que o aparelho compreende:
    um filtro passa-alta (152) para filtrar a primeira porção estendida (98'a) e a segunda porção estendida (98'b) ou para filtrar o sinal de áudio combinado (104) de modo que um sinal de áudio combinado filtrado (154) seja obtido;
    um filtro passa-baixa (158) para filtrar o sinal de áudio (91) de modo a obter um sinal de áudio filtrado; e um segundo combinador (162) configurado para combinar o sinal de áudio combinado filtrado (154) e o sinal de áudio filtrado para obter um sinal de áudio estendido de largura de banda (164).
  15. 15. Aparelho (210) para processar um sinal de áudio (12), em que o aparelho é caracterizado por compreender:
    um filtro antirrugosidade (122) para deslocamento de fase pelo menos uma porção do sinal de áudio (12), de modo a obter um sinal de deslocamento de fase (172);
    um filtro passa-alta (152) configurado para filtrar o sinal de mudança de fase (172) de modo a obter um primeiro sinal filtrado (174);
    um filtro passa-baixa (158) configurado para filtrar o sinal de áudio (12) de modo a obter um segundo sinal filtrado (176);
    um combinador (162) configurado para combinar o primeiro sinal filtrado (174) e o segundo sinal filtrado (176) de modo a obter um sinal de áudio aprimorado (178).
    Petição 870190097126, de 27/09/2019, pág. 343/383
    6/6
  16. 16. Método (3000) para processar um sinal de áudio, em que o método é caracterizado por compreender:
    separar (3100) uma primeira porção de um espectro do sinal de áudio de uma segunda porção do espectro do sinal de áudio, em que a primeira porção tem uma primeira característica de sinal e a segunda porção tem uma segunda característica de sinal;
    estender (3200) uma largura de banda da primeira porção com o uso dos primeiros parâmetros associados à primeira característica do sinal, para obter uma primeira porção estendida;
    estender (3300) uma largura de banda da segunda porção com o uso dos segundos parâmetros associados à segunda característica do sinal, para obter uma segunda porção estendida; e usar (3400) a primeira porção estendida e a segunda porção estendida para obter um sinal de áudio combinado estendido.
  17. 17. Método (4000) para processar um sinal de áudio, em que o método é caracterizado por compreender:
    deslocamento de fase (4100) de pelo menos uma porção do sinal de áudio, de modo a obter um sinal de deslocamento de fase;
    filtrar (4200) o sinal de mudança de fase com o uso de um filtro passaalta, de modo a obter um primeiro sinal filtrado;
    filtrar (4300) o sinal de áudio com o uso de um filtro passa-baixa, de modo a obter um segundo sinal filtrado;
    combinar (4400) o primeiro sinal filtrado e o segundo sinal filtrado, de modo a obter um sinal de áudio aprimorado.
  18. 18. Meio de armazenamento não transitório caracterizado por ter armazenado no mesmo um programa de computador com um código de programa para realizar, durante execução em um computador, um método, de acordo com a reivindicação 16 ou 17.
BR112019020357A 2017-03-31 2018-03-29 aparelho e método para processar um sinal de áudio e meio de armazenamento não transitório BR112019020357A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17164360 2017-03-31
EP17189999.0A EP3382703A1 (en) 2017-03-31 2017-09-07 Apparatus and methods for processing an audio signal
PCT/EP2018/025082 WO2018177611A1 (en) 2017-03-31 2018-03-29 Apparatus and methods for processing an audio signal

Publications (1)

Publication Number Publication Date
BR112019020357A2 true BR112019020357A2 (pt) 2020-04-28

Family

ID=58632740

Family Applications (3)

Application Number Title Priority Date Filing Date
BR112019020523A BR112019020523A2 (pt) 2017-03-31 2018-03-29 aparelho e método para determinar uma característica predeterminada relacionada a um processamento de aprimoramento espectral de um sinal de áudio e mídia de armazenamento não transitória
BR112019020578A BR112019020578A2 (pt) 2017-03-31 2018-03-29 aparelho e método para determinar uma característica predeterminada indicando que um sinal de áudio foi submetido a um processamento artificial de limitação de largura de banda e meio de armazenamento não transitório
BR112019020357A BR112019020357A2 (pt) 2017-03-31 2018-03-29 aparelho e método para processar um sinal de áudio e meio de armazenamento não transitório

Family Applications Before (2)

Application Number Title Priority Date Filing Date
BR112019020523A BR112019020523A2 (pt) 2017-03-31 2018-03-29 aparelho e método para determinar uma característica predeterminada relacionada a um processamento de aprimoramento espectral de um sinal de áudio e mídia de armazenamento não transitória
BR112019020578A BR112019020578A2 (pt) 2017-03-31 2018-03-29 aparelho e método para determinar uma característica predeterminada indicando que um sinal de áudio foi submetido a um processamento artificial de limitação de largura de banda e meio de armazenamento não transitório

Country Status (13)

Country Link
US (3) US20200020347A1 (pt)
EP (6) EP3382704A1 (pt)
JP (4) JP6968191B2 (pt)
KR (3) KR102517285B1 (pt)
CN (3) CN110870007B (pt)
AU (4) AU2018246838A1 (pt)
BR (3) BR112019020523A2 (pt)
CA (3) CA3058353C (pt)
ES (3) ES2933500T3 (pt)
MX (3) MX2019011519A (pt)
PL (3) PL3602553T3 (pt)
RU (3) RU2733533C1 (pt)
WO (3) WO2018177611A1 (pt)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220375485A1 (en) * 2019-09-24 2022-11-24 Sony Group Corporation Signal processing apparatus, signal processing method, and program
CN112927710B (zh) * 2021-01-21 2021-10-26 安徽南瑞继远电网技术有限公司 一种基于无监督方式的电力变压器工况噪声分离方法
CN113299313B (zh) * 2021-01-28 2024-03-26 维沃移动通信有限公司 音频处理方法、装置及电子设备
CN115512711A (zh) * 2021-06-22 2022-12-23 腾讯科技(深圳)有限公司 语音编码、语音解码方法、装置、计算机设备和存储介质
CN114070679B (zh) * 2021-10-25 2023-05-23 中国电子科技集团公司第二十九研究所 一种面向脉冲智能分类的频相特征分析方法

Family Cites Families (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4230414B2 (ja) * 1997-12-08 2009-02-25 三菱電機株式会社 音信号加工方法及び音信号加工装置
US7272551B2 (en) * 2003-02-24 2007-09-18 International Business Machines Corporation Computational effectiveness enhancement of frequency domain pitch estimators
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
KR100552693B1 (ko) * 2003-10-25 2006-02-20 삼성전자주식회사 피치검출방법 및 장치
EP2273494A3 (en) * 2004-09-17 2012-11-14 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus
EP1638083B1 (en) * 2004-09-17 2009-04-22 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited audio signals
CN101273404B (zh) * 2005-09-30 2012-07-04 松下电器产业株式会社 语音编码装置以及语音编码方法
US8073704B2 (en) * 2006-01-24 2011-12-06 Panasonic Corporation Conversion device
US8798172B2 (en) 2006-05-16 2014-08-05 Samsung Electronics Co., Ltd. Method and apparatus to conceal error in decoded audio signal
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US7881459B2 (en) * 2007-08-15 2011-02-01 Motorola, Inc. Acoustic echo canceller using multi-band nonlinear processing
CN101939782B (zh) * 2007-08-27 2012-12-05 爱立信电话股份有限公司 噪声填充与带宽扩展之间的自适应过渡频率
DE102007048973B4 (de) * 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
US8005233B2 (en) * 2007-12-10 2011-08-23 Dts, Inc. Bass enhancement for audio
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
US8433582B2 (en) 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
KR101518532B1 (ko) * 2008-07-11 2015-05-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더, 오디오 신호, 오디오 스트림을 부호화 및 복호화하는 장치 및 컴퓨터 프로그램
RU2443028C2 (ru) * 2008-07-11 2012-02-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Устройство и способ расчета параметров расширения полосы пропускания посредством управления фреймами наклона спектра
ATE539433T1 (de) * 2008-07-11 2012-01-15 Fraunhofer Ges Forschung Bereitstellen eines zeitverzerrungsaktivierungssignals und codierung eines audiosignals damit
EP2154911A1 (en) 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
EP4224474B1 (en) 2008-12-15 2023-11-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio bandwidth extension decoder, corresponding method and computer program
EP2214165A3 (en) * 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
JP4945586B2 (ja) * 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
US8515768B2 (en) * 2009-08-31 2013-08-20 Apple Inc. Enhanced audio decoder
JP5493655B2 (ja) * 2009-09-29 2014-05-14 沖電気工業株式会社 音声帯域拡張装置および音声帯域拡張プログラム
US8447617B2 (en) * 2009-12-21 2013-05-21 Mindspeed Technologies, Inc. Method and system for speech bandwidth extension
TWI444989B (zh) * 2010-01-22 2014-07-11 Dolby Lab Licensing Corp 針對改良多通道上混使用多通道解相關之技術
AU2016204672B2 (en) 2010-07-02 2016-08-18 Dolby International Ab Audio encoder and decoder with multiple coding modes
SG187950A1 (en) * 2010-08-25 2013-03-28 Fraunhofer Ges Forschung Apparatus for generating a decorrelated signal using transmitted phase information
CN103339670B (zh) * 2011-02-03 2015-09-09 瑞典爱立信有限公司 确定多通道音频信号的通道间时间差
CA2827249C (en) * 2011-02-14 2016-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
WO2012119140A2 (en) * 2011-03-03 2012-09-07 Edwards Tyson Lavar System for autononous detection and separation of common elements within data, and methods and devices associated therewith
US9117440B2 (en) 2011-05-19 2015-08-25 Dolby International Ab Method, apparatus, and medium for detecting frequency extension coding in the coding history of an audio signal
WO2012158705A1 (en) * 2011-05-19 2012-11-22 Dolby Laboratories Licensing Corporation Adaptive audio processing based on forensic detection of media processing history
EP2544465A1 (en) * 2011-07-05 2013-01-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral weights generator
US9390721B2 (en) 2012-01-20 2016-07-12 Panasonic Intellectual Property Corporation Of America Speech decoding device and speech decoding method
US9685921B2 (en) * 2012-07-12 2017-06-20 Dts, Inc. Loudness control with noise detection and loudness drop detection
ES2549953T3 (es) 2012-08-27 2015-11-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada
EP2709106A1 (en) * 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
EP3067890B1 (en) * 2013-01-29 2018-01-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
US9601125B2 (en) * 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment
US10424321B1 (en) * 2013-02-12 2019-09-24 Google Llc Audio data classification
CA2964368C (en) * 2013-06-21 2020-03-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Jitter buffer control, audio decoder, method and computer program
FR3007563A1 (fr) * 2013-06-25 2014-12-26 France Telecom Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
EP2830065A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
JP6186503B2 (ja) * 2013-10-03 2017-08-23 ドルビー ラボラトリーズ ライセンシング コーポレイション アップミキサーにおける適応的な拡散性信号生成
WO2015105775A1 (en) * 2014-01-07 2015-07-16 Harman International Industries, Incorporated Signal quality-based enhancement and compensation of compressed audio signals
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
US9564141B2 (en) * 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
EP2980795A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
JP6668372B2 (ja) * 2015-02-26 2020-03-18 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 目標時間領域エンベロープを用いて処理されたオーディオ信号を得るためにオーディオ信号を処理するための装置および方法
US9741360B1 (en) * 2016-10-09 2017-08-22 Spectimbre Inc. Speech enhancement for target speakers
US20190051286A1 (en) 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications

Also Published As

Publication number Publication date
CA3057739A1 (en) 2018-10-04
AU2021203677B2 (en) 2022-10-13
EP3602552A1 (en) 2020-02-05
MX2019011515A (es) 2019-12-19
KR20190134708A (ko) 2019-12-04
EP3382703A1 (en) 2018-10-03
US20200027474A1 (en) 2020-01-23
JP2022097514A (ja) 2022-06-30
KR20190134707A (ko) 2019-12-04
KR102426636B1 (ko) 2022-07-29
CA3058353C (en) 2023-03-07
RU2733278C1 (ru) 2020-10-01
KR102563915B1 (ko) 2023-08-04
EP3602553B1 (en) 2022-04-27
JP2020512593A (ja) 2020-04-23
KR20190134709A (ko) 2019-12-04
AU2018246837B2 (en) 2020-12-24
MX2019011519A (es) 2019-12-19
MX2019011522A (es) 2019-12-19
RU2733533C1 (ru) 2020-10-05
AU2018246838A1 (en) 2019-10-24
BR112019020523A2 (pt) 2020-05-05
US11170794B2 (en) 2021-11-09
JP6968191B2 (ja) 2021-11-17
EP3602555B1 (en) 2022-10-12
PL3602553T3 (pl) 2022-08-22
CN110870007B (zh) 2023-10-13
JP2020512591A (ja) 2020-04-23
WO2018177612A1 (en) 2018-10-04
US20200020346A1 (en) 2020-01-16
ES2923098T3 (es) 2022-09-23
EP3382702A1 (en) 2018-10-03
JP7059301B2 (ja) 2022-04-25
CN110914902A (zh) 2020-03-24
AU2018241963A1 (en) 2019-10-24
KR102517285B1 (ko) 2023-04-03
AU2018241963B2 (en) 2021-08-12
AU2021203677A1 (en) 2021-07-01
CN110832582B (zh) 2023-10-24
CN110832582A (zh) 2020-02-21
WO2018177611A1 (en) 2018-10-04
PL3602552T3 (pl) 2022-11-21
WO2018177610A1 (en) 2018-10-04
EP3602553A1 (en) 2020-02-05
EP3602552B1 (en) 2022-07-20
ES2927808T3 (es) 2022-11-11
EP3602555B8 (en) 2023-06-14
BR112019020578A2 (pt) 2020-05-19
JP7455890B2 (ja) 2024-03-26
US20200020347A1 (en) 2020-01-16
JP6896881B2 (ja) 2021-06-30
AU2018246837A1 (en) 2019-10-17
JP2020512594A (ja) 2020-04-23
PL3602555T3 (pl) 2023-05-08
CA3057897C (en) 2022-05-17
EP3382704A1 (en) 2018-10-03
CA3058353A1 (en) 2018-10-04
EP3602553B8 (en) 2022-11-02
CA3057897A1 (en) 2018-10-04
CN110914902B (zh) 2023-10-03
RU2719543C1 (ru) 2020-04-21
ES2933500T3 (es) 2023-02-09
CN110870007A (zh) 2020-03-06
EP3602555A1 (en) 2020-02-05

Similar Documents

Publication Publication Date Title
BR112019020357A2 (pt) aparelho e método para processar um sinal de áudio e meio de armazenamento não transitório

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]
B06W Patent application suspended after preliminary examination (for patents with searches from other patent authorities) chapter 6.23 patent gazette]