BR122019023684B1 - sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta - Google Patents

sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta Download PDF

Info

Publication number
BR122019023684B1
BR122019023684B1 BR122019023684A BR122019023684A BR122019023684B1 BR 122019023684 B1 BR122019023684 B1 BR 122019023684B1 BR 122019023684 A BR122019023684 A BR 122019023684A BR 122019023684 A BR122019023684 A BR 122019023684A BR 122019023684 B1 BR122019023684 B1 BR 122019023684B1
Authority
BR
Brazil
Prior art keywords
subband
signal
analysis
synthesis
index
Prior art date
Application number
BR122019023684A
Other languages
English (en)
Inventor
Villemoes Lars
Hedelin Per
Original Assignee
Dolby Int Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Int Ab filed Critical Dolby Int Ab
Publication of BR122019023684B1 publication Critical patent/BR122019023684B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Auxiliary Devices For Music (AREA)
  • Carbon And Carbon Compounds (AREA)
  • Fats And Perfumes (AREA)
  • Superconductors And Manufacturing Methods Therefor (AREA)

Abstract

a presente invenção refere-se a sistemas de codificação de áudio que fazem uso de uma transposição harmônica método para reconstrução de alta frequência (hfr). descreve-se um sistema e um método que servem para gerar um componente de frequência alta de um sinal a partir de um componente de frequência baixa do sinal. o sistema compreende um banco de filtro de análise que proporciona uma pluralidade de sinais de sub-banda de análise do componente de frequência baixa do sinal. o mesmo compreende, também, uma unidade de processamento não linear para gerar um sinal de sub-banda de síntese com uma frequência de síntese modificando-se a fase de um primeiro e um segundo sinal entre a pluralidade de sinais de sub-banda de análise e combinando-se os sinais de sub-banda de análise modificados por fase. finalmente, este compreende um banco de filtro de síntese que serve para gerar o componente de frequência alta do sinal a partir do sinal de sub-banda de síntese.

Description

Relatório Descritivo da Patente de Invenção para SISTEMA PARA GERAR UM COMPONENTE DE FREQUÊNCIA ALTA DE UM SINAL DE ÁUDIO E MÉTODO PARA REALIZAR RECONSTRUÇÃO DE FREQUÊNCIA ALTA DE UM COMPONENTE DE FREQUÊNCIA ALTA. CAMPO DA TÉCNICA
Dividido do PI1007050-8 depositado em 15 de janeiro de 2010.
[0001] A presente invenção refere-se a sistemas de codificação de áudio que fazem uso de um método de transposição harmônica para reconstrução de alta frequência (HFR).
ANTECEDENTES DA INVENÇÃO [0002] As tecnologias HFR, tal como a tecnologia de Replicação de Banda Espectral (SBR), permitem um aperfeiçoamento significativo da eficiência de codificação de codecs de áudio perceptivos tradicionais. Em combinação com a Codificação de Áudio Avançada MPEG-4 (AAC) estas formam um codec de áudio bastante eficiente, que já se encontra em uso no XM Satellite Radio e Digital Radio Mondiale. A combinação de AAC e SBR é denominada como aacPlus. Esta faz parte do padrão MPEG-4 onde é referida como o Perfil AAC de Alta Eficiência. Em geral, a tecnologia HFR pode ser combinada com qualquer codec de áudio perceptive de modo compatível para trás e para frente, oferecendo, assim, a possibilidade de atualização dos sistemas de radiodifusão já estabelecidos, como o MPEG Layer-2 usado no sistema Eureka DAB. Os métodos de transposição HFR também podem ser combinados com codecs de fala de modo a permitir sinais de fala de banda larga em taxas de bits ultrabaixas.
[0003] A ideia básica por trás do HRF é a observação que geralmente uma correlação forte entre as características da faixa de frequências altas de um sinal e as características da faixa de frequências baixas do mesmo sinal está presente. Portanto, uma boa aproximação para a representação da faixa de frequências altas de entrada originais de um sinal pode ser obtida por uma transposição de sinal a partir da faixa de frequências baixas para a faixa de frequências altas.
[0004] Este conceito de transposição foi estabelecido no documento
Petição 870190115842, de 11/11/2019, pág. 30/87
2/52
WO 98/57436, como um método para recriar uma banda de alta frequência a partir de uma banda de frequência inferior de um sinal áudio. Uma economia substancial em taxa de bits pode ser obtida utilizando-se este conceito na codificação de áudio e/ou na codificação de fala. A seguir, será feita referência à codificação de áudio, porém, deve-se notar que os métodos e sistemas descritos são igualmente aplicáveis à codificação de fala e em codificação unificada de fala e áudio (USAC).
[0005] Em um sistema de codificação de áudio baseado em HFR, um sinal de largura de banda baixa é apresentado a um codificador de forma de onda de núcleo e as frequências maiores são regeneradas ao lado do decodificador utilizando-se a transposição do sinal de largura de banda baixa e informações secundárias adicionais, que são tipicamente codificadas em taxas de bits muito baixas e que descrevem o formato espectral de destino. Para taxas de bits baixas, onde a largura de banda do sinal codificado de núcleo é estreita, se torna progressivamente importante recriar uma banda alta, isto é, a faixa de frequências altas do sinal de áudio, com características perceptivamente agradáveis. Duas variantes de métodos de reconstrução de frequência harmônica são mencionadas a seguir, uma é referida como transposição harmônica e a outra é referida como modulação de banda lateral única.
[0006] O princípio de transposição harmônica definido no documento WO 98/57436 é que uma senoide com frequência ω é mapeada a uma senoide com frequência Τω onde 7>1 é um número inteiro que define a ordem da transposição. Um recurso atraente da transposição harmônica é que a mesma estica uma faixa de frequências de origem em uma faixa de frequências de destino por um fator igual à ordem de transposição, isto é, por um fator igual a T. A transposição harmônica funciona bem para materiais musicais complexos. Além disso, a transposição harmônica exibe baixas frequências de cruzamento, isto é, uma grande faixa de frequências altas maior que a frequência de cruzamento pode ser gerada a partir de uma faixa de frequências baixas relativamente pequena menor que a frequência de cruzamento.
Petição 870190115842, de 11/11/2019, pág. 31/87
3/52 [0007] Contrariamente à transposição harmônica, uma modulação de banda lateral única (SSB) baseada em HFR mapeia uma senoide com frequência ω a uma senoide com frequência 0+Δ0 onde Δο é um deslocamento fixo de frequência. Observou-se que, dado um sinal de núcleo com baixa largura de banda, um instrumento de anelamento dissonante pode resultar a partir da transposição SSB. Deve-se notar que para uma frequência de cruzamento baixa, isto é, uma faixa de frequências de origem pequena, a transposição harmônica irá requere um número menor de patches com a finalidade de satisfazer uma faixa de frequências de destino desejada em relação à transposição baseada em SSB. A título de exemplo, se a faixa de frequências altas de (o, 4o] precisar ser satisfeita, então, utilizar uma ordem de transposição 7=4, uma transposição harmônica que possa satisfazer esta faixa de frequências a partir de uma faixa de frequências baixas de (| ω,ω\. Por outro lado, uma transposição baseada em SSB que utiliza a mesma faixa de frequências baixas deve utilizar um deslocamento de frequência de = -0 e e necessário repetir o processo quatro vezes com a finalidade de satisfazer a faixa de frequências altas (o,4o], [0008] Por outro lado, conforme já descrito no documento WO 02/052545 Al, a transposição harmônica apresenta desvantagens para sinais com uma estrutura periódica proeminente. Esses sinais são sobreposições de senoides harmonicamente relacionadas com frequências Ω,2Ω,3Ω, ..., onde Ω é a frequência fundamental.
[0009] Mediante uma transposição harmônica de ordem 7, as senoides de saída têm frequências 7Ω,27Ω,37Ω,..., que, no caso de 7 >1, consistem apenas em um subconjunto estrito da série harmônica completa desejada. Em termos da qualidade resultante de áudio, um timbre fantasma correspondente à frequência fundamental transposta 7Ω será tipicamente percebida. Geralmente, a transposição harmônica resulta em um caractere sonoro metálico do sinal de áudio codificado e decodificado. A situação pode ser aliviada até um determinado grau adicionando-se várias ordens de transposição 7=2,3, ..., Tmax ao HFR, porém, este método é computacionalmente complexo se a maioria dos intervalos espectrais precisar ser evitada.
Petição 870190115842, de 11/11/2019, pág. 32/87
4/52 [0010] Uma solução alternativa para evitar a aparência de timbres fantasmas ao se utilizar a transposição harmônica foi apresentada no documento WO 02/052545 Al. A solução consiste em utilizar dois tipos de transposição, isto é, uma transposição harmônica típica e uma transposição de pulso especial. O método descrito ensina a comutar à transposição de pulso dedicada para partes do sinal de áudio que são detectadas como sendo periódicas com um caractere tipo sequência de pulsos. O problema desta abordagem é que a aplicação de transposição de pulso em um material musical complexo geralmente degrada a qualidade comparada à transposição harmônica baseada em um banco de filtro com alta resolução. Portanto, os mecanismos de detecção precisam ser afinados, em vez de serem conservados, de tal modo que a transposição de pulso não seja usada para material complexo. Inevitavelmente, os instrumentos e vozes de timbre único algumas vezes serão classificados como sinais complexos, executando, deste modo, uma transposição harmônica e, portanto, perdendo harmônicas. Ademais, se ocorrer uma comutação na parte intermediária de um sinal de timbre único, ou um sinal com um timbre dominante em um plano de fundo complexo mais fraco, a própria comutação entre os dois métodos de transposição tendo propriedades de satisfação espectral bastante diferentes gerará instrumentos audíveis.
SUMÁRIO DA INVENÇÃO [0011] A presente invenção proporciona um método e um sistema para completar a série harmônica resultando a partir da transposição harmônica de um sinal periódico. A transposição de domínio de frequência compreende a etapa de mapear não linearmente os sinais de sub-banda modificados a partir de um banco de filtro de análise em sub-bandas selecionadas de um banco de filtro de síntese. A modificação não linear compreende uma modificação de fase ou uma rotação de fase que, em um domínio de banco de filtro complexo, pode ser obtida por uma lei de potência seguida por um ajuste de magnitude.
[0012] Considerando que a transposição da técnica anterior modifica uma sub-banda de análise em um tempo separadamente, a presente inven
Petição 870190115842, de 11/11/2019, pág. 33/87
5/52 ção ensina adicionar uma combinação não linear de pelo menos duas subbandas de análise diferentes para cada sub-banda de síntese. O espaçamento entre as sub-bandas de análise a serem combinadas pode ser relacionado à frequência fundamental de um componente dominante do sinal a ser transposto.
[0013] Em sua forma mais geral, a descrição matemática da invenção é que se utiliza um conjunto de componentes de frequência 01, 02, ..., ωκ para criar um novo componente de frequência = 7Ί 0)1 + T202 + ... + Tko)k, onde os coeficientes Τι,Τς Tk são ordens de transposição inteiras cuja soma é a ordem de transposição total T =T\ +T2 + ...,+Tk. Este efeito é obtido modificando-se as fases de K sinais de sub-banda adequadamente escolhidos pelos fatores Ti,T2..., Τκ& recombinando-se o resultado em um sinal com fase igual à soma das fases modificadas. É importante notar que todas essas operações de fase são bem definidas e não ambíguas visto que as ordens de transposição individuais são números inteiros, e que alguns desses inteiros podem ser negativos desde que a ordem de transposição total satisfaça T > 1.
[0014] Os métodos da técnica anterior correspondem ao caso K =1, e a invenção atual ensina como utilizar K > 2. O texto descritivo trata principalmente o caso K = 2, T> 2 como se fosse suficiente para solucionar a maioria dos problemas específicos à mão. Porém, deve-se notar que os casos K> 2 são considerados como sendo igualmente descritos e abrangidos pelo presente documento.
[0015] A invenção utiliza informações provenientes em um número maior de canais analíticos de banda de frequência baixa, isto é, um número maior de sinais de sub-banda de análise, com o intuito de mapear os sinais de sub-banda não linearmente modificados a partir de um banco de filtro de análise em sub-bandas selecionadas de um banco de filtro de síntese. A transposição não modifica apenas uma sub-banda em um momento separadamente, porém, adiciona uma combinação não linear de pelo menos duas sub-bandas de análise diferentes para cada sub-banda de análise. Conforme
Petição 870190115842, de 11/11/2019, pág. 34/87
6/52 mencionado anteriormente, a transposição harmônica de ordem T é designada para mapear uma senoide de frequência ω a uma senoide com frequência Τω, sendo T > 1. De acordo com a invenção, um suposto aprimoramento de produto cruzado com parâmetro de timbre Ω e um índice 0 < r < T é designado para mapear um par de senoides com frequências (0,0+Ω) a uma senoide com frequência (T-r)o + γ(ο+Ω) = Τω + /Ώ. Deve-se avaliar que para tais transposições de produtos cruzados, todas as frequências parciais de um sinal período com um período de Ω serão geradas adicionando-se todos os produtos cruzados de parâmetro de timbre Ω, sendo que o índice r varia de 1 a 7-1, à transposição harmônica de ordem T.
[0016] De acordo com um aspecto da invenção, descrevem-se um sistema e um método para gerar um componente de frequência alta de um sinal proveniente de um componente de frequência baixa do sinal. Deve-se notar que os recursos descritos a seguir no contexto de um sistema são igualmente aplicáveis ao método inventivo. O sinal pode, por exemplo, ser um áudio e/ou um sinal de fala. O sistema e o método podem ser usados para codificação de sinal de fala e áudio unificados. O sinal compreende um componente de frequência baixa e um componente de frequência alta, sendo que o componente de frequência baixa compreende as frequências abaixo de uma determinada frequência de cruzamento e o componente de frequência alta compreende as frequências acima da frequência de cruzamento. Em determinadas circunstâncias, pode ser necessário estimar o componente de frequência alta do sinal a partir de seu componente de frequência baixa. A título de exemplo, determinados esquemas de codificação de áudio codificam apenas o componente de frequência baixa de um sinal de áudio e se referem à reconstrução do componente de frequência alta somente daquele sinal a partir do componente de frequência baixa decodificado, utilizando-se, possivelmente, determinadas informações no envelope do componente de frequência alta original. O sistema e o método descritos no presente documento podem ser usados no contexto desses sistemas de codificação e decodificação.
[0017] O sistema destinado à geração do componente de frequência
Petição 870190115842, de 11/11/2019, pág. 35/87
7/52 alta compreende um banco de filtro de análise que proporciona uma pluralidade de sinais de sub-banda de análise do componente de frequência baixa do sinal. Esses bancos de filtro de análise podem compreender um conjunto de filtros passa-banda com largura de banda constante. De modo notável, no contexto de sinais de fala, também pode ser benéfico utilizar um conjunto de filtros passa-banda com uma distribuição logarítmica de largura de banda. Um objetivo do banco de filtro de análise consiste em dividir o componente de frequência baixa do sinal em seus constituintes de frequência. Esses constituintes de frequência serão refletidos na pluralidade de sinais de subbanda de análise gerados pelo banco de filtro de análise. A título de exemplo, um sinal que compreende uma nota tocada por um instrumento musical será dividido em sinais de sub-banda de análise tendo uma magnitude significativa para sub-bandas que correspondem à frequência harmônica da nota tocada, enquanto que as outras sub-bandas mostrarão sinais de sub-banda de análise com baixa magnitude.
[0018] O sistema compreende, ainda, uma unidade de processamento não linear para gerar um sinal de sub-banda de síntese com uma frequência de síntese particular modificando-se ou girando-se a fase de um primeiro e de um segundo sinais entre a pluralidade de sinais de sub-banda de análise e combinando-se os sinais de sub-banda de análise modificados por fase. O primeiro e o segundo sinais de sub-banda de análise são diferentes, em geral. Em outras palavras, os mesmos correspondem a diferentes sub-bandas. A unidade de processamento não linear pode compreender uma suposta unidade de processamento de termos cruzados na qual se gera o sinal de sub-banda de síntese. O sinal de sub-banda de síntese compreende a frequência de síntese. Em geral, o sinal de sub-banda de síntese compreende frequências provenientes de uma determinada faixa de frequências de síntese. A frequência de síntese é uma frequência contida nesta faixa de frequências, por exemplo, uma frequência central da faixa de frequências. A frequência de síntese e, também, a faixa de frequências de síntese são, tipicamente, maiores que a frequência de cruzamento. De modo análogo, os sinais de sub-banda de análise compreendem frequências provenientes de
Petição 870190115842, de 11/11/2019, pág. 36/87
8/52 uma determinada faixa de frequências de análise. Essas faixas de frequências de análise são, tipicamente, menores que a frequência de cruzamento. [0019] A operação de modificação de fase pode consistir em transpor as frequências dos sinais de sub-banda de análise. Tipicamente, o banco de filtro de análise produz sinais de sub-banda de análise complexos que podem ser representados como exponenciais complexos que compreendem uma magnitude e uma fase. A fase do sinal de sub-banda complexo corresponde à frequência do sinal de sub-banda. Uma transposição desses sinais de sub-banda por uma determinada ordem de transposição Τ' pode ser realizada adotando-se o sinal de sub-banda à potência da ordem de transposição Τ'. Isto resulta na fase do sinal de sub-banda complexo a ser multiplicado pela ordem de transposição Τ'. Em consequência, o sinal de sub-banda de análise transposto exibe uma fase ou uma frequência que é Τ' vezes maior que a fase ou frequência inicial. Essa operação de modificação de fase também pode ser referida como uma rotação de fase ou uma multiplicação de fase.
[0020] Além disso, o sistema compreende um banco de filtro de síntese que serve para gerar o componente de frequência alta do sinal a partir do sinal de sub-banda de síntese. Em outras palavras, o objetivo do banco de filtro de síntese consiste em unir possivelmente uma pluralidade de sinais de sub-banda de síntese, possivelmente, a partir de uma pluralidade de faixas de frequência de síntese e gerar um componente de frequência alta do sinal no domínio de tempo. Deve-se notar que para os sinais que compreendem uma frequência fundamental, por exemplo, uma frequência fundamental Ω, pode ser benéfico que o banco de filtro de síntese e/ou o banco de filtro de análise exibam um espaçamento de frequência que seja associado à frequência fundamental do sinal. Em particular, pode ser benéfico escolher os bancos de filtro com um espaçamento de frequência suficientemente baixo ou uma resolução suficientemente alta com a finalidade de solucionar a frequência fundamental Ω.
[0021] De acordo com outro aspecto da invenção, a unidade de processamento não linear ou a unidade de processamento de termos cruzados na
Petição 870190115842, de 11/11/2019, pág. 37/87
9/52 unidade de processamento não linear compreendem uma unidade de múltiplas entradas e única saída de uma primeira e uma segunda ordem de transposição que geram o sinal de sub-banda de síntese a partir do primeiro e do segundo sinal de sub-banda de análise que exibem uma primeira e uma segunda frequência de análise, respectivamente. Em outras palavras, a unidade de múltiplas entradas e única saída realiza a transposição do primeiro e do segundo sinais de sub-banda de análise e une os dois sinais de subbanda de análise transpostos em um sinal de sub-banda de síntese. O primeiro sinal de sub-banda de análise é modificador por fase, ou sua fase é multiplicada, pela primeira ordem de transposição e o segundo sinal de subbanda de análise é modificado por fase, ou sua fase é multiplicada pela segunda ordem de transposição. No caso de sinais de sub-banda de análise complexos, tal operação de modificação de fase consiste em multiplicar a fase do respectivo sinal de sub-banda de análise pela respectiva ordem de transposição. Os dois sinais de sub-banda de análise transpostos são combinados com a finalidade de produzir um sinal de sub-banda de síntese combinado com uma frequência de síntese que corresponda à primeira frequência de análise multiplicada pela primeira ordem de transposição mais a segunda frequência de análise multiplicada pela segunda ordem de transposição. Esta etapa de combinação pode consistir na multiplicação dos dois sinais de sub-banda de análise complexos transpostos. Essa multiplicação entre os dois sinais pode consistir na multiplicação de suas amostras.
[0022] Os recursos supramencionados também podem ser expressos em termos de fórmulas. Supõe-se que a primeira frequência de análise seja ω e a segunda frequência de análise seja (ω+Ω). Deve-se notar que essas variáveis também podem representar as respectivas faixas de frequências de análise dos dois sinais de sub-banda de análise. Em outras palavras, uma frequência deve ser compreendida como representativa de todas as frequências compreendidas em uma faixa de frequências particular ou uma sub-banda de frequência, isto é, a primeira e a segunda frequência de análise também deve ser compreendida como uma primeira e uma segunda faixa de frequências de análise ou uma primeira e uma segunda sub-banda de
Petição 870190115842, de 11/11/2019, pág. 38/87
10/52 análise. Além disso, a primeira ordem de transposição pode ser (T-r) e a segunda ordem de transposição pode ser r. Pode ser benéfico restringir as ordens de transposição de tal modo que T>1 e 1 < r < T. Para esses casos, a unidade de múltiplas entradas e única saída pode produzir sinais de subbanda de síntese com uma frequência de síntese de (T-r)· ω + Γ·(ω+Ω).
[0023] De acordo com um aspecto adicional da invenção, o sistema compreende uma pluralidade de unidades de múltiplas entradas e única saída e/ou uma pluralidade de unidades de processamento não linear que geram uma pluralidade de sinais de sub-banda de síntese parciais tendo a frequência de síntese. Em outras palavras, pode-se gerar uma pluralidade de sinais de sub-banda de síntese parciais que cobrem a mesma faixa de frequências de síntese. Nesses casos, proporciona-se uma unidade de soma de sub-banda para combinar a pluralidade de sinais de sub-banda de síntese parciais. Então, os sinais de sub-banda de síntese parciais combinados representam o sinal de sub-banda de síntese. A operação de combinação pode compreender a adição da pluralidade de sinais de sub-banda de síntese parciais. A mesma pode compreender, também, a determinação de um sinal de sub-banda de síntese médio a partir da pluralidade de sinais de subbanda de síntese parciais, sendo que os sinais de sub-banda de síntese podem ser ponderados de acordo com sua relevância para o sinal de subbanda de síntese. A operação de combinação também pode compreender a seleção de um ou alguns entre a pluralidade de sinais de sub-banda que, por exemplo, tenham uma magnitude que exceda um valor limiar predefinido. Deve-se notar que pode ser benéfico que o sinal de sub-banda de síntese seja multiplicado por um parâmetro de ganho. De modo notável, em casos onde existe uma pluralidade de sinais de sub-banda de síntese parciais, esses parâmetros de ganho podem contribuir para a normalização dos sinais de sub-banda de síntese.
[0024] De acordo com um aspecto adicional da invenção, a unidade de processamento não linear compreende, ainda, uma unidade de processamento direto que serve para gerar um sinal de sub-banda de síntese adicional a partir de um terceiro sinal entre a pluralidade de sinais de sub-banda
Petição 870190115842, de 11/11/2019, pág. 39/87
11/52 de análise. Essa unidade de processamento direto pode executar os métodos de transposição direta descritos, por exemplo, em WO 98/57436. Se o sistema compreender uma unidade de processamento direto adicional, então, pode ser necessário proporcionar uma unidade de soma de sub-banda para combinar os sinais de sub-banda de síntese correspondentes. Esses sinais de sub-banda de síntese correspondentes são, tipicamente, sinais de sub-banda que cobrem a mesma faixa de frequências de síntese e/ou exibem a mesma frequência de síntese. A unidade de soma de sub-banda pode realizar a combinação de acordo com os aspectos descritos anteriormente. A mesma também pode ignorar determinados sinais de sub-banda de síntese, de modo notável, o único gerado nas unidades de múltiplas entradas e única saída, se o mínimo da magnitude de um ou mais sinais de sub-banda de análise, por exemplo, a partir dos termos cruzados que contribuem para o sinal de sub-banda de síntese, for menor que uma fração predefinida da magnitude do sinal. O sinal pode ser o componente de frequência baixa do sinal ou um sinal de sub-banda de análise particular. Este sinal também pode ser um sinal de sub-banda de síntese particular. Em outras palavras, se a energia ou magnitude dos sinais de sub-banda de análise usados para gerar o sinal de sub-banda de síntese forem muito pequenas, então, este sinal de sub-banda de síntese pode não ser usado para gerar um componente de frequência alta do sinal. A energia ou magnitude podem ser determinadas para cada amostra ou podem ser determinados para um conjunto de amostras, por exemplo, determinando-se uma média de tempo ou uma média de janela deslizante dentre uma pluralidade de amostras adjacentes, dos sinais de sub-banda de análise.
[0025] A unidade de processamento direto pode compreender uma unidade de única entrada e única saída de uma terceira ordem de transposição Τ', gerando o sinal de sub-banda de síntese a partir do terceiro sinal de subbanda de análise que exibe uma terceira frequência de análise, sendo que o terceiro sinal de sub-banda de análise é modificado por fase, ou sua fase é multiplicada pela terceira ordem de transposição Τ', e Τ' é maior que um. Então, a frequência de síntese corresponde à terceira frequência de análise
Petição 870190115842, de 11/11/2019, pág. 40/87
12/52 multiplicada pela terceira ordem de transposição. Deve-se notar que esta terceira ordem de transposição Τ' é, de preferência, igual ao sistema ordem de transposição T introduzido abaixo.
[0026] De acordo com outro aspecto da invenção, o banco de filtro de análise tem N sub-bandas de análise em um espaçamento de sub-banda essencialmente constante de Δω. Conforme mencionado anteriormente, este espaçamento de sub-banda Δω pode ser associado a uma frequência fundamental do sinal. Uma sub-banda de análise é associada a um índice de sub-banda de análise n, onde ne{1,...,N}. Em outras palavras, as subbandas de análise do banco de filtro de análise podem ser identificadas por um índice de sub-banda n. De modo semelhante, os sinais de sub-banda de análise que compreendem as frequências provenientes da faixa de frequências da sub-banda de análise correspondentes podem ser identificados com o índice de sub-banda n.
[0027] No membro de síntese, o banco de filtro de síntese tem uma sub-banda de síntese que também é associada a um índice de sub-banda de síntese n. Este índice de sub-banda de síntese n também identifica o sinal de sub-banda de síntese que compreende as frequências provenientes da faixa de frequências de síntese da sub-banda de síntese com o índice de sub-banda n. Se o sistema tiver um sistema ordem de transposição, também referido como a ordem de transposição total, T, então, as sub-bandas de síntese têm, tipicamente, um espaçamento de sub-banda essencialmente constante de Δω·Τ, isto é, o espaçamento de sub-banda das sub-bandas de síntese é T vezes maior que o espaçamento de sub-banda das sub-bandas de análise. Nestes casos, a sub-banda de síntese e a sub-banda de análise com índice n compreendem faixas de frequências que se referem entre si através do fator ou do sistema ordem de transposição T. A título de exemplo, se a faixa de frequências da sub-banda de análise com índice n for [(η-1)·ω, η·ω], então, a faixa de frequências da sub-banda de síntese com índice n é [Τ·(η-1)· ω,Τ·η·ω], [0028] Dado que o sinal de sub-banda de síntese é associado à subbanda de síntese com índice n, outro aspecto da invenção é que este sinal
Petição 870190115842, de 11/11/2019, pág. 41/87
13/52 de sub-banda de síntese com índice n é gerado em uma unidade de múltiplas entradas e única saída a partir de um primeiro e um segundo sinal de sub-banda de análise. O primeiro sinal de sub-banda de análise é associado a uma sub-banda de análise com índice n-pi e o segundo sinal de subbanda de análise é associado a uma sub-banda de análise com índice n+p2. [0029] A seguir, descrevem-se vários métodos destinados à seleção de um par de deslocamentos de índice (pi, P2). Isto pode ser realizado por uma suposta unidade de seleção de índices. Tipicamente, um par ótimo de deslocamentos de índice é selecionado com a finalidade de gerar um sinal de sub-banda de síntese com uma frequência de síntese predefinida. Em um primeiro método, os deslocamentos de índice pi e p2 são selecionados a partir de uma lista limitada de pares (pi, P2) armazenada em uma unidade de armazenamento de índices. A partir desta lista limitada de partes de deslocamento de índice, um par (pi, P2) pode ser selecionado de tal modo que o valor mínimo de um conjunto que compreende a magnitude do primeiro sinal de sub-banda de análise e a magnitude do segundo sinal de sub-banda de análise seja maximizado. Em outras palavras, para cada par possível de deslocamentos de índice pi e p2, a magnitude dos sinais de sub-banda de análise correspondentes pode ser determinada. No caso de sinais de subbanda de análise complexos, a magnitude corresponde ao valor absoluto. A magnitude pode ser determinada para cada amostra ou pode ser determinada para um conjunto de amostras, por exemplo, determinando-se uma média de tempo ou uma média de janela deslizante dentre uma pluralidade de amostras adjacentes, do sinal de sub-banda de análise. Isto produz uma primeira e uma segunda magnitude para o primeiro e o segundo sinal de sub-banda de análise, respectivamente. Considera-se o mínimo da primeira e da segunda magnitude e o par de deslocamentos de índice (pi, P2) é selecionado ao qual este valor mínimo de magnitude é o maior.
[0030] Em outro método, os deslocamentos de índice pi e p2 são selecionados a partir de uma lista limitada de pares (pi, p2), sendo que a lista limitada é determinada através das fórmulas pi = r· I e p2 = (T-r)-l. Nessas fórmulas, I é um número inteiro positivo, considerando-se valores, por exem
Petição 870190115842, de 11/11/2019, pág. 42/87
14/52 pio, de 1 a 10. Este método é particularmente útil em situações onde a primeira ordem de transposição usada para transpor a primeira sub-banda de análise (n-pi) é (T-r) e onde a segunda ordem de transposição usada para transpor a segunda sub-banda de análise (n+pz) é r. Supondo-se que a sistema ordem de transposição T seja fixa, os parâmetros I e r podem ser selecionados de tal modo que o valor mínimo de um conjunto que compreende a magnitude do primeiro sinal de sub-banda de análise e a magnitude do segundo sinal de sub-banda de análise seja maximizado. Em outras palavras, os parâmetros I e r podem ser selecionados por uma abordagem de otimização máxima e mínima, conforme descrito anteriormente.
[0031] Em um método adicional, a seleção do primeiro e do segundo sinais de sub-banda de análise pode se basear nas características do sinal subjacente. De modo notável, se o sinal compreender uma frequência fundamental Ω, isto é, se o sinal for periódico com caractere tipo sequência de pulsos, pode ser benéfico selecionar os deslocamentos de índice pi e p2 em consideração a tal característica de sinal. A frequência fundamental Ω pode ser determinada a partir do componente de frequência baixa do sinal ou pode ser determinada a partir do sinal original, que compreende ambos, o componente de frequência baixa e alta. No primeiro caso, a frequência fundamental Ω pode ser determinada em um decodificador de sinal que utiliza reconstrução de frequência alta, enquanto no segundo case, a frequência fundamental Ω seria tipicamente determinada em um codificador de sinal e, então, sinalizada ao decodificador de sinal correspondente. Se um banco de filtro de análise com um espaçamento de sub-banda de Δω for usado e se a primeira ordem de transposição usada para transpor a primeira sub-banda de análise (n-pi) for (T-r) e se a segunda ordem de transposição usada para transpor a segunda sub-banda de análise (n+p2) for r, então, pi e p2 podem ser selecionados de tal modo que sua soma pi+p2 se aproxime da fração Ω/Δω e sua fração pi/p2 se aproxime de r/(T-r). Em um caso particular, pi e P2 são selecionados de tal modo que a fração pi/p2 seja igual a r7(T-r).
[0032] De acordo com outro aspecto da invenção, o sistema que serve para gerar um componente de frequência alta de um sinal também compre
Petição 870190115842, de 11/11/2019, pág. 43/87
15/52 ende uma janela de análise que isola um intervalo de tempo predefinido do componente de frequência baixa ao redor de uma instância de tempo predefinida k. O sistema pode compreender, também, uma janela de síntese que isola um intervalo de tempo predefinido do componente de frequência alta ao redor de uma instância de tempo predefinida k. Essas janelas são particularmente úteis para sinais com constituintes de frequência que são carregados com o passar do tempo. Estas permitem analisar a composição de frequência momentânea de um sinal. Em combinação com os bancos de filtro, um exemplo típico para tal análise de frequência dependente do tempo é a Transformada de Fourier de Tempo Curto (SIFT). Deve-se notar que geralmente a janela de análise é uma versão de tempo disperso na janela de síntese. Para um sistema com uma transposição de ordem do sistema T, a janela de análise no domínio de tempo pode ser uma versão de tempo disperso da janela de síntese no domínio de tempo com um fator de dispersão T.
[0033] De acordo com um a adicional da invenção, descreve-se um sistema que serve para decodificar um sinal. O sistema adota uma versão codificada do componente de frequência baixa de um sinal e compreende uma unidade de transposição, de acordo com o sistema descrito anteriormente, que serve para gerar o componente de frequência alta do sinal a partir do componente de frequência baixa do sinal. Tipicamente, esses sistemas de decodificação compreendem, ainda, um decodificador de núcleo que serve para decodificar o componente de frequência baixa do sinal. O sistema de decodificação pode compreender, ainda, um elemento de aumento da taxa de amostragem que serve para realizar um aumento da taxa de amostragem do componente de frequência baixa de modo a produzir um componente de frequência baixa com aumento na taxa de amostragem. Isto pode ser necessário, se o componente de frequência baixa do sinal tiver tido sua taxa de amostragem reduzida no codificador, explorar o fato de que o componente de frequência baixa cobre apenas uma faixa de frequências reduzida comparada ao sinal original. Ademais, o sistema de decodificação pode compreender uma unidade de entrada que serve para receber o sinal codificado, compreendendo o componente de frequência baixa, e uma unidade de saída que
Petição 870190115842, de 11/11/2019, pág. 44/87
16/52 serve para proporcionar o sinal decodificado, compreendendo o componente gerado de frequência baixa e alta.
[0034] O sistema de decodificação pode compreender, ainda, um ajustador de envelope para conformar o componente de frequência alta. Embora as frequências altas de um sinal possam ser geradas novamente a partir da faixa de frequências baixas de um sinal utilizando-se os sistemas e métodos de reconstrução de frequência alta descritos no presente documento, pode ser benéfico extrair informações a partir do sinal original referente ao envelope espectral de seu componente de frequência alta. Estas informações de envelope podem, então, ser proporcionadas ao decodificador, com a finalidade de gerar um componente de frequência alta que se aproxime bem do envelope espectral do componente de frequência alta do sinal original. Tipicamente, esta operação é realizada no ajustador de envelope no sistema de decodificação. Objetivando receber informações relacionadas ao envelope do componente de frequência alta do sinal, o sistema de decodificação pode compreender uma unidade de recepção de dados de envelope. O componente de frequência alta regenerado e o componente de frequência baixa decodificado e, possivelmente, tendo um aumento na taxa de amostragem podem, então, ser somados em uma unidade de soma de componentes para determinar o sinal decodificado.
[0035] Conforme descrito anteriormente, o sistema que serve para gerar o componente de frequência alta pode usar informações referentes aos sinais de sub-banda de análise que devem ser transpostos e combinados com a finalidade de gerar um sinal de sub-banda de síntese particular. Para este propósito, o sistema de decodificação pode compreender, ainda, uma unidade de recepção de dados de seleção de sub-banda que serve para receber informações que permitam a seleção do primeiro e do segundo sinais de sub-banda de análise a partir dos quais o sinal de sub-banda de síntese deve ser gerado. Estas informações podem ser relacionadas a determinadas características do sinal codificado, por exemplo, as informações podem ser associadas a uma frequência fundamental Ω do sinal. As informações também podem ser diretamente relacionadas às sub-bandas de análise que de
Petição 870190115842, de 11/11/2019, pág. 45/87
17/52 vem ser selecionadas. A título de exemplo, as informações podem compreender uma lista de possíveis pares do primeiro e do segundo sinais de subbanda de análise ou uma lista de pares (pi, P2) de possíveis deslocamentos de índice.
[0036] De acordo com outro aspecto da invenção, descreve-se um sinal codificado. Este sinal codificado compreende informações relacionadas a um componente de frequência baixa do sinal decodificado, sendo que o componente de frequência baixa compreende uma pluralidade de sinais de subbanda de análise. Além disso, o sinal codificado compreende informações relacionadas a qual entre os dois sinais entre uma pluralidade de sinais de sub-banda de análise deve ser selecionados para gerar um componente de frequência alta do sinal decodificado transpondo-se os dois sinais de subbanda de análise selecionados. Em outras palavras, o sinal codificado compreende uma versão possivelmente codificada do componente de frequência baixa de um sinal. Ademais, o mesmo proporciona informações, tal como uma frequência fundamental Ω do sinal ou uma lista de possíveis pares de deslocamento de índice (pi,ρζ), que permitirá que um decodificador regenere o componente de frequência alta do sinal com base no método de transposição harmônica aprimorado para produtos cruzados descrito no presente documento.
[0037] De acordo com um aspecto adicional da invenção, descreve-se um sistema que serve para codificar um sinal. Este sistema de codificação compreende uma unidade de divisão que serve para dividir o sinal em um componente de frequência baixa e em um componente de frequência alta e um codificador de núcleo que serve para codificar o componente de frequência baixa. O mesmo também compreende uma unidade de determinação de frequência que serve para determinar uma frequência fundamental Ω do sinal e um codificador de parâmetros que serve para codificar a frequência fundamental Ω, sendo que a frequência fundamental Ω é usada em um decodificador para regenerar o componente de frequência alta do sinal. O sistema também pode compreender uma unidade de determinação de envelope que serve para determinar o envelope espectral do componente de fre
Petição 870190115842, de 11/11/2019, pág. 46/87
18/52 quência alta e um codificador de envelope que serve para codificar o envelope espectral. Em outras palavras, o sistema de codificação remove o componente de frequência alta do sinal original e codifica o componente de frequência baixa através de um codificador de núcleo, por exemplo, um codificador AAC ou Dolby D. Além disso, o sistema de codificação analisa o componente de frequência alta do sinal original e determina um conjunto de informações que é usado no decodificador para regenerar o componente de frequência alta do sinal decodificado. O conjunto de informações pode compreender uma frequência fundamental Ω do sinal e/ou o envelope espectral do componente de frequência alta.
[0038] O sistema de codificação também pode compreender um banco de filtro de análise que proporciona uma pluralidade de sinais de sub-banda de análise do componente de frequência baixa do sinal. Além disso, o mesmo pode compreender uma unidade de determinação de par de sub-banda que serve para determinar um primeiro e um segundo sinal de sub-banda que servem para gerar um componente de frequência alta do sinal e um codificador de índice que serve para codificar os números de índice que representam o primeiro e o segundo sinal de sub-banda determinados. Em outras palavras, o sistema de codificação pode usar o método e/ou sistema de reconstrução de frequência alta descrito no presente documento com a finalidade de determinar as sub-bandas de análise a partir das quais as subbandas de alta frequência e, em última análise, pode-se gerar o componente de frequência alta do sinal. As informações nessas sub-bandas, por exemplo, uma lista limitada de pares de deslocamento de índice (pi,ρζ), pode, então, ser codificada e proporcionada ao decodificador.
[0039] Conforme enfatizado anteriormente, a invenção também abrange métodos que servem para gerar um componente de frequência alta de um sinal, assim como métodos para decodificar e codificar sinais. Os recursos descritos anteriormente no contexto dos sistemas são igualmente aplicáveis aos métodos correspondentes. A seguir, descrevem-se os aspectos selecionados dos métodos de acordo com a invenção. De modo similar, esses aspectos também são aplicáveis aos sistemas descritos no presente
Petição 870190115842, de 11/11/2019, pág. 47/87
19/52 documento.
[0040] De acordo com outro aspecto da invenção, descreve-se um método para realizar uma reconstrução de frequência alta de um componente de frequência alta a partir de um componente de frequência baixa de um sinal. Este método compreende a etapa de proporciona um primeiro sinal de sub-banda do componente de frequência baixa a partir de uma primeira banda de frequência e um segundo sinal de sub-banda do componente de frequência baixa a partir de uma segunda banda de frequência. Em outras palavras, dois sinais de sub-banda são isolados a partir do componente de frequência baixa do sinal, o primeiro sinal de sub-banda abrange uma primeira banda de frequência e o segundo sinal de sub-banda abrange uma segunda banda de frequência. As duas sub-bandas de frequência são preferencialmente diferentes. Em uma etapa adicional, o primeiro e o segundo sinais de sub-banda são transpostos por um primeiro e por um segundo fator de transposição, respectivamente. A transposição de cada sinal de subbanda pode ser realizada de acordo com métodos conhecidos para transpor sinais. No caso de sinais de sub-banda complexos, a transposição pode ser realizada modificando-se a fase, ou multiplicando-se a fase, pelo respectivo fator de transposição ou ordem de transposição. Em uma etapa adicional, o primeiro e o segundo sinais de sub-banda transpostos são combinados de modo a produzir um componente de frequência alta que compreende frequências a partir de uma banda de frequência alta.
[0041] A transposição pode ser realizada de tal modo que a banda de frequência alta corresponda à soma da primeira banda de frequência multiplicada pelo primeiro fator de transposição e da segunda banda de frequência multiplicada pelo segundo fator de transposição. Além disso, a etapa de transposição pode compreender as etapas de multiplicar a primeira banda de frequência do primeiro sinal de sub-banda com o primeiro fator de transposição e multiplicar a segunda banda de frequência do segundo sinal de sub-banda com o segundo fator de transposição. Com o intuito de simplificar a explicação e não limitar seu escopo, a invenção é ilustrada para transposição de frequências individuais. No entanto, deve-se notar que a transposição
Petição 870190115842, de 11/11/2019, pág. 48/87
20/52 é realizada não apenas para frequências individuais, mas também para todas as bandas de frequência, isto é, para uma pluralidade de frequências compreendidas em uma banda de frequência. De fato, a transposição das frequências e a transposição das bandas de frequência devem ser compreendidas como sendo intercambiáveis no presente documento. No entanto, deve se ter conhecimento das diferentes resoluções de frequência dos bancos de filtro de análise e síntese.
[0042] No método mencionado anteriormente, a etapa de fornecimento pode compreender a filtragem do componente de frequência baixa por um banco de filtro de análise de modo a gerar um primeiro e um segundo sinal de sub-banda. Por outro lado, a etapa de combinação pode compreender multiplicar o primeiro e o segundo sinais de sub-banda transpostos de modo a produzir um sinal de sub-banda alta e inserir o sinal de sub-banda alta em um banco de filtro de síntese para gerar o componente de frequência alta. Outras transformações de sinal em uma representação de frequência também são possíveis e se encontram no escopo da invenção. Essas transformações de sinal compreendem Transformadas de Fourier (FFT, DCT), transformadas em ondaletas, filtros em espelho de quadrature (QMF), etc.. Além disso, essas transformações também compreendem funções de janela pare o propósito de isolar um intervalo de tempo reduzido do sinal a ser transformado. As funções de janela possíveis compreendem janelas Gaussianas, janelas de cosseno, janelas de Hamming, janelas de Hann, janelas retangulares, janelas de Barlett, janelas de Blackman, e outras. Neste documento, o termo banco de filtro pode compreender quaisquer transformadas possivelmente combinadas com quaisquer funções de janela.
[0043] De acordo com outro aspecto da invenção, descreve-se um método pare decodificar um sinal codificado. O sinal codificado é derivado a partir de um sinal original e representa apenas uma porção das sub-bandas de frequência do sinal original menor que uma frequência de cruzamento. O método compreende as etapas de proporcionar uma primeira e uma segunda sub-banda de frequência do sinal codificado. Isto pode ser realizado utilizando-se um banco de filtro de análise. Então, as sub-bandas de frequência
Petição 870190115842, de 11/11/2019, pág. 49/87
21/52 são transpostas por um primeiro fator de transposição e por um segundo fator de transposição, respectivamente. Isto pode ser concebido realizandose uma modificação de fase, ou uma multiplicação de fase, do sinal na primeira sub-banda de frequência com o primeiro fator de transposição e realizando-se uma modificação de fase, ou uma multiplicação de fase, do sinal na segunda sub-banda de frequência com o segundo fator de transposição. Finalmente, uma sub-banda de frequência alta é gerada a partir da primeira e da segunda sub-bandas de frequência transpostas, sendo que a subbanda de frequência alta é maior que a frequência de cruzamento. Esta subbanda de frequência alta pode corresponder à soma da primeira sub-banda de frequência multiplicada pelo primeiro fator de transposição e a segunda sub-banda de frequência multiplicada pelo segundo fator de transposição. [0044] De acordo com outro aspecto da invenção, descreve-se um método que serve para codificar um sinal. Este método compreende as etapas de filtrar o sinal de modo a isolar uma frequência baixa do sinal e codificar o componente de frequência baixa do sinal. Além disso, proporciona-se uma pluralidade de sinais de sub-banda de análise do componente de frequência baixa do sinal. Isto pode ser realizado utilizando-se um banco de filtro de análise conforme descrito no presente documento. Então, um primeiro e um segundo sinal de sub-banda que servem para gerar um componente de frequência alta do sinal são determinados. Isto pode ser realizado utilizando-se os métodos e sistemas de reconstrução de frequência alta descritos no presente documento. Finalmente, codificam-se as informações que representam o primeiro e o segundo sinal de sub-banda determinados. Essas informações podem ser características do sinal original, por exemplo, a frequência fundamental Ω do sinal, ou as informações relacionadas às sub-bandas de análise selecionadas, por exemplo, os pares de deslocamento de índice (pi,p2).
[0045] Deve-se notar que as modalidades e aspectos supramencionados da invenção podem ser arbitrariamente combinados. Em particular, deve-se notar que os aspectos descritos para um sistema também são aplicáveis ao método correspondente adotado pela presente invenção. Além disso,
Petição 870190115842, de 11/11/2019, pág. 50/87
22/52 deve-se notar que a descrição da invenção também cobre outras combinações de concretizações além das combinações de concretizações que são explicitamente fornecidas pelas referências retroativas nas concretizações, isto é, as concretizações e seus recursos técnicos podem ser combinados em qualquer ordem ou em qualquer formação.
BREVE DESCRIÇÃO DOS DESENHOS [0046] A presente invenção será descrita agora por meio de exemplos ilustrativos, não limitando o escopo da invenção. A mesma será descrita com referência aos desenhos em anexo, onde:
[0047] A figura 1 ilustra a operação de um decodificador de áudio aprimorado de HFR;
[0048] A figura 2 ilustra a operação de um transpondedor harmônico que utiliza várias ordens;
[0049] A figura 3 ilustra a operação de um transpondedor harmônico de domínio de frequência (FD);
[0050] A figura 4 ilustra a operação do uso inventivo de processamento de termo cruzado;
[0051 ] A figura 5 ilustra o processamento direto da técnica anterior;
[0052] A figura 6 ilustra o processamento não linear direto da técnica anterior de uma sub-banda única;
[0053] A figura 7 ilustra os componentes do processamento de termo cruzado inventivo;
[0054] A figura 8 ilustra a operação de um bloco de processamento de termo cruzado;
[0055] A figura 9 ilustra o processamento não linear inventivo contido em cada um dos sistemas MISO da figura 8;
[0056] As figuras 10 a 18 ilustram o efeito da invenção para transposição harmônica de sinais periódicos exemplificadores;
[0057] A figura 19 ilustra a resolução tempo-frequência de uma Transformada de Fourier de Tempo Curto (STFT);
[0058] A figura 20 ilustra a progressão de tempo exemplificadora de uma função de janela e sua transformada de Fourier usada no membro de
Petição 870190115842, de 11/11/2019, pág. 51/87
23/52 síntese;
[0059] A figura 21 ilustra a STFT de um sinal de entrada sinusoidal;
[0060] A figura 22 ilustra a função de janela e sua transformada de Fourier de acordo com a figura 20 usada no membro de análise;
[0061] As figuras 23 e 24 ilustram a determinação de sub-bandas de banco de filtro de análise apropriadas para o aprimoramento de termo cruzado de uma sub-banda de banda de filtro de síntese;
[0062] As figuras 25, 26, e 27 ilustram resultados experimentais do método descrito de transposição harmônica de termo direto e termo cruzado;
[0063] As figuras 28 e 29 ilustram as modalidades de um codificador e de um decodificador, respectivamente, utilizando-se os esquemas de transposição harmônica aprimorada esboçados no presente documento; e [0064] A figura 30 ilustra uma modalidade de uma unidade de transposição mostrada nas figuras 28 e 29.
DESCRIÇÃO DAS MODALIDADES PREFERENCIAIS [0065] As modalidades descritas abaixo são meramente ilustrativas para os princípios da presente invenção à suposta TRANSPOSIÇÃO HARMÔNICA APRIMORADA PARA PRODUTOS CRUZADOS. Compreende-se que as modificações e variações das disposições e os detalhes descritos no presente documento se tornarão aparentes a outros indivíduos versados na técnica. Portanto, pretende-se que sejam limitados apenas pelo escopo das concretizações iminentes e não pelos detalhes específicos apresentados por meio da descrição e da explicação das modalidades do presente documento. [0066] A figura 1 ilustra a operação de um decodificador de áudio aprimorado de HFR. O decodificador de áudio de núcleo 101 emite um sinal de áudio de largura de banda baixa que é carregado a um elemento de aumento da taxa de amostragem 104 que pode ser necessário com o intuito de produzir uma contribuição de saída de áudio final na taxa de amostragem completa desejada. Esse aumento da taxa de amostragem é necessário para sistemas de taxa dupla, onde o codec de áudio de núcleo com banda limitada está operando na metade da taxa de amostragem de áudio externo, enquanto a parte de HFR é processada na frequência de amostragem com
Petição 870190115842, de 11/11/2019, pág. 52/87
24/52 pleta. Consequentemente, para um sistema de taxa simples, este elemento da taxa de amostragem 104 é omitido. A saída de largura de banda baixa de 101 também é enviada ao transpondedor ou à unidade de transposição 102 que emite um sinal transposto, isto é, um sinal que compreende a faixa de frequência alta desejada. Este sinal transposto pode ser conformado em tempo e frequência pelo ajustador de envelope 103. A saída de áudio final é a soma do sinal de núcleo de largura de banda baixa e o sinal transposto ajustado por envelope.
[0067] A figura 2 ilustra a operação de um transpondedor harmônico 201, que corresponde ao transpondedor 102 da figura 1, que compreende vários transpondedores de ordem de transposição diferente T. O sinal a ser transposto é passado ao banco de transpondedores individuais 201-2, 2013, ..., 201-Tmax tendo ordens de transposição T = 2,3,...,Tmax, respectivamente. Tipicamente, uma ordem de transposição Tmax = 3 é suficiente para a maioria das aplicações de codificação de áudio. As contribuições dos diferentes transpondedores 201-2, 201-3, ..., 201-Tmax são somadas em 202 de modo a produzir a saída de transpondedor combinada. Em uma primeira modalidade, esta operação de soma pode compreender a adição das contribuições individuais. Em outra modalidade, as contribuições são ponderadas com diferentes ponderações, de tal modo que o efeito de adicionar múltiplas contribuições a determinadas frequências seja mitigado. Por exemplo, as terceiras contribuições de ordem podem ser adicionadas a um ganho menor que as segundas contribuições de ordem. Finalmente, a unidade de soma 202 pode adicionar as contribuições seletivamente dependendo da frequência de saída. Por exemplo, a segunda transposição de ordem pode ser usada para uma primeira faixa de frequência de destino inferior, e a terceira transposição de ordem pode ser usada para uma segunda faixa de frequência de destino superior.
[0068] A figura 3 ilustra a operação de um transpondedor harmônico de domínio de frequência (FD), tal como um dos blocos individuais de 201, isto é, um dos transpondedores 201-T de ordem de transposição T. Um banco de filtro de análise 301 emite sub-bandas complexas que são submetidas a
Petição 870190115842, de 11/11/2019, pág. 53/87
25/52 um processamento não linear 302, que modifica a fase e/ou a amplitude do sinal de sub-banda de acordo com a ordem de transposição T escolhida. As sub-bandas modificadas são carregadas em um banco de filtro de síntese 303 que emite o sinal de domínio de tempo transposto. No caso de múltiplos transpondedores paralelos de diferentes ordens de transposição, tal como mostrado na figura 2, algumas operações de banco de filtro podem ser compartilhadas entre os diferentes transpondedores 201-2, 201-3, 201-Tmax. O compartilhamento as operações de banco de filtro podem ser realizadas para análise ou síntese. No caso de síntese compartilhada 303, a soma 202 pode ser realizada no domínio de sub-banda, isto é, antes da síntese 303.
[0069] A figura 4 ilustra a operação de processamento de termo cruzado 402 além do processamento direto 401. O processamento de termo cruzado 402 e o processamento direto 401 são realizados em paralelo no bloco de processamento não linear 302 do transpondedor harmônico de domínio de frequência da figura 3. Os sinais de saída transpostos são combinados, por exemplo, adicionados, com a finalidade de proporcionar um sinal transposto unido. Esta combinação de sinais de saída transpostos pode consistir na superposição dos sinais de saída transpostos. Opcionalmente, a adição seletiva de termos cruzados pode ser implementada na computação de ganho.
[0070] A figura 5 ilustra, em maiores detalhes, a operação do bloco de processamento direto 401 da figura 4 no transpondedor harmônico de domínio de frequência da figura 3. As unidades de única entrada e única saída (SISO) 401-1, ..., 401-n, ..., 401-N mapeiam cada sub-banda de análise a partir de uma faixa de origem em uma sub-banda de síntese em uma faixa de destino. De acordo com a figura 5, uma sub-banda de análise de índice n é mapeada pela unidade de SISO 401-n a uma sub-banda de síntese do mesmo índice n. Deve-se notar que a faixa de frequências da sub-banda com índice n no banco de filtro de síntese pode variar dependendo da versão ou tipo exato de transposição harmônica. Na versão ou tipo ilustrado na figura 5, o espaçamento de frequência do banco de análise 301 é um fator T menor que do banco de síntese 303. Portanto, o índice n no banco de sínte
Petição 870190115842, de 11/11/2019, pág. 54/87
26/52 se 303 corresponde a uma frequência, que é T vezes maior que a frequência da sub-banda com o mesmo índice n no banco de análise 301. A título de exemplo, uma sub-banda de análise [(η-1)ο,ηο] é transposta em uma subbanda de síntese [(η-^Τω,ηΤω].
[0071] A figura 6 ilustra o processamento não linear direto de uma subbanda única contida em cada uma das unidades de SISO de 401-η. A não linearidade do bloco 601 realiza uma multiplicação da fase do sinal de subbanda complexo por um fator igual à ordem de transposição T. A unidade de ganho opcional 602 modifica a magnitude do sinal de sub-banda modificado por fase. Em termos matemáticos, a saída y da unidade de SISO 401-n pode ser escrita como uma função da entrada x ao sistema de SISO 401-n e do parâmetro de ganho g, da seguinte forma:
r=g*v7, onde v=x/|x|1'1/7 (1) [0072] Isto também pode ser escrito como:
Figure BR122019023684B1_D0001
[0073] Em palavras, a fase do sinal de sub-banda complexo x é multiplicada pela ordem de transposição Tea amplitude do sinal de sub-banda complexo x é modificada pelo parâmetro de ganho g.
[0074] A figura 7 ilustra os componentes do processamento de termo cruzado 402 para uma transposição harmônica de ordem T. Existem T -1 blocos de processamento de termo cruzado em paralelo, 701-1, ..., 701-r, ... 701-(T-1), cujas saídas são somadas na unidade de soma 702 de modo a produzir uma saída combinada. Conforme apontado anteriormente na seção introdutória, um objetivo consiste em mapear um par de senoides com frequências (ο,<β+Ω) em uma senoide com frequência (7-γ)<β+γ(<2Η-Ω) = 7<β+/Ώ, sendo que a variável r varia de 1 a 7-1. Em outras palavras, duas subbandas do banco de filtro de análise 301 devem ser mapeadas em uma subbanda da faixa de frequências altas. Para um valor particular de r e uma determinada ordem de transposição 7, esta etapa de mapeamento é realizada no bloco de processamento de termo cruzado 701-r.
[0075] A figura 8 ilustra a operação de um bloco de processamento de
Petição 870190115842, de 11/11/2019, pág. 55/87
27/52 termo cruzado 701 -r para um valor fixo r=1,2,...,7-1. Cada sub-banda de saída 803 é obtida em uma unidade de múltiplas entradas e única saída (MISO) 800-n a partir de duas sub-bandas de entrada 801 e 802. Para uma subbanda de saída 803 de índice n, as duas entradas da unidade de MISO 800n são sub-bandas n- pi, 801, e n+ p2, 802, onde pi e p? são deslocamentos de índice inteiros positivos, que dependem da ordem de transposição T, da variável r, e do parâmetro de timbre de aprimoramento de produtos cruzados O. A convenção de numeração de sub-banda de análise e síntese é mantida em linha com aquela da figura 5, ou seja, o espaçamento em frequência do banco de análise 301 é um fator T menor que aquele do banco de síntese 303 e, consequentemente, os comentários anteriores dados em variações do fator T permanecem relevantes.
[0076] Em relação à utilização do processamento de termo cruzado, os comentários a seguir devem ser considerados. O parâmetro de timbre Ω não precisa ser conhecido com alta precisão, e certamente com uma resolução de frequência não melhor que a resolução de frequência obtida pelo banco de filtro de análise 301. De fato, em algumas modalidades da presente invenção, o parâmetro de timbre de aprimoramento de produtos cruzados subjacentes Ω não é inserido no decodificador. Em vez disso, o par escolhido de deslocamentos de índice inteiros (pi, p?) é selecionado a partir de uma lista de possíveis candidatos seguindo-se um critério de otimização, tal como a maximização da magnitude de saída de produtos cruzados, isto é, a maximização da energia da saída de produtos cruzados. A título de exemplo, para determinados valores de T e r, uma lista de candidatos dada pela fórmula (pi, P2) = (rl,(T - r)l),l e L, onde L é uma lista de números inteiros positivos, pode ser usada. Esta é mostrada em maiores detalhes abaixo no contexto da fórmula (11). Todos os números inteiros positivos são, em princípios, considerados OK como candidatos. Em alguns casos, as informações de timbre podem ajudar a identificar quais / escolher como deslocamentos de índice apropriados.
[0077] Além disso, embora o processamento de produtos cruzados exemplificador ilustrado na figura 8 sugira que os deslocamentos de índice
Petição 870190115842, de 11/11/2019, pág. 56/87
28/52 aplicados (p-ι, P2) sejam iguais para uma determinada faixa de sub-bandas de saída, por exemplo, sub-bandas de síntese (n-1), n e (n+1) são compostos a partir de sub-bandas de análise tendo uma distância fixa pi + p2, sendo que este não é necessariamente o caso. De fato, os deslocamentos de índice (pi, P2) podem ser diferentes para cada sub-banda de saída. Isto significa que para cada sub-banda n, pode-se selecionar um valor Ω diferente do parâmetro de timbre de aprimoramento de produtos cruzados.
[0078] A figura 9 ilustra o processamento não linear contido em cada uma das unidades de MISO 800-n. A operação de produto 901 cria um sinal de sub-banda com uma fase igual a uma soma ponderada das fases dos dois sinais de sub-banda de entrada complexa e uma magnitude igual a um valor médio generalizado das magnitudes das duas amostras de sub-banda de entrada. A unidade de ganho opcional 902 modifica a magnitude das amostras de sub-banda modificadas por fase. Em termos matemáticos, a saída γ pode ser escrita como uma função das entradas μ, 801 e μ2 802 à unidade de MISO 800-n e do parâmetro de ganho g, da seguinte forma,
7-, , ,| I1-1V
Τ - S' vi v2, onde v™ ~~Um \Um\ , for m = 1,2 [0079] Esta também pode ser escrita como:
í í V w2 (2) onde AWW) é uma função de geração de magnitude. Em palavras, a fase do sinal de sub-banda complexo /zi, é multiplicada pela ordem de transposição T-r e a fase do sinal de sub-banda complexo μ2 é multiplicada pela ordem de transposição r.. A soma dessas duas fases é usada como a fase da saída γ cuja magnitude é obtida pela função de geração de magnitude. Comparando-se com a fórmula (2), a função de geração de magnitude é expressa como a média geométrica das magnitudes modificadas pelo parâmetro de ganho g, ou seja, A(|wi|Jw2|) = g’|wi| |w2| . Permitindo-se que o parâmetro de ganho dependa das entradas, naturalmente, estas cobrem todas as possibilidades.
[0080] Deve-se notar que a fórmula (2) resulta a partir do alvo subja
Petição 870190115842, de 11/11/2019, pág. 57/87
29/52 cente que um par de senoides com frequências (0,0+Ω) deve ser mapeado a uma senoide com frequência Τ0+/Ώ, que também pode ser escrita como (T-r) 0+γ(0+Ω).
[0081] No texto a seguir, representa-se uma descrição matemática da presente invenção. Por motivos de simplicidade, os sinais de tempo contínuo são considerados. Supõe-se que o banco de filtro de síntese 303 alcance uma reconstrução perfeita a partir de um banco de filtro de análise modulado complexo correspondente 301 com uma função de janela simétrica avaliada real ou filtro de protótipo w(t). O banco de filtro de síntese geralmente utilizará, mas nem sempre, a mesma janela no processo de síntese. Supõe-se que a modulação seja do tipo uniformemente empilhada, a distância seja normalizada para um e o espaçamento de frequência angular das sub-bandas de síntese seja normalizado para π . Portanto, um sinal de destino s(f) será obtido na saída do banco de filtro de síntese se os sinais de sub-banda de entrada ao banco de filtro de síntese forem dados pelos sinais de sub-banda de síntese γη(/ί), y„(Ar)= j s(t)w(t - k)exp[-inn(t - k)]dt.
(3) [0082] Nota-se que a fórmula (3) é um modelo matemático de tempo contínuo normalizado das operações usuais em um banco de filtro de análise de sub-banda modulado complexo, tal como uma Transformada de Fourier Discreta janelada (DFT), também denotada como Transformada de Fourier de Tempo Curto (STFT). Com uma ligeira modificação no argumento do exponencial complexo de fórmula (3), obtêm-se modelos de tempo contínuo para Filtro de Banco em Espelho de Quadrature (QMF) modulado complexo (pseudo) e Transformada de Cosseno Discreta Modificada complexa (CMDCT), também denotada como um DFT janelado estranhamente empilhado. O índice de sub-banda n percorre todos os números inteiros não negativos pare o caso de tempo de contínuo. Pare as contrapartes de tempo discretas, a variável de tempo t é amostrada na etapa 1/N, e o índice de subbanda n é limitado por N, onde N é o número de sub-bandas no banco de filtro, que é igual à distância de tempo discreto do banco de filtro. No caso de
Petição 870190115842, de 11/11/2019, pág. 58/87
30/52 tempo discreto, um fator de normalização relacionado a Λ/ também é necessário na operação de transformada se não for incorporado no escalonamento da janela.
[0083] Para um sinal avaliado real, existem tantas amostras de subbanda complexas fora quanto existem amostras avaliadas reais dentro para o modelo de banco de filtro escolhido. Portanto, existe uma sobreamostragem total (ou redundância) por um fator dois. Os bancos de filtro com um grau maior de sobreamostragem também podem ser empregados, porém, a sobreamostragem é mantida pequena na presente descrição das modalidades por motivos de clareza de exposição.
[0084] As etapas principais envolvidas na análise de banco de filtro modulado correspondente à fórmula (3) são aquelas que o sinal é multiplicado por uma janela centralizada em torno do tempo t=k, e o sinal janelado resultante é correlacionado a cada uma das senoides complexas exp[-/T7Xfk)]. Em implementações de tempo discretas, esta correlação é eficientemente implementada através de uma Transformada Rápida de Fourier. As etapas algorítmicas correspondentes para o banco de filtro de síntese são bem conhecidas pelos indivíduos versados na técnica, e consistem em modulação de síntese, janelamento de síntese, e operações sobreposição e soma.
[0085] A figura 19 ilustra a posição em tempo e frequência correspondente às informações realizadas pela amostra de sub-banda yn(k) para uma seleção de valores do índice de tempo k e do índice de sub-banda n. Como um exemplo, a amostra de sub-banda ^(4) é representada pelo retângulo escuro 1901.
[0086] Para uma senoide, sfO=Acos(of+^)=Re{Cexp(/of)}, os sinais de sub-banda de (3) são, para n suficientemente grande com uma boa aproximação, dados por yn (Λ) = Céka> J n-(/j exp\—ΐ(ηπ — ω)ί] dt - Ce'k0>w(nK - ω), (4) onde o acento circunflexo denota a transformada de Fourier, isto é, iv é a transformada de Fourier da função de janela w .
[0087] No sentido exato, a fórmula (4) é somente verdadeira se for adi
Petição 870190115842, de 11/11/2019, pág. 59/87
31/52 cionado um termo com -ω em vez de ω. Este termo é desprezado com base na suposição que a resposta de frequência da janela decai suficientemente rápido, e que a soma de ω e não é próxima de zero.
[0088] A figura 20 descreve a aparência típica de uma janela w, 2001, e sua transformada de Fourier ¢,2002.
[0089] A figura 21 ilustra a análise de uma senoide única correspondente à fórmula (4). As sub-bandas que são principalmente afetadas pela senoide na frequência ω são aquelas com índice n de tal modo que ηπ-ω seja pequeno. Para o exemplo da figura 21, a frequência é o=6,25^· conforme indicado pela linha pontilhada horizontal 2101. Neste caso, as três sub-bandas para n=5,6,7, representadas pelas referências numéricas 2102, 2103, 2104, respectivamente, contêm sinais de sub-banda significativos não iguais a zero. O sombreamento dessas três sub-bandas reflete a amplitude relativa das senoides complexas em cada sub-banda obtida a partir da fórmula (4). Um sombreamento mais escuro significa uma amplitude maior. No exemplo concreto, isto significa que a amplitude da sub-banda 5, isto é, 2102, é menor comparada à amplitude da sub-banda 7, isto é, 2104, que, novamente, é menor que a amplitude da sub-banda 6, isto é, 2103. É importante notar que pode ser necessário, em geral, que as várias sub-bandas diferentes de zero sejam capazes de sintetizar uma senoide de alta qualidade na saída do banco de filtro de síntese, especialmente em casos onde a janela tem uma aparência como a janela 2001 da figura 20, com uma duração relativamente curta e lobos laterais significativos em frequência.
[0090] Os sinais de sub-banda de síntese /n(k) também podem ser determinados como resultado do banco de filtro de análise 301 e do processamento não linear, isto é, o transpondedor harmônico 302 ilustrado na figura 3. No lado do banco de filtro de análise, os sinais de sub-banda de análise xn(k) podem ser representados como uma função do sinal de origem z(f). Para uma transposição de ordem T, um banco de filtro de análise modulado complexo com janela wi(t)=w(t/T)/T, uma distância, e uma etapa de frequência de modulação, que é T vezes mais fina do que a etapa de frequência do banco de síntese, é aplicado no sinal de origem z(f). A figura 22 ilustra a
Petição 870190115842, de 11/11/2019, pág. 60/87
32/52 aparência da janela escalonada wt 2201 e sua transformada de Fourier wt 2202. Comparada à figura 20, a janela de tempo 2201 é esticada e a janela de frequência 2202 é compactada.
[0091] A análise pelo banco de filtro modificado causa os sinais de subbanda de análise xn(k) .ηπ . .. ,
-z-y(r-Á;) dt xn(k) = $z(f)wT(t-k)exp (5) [0092] Para uma senoide, z(f)=Bcos(<^+<p)=Re{Dexp(/<^)}, descobre-se que os sinais de sub-banda de (5) para n suficientemente grande com boa aproximação são dados por x (k) = D exp(z7£) - 7£).
(6) [0093] Portanto, submetendo-se esses sinais de sub-banda ao transpondedor harmônico 302 e aplicando-se a regra de transposição direta (1) em (6) rende ίν(ηπ-Τξ) yn(k} = gD 7-7 exptikTξΎ(ηπ-Τξ) .
(7) [0094] Os sinais de sub-banda de síntese yn(k) dados pela fórmula (4) e os sinais de sub-banda não lineares obtidos através da transposição harmônica yn(k) dados por (7) formal devem idealmente se corresponder.
[0095] Para ordens de transposição ímpares T, o fator contendo a influência da janela em (7) é igual a um, visto que a transformada de Fourier da janela é avaliada real por hipótese, e 7-1 é um número par. Portanto, a fórmula (7) pode exatamente se corresponder à fórmula (4) com ω=Τξ, para todas as sub-bandas, de tal modo que a saída do banco de filtro de síntese com sinais de sub-banda de entrada de acordo com fórmula (7) seja uma senoide com uma frequência ω=Τξ, uma amplitude A=gB, e uma fase θ=Τφ, sendo que B e φ são determinados a partir da fórmula: D = Bexp(/\z>), que í \Ί~λ „ D _ gBexp(iT<p) _gBexp(jyCp) portanto, mediante inserção produz obtém-se uma transposição harmônica de ordem T do sinal de origem senoidal z(t).
Petição 870190115842, de 11/11/2019, pág. 61/87
33/52 [0096] Para T par, a correspondência é mais aproximada, porém ainda se mantém na parte avaliada positiva da resposta de frequência de janela w, que para uma janela avaliada real simétrica inclui o lobo principal mais importante. Isto significa que também para valores pares de 7] se obtém uma transposição harmônica do sinal de origem senoidal z(t). No caso particular de uma janela Gaussiana, # é sempre positivo e, consequentemente, não há diferenças em desempenho para ordens pares e ímpares de transposição.
[0097] De modo semelhante à fórmula (6), a análise de uma senoide com frequência ξ+Ω, isto é, o sinal de origem senoidal z(t) = B' οο5((ξ+Ω)ί + = Ρθ{Εθχρ(/(ξ +Ω)/)}, é x'n(k) = Eexp(ik(£ + Ω)) \ν(ηπ - Τ(ξ + Ω)).
[0098] Portanto, carregando-se os dois sinais de sub-banda /zi = xn pi(k), que correspondem ao sinal 801 na figura 8, e w//2 = x' n+P2(k), que corresponde ao sinal 802 na figura 8, no processamento de produto cruzado
800-n ilustrado na figura 8 e aplicando-se a fórmula de produto cruzado (2) produz o sinal de sub-banda de saída 803 yn W = g exp \jk (Τξ + γΩ)]Μ(Χ ξ),
w) onde
Μ(η,ξ)
DT~’E’ ύ([η-ρλ)π-Τξ)Τ ’ w((h + ρ2)π-Τ(ξ + Ω))?
1-1/Γ
I 7 . [1-1/71 τ
Γ Ρι)π ιν((« + ρ2)^·-Γ(^ + Ω)) (10) [0099] A partir da fórmula (9), pode-se observar que a evolução de fase do sinal de sub-banda de saída 803 do sistema de MISO 800-n segue a evolução de fase de uma análise de uma senoide de frequência 7ξ +/Ώ. Isto independe da escolha dos deslocamentos de índice pi e p2. De fato, se o sinal de sub-banda (9) for carregado em um canal de sub-banda n correspondente à frequência Τξ +/Ώ, ou seja, se ηπ^ Τξ+ιΏ., então, a saída será uma contribuição para a geração de uma senoide em frequência Τξ+ιΏ.. No entanto, é vantajoso ter certeza que cada contribuição é significante, e que as contribuições sejam adicionadas de modo benéfico. Estes aspectos serão discutidos mais adiante.
Petição 870190115842, de 11/11/2019, pág. 62/87
34/52 [00100] Dado um parâmetro de timbre de aprimoramento de produtos cruzados Ω, as escolhas adequadas para deslocamentos de índice pi e p? podem ser derivadas na ordem para magnitude complexa Μ(η,ξ) de (10) até aproximadamente ®(ηπ-(Ύξ +γΩ)) para uma faixa de sub-bandas n, neste caso, a saída final se aproximará de uma senoide na frequência Τξ +γΩ. Uma primeira consideração em lobos principais impõe todos os três valores de (η-ρι)π-Τξ, (n+p2 )π-Τ(ξ+Ω), ηπ-(Τς+ΓΩ) como sendo simultaneamente pequenos, levando às igualdades aproximadas
p.~r— p2~(T-r)— π e π (11) [00101] Isto significa que quando o parâmetro de timbre de aprimoramento de produtos cruzados Ω for conhecido, os deslocamentos de índice podem ser aproximados pela fórmula (11), permitindo, assim, uma simples seleção de sub-bandas de análise. Uma análise mais completa dos efeitos da escolha dos deslocamentos de índice p?, e p2 de acordo com a fórmula (11) na magnitude do parâmetro Μ(η,ξ) de acordo com fórmula (10) pode ser realizada para casos especiais importantes de funções de janela w(t), tal como a janela Gaussiana e uma janela senoidal. Descobre-se que a aproximação desejada a η(ηπ-(Τξ +/Ώ)) é muito boa para várias sub-bandas com ηπ^ Τξ+ιΏ., [00102] Deve-se notar que a relação (11) é calibrada à situação exemplificadora onde o banco de filtro de análise 301 tem um espaçamento de subbanda de frequência angular de πΓΓ. No caso geral, a interpretação resultante de 11 é que o intervalo de origem de termo cruzado pi, + p2é um número inteiro que se aproxima da frequência fundamental subjacente Ω, medida em unidades do banco de filtro de análise espaçamento de sub-banda, e que o par (pi, P2) é escolhido como um múltiplo de (r,T-r).
[00103] Para a determinação do par de deslocamento de índices (pi,p2) no decodificador, podem-se utilizar os modos a seguir:
[00104] Um valor de Ω pode ser derivado no processo de codificação e explicitamente transmitido ao decodificador em uma precisão suficiente para derivar os valores inteiros de pi e P2 por meio de um processamento ade
Petição 870190115842, de 11/11/2019, pág. 63/87
35/52 quado de arredondamento, que pode seguir os princípios que [00105] pi + p2 se aproxima de Ω/Δο, onde Δο é um espaçamento de frequência angular do banco de filtro de análise; e [00106] Pi, p2 é escolhido para se aproximar de r/(T -r).
[00107] Para cada amostra de sub-banda de destino, o par de deslocamento de índices (pi,p2) pode ser derivado no decodificador a partir de uma lista predeterminada de valores candidatos, tais como (pi, P2) = (rl,(T - r)l),l e L, r eonde L é uma lista de números inteiros positivos.
[00108] A seleção pode se basear em uma otimização da magnitude de saída de termos cruzados, por exemplo, uma maximização da energia da saída de termos cruzados.
[00109] Para cada amostra de sub-banda de destino, o par de deslocamento de índices (pi, P2) pode ser derivado a partir de uma lista reduzida de valores candidatos por uma otimização da magnitude de saída de termos cruzados, onde a lista reduzida de valores candidatos é derivada no processo de codificação e transmitida ao decodificador.
[00110] Deve-se notar que a modificação de fase dos sinais de subbanda μι e μ2 é realizada com uma ponderação (T - r) e r, respectivamente, porém, as distâncias de índice de sub-banda pi e p2 são escolhidas proporcionalmente are (T-r), respectivamente. Portanto, a sub-banda mais próxima à sub-banda de síntese n recebe a modificação de fase mais forte.
[00111] Um método vantajoso para o procedimento de otimização para os modos 2 e 3 descritos anteriormente pode considerar a otimização MaxMin:
max{min|x„„A (&)|,|x„+^)|}: (p15jp2) = (r/,(Z-r)/),/ e L,r e {1,2,...,7-1}}, e utilizar o par vencedor junto a seu valor correspondente de r para construir a contribuição de produtos cruzados para um determinado índice de subbanda de destino n. Nos modos orientados de busca de decodificador 2 e, também, parcialmente 3, a adição de termos cruzados para diferentes valores r é preferencialmente realizada de modo independente, visto que pode existir um risco de adicionar um conteúdo à mesma sub-banda várias vezes. Se, por outro lado, a frequência fundamental Ω for usada para selecionar as
Petição 870190115842, de 11/11/2019, pág. 64/87
36/52 sub-bandas conforme no modo 1 ou se apenas uma faixa estreita de distâncias de índice de sub-banda for permitida conforme pode ser o caso no modo 2, pode-se evitar este problema particular de adicionar conteúdos à mesma sub-banda várias vezes.
[00112] Além disso, deve-se notar, também, que para as modalidades dos esquemas de processamento de termo cruzado descritas anteriormente, uma modificação de decodificador adicional do ganho de produto cruzado g pode ser benéfica. Por exemplo, refere-se aos sinais de sub-banda de entrada μι, μ2 à unidade de MISO de produtos cruzados dada pela fórmula (2) e o sinal de sub-banda de entrada x à unidade de SISO de transposição dada pela fórmula (1). Se todos os três sinais precisam ser carregados à mesma sub-banda de síntese de saída, conforme mostrado na figura 4, onde o processamento direto 401 e o processamento de produtos cruzados 402 proporcionam componentes para a sub-banda de síntese de saída, pode ser desejável ajustar o ganho de produto cruzado g para zero, isto é, a unidade de ganho 902 da figura 9, se minílwj |,|z/2|) < ç|x|, para um limite predefinido q >1. Em outras palavras, a adição de produtos cruzados é somente realizada se a magnitude de sub-banda de entrada de termo direto |x| for pequena comparada a ambas dos termos de entrada de produtos cruzados. Neste contexto, x é a amostra de sub-banda de análise para um processamento de termo direto que leva a uma saída na mesma sub-banda de síntese do produto cruzado sob consideração. Isto pode ser uma precaução com a finalidade de não aprimorar adicionalmente um componente harmônico que já foi finalizado pela transposição direta.
[00113] A seguir, o método de transposição harmônica descrito no presente documento será descrito para configurações espectrais exemplificadoras de modo a ilustras os aprimoramentos em relação à técnica anterior. A figura 10 ilustra o efeito da transposição harmônica direta de ordem T= 2. O diagrama superior 1001 descreve os componentes de frequência parcial do sinal original por setas verticais posicionadas em múltiplos da frequência fundamental Ω. O mesmo ilustra o sinal de origem, por exemplo, no lado do
Petição 870190115842, de 11/11/2019, pág. 65/87
37/52 codificador. O diagrama 1001 é segmentado em uma faixa de frequências de origem à esquerda com frequências parciais Ω,2Ω,3Ω,4Ω,5Ω e em uma faixa de frequências de destino à direita com frequências parciais 6Ω,7Ω,8Ω . A faixa de frequências de origem será tipicamente codificada e transmitida ao codificador. Por outro lado, a faixa de frequências de destino à direita, que compreende as frequências parciais 6Ω,7Ω,8Ω acima da frequência de cruzamento 1005 do método de HFR, tipicamente não será transmitida ao decodificador. Um objetivo do método de transposição harmônica consiste em reconstruir a faixa de frequências de destino acima da frequência de cruzamento 1005 do sinal de origem a partir da faixa de frequências de origem. Consequentemente, a faixa de frequências de destino, e, notavelmente, as frequências parciais 6Ω,7Ω,8Ω no diagrama 1001 não estão disponíveis como uma entrada ao transpondedor.
[00114] Conforme descrito anteriormente, o objetivo do método de transposição harmônica consiste em regenerar os componentes de sinal 6Ω,7Ω,8Ω do sinal de origem a partir dos componentes de frequência disponíveis na faixa de frequências de origem. O diagrama inferior 1002 mostra a saída do transpondedor na faixa de frequências de destino à direita. Esse transpondedor pode, por exemplo, ser colocado no lado do decodificador. Os parciais em frequências 6Ω e 8Ω são regenerados a partir dos parciais em frequências 3Ω e 4Ω através de transposição harmônica utilizando-se uma ordem de transposição 7=2. Como resultado de um efeito de esticamento espectral da transposição harmônica, descreve-se, através das setas pontilhadas 1003 e 1004, que o parcial de destino em 7Ω está faltando. Este parcial de destino em 7Ω não pode ser gerado utilizando-se o método de transposição harmônica da técnica anterior subjacente.
[00115] A figura 11 ilustra o efeito da invenção para transposição harmônica de um sinal periódico no caso onde um transpondedor harmônico de segunda ordem é aprimorado por um único termo cruzado, isto é 7 = 2 e r = 1. Conforme descrito no contexto da figura 10, utiliza-se um transpondedor para gerar os parciais 6Ω,7Ω,8Ω na faixa de frequências de destino acima da frequência de cruzamento 1105 no diagrama inferior 1102 a partir dos
Petição 870190115842, de 11/11/2019, pág. 66/87
38/52 parciais Ω,Ω2,3Ω,4Ω,5Ω na faixa de frequências de origem abaixo da frequência de cruzamento 1105 do diagrama 1101. Além da saída do transpondedor da técnica anterior da figura 10, o componente de frequência parcial em 7Ω é regenerado a partir de uma combinação dos parciais de origem em 3Ω e 4Ω. O efeito da adição de produtos cruzados é descrito pelas setas pontilhadas 1103 e 1104. Em termos das fórmulas, ω - 3Ω e, portanto, (7 γ)ο+γ(0+Ω) = 7ο+/Ώ = 6Ω+Ω = 7Ω. Conforme se pode observar a partir deste exemplo, todos os parciais de destino podem ser regenerados utilizandose o método de HFR da invenção descrito no presente documento.
[00116] A figura 12 ilustra uma possível implementação de um transpondedor harmônico de segunda ordem de técnica anterior em um banco de filtro modulado para a configuração espectral da figura 10. As respostas de frequência estilizada das sub-bandas de banco de filtro de análise são mostradas pelas linhas pontilhadas, por exemplo, referência numérica 1206, no diagrama superior 1201. As sub-bandas são enumeradas pelo índice de subbanda, entre as quais os índices 5, 10 e 15 são mostrados na figura 12. Para o determinado exemplo, a frequência fundamental Ω é igual a 3,5 vezes o espaçamento de frequência de sub-banda de análise. Isto é ilustrado pelo fato de que o parcial Ω no diagrama 1201 é posicionado entre as duas subbandas com o índice de sub-banda 3 e 4. O parcial 2Ω é posicionado na parte central da sub-banda com o índice de sub-banda 7 e assim por diante.
[00117] O diagrama inferior 1202 mostra os parciais regenerados 6Ω e 8Ω sobrepostos com as respostas de frequência estilizada, por exemplo, a referência numérica 1207, das sub-bandas de banco de filtro de síntese selecionadas. Conforme descrito anteriormente, essas sub-bandas têm um espaçamento de frequência 7=2 vezes mais grosseiro. De modo correspondente, as respostas de frequência são escalonadas pelo fator 7=2. Conforme descrito anteriormente, o método de processamento de termo direto da técnica anterior modifica a fase de cada sub-banda de análise, isto é, de cada sub-banda abaixo da frequência de cruzamento 1205 no diagrama 1201, por um fator 7 = 2 e mapeia o resultado na sub-banda de síntese com o mesmo índice, isto é, uma sub-banda acima da frequência de cruzamento
Petição 870190115842, de 11/11/2019, pág. 67/87
39/52
1205 no diagrama 1202. Este é simbolizado na figura 12 por setas pontilhadas diagonais, por exemplo, a seta 1208 para a sub-banda de análise 1206 e a sub-banda de síntese 1207. O resultado deste processamento de termo direto para sub-bandas com os índices de sub-bandas 9 a 16 a partir da subbanda de análise 1201 é a regeneração dos parciais de destino em frequências 6Ω e 8Ω na sub-banda de síntese 1202 a partir dos parciais de origem em frequências 352 e 452. Conforme se pode observar a partir da figura 12, a contribuição principal ao parcial de destino 6Ω vem a partir das subbandas com os índices de sub-bandas 10 e 11, isto é, os símbolos de referência 1209 e 1210, e a contribuição principal ao parcial de destino 8Ω vem a partir da sub-banda com o índice de sub-banda 14, isto é, a referência numérica 1211.
[00118] A figura 13 ilustra uma possível implementação de uma etapa adicional de processamento de termo cruzado no banco de filtro modulado da figura 12. A etapa de processamento de termo cruzado corresponde àquela descrita para sinais periódicos com a frequência fundamental Ω em relação à figura 11.0 diagrama superior 1301 ilustra as sub-bandas de análise, entre as quais a faixa de frequências de origem deve ser transposta na faixa de frequências de destino das sub-bandas de síntese no diagrama inferior 1302. Considera-se o caso particular da geração das sub-bandas de síntese 1315 e 1316, que estão circundando o parcial 7Ω, a partir das subbandas de análise. Para uma ordem de transposição 7=2, pode-se selecionar um valor possível r =1. A escolha da lista de valores candidatos (pi, p?)
ÍL como um múltiplo de (r,T-r) _ (1,1) de tal modo que pi + p2 aproxime de = ,ft,3= 3,5, isto e a frequência fundamental Ω em unidades do espaçamento de frequência de sub-banda de análise, leva à escolha pi = p? = 2 . Conforme descrito no contexto da figura 8, pode-se gerar uma sub-banda de síntese com o índice de sub-banda n a partir do produto de termo cruzado das sub-bandas de análise com o índice de sub-banda (n - pi) e (n + p2). Consequentemente, para a sub-banda de síntese com o índice de sub-banda 12, isto é, a referência numérica 1315, forma-se um produto cruzado a partir das sub-bandas de análise com o índice de sub-banda (n - pi) =12-2 =10, isto é,
Petição 870190115842, de 11/11/2019, pág. 68/87
40/52 a referência numérica 1311, e (η + P2) =12+2 =14, isto é, a referência numérica 1313. Para a sub-banda de síntese com o índice de sub-banda 13, forma-se um produto cruzado a partir das sub-bandas de análise e o índice (n p?)=13 - 2=11, isto é, a referência numérica 1312, e (n + p2)=13 + 2=15, isto é, a referência numérica 1314. Este processo de geração de produto cruzado é simbolizado pelos pares de setas tracejadas/pontilhadas diagonais, isto é, os pares de referências numéricas 1308, 1309 e 1306, 1307, respectivamente.
[00119] Conforme se pode observar a partir da figura 13, o parcial 7Ω é colocado primeiramente na sub-banda 1315 com índice 12 e apenas em segundo lugar na sub-banda 1316 com índice 13. Consequentemente, para respostas de filtro mais realísticas, existirão mais termos diretos e/ou cruzados ao redor da sub-banda de síntese 1315 com índice 12 que adicionam beneficamente à síntese de uma senoide de alta qualidade em frequência (7 -γ)®+γ(0+Ω) = Τω+/Ώ = 6Ω + Ω = 7Ω do que termos ao redor da sub-banda de síntese 1316 com índice 13. Além disso, conforme destacado no contexto de fórmula (13), uma adição oculta de todos os termos cruzados com pi = P2 = 2 pode levar a componentes de sinal indesejado para sinais de entrada menos periódicos e acadêmicos. Consequentemente, este fenômeno de componentes de sinal indesejados pode requerer a aplicação de uma regra de cancelamento de produto cruzado adaptativo, tal como a regra dada pela fórmula (13).
[00120] A figura 14 ilustra o efeito da transposição harmônica da técnica anterior de ordem 7 = 3. O diagrama superior 1401 descreve os componentes de frequência parcial do sinal original por setas verticais posicionadas em múltiplos da frequência fundamental Ω. Os parciais 6Ω,7Ω,8Ω,9Ω se encontram na faixa de destino acima da frequência de cruzamento 1405 do método de HFR e, portanto, não disponível como uma entrada ao transpondedor. O objetivo da transposição harmônica consiste em regenerar estes componentes de sinal a partir do sinal na faixa de origem. O diagrama inferior 1402 mostra a saída do transpondedor na faixa de frequências de destino. Os parciais em frequências 6Ω, isto é, a referência numérica 1407, e 9Ω, isto é,
Petição 870190115842, de 11/11/2019, pág. 69/87
41/52 a referência numérica 1410, foram regenerados a partir dos parciais em frequências 2Ω, isto é, a referência numérica 1406, e 3Ω, isto é, a referência numérica 1409. Como resultado de um efeito de esticamento espectral da transposição harmônica, descreve-se através das setas pontilhadas 1408 e 1411, respectivamente, os parciais de destino em 7Ω e 8Ω que estão faltando.
[00121] A figura 15 ilustra o efeito da invenção para a transposição harmônica de um sinal periódico no caso onde um transpondedor harmônico de terceira ordem é aprimorado pela adição de dois termos cruzados diferentes, isto é T = 3 e r =1,2 . Além da saída do transpondedor de técnica anterior da figura 14, o componente de frequência parcial 1508 em 7Ω é regenerado pelo termo cruzado para r =1 a partir de uma combinação dos parciais de origem 1506 em 252 e 1507 em 3Ω. O efeito da adição de produtos cruzados é descrito pelas setas tracejadas 1510 e 1511. Em termos de fórmulas, temos ω = 2Ω, (T - r)o + r(co + Ω) = Τω + /Ώ = 6Ω + 5Ω = 7Ω . Da mesma forma, o componente de frequência parcial 1509 em 8Ω é regenerado pelo termo cruzado para r = 2 . Este componente de frequência parcial 1509 na faixa de destino do diagrama inferior 1502 é gerado a partir dos componentes de frequência parcial 1506 em 2Ω e 1507 em 3Ω na faixa de frequências de origem do diagrama superior 1501. A geração do produto de termo cruzado é descrita pelas setas 1512 e 1513. Em termos de fórmulas, temos ω = 2Ω, (T - ήω + r(o + Ω) = To + /Ώ = 6Ω + 2Ω = 8Ω. Conforme se pode observar, todos os parciais de destino podem ser regenerados utilizando-se o método de HFR da invenção no presente documento.
[00122] A figura 16 ilustra uma possível implementação de um transpondedor harmônico de terceira ordem da técnica anterior em um banco de filtro modulado para a situação espectral da figura 14. As respostas de frequência estilizada das sub-bandas de banco de filtro de análise são mostradas pelas linhas pontilhadas no diagrama superior 1601. As sub-bandas são enumeradas pelos índices de sub-bandas 1 a 17 entre os quais as sub-bandas 1606, com índice 7, 1607, com índice 10 e 1608, com índice 11, são referenciadas de modo exemplificador. Para o exemplo dado, a frequência fundamental Ω
Petição 870190115842, de 11/11/2019, pág. 70/87
42/52 é igual a 3,5 vezes o espaçamento de frequência de sub-banda de análise Δο. O diagrama inferior 1602 mostra a frequência parcial regenerada sobreposta às respostas de frequência estilizada de sub-bandas selecionadas de banco de filtro de síntese. A título de exemplo, as sub-bandas 1609, com índice de sub-banda 7, 1610, com índice de sub-banda 10 e 1611, com índice de sub-banda 11 são referenciadas. Conforme descrito anteriormente, estas sub-bandas têm um espaçamento de frequência Δο T = 3 vezes mais grosseiro. De modo correspondente, as respostas de frequência também são escalonadas.
[00123] O processamento de termo direto da técnica anterior modifica a fase dos sinais de sub-banda por um fator T = 3 para cada sub-banda de análise e mapeia o resultado na sub-banda de síntese com o mesmo índice, conforme simbolizado pelas setas pontilhadas diagonais. O resultado deste processamento de termo direto para sub-bandas 6 a 11 é a regeneração das duas frequências parciais de destino 6Ω e 9Ω a partir dos parciais de origem em frequências 2Ω e 3Ω. Conforme se pode observar a partir da figura 16, a contribuição principal ao parcial de destino 6Ω vem a partir da sub-banda com índice 7, isto é, a referência numérica 1606, e as contribuições principais ao parcial de destino 9Ω vem a partir das sub-bandas com índice 10 e 11, isto é, as referências numéricas 1607 e 1608, respectivamente.
[00124] A figura 17 ilustra uma possível implementação de uma etapa adicional de processamento de termo cruzado para r =1 no banco de filtro modulado da figura 16 que leva à regeneração do parcial em 7Ω. Conforme descrito no contexto da figura 8, os deslocamentos de índice (pi, P2) podem ser selecionados como um múltiplo de (r,T - r) = (1,2), de tal modo que pi + P2 se aproxime de 3,5, isto é, a frequência fundamental Ω em unidades do espaçamento de frequência de sub-banda de análise Δο. Em outras palavras, a distância relativa, isto é, a distância no eixo geométrico de frequência dividida pelo espaçamento de frequência de sub-banda de análise Δο, entre as duas sub-bandas de análise que contribuem à sub-banda de síntese que deve ser gerada, deve aproximar melhor a frequência fundamental relativa, isto é, a frequência fundamental Ω dividida pelo espaçamento de frequência
Petição 870190115842, de 11/11/2019, pág. 71/87
43/52 de sub-banda de análise Δο. Esta também é expressa pelas fórmulas (11) e leva à escolha pi =1, p?= 2.
[00125] Conforme mostrado na figura 17, a sub-banda de síntese com índice 8, isto é, a referência numérica 1710, é obtida a partir de um produto cruzado formado a partir das sub-bandas de análise com índice (n - pi) = 8 1 = 7, isto é, a referência numérica 1706, e (η + P2) = 8 + 2 = 10, isto é, a referência numérica 1708. Para a sub-banda de síntese com índice 9, um produto cruzado é formado a partir das sub-bandas de análise com índice (n - pi) = 9 - 1 =8, isto é, a referência numérica 1707, e (η + P2) = 9 + 2 = 11, isto é, a referência numérica 1709. Este processo de formação de produtos cruzados é simbolizado pelos pares de setas diagonais tracejadas/ pontilhadas, isto é, o par de setas 1712, 1713 e 1714, 1715, respectivamente. Podese observar a partir da figura 17 que a frequência parcial 7Ω é posicionada na sub-banda 1710 de forma mais destacada do que a sub-banda 1711. Consequentemente, deve-se esperar que para respostas de filtro realísticas, existam mais termos cruzados ao redor da sub-banda de síntese com índice 8, isto é, a sub-banda 1710, que adicionam beneficamente à síntese de uma senoide de alta qualidade em frequência(T - r)co + r(o + Ω) = Τω + /Ώ = 6Ω + Ω = 7Ω.
[00126] A figura 18 ilustra uma possível implementação de uma etapa adicional de processamento de termo cruzado para r = 2 no filtro de banco modulado da figura 16 que leva à regeneração da frequência parcial em 8Ω. Os deslocamentos de índice (pi, pz) podem ser selecionados como um múltiplo de (r,T - r) = (2,1), de tal modo que pi + p2 se aproxime de 3,5, isto é, a frequência fundamental Ω em unidades do espaçamento de frequência de sub-banda de análise Δο. Isto leva à escolha pi = 2, p2 = 1. Conforme mostrado na figura 18, a sub-banda de síntese com índice 9, isto é, a referência numérica 1810, é obtida a partir de um produto cruzado formado a partir das sub-bandas de análise com índice (n - pi) = 9 - 2 = 7, isto é, a referência numérica 1806, e (η + P2) = 9 + 1 =10, isto é, a referência numérica 1808. Para a sub-banda de síntese com índice 10, forma-se um produto cruzado a partir das sub-bandas de análise com índice (n-pi) =10 -2 = 8, isto é, a referência
Petição 870190115842, de 11/11/2019, pág. 72/87
44/52 numérica 1807, e (η + P2) = 10 + 1= 11, isto é, a referência numérica 1809. Este processo de formação de produtos cruzados é simbolizado pelos pares de setas diagonais tracejadas/pontilhadas, isto é, o par de setas 1812, 1813 e 1814, 1815, respectivamente. Pode-se observar a partir da figura 18 que a frequência parcial 8Ω é posicionada de modo ligeiramente mais destacado na sub-banda 1810 do que na sub-banda 1811. Consequentemente, deve-se esperar que para respostas de filtro realísticas, existam mais termos diretos e/ou cruzados ao redor da sub-banda de síntese com índice 9, isto é, a subbanda 1810, que adicionam beneficamente à síntese de uma senoide de alta qualidade em frequência (T - r)w + r(co + Ω) = Τω + /Ώ = 2Ω + 6Ω = 8Ω . [00127] A seguir, faz-se referência às figuras 23 e 24 que ilustram o procedimento de seleção baseado na otimização Máx-Mín (12) para o par de deslocamento de índices (pi, P2) e r de acordo com esta regra para 7 = 3. O índice de sub-banda de destino escolhido é n =18 e o diagrama superior fornece um exemplo da magnitude de um sinal de sub-banda para um determinado índice de tempo. A lista de números inteiros positivos é dado pelos sete valores L = {2,3,...,8}.
[00128] A figura 23 ilustra a busca por candidatos com r =1. A sub-banda de síntese ou alvo é mostrada com o índice n =18. A linha pontilhada 2301 destaca a sub-banda com o índice n =18 na faixa superior de sub-banda de análise e na faixa inferior de sub-banda de síntese. Os possíveis pares de deslocamentos de índices são (pi, P2) = {(2,4),(3,6),..., (8,16)}, para 1 = 2,3,...,8, respectivamente, e os pares de índice amostrai de magnitude de sub-banda de análise correspondentes, isto é, a lista de pares de índice de sub-banda que são considerados para determinar o termo cruzado ótimo, são {(16,22),(15,24),...,(10,34)}. O conjunto de setas ilustra os pares sob consideração. Como um exemplo, mostra-se o par (15,24) denotado pelas referências numéricas 2302 e 2303. A avaliação do mínimo destes pares de magnitude fornece a lista (0,4,1,0,0,0,0) de respectivas magnitudes mínimas para a possível lista de termos cruzados. Visto que a segunda entrada para / = 3 é máxima, o par (15,24) vence entre os candidatos com r=1, e esta seleção é descrita pelas setas grossas.
Petição 870190115842, de 11/11/2019, pág. 73/87
45/52 [00129] A figura 24 ilustra, de modo semelhante, a busca por candidatos com r= 2. A sub-banda de síntese ou alvo é mostrada com o índice n =18. A linha pontilhada 2401 destaca a sub-banda com o índice n =18 na faixa superior de sub-banda de análise e na faixa inferior de sub-banda de síntese. Neste caso, os possíveis pares de deslocamentos de índices são (pi, P2) = {(4,2),(6,3),...,(16,8)} e os pares de índices amostrais de magnitude de subbanda de análise correspondentes são {(14,20),(12,21 ),...,(2,26)}, entre os quais o par (6,24) é representado pelas referências numéricas 2402 e 2403. A avaliação do mínimo desses pares de magnitude fornece a lista (0,0,0,0,3,1,0). Visto que a quinta entrada é máxima, isto é, / = 6, o par (6,24) vence entre os candidatos com r = 2, conforme descrito pelas setas grossas. Em geral, visto que o mínimo dos pares de magnitude correspondentes é menor que aquele do par de sub-banda selecionado para r =1, a seleção final para o índice de sub-banda de destino n =18 se encontra no par (15,24) e r=1.
[00130] Deve-se notar, ainda, que quando o sinal de entrada z(t) for uma série harmônica com uma frequência fundamental Ω, isto é, com uma frequência fundamental que corresponde ao parâmetro de timbre de aprimoramento de produtos cruzados, e Ω for suficientemente grande comparado à resolução de frequência do banco de filtro de análise, os sinais de subbanda de análise xn(k) dados pela fórmula (6) e x'n(k) dado pela fórmula (8) são boas aproximações da análise do sinal de entrada z(t) onde a aproximação é válida em diferentes regiões de sub-banda. Isto segue a partir de uma comparação das fórmulas (6) e (8-10) que uma evolução de fase harmônica ao longo do eixo geométrico de frequência do sinal de entrada z(t) será corretamente extrapolada pela presente invenção. Em particular, isto se mantém para uma sequência de pulsos pura. Para uma qualidade de áudio de saída, isto consiste em um recurso atrativo para sinais de caractere tipo sequência de pulsos, tais como aqueles produzidos por vozes humanas e alguns instrumentos musicais.
[00131] As figuras 25, 26 e 27 ilustram o desempenho de uma implementação exemplificadora da transposição inventiva para um sinal harmôni
Petição 870190115842, de 11/11/2019, pág. 74/87
46/52 co no caso T = 3. O sinal tem uma frequência fundamental 282,35 Hz e seu espectro de magnitude na faixa de destino considerada de 10 a 15 kHz é descrito na figura 25. Um banco de filtro de N =512 sub-bandas é usado em uma frequência de amostragem de 48 kHz para implementar as transposições. O espectro de magnitude da saída de um transpondedor direto de terceira ordem (T=3) é descrito na figura 26. Conforme se pode observar, cada terceira harmônica é reproduzida com alta fidelidade conforme previsto pela teoria descrita anteriormente, e o timbre captado será igual a 847 Hz, três vezes o timbre original. A figura 27 mostra a saída de um transpondedor que aplica produtos de termo cruzado. Todas as harmônicas foram recriadas até as imperfeições devido aos aspectos aproximativos da teoria. Para este caso, os lobos laterais são cerca de 40 dB abaixo do nível de sinal e este é mais do que suficiente para regeneração de conteúdos de alta frequência que são perceptivamente indistinguíveis do sinal harmônico original.
[00132] A seguir, faz-se referência às figuras 28 e 29 que ilustram um codificador exemplificador 2800 e um decodificador exemplificador 2900, respectivamente, para codificação unificada de fala e áudio (USAC). A estrutura geral do codificador de USAC 2800 e do decodificador 2900 é descrita da seguinte forma: primeiramente, pode existir um pré/pós-processamento comum que consiste em uma unidade funcional MPEG Surround (MPEGS) para manipular um processamento estéreo ou multicanais e uma unidade de SBR aprimorada (eSBR) 2801 e 2901, respectivamente, que manipula a representação paramétrica das frequências de áudio superiores no sinal de entrada e que pode fazer uso dos métodos de transposição harmônica descritos no presente documento. Então, existem duas ramificações, uma consistindo em um caminho de ferramenta de Codificação de Áudio Avançado modificado (AAC) e a outra consistindo em um caminho baseado em uma codificação de predição linear (domínio LP ou LPC), que descreve, sucessivamente, uma representação de domínio de frequência ou uma representação de domínio de tempo do LPC residual. Todos os espectros transmitidos para ambos, AAC e LPC, podem ser representados no domínio de MDCT seguindo uma codificação de quantização e aritmética. A representação de
Petição 870190115842, de 11/11/2019, pág. 75/87
47/52 domínio de tempo utiliza um esquema de codificação de excitação de ACELP.
[00133] A unidade de Replicação de Banda Espectral aprimorada (eSBR) 2801 do codificador 2800 pode compreender os sistemas de reconstrução de alta frequência descritos no presente documento. Em particular, a unidade de eSBR 2801 pode compreender um banco de filtro de análise 301 com a finalidade de gerar uma pluralidade de sinais de sub-banda de análise. Estes sinais de sub-banda de análise podem, então, ser transpostos em uma unidade de processamento não linear 302 de modo a gerar uma pluralidade de sinais de sub-banda de síntese, que podem, então, ser inseridos em um banco de filtro de síntese 303 com a finalidade de gerar um componente de frequência alta. Na unidade de eSBR 2801, no lado de codificação, podese determinar um conjunto de informações de como gerar um componente de frequência alta a partir do componente de frequência baixa que melhor se adéqua ao componente de frequência alta do sinal original. Este conjunto de informações pode compreender informações em características de sinal, tal como uma frequência fundamental predominante Ω, no envelope espectral do componente de frequência alta, e pode compreender informações de como melhor combinar os sinais de sub-banda de análise, isto é, as informações como um conjunto limitado de pares de deslocamentos de índices (pi,P2). Os dados codificados para este conjunto de informações são unidos às outras informações codificadas em um multiplexador de fluxo de bits e repassados como um fluxo de áudio codificado a um decodificador correspondente 2900.
[00134] O decodificador 2900 mostrado na figura 29 também compreende uma unidade de Replicação de Largura de banda Espectral aprimorada (eSBR) 2901. Esta unidade de eSBR 2901 recebe o fluxo de bits de áudio codificado ou o sinal codificado a partir do codificador 2800 e utiliza os métodos descritos no presente documento para gerar um componente de frequência alta do sinal, que é unido ao componente de frequência baixa decodificado de modo a produzir um sinal decodificado. A unidade de eSBR 2901 pode compreender os diferentes componentes descritos no presente docu
Petição 870190115842, de 11/11/2019, pág. 76/87
48/52 mento. Em particular, a mesma pode compreender um banco de filtro de análise 301, uma unidade de processamento não linear 302 e um banco de filtro de síntese 303. A unidade de eSBR 2901 pode utilizar informações sobre o componente de frequência alta proporcionado pelo codificador 2800 com a finalidade de realizar a reconstrução de alta frequência. Essas informações podem ser uma frequência fundamental Ω do sinal, o envelope espectral do componente de frequência alta original e/ou as informações sobre as sub-bandas de análise que devem ser usadas com a finalidade de gerar os sinais de sub-banda de síntese e, em último lugar, o componente de frequência alta do sinal decodificado.
[00135] Além disso, as figuras 28 e 29 ilustram possíveis componentes adicionais de um codificador/decodificador de USAC, tais como:
uma ferramenta de demultiplexador de carga útil de fluxo de bits, que separa a carga útil de fluxo de bits em partes para cada ferramenta, e proporciona a cada uma das ferramentas as informações de carga útil de fluxo de bits relacionadas a tal ferramenta;
uma ferramenta de decodificação silenciosa de fator de escalonamento, que recolhe informações a partir do demultiplexador de carga útil de fluxo de bits, analisa essas informações, e decodifica os fatores de escalonamento codificados de Huffman e DPCM;
uma ferramenta de decodificação silenciosa espectral, que recolhe informações a partir do demultiplexador de carga útil de fluxo de bits, analisa essas informações, decodifica os dados aritmeticamente codificados, e reconstrói os espectros quantizados;
uma ferramenta quantizadora inversa, que adota os valores quantizados para os espectros, e converte os valores inteiros em espectros reconstruídos não escalonados; este quantizador é, de preferência, uma compressão de quantizador, cujo fator de compressão depende do modo de codificação de núcleo escolhido;
uma ferramenta de preenchimento de ruídos, que é usada para preencher os vãos espectrais nos espectros decodificados, que ocorrem quando os valores espectrais são quantizados para zero, por exemplo, devi
Petição 870190115842, de 11/11/2019, pág. 77/87
49/52 do a uma forte restrição em demanda de bits no codificador;
uma ferramenta de reescalonamento, que converte a representação inteira dos fatores de escalonamento em valores atuais, e multiplica os espectros quantizados inversamente não escalonados pelos fatores de escalonamento relevantes;
uma ferramenta M/S, conforme descrito em ISO/IEC 14496-3;
uma ferramenta de formatação temporal de ruídos (TNS), conforme descrito em ISO/IEC 14496-3;
uma ferramenta de comutação de bloco/banco de filtro, que aplica o inverso do mapeamento de frequência que foi realizado no codificador; utiliza-se, de preferência, uma transformada de cosseno discreta modificada inversa (IMDCT) para a ferramenta de banco de filtro;
uma ferramenta de comutação de bloco/banco de filtro de tempo deformado, que substitui a ferramenta de comutação de bloco/banco de filtro normal quando um modo de deformação de tempo for habilitado; o banco de filtro é, de preferência, o mesmo (IMDCT) do banco de filtro normal, adicionalmente, as amostras de domínio de tempo janelado são mapeadas a partir do domínio de tempo deformado até o domínio de tempo linear através de re-amostragem de tempo variável;
uma ferramenta MPEG Surround (MPEGS), que produz múltiplos sinais a partir de um ou mais sinais de entrada aplicando-se um procedimento de upmix sofisticado ao(s) sinal(is) de entrada controlado(s) pelos parâmetros espaciais apropriados; no contexto de USAC, MPEGS é preferencialmente usado para codificar um sinal multicanais, transmitindo-se as informações secundárias paramétricas junto a um sinal transmitido submetido à downmix;
uma ferramenta de Classificação de Sinal, que analisa o sinal de entrada original e gera a partir deste as informações de controle que acionam a seleção dos diferentes modos de codificação; a análise do sinal de entrada depende tipicamente da implementação e tentará escolher o modo de codificação de núcleo ótima para um determinado quadro de sinal de entrada; a saída do classificador de sinal também pode opcionalmente ser
Petição 870190115842, de 11/11/2019, pág. 78/87
50/52 usada para influenciar o comportamento de outras ferramentas, por exemplo, MPEG Surround, SBR aprimorado, banco de filtro de tempo deformado e outras;
uma ferramenta de filtro de LPC, que produz um sinal de domínio de tempo a partir de um sinal de domínio de excitação filtrando-se o sinal de excitação reconstruído através de um filtro de síntese de predição linear; e uma ferramenta de ACELP, que proporcionar uma forma para representar eficientemente um sinal de excitação de domínio de tempo combinando-se um indicador de longo prazo (palavra código adaptativa) com uma sequência tipo pulso (palavra código de inovação).
[00136] A figura 30 ilustra uma modalidade das unidades de eSBR mostradas nas figuras 28 e 29. A unidade de eSBR 3000 será descrita a seguir no contexto de um decodificador, onde a entrada à unidade de eSBR 3000 é o componente de frequência baixa, também conhecido como a banda baixa, de um sinal e possíveis informações adicionais referentes características de sinal específicas, tal como uma frequência fundamental Ω, e/ou possíveis valores de deslocamento de índice (ρ-ι,ρζ). No lado do codificador, a entrada à unidade de eSBR será tipicamente o sinal completo, enquanto a saída será informações adicionais referentes às características de sinal e/ou valores de deslocamento de índice.
[00137] Na figura 30, o componente de frequência baixa 3013 é carregado em um banco de filtro de QMF, com a finalidade de gerar bandas de frequência de QMF. Essas bandas de frequência de QMF não devem ser confundidas com as sub-bandas de análise descritas neste documento. As bandas de frequência de QMF são usadas para o propósito de manipulação e união do componente de frequência baixa e alta do sinal no domínio de frequência, em vez de no domínio de tempo. O componente de frequência baixa 3014 é carregado na unidade de transposição 3004 que corresponde aos sistemas para reconstrução de alta frequência descrita no presente documento. A unidade de transposição 3004 também pode receber informações adicionais 3011, tal como a frequência fundamental Ω do sinal codificado
Petição 870190115842, de 11/11/2019, pág. 79/87
51/52 e/ou possíveis pares de deslocamento de índices (ρ-ι,ρ?) para seleção de sub-banda. A unidade de transposição 3004 gera um componente de frequência alta 3012, também conhecido como banda alta, do sinal, que é transformado no domínio de frequência por um banco de filtro de QMF 3003. Tanto o componente de frequência baixa transformado de QMF como o componente de frequência alta transformado de QMF são carregados em uma unidade de manipulação e união 3005. Esta unidade 3005 pode realizar um ajuste de envelope do componente de frequência alta e combina o componente de frequência alta e o componente de frequência baixa ajustados. O sinal de saída combinado é retransformado no domínio de tempo por um banco de filtro de QMF inverso 3001.
[00138] Tipicamente, o banco de filtro de QMF compreende 64 bandas de frequência de QMF. Deve-se notar, no entanto, que pode ser benéfico para reduzir a taxa de amostragem do componente de frequência baixa 3013, de tal modo que o banco de filtro de QMF 3002 apenas precise de 32 bandas de frequência de QMF. Nestes casos, o componente de frequência baixa 3013 tem uma largura de banda de β / 4, onde fs é a frequência de amostragem do sinal. Por outro lado, o componente de frequência alta 3012 tem uma largura de banda de fs /2.
[00139] O método e o sistema descritos no presente documento podem ser implementados como software, firmware e/ou hardware. Determinados componentes podem, por exemplo, ser implementados como um software sendo executado em um processador ou multiprocessador de sinal digital. Outro componente pode, por exemplo, ser implementado como hardware e/ou como circuitos integrados de aplicação específica. Os sinais encontrados nos métodos e sistemas descritos podem ser armazenados em mídias, tal como uma memória de acesso aleatório ou uma mídia de armazenamento óptico. Estes podem ser transferidos através de redes, tais como redes de rádio, redes via satélite, redes sem fio ou redes cabeadas, por exemplo, a internet. Dispositivos típicos que fazem uso do método e sistema descritos no presente documento são decodificadores ou outros equipamentos dentro das instalações do cliente que decodifiquem sinais de áudio. No lado de coPetição 870190115842, de 11/11/2019, pág. 80/87
52/52 dificação, o método e o sistema podem ser usados em estações de radiodifusão, por exemplo, em sistemas de processamento de vídeo.
[00140] O presente documento descreveu um método e um sistema destinados à realização de uma reconstrução de frequência alta de um sinal baseado no componente de frequência baixa deste mesmo sinal. Utilizando-se combinações de sub-bandas a partir do componente de frequência baixa, o método e o sistema permitem a reconstrução de frequências e bandas de frequência que podem não ser geradas por métodos de transposição conhecidos a partir da técnica. Além disso, o método e o sistema de HTR descritos permitem o uso de baixas frequências de cruzamento e/ou a geração de bandas de frequência alta grandes a partir de bandas de frequência baixa estreitas.

Claims (12)

  1. REIVINDICAÇÕES
    1. Sistema para gerar um componente de frequência alta de um sinal de áudio a partir de um componente de frequência baixa do sinal de áudio, caracterizado pelo fato de que compreende:
    - um decodificador de núcleo (101) para decodificar o componente de frequência baixa do sinal de áudio;
    - um banco de filtro de análise (301) que proporciona uma pluralidade de sinais de sub-banda de análise do componente de frequência baixa do sinal de áudio;
    - uma unidade de processamento não linear (302) para gerar um sinal de sub-banda de síntese com uma frequência de síntese multiplicandose a fase de um primeiro e um segundo sinal entre a pluralidade de sinais de sub-banda de análise e combinando-se os sinais de sub-banda de análise modificados por fase; e
    - um banco de filtro de síntese (303) para gerar o componente de frequência alta do sinal a partir do sinal de áudio de sub-banda de síntese;
    em que
    - a unidade de processamento não linear (302) compreende uma unidade de múltiplas entradas e única saída (800-n) de uma primeira e uma segunda ordem de transposição gerando o sinal de sub-banda de síntese (803) a partir dos primeiro (801) segundo (802) sinais de sub-banda de análise com uma primeira frequência de análise e uma segunda frequência de análise (ω +Ω), respectivamente;
    - o primeiro sinal de sub-banda de análise (801) é multiplicado por fase pela primeira ordem de transposição (T-r);
    - o segundo sinal de sub-banda de análise (802) é multiplicado por fase pela segunda ordem de transposição r;
    -T>1;1 < rT; e
    - a frequência de síntese é (Τ-Γ)·ω + Γ·(ω+Ω).
  2. 2. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende ainda
    Petição 870190115842, de 11/11/2019, pág. 82/87
    2/5
    - uma pluralidade de unidades de múltiplas entradas e única saída (800-n) e/ou uma pluralidade de unidades de processamento não linear que geram uma pluralidade de sinais de sub-banda de síntese parciais (803) com a frequência de síntese; e
    - uma unidade de soma de sub-banda (702) que serve para combinar a pluralidade de sinais de sub-banda de síntese parciais.
  3. 3. Sistema, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que a unidade de processamento não linear (302) compreende, ainda:
    - uma unidade de processamento direto (401) que serve para gerar um sinal de sub-banda de síntese adicional a partir de um terceiro sinal entre a pluralidade de sinais de sub-banda de análise; e
    - uma unidade de soma de sub-banda que serve para combinar os sinais de sub-banda de síntese com a frequência de síntese.
  4. 4. Sistema, de acordo com a reivindicação 3, caracterizado pelo fato de que
    - a unidade de soma de sub-banda ignora os sinais de subbanda de síntese gerados nas unidades de múltiplas entradas e única saída (800-n) se o mínimo da magnitude do primeiro (801) e do segundo (802) sinais de sub-banda de análise for menor que uma fração predefinida da magnitude do sinal.
  5. 5. Sistema, de acordo com a reivindicação 3, caracterizado pelo fato de que a unidade de processamento direto (401) compreende:
    - uma unidade de única entrada e única saída (401-n) de uma terceira ordem de transposição Τ', que gera o sinal de sub-banda de síntese a partir do terceiro sinal de sub-banda de análise que exibe uma terceira frequência de análise, em que
    - o terceiro sinal de sub-banda de análise é modificado por fase pela terceira ordem de transposição Τ';
    - Τ' é maior que um; e
    - a frequência de síntese corresponde à terceira frequência de análise multiplicada pela terceira ordem de transposição.
    Petição 870190115842, de 11/11/2019, pág. 83/87
    3/5
  6. 6. Sistema, de acordo com qualquer uma das reivindicações 1 a 5, caracterizado pelo fato de que
    - o banco de filtro de análise (301) tem N sub-bandas de análise em um espaçamento de sub-banda essencialmente constante de Δω;
    - uma sub-banda de análise é associada a um índice de subbanda de análise n, com ne{1,...,N};
    - o banco de filtro de síntese (303) tem uma sub-banda de síntese;
    - a sub-banda de síntese é associada a um índice de sub-banda de síntese n; e
    - a sub-banda de síntese e a sub-banda de análise com índice n compreendem faixas de frequências que se relacionam entre si através do fator T.
  7. 7. Sistema, de acordo com a reivindicação 6, caracterizado pelo fato de que
    - o sinal de sub-banda de síntese (803) é associado à sub-banda de síntese com índice n;
    - o primeiro sinal de sub-banda de análise (801) é associado a uma sub-banda de análise com índice n-pi;
    - o segundo sinal de sub-banda de análise (802) é associado a uma sub-banda de análise com índice n+p2; e
    - o sistema compreende, ainda, uma unidade de seleção de índice que serve para selecionar pi e p2.
  8. 8. Sistema, de acordo com a reivindicação 7, caracterizado pelo fato de que
    - a unidade de seleção de índice é operável para selecionar os deslocamentos de índice pi e p2 a partir de uma lista limitada de pares (pi, P2) armazenados em uma unidade de armazenamento de índices;
    - a unidade de seleção de índice é operável para selecionar o par (pi, p2) de tal modo que o valor mínimo de um conjunto que compreende a magnitude do primeiro sinal de sub-banda de análise e a magnitude do segundo sinal de sub-banda de análise seja maximizado.
    Petição 870190115842, de 11/11/2019, pág. 84/87
    4/5
  9. 9. Sistema, de acordo com a reivindicação 7, caracterizado pelo fato de que a unidade de seleção de índice é operável para determinar uma lista limitada de pares (pi, pz) de tal modo que
    - o deslocamento de índice pi= r I;
    - o deslocamento de índice p2= (T-r)-l; e
    -1 seja um número inteiro positivo;
    em que a unidade de seleção de índice é operável para selecionar os parâmetros I e r de tal modo que o valor mínimo do conjunto que compreende a magnitude do primeiro sinal de sub-banda de análise e a magnitude do segundo sinal de sub-banda de análise seja maximizado.
  10. 10. Sistema, de acordo com a reivindicação 7, caracterizado pelo fato de que a unidade de seleção de índice é operável para selecionar os deslocamentos de índice pi e p2 com base em uma característica do sinal; em que o sinal compreende uma frequência fundamental Ω; e em que a unidade de seleção de índice é operável para selecionar os deslocamentos de índice pi e p2 de tal modo que sua soma de deslocamentos de índice p1+p2 se aproxime da fração Ω/Δω; e a fração pi/pz seja um múltiplo de r/(Tr); ou em que a unidade de seleção de índice é operável para selecionar os deslocamentos de índice pi e p2 de tal modo que sua soma de deslocamentos de índice p1+p2 se aproxime da fração Ω/Δω; e a fração pi/p2 seja igual a r/(T-r).
  11. 11. Método para realizar reconstrução de frequência alta de um componente de frequência alta a partir de um componente de frequência baixa de um sinal de áudio, caracterizado pelo fato de que compreende as etapas de:
    - decodificar o componente de frequência baixa do sinal de áudio;
    - proporcionar (301) um primeiro sinal de sub-banda do componente de frequência baixa com uma primeira frequência e um segundo sinal de sub-banda do componente de frequência baixa com uma segunda frequência (ω+Ω);
    - multiplicar uma fase do primeiro sinal de sub-banda com um
    Petição 870190115842, de 11/11/2019, pág. 85/87
    5/5 primeiro fator de transposição (T-r) de modo a produzir um primeiro sinal de sub-banda transposto;
    - multiplicar uma fase do segundo sinal de sub-banda com um segundo fator de transposição r de modo a produzir um segundo sinal de sub-banda transposto; sendo que T>1;e1<r<T;e
    - combinar (303) o primeiro e o segundo sinais de sub-banda transpostos de modo a produzir um componente de frequência alta com uma frequência alta (Τ-Γ)·ω + Γ·(ω+Ω); em que combinar inclui multiplicar o componente de frequência alta por um parâmetro de ganho.
  12. 12. Método, de acordo com a reivindicação 11, caracterizado pelo fato de que a etapa de combinação compreende:
    - multiplicar o primeiro e o segundo sinais de sub-banda transpostos de modo a produzir um sinal de sub-banda alta; e
    - inserir o sinal de sub-banda alta em um banco de filtro de síntese de modo a gerar o componente de frequência alta.
BR122019023684A 2009-01-16 2010-01-15 sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta BR122019023684B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14522309P 2009-01-16 2009-01-16
PCT/EP2010/050483 WO2010081892A2 (en) 2009-01-16 2010-01-15 Cross product enhanced harmonic transposition
BRPI1007050A BRPI1007050B1 (pt) 2009-01-16 2010-01-15 Sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequênciaalta

Publications (1)

Publication Number Publication Date
BR122019023684B1 true BR122019023684B1 (pt) 2020-05-05

Family

ID=42077387

Family Applications (3)

Application Number Title Priority Date Filing Date
BRPI1007050A BRPI1007050B1 (pt) 2009-01-16 2010-01-15 Sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequênciaalta
BR122019023704A BR122019023704B1 (pt) 2009-01-16 2010-01-15 sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta
BR122019023684A BR122019023684B1 (pt) 2009-01-16 2010-01-15 sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta

Family Applications Before (2)

Application Number Title Priority Date Filing Date
BRPI1007050A BRPI1007050B1 (pt) 2009-01-16 2010-01-15 Sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequênciaalta
BR122019023704A BR122019023704B1 (pt) 2009-01-16 2010-01-15 sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta

Country Status (21)

Country Link
US (9) US8818541B2 (pt)
EP (8) EP3598445B1 (pt)
JP (2) JP5237465B2 (pt)
KR (2) KR101589942B1 (pt)
CN (2) CN102282612B (pt)
AU (1) AU2010205583B2 (pt)
BR (3) BRPI1007050B1 (pt)
CA (7) CA3084938C (pt)
CL (1) CL2011001717A1 (pt)
ES (7) ES2885804T3 (pt)
HK (1) HK1162735A1 (pt)
MX (1) MX2011007563A (pt)
MY (1) MY180550A (pt)
PL (6) PL3992966T3 (pt)
RU (5) RU2495505C2 (pt)
SG (1) SG172976A1 (pt)
TR (1) TR201910073T4 (pt)
TW (2) TWI523005B (pt)
UA (1) UA99878C2 (pt)
WO (1) WO2010081892A2 (pt)
ZA (1) ZA201105923B (pt)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
UA99878C2 (ru) 2009-01-16 2012-10-10 Долби Интернешнл Аб Гармоническое преобразование, усовершенствованное перекрестным произведением
RU2493618C2 (ru) * 2009-01-28 2013-09-20 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование
BRPI1007528B1 (pt) 2009-01-28 2020-10-13 Dolby International Ab Sistema para gerar um sinal de áudio de saída a partir de um sinal de áudio de entrada usando um fator de transposição t, método para transpor um sinal de áudio de entrada por um fator de transposição t e meio de armazenamento
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI556227B (zh) 2009-05-27 2016-11-01 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
TWI404050B (zh) * 2009-06-08 2013-08-01 Mstar Semiconductor Inc 多聲道音頻信號解碼方法與裝置
EP2306456A1 (en) * 2009-09-04 2011-04-06 Thomson Licensing Method for decoding an audio signal that has a base layer and an enhancement layer
JP5433022B2 (ja) 2009-09-18 2014-03-05 ドルビー インターナショナル アーベー 高調波転換
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
ES2805349T3 (es) * 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
KR102020334B1 (ko) 2010-01-19 2019-09-10 돌비 인터네셔널 에이비 고조파 전위에 기초하여 개선된 서브밴드 블록
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN103155033B (zh) * 2010-07-19 2014-10-22 杜比国际公司 高频重建期间的音频信号处理
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
US9236063B2 (en) 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
AU2015202647B2 (en) * 2010-09-16 2017-05-11 Dolby International Ab Cross product enhanced subband block based harmonic transposition
CA3191597C (en) * 2010-09-16 2024-01-02 Dolby International Ab Cross product enhanced subband block based harmonic transposition
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US8675881B2 (en) * 2010-10-21 2014-03-18 Bose Corporation Estimation of synthetic audio prototypes
US9078077B2 (en) 2010-10-21 2015-07-07 Bose Corporation Estimation of synthetic audio prototypes with frequency-based input signal decomposition
CN103477387B (zh) 2011-02-14 2015-11-25 弗兰霍菲尔运输应用研究公司 使用频谱域噪声整形的基于线性预测的编码方案
BR112013020482B1 (pt) 2011-02-14 2021-02-23 Fraunhofer Ges Forschung aparelho e método para processar um sinal de áudio decodificado em um domínio espectral
KR101551046B1 (ko) 2011-02-14 2015-09-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법
MY166394A (en) 2011-02-14 2018-06-25 Fraunhofer Ges Forschung Information signal representation using lapped transform
KR101525185B1 (ko) 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
ES2639646T3 (es) 2011-02-14 2017-10-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación y decodificación de posiciones de impulso de pistas de una señal de audio
AU2012218409B2 (en) * 2011-02-18 2016-09-15 Ntt Docomo, Inc. Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program
EP3279895B1 (en) * 2011-11-02 2019-07-10 Telefonaktiebolaget LM Ericsson (publ) Audio encoding based on an efficient representation of auto-regressive coefficients
EP3544006A1 (en) 2011-11-11 2019-09-25 Dolby International AB Upsampling using oversampled sbr
US20130162901A1 (en) * 2011-12-22 2013-06-27 Silicon Image, Inc. Ringing suppression in video scalers
US8917197B2 (en) * 2012-01-03 2014-12-23 Nucript LLC System and method for improving performance of photonic samplers
BR122021018240B1 (pt) * 2012-02-23 2022-08-30 Dolby International Ab Método para codificar um sinal de áudio multicanal, método para decodificar um fluxo de bits de áudio codificado, sistema configurado para codificar um sinal de áudio, e sistema para decodificar um fluxo de bits de áudio codificado
CN102584191B (zh) * 2012-03-22 2014-05-14 上海大学 用蛇纹石尾矿制备堇青石陶瓷的方法
CN110706715B (zh) * 2012-03-29 2022-05-24 华为技术有限公司 信号编码和解码的方法和设备
JP5894347B2 (ja) * 2012-10-15 2016-03-30 ドルビー・インターナショナル・アーベー 転移器に基づく仮想ベース・システムにおけるレイテンシーを低減するシステムおよび方法
CN103928031B (zh) * 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
KR101775084B1 (ko) * 2013-01-29 2017-09-05 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 주파수 향상 오디오 신호를 생성하는 디코더, 디코딩 방법, 인코딩된 신호를 생성하는 인코더, 및 컴팩트 선택 사이드 정보를 이용한 인코딩 방법
US9881624B2 (en) 2013-05-15 2018-01-30 Samsung Electronics Co., Ltd. Method and device for encoding and decoding audio signal
MX353240B (es) * 2013-06-11 2018-01-05 Fraunhofer Ges Forschung Dispositivo y método para extensión de ancho de banda para señales acústicas.
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
FR3015754A1 (fr) * 2013-12-20 2015-06-26 Orange Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame
JP6593173B2 (ja) 2013-12-27 2019-10-23 ソニー株式会社 復号化装置および方法、並びにプログラム
DE102014003057B4 (de) * 2014-03-10 2018-06-14 Ask Industries Gmbh Verfahren zur Rekonstruierung hoher Frequenzen bei verlustbehafteter Audiokomprimierung
US9306606B2 (en) * 2014-06-10 2016-04-05 The Boeing Company Nonlinear filtering using polyphase filter banks
EP2963646A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI693594B (zh) 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
WO2016180704A1 (en) 2015-05-08 2016-11-17 Dolby International Ab Dialog enhancement complemented with frequency transposition
US9837089B2 (en) 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) * 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9454343B1 (en) 2015-07-20 2016-09-27 Tls Corp. Creating spectral wells for inserting watermarks in audio signals
US9311924B1 (en) 2015-07-20 2016-04-12 Tls Corp. Spectral wells for inserting watermarks in audio signals
US9626977B2 (en) 2015-07-24 2017-04-18 Tls Corp. Inserting watermarks into audio signals that have speech-like properties
US10115404B2 (en) 2015-07-24 2018-10-30 Tls Corp. Redundancy in watermarking audio signals that have speech-like properties
TWI807562B (zh) 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
US10573326B2 (en) * 2017-04-05 2020-02-25 Qualcomm Incorporated Inter-channel bandwidth extension
CN108108333B (zh) * 2017-05-02 2021-10-19 大连民族大学 一种伪双谱分离具有相同谐波频率成分信号的方法
IL278223B2 (en) * 2018-04-25 2023-12-01 Dolby Int Ab Combining high-frequency audio reconstruction techniques
CN109003621B (zh) * 2018-09-06 2021-06-04 广州酷狗计算机科技有限公司 一种音频处理方法、装置及存储介质
CN109036457B (zh) * 2018-09-10 2021-10-08 广州酷狗计算机科技有限公司 恢复音频信号的方法和装置
CN110244290A (zh) * 2019-06-17 2019-09-17 电子科技大学 一种距离扩展目标的检测方法

Family Cites Families (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4048443A (en) 1975-12-12 1977-09-13 Bell Telephone Laboratories, Incorporated Digital speech communication system for minimizing quantizing noise
US4998072A (en) * 1990-02-20 1991-03-05 John Fluke Mfg. Co., Inc. High resolution direct digital synthesizer
SE501305C2 (sv) 1993-05-26 1995-01-09 Ericsson Telefon Ab L M Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
KR100289733B1 (ko) 1994-06-30 2001-05-15 윤종용 디지탈 오디오 부호화 방법 및 장치
JP3606388B2 (ja) 1994-10-31 2005-01-05 ソニー株式会社 オーデイオデータ再生方法及びオーデイオデータ再生装置
US5781880A (en) * 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
TW303410B (en) 1996-04-19 1997-04-21 Kok Hua Liow Improved construction products and methods
US6252965B1 (en) 1996-09-19 2001-06-26 Terry D. Beard Multichannel spectral mapping audio apparatus and method
RU2256293C2 (ru) * 1997-06-10 2005-07-10 Коудинг Технолоджиз Аб Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5856674A (en) 1997-09-16 1999-01-05 Eaton Corporation Filament for ion implanter plasma shower
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
DE60019268T2 (de) 1999-11-16 2006-02-02 Koninklijke Philips Electronics N.V. Breitbandiges audio-übertragungssystem
GB0003954D0 (en) 2000-02-18 2000-04-12 Radioscape Ltd Method of and apparatus for converting a signal between data compression formats
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
EP1158494B1 (en) 2000-05-26 2002-05-29 Lucent Technologies Inc. Method and apparatus for performing audio coding and decoding by interleaving smoothed critical band evelopes at higher frequencies
US7003467B1 (en) 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
EP1199711A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US7013269B1 (en) * 2001-02-13 2006-03-14 Hughes Electronics Corporation Voicing measure for a speech CODEC system
FR2821501B1 (fr) 2001-02-23 2004-07-16 France Telecom Procede et dispositif de reconstruction spectrale d'un signal a spectre incomplet et systeme de codage/decodage associe
FR2821475B1 (fr) 2001-02-23 2003-05-09 France Telecom Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques
SE0101175D0 (sv) 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
US7400651B2 (en) 2001-06-29 2008-07-15 Kabushiki Kaisha Kenwood Device and method for interpolating frequency components of signal
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
EP1351401B1 (en) * 2001-07-13 2009-01-14 Panasonic Corporation Audio signal decoding device and audio signal encoding device
US7333929B1 (en) 2001-09-13 2008-02-19 Chmounk Dmitri V Modular scalable compressed audio data stream
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
EP1423847B1 (en) 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
US7065491B2 (en) 2002-02-15 2006-06-20 National Central University Inverse-modified discrete cosine transform and overlap-add method and hardware structure for MPEG layer3 audio signal decoding
CA2464408C (en) * 2002-08-01 2012-02-21 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method for band expansion with aliasing suppression
JP3879922B2 (ja) 2002-09-12 2007-02-14 ソニー株式会社 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム
US20040083094A1 (en) 2002-10-29 2004-04-29 Texas Instruments Incorporated Wavelet-based compression and decompression of audio sample sets
KR100501930B1 (ko) 2002-11-29 2005-07-18 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
RU2244386C2 (ru) 2003-03-28 2005-01-10 Корпорация "Самсунг Электроникс" Способ восстановления высокочастотной составляющей аудиосигнала и устройство для его реализации
SE0301272D0 (sv) 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Adaptive voice enhancement for low bit rate audio coding
CN101800049B (zh) * 2003-09-16 2012-05-23 松下电器产业株式会社 编码装置和译码装置
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
EP1672618B1 (en) * 2003-10-07 2010-12-15 Panasonic Corporation Method for deciding time boundary for encoding spectrum envelope and frequency resolution
CN100507485C (zh) 2003-10-23 2009-07-01 松下电器产业株式会社 频谱编码装置和频谱解码装置
US7668711B2 (en) * 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
JP4977471B2 (ja) * 2004-11-05 2012-07-18 パナソニック株式会社 符号化装置及び符号化方法
JP5129117B2 (ja) * 2005-04-01 2013-01-23 クゥアルコム・インコーポレイテッド 音声信号の高帯域部分を符号化及び復号する方法及び装置
WO2006126844A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US8311840B2 (en) * 2005-06-28 2012-11-13 Qnx Software Systems Limited Frequency extension of harmonic signals
KR101171098B1 (ko) 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
KR100717058B1 (ko) 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
US20070121953A1 (en) 2005-11-28 2007-05-31 Mediatek Inc. Audio decoding system and method
JP2007171339A (ja) * 2005-12-20 2007-07-05 Kenwood Corp オーディオ信号処理装置
JP4548348B2 (ja) 2006-01-18 2010-09-22 カシオ計算機株式会社 音声符号化装置及び音声符号化方法
CN101089951B (zh) * 2006-06-16 2011-08-31 北京天籁传音数字技术有限公司 频带扩展编码方法及装置和解码方法及装置
US20070299655A1 (en) 2006-06-22 2007-12-27 Nokia Corporation Method, Apparatus and Computer Program Product for Providing Low Frequency Expansion of Speech
JP2008033269A (ja) 2006-06-26 2008-02-14 Sony Corp デジタル信号処理装置、デジタル信号処理方法およびデジタル信号の再生装置
US20080109215A1 (en) 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
EP2048658B1 (en) 2006-08-04 2013-10-09 Panasonic Corporation Stereo audio encoding device, stereo audio decoding device, and method thereof
KR101435893B1 (ko) * 2006-09-22 2014-09-02 삼성전자주식회사 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
US20080243518A1 (en) 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
US8363842B2 (en) 2006-11-30 2013-01-29 Sony Corporation Playback method and apparatus, program, and recording medium
TWI308740B (en) 2007-01-23 2009-04-11 Ind Tech Res Inst Method of a voice signal processing
US20080208575A1 (en) 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
JP4905241B2 (ja) * 2007-04-27 2012-03-28 ヤマハ株式会社 高調波生成装置、低音増強装置、およびコンピュータプログラム
US7886303B2 (en) 2007-05-18 2011-02-08 Mediatek Inc. Method for dynamically adjusting audio decoding process
CN101105940A (zh) 2007-06-27 2008-01-16 北京中星微电子有限公司 音频编解码的量化方法、反变换方法及音频编解码装置
UA99878C2 (ru) * 2009-01-16 2012-10-10 Долби Интернешнл Аб Гармоническое преобразование, усовершенствованное перекрестным произведением

Also Published As

Publication number Publication date
JP5237465B2 (ja) 2013-07-17
EP4145446B1 (en) 2023-11-22
CA2748003A1 (en) 2010-07-22
RU2495505C2 (ru) 2013-10-10
US20210366500A1 (en) 2021-11-25
EP3598445A1 (en) 2020-01-22
EP3598447B1 (en) 2021-12-01
KR101256808B1 (ko) 2013-04-22
EP3598446A1 (en) 2020-01-22
EP3598446B1 (en) 2021-12-22
PL4145446T3 (pl) 2024-04-08
US10192565B2 (en) 2019-01-29
RU2638748C2 (ru) 2017-12-15
US9799346B2 (en) 2017-10-24
US11935551B2 (en) 2024-03-19
ES2966639T3 (es) 2024-04-23
EP3992966B1 (en) 2022-11-23
KR20110128275A (ko) 2011-11-29
CA3162807C (en) 2024-04-23
RU2667629C1 (ru) 2018-09-21
US10586550B2 (en) 2020-03-10
US20140297295A1 (en) 2014-10-02
ES2734361T3 (es) 2019-12-05
EP2620941A1 (en) 2013-07-31
MY180550A (en) 2020-12-02
JP2013148920A (ja) 2013-08-01
MX2011007563A (es) 2011-09-06
RU2018130424A3 (pt) 2021-11-15
US20230298606A1 (en) 2023-09-21
SG172976A1 (en) 2011-08-29
US20180033446A1 (en) 2018-02-01
TWI523005B (zh) 2016-02-21
ES2904373T3 (es) 2022-04-04
KR20130006723A (ko) 2013-01-17
CA3084938A1 (en) 2010-07-22
CN103632678B (zh) 2017-06-06
EP3598445B1 (en) 2021-07-07
RU2765618C2 (ru) 2022-02-01
CL2011001717A1 (es) 2012-07-20
CA2926491A1 (en) 2010-07-22
CA3124108C (en) 2022-08-02
EP3598447A1 (en) 2020-01-22
CA3009237C (en) 2020-08-25
JP5597738B2 (ja) 2014-10-01
US20240249739A1 (en) 2024-07-25
CA3084938C (en) 2021-08-24
EP2620941B1 (en) 2019-05-01
RU2013119725A (ru) 2014-11-10
RU2011133894A (ru) 2013-03-10
US11682410B2 (en) 2023-06-20
US12119011B2 (en) 2024-10-15
AU2010205583B2 (en) 2013-02-07
CA2748003C (en) 2016-05-24
PL2620941T3 (pl) 2019-11-29
US20190115038A1 (en) 2019-04-18
RU2646314C1 (ru) 2018-03-02
CA3124108A1 (en) 2010-07-22
ES2885804T3 (es) 2021-12-15
CA3009237A1 (en) 2010-07-22
EP4300495A2 (en) 2024-01-03
US20110305352A1 (en) 2011-12-15
ES2427278T3 (es) 2013-10-29
BRPI1007050B1 (pt) 2020-04-22
EP4300495A3 (en) 2024-02-21
BRPI1007050A2 (pt) 2019-03-26
JP2012515362A (ja) 2012-07-05
EP4145446A1 (en) 2023-03-08
TWI430264B (zh) 2014-03-11
WO2010081892A3 (en) 2010-11-18
PL3598446T3 (pl) 2022-03-28
CN102282612A (zh) 2011-12-14
ES2938858T3 (es) 2023-04-17
ZA201105923B (en) 2012-11-28
PL3992966T3 (pl) 2023-03-20
KR101589942B1 (ko) 2016-01-29
CA2926491C (en) 2018-08-07
UA99878C2 (ru) 2012-10-10
US20240194211A1 (en) 2024-06-13
CA3162807A1 (en) 2010-07-22
CN103632678A (zh) 2014-03-12
BR122019023704B1 (pt) 2020-05-05
US8818541B2 (en) 2014-08-26
HK1162735A1 (en) 2012-08-31
PL3598445T3 (pl) 2021-12-27
EP3992966A1 (en) 2022-05-04
US11031025B2 (en) 2021-06-08
EP2380172B1 (en) 2013-07-24
PL3598447T3 (pl) 2022-02-14
AU2010205583A1 (en) 2011-07-07
TW201128634A (en) 2011-08-16
US20200273476A1 (en) 2020-08-27
RU2018130424A (ru) 2020-02-25
CN102282612B (zh) 2013-07-24
CA3231911A1 (en) 2010-07-22
WO2010081892A2 (en) 2010-07-22
TR201910073T4 (tr) 2019-07-22
ES2901735T3 (es) 2022-03-23
TW201413709A (zh) 2014-04-01
EP2380172A2 (en) 2011-10-26

Similar Documents

Publication Publication Date Title
US11935551B2 (en) Cross product enhanced harmonic transposition
AU2013201597B2 (en) Cross product enhanced harmonic transposition

Legal Events

Date Code Title Description
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 05/05/2020, OBSERVADAS AS CONDICOES LEGAIS.

B25G Requested change of headquarter approved

Owner name: DOLBY INTERNATIONAL AB (IE)