BR112016018694B1 - Conceito para codificação de informação - Google Patents

Conceito para codificação de informação Download PDF

Info

Publication number
BR112016018694B1
BR112016018694B1 BR112016018694-0A BR112016018694A BR112016018694B1 BR 112016018694 B1 BR112016018694 B1 BR 112016018694B1 BR 112016018694 A BR112016018694 A BR 112016018694A BR 112016018694 B1 BR112016018694 B1 BR 112016018694B1
Authority
BR
Brazil
Prior art keywords
polynomials
spectrum
polynomial
derived
converter
Prior art date
Application number
BR112016018694-0A
Other languages
English (en)
Other versions
BR112016018694A2 (pt
Inventor
Bãckstrõm Tom
Christian Fischer Pedersen
Fischer Johannes
Hüttenberger Matthias
Pino Alfonso
Original Assignee
Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. filed Critical Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V.
Publication of BR112016018694A2 publication Critical patent/BR112016018694A2/pt
Publication of BR112016018694B1 publication Critical patent/BR112016018694B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

CONCEITO PARA CODIFICAÇÃO DE INFORMAÇÃO. A presente invenção fornece um codificador de informação para codificar um sinal de informação (SI), caracterizado por compreender: um analisador (2), a fim de obter coeficientes lineares de previsão de um polinomial preditivo A(z); um conversor (3) para converter os coeficientes lineares de previsão do polinomial preditivo A(z) em valores de frequência f1...fn de uma represen-tação de frequência espectral do polinomial preditivo A (z), em que o conver-sor (3) determina os valores de frequência f1...fn, analisando um par de polinomiais P (z) e Q (z) sendo definido como P (z) = A (z) + z-m-l A (z-1) e Q (z) = A (z) - z-m-l A(z-1), em que m é uma ordem do polinomial preditivo A (z) e l é maior ou igual à zero, em que o conversor (3) é configurado para obter os valores de frequência (f1...fn), estabelecendo um espectro estritamente real (RES) derivado de P (z) e um espectro estritamente imaginário (IES) de Q (z) e identificando os zeros do espectro estritamente real (RES) derivado de P (z) e do espectro estritamente imaginário (IES) derivado de Q (z); um quantizador (4) para obter os valores da frequência quantizada (fq1...fqn) dos valores de frequência(f1...fn); e um produtor de fluxo de bits contínuo (5) para produzir um fluxo de bits contínuo compreendendo os valores de frequência quantizados (fq1...fqn).

Description

DESCRIÇÃO
[0001] O paradigma mais frequentemente utilizado em codificação de fala é a Previsão Linear Excitada por Código Algébrico (ACELP | Algebraic Code Excited Linear Prediction), que é utilizada em padrões como a família AMR, G.718 e MPEG USAC [1-3]. Ela se baseia na fala de modelagem utilizando um modelo de origem, consistindo em um previsor linear (LP | linear predictor) para modelar o envelope espectral, um previsor de período longo (LTP | long time predictor) para modelar a frequência fundamental e um livro de códigos algébrico para o residual.
[0002] Os coeficientes do modelo preditivo linear são muito sensíveis à quantização, pela qual geralmente eles são primeiro transformados em Frequências Espectrais de Linha (LSFs | Line Spectral Frequencies) ou Frequências Espectrais de Imitância (ISFs | Imittance Spectral Frequencies) antes da quantização. Os domínios LSF/ISF são robustos a erros de quantização e, nesses domínios, a estabilidade do previsor pode ser prontamente preservada, pela qual ela oferece o domínio adequado para quantização [4].
[0003] As LSFs/ISFs, a seguir referidas como valores de frequência, podem ser obtidas de um polinomial preditivo linear A(z) da ordem m, conforme segue. Os polinomiais do Par de Espectro de Linha são definidos como
Figure img0001
onde l = 1 para o Par de Espectro de Linha e l = 0 para a representação do Par de Espectro de Imitância, mas qualquer l > 0 é, em princípio, válido. A seguir, será, então, assumido apenas que l > 0.
[0004] Observe que o previsor original pode sempre ser reconstruído utilizando A(z) = 1/2 [P(z)+Q(z)]. Os polinomiais P(z) e Q(z), assim, contêm toda a informação de A(z).
[0005] A propriedade central dos polinomiais LSP/ISP é que se e apenas se A(z) tiver todas as suas raízes dentro do círculo da unidade, então, as raízes de P(z) e Q(z) serão entrelaçadas no círculo da unidade. Visto que as raízes de P(z) e Q(z) estão no círculo da unidade, elas podem ser representadas apenas por seus ângulos. Esses ângulos correspondem às frequências e visto que os espectros de P(z) e Q(z) têm linhas verticais em seus espectros de magnitude logarítmica em frequências correspondentes às raízes, as raízes são referidas como valores de frequência.
[0006] Segue-se que os valores de frequência codificam toda a informação do previsor A(z). Além disso, observou-se que os valores de frequência são robustos a erros de quantização, de modo que um pequeno erro em um dos valores de frequência produz um pequeno erro no espectro do previsor reconstruído, que está localizado no espectro, próximo à frequência correspondente. Devido à essas propriedades favoráveis, a quantização nos domínios LSF ou ISF é utilizada em todos os codecs de fala de fluxo principal [1-3].
[0007] Um dos desafios ao utilizar os valores de frequência é, no entanto, encontrar suas localizações eficientemente dos coeficientes a partir dos polinomiais P(z) e Q(z). Depois disso, encontrar as raízes de polinomiais é um problema clássico e difícil. Os métodos previamente propostos para essa tarefa incluem as seguintes abordagens: • Uma das abordagens anteriores utiliza o fato de que zeros residem no círculo da unidade, pelo qual eles aparecem como zeros no espectro de magnitude [5]. Considerando a transformada discreta de Fourier dos coeficientes de P(z) e Q(z), pode-se, assim, buscar vales no espectro de magnitude. Cada vale indica a localização de uma raiz e, se o espectro for amostrado de forma suficiente, pode-se encontrar todas as raízes. Esse método, entretanto, produz apenas uma posição aproximada, pois é difícil determinar a posição exata da localização do vale. • A abordagem mais utilizada frequentemente se baseia nos polinomiais de Chebyshev e foi apresentada em [6]. Ela depende da percepção de que os polinomiais P(z) e Q(z) são simétricos e antissimétricos, respectivamente, pela qual eles contêm muita informação redundante. Pela remoção de zeros comuns em z = ±1 e com a substituição x = z + z-1 (que é conhecida como a transformada de Chebyshev), os polinomiais podem ser transformados em uma representação alternativa FP(x) e FQ(x). Esses polinomiais são metade da ordem de P(z) e Q(z) e eles têm apenas raízes reais na faixa de -2 à +2. Observe que os polinomiais FP(x) e FQ(x) têm valores reais quando x é real. Além disso, visto que as raízes são simples, FP(x) e FQ(x) terá um cruzamento zero em cada uma de suas raízes. • Nos codecs de fala, como o AMR-WB, essa abordagem é aplicada de modo que os polinomiais FP(x) e FQ(x) sejam avaliados em uma grade fixa no eixo real para encontrar todos os cruzamentos zero. As localizações da raiz são ainda refinadas pela interpolação linear ao redor do cruzamento zero. A vantagem dessa abordagem é a complexidade reduzida devido à omissão de coeficientes redundantes.
[0008] Embora os métodos descritos acima funcionem suficientemente nos codecs existentes, eles apresentam vários problemas.
[0009] O problema a ser solucionado é fornecer um conceito melhorado para codificação de informação.
[0010] Em um primeiro aspecto, o problema é solucionado por um codificador de informação para codificar um sinal de informação. O codificador de informação é caracterizado por compreender: um analisador para analisar o sinal de informação, a fim de obter coeficientes lineares de previsão de um polinomial preditivo A(z); um conversor para converter os coeficientes lineares de previsão do polinomial preditivo A(z) em valores de frequência de uma representação de frequência espectral do polinomial preditivo A(z), em que o conversor é configurado para determinar os valores de frequência, analisando um par de polinomiais P(z) e Q(z), sendo definido como P(z) = A(z) + z-m-l A(z-1) e Q(z) = A(z) - z-m-l A(z-1), em que m é uma ordem do polinomial preditivo A(z) e l é maior ou igual à zero, em que o conversor é configurado para obter os valores de frequência, estabelecendo um espectro estritamente real derivado de P(z) e um espectro estritamente imaginário de Q(z) e identificando zeros do espectro estritamente real derivado de P(z) e do espectro estritamente imaginário derivado de Q(z); um quantizador para obter valores de frequência quantizada dos valores de frequência; e um produtor de fluxo de bits contínuo produzir um fluxo de bits contínuo, compreendendo os valores de frequência quantizada.
[0011] O codificador de informação, de acordo com a invenção, utiliza uma busca cruzada de zero, enquanto que a abordagem espectral para localizar as raízes, de acordo com a técnica prévia, depende de localizar os vales no espectro de magnitude. Entretanto, ao buscar vales, a precisão é mais pobre do que buscar cruzamentos zero. Considere, por exemplo, a sequência [4, 2, 1, 2, 3]. Claramente, o menor valor é o terceiro elemento, pelo qual o zero ficaria em algum lugar entre o segundo e o quarto elemento. Em outras palavras, não é possível determinar se o zero está à direita ou à esquerda do terceiro elemento. Entretanto, se for considerada a sequência [4, 2, 1, -2, -3], pode-se ver imediatamente que o cruzamento zero está entre o terceiro e o quarto elementos, pelos quais nossa margem de erro é reduzida pela metade. Segue-se que com a abordagem magnitude-espectro, é necessário duplicar o número de pontos de análise para obter a mesma precisão que com a busca de cruzamento zero.
[0012] Em comparação com a avaliação das magnitudes |P (z)| e |Q(z)|, a abordagem de cruzamento zero tem uma vantagem significativa na precisão. Considere, por exemplo, a sequência 3, 2, -1, -2. Com a abordagem de cruzamento zero, é óbvio que o zero fica entre 2 e -1. Entretanto, estudando a sequência de magnitude correspondente 3, 2, 1, 2, pode-se apenas concluir que o zero fica em algum lugar entre o segundo e o último elemento. Em outras palavras, com a abordagem de cruzamento zero a precisão é dupla em comparação à abordagem com base na magnitude.
[0013] Além disso, o codificador de informação, de acordo com a invenção, pode utilizar longos previsores, como m = 128. Ao contrário disso, a transformada de Chebyshev realiza suficientemente apenas quando o comprimento de A(z) é relativamente pequeno, por exemplo, m < 20. Para longos previsores, a transformada de Chebyshev é numericamente instável, pela qual a implementação prática do algoritmo é impossível.
[0014] As propriedades principais do codificador de informação proposto são, assim, aquelas que podem chegar à mais alta ou melhor precisão como o método com base em Chebyshev, visto que cruzamentos zeros são pesquisados e porque uma conversão de domínio de tempo em domínio de frequência é realizada, de modo que zeros podem ser encontrados com complexidade computacional muito baixa.
[0015] Como resultado, o codificador de informação, de acordo com a invenção, determina ambos os zeros (raízes) mais precisamente, mas também com baixa complexidade computacional.
[0016] O codificador de informação, de acordo com a invenção, pode ser utilizado em qualquer aplicação de processamento de sinal que precisa determinar o espectro de linha de uma sequência. Aqui, o codificador de informação é exemplarmente discutido na codificação de fala de contexto. A invenção é aplicável em um dispositivo de codificação de fala, áudio e/ou vídeo ou aplicação, que emprega um previsor linear para modelar o envelope de magnitude espectral, limiar de mascaramento de frequência perceptual, limiar de mascaramento temporal, limiar de mascaramento temporal perceptual, ou outros formatos de envelope, ou outras representações equivalentes à um formato de envelope como um sinal de autocorrelação, que utiliza um espectro de linha para representar a informação do envelope, para codificação, análise ou processamento, que precisa de um método para determinar o espectro de linha de um sinal de entrada, como uma fala ou sinal de áudio geral, e onde o sinal de entrada é representado como um filtro digital ou outra sequência de números.
[0017] O sinal de informação pode ser, por exemplo, um sinal de áudio ou um sinal de vídeo. Os valores de frequência podem ser frequências de linhas espectrais ou frequências espectrais de limitância. Os valores de frequência quantizada transmitidos dentro do fluxo de bits contínuo permitirão que um decodificador decodifique o fluxo de bits contínuo a fim de recriar o sinal de áudio ou o sinal de vídeo.
[0018] De acordo com uma aplicação preferida da invenção o conversor compreende um dispositivo de determinação para determinar os polinomiais P(z) e Q(z) do polinomial preditivo A(z).
[0019] De acordo com a aplicação preferida da invenção, o conversor compreende um identificador de zero para identificar os zeros do espectro estritamente real derivado de P(z) e do espectro estritamente imaginário derivado de Q(z).
[0020] De acordo com uma aplicação preferida da invenção, o identificador de zero é configurado para identificar os zeros por a) iniciação com o espectro real em frequência nula; b) aumento da frequência até uma mudança de sinal no espectro real ser encontrada; c) aumento de frequência até uma mudança de sinal adicional no espectro imaginário ser encontrada; e d) repetição das etapas b) e c) até todos os zeros serem encontrados.
[0021] Observe que Q(z) e, assim, a parte imaginária do espectro sempre tem um zero na frequência nula. Visto que as raízes estão se sobrepondo a P(z) e, assim, a parte real do espectro, então, será sempre não zero na frequência nula. Pode-se, dessa forma, iniciar com a parte real na frequência nula e aumentar a frequência até a primeira mudança de sinal ser encontrada, o que indica o primeiro cruzamento zero e, assim, o primeiro valor da frequência.
[0022] Visto que as raízes são entrelaçadas, o espectro de Q(z) terá a próxima mudança no sinal. Assim, pode-se aumentar a frequência até uma mudança de sinal para o espectro de Q(z) ser encontrada. Esse processo, então, pode ser repetido, alternando entre os espectros P(z) e Q(z), até todos os valores de frequência terem sido encontrados. A abordagem utilizada para localizar o cruzamento zero nos espectros é, então, similar à abordagem aplicada no domínio de Chebyshev [6, 7].
[0023] Visto que os zeros de P(z) e Q(z) são entrelaçados, pode-se alternar entre buscar zeros nas partes real e complexa, de modo que sejam encontrados todos os zeros em uma passagem e reduzida a complexidade pela metade em comparação à uma busca completa.
[0024] De acordo com uma aplicação preferida da invenção, o identificador de zero é configurado para identificar os zeros por interpolação.
[0025] Além da abordagem de cruzamento zero, pode-se aplicar prontamente a interpolação de modo que se pode estimar a posição do zero com precisão ainda mais alta, por exemplo, como é realizado nos métodos convencionais, por exemplo [7].
[0026] De acordo com uma aplicação preferida da invenção, o conversor compreende um dispositivo de preenchimento zero para adicionar um ou mais coeficiente(s), tendo um valor “0” para os polinomiais P(z) e Q(z) para produzir um par de polinomiais alongados Pe(z) e Qe(z). A precisão pode ser melhorada, ainda, estendendo o comprimento do espectro avaliado. Com base na informação sobre o sistema, é possível de fato, em alguns casos, determinar uma distância mínima entre os valores de frequência e, assim, determinar o comprimento mínimo do espectro com o qual todos os valores de frequência podem ser encontrados [8].
[0027] De acordo com uma aplicação preferida da invenção, o conversor é configurado de modo que, durante a conversão dos coeficientes lineares de previsão em valores de frequência de uma representação de frequência espectral do polinomial preditivo A(z), pelo menos, uma parte das operações com coeficientes conhecidos como tendo o valor “0” dos polinomiais alongados Pe(z) e Qe(z) seja omitida.
[0028] O aumento do comprimento do espectro, entretanto, também aumenta a complexidade computacional. O maior contribuinte para a complexidade é a transformada de domínio de tempo em transformada de domínio de frequência, tal como uma transformada rápida de Fourier, dos coeficientes de A(z). Visto que o vetor do coeficiente foi preenchido com zero no comprimento desejado, ele é, contudo, muito esparso. Esse fato pode ser prontamente utilizado para reduzir a complexidade. Esse é um problema bastante simples, no sentido de que alguém sabe exatamente quais coeficientes são zero, pelos quais em cada iteração da transformada rápida de Fourier pode-se simplesmente omitir as operações que envolvem zeros. A aplicação de tal transformada rápida de Fourier esparsa é direta e qualquer programador especialista na técnica pode implementá-la. A complexidade de tal implementação é O(N log2(1 + m + l)), onde N é o comprimento do espectro e m e l são definidos como antes.
[0029] De acordo com uma aplicação preferida da invenção, o conversor compreende um formador polinomial composto configurado para estabelecer um polinomial composto Ce(Pe(z), Qe(z)) dos polinomiais alongados Pe(z) e Qe(z).
[0030] De acordo com uma aplicação preferida da invenção, o conversor é configurado de modo que o espectro estritamente real derivado de P(z) e o espectro estritamente imaginário de Q(z) sejam estabelecidos por uma única transformada de Fourier pela transformação do polinomial composto Ce(Pe(z), Qe(z)).
[0031] De acordo com uma aplicação preferida invenção, o conversor compreende um dispositivo de transformada de Fourier para transformada de Fourier do par de polinomiais P(z) e Q(z) ou um ou mais polinomial(is) derivado(s) do par de polinomiais P(z) e Q(z) em um domínio de frequência e um dispositivo de ajuste para ajustar uma fase do espectro derivado de P(z), de modo que seja estritamente real, e para ajustar uma fase do espectro derivado de Q(z), de modo que seja estritamente imaginário. O dispositivo de transformada de Fourier pode ser basear na transformada rápida de Fourier ou na transformada discreta de Fourier.
[0032] De acordo com uma aplicação preferida da invenção, o dispositivo de ajuste é configurado como um comutador de coeficiente para comutação circular de coeficientes do par de polinomiais P(z) e Q(z) ou um ou mais polinomial(is) derivado(s) do par de polinomiais P(z) e Q(z).
[0033] De acordo com uma aplicação preferida da invenção, o comutador de coeficiente é configurado para comutação circular de coeficientes de modo que um ponto médio original de uma sequência de coeficientes seja alterado na primeira posição da sequência.
[0034] Em teoria, sabe-se bem que a transformada de Fourier de uma sequência simétrica tem valor real e sequências assimétricas têm espectros de Fourier puramente imaginários. No presente caso, nossa sequência de entrada são os coeficientes de polinomial P(z) ou Q(z) que têm comprimento m + l, enquanto que pode-se preferir ter a transformada discreta de Fourier de um comprimento muito maior N » (m + l). A abordagem convencional para criar espectros de Fourier mais longos é o preenchimento zero do sinal de entrada. Entretanto, o zero preenchimento da sequência tem que ser cuidadosamente implementado de modo que as simetrias sejam retidas.
[0035] Primeiro, um polinomial P(z) com coeficientes [p0, p1, p2, p1, p0] é considerado.
[0036] A forma na qual algoritmos FFT são geralmente aplicados exige que o ponto da simetria seja o primeiro elemento, pelo qual, quando aplicado, por exemplo, em MATLAB pode-se escrever fft([p2, p1, p0, p0, p1]) para obter uma saída com valor real. Especificamente, uma mudança circular pode ser aplicada, de modo que o ponto de simetria corresponda ao elemento de ponto médio, isso é, o coeficiente p2 seja alternado à esquerda, de modo que esteja na primeira posição. Os coeficientes que estavam no lado esquerdo de p2 são, então, anexos à extremidade da sequência.
[0037] Para uma sequência com zero preenchimento [p0, p1, p2, p1, p0, 0, 0 . . . 0] pode-se aplicar o mesmo processo. A sequência [p2, p1, p0, 0, 0 . . . 0, p0, p1] terá, assim, uma transformada discreta de Fourier com valor real. Aqui, o número de zeros nas sequências de entrada é N - m - l, se N for o comprimento do espectro desejado.
[0038] De modo correspondente, considere os coeficientes [q0, q1, 0, -q1, -q0] correspondendo ao polinomial Q(z). Aplicando uma mudança circular, de modo que o ponto médio anterior fique na primeira posição, obtém-se [0, -q1, -q0, q0, q1] que tem uma transformada discreta de Fourier puramente imaginária. A transformada preenchida com zero pode, então, ser considerada para a sequência [0, -q1, -q0, 0, 0 . . . 0, q0, q1]
[0039] Observe que o que foi mencionado acima se aplica apenas para os casos onde o comprimento da sequência é ímpar, pelo qual m + l é par. Para casos onde m + l é ímpar, tem-se duas opções. Pode-se implementar a mudança circular no domínio de frequência ou aplicar uma DFT com metade das amostras (vide abaixo).
[0040] De acordo com uma aplicação preferida da invenção, o dispositivo de ajuste é configurado como um comutador de fase para alternar uma fase da saída do dispositivo de transformada de Fourier.
[0041] De acordo com uma aplicação preferida da invenção, o comutador de fase é configurado para alternar a fase da saída do dispositivo de transformada de Fourier multiplicando uma posição de frequência k-ésima com exp(i2nkh/N), em que N é o comprimento da amostra e h = (m+l)/2.
[0042] Sabe-se bem que uma mudança circular no domínio de tempo é equivalente a uma rotação de fase no domínio de frequência. Especificamente, uma mudança de h = (m + l)/2 passos no domínio de tempo corresponde à multiplicação da posição de frequência k-ésima com exp(-i2nkh/N), onde N é o comprimento do espectro. Ao invés da mudança circular, pode- se, assim, aplicar uma multiplicação no domínio de frequência para obter exatamente o mesmo resultado. O custo dessa abordagem é uma complexidade levemente elevada. Observe que h = (m + l)/2 é um número inteiro apenas quando m + l for par. Quando m + l for ímpar, a mudança circular exigiria um atraso pelo número racional de passos, que é difícil de implementar diretamente. Em vez disso, pode-se aplicar a mudança correspondente no domínio de frequência pela rotação de fase descrita acima.
[0043] De acordo com a aplicação preferida da invenção, o conversor compreende um dispositivo de transformada de Fourier para transformada de Fourier do par de polinomiais P(z) e Q(z) ou um ou mais polinomial(is) derivado(s) do par de polinomiais P(z) e Q(z) em um domínio de frequência com metade das amostras de modo que o espectro seja estritamente real e de modo que o de Q(z) seja estritamente imaginário.
[0044] Uma alternativa é implementar uma DFT com metade das amostras. Especificamente, enquanto que a DFT convencional é definida como
Figure img0002
pode-se definir a DFT de meia amostra DFT como
Figure img0003
[0045] Uma implementação rápida, como FFT, pode ser prontamente desenvolvida para essa formulação.
[0046] O benefício dessa formulação é que agora o ponto de simetria está em n = 1/2 em vez do comum n = 1. Com essa DFT de meia amostra, então, com uma sequência [2, 1, 0, 0, 1, 2] seria obtido um espectro de Fourier com valor real.
[0047] No caso de m+l ímpar para um polinomial P(z) com coeficientes p0, p1, p2, p2, p1, p0 pode-se, então, com uma DFT de meia amostra e zero preenchimento, obter-se um espectro com valor real quando a sequência de entrada for [p2, p1, p0, 0, 0 . . . 0, p0, p1, p2].
[0048] Correspondentemente, para um polinomial Q(z), pode-se aplicar a DFT de meia amostra na sequência [-q2, -q1, -q0, 0, 0 . . . 0, q0, q1, q2] para obter um espectro puramente imaginário.
[0049] Com esses métodos, para qualquer combinação de m e l, pode-se obter um espectro com valor real para um polinomial P(z) e um espectro puramente imaginário para qualquer Q(z). De fato, visto que os espectros de P(z) e Q(z) são puramente reais e imaginários, respectivamente, pode-se armazená-los em um único espectro complexo, que, então, corresponde ao espectro de P(z) + Q(z) = 2A(z). A escala pelo fator 2 não muda a localização das raízes, pela qual pode ser ignorada. Pode-se, assim, obter os espectros de P(z) e Q(z) avaliando apenas o espectro de A(z) utilizando uma única FFT. Precisa-se apenas aplicar a mudança circular, conforme explicado acima, aos coeficientes de A(z).
[0050] Por exemplo, com m = 4 e l = 0, os coeficientes de A(z) são [a0, a1, a2, a3, a4] que pode ser preenchido com zero em um comprimento arbitrário N por [a0, a1, a2, a3, a4, 0, 0 . . . 0].
[0051] Se, então, for aplicada uma mudança circular de etapas (m + l)/2 = 2, obtém-se [a2, a3, a4, 0, 0 . . . 0, a0, a1].
[0052] Considerando a DFT dessa sequência, tem-se o espectro de P(z) e Q(z) nas partes real e complexa do espectro.
[0053] De acordo com uma aplicação preferida da invenção, o conversor compreende um formador polinomial composto configurado para estabelecer um polinomial composto C(P(z), Q(z)) dos polinomiais P(z) e Q(z).
[0054] De acordo com uma aplicação preferida da invenção, o conversor é configurado de modo que o espectro estritamente real derivado de P(z) e o espectro estritamente imaginário de Q(z) sejam estabelecidos por uma única transformada de Fourier, por exemplo, uma transformada rápida de Fourier (FFT), transformando um polinomial composto C(P(z), Q(z)).
[0055] Os polinomiais P (z) e Q(z) são simétricos e assimétricos, respectivamente, com o eixo da simetria em z-(m+i)/2. Segue-se que os espectros de z-(m+l)/2P(z) e z-(m+l)/2Q(z), respectivamente, avaliados no círculo da unidade z = exp(iθ), são com valores real e complexo, respectivamente. Visto que os zeros estão no círculo da unidade, pode-se encontra-los buscando cruzamentos zero. Além disso, a avaliação no círculo por unidade pode ser implementada simplesmente por uma transformada rápida de Fourier.
[0056] Como os espectros correspondentes à z-(m+l)/2P (z) e z-(m+l)/2Q(z) são reais e complexos, respectivamente, 2 pode-se implementá-los com uma única transformada rápida de Fourier. Especificamente, se for considerada a soma z-(m+l)/2(P (z) + Q(z)), então, as partes real e complexa dos espectros correspondem à z-(m+l)/2 P(z) e z-(m+l)/2 Q(z), respectivamente. Além disso, visto que
Figure img0004
pode-se considerar diretamente a FFT de 2z-(m+l)/2 A(z) para obter os espectros correspondentes à z—(m+i)/2 p(z) e z-(m+l)/2 Q(z), sem determinar explicitamente P(z) e Q(z). Visto que existe um interesse apenas nas localizações de zeros, 1 pode-se, em vez disso, omitir a multiplicação pela escala 2 e avaliar z-(m+l)/2 A(z) por FFT. Observe que visto que A(z) tem apenas coeficientes não zero m + 1, pode-se utilizar a remoção de FFT para reduzir a complexidade [11]. Para certificar-se de que todas as raízes são encontradas, deve-se utilizar uma FFT de comprimento suficientemente alto N que o espectro é avaliado em pelo menos uma frequência entre a cada dois zeros.
[0057] De acordo com uma aplicação preferida da invenção, o conversor compreende um dispositivo de limitação para limitar a faixa numérica dos espectros dos polinomiais P (z) e Q(z) multiplicando os polinomiais P(z) e Q(z) ou um ou mais polinomial(is) derivado(s) dos polinomiais P(z) e Q(z) com um polinomial de filtro B(z), em que o polinomial de filtro B(z) é simétrico e não tem quaisquer raízes em um círculo da unidade.
[0058] Codecs de fala são frequentemente implementados no dispositivo móvel com recursos limitados, pelos quais as operações numéricas podem ser implementadas com representações de ponto fixo. Portanto, é essencial que os algoritmos implementados operem com representações numéricas cuja faixa é limitada. Para envelopes espectrais de fala comum, a faixa numérica do espectro de Fourier é, entretanto, tão grande que é necessária uma implementação de 32 bits da FFT para garantir que as localizações de cruzamento zero sejam retidas.
[0059] Uma FFT de 16 bits pode, por outro lado, ser frequentemente implementada com complexidade inferior, pela qual seria útil limitar os valores de faixa espectral para adaptar à faixa de 16 bits. Das equações |P (eiθ) | < 2|A(eiθ ) | e |Q(eiθ ) | 2|A(eiθ ) | sabe-se que pela limitação da faixa numérica de B(z)A(z) também limita-se a faixa numérica de B(z)P (z) e B(z)Q(z). Se B(z) não tem zeros no círculo da unidade, então, B(z)P (z) e B(z)Q(z) terá o mesmo cruzamento zero no círculo da unidade as P (z) e Q(z). Além disso, B(z) tem que ser simétrico de modo que z-(m+l+n)/2P (z)B(z) e z-(m+l+n)/2Q(z)B(z) permaneçam simétricos e antissimétricos e seus espectros sejam puramente reais e imaginários, respectivamente. Em vez de avaliar o espectro de z(n+l)/2A(z) pode-se, assim, avaliar z(n+l+n)/2A(z)B(z), onde B(z) é um polinomial simétrico de ordem n sem raízes no círculo da unidade. Em outras palavras, pode-se aplicar a mesma abordagem conforme descrito acima, mas primeiro multiplicando A(z) com filtro B(z) e aplicando uma mudança de fase modificada z-(m+l+n)/2.
[0060] A tarefa remanescente é desenhar um filtro B(z), de modo que a faixa numérica de A(z)B(z) seja limitada, com a restrição que B(z) deve ser simétrico e sem raízes no círculo da unidade. O filtro mais simples que atende as exigências é um filtro de fase linear de ordem 2
Figure img0005
onde βk e R são os parâmetros e | β2| > 2| β1|. Pelo ajuste de βk, pode-se modificar a inclinação espectral e, assim, reduzir, a faixa numérica do produto A(z)B1(z). Uma abordagem computacionalmente muito eficiente é escolher β, de modo que a magnitude em frequência 0 e Nyquist seja igual, |A(1)B1(1)| = |A(-1)B1(-1)|, pelo qual pode-se escolher, por exemplo,
Figure img0006
[0061] Essa abordagem provê um espectro aproximadamente plano.
[0062] Observa-se (vide também a figura 5) que enquanto A(z) tem um caractere de alta passagem, B1(z) é de baixa passagem, pelo qual o produto A(z)B1(z) tem, conforme esperado, magnitude igual em 0- e frequência de Nyquist e é mais ou menos plano. Visto que B1(z) tem apenas um grau de liberdade, obviamente não se pode esperar que o produto seria completamente plano. Ainda, observe que a razão entre o pico mais alto e o vale mais baixo de B1(z)A(z) pode ser muito menor que de A(z). Isso significa que obteve-se o efeito desejado; a faixa numérica de B1(z)A(z) é muito menor que a de A(z).
[0063] Um segundo método ligeiramente mais complexo é calcular a autocorrelação rk da resposta de impulso de A(0.5z). Aqui, a multiplicação por 0,5 move os zeros de A(z) na direção de origem, pela qual a magnitude espectral é reduzida aproximadamente pela metade. Por meio da aplicação de Levinson- Durbin na autocorrelação rk, obtém-se um filtro H(z) de ordem n que é de fase mínima. Pode-se, então, definir B2(z) = z-nH(z)H(z-1) para obter um |B2(z)A(z) |que é aproximadamente constante. Será observado que a faixa de |B2(z)A(z)| é menor que a de |B1(z)A(z)|. Abordagens adicionais para o desenho de B(z) podem ser prontamente encontradas na literatura clássica do desenho de FIR [18].
[0064] De acordo com uma aplicação preferida da invenção, o conversor compreende um dispositivo de limitação para limitar a faixa numérica dos espectros dos polinomiais alongados Pe(z) e Qe(z) ou um ou mais polinomial(is) derivado(s) dos polinomiais alongados Pe(z) e Qe(z) multiplicando os polinomiais alongados Pe(z) e Qe(z) com um polinomial de filtro B(z), em que o polinomial de filtro B(z) é simétrico e não tem quaisquer raízes em um círculo da unidade. B(z) pode ser encontrado conforme explicado acima.
[0065] Em um aspecto adicional, o problema é solucionado por um método para operar um codificador de informação para codificar um sinal de informação. O método compreende as etapas de: analisar o sinal de informação a fim de obter coeficientes lineares de previsão de um polinomial preditivo A(z); converter os coeficientes lineares de previsão do polinomial preditivo A(z) em valores de frequência f1...fn de uma representação de frequência espectral do polinomial preditivo A(z), em que os valores de frequência fi.fn são determinados analisando um par de polinomiais P(z) e Q(z) sendo definido como P(z) = A(z) + z-m-l A(z-i) e Q(z) = A(z) - z-m-l A(z-1), em que m é uma ordem do polinomial preditivo A(z) e l é maior ou igual à zero, em que os valores de frequência f1.fn são obtidos estabelecendo um espectro estritamente real derivado de P(z) e um espectro estritamente imaginário de Q(z) e identificando zeros do espectro estritamente real derivado de P(z) e o espectro estritamente imaginário derivado de Q(z); obter os valores de frequência quantizada fq1...fqn dos valores de frequência f1...fn; e produzir um fluxo de bits contínuo compreendendo os valores de frequência quantizada fq1.fqn.
[0066] Além disso, o programa é observado por um programa de computador para, ao executar em um processador, executar o método de acordo com a invenção.
[0067] As aplicações preferidas da invenção são subsequentemente discutidas com relação aos desenhos anexos, nos quais:
[0068] A Figura 1 ilustra uma aplicação de um codificador de informação, de acordo com a invenção, em uma visualização esquemática;
[0069] A Figura 2 ilustra uma relação exemplar de A(z), P (z) e Q(z);
[0070] A Figura 3 ilustra uma primeira aplicação do conversor do codificador de informação, de acordo com a invenção, em uma visualização esquemática;
[0071] A Figura 4 ilustra uma segunda aplicação do conversor do codificador de informação, de acordo com a invenção, em uma visualização esquemática;
[0072] A Figura 5 ilustra um espectro de magnitude exemplar de um previsor A(z), os filtros de nivelamento correspondentes B1(z) e B2(z) e os produtos A(z)B1(z) e A(z)B2(z);
[0073] A Figura 6 ilustra uma terceira aplicação do conversor do codificador de informação, de acordo com a invenção, em uma visualização esquemática;
[0074] A Figura 7 ilustra uma quarta aplicação do conversor do codificador de informação, de acordo com a invenção, em uma visualização esquemática; e
[0075] A Figura 8 ilustra uma quinta aplicação do conversor do codificador de informação, de acordo com a invenção, em uma visualização esquemática.
[0076] A figura 1 ilustra uma aplicação de um codificador de informação (1) de acordo com a invenção em uma visualização esquemática.
[0077] O codificador de informação (1) para codificar um sinal de informação (IS), compreende: um analisador (2) para analisar o sinal de informação (IS), a fim de obter coeficientes lineares de previsão de um polinomial preditivo A(z); um conversor (3) para converter os coeficientes lineares de previsão do polinomial preditivo A(z) em valores de frequência f1.fn de uma representação de frequência espectral RES, IES do polinomial preditivo A(z), em que o conversor (3) é configurado para determinar os valores de frequência f1...fn analisando um par de polinomiais P(z) e Q(z) sendo definido como P(z) = A(z) + z-m-l A(z-1) e Q(z) = A(z) - z-m-l A(z-1), em que m é uma ordem do polinomial preditivo A(z) e l é maior ou igual à zero, em que o conversor (3) é configurado para obter os valores de frequência f1.fn estabelecendo um espectro estritamente real RES derivado de P(z) e um espectro estritamente imaginário IES de Q(z) e identificando zeros do espectro estritamente real RES derivado de P(z) e o espectro estritamente imaginário IES derivado de Q(z); um quantizador (4) para obter os valores da frequência quantizada fq1...fqn dos valores de frequência f1.fn; e um produtor de fluxo de bits contínuo (5) que produz um fluxo de bits contínuo BS compreendendo os valores de frequência quantizada fq1.fqn.
[0078] O codificador de informação (1), de acordo com a invenção, utiliza uma busca de cruzamento zero, enquanto que a abordagem espectral para encontrar as raízes de acordo com a técnica prévia depende da localização de vales no espectro de magnitude. Entretanto, ao buscar vales, a precisão é mais pobre que ao buscar cruzamentos zero. Considere, por exemplo, a sequência [4, 2, 1, 2, 3]. Claramente, o menor valor é o terceiro elemento, pelo qual o zero ficaria em qualquer lugar entre o segundo e o quarto elemento. Em outras palavras, pode-se não determinar se o zero está à direita ou à esquerda do terceiro elemento. Entretanto, se for considerada a sequência [4, 2, 1, -2, -3], pode-se ver imediatamente que o cruzamento zero está entre o terceiro e o quarto elemento, pelos quais nossa margem de erro é reduzida pela metade. Segue-se que com a abordagem magnitude-espectro, precisa-se duplicar o número de pontos de análise para obter a mesma precisão que com a busca de cruzamento zero.
[0079] Em comparação à avaliação das magnitudes |P (z)| e |Q(z)|, a abordagem de cruzamento zero tem uma vantagem significativa na precisão. Considere, por exemplo, a sequência 3, 2, -1, -2. Com a abordagem de cruzamento zero é óbvio que o zero fica entre 2 e -1. Entretanto, pelo estudo da sequência de magnitude corresponde 3, 2, 1, 2, pode-se concluir apenas que o zero fica em algum lugar entre o segundo e o último elemento. Em outras palavras, com a abordagem de cruzamento zero a precisão é dupla em comparação à abordagem com base na magnitude.
[0080] Além disso, o codificador de informação, de acordo com a invenção, pode utilizar longos previsores, como m = 128. Ao contrário disso, a transformada de Chebyshev realiza suficientemente apenas quando o comprimento de A(z) é relativamente pequeno, por exemplo, m < 20. Para previsores longos, a transformada de Chebyshev é numericamente instável pela qual a implementação prática do algoritmo é impossível.
[0081] As propriedades principais do codificador de informação proposto (1) são, assim, aquelas que podem obter precisão tão alta ou melhor que o método com base em Chebyshev visto que cruzamentos zeros são buscados e porque uma conversão de domínio de tempo em domínio de frequência é feita, de modo que os zeros podem ser encontrados com complexidade computacional muito baixa.
[0082] Como resultado, o codificador de informação (1), de acordo com a invenção, determina ambos os zeros (raízes) mais precisamente, mas também com baixa complexidade computacional.
[0083] O codificador de informação (1), de acordo com a invenção, pode ser utilizado em qualquer aplicação de processamento de sinal que precisa determinar o espectro de linha de uma sequência. Aqui, o codificador de informação (1) é exemplarmente discutido na codificação de fala de contexto. A invenção é aplicável em um dispositivo de codificação de fala, áudio e/ou vídeo ou aplicação, que emprega um previsor linear para modelar o envelope de magnitude espectral, limiar de mascaramento de frequência perceptual, limiar de mascaramento temporal, limiar de mascaramento temporal perceptual, ou outros formatos de envelope, ou outras representações equivalentes à um formato de envelope como um sinal de autocorrelação, que utiliza um espectro de linha para representar a informação do envelope, para codificação, análise ou processamento, que precisa de um método para determinar o espectro de linha de um sinal de entrada, como uma fala ou sinal de áudio geral, e onde o sinal de entrada é representado como um filtro digital ou outra sequência de números.
[0084] O sinal de informação (IS) pode ser, por exemplo, um sinal de áudio ou um sinal de vídeo.
[0085] A figura 2 ilustra uma relação exemplar de A(z), P (z) e Q(z). As linhas pontilhadas verticais descrevem os valores de frequência f1_fe. Observe que a magnitude é expressa em um eixo linear em vez da escala decibel, a fim de manter os cruzamentos zero visíveis. Podemos ver que as frequências de linhas espectrais ocorrem nos cruzamentos de zeros de P (z) e Q(z). Além disso, as magnitudes de P (z) e Q(z) são menores ou iguais do que 2|A(z)| em qualquer local; |P (eiθ )| < 2|A(eiθ ) | e |Q(eiθ )| < 2|A(eiθ ) | .
[0086] A figura 3 ilustra uma primeira aplicação do conversor do codificador de informação, de acordo com a invenção, em uma visualização esquemática.
[0087] De acordo com uma aplicação preferida da invenção, o conversor (3) compreende um dispositivo de determinação (6) para determinar os polinomiais P(z) e Q(z) do polinomial preditivo A(z).
[0088] De acordo com uma aplicação preferida invenção, o conversor compreende um dispositivo de transformada de Fourier (8) para transformada de Fourier do par de polinomiais P(z) e Q(z) ou um ou mais polinomial(is) derivado(s) do par de polinomiais P(z) e Q(z) em um domínio de frequência e um dispositivo de ajuste (7) para ajustar uma fase do espectro RES derivado de P(z) de modo que seja estritamente real e para ajustar uma fase do espectro IES derivado de Q(z) de modo que seja estritamente imaginário. O dispositivo de transformada de Fourier pode ser 8 com base na transformada rápida de Fourier ou na transformada discreta de Fourier.
[0089] De acordo com uma aplicação preferida da invenção, o dispositivo de ajuste (7) é configurado como um comutador de coeficiente (7) para comutação circular de coeficientes do par de polinomiais P(z) e Q(z) ou um ou mais polinomial(is) derivado(s) do par de polinomiais P(z) e Q(z).
[0090] De acordo com uma aplicação preferida da invenção, o comutador de coeficiente (7) é configurado para comutação circular de coeficientes de modo que um ponto médio original de uma sequência de coeficientes seja mudado para a primeira posição da sequência.
[0091] Em teoria, é bem conhecido que a transformada de Fourier de uma sequência simétrica é de valor real e as sequências assimétricas têm espectros de Fourier puramente imaginários. No presente caso, nossa sequência de entrada são os coeficientes de polinomial P(z) ou Q(z) que têm comprimento m + l, enquanto que seria preferido ter a transformada discreta de Fourier de um comprimento muito maior N » (m + l). A abordagem convencional para criar espectros de Fourier mais longos é zero preenchimento do sinal de entrada. Entretanto, zero preenchimento da sequência deve ser cuidadosamente implementado de modo que as simetrias sejam retidas.
[0092] Primeiro, um polinomial P(z) com coeficientes [p0, p1, p2, p1, p0] é considerado.
[0093] A forma que os algoritmos de transformada rápida de Fourier são geralmente aplicados exige que o ponto de simetria seja o primeiro elemento, pelo qual, quando aplicado, por exemplo, em MATLAB, pode-se escrever fft([p2, p1, p0, p0, p1]) para obter uma saída com valor real. Especificamente, uma mudança circular pode ser aplicada, de modo que o ponto de simetria correspondente ao elemento de ponto médio, isso é, coeficiente p2 seja mudado para à esquerda, de modo que fique na primeira posição. Os coeficientes que estavam à esquerda de p2 são, então, anexos à extremidade da sequência.
[0094] Para uma sequência com preenchimento zero [p0, p1, p2, p1, p0, 0, 0 . . . 0] pode-se aplicar o mesmo processo. A sequência [p2, p1, p0, 0, 0 . . . 0, p0, p1] terá, assim, uma transformada discreta de Fourier com valor real. Aqui o número de zeros nas sequências de entrada é N - m - l se N for o comprimento do espectro desejado.
[0095] Correspondentemente, considere os coeficientes [q0, q1, 0, -q1, -q0] correspondente ao polinomial Q(z). Aplicando uma mudança circular, de modo que o ponto médio anterior chegue à primeira posição, obtém-se [0, -q1, -q0, q0, q1] que tem uma transformada discreta de Fourier puramente imaginária. A transformada preenchida com zero pode, então, ser considerada para a sequência [0, -q1, -q0, 0, 0 . . . 0, q0, q1]
[0096] Observe que o que foi mencionado acima se aplica apenas para casos onde o comprimento da sequência é ímpar, pela qual m + l é par. Para casos onde m + l é ímpar, tem-se duas opções. Pode-se implementar a mudança circular no domínio de frequência ou aplicar uma DFT com metade das amostras.
[0097] De acordo com a aplicação preferida da invenção, o conversor (3) compreende um identificador de zero (9) para identificar os zeros do espectro estritamente real RES derivados de P(z) e o espectro estritamente imaginário IES derivado de Q(z).
[0098] De acordo com uma aplicação preferida da invenção, o identificador de zero (9) é configurado para identificar os zeros por a) iniciação com o espectro real em frequência nula; b) aumento da frequência até uma mudança de sinal no espectro real ser encontrada; c) aumento de frequência até uma mudança de sinal adicional no espectro imaginário ser encontrada; e d) repetição das etapas b) e c) até todos os zeros serem encontrados.
[0099] Observe que Q(z) e, assim, a parte imaginária IES do espectro sempre tem um zero na frequência nula. Visto que as raízes estão sobrepondo-se, P(z) e, assim, a parte real RES do espectro então será sempre não zero na frequência nula. Pode-se, dessa forma, iniciar com a parte real RES na frequência nula e aumentar a frequência até a primeira mudança de sinal ser encontrada, o que indica o primeiro cruzamento zero e, assim, o primeiro valor da frequência f1.
[0100] Visto que as raízes são entrelaçadas, o espectro IES de Q(z) terá a próxima mudança no sinal. Assim, pode-se aumentar a frequência até uma mudança de sinal para o espectro de Q(z) ser encontrada. Esse processo então pode ser repetido, alternando entre os espectros P(z) e Q(z), até todos os valores de frequência f1_fn, tenham sido encontrados. A abordagem utilizada para localizar o cruzamento zero nos espectros RES e IES é, então, similar à abordagem aplicada no domínio de Chebyshev [6, 7].
[0101] Visto que os zeros de P (z) e Q(z) são entrelaçados, pode-se alternar entre buscar zeros nas partes real RES e complexa IES, de modo que seja encontrado todos os zeros em uma passagem e reduzam a complexidade pela metade em comparação à uma busca completa.
[0102] De acordo com uma aplicação preferida da invenção, o identificador de zero é configurado para identificar os zeros por interpolação.
[0103] Além da abordagem de cruzamento zero, pode-se aplicar prontamente a interpolação, de modo que se pode estimar a posição do zero com precisão ainda mais alta, por exemplo, como é realizado nos métodos convencionais, por exemplo [7].
[0104] A figura 4 ilustra uma segunda aplicação do conversor (3) do codificador de informação (1), de acordo com a invenção, em uma visualização esquemática.
[0105] De acordo com uma aplicação preferida da invenção, o conversor (3) compreende um dispositivo de preenchimento zero (10) para adicionar um ou mais coeficiente(s), tendo um valor “0”, aos polinomiais P(z) e Q(z) para produzir um par de polinomiais alongados Pe(z) e Qe(z). A precisão pode ainda ser melhorada estendendo o comprimento do espectro avaliado RES, IES. Com base na informação sobre o sistema, é possível de fato, em alguns casos, determinar uma distância mínima entre os valores de frequência f1.fn, e, determinar o comprimento mínimo do espectro RES, IES com o qual todos os valores de frequência f1...fn podem ser encontrados [8].
[0106] De acordo com uma aplicação preferida da invenção, o conversor (3) é configurado de modo que durante a conversão dos coeficientes lineares de previsão em valores de frequência f1.fn, de uma representação de frequência espectral RES, IES do polinomial preditivo A(z) pelo menos uma parte das operações com coeficientes conhecidos para ter o valor “0” dos polinomiais alongados Pe(z) e Qe(z) seja omitida.
[0107] O aumento do comprimento do espectro, entretanto, também aumenta a complexidade computacional. O maior contribuinte para a complexidade é o domínio de tempo para transformada de domínio de tempo, como uma transformada rápida de Fourier, dos coeficientes de A(z). Visto que o vetor do coeficiente foi preenchido com zero no comprimento desejado, é, entretanto, muito esparso. Esse fato pode ser prontamente utilizado para reduzir a complexidade. Esse é um problema bastante simples no sentido que alguém sabe exatamente quais coeficientes são zero, pelos quais em cada iteração da transformada rápida de Fourier pode-se simplesmente omitir as operações que envolvem zeros. A aplicação de tal transformada rápida de Fourier esparsa é direta e qualquer programador especialista na técnica pode implementá-la. A complexidade de tal implementação é O(N log2(1 + m + l)),onde N é o comprimento do espectro e m e l são definidos como antes.
[0108] De acordo com uma aplicação preferida da invenção, o conversor compreende um dispositivo de limitação (11) para limitar a faixa numérica dos espectros dos polinomiais alongados Pe(z) e Qe(z) ou um ou mais polinomial(is) derivado(s) dos polinomiais alongados Pe(z) e Qe(z) multiplicando os polinomiais alongados Pe(z) e Qe(z) com um polinomial de filtro B(z), em que o polinomial de filtro B(z) é simétrico e não tem quaisquer raízes em um círculo da unidade. B(z) pode ser encontrado conforme explicado acima.
[0109] A figura 5 ilustra um espectro de magnitude exemplar de um previsor A(z), os filtros de nivelamento correspondentes B1(z) e B2(z) e os produtos A(z)B1(z) e A(z)B2(z). A linha pontilhada horizontal mostra o nível de A(z)B1(z) nas frequências 0 e Nyquist.
[0110] De acordo com uma aplicação preferida (não mostrada) da invenção, o conversor (3) compreende um dispositivo de limitação (11) para limitar a faixa numérica dos espectros RES, IES dos polinomiais P(z) e Q(z) multiplicando os polinomiais P(z) e Q(z) ou um ou mais polinomial(is) derivado(s) dos polinomiais P(z) e Q(z) com um polinomial de filtro B(z), em que o polinomial de filtro B(z) é simétrico e não tem quaisquer raízes em um círculo da unidade.
[0111] Codecs de fala são frequentemente implementados no dispositivo móvel com recursos limitados, pelos quais as operações numéricas devem ser implementadas com representações de ponto fixo. Portanto, é essencial que os algoritmos implementados operem com representações numéricas cuja faixa é limitada. Para envelopes espectrais de fala comum, a faixa numérica do espectro de Fourier é, entretanto, tão grande que é necessária uma implementação de 32 bits da FFT para garantir que as localizações de cruzamento zero sejam retidas.
[0112] Uma FFT de 16 bits pode, por outro lado, ser frequentemente implementada com complexidade inferior, pela qual seria útil limitar os valores de faixa espectral para adaptar à faixa de 16 bits. Das equações |P (eiθ ) | 2|A(eiθ ) | e |Q(eiθ) | - 2|A(eiθ ) | sabe-se que pela limitação da faixa numérica de B(z)A(z) também limita-se a faixa numérica de B(z)P (z) e B(z)Q(z). Se B(z) não tem zeros no círculo da unidade, então, B(z)P (z) e B(z)Q(z) terá o mesmo cruzamento zero no círculo da unidade as P (z) e Q(z). Além disso, B(z) tem que ser simétrico, de modo que z-(m+l+n)/2P (z)B(z) e z-(m+l+n)/2Q(z)B(z) permaneçam simétricos e antissimétricos e seus espectros sejam puramente reais e imaginários, respectivamente. Em vez de avaliar o espectro de z(n+l)/2A(z) pode-se, assim, avaliar z(n+l+n)/2A(z)B(z), onde B(z) é um polinomial simétrico de ordem n sem raízes no círculo da unidade. Em outras palavras, pode-se aplicar a mesma abordagem conforme descrito acima, mas primeiro multiplicando A(z) com filtro B(z) e aplicando uma mudança de fase modificada z-(m+l+n)/2.
[0113] A tarefa remanescente é desenhar um filtro B(z), de modo que a faixa numérica de A(z)B(z) seja limitada, com a restrição de que B(z) deve ser simétrico e sem raízes no círculo da unidade. O filtro mais simples que atende as exigências é um filtro de fase linear de ordem 2 B1(z) = β0 + β1z-1 + β2z-2, onde βk E R são os parâmetros e | β2| > 2|β1|. Pelo ajuste de βk, pode-se modificar a inclinação espectral e, assim, reduzir, a faixa numérica do produto A(z)B1(z). Uma abordagem computacionalmente muito eficiente é escolher β, de modo que a magnitude em frequência 0 e Nyquist seja igual, |A(1)B1(1)| = |A(-1)B1(-1)|, pelo qual pode-se escolher, por exemplo, β0 = A(1) - A(-1) e β1 = 2 (A(1) + A(-1) ) .
[0114] Essa abordagem provê um espectro aproximadamente plano.
[0115] Observa-se da figura 5 que, enquanto A(z) tem um caractere de alta passagem, B1(z) é de baixa passagem, pelo qual o produto A(z)B1(z) tem, conforme esperado, magnitude igual em frequência 0 e de Nyquist e é mais ou menos plano. Visto que B1(z) tem apenas um grau de liberdade, obviamente não se pode esperar que o produto seria completamente plano. Ainda, observe que a razão entre o pico mais alto e o vale mais baixo de B1(z)A(z) pode ser muito menor que de A(z). Isso significa que obteve-se o efeito desejado; a faixa numérica de B1(z)A(z) é muito menor que a de A(z).
[0116] Um segundo método ligeiramente mais complexo é calcular a autocorrelação rk da resposta de impulso de A(0,5z). Aqui a multiplicação por 0,5 move os zeros de A(z) na direção de origem, pela qual a magnitude espectral é reduzida aproximadamente pela metade. Por meio da aplicação de Levinson- Durbin na autocorrelação rk, obtém-se um filtro H(z) de ordem n que é de fase mínima. Pode-se, então, definir B2(z) = z-nH(z)H(z-1) para obter um |B2(z)A(z) | que é aproximadamente constante. Será observado que a faixa de |B2(z)A(z)|é menor que a de |B1(z)A(z)|. Abordagens adicionais para o desenho de B(z) podem ser prontamente encontradas na literatura clássica do desenho de FIR [18].
[0117] A figura 6 ilustra uma terceira aplicação do conversor (3) do codificador de informação (1), de acordo com a invenção, em uma visualização esquemática.
[0118] De acordo com uma aplicação preferida da invenção, o dispositivo de ajuste (12) é configurado como um comutador de fase (12) para alternar uma fase da saída do dispositivo de transformada de Fourier (8).
[0119] De acordo com uma aplicação preferida da invenção, o comutador de fase (12) é configurado para alternar a fase da saída do dispositivo de transformada de Fourier (8) multiplicando uma posição de frequência k-ésima com exp(i2πkh/N), em que N é o comprimento da amostra e h = (m+l)/2.
[0120] É bem conhecido que uma mudança circular no domínio de tempo é equivalente à uma rotação de fase no domínio de frequência. Especificamente, uma mudança de h = (m + l)/2 passos no domínio de tempo corresponde à multiplicação da posição de frequência k-ésima com exp(-i2πkh/N ), onde N é o comprimento do espectro. Em vez da mudança circular, pode-se, assim, aplicar uma multiplicação no domínio de frequência para obter exatamente o mesmo resultado. O custo dessa abordagem é uma complexidade levemente elevada. Observe que h = (m + l)/2 é um número inteiro apenas quando m + l for par. Quando m + l for ímpar, a mudança circular exigiria um atraso pelo número racional de passos, que é difícil de implementar diretamente. Em vez disso, pode-se aplicar a mudança correspondente no domínio de frequência pela rotação de fase descrita acima.
[0121] A figura 7 ilustra uma quarta aplicação do conversor (3) do codificador de informação (1), de acordo com a invenção, em uma visualização esquemática.
[0122] De acordo com uma aplicação preferida da invenção, o conversor (3) compreende um formador polinomial composto (13) configurado para estabelecer um polinomial composto C(P(z), Q(z)) dos polinomiais P(z) e Q(z).
[0123] De acordo com uma aplicação preferida da invenção, o conversor (3) é configurado de modo que o espectro estritamente real derivado de P(z) e o espectro estritamente imaginário de Q(z) sejam estabelecidos por uma única transformada de Fourier, por exemplo, uma transformada rápida de Fourier (FFT), transformando um polinomial composto C(P(z), Q(z)).
[0124] Os polinomiais P (z) e Q(z) são simétrico e antissimétricos, respectivamente, com o eixo de simetria em z-(m+l)/2.Segue-se que os espectros de z-(m+l)/2P(z) e z-(m+l)/2Q(z), respectivamente, avaliados no círculo da unidade z = exp(iθ), têm valores reais e complexos, respectivamente. Visto que os zeros estão no círculo da unidade, pode-se encontra-los buscando cruzamentos zero. Além disso, a avaliação no círculo por unidade pode ser implementada simplesmente por uma transformada rápida de Fourier.
[0125] Como os espectros correspondentes à z-(m+l)/2P (z) e z-(m+l)/2Q(z) são reais e complexos, respectivamente, 2 pode-se implementá-los com uma única transformada rápida de Fourier. Especificamente, se considerar a soma z-(m+l)/2(P (z) + Q(z)), então, as partes real e complexa dos espectros correspondem à z-(m+l)/2 P(z) e z-(m+l)/2 Q(z), respectivamente. Além disso, visto que z-(m+l)/2 (P (z) + Q(z)) = 2z-(m+l)/2 A(z), pode-se considerar diretamente a FFT de 2z-(m+l)/2 A(z) para obter os espectros correspondentes à z-(m+l)/2 P(z) e z-(m+l)/2 Q(z), sem determinar explicitamente P(z) e Q(z). Visto que existe um interesse apenas nas localizações de zeros, 1 pode- se, em vez disso, omitir a multiplicação pela escala (2) e avaliar z-(m+l)/2 A(z) por FFT. Observe que, visto que A(z) tem apenas coeficientes não zero m + 1, pode-se utilizar a remoção de FFT para reduzir a complexidade [11]. Para certificar-se de que todas as raízes são encontradas, deve-se utilizar uma FFT de comprimento suficientemente alto N que o espectro é avaliado em pelo menos uma frequência entre a cada dois zeros.
[0126] De acordo com uma aplicação preferida (não mostrada) da invenção, o conversor (3) compreende um formador polinomial composto configurado para estabelecer um polinomial composto Ce(Pe(z), Qe(z)) dos polinomiais alongados Pe(z) e Qe(z).
[0127] De acordo com uma aplicação preferida (não mostrada) da invenção, o conversor é configurado de modo que o espectro estritamente real derivado de P(z) e o espectro estritamente imaginário de Q(z) sejam estabelecidos por uma única transformada de Fourier transformando o polinomial composto Ce(Pe(z), Qe(z)).
[0128] A figura 8 ilustra uma quinta aplicação do conversor (3) do codificador de informação (1) de acordo com a invenção em uma visualização esquemática.
[0129] De acordo com aplicação preferida da invenção, o conversor (3) compreende um dispositivo de transformada de Fourier (14) para transformada de Fourier do par de polinomiais P(z) e Q(z) ou um ou mais polinomial(is) derivado(s) do par de polinomiais P(z) e Q(z) em um domínio de frequência com metade das amostras de modo que o espectro derivado de P(z) seja estritamente real e de modo que o espectro derivado de Q(z) seja estritamente imaginário.
[0130] Uma alternativa é implementar uma DFT com metade das amostras. Especificamente, enquanto a DFT convencional é definida como
Figure img0007
pode-se definir a DFT de meia amostra como
Figure img0008
[0131] Uma rápida implementação, como FFT, pode ser prontamente desenvolvida para essa formulação.
[0132] O benefício dessa formulação é que agora o ponto de simetria está em n = 1/2 em vez do comum n = 1. Com essa DFT de meia amostra, então, seria obtido com uma sequência [2, 1, 0, 0, 1, 2] um espectro de Fourier com valor real RES.
[0133] No caso de m+l ímpar, para um polinomial P(z) com coeficientes p0, p1, p2, p2, p1, p0 pode-se, então, com uma DFT de meia amostra e zero preenchimento obter um espectro com valor real quando a sequência de entrada for [p2, p1, p0, 0, 0 . . . 0, p0, p1, p2].
[0134] Correspondentemente, para um polinomial Q(z) pode-se aplicar a DFT de meia amostra na sequência [-q2, -q1, -q0, 0, 0 . . . 0, q0, q1, q2] para se obter um espectro puramente imaginário IES.
[0135] Com esses métodos, para qualquer combinação de m e l, pode-se obter um espectro com valor real para um polinomial P(z) e um espectro puramente imaginário para qualquer Q(z). De fato, visto que os espectros de P(z) e Q(z) são puramente reais e imaginários, respectivamente, pode-se armazená-los em um único espectro complexo, que, então, corresponde ao espectro de P(z) + Q(z) = 2A(z). A escala pelo fator 2 não muda a localização das raízes, pela qual pode ser ignorada. Pode-se, assim, obter os espectros de P(z) e Q(z) avaliando apenas o espectro de A(z) utilizando uma única FFT. Precisa-se apenas aplicar a mudança circular, conforme explicado acima, aos coeficientes de A(z).
[0136] Por exemplo, com m = 4 e l = 0, os coeficientes de A(z) são [a0, a1, a2, a3, a4] que pode ser preenchido com zero em um comprimento arbitrário N por [a0, a1, a2, a3, a4, 0, 0 . . . 0].
[0137] Se, então, for aplicada uma mudança circular de (m + l)/2 = 2 passos, obtém-se [a2, a3, a4, 0, 0 . . . 0, a0, a1].
[0138] Considerando a DFT dessa sequência, tem-se o espectro de P(z) e Q(z) nas partes reais RES e nas partes complexas IES do espectro.
[0139] O algoritmo geral no caso onde m + l é par pode ser afirmado como segue. Deixe os coeficientes de A(z), denotados por ak , residirem em um buffer de comprimento N. 1. Aplique uma mudança circular em ak de (m + l)/2 passos à esquerda. 2. Calcule a transformada rápida de Fourier da sequência ak e denote-a por Ak. 3. Até todos os valores de frequência terem sido encontrados, comece com k = 0 e alterne entre (a) Enquanto sign(real(Ak)) = sign(real(Ak+1)) aumente k := k + 1. Visto que o cruzamento zero foi encontrado, armazene k na lista de valores de frequência. (b) Enquanto sign(imag(Ak)) = sign(imag(Ak+1)) aumentam k := k + 1. Uma vez que o cruzamento zero foi encontrado, armazene k na lista de valores de frequência. 4. Para cada valor da frequência, interpole entre Ak e Ak+1 para determinar a posição precisa.
[0140] Aqui as funções sign(x), real(x) e imag(x) se referem ao sinal de x, a parte real de x e a parte imaginária de x, respectivamente.
[0141] Para o caso de m + l ímpar, a mudança circular é reduzida para (m + l - 1)/2 passos à esquerda e a transformada rápida de Fourier regular é substituída pela transformada rápida de Fourier de meia amostra.
[0142] De modo alternativo, podemos sempre substituir a combinação de mudança circular e 1a transformada de Fourier, por transformada rápida de Fourier e uma mudança de fase no domínio de frequência.
[0143] Para localizações mais precisas das raízes, é possível utilizar o método proposto acima para fornecer uma primeira suposição e, então, aplicam uma segunda etapa que refina a root loci. Para o refinamento, podemos aplicar qualquer método clássico de localização da raiz polinomial como método de Durand-Kerner, Aberth-Ehrlich, o método GaussNewton de Laguerre método ou outros [11-17].
[0144] Em uma formulação, o método apresentado consiste nas seguintes etapas: (a) Para uma sequência de comprimento m + l + 1 preenchida com zero ao comprimento N, onde m + l é par, aplique uma mudança circular de (m + l)/2 passos à esquerda, de modo que o comprimento do buffer seja N e corresponda ao espectro de comprimento da saída desejado, ou para uma sequência de comprimento m + l + 1 preenchida com zero para o comprimento N, onde m + l é ímpar, aplique uma mudança circular de (m + l - 1)/2 passos à esquerda, de modo que o comprimento do buffer seja N e corresponda ao espectro com comprimento da saída desejado. (b) se m + l for par, aplique uma DFT regular na sequência. Se m+l for ímpar, aplique uma DFT de meia amostra na sequência, conforme descrito pela Eq. 3 ou uma representação equivalente. (c) se o sinal de entrada estava simétrico ou antissimétrico, busque cruzamentos zero da representação de domínio de frequência a armazene as localizações em uma lista.
[0145] Se o sinal de entrada era uma sequência composta B(z) = P (z) + Q(z), busque cruzamentos zero em ambas as partes, real e imaginária, da representação do domínio de frequência e armazene as localizações em uma lista. Se o sinal de entrada era uma sequência composta B(z) = P (z)+Q(z), e as raízes de P (z) e Q(z) alternam ou têm estrutura similar, busque cruzamentos zero alternando a parte real e a parte imaginária da representação do domínio de frequência e armazene as localizações em uma lista.
[0146] Em outra formulação, o método apresentado consiste nas seguintes etapas (a) Para um sinal de entrada que tem a mesma forma que no ponto anterior, aplique a DFT na sequência de entrada. (b) Aplique uma rotação de fase aos valores de domínio de frequência, que é equivalente à uma mudança circular do sinal de entrada por (m + l)/2 passos à esquerda. (c) Aplique uma busca de cruzamento zero, como foi feito no ponto anterior.
[0147] Com relação ao codificador (1) e aos métodos das aplicações descritas, o seguinte é mencionado:
[0148] Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é evidente que esses aspectos também representam uma descrição do método correspondente, onde um bloco ou dispositivo corresponde à uma etapa do método ou um recurso de uma etapa do método. De forma análoga, os aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco ou item ou recurso correspondente de um aparelho correspondente.
[0149] Dependendo de certas exigências de implementação, as aplicações da invenção podem ser implementadas em hardware ou software. A implementação pode ser realizada utilizando um meio de armazenamento digital, por exemplo, um disquete, um DVD, um CD, uma memória ROM, um PROM, uma EPROM, uma EEPROM ou uma memória FLASH, tendo sinais de controle eletronicamente legíveis armazenados em si que cooperam (ou são capazes de cooperação) com um sistema de computador programável, de modo que o respectivo método seja realizado.
[0150] Algumas aplicações, de acordo com a invenção, compreendem um transportador de dados tendo sinais de controle eletronicamente legíveis que são capazes de cooperar com um sistema de computador programável, de modo que um dos métodos aqui descritos seja realizado.
[0151] De modo geral, as aplicações da presente invenção podem ser implementadas como um produto de programa de computador com um código de programa, o código de programa sendo operativo para realizar um dos métodos quando o produto do programa de computador é executado em um computador. O código de programa pode, por exemplo, ser armazenado em uma portadora legível por máquina.
[0152] Outras aplicações compreendem o programa de computador para realizar um dos métodos descritos aqui, armazenados em um transportador legível por máquina ou um meio de armazenamento não transitório.
[0153] Em outras palavras, uma aplicação do método inventivo é, portanto, um programa de computador tendo um código de programa para realizar um dos métodos aqui descritos, quando o programa de computador for executado em um computador.
[0154] Uma aplicação adicional dos métodos inventivos é, portanto, um transportador de dados (ou um meio de armazenamento digital ou a meio legível por computador) compreendendo, gravado nele, o programa de computador para realizar um dos métodos aqui descritos.
[0155] Uma aplicação adicional do método inventivo é, portanto, um fluxo de dados ou uma sequência de sinais que representa o programa de computador para realizar um dos métodos aqui descritos. O fluxo de dados ou a sequência de sinais pode, por exemplo, ser configurado(a) para transferência através de uma conexão de comunicação de dados, por exemplo, via Internet.
[0156] Uma aplicação adicional compreende um meio de processamento, por exemplo, um computador ou um dispositivo de lógica programável, configurado para ou adaptado para realizar um dos métodos aqui descritos.
[0157] Uma aplicação adicional compreende um computador, tendo instalado nele o programa de computador para realizar um dos métodos aqui descritos.
[0158] Em algumas aplicações, um dispositivo lógico programável (por exemplo, um arranjo de portas de campo programável) pode ser utilizado para realizar algumas ou todas as funcionalidades dos métodos aqui descritos. Em algumas aplicações, um arranjo de portas de campo programável pode cooperar com um microprocessador, a fim de realizar um dos métodos aqui descritos. De modo geral, os métodos são vantajosamente realizados por qualquer aparelho de hardware.
[0159] Embora a presente invenção tenha sido descrita em termos de várias aplicações, há alterações, permutações e equivalentes que recaem no escopo da presente invenção. Deve ser observado, ainda, que há muitas formas alternativas de implementar os métodos e composições da presente invenção. É intenção, portanto, que as reivindicações anexas a seguir sejam interpretadas como incluindo todas essas alterações, permutações e equivalentes que recaem no verdadeiro espírito e escopo da presente invenção.
[0160] SINAIS DE REFERÊNCIA: 1. codificador de informação 2. analisador 3. conversor 4. quantizador 5. produtor de fluxo de bits contínuo 6. dispositivo de determinação 7. comutador de coeficiente 8. dispositivo de transformada de Fourier 9. identificador de zero 10. dispositivo de preenchimento zero 11. dispositivo de limitação 12. comutador de fase 13. formador polinomial composto 14. dispositivo de transformada de Fourier de meia amostra 15. sinal de informação RES espectro real IES espectro imaginário 16. fn valores de frequência 17. ...fqn valores de frequência quantizada BS fluxo de bits contínuo REFERÊNCIAS:
[0161] [1] B. Bessette, R. Salami, R. Lefebvre, M. Jelinek, J. Rotola-Pukkila, J. Vainio, H. Mikkola, and K. Jãrvinen, “The adaptive multirate wideband speech codec (AMR- WB)”, Speech and Audio Processing, IEEE Transac- tions on, vol. 10, no. 8, pp. 620-636, 2002.
[0162] [2] ITU-T G.718, “Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s”, 2008.
[0163] [3] M. Neuendorf, P. Gournay, M. Multrus, J. Lecomte, B. Bessette, R. Geiger, S. Bayer, G. Fuchs, J. Hilpert, N. Rettelbach, R. Salami, G. Schuller, R. Lefebvre, and B. Grill, “Unified speech and audio coding scheme for high quality at low bitrates”, in Acoustics, Speech and Signal Processing. ICASSP 2009. IEEE Int Conf, 2009, pp. 1-4.
[0164] [4] T. Bãckstrom and C. Magi, “Properties of line spectrum pair polynomials - a review”, Signal Processing, vol. 86, no. 11, pp. 3286-3298, November 2006.
[0165] [5] G. Kang and L. Fransen, “Application of line-spectrum pairs to low-bit- rate speech encoders”, in Acoustics, Speech, and Signal Processing, IEEE International Conference on ICASSP’85., vol. 10. IEEE, 1985, pp. 244-247.
[0166] [6] P. Kabal and R. P. Ramachandran, “The computation of line spectral frequencies using Chebyshev polynomials”, Acoustics, Speech and Signal Processing, IEEE Transactions on, vol. 34, no. 6, pp. 1419-1426, 1986.
[0167] [7] 3GPP TS 26.190 V7.0.0, “Adaptive multirate (AMR-WB) speech codec”, 2007.
[0168] [8] T. Bãckstrom, C. Magi, and P. Alku, “Minimum separation of line spec- tral frequencies”, IEEE Signal Process. Lett., vol. 14, no. 2, pp. 145-147, February 2007.
[0169] [9] T. Bãckstrom, “Vandermonde factorization of Toeplitz matrices and applications in filtering and warping,” IEEE Trans. Signal Process., vol. 61, no. 24, pp. 6257-6263, 2013.
[0170] [10] V. F. Pisarenko, “The retrieval of harmonics from a covariance function”, Geophysical Journal of the Royal Astronomical Society, vol. 33, no. 3, pp. 347-366, 1973.
[0171] [11] E. Durand, Solutions Numériques des Équations Algébriques. Paris: Masson, 1960.
[0172] [12] I. Kerner, “Ein Gesamtschrittverfahren zur Berechnung der Nullstellen von Polynomen”, Numerische Mathematik, vol. 8, no. 3, pp. 290-294, May 1966.
[0173] [13] O. Aberth, “Iteration methods for finding all zeros of a polynomial simultaneously”, Mathematics of Computation, vol. 27, no. 122, pp. 339-344, April 1973.
[0174] [14] L. Ehrlich, “A modified newton method for polynomials”, Communications of the ACM, vol. 10, no. 2, pp. 107-108, February 1967.
[0175] [15] D. Starer and A. Nehorai, “Polynomial factorization algorithms for adaptive root estimation”, in Int. Conf. on Acoustics, Speech, and Signal Processing, vol. 2. Glasgow, UK: IEEE, May 1989, pp. 1158-1161.
[0176] [16] ——, “Adaptive polynomial factorization by coefficient matching”, IEEE Transactions on Signal Processing, vol. 39, no. 2, pp. 527-530, February 1991.
[0177] [17] G. H. Golub and C. F. van Loan, Matrix Computations, 3rd ed. John Hopkins University Press, 1996.
[0178] [18] T. Saramãki, “Finite impulse response filter design”, Handbook for Digital Signal Processing, pp. 155-277, 1993.

Claims (18)

1. Codificador de informação para codificar um sinal de informação (IS), o codificador de informação (1) compreendendo: um analisador (2) para analisar o sinal de informação (IS) a fim de obter coeficientes de predição linear de um polinômio preditivo A(z); um conversor (3) para converter os coeficientes de predição linear do polinômio preditivo A (z) em valores de frequência (f1...fn) de uma representação de frequência espectral do polinômio preditivo A (z), em que o conversor (3) está configurado para determinar os valores de frequência (f1.fn) analisando um par de polinômios P(z) e Q(z) sendo definidos como P(z)= A(z) +z -m-l A(z-1) e Q(z) = A(z) - z-m-l A(z-1), em que m é uma ordem do polinômio preditivo A(z) e l é maior ou igual a zero, em que o conversor (3) é configurado para obter os valores de frequência (f1.fn) estabelecendo um espectro estritamente real (RES) derivado de P(z) e um espectro estritamente imaginário (IES) de Q(z) e identificando zeros do espectro estritamente real (RES) derivado de P(z) e do espectro estritamente imaginário (IES) derivado de Q(z); um quantizador (4) para obter valores de frequência quantizados (fq1.fqn) a partir dos valores de frequência (f1.fn); e um produtor de fluxo de bits (5) para produzir um fluxo de bits compreendendo os valores de frequência quantizados (fq1...fqn); caracterizado por o conversor (3) compreende um dispositivo limitador (11) para limitar a faixa numérica dos espectros (RES, IES) dos polinômios P(z) e Q(z) multiplicando os polinômios P(z) e Q(z) ou um ou mais polinômios derivados dos polinômios P(z) e Q(z) com um polinômio de filtro B(z), em que o polinômio de filtro B(z) é simétrico e não tem raízes em um círculo unitário.
2. Codificador de informação de acordo com a reivindicação anterior, caracterizado pelo fato de que o conversor (3) compreende um dispositivo de determinação (6) para determinar os polinômios P(z) e Q(z) a partir do polinômio preditivo A(z).
3. Codificador de informação de acordo com uma das reivindicações anteriores, em que o conversor (3) compreende um identificador de zero (9) para identificar os zeros do espectro estritamente real (RES) derivado de P(z) e o espectro estritamente imaginário (IES) derivado de Q(z), em que o identificador de zero (9) é configurado para identificar os zeros por a) começando com o espectro real (RES) em frequência nula; b) aumentar a frequência até que uma mudança de sinal no espectro real (RES) seja encontrada; c) aumentar a frequência até que uma nova mudança de sinal no espectro imaginário (IES) seja encontrada; e d) repetir os passos b) ec) até que todos os zeros sejam encontrados.
4. Codificador de informação, de acordo com a reivindicação 2 ou 3, caracterizado pelo fato de que o identificador de zero é configurado para identificar os zeros por interpolação.
5. Codificador de informação, de acordo com uma das reivindicações anteriores, caracterizado pelo fato de que o conversor (3) compreende um dispositivo de preenchimento de zero (10) para adicionar um ou mais coeficientes tendo um valor "0" para os polinômios P(z) e Q(z) de modo a produzir um par de polinômios alongados Pe(z) e Qe(z).
6. Codificador de informação, de acordo com a reivindicação 5, caracterizado pelo fato de que o conversor (3) é configurado de tal forma que durante a conversão dos coeficientes de predição linear em valores de frequência (f1...fn) da representação de frequência espectral (RES, IES) do O polinômio preditivo A (z) pelo menos uma parte das operações com coeficientes conhecidos por terem o valor "0" dos polinômios alongados Pe(z) e Qe(z)são omitidos.
7. Codificador de informação, de acordo com a reivindicação 5 ou 6, caracterizado pelo fato de que o conversor (3) compreende um formador polinomial composto configurado para estabelecer um polinômio composto Ce(Pe(z), Qe(z))a partir dos polinômios alongados Pe(z) e Qe(z).
8. Codificador de informação, de acordo com a reivindicação anterior, caracterizado pelo fato de que o conversor (3) é configurado de tal forma que o espectro estritamente real (RES) derivado de P(z) e o espectro estritamente imaginário (IES) de Q(z) são estabelecidos por uma única transformada de Fourier pela transformação do polinômio composto Ce(Pe(z), Qe(z)).
9. Codificador de informação, de acordo com uma das reivindicações anteriores, caracterizado pelo fato de que o conversor (3) compreende um dispositivo de transformação de Fourier (8) para transformar Fourier do par de polinômios P(z) e Q(z) ou um ou mais polinômios derivados do par de polinômios P(z) e Q(z) em um domínio de frequência e um dispositivo de ajuste (7, 12) para ajustar uma fase do espectro (RES) derivado de P(z) de modo que seja estritamente real e para ajustar uma fase do espectro (IES) derivada de Q(z) de forma que seja estritamente imaginária.
10. Codificador de informação, de acordo com a reivindicação anterior, caracterizado pelo fato de que o dispositivo de ajuste (7, 12) é configurado como um deslocador de coeficiente (7) para deslocamento circular de coeficientes do par de polinômios P(z) e Q(z) ou aquele ou mais polinômios derivados do par de polinômios P(z) e Q(z).
11. Codificador de informação, de acordo com a reivindicação anterior, caracterizado pelo fato de que o deslocador de coeficiente (7) é configurado para deslocamento circular de coeficientes de tal forma que um ponto médio original de uma sequência de coeficientes é deslocado para a primeira posição da sequência.
12. Codificador de informação de acordo com a reivindicação 9, caracterizado pelo fato de que o dispositivo de ajuste (7, 12) é configurado como um deslocador de fase (12) para deslocar uma fase da saída do dispositivo de transformada de Fourier (8).
13. Codificador de informação, de acordo com a reivindicação anterior, caracterizado pelo fato de que o deslocador de fase (12) é configurado para mudar a fase da saída do dispositivo de transformada de Fourier (8) multiplicando um bin de frequência k-ésima com exp(i2πkh/N), em que N é o comprimento da amostra e h = (m+l)/2.
14. Codificador de informação, de acordo com uma das reivindicações 1 a 8, caracterizado pelo fato de que o conversor (3) compreende um dispositivo de transformada de Fourier (14) para transformar Fourier do par de polinômios P(z) e Q(z) ou um ou mais polinômios derivados do par de polinômios P(z) e Q(z) em um domínio de frequência com meias amostras de modo que o espectro (RES) derivado de P (z) seja estritamente real e de modo que o espectro (IES) derivado de Q(z) é estritamente imaginário.
15. Codificador de informação, de acordo com uma das reivindicações 1 a 6, caracterizado pelo fato de que o conversor (3) compreende um formador polinomial composto (13) configurado para estabelecer um polinômio composto C (P(z), Q(z)) a partir dos polinômios P(z) e Q(z).
16. Codificador de informação, de acordo com a reivindicação anterior, caracterizado pelo fato de que o conversor (3) é configurado de tal forma que o espectro estritamente real (RES) derivado de P (z) e o espectro estritamente imaginário (IES) de Q (z) são estabelecidos por uma única transformada de Fourier ao transformar o polinômio composto C (P(z), Q(z)).
17. Codificador de informação, de acordo com uma das reivindicações 5 a 16, caracterizado pelo fato de que o conversor (3) compreende um dispositivo de limitação (11) para limitar a faixa numérica dos espectros (RES, IES) dos polinômios alongados Pe(z) e Qe(z) ou um ou mais polinômios derivados dos polinômios alongados Pe(z) e Qe(z) multiplicando os polinômios alongados Pe(z) e Qe(z) com um polinômio de filtro B(z), em que o polinômio de filtro B(z) é simétrico e não tem raízes em um círculo unitário.
18. Método para operar um codificador de informação (1) para codificar um sinal de informação (IS), o método compreende as etapas de: analisar o sinal de informação (IS) a fim de obter coeficientes de predição linear de um polinômio preditivo A(z); converter os coeficientes de predição linear do polinômio preditivo A(z) em valores de frequência (f1...fn) de uma representação de frequência espectral (RES, IES) do polinômio preditivo A(z), em que os valores de frequência (f1.fn) são determinados analisando um par de polinômios P(z) e Q(z) sendo definidos como P(z) = A(z) + z-m-l A(z-1) e Q(z) = A(z) - z-m-l A(z-1), em que m é uma ordem do polinômio preditivo A (z) e I é maior ou igual a zero, em que os valores de frequência (f1...fn) são obtidos estabelecendo um espectro estritamente real (RES) derivado de P(z) e um espectro estritamente imaginário (IES) de Q(z) e identificando zeros do espectro estritamente real (RES) derivado de P(z) e do espectro estritamente imaginário (IES) derivado de Q(z); obtenção de valores de frequência quantizados (fq1...fqn) a partir dos valores de frequência (fi...fn); e produzir um fluxo de bits (BS) compreendendo os valores de frequência quantizados (fqi.fqn); caracterizado por limitar o intervalo numérico dos espectros (RES, IES) dos polinômios P(z) e Q(z) multiplicando os polinômios P(z) e Q(z) ou um ou mais polinômios derivados dos polinômios P(z) e Q(z) com um polinômio de filtro B (z), em que o polinômio de filtro B(z) é simétrico e não tem raízes em um círculo unitário.
BR112016018694-0A 2014-03-07 2015-02-09 Conceito para codificação de informação BR112016018694B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP14158396.3 2014-03-07
EP14158396 2014-03-07
EP14178789.5A EP2916319A1 (en) 2014-03-07 2014-07-28 Concept for encoding of information
EP14178789.5 2014-07-28
PCT/EP2015/052634 WO2015132048A1 (en) 2014-03-07 2015-02-09 Concept for encoding of information

Publications (2)

Publication Number Publication Date
BR112016018694A2 BR112016018694A2 (pt) 2017-08-22
BR112016018694B1 true BR112016018694B1 (pt) 2022-09-06

Family

ID=51260570

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112016018694-0A BR112016018694B1 (pt) 2014-03-07 2015-02-09 Conceito para codificação de informação

Country Status (18)

Country Link
US (3) US10403298B2 (pt)
EP (4) EP2916319A1 (pt)
JP (3) JP6420356B2 (pt)
KR (1) KR101875477B1 (pt)
CN (2) CN111179952B (pt)
AR (1) AR099616A1 (pt)
AU (1) AU2015226480B2 (pt)
BR (1) BR112016018694B1 (pt)
CA (1) CA2939738C (pt)
ES (1) ES2721029T3 (pt)
MX (1) MX358363B (pt)
MY (1) MY192163A (pt)
PL (1) PL3097559T3 (pt)
PT (1) PT3097559T (pt)
RU (1) RU2670384C2 (pt)
SG (1) SG11201607433YA (pt)
TW (1) TWI575514B (pt)
WO (1) WO2015132048A1 (pt)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2834532A1 (en) 2011-04-29 2012-11-01 Selecta Biosciences, Inc. Tolerogenic synthetic nanocarriers to reduce cytotoxic t lymphocyte responses
BR112015007137B1 (pt) * 2012-10-05 2021-07-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho para codificar um sinal de fala que emprega acelp no domínio de autocorrelação
KR20220025908A (ko) 2013-05-03 2022-03-03 셀렉타 바이오사이언시즈, 인크. 제i형 및 제iv형 과민성을 감소시키기 위한 관용유발 합성 나노담체의 국부, 병용 투여
EP2916319A1 (en) 2014-03-07 2015-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding of information
PL3471095T3 (pl) * 2014-04-25 2024-07-15 Ntt Docomo, Inc. Urządzenia do przekształcania współczynnika predykcji liniowej i sposób przekształcania współczynnika predykcji liniowej
EP3189147A1 (en) * 2014-09-07 2017-07-12 Selecta Biosciences, Inc. Methods and compositions for attenuating gene expression modulating anti-viral transfer vector immune responses
US10349127B2 (en) * 2015-06-01 2019-07-09 Disney Enterprises, Inc. Methods for creating and distributing art-directable continuous dynamic range video
US10211953B2 (en) * 2017-02-07 2019-02-19 Qualcomm Incorporated Antenna diversity schemes
JP7515741B2 (ja) 2020-12-23 2024-07-12 三菱電機株式会社 デジタル予歪および電力増幅器システム自動調整のための対話型オンライン適応

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3246029B2 (ja) * 1993-01-29 2002-01-15 ソニー株式会社 音声信号処理装置及び電話装置
US5701390A (en) 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
DE69626088T2 (de) * 1995-11-15 2003-10-09 Nokia Corp., Espoo Bestimmung der Linienspektrumfrequenzen zur Verwendung in einem Funkfernsprecher
JPH09212198A (ja) * 1995-11-15 1997-08-15 Nokia Mobile Phones Ltd 移動電話装置における線スペクトル周波数決定方法及び移動電話装置
US6480822B2 (en) * 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
FI116992B (fi) * 1999-07-05 2006-04-28 Nokia Corp Menetelmät, järjestelmä ja laitteet audiosignaalin koodauksen ja siirron tehostamiseksi
US6611560B1 (en) * 2000-01-20 2003-08-26 Hewlett-Packard Development Company, L.P. Method and apparatus for performing motion estimation in the DCT domain
US6665638B1 (en) * 2000-04-17 2003-12-16 At&T Corp. Adaptive short-term post-filters for speech coders
JP2004502204A (ja) * 2000-07-05 2004-01-22 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ラインスペクトル周波数をフィルタ係数に変換する方法
US7089178B2 (en) * 2002-04-30 2006-08-08 Qualcomm Inc. Multistream network feature processing for a distributed speech recognition system
JP4649208B2 (ja) * 2002-07-16 2011-03-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオコーディング
CA2415105A1 (en) 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
CN1458646A (zh) * 2003-04-21 2003-11-26 北京阜国数字技术有限公司 一种滤波参数矢量量化和结合量化模型预测的音频编码方法
EP1711938A1 (en) * 2004-01-28 2006-10-18 Koninklijke Philips Electronics N.V. Audio signal decoding using complex-valued data
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
CN1677493A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
KR100723409B1 (ko) * 2005-07-27 2007-05-30 삼성전자주식회사 프레임 소거 은닉장치 및 방법, 및 이를 이용한 음성복호화 방법 및 장치
US7831420B2 (en) * 2006-04-04 2010-11-09 Qualcomm Incorporated Voice modifier for speech processing systems
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
CN101149927B (zh) * 2006-09-18 2011-05-04 展讯通信(上海)有限公司 在线性预测分析中确定isf参数的方法
CN103383846B (zh) * 2006-12-26 2016-08-10 华为技术有限公司 改进语音丢包修补质量的语音编码方法
KR101531910B1 (ko) * 2007-07-02 2015-06-29 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
US20090198500A1 (en) 2007-08-24 2009-08-06 Qualcomm Incorporated Temporal masking in audio coding based on spectral dynamics in frequency sub-bands
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
US8290782B2 (en) * 2008-07-24 2012-10-16 Dts, Inc. Compression of audio scale-factors by two-dimensional transformation
CN101662288B (zh) * 2008-08-28 2012-07-04 华为技术有限公司 音频编码、解码方法及装置、系统
JP2010060989A (ja) 2008-09-05 2010-03-18 Sony Corp 演算装置および方法、量子化装置および方法、オーディオ符号化装置および方法、並びにプログラム
ES2441069T3 (es) * 2009-10-08 2014-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, procedimiento y programa de computación que usan un modelado de ruido en base a linealidad-predicción-codificación
MX2012004648A (es) 2009-10-20 2012-05-29 Fraunhofer Ges Forschung Codificacion de señal de audio, decodificador de señal de audio, metodo para codificar o decodificar una señal de audio utilizando una cancelacion del tipo aliasing.
CA3045686C (en) * 2010-04-09 2020-07-14 Dolby International Ab Audio upmixer operable in prediction or non-prediction mode
MY194835A (en) 2010-04-13 2022-12-19 Fraunhofer Ges Forschung Audio or Video Encoder, Audio or Video Decoder and Related Methods for Processing Multi-Channel Audio of Video Signals Using a Variable Prediction Direction
CN101908949A (zh) * 2010-08-20 2010-12-08 西安交通大学 无线通信系统及其基站、中继站、用户终端和数据的发送接收方法
KR101747917B1 (ko) * 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
US20130211846A1 (en) * 2012-02-14 2013-08-15 Motorola Mobility, Inc. All-pass filter phase linearization of elliptic filters in signal decimation and interpolation for an audio codec
US9479886B2 (en) * 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
CN102867516B (zh) * 2012-09-10 2014-08-27 大连理工大学 一种采用高阶线性预测系数分组矢量量化的语音编解方法
WO2014138539A1 (en) * 2013-03-08 2014-09-12 Motorola Mobility Llc Conversion of linear predictive coefficients using auto-regressive extension of correlation coefficients in sub-band audio codecs
EP2916319A1 (en) * 2014-03-07 2015-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding of information

Also Published As

Publication number Publication date
JP6420356B2 (ja) 2018-11-07
CN106068534A (zh) 2016-11-02
ES2721029T3 (es) 2019-07-26
JP2021006922A (ja) 2021-01-21
JP2017513048A (ja) 2017-05-25
EP3097559B1 (en) 2019-03-13
WO2015132048A1 (en) 2015-09-11
EP4318471A3 (en) 2024-04-10
US20210335373A1 (en) 2021-10-28
EP4318471A2 (en) 2024-02-07
BR112016018694A2 (pt) 2017-08-22
CN111179952B (zh) 2023-07-18
US20160379656A1 (en) 2016-12-29
TW201537566A (zh) 2015-10-01
JP6772233B2 (ja) 2020-10-21
KR20160129891A (ko) 2016-11-09
JP7077378B2 (ja) 2022-05-30
SG11201607433YA (en) 2016-10-28
MX2016011516A (es) 2016-11-29
MY192163A (en) 2022-08-03
KR101875477B1 (ko) 2018-08-02
CA2939738A1 (en) 2015-09-11
AR099616A1 (es) 2016-08-03
PL3097559T3 (pl) 2019-08-30
CA2939738C (en) 2018-10-02
AU2015226480A1 (en) 2016-09-01
RU2670384C2 (ru) 2018-10-22
US11640827B2 (en) 2023-05-02
US10403298B2 (en) 2019-09-03
CN111179952A (zh) 2020-05-19
US20190341065A1 (en) 2019-11-07
JP2019049729A (ja) 2019-03-28
EP3503099A1 (en) 2019-06-26
AU2015226480B2 (en) 2018-01-18
EP3097559A1 (en) 2016-11-30
PT3097559T (pt) 2019-06-18
MX358363B (es) 2018-08-15
EP3503099C0 (en) 2024-05-01
RU2016137805A (ru) 2018-04-10
EP3503099B1 (en) 2024-05-01
US11062720B2 (en) 2021-07-13
CN106068534B (zh) 2020-01-17
EP2916319A1 (en) 2015-09-09
TWI575514B (zh) 2017-03-21

Similar Documents

Publication Publication Date Title
BR112016018694B1 (pt) Conceito para codificação de informação
JP6153661B2 (ja) 改善されたパルス再同期化を採用するacelp型封じ込めにおける適応型コードブックの改善された封じ込めのための装置および方法
JP6482540B2 (ja) 改善されたピッチラグ推定を採用するacelp型封じ込めにおける適応型コードブックの改善された封じ込めのための装置および方法
RU2694150C1 (ru) Устройство преобразования коэффициентов линейного предсказания и способ преобразования коэффициентов линейного предсказания
Bäckström et al. Finding line spectral frequencies using the fast Fourier transform
Domadiya et al. A complex Ferrari LPC to LSF implementation

Legal Events

Date Code Title Description
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 09/02/2015, OBSERVADAS AS CONDICOES LEGAIS