ES2749967T3 - Codificación de audio en base a una representación eficiente de coeficientes autorregresivos - Google Patents

Codificación de audio en base a una representación eficiente de coeficientes autorregresivos Download PDF

Info

Publication number
ES2749967T3
ES2749967T3 ES17190535T ES17190535T ES2749967T3 ES 2749967 T3 ES2749967 T3 ES 2749967T3 ES 17190535 T ES17190535 T ES 17190535T ES 17190535 T ES17190535 T ES 17190535T ES 2749967 T3 ES2749967 T3 ES 2749967T3
Authority
ES
Spain
Prior art keywords
frequency
quantized
spectral representation
coefficients
parametric spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES17190535T
Other languages
English (en)
Inventor
Volodya Grancharov
Sigurdur Sverrisson
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Application granted granted Critical
Publication of ES2749967T3 publication Critical patent/ES2749967T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation
    • G10L2019/001Interpolation of codebook vectors

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Error Detection And Correction (AREA)

Abstract

Un codificador (40) para codificar una representación espectral paramétrica (f) de coeficientes autorregresivos (a) que representan parcialmente una señal de audio, incluyendo dicho codificador: - medios (10) para codificar una parte de baja frecuencia (fL) de la representación espectral paramétrica (f) por cuantificación de coeficientes de la representación espectral paramétrica que corresponden a una parte de baja frecuencia de la señal de audio; - medios (12) para codificar una parte de alta frecuencia (fH) de la representación espectral paramétrica (f) por promediado ponderado en base a los coeficientes cuantificados (fL) volteados alrededor una frecuencia de traslado especular cuantificada (fm), que separa la parte de baja frecuencia de la parte de alta frecuencia, y una cuadrícula de frecuencia (gopt) determinada a partir de un libro de códigos de cuadrícula de frecuencia (24) en un procedimiento de búsqueda de ciclo cerrado; y - medios para dejar salir al menos un índice de cuantificación (IfL) que representa los coeficientes cuantificados (fL), un índice de cuantificación (Im) que representa la frecuencia de traslado especular cuantificada (fm) y un índice de cuantificación (Ig) que representa la cuadrícula de frecuencia (gopt) para la transmisión a un descodificador.

Description

DESCRIPCIÓN
Codificación de audio en base a una representación eficiente de coeficientes autorregresivos
Campo técnico
La tecnología propuesta se refiere a codificación de audio en base a una representación eficiente de coeficientes autorregresivos (AR).
Antecedentes
El análisis AR se utiliza comúnmente en la codificación de audio tanto en el dominio tiempo [1] como el dominio transformada [2]. Un enfoque de codificación se divulga en el documento EP1818913. Diferentes aplicaciones utilizan vectores de diferente longitud (el orden de modelo es dependiente principalmente del ancho de banda de la señal codificada; desde 10 coeficientes para señales con un ancho de banda de 4 kHz, hasta 24 coeficientes para señales con un ancho de banda de 16 kHz). Estos coeficientes AR están cuantificados con cuantificación vectorial (VQ) multietapa y dividida, que garantiza una reconstrucción casi transparente. Sin embargo, los esquemas de cuantificación convencionales no están diseñados para el caso en el que los coeficientes AR modelan altas frecuencias de audio (por ejemplo, por encima de 6 kHz), y operan a presupuestos de bit limitados (que no permiten codificación transparente de los coeficientes). Esto introduce grandes errores perceptuales en la señal reconstruida cuando estos esquemas de cuantificación convencionales se utilizan a rangos de frecuencia no óptimos y tasas de bit no óptimas.
Sumario
Un objeto de la tecnología propuesta es un esquema de cuantificación más eficiente para los coeficientes autorregresivos.
Este objeto se consigue en acuerdo con las reivindicaciones adjuntas.
Un primer aspecto de la tecnología propuesta involucra un aparato para codificar una representación espectral paramétrica de coeficientes autorregresivos que parcialmente representan una señal de audio. El aparato comprende:
- medios para codificar una parte de baja frecuencia de la representación espectral paramétrica cuantificando coeficientes de la representación espectral paramétrica que corresponde a una parte de baja frecuencia de la señal de audio;
- medios para codificar una parte de alta frecuencia de la representación espectral paramétrica por promediado ponderado en base a los coeficientes cuantificados volteados alrededor de una frecuencia de traslado especular cuantificada, que separa la parte de baja frecuencia de la parte de alta frecuencia, y una cuadrícula de frecuencia determinada a partir de un libro de códigos de cuadrícula de frecuencia en un procedimiento de búsqueda de ciclo cerrado;
- medios para dejar salir al menos un índice de cuantificación representando los coeficientes cuantificados, un índice de cuantificación que representa la frecuencia de traslado especular cuantificada y un índice de cuantificación que representa la cuadrícula de frecuencia para la transmisión a un descodificador.
Un segundo aspecto de la tecnología propuesta involucra un método de codificar una representación espectral paramétrica de coeficientes autorregresivos que representan parcialmente una señal de audio. El método comprende:
- codifica una parte de baja frecuencia de la representación espectral paramétrica cuantificando coeficientes de la representación espectral paramétrica que corresponden a una parte de baja frecuencia de la señal de audio;
- codifica una parte de alta frecuencia de la representación espectral paramétrica por promediado ponderado en base a los coeficientes cuantificados volteados alrededor de una frecuencia de traslado especular cuantificada, que separa la parte de baja frecuencia de la parte de alta frecuencia, y una cuadrícula de frecuencia determinada a partir de un libro de códigos de cuadrícula de frecuencia en un procedimiento de búsqueda de ciclo cerrado;
- deja salir al menos un índice de cuantificación que representa los coeficientes cuantificados, un índice de cuantificación que representa la frecuencia de traslado especular cuantificada y un índice de cuantificación que representa la cuadrícula de frecuencia para la transmisión a un codificador.
La tecnología propuesta proporciona un esquema de baja tasa de bit para la compresión o codificación de coeficientes autorregresivos. En adición a mejoras perceptuales, la tecnología propuesta también tiene la ventaja de reducir la complejidad computacional en comparación con métodos de cuantificación de espectro entero.
Breve descripción de los dibujos
La tecnología propuesta, junto con más objetos y ventajas de la misma, puede entenderse mejor haciendo referencia a la siguiente descripción junto con los dibujos que se acompañan, en los que:
la figura 1 es un diagrama de flujo del método de codificación de acuerdo con la tecnología propuesta;
la figura 2 ilustra una realización del método de lado de codificador de la tecnología propuesta;
la figura 3 ilustra el volteo de elementos LSF de baja frecuencia cuantificados (representados por puntos negros) a alta frecuencia trasladándolos especularmente al espacio previamente ocupado por la mitad superior del vector LSF; la figura 4 ilustra el efecto de alisado de cuadrícula en un espectro de señal;
la figura 5 es un diagrama de bloques de una realización del codificador de acuerdo con la tecnología propuesta; la figura 6 es un diagrama de bloques de una realización del codificador de acuerdo con la tecnología propuesta; la figura 7 es un diagrama de flujo del método de descodificación de acuerdo con la tecnología propuesta;
la figura 8 ilustra un ejemplo del método de lado de descodificador de la tecnología propuesta;
la figura 9 es un diagrama de bloques de un ejemplo del descodificador de acuerdo con la tecnología propuesta; la figura 10 es un diagrama de bloques de un ejemplo del descodificador de acuerdo con la tecnología propuesta; la figura 11 es un diagrama de bloques de una realización del codificador de acuerdo con la tecnología propuesta; la figura 12 es un diagrama de bloques de un ejemplo del descodificador de acuerdo con la tecnología propuesta; la figura 13 ilustra una realización de un equipo de usuario que incluye un codificador de acuerdo con la tecnología propuesta; y
la figura 14 ilustra un ejemplo de un equipo de usuario que incluye un descodificador de acuerdo con la tecnología propuesta.
Descripción detallada
La tecnología propuesta requiere como entrada un vector a de coeficientes AR (otro nombre utilizado comúnmente es coeficientes de predicción lineal (LP)). Se obtienen típicamente por computar primero las autocorrelaciones r(j) del segmento de audio en ventana s(n), n=1, ..., N, es decir:
TV
r ( j ) = Y .s(n)s(n - J ) ’ j = 0 ,...,M (1)
n=j
donde M es el orden de modelo predefinido. Entonces los coeficientes AR a se obtienen desde la secuencia de autocorrelación r(j) a través del algoritmo Levinson-Durbin [3].
En un sistema de comunicación de audio AR los coeficientes tienen que transmitirse eficientemente desde la parte de codificador a la de decodificación del sistema. En la tecnología propuesta esto se consigue cuantificando solo ciertos coeficientes, y representando los coeficientes restantes con solo un número pequeño de bits.
Codificador
La figura 1 es un diagrama de flujo del método de codificación de acuerdo con la tecnología propuesta. El paso S1 codifica una parte de baja frecuencia de la representación espectral paramétrica cuantificando elementos de la representación espectral paramétrica que corresponden a una parte de baja frecuencia de la señal de audio. El paso S2 codifica una parte de alta frecuencia de la representación espectral paramétrica por promediado ponderado en base a los elementos cuantificados volteados alrededor una frecuencia de traslado especular cuantificada, que separa la parte de baja frecuencia de la parte de alta frecuencia, y una cuadrícula de frecuencia determinada a partir de un libro de códigos de cuadrícula de frecuencia en un procedimiento de búsqueda de ciclo cerrado.
La figura 2 ilustra pasos realizados en el lado de codificador de una realización de la tecnología propuesta. Primero los coeficientes AR se convierten en una representación de frecuencias de espectro lineal (LSF) en el paso S3, por ejemplo por el algoritmo descrito en [4]. Entonces el vector LSF f se divide en dos partes, indicadas como partes de frecuencia baja (L) y alta (H) en el paso S4. Por ejemplo, en un vector 10 dimensional LSF, los primeros 5 coeficientes pueden asignarse al sub-vector L fL y los coeficientes restantes al sub-vector H fH.
Aunque la tecnología propuesta será descrita con referencia a una representación LSF, los conceptos generales pueden también aplicarse a una implementación alternativa en el que el vector AR se convierte en otra representación espectral paramétrica, tal como un par espectral lineal (LSP) o pares espectrales de inmitancia (ISO) en vez de LSF.
Solo el sub-vector f1- de baja frecuencia LSF se cuantifica en el paso S5, y sus índices de cuantificación k son transmitidos al descodificador. Las LSF de alta frecuencia del sub-vector fH no son cuantificadas, sino que solamente se usan en la cuantificación de una frecuencia de traslado especular fm (a fm) y la búsqueda de ciclo cerrado de una cuadrícula de frecuencia óptima gopt desde un conjunto de cuadrículas de frecuencia gi que forman un libro de códigos de cuadrícula de frecuencia, como se describe con referencia a las ecuaciones (2)-(13) posteriores. Los índices de cuantificación Im e Ig para la frecuencia de traslado especular y la cuadrícula de frecuencia óptima, respectivamente, representan el vector fH de alta frecuencia LSF codificado y se transmiten al descodificador. La codificación del sub-vector de alta frecuencia fH ocasionalmente será denominado “extrapolación” en la siguiente descripción.
En la realización propuesta la cuantificación está basada en un conjunto de cuantificadores escalares (SQs) individualmente optimizados en las propiedades estadísticas de los parámetros anteriores. En una implementación alternativa los elementos LSF podrían enviarse a un cuantificador vectorial (VQ) o se puede aún entrenar un VQ para el conjunto combinado de parámetros (los LSF, la frecuencia de traslado especular, y la cuadrícula óptima). Los LSF de baja frecuencia del sub-vector f1- son volteados en el paso S6 adentro del espacio en el que se extienden los LSF de alta frecuencia del sub-vector fH. Esta operación se ilustra en la figura 3. Primero la frecuencia de traslado especular cuantificada fm se calcula de acuerdo con:
donde f denota todo el vector LSF y Q( ) es la cuantificación de la diferencia entre el primer elemento en fH (concretamente f(M/2)) y el último elemento cuantificado en f1-(concretamente f(M/2-1)), y donde M denota el número total de elementos en la representación espectral paramétrica.
Después los LSF volteados ffiip(k) son calculados de acuerdo con:
Entonces, los LSF volteados se re-escalan de manera que estarán limitados dentro del rango [0... 0.5] (como una alternativa el rango puede representarse en radianes como [0... tc]) de acuerdo con:
Figure imgf000004_0001
Las cuadrículas de frecuencia gi se re-escalan para caber en el intervalo entre el último elemento LSF cuantificado f(M/2-1) y un valor de punto de cuadrícula máximo gmax, es decir:
Estos coeficientes volteados y re-escalados ffiip(k) (colectivamente denotados fhHen la figura 2) son procesados adicionalmente en el paso S7 alisando con las cuadrículas de frecuencia re-escaladas gi(k). El alisado tiene la forma de una suma ponderada entre los LSF volteados y re-escalados ffiip(k) y las cuadrículas de frecuencia re-escaladas gi(k), de acuerdo con:
donde A,(k) y [1 - A,(k)] son ponderaciones predefinidos.
Puesto que la ecuación (6) incluye un índice libre i, esto significa que un vector fsmooth(k) se generará para cada gi(k).
Así, la ecuación (6) puede expresarse como:
El alisado se realiza en el paso S7 en una búsqueda de ciclo cerrado sobre todas las cuadrículas de frecuencia gi, para encontrar la que minimiza un criterio predefinido (descrito después de la ecuación (12) posterior).
Para M/2 = 5 las ponderaciones X(k) en la ecuación (7) pueden elegirse como:
Á = { 0.2, 0.35, 0.5, 0.75, 0.8 } (8)
En una realización estas constantes están optimizadas perceptualmente (se sugieren diferentes conjuntos de valores, y finalmente se selecciona el conjunto que maximiza la calidad, como se declara por un panel de oyentes). Generalmente los valores de elementos en X aumentan según el índice k aumenta. Puesto que un índice más alto corresponde a una frecuencia más alta, las frecuencias más altas del espectro resultante están más influenciadas por gi(k) que por ffiip (véase la ecuación (7)). Este resultado de este promediado alisado o ponderado es un espectro más plano hacia las frecuencias altas (la estructura de espectro introducida potencialmente por ffiip se retira progresivamente hacia frecuencias más altas).
Aquí gmax se selecciona cerca de, pero menos que 0,5. En este ejemplo, gmax se selecciona igual a 0,49.
El método en este ejemplo utiliza 4 cuadrículas entrenadas gi (menos o más cuadrículas son posibles). Vectores de cuadrícula de plantilla en un rango [0... 1], pre-almacenados en la memoria, son de la forma:
g = 0.17274857, 0.35811835, 0.52369229, 0.71552804, 0.85539771 }
g 2 ~ 0.16313042, 0.30782962, 0.43109281, 0.59395830, 0.81291897 }
(9)
g 3 = 0.17172427, 0.33157177, 0.48528862, 0.66492442, 0.82952486 }
g4 = 0.16666667, 0.33333333, 0.50000000, 0.66666667, 0.83333333 }
Si se asume que la posición del último coeficiente LSF cuantificado f(M/2-1) es 0,25, los vectores de cuadrícula re­ escalados cogen la forma:
Figure imgf000005_0001
Un ejemplo del efecto de alisar los coeficientes LSF volteados y re-escalados a los puntos de cuadrícula se ilustra en la figura 4. Con un número creciente de vectores de cuadricula utilizados en el procedimiento de ciclo cerrado, el espectro resultante se acerca mucho al espectro objetivo.
Si gmax = 0,5 en vez de 0,49, el libro de códigos de cuadrícula de frecuencia puede en cambio estar formado por:
g = 0.15998503, 0.31215086, 0.47349756, 0.66540429, 0.84043882 }
2
g = 0.15614473, 0.30697672, 0.45619822, 0.62493785, 0.77798001 }
g 3 _ ( 11) 0.14185823, 0.26648724, 0.39740108, 0.55685745, 0.74688616 }
g 4 ^ 0.15416561, 0.27238427, 0.39376780, 0.59287916, 0.86613986 }
Si se asume de nuevo que la posición del último coeficiente LSF cuantificado f(M/2-1) es 0,25, los vectores de cuadrícula re-escalados toman la forma:
í = 0.28999626, 0.32803772, 0.36837439, 0.41635107, 0.46010970}
g =■ 0.28903618, 0.32674418, 0.36404956, 0.40623446, 0.44449500}
g =■ 0.28546456, 0.31662181, 0.34935027, 0.38921436, 0.43672154} (12)
g4 =\ 0.28854140, 0.31809607, 0.34844195, 0.39821979, 0.46653496}
Se hace notar que las cuadrículas re-escaladas gi pueden ser diferentes de trama a trama, puesto que f(M/2-1) en la ecuación de re-escalado (5) puede no ser constante, sino variar con el tiempo. Sin embargo, el libro de códigos formado por las cuadrículas de plantilla gi es constante. En este sentido las cuadrículas re-escaladas gi pueden ser consideradas como un libro de códigos adaptativo formado a partir de un libro de códigos fijo de cuadrículas de plantilla gi.
Los vectores LSF fsmooth creados por la suma ponderada en (7) se comparan con el vector LSF objetivo f1"1 y la cuadrícula óptima gi se selecciona como la que minimiza el error cuadrático medio (MSE) entre estos dos vectores. El índice opt de esta cuadrícula óptima puede expresarse matemáticamente como:
Figure imgf000006_0001
donde fH(k) es un vector objetivo formado por los elementos de la parte de alta frecuencia de la representación espectral paramétrica.
En una implementación alternativa se puede utilizar medidas de error más avanzadas que imitan distorsión espectral (SD), por ejemplo media inversa harmónica u otra ponderación en el dominio LSF.
En una realización el libro de códigos de cuadrícula de frecuencia se obtiene con un algoritmo de agrupación de medias de K en un gran conjunto de vectores LSF, que ha sido extraído de una base de datos de habla. Los vectores de cuadrícula en las ecuaciones (9) y (11) se seleccionan como los que, después de un re-escalado de acuerdo con la ecuación (5) y un promediado ponderado con fnip de acuerdo con la ecuación (7), minimizan la distancia al cuadrado a fH. En otras palabras, estos vectores de cuadrícula, cuando se utilizan en la ecuación (7), dan la mejor representación de los coeficientes LSF de alta frecuencia.
La figura 5 es un diagrama de bloques de una realización del descodificador de acuerdo con la tecnología propuesta. El descodificador 40 incluye un descodificador de baja frecuencia 10 configurado para descodificar una parte de baja frecuencia de la representación espectral paramétrica f cuantificando elementos de la representación espectral paramétrica que corresponden a una parte de baja frecuencia de la señal de audio. El descodificador 40 también incluye un descodificador de alta frecuencia 12 configurado para descodificar una parte de alta frecuencia fH de la representación espectral paramétrica por promediado ponderado en base a los elementos cuantificados f- volteados alrededor de una frecuencia de traslado especular cuantificada que separa la parte de baja frecuencia de la parte de alta frecuencia, y una cuadrícula de frecuencia de un libro de códigos de cuadrícula de frecuencia 24 en un procedimiento de búsqueda de ciclo cerrado. Las entidades cuantificadas f1-, fm, gopt se representan por los índices correspondientes de cuantificación IfL, Im, Ig, que se transmiten al descodificador.
La figura 6 es un diagrama de bloques de una realización del descodificador de acuerdo con la tecnología propuesta. El descodificador de baja frecuencia 10 recibe todo el vector LSF f, que está dividido en una parte de baja frecuencia o sub-vector f1- y una parte de alta frecuencia o sub-vector fH por un divisor de vector 14. La parte de baja frecuencia se avanza a un cuantificador 16, que está configurado para codificar la parte de baja frecuencia f- cuantificando sus elementos, por cuantificación bien escalar o bien vectorial, en una parte de baja frecuencia cuantificada o sub-vector f- . Al menos un índice de cuantificación IfL (dependiendo del método de cuantificación utilizado) se deja salir para la transmisión al descodificador.
El sub-vector f- de baja frecuencia cuantificado y el sub-vector fH de alta frecuencia aún no codificado se avanzan al descodificador de alta frecuencia 12. Una calculadora de frecuencia de traslado especular 18 se configura para calcular la frecuencia de traslado especular cuantificada fm de acuerdo con la ecuación (2). Las líneas discontinuas indican que sólo se necesitan para ello el último elemento cuantificado f(M/2-1) en f- y el primer elemento f(M/2) in fH. El índice de cuantificación Im que representa la frecuencia de traslado especular cuantificada fm se deja salir para la transmisión al descodificador.
La frecuencia de traslado especular cuantificada fm se avanza a una unidad de volteo de sub-vector de baja frecuencia cuantificada 20 configurada para voltear los elementos del sub-vector f- de baja frecuencia cuantificada alrededor de la frecuencia de traslado especular cuantificada fm de acuerdo con la ecuación (3). Los elementos volteados fflip(k) y la frecuencia de traslado especular cuantificada fm se avanzan a un re-escalador de elemento volteado 22 configurado para re-escalar los elementos volteados de acuerdo con la ecuación (4).
Las cuadrículas de frecuencia gi(k) se avanzan desde el libro de códigos de cuadrícula de frecuencia 24 a un re­ escalador de cuadrícula de frecuencia 26, que también recibe el último elemento cuantificado f(M/2-1) en f-. El re­ escalador 26 está configurado para re-escalar de acuerdo con la ecuación (5).
Los LSF volteados y re-escalados ffiip(k) del re-escalador de elemento volteado 22 y las cuadrículas de frecuencia re­ escaladas gi(k) desde el re-escaldor de cuadrícula de frecuencia 26 se avanzan a una unidad de ponderación 28, que está configurada para realizar un promediado ponderado de acuerdo con la ecuación (7). Los elementos alisados resultantes fLooÁk) y el vector objetivo de alta frecuencia í1"1 se avanzan a una unidad de búsqueda de cuadrícula de frecuencia 30 configurada para seleccionar una cuadrícula de frecuencia gopt de acuerdo con la ecuación (13). El índice Ig correspondiente se transmite al descodificador.
Descodificador
La figura 7 es un diagrama de flujo del método de descodificación de acuerdo con la tecnología propuesta. El paso S11 reconstruye elementos de una parte de baja frecuencia de la representación espectral paramétrica que corresponde a una parte de baja frecuencia de la señal de audio de al menos un índice de cuantificación que codifica esa parte de la representación espectral paramétrica. El paso S12 reconstruye elementos de una parte de alta frecuencia de la representación espectral paramétrica por promediado ponderado en base a los elementos decodificados volteados alrededor de una frecuencia de traslado especular descodificada, que separa la parte de baja frecuencia de la parte de alta frecuencia, y una cuadrícula de frecuencia descodificada.
Los pasos del método realizados en el descodificador se ilustran por el ejemplo en la figura 8. Primero se reciben los índices de cuantificación k , Im, Ig para los LSF de baja frecuencia, la frecuencia óptima de traslado especular y la cuadrícula óptima, respectivamente.
En el paso S13 la parte de baja frecuencia cuantificada fL es reconstruida desde un libro de códigos de baja frecuencia utilizando el índice recibido k.
Los pasos del método realizados en el descodificador para reconstruir la parte de alta frecuencia f" son muy similares a pasos de procesamiento de codificador ya descritos en ecuaciones (3)-(7).
Los pasos de volteo y re-escalado realizados en el descodificador (en S14) son idénticos a las operaciones de codificador, y por lo tanto descritos exactamente en las ecuaciones (3)-(4).
Los pasos (en S15) de re-escalado de la cuadrícula (ecuación (5)), y alisado con ello (ecuación (6)), requieren solo ligera modificación en el descodificador, porque no se realiza la búsqueda de ciclo cerrado (búsqueda sobre i). Esto es porque el descodificador recibe el índice óptimo opt desde la corriente de bits. Estas ecuaciones en cambio cogen la siguiente forma:
y
/„ ,# ') = [1 - Mk)\f,„p(k) + m ~gm(k) (15)
respectivamente. El vector fsmooth representa la parte de alta frecuencia f" de la señal descodificada.
Finalmente, las partes de baja y alta frecuencia f- , f" del vector LSF se combinan en el paso S16, y el vector resultante f se transforma en coeficientes AR a en el paso S17.
La figura 9 es un diagrama de bloques de un ejemplo del descodificador 50 de acuerdo con la tecnología propuesta. Un descodificador de baja frecuencia 60 se configura para reconstruir elementos f1- de una parte de baja frecuencia fde la representación espectral paramétrica f que corresponde a una parte de baja frecuencia de la señal de audio de al menos un índice de cuantización k que codifica esa parte de la representación espectral paramétrica. Un descodificador de alta frecuencia 62 está configurado para reconstruir elementos f" de una parte de alta frecuencia f" de la representación espectral paramétrica por promediado ponderado en base a los elementos descodificados fvolteados alrededor de una frecuencia de traslado especular descodificada fm, que separa la parte de baja frecuencia de la parte de alta frecuencia, y una cuadrícula de frecuencia descodificada gopt. La cuadrícula de frecuencia gopt se obtiene recuperando la cuadrícula de frecuencia que corresponde a un índice recibido Ig de un libro de códigos de cuadrícula de frecuencia 24 (este es el mismo libro de códigos que en el codificador).
La figura 10 es un diagrama de bloques de un ejemplo del descodificador de acuerdo con la tecnología propuesta. El descodificador de baja frecuencia recibe al menos un índice de cuantificación k , dependiendo de si se utiliza cuantificación escalar o vectorial, y lo avanza a un descodificador de índice de cuantificación 66, que reconstruye elementos f- de la parte de baja frecuencia de la representación espectral paramétrica. El descodificador de alta frecuencia 62 recibe un índice de cuantificación de frecuencia de traslado especular Im, que se avanza a un descodificador de frecuencia de traslado especular 66 para descodificar la frecuencia de traslado especular fm. Los bloques restantes 20, 22, 24, 26 y 28 realizan las mismas funciones que los bloques numerados correspondientemente en el codificador ilustrado en la figura 6. Las diferencias esenciales entre el codificador y el descodificador son que la frecuencia de traslado especular se descodifica desde el índice Im en vez de calcularse desde la ecuación (2), y que la unidad de búsqueda de cuadrícula de frecuencia 30 en el codificador no se requiere, ya que la cuadrícula de frecuencia óptima se obtiene directamente desde el libro de códigos de cuadrícula de frecuencia 24 mirando la cuadrícula de frecuencia gopt que corresponde al índice recibido Ig.
Los pasos, funciones, procedimientos y/o bloques descritos aquí pueden implementarse en equipo físico informático utilizando cualquier tecnología convencional, tal como tecnología de circuito discreto o de circuito integrado, incluyendo tanto circuitos electrónicos de propósito general como circuitos específicos de aplicación.
Alternativamente, al menos algunos de los pasos, funciones, procedimientos y/o bloques descritos aquí pueden implementarse en equipo lógico informático para la ejecución por equipo de procesamiento adecuado. Este equipo puede incluir, por ejemplo, uno o varios microprocesadores, uno o varios procesadores de señal digital (DSP), uno o varios circuitos integrados de aplicación específica (ASIC), equipo físico informático acelerado de video o uno o varios dispositivos lógicos programables adecuados, tales como matrices de puertas programables de campo (FPGA). También son factibles combinaciones de tales elementos de procesamiento.
También debería entenderse que puede ser posible reutilizar las capacidades de procesamiento generales ya presentes en un UE. Esto se puede hacer, por ejemplo, reprogramando el equipo lógico informático existente o añadiendo nuevos componentes de equipo lógico informático.
La figura 11 es un diagrama de bloques de una realización del codificador 40 de acuerdo con la tecnología propuesta. Esta realización está basada en un procesador 110, por ejemplo un microprocesador, que ejecuta equipo lógico informático 120 para cuantificar la parte de baja frecuencia fL de la representación espectral paramétrica, y equipo lógico informático 130 para la búsqueda de una extrapolación óptima representada por la frecuencia de traslado especular fm y el vector de cuadrícula de frecuencia óptima gopt. El equipo lógico informático se almacena en la memoria 140. El procesador 110 se comunica con la memoria sobre un sistema de bus. La representación espectral paramétrica entrante f se recibe por un controlador de entrada/salida (I/O) 150 que controla un bus de I/O, al que el procesador 110 y la memoria 140 están conectados. El equipo lógico informático 120 puede implementar la funcionalidad del codificador de baja frecuencia 10. El equipo lógico informático 130 puede implementar la funcionalidad del codificador de alta frecuencia 12. Los parámetros cuantificados f-, fm, gopt (o preferiblemente los índices correspondientes IfL, Im, Ig) obtenidos del equipo lógico informático 120 y 130 se dejar salir desde la memoria 140 por el controlador I/O sobre el bus I/O.
La figura 12 es un diagrama de bloques de un ejemplo del descodificador 50 de acuerdo con la tecnología propuesta. Este ejemplo está basado en un procesador 210, por ejemplo un microprocesador, que ejecuta un equipo lógico informático 220 para descodificar la parte de baja frecuencia fL de la representación espectral paramétrica, y equipo lógico informático 230 para descodificar la parte de baja frecuencia fH de la representación espectral paramétrica por extrapolación. El equipo lógico informático se almacena en la memoria 240. El procesador 210 se comunica con la memoria sobre un bus de sistema. Los parámetros codificados entrantes P-, fm, gopt (representados por IfL, Im, Ig) se reciben por un controlador de entrada/salida (I/O) 250 que controla un bus I/O, al que están conectados el procesador 210 y la memoria 240. El equipo lógico informático 220 puede implementar la funcionalidad del descodificador de baja frecuencia 60. El equipo lógico informático 230 puede implementar la funcionalidad del descodificador de alta frecuencia 62. La representación paramétrica descodificada f (f- combinada con fH) obtenida desde el equipo lógico informático 220 y 230 se deja salir desde la memoria 240 por el controlador I/O 250 sobre el bus I/O.
La figura 13 ilustra una realización de un equipo de usuario UE que incluye un descodificador de acuerdo con la tecnología propuesta. Un micrófono 70 avanza una señal de audio a un convertidor A/D 72. La señal de audio digitalizada es codificada por un codificador de audio 74. Solo los componentes relevantes para ilustrar la tecnología propuesta se ilustran en el codificador de audio 74. El codificador de audio 74 incluye un estimador de coeficiente AR 76, un convertidor de representación espectral paramétrica a AR 78 y un codificador 40 de la representación espectral paramétrica. La representación espectral paramétrica codificada (junto con otros parámetros de audio codificados que no se necesitan para ilustrar la presente tecnología) se avanza a una unidad de radio 80 para codificación de canal y conversión de frecuencia de radio y transmisión a un descodificador sobre una antena.
La figura 14 ilustra un ejemplo de un equipo de usuario UE que incluye un descodificador de acuerdo con la tecnología propuesta. Una antena recibe una señal que incluye la representación espectral paramétrica codificada y la avanza a una unidad de radio 82 para conversión desde la frecuencia de radio y descodificación de canal. La señal digital resultante se avanza a un descodificador de audio 84. Solo los componentes relevantes para ilustrar la tecnología propuesta se ilustran en el descodificador de audio 84. El descodificador de audio 84 incluye un descodificador 50 de una representación espectral paramétrica y un convertidor de representación espectral paramétrica a AR 86. Los coeficientes AR se utilizan (junto con otros parámetros de audio descodificados que no se necesitan para ilustrar la presente tecnología) para descodificar la señal de audio, y las muestras de audio resultantes se avanzan a una unidad de conversión D/A y amplificación 88, que deja salir la señal de audio a un altavoz 90.
En una aplicación de ejemplo el esquema de extrapolación-cuantificación AR propuesto se utiliza en un contexto BWE. En este caso el análisis AR se realiza a una cierta banda de alta frecuencia, y solo se utilizan coeficientes AR para el filtro de síntesis. En vez de obtenerse con el filtro de análisis correspondiente, la señal de excitación para esta banda alta se extrapola desde una excitación de banda baja codificada independientemente.
En otra aplicación de ejemplo el esquema de extrapolación de cuantificación AR propuesto se utiliza en un esquema de codificación tipo ACELP. Los codificadores ACELP modelan un tracto vocal de un hablante con un modelo AR. Se genera una señal de excitación e(n) pasando una forma de onda s(n) a través de un filtro blanqueador e(n) = A(z)s(n), donde A(z) = 1 a1z-1 a2z-2 ... aMz-M, es el modelo AR de orden M. De una manera trama a trama un conjunto de coeficientes AR a = [a1 a2 ... aM]T, y señal de excitación se cuantifican, y se transmiten índices de cuantificación sobre la red. En el descodificador, se genera habla sintetizada de una manera trama a trama mandando la señal de excitación reconstruida a través del filtro de síntesis reconstruido A(z)-1.
En una aplicación más de ejemplo el esquema de extrapolación de cuantificación AR propuesto se utiliza como una manera eficiente para parametrizar una envolvente de espectro de un código de audio de transformada. De una manera a corto plazo la forma de onda se transforma a dominio frecuencia, y la respuesta de frecuencia de los coeficientes AR se utiliza para aproximar la envolvente de espectro y normalizar el vector transformado (para crear un vector residual). Después los coeficientes AR y el vector residual son codificados y transmitidos al descodificador. Se entenderá por los expertos en la técnica que pueden hacerse varias modificaciones y cambios a la tecnología propuesta sin salir del alcance de la misma, que está definido por las reivindicaciones adjuntas.
Abreviaturas
ACELP Predicción lineal excitada de código algebraico
ASIC Circuitos integrados de aplicación específica
AR Auto regresión
BWE Extensión de ancho de banda
DSP Procesador de señal digital
Campo FPGA Matriz de puerta programable
ISP Pares espectrales de inmitancia
LP Predicción lineal
LSF Frecuencias espectrales lineales
MSE Error cuadrático medio
SD Distorsión espectral
SQ Cuantificador escalar
UE Equipo de usuario
VQ Cuantificación vectorial
Referencias
[1] 3GPP TS 26.090, "Adaptive Multi-Rate (AMR) speech codec; Trans-coding functions", p.13, 2007
[2] N. Iwakami, et al., High-quality audio-coding at less than 64 kbit/s by using transform-domain weighted interleave vector quantization (TWINVQ), IEEE ICASSP, vol. 5, pp. 3095-3098, 1995
[3] J. Makhoul, "Linear prediction: A tutorial review", Proc. IEEE, vol. 63, p. 566, 1975
[4] P. Kabal and R.P. Ramachandran, "The computation of line spectral frequencies using Chebyshev polynomials", IEEE Trans. on ASSP, vol. 34, n° 6, pp. 1419-1426, 1986

Claims (9)

REIVINDICACIONES
1. Un codificador (40) para codificar una representación espectral paramétrica (f) de coeficientes autorregresivos (a) que representan parcialmente una señal de audio, incluyendo dicho codificador:
- medios (10) para codificar una parte de baja frecuencia (fL) de la representación espectral paramétrica (f) por cuantificación de coeficientes de la representación espectral paramétrica que corresponden a una parte de baja frecuencia de la señal de audio;
- medios (12) para codificar una parte de alta frecuencia (fH) de la representación espectral paramétrica (f) por promediado ponderado en base a los coeficientes cuantificados (f-) volteados alrededor una frecuencia de traslado especular cuantificada (fm), que separa la parte de baja frecuencia de la parte de alta frecuencia, y una cuadrícula de frecuencia (gopt) determinada a partir de un libro de códigos de cuadrícula de frecuencia (24) en un procedimiento de búsqueda de ciclo cerrado; y
- medios para dejar salir al menos un índice de cuantificación (If-) que representa los coeficientes cuantificados (f-), un índice de cuantificación (Im) que representa la frecuencia de traslado especular cuantificada (fm) y un índice de cuantificación (Ig) que representa la cuadrícula de frecuencia (gopt) para la transmisión a un descodificador.
2. El codificador de la reivindicación 1, en el que los medios (12) para codificar una parte de alta frecuencia (fH) de la representación espectral paramétrica (f) comprenden medios (18) para calcular la frecuencia de traslado especular cuantificada fm de acuerdo con:
donde:
Q denota cuantificación de la expresión en el paréntesis adyacente,
M denota el número total de coeficientes en la representación espectral paramétrica,
f(M/2) denota el primer coeficiente en la parte de alta frecuencia, y
f(M/2-1) denota el último coeficiente cuantificado en la parte de baja frecuencia.
3. El codificador de la reivindicación 2, en el que los medios (12) para codificar una parte de alta frecuencia (fH) de la representación espectral paramétrica (f) comprenden medios (20) para voltear los coeficientes cuantificados de la parte de baja frecuencia (f-) de la representación espectral paramétrica (f) alrededor de la frecuencia de traslado especular cuantificada fm de acuerdo con:
donde f(M/2-1-k) denota coeficiente cuantificado M/2-1-k.
4. El codificador de la reivindicación 3, en el que los medios (12) para codificar una parte de alta frecuencia (fH) de la representación espectral paramétrica (f) comprenden medios (22) para re-escalar los coeficientes fflip(k) de acuerdo con:
Figure imgf000010_0001
5. El codificador de la reivindicación 4, en el que los medios (12) para codificar una parte de alta frecuencia (fH) de la representación espectral paramétrica (f) comprenden medios (26) para re-escalar las cuadrículas de frecuencia gi del libro de códigos de cuadrícula de frecuencia (24) para caber en el intervalo entre el último coeficiente cuantificado f(M/2-1) en la parte de baja frecuencia y un máximo valor de punto de cuadrícula gmax de acuerdo con:
6. El codificador de la reivindicación 5, en el que los medios (12) para codificar una parte de alta frecuencia (fH) de la representación espectral paramétrica (f) comprenden medios (28) para realizar promediado ponderado de los coeficientes volteados y re-escalados fnip(k) y las cuadrículas de frecuencia re-escaladas gi(k) de acuerdo con:
donde A,(k) y [1-^(k)] son ponderaciones predefinidas.
7. El codificador de la reivindicación 6, en el que los medios (12) para codificar una parte de alta frecuencia (fH) de la representación espectral paramétrica (f) comprenden medios (30) para seleccionar una cuadrícula de frecuencia gopt, donde el índice opt satisface el criterio:
Figure imgf000011_0001
donde fH(k) es un vector objetivo formado por los coeficientes de la parte de alta frecuencia de la representación espectral paramétrica.
8. Un equipo de usuario que comprende un codificador (40) de acuerdo con una cualquiera de las reivindicaciones 1­ 7.
9. Un método de codificar una representación espectral paramétrica (f) de coeficientes autorregresivos (a) que parcialmente representan una señal de audio, comprendiendo dicho método:
- codificar una parte de baja frecuencia (fL) de la representación espectral paramétrica (f) por cuantificación de coeficientes de la representación espectral paramétrica que corresponden a una parte de baja frecuencia de la señal de audio;
- codificar una parte de alta frecuencia (fH) de la representación espectral paramétrica (f) por promediado ponderado en base a los coeficientes cuantificados (f-) volteados alrededor de una frecuencia de traslado especular cuantificada(fm), que separa la parte de baja frecuencia de la parte de alta frecuencia, y una cuadrícula de frecuencia (gopt) determinada a partir de un libro de códigos de cuadrícula de frecuencia (24) en un procedimiento de búsqueda de ciblo cerrado; y
- dejar salir al menos un índice de cuantificación (Ifl) que representa los coeficientes cuantificados (f-), un índice de cuantificación (lm) que representa la frecuencia de traslado especular cuantificada (fm) y un índice de cuantificación (lg) que representa la cuadrícula de frecuencia (gopt) para la transmisión a un descodificador.
ES17190535T 2011-11-02 2012-05-15 Codificación de audio en base a una representación eficiente de coeficientes autorregresivos Active ES2749967T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201161554647P 2011-11-02 2011-11-02

Publications (1)

Publication Number Publication Date
ES2749967T3 true ES2749967T3 (es) 2020-03-24

Family

ID=48192964

Family Applications (3)

Application Number Title Priority Date Filing Date
ES17190535T Active ES2749967T3 (es) 2011-11-02 2012-05-15 Codificación de audio en base a una representación eficiente de coeficientes autorregresivos
ES12846533.3T Active ES2592522T3 (es) 2011-11-02 2012-05-15 Codificación de audio basada en representación de coeficientes auto-regresivos
ES16156708.6T Active ES2657802T3 (es) 2011-11-02 2012-05-15 Decodificación de audio basada en una representación eficiente de coeficientes autoregresivos

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES12846533.3T Active ES2592522T3 (es) 2011-11-02 2012-05-15 Codificación de audio basada en representación de coeficientes auto-regresivos
ES16156708.6T Active ES2657802T3 (es) 2011-11-02 2012-05-15 Decodificación de audio basada en una representación eficiente de coeficientes autoregresivos

Country Status (10)

Country Link
US (5) US9269364B2 (es)
EP (3) EP3279895B1 (es)
CN (1) CN103918028B (es)
AU (1) AU2012331680B2 (es)
BR (1) BR112014008376B1 (es)
DK (1) DK3040988T3 (es)
ES (3) ES2749967T3 (es)
NO (1) NO2737459T3 (es)
PL (2) PL3040988T3 (es)
WO (1) WO2013066236A2 (es)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3279895B1 (en) * 2011-11-02 2019-07-10 Telefonaktiebolaget LM Ericsson (publ) Audio encoding based on an efficient representation of auto-regressive coefficients
JP6248186B2 (ja) 2013-05-24 2017-12-13 ドルビー・インターナショナル・アーベー オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
CN104517611B (zh) * 2013-09-26 2016-05-25 华为技术有限公司 一种高频激励信号预测方法及装置
CN108172239B (zh) * 2013-09-26 2021-01-12 华为技术有限公司 频带扩展的方法及装置
US9959876B2 (en) * 2014-05-16 2018-05-01 Qualcomm Incorporated Closed loop quantization of higher order ambisonic coefficients
CN113556135B (zh) * 2021-07-27 2023-08-01 东南大学 基于冻结翻转列表的极化码置信传播比特翻转译码方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1216504A1 (en) * 2000-05-17 2002-06-26 Koninklijke Philips Electronics N.V. Spectrum modeling
US7346499B2 (en) * 2000-11-09 2008-03-18 Koninklijke Philips Electronics N.V. Wideband extension of telephone speech for higher perceptual quality
KR20070009644A (ko) 2004-04-27 2007-01-18 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치, 스케일러블 복호화 장치 및 그방법
WO2006018748A1 (en) * 2004-08-17 2006-02-23 Koninklijke Philips Electronics N.V. Scalable audio coding
ATE406652T1 (de) * 2004-09-06 2008-09-15 Matsushita Electric Ind Co Ltd Skalierbare codierungseinrichtung und skalierbares codierungsverfahren
WO2006062202A1 (ja) 2004-12-10 2006-06-15 Matsushita Electric Industrial Co., Ltd. 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法
KR101565919B1 (ko) * 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
CA3231911A1 (en) * 2009-01-16 2010-07-22 Dolby International Ab Cross product enhanced harmonic transposition
EP3279895B1 (en) * 2011-11-02 2019-07-10 Telefonaktiebolaget LM Ericsson (publ) Audio encoding based on an efficient representation of auto-regressive coefficients

Also Published As

Publication number Publication date
EP3040988B1 (en) 2017-10-25
CN103918028A (zh) 2014-07-09
EP2774146A4 (en) 2015-05-13
AU2012331680B2 (en) 2016-03-03
BR112014008376B1 (pt) 2021-01-05
ES2592522T3 (es) 2016-11-30
PL3040988T3 (pl) 2018-03-30
BR112014008376A2 (pt) 2017-04-18
US20230178087A1 (en) 2023-06-08
EP2774146B1 (en) 2016-07-06
EP3040988A1 (en) 2016-07-06
PL3279895T3 (pl) 2020-03-31
US20160155450A1 (en) 2016-06-02
CN103918028B (zh) 2016-09-14
ES2657802T3 (es) 2018-03-06
EP3279895A1 (en) 2018-02-07
EP3279895B1 (en) 2019-07-10
US20140249828A1 (en) 2014-09-04
US9269364B2 (en) 2016-02-23
EP2774146A2 (en) 2014-09-10
DK3040988T3 (en) 2018-01-08
WO2013066236A3 (en) 2013-07-11
US11594236B2 (en) 2023-02-28
AU2012331680A1 (en) 2014-05-22
US20210201924A1 (en) 2021-07-01
US11011181B2 (en) 2021-05-18
NO2737459T3 (es) 2018-09-08
US20200243098A1 (en) 2020-07-30
WO2013066236A2 (en) 2013-05-10

Similar Documents

Publication Publication Date Title
ES2749967T3 (es) Codificación de audio en base a una representación eficiente de coeficientes autorregresivos
US10249313B2 (en) Adaptive bandwidth extension and apparatus for the same
TWI324335B (en) Methods of signal processing and apparatus for wideband speech coding
ES2433043T3 (es) Conmutación del modo de codificación ACELP a TCX
JP6272619B2 (ja) オーディオ信号の符号化用エンコーダ、オーディオ伝送システムおよび補正値の判定方法
ES2358125T3 (es) Procedimiento y aparato para un filtrado de antidispersión de una señal ensanchada de excitación de predicción de velocidad de ancho de banda.
ES2947874T3 (es) Determinación de una función de ponderación de baja complejidad para la cuantificación de coeficientes de codificación lineal predictiva (LPC)
BRPI0520729B1 (pt) Método para a codificação e decodificação de sinais de áudio, codificador para codificação e decodificador para decodificar sinais de áudio e sistema para compressão de áudio digital.
ES2404408T3 (es) Dispositivo de codificación y método de codificación
WO2007132750A1 (ja) Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法
BR112016004544B1 (pt) Método para processamento de um sinal de fala compreendendo uma pluralidade de quadros e aparelho de processamento de fala
ES2952973T3 (es) Dispositivo de determinación de la función de ponderación y procedimiento para cuantificar el coeficiente de codificación de predicción lineal
WO2009125588A1 (ja) 符号化装置および符号化方法
WO2012053149A1 (ja) 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法