ES2559040T3 - Relleno de subvectores no codificados en señales de audio codificadas por transformada - Google Patents

Relleno de subvectores no codificados en señales de audio codificadas por transformada Download PDF

Info

Publication number
ES2559040T3
ES2559040T3 ES11860593.0T ES11860593T ES2559040T3 ES 2559040 T3 ES2559040 T3 ES 2559040T3 ES 11860593 T ES11860593 T ES 11860593T ES 2559040 T3 ES2559040 T3 ES 2559040T3
Authority
ES
Spain
Prior art keywords
subvectors
residual
virtual
coefficients
residual subvectors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11860593.0T
Other languages
English (en)
Inventor
Volodya Grancharov
Sebastian NÄSLUND
Sigurdur Sverrisson
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Application granted granted Critical
Publication of ES2559040T3 publication Critical patent/ES2559040T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation

Abstract

Un método de rellenado de subvectores residuales no codificados de una señal de audio codificada por transformada, incluyendo dicho método las etapas de: comprimir (S1) subvectores residuales actualmente codificados; rechazar (S2) subvectores residuales comprimidos que no cumplan un criterio de dispersión predeterminado; concatenar (S3) los subvectores residuales comprimidos restantes para formar un primer libro de códigos virtual (VC1); combinar (S4) pares de coeficientes del primer libro de códigos virtual (VC1) para formar un segundo libro de códigos virtual (VC2); rellenar (S5) subvectores residuales no codificados por debajo de una frecuencia predeterminada con coeficientes procedentes del primer libro de códigos virtual (VC1); rellenar (S6) subvectores residuales no codificados por encima de la frecuencia predeterminada con coeficientes procedentes del segundo libro de códigos virtual; caracterizado porque se comprimen (S1) componentes (k) de subvectores residuales actualmente codificados conforme a: donde Y(k) son las componentes de los subvectores residuales comprimidos.

Description

5
10
15
20
25
30
35
40
45
DESCRIPCION
Relleno de subvectores no codificados en senales de audio codificadas por transformada Campo tecnico
La presente tecnolog^a se refiere a la codificacion de senales de audio, y especialmente al relleno de subvectores no codificados en senales de audio codificadas por transformada.
Antecedentes
Un sistema tfpico de codificador/descodificador basado en codificacion por transformada, ha sido ilustrado en la Figura 1.
Las etapas principales de la codificacion por transformada son:
A. Transformar una trama de audio corta (20-40 ms) a un dominio de frecuencia, por ejemplo mediante la Transformada Coseno Discreta Modificada (MDCT);
B. Dividir el vector X(k) de la MDCT en multiples bandas (subvectores SV1, SV2, ...), segun se ha ilustrado en la Figura 2. Tfpicamente, el ancho de las bandas se incrementa hacia frecuencias mas altas [1];
C. Calcular la energfa en cada banda. Esto proporciona una aproximacion de la envolvente espectral, segun se ha ilustrado en la Figura 3;
D. La envolvente espectral se cuantifica, y los indices de cuantificacion se transmiten al descodificador;
E. Se obtiene un vector residual escalando el vector de MDCT con las ganancias de envolvente, por ejemplo el vector residual se forma mediante los subvectores (SV1, SV2, ...) de MDCT escalados a unidad de energfa de Valor Cuadratico Medio (RMS);
F. Se asignan bits para la cuantificacion de diferentes subvectores residuales en base a energfas de envolvente. Debido a un presupuesto limitado de bits, no se asigna ningun bit a algunos de los subvectores. Esto ha sido ilustrado en la Figura 4, donde los subvectores correspondientes a ganancias de envolvente por debajo de un umbral TH no han sido asignados con ningun bit.
G. Los subvectores residuales se cuantifican segun los bits asignados, y los indices de cuantificacion se transmiten al descodificador. La cuantificacion residual puede ser llevada a cabo, por ejemplo, con el esquema de Codificacion Factorial de Pulso (FPC) [2].
H. Los subvectores residuales con cero bits asignados no son codificados, pero en cambio se rellenan de ruido en el descodificador. Esto se consigue creando un Libro de Codigos Virtual (VC) a partir de subvectores codificados, concatenando los coeficientes perceptualmente relevantes del espectro descodificado. El VC crea contenidos en los subvectores residuales no codificados.
I. En el descodificador, el vector de MDCT se reconstruye mediante el escalonamiento ascendente de los subvectores residuales con ganancias de envolvente correspondientes, y la MDCT inversa se usa para reconstruir la trama de audio en el dominio del tiempo.
Un inconveniente del esquema de relleno de ruido convencional, por ejemplo segun [1], consiste en que la etapa H crea distorsion audible en la senal de audio reconstruida, cuando se utiliza con el esquema de la FPC.
El documento US 2010/0241437 A1 divulga un metodo para la descodificacion espectral perceptual, donde un conjunto inicial de coeficientes espectrales es el relleno del espectro. El relleno del espectro comprende el relleno de ruido de huecos espectrales estableciendo coeficientes espectrales en el conjunto inicial de coeficientes espectrales que no han sido descodificados a partir de un flujo binario igual a los elementos derivados de los coeficientes espectrales descodificados. El conjunto de coeficientes espectrales reconstruido de un dominio de frecuencia formado por el relleno espectral se convierte en una senal de audio de un dominio de tiempo.
Sumario
Un objeto general es un relleno mejorado de subvectores residuales no codificados de una senal de audio codificada por transformada.
Otro objeto es la generacion de libros de codigo virtuales usados para rellenar los subvectores residuales no codificados.
Estos objetos se han alcanzado conforme a las reivindicaciones anexas.
Un primer aspecto de la presente tecnologfa incluye un metodo de relleno de subvectores residuales no codificados
5
10
15
20
25
30
35
40
45
de una senal de audio codificada por transformada. El metodo incluye las etapas de:
• Comprimir subvectores residuales actualmente codificados;
• Rechazar subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado;
• Concatenar los subvectores residuales comprimidos restantes para formar un primer libro de codigos virtual;
• Combinar pares de coeficientes del primer libro de codigos virtual para formar un segundo libro de codigos virtual;
• Rellenar subvectores residuales no codificados por debajo de una frecuencia predeterminada con coeficientes procedentes del primer libro de codigos virtual;
• Rellenar subvectores residuales no codificados por encima de la frecuencia predeterminada con coeficientes procedentes del segundo libro de codigos virtual.
Un segundo aspecto de la presente tecnologfa incluye un metodo de generacion de un libro de codigos virtual para rellenar subvectores residuales no codificados de una senal de audio codificada por transformada por debajo de una frecuencia predeterminada. El metodo incluye las etapas de:
• Comprimir subvectores residuales actualmente codificados;
• Rechazar subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado;
• Concatenar los subvectores residuales comprimidos restantes para formar un libro de codigos virtual.
Un tercer aspecto de la presente tecnologfa incluye un metodo de generacion de un libro de codigos virtual para rellenar subvectores residuales no codificados de una senal de audio codificada por transformada por encima de una frecuencia predeterminada. El metodo incluye las etapas de:
• Generar un primer libro de codigos virtual conforme al segundo aspecto;
• Combinar pares de coeficientes del primer libro de codigos virtual.
Un cuarto aspecto de la presente tecnologfa incluye un rellanado de espectro para rellenar subvectores residuales no codificados de una senal de audio codificada por transformada. El rellenador de espectro incluye:
• Un compresor de subvector configurado para comprimir subvectores residuales actualmente codificados;
• Un rechazador de subvector configurado para rechazar subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado;
• Un colector de subvector configurado para concatenar los subvectores residuales comprimidos restantes para formar un primer libro de codigos virtual;
• Un combinador de coeficientes configurado para combinar pares de coeficientes del primer libro de codigos virtual para formar un segundo libro de codigos virtual;
• Un rellenador de subvector configurado para rellenar subvectores residuales no codificados por debajo de una frecuencia predeterminada con coeficientes procedentes del primer libro de codigos virtual, y para rellenar subvectores residuales no codificados por encima de la frecuencia predeterminada con coeficientes procedentes del segundo libro de codigos virtual.
Un quinto aspecto de la presente tecnologfa incluye un descodificador que incluye un rellenador de espectro conforme al cuarto aspecto.
Un sexto aspecto de la presente tecnologfa incluye un equipo de usuario que incluye un descodificador conforme al quinto aspecto.
Un septimo aspecto de la presente tecnologfa incluye un generador de libro de codigos virtual de baja frecuencia para generar un libro de codigos virtual de baja frecuencia para rellenar subvectores residuales no codificados de una senal de audio codificada por transformada por debajo de una frecuencia predeterminada. El generador de libro de codigos virtual de baja frecuencia incluye:
• Un compresor de subvector configurado para comprimir subvectores residuales actualmente codificados;
• Un rechazador de subvector configurado para rechazar subvectores residuales comprimidos que no cumplan con un criterio de dispersion predeterminado;
5
10
15
20
25
30
35
40
• Un colector de subvector configurado para concatenar los subvectores residuales comprimidos restantes para formar el libro de codigos virtual de baja frecuencia.
Un octavo aspecto de la presente tecnologfa incluye un generador de libro de codigos virtual de alta frecuencia para generar un libro de codigos virtual de alta frecuencia para relleno de subvectores residuales no codificados de una senal de audio codificada por transformada por encima de una frecuencia predeterminada. El generador de libro de codigos virtual de baja frecuencia incluye:
• Un generador de libro de codigos virtual de baja frecuencia conforme con el septimo aspecto, configurado para generar un libro de codigos virtual de baja frecuencia;
• Un combinador de coeficientes configurado para combinar pares de coeficientes del libro de codigos virtual de baja frecuencia para formar el libro de codigos virtual de alta frecuencia.
Una ventaja de la presente tecnologfa de relleno espectral consiste en un perfeccionamiento perceptivo de senales de audio descodificadas en comparacion con el relleno de ruido convencional.
Breve descripcion de los dibujos
La presente tecnologfa, junto con otros objetos y ventajas de la misma, podra ser mejor comprendida haciendo referencia a la descripcion que sigue tomada junto con los dibujos que se acompanan, en los que:
La Figura 1 es un diagrama de bloques que ilustra un sistema tfpico de codificacion/descodificacion de audio basado en transformada;
La Figura 2 es un diagrama que ilustra la estructura de un vector de MDCT;
La Figura 3 es un diagrama que ilustra la distribucion de energfa en los subvectores de un vector de MDCT;
La Figura 4 es un diagrama que ilustra el uso de la envolvente espectral para asignacion de bits;
La Figura 5 es un diagrama que ilustra un residual codificado;
La Figura 6 es un diagrama que ilustra compresion de un residual codificado;
La Figura 7 es un diagrama que ilustra el rechazo de subvectores residuales codificados;
La Figura 8 es un diagrama que ilustra la concatenacion de subvectores residuales sobrevivientes para formar un primer libro de codigos virtual;
Las Figuras 9A-B son diagramas que ilustran la combinacion de coeficientes a partir del primer libro de codigos virtual para formar un segundo libro de codigos virtual;
La Figura 10 es un diagrama de bloques que ilustra un ejemplo de realizacion de un generador de libro de codigos virtual de baja frecuencia;
La Figura 11 es un diagrama de bloques que ilustra un ejemplo de realizacion de un generador de libro de codigos virtual de alta frecuencia;
La Figura 12 es un diagrama de bloques que ilustra un ejemplo de realizacion de un rellenador de espectro;
La Figura 13 es un diagrama de bloques que ilustra un ejemplo de realizacion de un descodificador que incluye un rellenador de espectro;
La Figura 14 es un diagrama de flujo que ilustra la generacion de libro de codigos virtual de baja frecuencia;
La Figura 15 es un diagrama de flujo que ilustra la generacion de libro de codigos virtual de alta frecuencia;
La Figura 16 es un diagrama de flujo que ilustra el relleno de espectro;
La Figura 17 es un diagrama de bloques que ilustra un ejemplo de realizacion de un generador de libro de codigos virtual de baja frecuencia;
La Figura 18 es un diagrama de bloques que ilustra un ejemplo de realizacion de un generador de libro de codigos virtual de alta frecuencia;
La Figura 19 es un diagrama de bloques que ilustra un ejemplo de realizacion de un rellenador de espectro, y
La Figura 20 es un diagrama de bloques que ilustra un ejemplo de realizacion de un equipo de usuario.
5
10
15
20
25
30
35
40
45
Descripcion detallada
Con anterioridad a describir con mayor detalle la presente tecnolog^a, se va a describir brevemente la codificacion/descodificacion basada en transformada, con referencia a las Figuras 1-7.
La Figura 1 es un diagrama de bloques que ilustra un sistema tipico de codificacion/descodificacion de audio basado en transformada. Una senal de entrada x(n) se envfa a un transformador de frecuencia, por ejemplo un transformador 10 de MDCT, donde tramas de audio cortas (20-40 ms) son transformadas en un dominio de frecuencia. La senal X(k) de dominio de frecuencia resultante se divide en multiples bandas (subvectores SV1, SV2, ...), segun se ha ilustrado en la Figura 2. Tfpicamente, el ancho de las bandas se incrementa hacia frecuencias mas altas [1]. La energfa de cada banda se determina en un calculador y cuantificador de envolvente 12. Esto da una aproximacion de la envolvente espectral, segun se ha ilustrado en la Figura 3. Cada subvector se normaliza segun un subvector residual en un normalizador de subvector 14 escalando la inversa del valor de envolvente (ganancia) cuantificado correspondiente.
Un asignador de bits 16 asigna bits para la cuantificacion de diferentes subvectores residuales en base a energfas de envolvente. Debido a un presupuesto limitado de bits, no se asignan bits a algunos de los subvectores. Esto ha sido ilustrado en la Figura 4, donde los subvectores correspondientes a ganancias de envolvente por debajo de un umbral TH no han sido asignados con ningun bit. Los subvectores residuales son cuantificados en un cuantificador de subvector 18 conforme a los bits asignados. La cuantificacion residual puede ser llevada a cabo, por ejemplo, con un esquema de Codificacion de Pulso Factorial (FPC) [2]. Los indices de cuantificacion de subvector residual y los indices de cuantificacion de envolvente son transmitidos a continuacion al descodificador a traves de un multiplexor (MUX) 20.
En el descodificador, se desmultiplexa la corriente de bits recibida en indices de cuantificacion de subvector residual e indices de cuantificacion de envolvente en un desmultiplexor (DEMUX) 22. Los indices de cuantificacion de subvector residual son descuantificados en subvectores residuales en un descuantificador de subvector 24, y los indices de cuantificacion de envolvente son descuantificados en ganancias de envolvente en un descuantificador de envolvente 26. Un asignador de bits 28 usa las ganancias de envolvente para controlar la descuantificacion de subvector residual.
Los subvectores residuales con cero bits asignados, no son codificados en el codificador, y en cambio son rellenados con ruido mediante un rellenador de ruido 30 en el descodificador. Esto se consigue creando un Libro de Codigos Virtual (VC) a partir de los subvectores codificados, concatenando los coeficientes perceptiblemente relevantes del espectro descodificado ([1] seccion 8.4.1). De ese modo, el VC crea contenidos en los subvectores residuales no codificados.
A
En el descodificador, el vector X(n) de MDCT es reconstruido a continuacion mediante escalado ascendente de subvectores residuales con ganancias de envolvente correspondientes en un conformador de envolvente 32, y
A
transformando el vector X(k) de dominio de frecuencia resultante en un transformador de MDCT inverso 34.
Un inconveniente del esquema convencional de relleno de ruido descrito con anterioridad consiste en que crea distorsion audible en la senal de audio reconstruida, cuando se usa con el esquema de FPC. La razon principal es que algunos de los vectores codificados pueden ser demasiado dispersos, lo que crea problemas de desajuste energetico en las bandas rellenadas con ruido. Adicionalmente, algunos de los vectores codificados pueden contener demasiada estructura (color), lo que conduce a degradaciones perceptivas cuando el relleno de ruido se realiza a frecuencias elevadas.
La descripcion que sigue va a ser enfocada a una realizacion de un procedimiento mejorado para la generacion de libro de codigos virtual en la etapa H anterior.
A
Un residual codificado X(k), ilustrado en la Figura 5, se comprime o cuantifica conforme a:
1 si X(k)> 0
o Si x(fc) = o (1)
-l si x(k)< o
imagen1
segun se ha ilustrado en la Figura 6. Esta etapa garantiza que no exista una estructura excesiva (tal como periodicidad a altas frecuencias) en las regiones rellenas de ruido. Adicionalmente, la forma espedfica de residual comprimido Y(k) permite una baja complejidad en las etapas subsiguientes.
A
Como alternativa, el residual codificado X(k) puede ser comprimido o cuantificado conforme a:
5
10
15
20
25
30
r(fc) =
' 1
SI
0
si
-1
si
X(k)>T -T<X(k)<;T X (k) < -T
(2)
donde T es un numero pequeno positivo. El valor de T puede ser usado para controlar la cantidad de compresion. Esta realizacion es tambien util para senales que hayan sido codificadas por medio de un codificador que cuantifique simetricamente en torno a 0 pero no incluye el valor 0 real.
El libro de codigos virtual se construye solamente a partir de subvectores M-dimensionales “poblados”. Si un subvector residual codificado no cumple el criterio:
Sk«|i2 (3)
fc-i
se considera disperso, y se rechaza. Por ejemplo, si el subvector tiene dimension 8 (M=8), la ecuacion (3) garantiza que un subvector particular sera rechazado desde el libro de codigos virtual si tiene mas de 6 ceros. Esto ha sido ilustrado en la Figura 7, donde el subvector SV3 es rechazado, debido a que tiene 7 ceros. Un libro de codigos virtual VC1 se forma concatenando los subvectores restantes o sobrevivientes, segun se ha ilustrado en la Figura 8. Puesto que la longitud de los subvectores es un multiplo de M, el criterio (3) puede ser usado tambien para subvectores mas largos. En este caso, las partes que no cumplan el criterio son rechazadas.
En general, un subvector comprimido se considera “poblado” si contiene mas de un 20-30% de componentes distintos de cero. En el ejemplo anterior con M=8, el criterio es “mas de un 25% de componentes distintos de cero”.
Un segundo libro de codigos virtual VC2 se crea a partir del libro de codigos virtual VC1 obtenido. Este segundo libro de codigos virtual VC2 esta incluso mas “poblado” y se usa para frecuencias de relleno superiores a 4,8 kHz (tambien son por supuesto posibles otras frecuencias de transicion; tipicamente, la frecuencia de transicion esta entre 4 y 6 kHz). El segundo libro de codigos virtual VC2 se forma conforme a:
Z(k) = Y(k)®Y(N-k), k = O...N-l (4)
donde N es el tamano (numero total de coeficientes Y(k)) del primer libro de codigos virtual VC1, y la operacion combinadora © se define como:
imagen2
Esta etapa de combinacion o fusion, ha sido ilustrada en las Figuras 9A-B. Se debe apreciar que el mismo par de coeficientes Y(k), Y(N-k) se utiliza dos veces en el proceso de fusion, una vez en la mitad inferior (Figura 9A) y una vez en la mitad superior (Figura 9B).
Los subvectores no codificados pueden ser rellenados pasando dclicamente a traves del libro de codigos virtual respectivo, VC1 o VC2 dependiendo de si el subvector que va a ser rellenado esta por debajo o por encima de la frecuencia de transicion, y copiando el numero requerido de coeficientes del libro de codigos en el subvector vacfo. De ese modo, si los libros de codigos son cortos y existen muchos subvectores para ser rellenados, se reutilizaran los mismos coeficientes para rellenar mas de un subvector.
Un ajuste de energfa de los subvectores rellenados se lleva a cabo preferentemente sobre la base de un subvector. Esto explica el hecho de que tras el rellenado del espectro, los subvectores residuales pueden no tener la energfa de RMS unitaria esperada. El ajuste se puede llevar a cabo conforme a:
5
10
15
20
25
30
35
40
45
50
55
imagen3
donde a<1, por ejemplo, a=0,8 es un factor de atenuacion optimizado perceptualmente. Un motivo para la atenuacion perceptual es que la operacion de rellenado de ruido da con frecuencia como resultado estadfsticas significativamente diferentes del vector residual y es deseable atenuar tales regiones “imprecisas”.
En un esquema mas avanzado, el ajuste de energfa de un subvector particular puede estar adaptado al tipo de subvectores vecinos: si las regiones vecinas estan codificadas a una tasa de bits alta, la atenuacion del subvector actual es mas agresiva (alfa tiende hacia cero). Si las regiones vecinas estan codificadas a una tasa de bits baja o rellenas con ruido, la atenuacion del subvector actual esta limitada (alfa tiende hacia uno). Este esquema impide la atenuacion de grandes regiones espectrales continuas, que podnan conducir a perdida de sonoridad acustica. Al mismo tiempo, si la region espectral que debe ser atenuada es estrecha, una atenuacion incluso muy intensa no afectara a la sonoridad global.
La tecnologfa descrita proporciona un relleno de ruido mejorado. Las mejoras perceptivas han sido medidas por medio de pruebas de escucha. Estas pruebas indican que el procedimiento de relleno de espectro descrito con anterioridad fue el preferido por un 83% de oyentes de las pruebas, mientras que el procedimiento de relleno de ruido convencional fue el preferido en un 17% de las pruebas.
La Figura 10 es un diagrama de bloques que ilustra un ejemplo de generador de libro de codigos virtual 60 de baja frecuencia. Los subvectores residuales son enviados a un compresor de subvector 42, el cual esta configurado para comprimir subvectores residuales actualmente codificados (es decir, subvectores a los que se haya asignado realmente bits para codificacion), por ejemplo conforme a la ecuacion (1). Los subvectores comprimidos son reenviados a un rechazador de subvector 44, el cual esta configurado para rechazar los subvectores residuales comprimidos que no cumplan con un criterio de dispersion predeterminado, por ejemplo el criterio (3). Los subvectores comprimidos restantes son recopilados en un colector de subvector 46, el cual esta configurado para concatenarlos para formar el libro de codigos virtual VC1 de baja frecuencia.
La Figura 11 es un diagrama de bloques que ilustra un ejemplo de generador de libro de codigos virtual 70 de alta frecuencia. Los subvectores residuales son reenviados a un compresor de subvector 42, el cual esta configurado para comprimir subvectores residuales actualmente codificados (es decir, subvectores que han sido actualmente asignados con bits para codificacion), por ejemplo segun la ecuacion (1). Los subvectores comprimidos son reenviados a un rechazador de subvector 44, el cual esta configurado para rechazar subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado, como por ejemplo el criterio (3). Los restantes subvectores comprimidos son recopilados en un colector de subvector 46, el cual esta configurado para concatenarlos para formar el libro de codigos virtual VC1 de baja frecuencia. De ese modo, hasta ese punto, el generador de libro de codigos virtual 70 de alta frecuencia incluye los mismos elementos que el generador de libro de codigos virtual 60 de baja frecuencia. Los coeficientes del libro de codigos virtual VC1 de baja frecuencia son reenviados a un combinador de coeficientes 48, el cual esta configurado para combinar pares de coeficientes para formar el libro de codigos virtual VC2 de alta frecuencia, por ejemplo conforme a la ecuacion (5).
La Figura 12 es un diagrama de bloques que ilustra una realizacion de un rellenador de espectro 40. Los subvectores residuales son reenviados a un compresor de subvector 42, el cual esta configurado para comprimir subvectores residuales actualmente codificados (es decir, subvectores que han sido asignados realmente con bits para codificacion), por ejemplo conforme a la ecuacion (1). Los subvectores comprimidos son reenviados a un rechazador de subvector 44, el cual esta configurado para rechazar subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado, por ejemplo el criterio (3). Los subvectores comprimidos restantes son recopilados en un colector de subvector 46, el cual esta configurado para concatenarlos para que formen un primer libro de codigos virtual VC1 (baja frecuencia). Los coeficientes procedentes del primer libro de codigos virtual VC1 son reenviados a un combinador de coeficientes 48, el cual esta configurado para combinar pares de coeficientes para formar un segundo libro de codigos virtual VC2 (alta frecuencia), por ejemplo conforme a la ecuacion (5). De ese modo, hasta ese punto, el rellenador de espectro 40 incluye los mismos elementos que el generador de libro de codigos virtual 70 de alta frecuencia. Los subvectores residuales son reenviados tambien a un rellenador de subvector 50, el cual esta configurado para rellenar subvectores residuales no codificados por debajo de una frecuencia predeterminada con coeficientes procedentes del primer libro de codigos virtual VC1, y para rellenar subvectores residuales no codificados por encima de la frecuencia predeterminada con coeficientes procedentes del segundo libro de codigos virtual. En una realizacion preferida, el rellenador de espectro 40 incluye tambien un ajustador de energfa 52 configurado para ajustar la energfa de los subvectores residuales no codificados rellenados, para obtener una atenuacion perceptiva, segun se ha descrito con anterioridad.
La Figura 13 es un diagrama de bloques que ilustra una realizacion de un descodificador 300 que incluye un rellenador de espectro 40. La estructura general del descodificador 300 es la misma que la del descodificador de la
5
10
15
20
25
30
35
40
45
50
55
60
Figura 1, pero con el rellenador de ruido 30 reemplazado por el rellenador de espectro 40.
La Figura 14 es un diagrama de flujo que ilustra la generacion de libro de codigos virtual de baja frecuencia. La etapa S1 comprime subvectores residuales actualmente codificados, por ejemplo conforme a la ecuacion (1). La etapa S2 rechaza subvectores residuales comprimidos que sean demasiado dispersos, es decir subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado, por ejemplo el criterio (3). La etapa S3 concatena los subvectores residuales comprimidos restantes para formar el libro de codigos virtual VC1.
La Figura 15 es un diagrama de flujo que ilustra la generacion de libro de codigos virtual de alta frecuencia. La etapa S1 comprime subvectores residuales actualmente codificados, por ejemplo conforme a la ecuacion (1). La etapa S2 rechaza subvectores residuales comprimidos que sean demasiado dispersos, es decir subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado, tal como el criterio (3). La etapa S3 concatena los subvectores residuales comprimidos restantes para formar un primer libro de codigos virtual VC1. De ese modo, hasta ese punto, la generacion de libro de codigos virtual de alta frecuencia incluye las mismas etapas que la generacion de libro de codigos virtual de baja frecuencia. La etapa S4 combina pares de coeficientes del primer libro de codigos virtual VC1, por ejemplo conforme a la ecuacion (5), formando con ello el libro de codigos virtual VC2 de alta frecuencia.
La Figura 16 es un diagrama de flujo que ilustra el rellenado de espectro. La etapa S1 comprime subvectores residuales actualmente codificados, por ejemplo conforme a la ecuacion (1). La etapa S2 rechaza subvectores residuales comprimidos que sean demasiado dispersos, es decir, subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado, tal como el criterio (3). La etapa S3 concatena los subvectores residuales comprimidos restantes para formar un primer libro de codigos virtual VC1. La etapa S4 combina pares de coeficientes del primer libro de codigos virtual VC1, por ejemplo conforme a la ecuacion (5), para formar un segundo libro de codigos virtual VC2. De ese modo, hasta ese punto, el relleno de espectro incluye las mismas etapas que la generacion de libro de codigos virtual de alta frecuencia. La etapa S5 rellena subvectores residuales no codificados por debajo de una frecuencia predeterminada con coeficientes procedentes del primer libro de codigos virtual VC1. La etapa S6 rellena subvectores residuales no codificados por encima de una frecuencia predeterminada con coeficientes procedentes del segundo libro de codigos virtual VC2. La etapa S7 opcional ajusta la energfa de subvectores residuales no codificados rellenados para obtener una atenuacion perceptiva, segun se ha descrito con anterioridad. La Figura 17 es un diagrama de bloques que ilustra un ejemplo de un generador de libro de codigos virtual 60 de baja frecuencia. Este ejemplo se basa en un procesador 110, por ejemplo un microprocesador, que ejecuta una componente de software 120 para comprimir subvectores residuales actualmente codificados, una componente de software 130 para rechazar subvectores residuales comprimidos que sean demasiado dispersos, y una componente de software 140 para concatenar los restantes subvectores residuales comprimidos para formar el libro de codigos virtual VC1. Estas componentes de software estan almacenadas en la memoria 150. El procesador 110 comunica con la memoria a traves de un bus de sistema. Los subvectores residuales son recibidos por el controlador 160 de entrada/salida (E/S) que controla un bus de E/S, al que estan conectados el procesador 110 y la memoria 150. En este ejemplo, los subvectores residuales recibidos por el controlador de E/S 160 son almacenados en la memoria 150, donde estos son procesados por medio de las componentes de software. La componente de software 120 puede implementar la funcionalidad del bloque 42 en el ejemplo descrito con referencia a la Figura 10 anterior. La componente de software 130 puede implementar la funcionalidad del bloque 44 en el ejemplo descrito con referencia a la Figura 10 anterior. La componente de software 140 puede implementar la funcionalidad del bloque 46 en el ejemplo descrito con referencia a la Figura 10 anterior. El libro de codigos virtual VC1 obtenido a partir de la componente de software 140 es presentado a la salida desde la memoria 150 por el controlador de E/S 160 a traves del bus de E/S o se almacena en la memoria 150.
La Figura 18 es un diagrama de bloques que ilustra un ejemplo de generador de libro de codigos virtual 70 de alta frecuencia. Este ejemplo se basa en un procesador 110, por ejemplo un microprocesador, que ejecuta una componente de software 120 para comprimir subvectores residuales actualmente codificados, una componente de software 130 para rechazar subvectores residuales comprimidos que sean demasiado dispersos, una componente de software 140 para concatenar los restantes subvectores residuales comprimidos para formar el libro de codigos virtual VC1 de baja frecuencia, y una componente de software 170 para combinar pares de coeficientes a partir del libro de codigos VC1 para formar el libro de codigos virtual VC2 de alta frecuencia. Estas componentes de software se almacenan en la memoria 150. El procesador 110 comunica con la memoria a traves de un bus de sistema. Los subvectores residuales son recibidos por un controlador 160 de entrada/salida (E/S) que controla un bus de E/S, al que estan conectados el procesador 110 y la memoria 150. En este ejemplo, los subvectores residuales recibidos por el controlador de E/S 160 son almacenados en la memoria 150, donde son procesados por las componentes de software. La componente de software 120 puede implementar la funcionalidad del bloque 42 en el ejemplo descrito con referencia a la Figura 11 anterior. La componente de software 130 puede implementar la funcionalidad del bloque 44 en el ejemplo descrito con referencia a la Figura 11 anterior. La componente de software 140 puede implementar la funcionalidad del bloque 46 en el ejemplo descrito con referencia a la Figura 11 anterior. La componente de software 170 puede implementar la funcionalidad del bloque 48 en el ejemplo descrito con referencia a la Figura 11 anterior. El libro de codigos virtual VC1 obtenido a partir de la componente de software 140 se almacena preferentemente en la memoria 150 para este proposito. El libro de codigos virtual VC2 obtenido a partir de la componente de software 170 se presenta a la salida desde la memoria 150 por parte del controlador de E/S 160 a traves del bus de E/S o se almacena en la memoria 150.
5
10
15
20
25
30
35
40
45
La Figura 19 es un diagrama de bloques que ilustra una realizacion de un rellenador de espectro 40. Esta realizacion se basa en un procesador 110, por ejemplo un microprocesador, que ejecuta una componente de software 180 para generar un libro de codigos virtual VC1 de baja frecuencia, una componente de software 190 para generar un libro de codigos virtual VC2 de alta frecuencia, una componente de software 200 para rellenar subvectores residuales no codificados por debajo de una frecuencia predeterminada a partir del libro de codigos virtual VC1, y una componente de software 210 para rellenar subvectores residuales no codificados por encima de una frecuencia predeterminada a partir del libro de codigos virtual VC2. Estas componentes de software se almacenan en la memoria 150. El procesador 110 comunica con la memoria a traves de un bus de sistema. Los subvectores residuales son recibidos por un controlador 160 de entrada/salida (E/S) que controla un bus de E/S, al que estan conectados el procesador 110 y la memoria 150. En esta realizacion, los subvectores residuales recibidos por el controlador de E/S 160 se almacenan en la memoria 150, donde son procesados mediante las componentes de software. La componente de software 180 puede implementar la funcionalidad de los bloques 42-46 en la realizacion descrita con referencia a la Figura 12 anterior. La componente de software 190 puede implementar la funcionalidad del bloque 48 en la realizacion descrita con referencia a la Figura 12 anterior. Las componentes de software 200, 210 pueden implementar la funcionalidad del bloque 50 en la realizacion descrita con referencia a la Figura 12 anterior. Los libros de codigos virtuales VC1, VC2 obtenidos a partir de las componentes de software 180 y 190 se almacenan con preferencia en la memoria 150 para este proposito. Los subvectores residuales rellenados obtenidos a partir de las componentes de software 200, 201 son presentados a la salida desde la memoria 150 por medio del controlador de E/S 160 a traves del bus de E/S o se almacenan en la memoria 150.
La tecnologfa descrita en lo que antecede esta destinada a ser usada en un descodificador de audio, el cual puede ser usado en un dispositivo movil (por ejemplo, telefono movil, ordenador portatil) o en un PC estacionario. En esta memoria, el termino Equipo de Usuario (UE) sera usado como nombre generico de tales dispositivos. Un descodificador de audio con el esquema de rellenado de espectro que se ha propuesto puede ser usado en escenarios de comunicacion en tiempo real (dirigidos principalmente a habla) o escenarios de transmision (dirigidos principalmente a musica).
La Figura 20 ilustra una realizacion de un equipo de usuario conforme a la presente tecnologfa. Este incluye un descodificador 300 equipado con un rellenador de espectro 40 conforme a la presente tecnologfa. Esta realizacion ilustra un terminal de radio, pero tambien son factibles otros nodos de red. Por ejemplo, si se usa voz sobre IP (Protocolo de Internet) en la red, el equipo de usuario puede comprender un ordenador.
En el equipo de usuario de la Figura 20, una antena 302 recibe una senal de audio codificada. Una unidad de radio 304 transforma la senal en parametros de audio, los cuales son enviados al descodificador 300 para generar una senal de audio digital, segun se ha descrito con referencia a las diversas realizaciones anteriores. La senal de audio digital se convierte a continuacion en D/A y se amplifica en una unidad 306 y finalmente se envfa a un altavoz 308.
Los expertos en la materia comprenderan que se pueden realizar diversas modificaciones y cambios en la presente tecnologfa sin apartarse del alcance de la misma, el cual se define en las reivindicaciones anexas.
Referencias
[1] ITU-T Rec. G.719, “Low-complexity full-band audio coding for high-quality conversational applications”, 2008, Secciones 8.4.1, 8.4.3.
[2] Mittal, J. Ashley, E. Cruz-Zeno, “Low Complexity Factorial Pulse Coding of MDCT Coefficients using Approximation of Combinatorial Functions”, ICASSP 2007.
Abreviaturas
FPC Codificacion de Pulso Factorial
MDCT Transformada Coseno Discreta Modificada
RMS Valor Cuadratico Medio
UE Equipo de Usuario
VC Libro de Codigos Virtual

Claims (10)

  1. 5
    10
    15
    20
    25
    30
    35
    REIVINDICACIONES
    1.- Un metodo de rellenado de subvectores residuales no codificados de una senal de audio codificada por transformada, incluyendo dicho metodo las etapas de:
    comprimir (S1) subvectores residuales actualmente codificados;
    rechazar (S2) subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado;
    concatenar (S3) los subvectores residuales comprimidos restantes para formar un primer libro de codigos virtual (VC1);
    combinar (S4) pares de coeficientes del primer libro de codigos virtual (VC1) para formar un segundo libro de codigos virtual (VC2);
    rellenar (S5) subvectores residuales no codificados por debajo de una frecuencia predeterminada con coeficientes procedentes del primer libro de codigos virtual (VC1);
    rellenar (S6) subvectores residuales no codificados por encima de la frecuencia predeterminada con coeficientes procedentes del segundo libro de codigos virtual;
    A
    caracterizado porque se comprimen (S1) componentes X(k) de subvectores residuales actualmente codificados conforme a:
    imagen1
    si X(k)> 0 si x (fc) = o
    Si X(k) <0
    donde Y(k) son las componentes de los subvectores residuales comprimidos.
  2. 2. - El metodo de la reivindicacion 1, en donde los subvectores residuales comprimidos que tienen menos de un porcentaje predeterminado de componentes distintas de cero, son rechazados (S2).
  3. 3. - El metodo de la reivindicacion 1 o 2, en donde se combinan (S4) pares de coeficientes Y(k) del primer libro de codigos virtual (VC1) conforme a:
    imagen2
    donde N es el tamano del primer libro de codigos virtual (VC1) y Z(k) son los componentes del segundo libro de codigos virtual (VC2).
  4. 4. - El metodo de las reivindicaciones 1, 2 o 3, que incluye la etapa de ajustar (S7) la energfa de los subvectores residuales no codificados rellenados para obtener una atenuacion perceptiva.
  5. 5. - Un rellenador de espectro (40) para rellenar subvectores residuales no codificados de una senal de audio codificada por transformada, incluyendo dicho rellenador de espectro:
    un compresor de subvector (42) configurado para comprimir subvectores residuales actualmente codificados;
    un rechazador de subvector (44) configurado para rechazar subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado;
    un colector de subvector (46) configurado para concatenar los subvectores residuales comprimidos restantes para formar un primer libro de codigos virtual (VC1);
    un combinador de coeficientes (48) configurado para combinar pares de coeficientes del primer libro de codigos virtual (VC1) para formar un segundo libro de codigos virtual (VC2);
    un rellenador de subvector (50) configurado para rellenar subvectores residuales no codificados por debajo de una frecuencia predeterminada con coeficientes procedentes del primer libro de codigos virtual (VC1), y para rellenar
    subvectores residuales no codificados por encima de la frecuencia predeterminada con coeficientes procedentes del segundo libro de codigos virtual (VC2), caracterizado porque el compresor de subvector (42) esta configurado para
    A
    comprimir componentes X(k) de subvectores residuales actualmente codificados conforme a:
    imagen3
    5 donde Y(k) son las componentes de los subvectores residuales comprimidos.
  6. 6. - El rellenador de espectro de la reivindicacion 5, en donde el rechazador de subvector (44) esta configurado para rechazar subvectores residuales comprimidos que tengan menos de un porcentaje predeterminado de componentes distintas de cero.
  7. 7. - El rellenador de espectro de la reivindicacion 5 o 6, en donde el combinador de coeficientes (48) esta configurado 10 para combinar pares de coeficientes Y(k) del primer libro de codigos virtual (VC1) conforme a:
    sign(Y (k)) x (|y (k)| + |y (AT - k)^ Si Y(k)* 0
    k = O...N -1
    Y(N-k) si Y(k) = 0
    donde N es el tamano del primer libro de codigos virtual (VC1) y Z(k) son los componentes del segundo libro de codigos virtual (VC2).
  8. 8. - El rellenador de espectro de la reivindicacion 5, 6 o 7, que incluye un ajustador de energfa (52) configurado para 15 ajustar la energfa de los subvectores residuales no codificados rellenados, para obtener una atenuacion perceptiva.
  9. 9. - Un descodificador (300) que incluye un rellenador de espectro (40) conforme a cualquiera de las reivindicaciones 5-8 precedentes.
  10. 10. - Un equipo de usuario (UE) que incluye un descodificador conforme a la reivindicacion 9.
    Z(fc)=-
ES11860593.0T 2011-03-10 2011-09-14 Relleno de subvectores no codificados en señales de audio codificadas por transformada Active ES2559040T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161451363P 2011-03-10 2011-03-10
US201161451363P 2011-03-10
PCT/SE2011/051110 WO2012121638A1 (en) 2011-03-10 2011-09-14 Filing of non-coded sub-vectors in transform coded audio signals

Publications (1)

Publication Number Publication Date
ES2559040T3 true ES2559040T3 (es) 2016-02-10

Family

ID=46798435

Family Applications (3)

Application Number Title Priority Date Filing Date
ES17208522T Active ES2758370T3 (es) 2011-03-10 2011-09-14 Relleno de subvectores no codificados en señales de audio codificadas por transformada
ES11860593.0T Active ES2559040T3 (es) 2011-03-10 2011-09-14 Relleno de subvectores no codificados en señales de audio codificadas por transformada
ES15183624.4T Active ES2664090T3 (es) 2011-03-10 2011-09-14 Relleno de subvectores no codificados en señales de audio codificadas por transformada

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES17208522T Active ES2758370T3 (es) 2011-03-10 2011-09-14 Relleno de subvectores no codificados en señales de audio codificadas por transformada

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES15183624.4T Active ES2664090T3 (es) 2011-03-10 2011-09-14 Relleno de subvectores no codificados en señales de audio codificadas por transformada

Country Status (11)

Country Link
US (6) US9424856B2 (es)
EP (3) EP3319087B1 (es)
CN (1) CN103503063B (es)
AU (1) AU2011361945B2 (es)
DK (3) DK2684190T3 (es)
ES (3) ES2758370T3 (es)
HU (2) HUE037111T2 (es)
NO (1) NO2753696T3 (es)
PL (1) PL2684190T3 (es)
PT (2) PT3319087T (es)
WO (1) WO2012121638A1 (es)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2836122C (en) 2011-05-13 2020-06-23 Samsung Electronics Co., Ltd. Bit allocating, audio encoding and decoding
KR102078865B1 (ko) 2011-06-30 2020-02-19 삼성전자주식회사 대역폭 확장신호 생성장치 및 방법
KR20130032980A (ko) * 2011-09-26 2013-04-03 한국전자통신연구원 잔여 비트를 이용하는 코딩 장치 및 그 방법
MY197538A (en) * 2012-03-29 2023-06-22 Ericsson Telefon Ab L M Bandwidth extension of harmonic audio signal
KR101897092B1 (ko) * 2013-01-29 2018-09-11 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 노이즈 채움 개념
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP3413308A1 (en) 2017-06-07 2018-12-12 Nokia Technologies Oy Efficient storage of multiple structured codebooks
MX2020010468A (es) * 2018-04-05 2020-10-22 Ericsson Telefon Ab L M Codificacion predictiva truncable.
GB2578603A (en) * 2018-10-31 2020-05-20 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
RU2757860C1 (ru) * 2021-04-09 2021-10-21 Общество с ограниченной ответственностью "Специальный Технологический Центр" Способ автоматической оценки качества речевых сигналов с низкоскоростным кодированием

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0451199A (ja) * 1990-06-18 1992-02-19 Fujitsu Ltd 音声符号化・復号化方式
CA2206652A1 (en) * 1996-06-04 1997-12-04 Claude Laflamme Baud-rate-independent asvd transmission built around g.729 speech-coding standard
US6173257B1 (en) 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6714907B2 (en) * 1998-08-24 2004-03-30 Mindspeed Technologies, Inc. Codebook structure and search for speech coding
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6456964B2 (en) * 1998-12-21 2002-09-24 Qualcomm, Incorporated Encoding of periodic speech using prototype waveforms
US6952671B1 (en) * 1999-10-04 2005-10-04 Xvd Corporation Vector quantization with a non-structured codebook for audio compression
US6944350B2 (en) * 1999-12-17 2005-09-13 Utah State University Method for image coding by rate-distortion adaptive zerotree-based residual vector quantization and system for effecting same
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US6909749B2 (en) * 2002-07-15 2005-06-21 Pts Corporation Hierarchical segment-based motion vector encoding and decoding
US8064520B2 (en) * 2003-09-07 2011-11-22 Microsoft Corporation Advanced bi-directional predictive coding of interlaced video
US8165215B2 (en) * 2005-04-04 2012-04-24 Technion Research And Development Foundation Ltd. System and method for designing of dictionaries for sparse representation
WO2007114290A1 (ja) * 2006-03-31 2007-10-11 Matsushita Electric Industrial Co., Ltd. ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
JPWO2007132750A1 (ja) 2006-05-12 2009-09-24 パナソニック株式会社 Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法
US7822289B2 (en) * 2006-07-25 2010-10-26 Microsoft Corporation Locally adapted hierarchical basis preconditioning
WO2008067766A1 (fr) 2006-12-05 2008-06-12 Huawei Technologies Co., Ltd. Procédé et dispositif de quantification d'un vecteur
WO2009029036A1 (en) * 2007-08-27 2009-03-05 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for noise filling
US8280744B2 (en) * 2007-10-17 2012-10-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio object encoder, method for decoding a multi-audio-object signal, multi-audio-object encoding method, and non-transitory computer-readable medium therefor
EP3288029A1 (en) * 2008-01-16 2018-02-28 III Holdings 12, LLC Vector quantizer, vector inverse quantizer, and methods therefor
US8619918B2 (en) * 2008-09-25 2013-12-31 Nec Laboratories America, Inc. Sparse channel estimation for MIMO OFDM systems
US8320489B2 (en) * 2009-02-20 2012-11-27 Wisconsin Alumni Research Foundation Determining channel coefficients in a multipath channel

Also Published As

Publication number Publication date
DK2684190T3 (da) 2016-02-22
CN103503063A (zh) 2014-01-08
US11756560B2 (en) 2023-09-12
PT3319087T (pt) 2019-10-09
EP2684190B1 (en) 2015-11-18
PT2684190E (pt) 2016-02-23
AU2011361945A1 (en) 2013-09-26
EP2684190A4 (en) 2014-08-13
EP3319087A1 (en) 2018-05-09
WO2012121638A1 (en) 2012-09-13
US9966082B2 (en) 2018-05-08
CN103503063B (zh) 2015-12-09
EP2975611B1 (en) 2018-01-10
US20180226081A1 (en) 2018-08-09
ES2758370T3 (es) 2020-05-05
US20160322058A1 (en) 2016-11-03
DK3319087T3 (da) 2019-11-04
HUE037111T2 (hu) 2018-08-28
HUE026874T2 (en) 2016-07-28
AU2011361945B2 (en) 2016-06-23
US20230410822A1 (en) 2023-12-21
NO2753696T3 (es) 2018-04-21
US9424856B2 (en) 2016-08-23
US20230106557A1 (en) 2023-04-06
US20210287685A1 (en) 2021-09-16
PL2684190T3 (pl) 2016-04-29
EP3319087B1 (en) 2019-08-21
DK2975611T3 (en) 2018-04-03
EP2684190A1 (en) 2014-01-15
EP2975611A1 (en) 2016-01-20
ES2664090T3 (es) 2018-04-18
US20130346087A1 (en) 2013-12-26
US11551702B2 (en) 2023-01-10

Similar Documents

Publication Publication Date Title
ES2559040T3 (es) Relleno de subvectores no codificados en señales de audio codificadas por transformada
US10515648B2 (en) Audio/speech encoding apparatus and method, and audio/speech decoding apparatus and method
ES2375192T3 (es) Codificación por transformación mejorada de habla y señales de audio.
JP6435392B2 (ja) 音声音響符号化装置及び音声音響符号化方法
ES2703873T3 (es) Codificación/descodificación de la transformada de señales armónicas de audio
WO2006041055A1 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
ES2637031T3 (es) Decodificador para la atenuación de regiones de señal reconstruidas con baja precisión
CN105448298A (zh) 填充变换编码音频信号中的非编码子向量