ES2613651T3 - Cuantificación de señales de audio adaptativas por tonalidad de baja complejidad - Google Patents

Cuantificación de señales de audio adaptativas por tonalidad de baja complejidad Download PDF

Info

Publication number
ES2613651T3
ES2613651T3 ES14701558.0T ES14701558T ES2613651T3 ES 2613651 T3 ES2613651 T3 ES 2613651T3 ES 14701558 T ES14701558 T ES 14701558T ES 2613651 T3 ES2613651 T3 ES 2613651T3
Authority
ES
Spain
Prior art keywords
hue
spectral
dead zone
signal
spectral lines
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14701558.0T
Other languages
English (en)
Inventor
Martin Dietz
Guillaume Fuchs
Christian Helmrich
Goran MARKOVIC
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2613651T3 publication Critical patent/ES2613651T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/02Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
    • G10H1/06Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/555Tonality processing, involving the key in which a musical piece or melody is played
    • G10H2210/561Changing the tonality within a musical piece
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters

Abstract

Codificador de audio para codificar una señal de audio (AS) para producir a partir de la misma una señal codificada (ES), comprendiendo el codificador de audio (1): un dispositivo de alineación de tramas (2) configurado para extraer tramas (F) de la señal de audio (AS); un cuantificador (3) configurado para mapear líneas espectrales (SL1-32) de una señal de espectro (SPS) derivada desde la trama (F) de la señal de audio (AS) a los índices de cuantificación (I0, I1), en el que el cuantificador (3) tiene una zona muerta (DZ), en la que se mapean las líneas espectrales (SL1-32) hasta el índice de cuantificación cero (I0); y un dispositivo de control (4) configurado para modificar la zona muerta (DZ); en el que el dispositivo de control (4) comprende un dispositivo de cálculo de la tonalidad (5) configurado para calcular al menos un valor indicativo de tonalidad (TI5-32) para al menos una línea espectral (SL1-32) o para al menos un grupo de líneas espectrales (SL1-32), en el que el dispositivo de control (4) está configurado para modificar la zona muerta (DZ) para la al menos una línea espectral (SL1-32) o el al menos un grupo de líneas espectrales (SL1-32) dependiendo del respectivo valor indicativo de tonalidad (TI5-32).

Description

5
10
15
20
25
30
35
40
45
50
55
60
Cuantificacion de senales de audio adaptativas por tonalidad de baja complejidad
DESCRIPCION
La invencion se refiere a procesamiento de senales de audio digitales. Mas particularmente la invencion se refiere a cuantificacion de senales de audio.
En la codificacion de transformacion de tasa de bits muy baja, el numero de bits por trama generalmente no es suficiente para evitar artefactos en la senal decodificada. El ruido musical, en particular, puede aparecer en los espectros de ruido o musica fija debido a lmeas de transformacion (rangos) que se “encienden y apagan”, es decir se cuantifican a cero o no se cuantifican a cero, a una cierta frecuencia de una trama a la siguiente. Dicho metodo de codificacion no solo proporciona a la region de senal decodificada un caracter mas tonal que el que tiene la senal original (por lo tanto la expresion ruido musical), tampoco produce una ventaja notable sobre no codificar dicha region espectral en absoluto y aplicar en su lugar una tecnica de reemplazo de rango como los algoritmos de relleno de ruido en los sistemas de codificacion TCX o FD empleados en xHE-AAC [4]. De hecho, la codificacion explfcita aunque insuficiente de las regiones propensas al ruido de codificacion musical requiere bits en la etapa de codificacion por entropfa del codificador de transformacion, que sonicamente se usa mejor en las regiones espectrales, en especial a bajas frecuencias donde el sistema auditivo humano es sensible.
Un modo de reducir la aparicion de ruido musical en codificacion de audio de tasa de bits baja es pre-filtrar los coeficientes de MDCT como se publica en DAUDET, L. MDCT Analysis of Sinusoids: Exact Results and Applications to Coding Artifacts Reduction. IEEE Transactions on Speech and Audio Processing, 2004, Vol. 12, N .° 3, paginas 302 a 312.
Otro modo de reducir la aparicion de ruido musical en codificacion de audio de tasa de bits baja es modificar el comportamiento del mapeo del cuantificador en las lmeas espectrales de entrada a los indices de cuantificacion de modo que se adapte a la caractenstica de senal de entrada instantanea y consumo de bits del espectro cuantificado. Con mayor precision, una zona muerta usada durante la cuantificacion se altera en forma adaptativa de la senal. Se han publicado diversos enfoques [5, 6 y referencias citadas en los mismos]. En [5], la adaptacion del cuantificador se realiza en el espectro completo a codificarse. El cuantificador adaptado por lo tanto se comporta identicamente para todos los rangos espectrales de la trama dada. Mas aun, en el caso de cuantificacion con la zona muerta optima zopt, 2 bits de informacion secundaria deben transmitirse al decodificador, que representan una tasa de bits y penalizacion de compatibilidad hacia atras. En [6], el cuantificador se adapta en una base de banda por frecuencia, pero se realizan dos intentos de cuantificacion por banda, y solamente el mejor intento (de acuerdo con una cierta decision) se usa para la transmision. Esto es complejo.
Un objetivo de la presente invencion es proporcionar conceptos mejorados para procesamiento de senal de audio. Mas particularmente, un objetivo de la presente invencion es proporcionar conceptos mejorados para cuantificacion de senales de audio adaptativas. El objetivo de la presente invencion se logra por un codificador de audio de acuerdo con la reivindicacion 1, por un sistema de acuerdo con la reivindicacion 15, por un metodo de acuerdo con la reivindicacion 16 y por un programa informatico de acuerdo con la reivindicacion 17.
En un aspecto la invencion proporciona un codificador de audio para codificar una senal de audio con el objetivo de producir a partir de la misma una senal codificada, comprendiendo el codificador de audio:
un dispositivo de alineacion de tramas configurado para extraer tramas de la senal de audio;
un cuantificador configurado para mapear lmeas espectrales de una senal de espectro derivada de la trama de la senal de audio a los indices de cuantificacion; en el que el cuantificador tiene una zona muerta, en la cual las lmeas espectrales se mapean hasta el mdice de cuantificacion cero; y
un dispositivo de control configurado para modificar la zona muerta;
en el que el dispositivo de control comprende un dispositivo de calculo de la tonalidad configurado para calcular al menos una tonalidad que indica el valor para al menos una lmea espectral o para al menos un grupo de lmeas espectrales,
en el que el dispositivo de control esta configurado para modificar la zona muerta para la al menos una lmea espectral o el al menos un grupo de lmeas espectrales dependiendo del respectivo valor indicativo de tonalidad.
El dispositivo de alineacion de tramas puede estar configurado para extraer tramas de la senal de audio por medio de la aplicacion de una funcion de ventana a la senal de audio. En el procesamiento de la senal, una funcion de ventana (conocida tambien como funcion de apodizacion o funcion de reduccion) es una funcion matematica que tiene valor cero fuera de algun intervalo elegido. Por medio de la aplicacion de la funcion de ventana a la senal, la senal puede descomponerse en segmentos cortos, los cuales normalmente se llaman tramas.
5
10
15
20
25
30
35
40
45
50
55
60
Cuantificacion, en el procesamiento de senales de audio digital, es el proceso de mapeo de un conjunto grande de valores de entrada a un conjunto mas pequeno (contable) - tal como redondeo de valores hasta alguna unidad de precision. Un dispositivo o funcion algontmica que realiza la cuantificacion se llama un cuantificador.
De acuerdo con la invencion una senal de espectro se calcula para las tramas de la senal de audio. La senal del espectro puede contener un espectro de cada una de las tramas de la senal de audio, que es una senal de dominio de tiempo, en la que cada espectro es una representacion de una de las tramas en el dominio de frecuencia. El espectro de frecuencia puede generarse por medio de una transformacion matematica de la senal, y los valores resultantes se presentan normalmente como amplitud frente a frecuencia.
La zona muerta es una zona usada durante cuantificacion, en la que las lmeas espectrales (rangos de frecuencia) o grupos de lmeas espectrales (bandas de frecuencia) se mapean a cero. La zona muerta tiene un lfmite inferior, que normalmente esta a una amplitud de cero, y un lfmite superior, que puede variar para diferentes lmeas espectrales o grupos de lmeas espectrales.
De acuerdo con la invencion la zona muerta puede modificarse por medio de un dispositivo de control. El dispositivo de control comprende un dispositivo de calculo de la tonalidad que esta configurado para calcular al menos un valor indicativo de tonalidad para al menos una lmea espectral o para al menos un grupo de lmeas espectrales.
El termino “tonalidad” se refiere al caracter tonal de la senal del espectro. En general puede decirse que la tonalidad es alta en el caso que el espectro comprenda componentes predominantemente periodicos, lo que significa que el espectro de una trama comprende picos dominantes. El opuesto de un caracter tonal es un caracter con ruido. En el ultimo caso el espectro de una trama es mas plano.
Adicionalmente, el dispositivo de control esta configurado para modificar la zona muerta para la al menos una lmea espectral o el al menos un grupo de lmeas espectrales dependiendo del respectivo valor indicativo de tonalidad.
La presente invencion revela un esquema de cuantificacion con una zona muerta adaptativa a la senal que
• no requiere ninguna informacion secundaria, lo que permite su uso en codec de medios existentes,
• decide antes de la cuantificacion cual zona muerta usar por rango o banda, ahorrando complejidad,
• puede determinar la zona muerta por banda o por rango basandose en la frecuencia de la banda y/o tonalidad de la senal.
La invencion puede aplicarse en infraestructura de codificacion existente dado que solo se cambia el cuantificador de senal en el codificador; el correspondiente decodificador aun sera capaz de leer el flujo de bits (sin modificar) producido a partir de la senal codificada y decodificar la salida. A diferencia de [6] y las referencias en el mismo, la zona muerta para cada grupo de lmeas espectrales o para cada lmea espectral se selecciona antes de la cuantificacion, de modo que solo es necesaria una operacion de cuantificacion por grupo o lmea espectral. Finalmente, la decision del cuantificador no se limita a elegir entre dos valores posibles de zona muerta, sino un rango entero de valores. La decision se detalla a continuacion. El esquema de cuantificacion adaptativo a la tonalidad definido con anterioridad puede implementarse en la trayectoria de excitacion codificada de transformacion (TCX) del codificador de LD-USAC, una variante de bajo retardo de xHE-AAC [4].
De acuerdo con un modo de realizacion preferido de la invencion el dispositivo de control esta configurado para modificar la zona muerta de tal manera que la zona muerta en una de las lmeas espectrales es mas grande que lo que la zona muerta es en una de las lmeas espectrales que tiene una mayor tonalidad o de tal manera que la zona muerta en uno de los grupos de lmeas espectrales es mas grande que lo que es la zona muerta en uno de los grupos de lmeas espectrales que tiene una mayor tonalidad. Por estas caractensticas las regiones espectrales no tonales tenderan a cuantificarse a cero, lo que significa que la cantidad de los datos puede reducirse.
De acuerdo con un modo de realizacion preferido de la invencion el dispositivo de control comprende un dispositivo de calculo del espectro de energfa configurado para calcular un espectro de energfa de la trama de la senal de audio, en el que el espectro de energfa comprende valores de energfa para las lmeas espectrales o grupos de lmeas espectrales, en el que el dispositivo de calculo de la tonalidad esta configurado para calcular el al menos un valor indicativo de tonalidad dependiendo del espectro de energfa. Calculando el valor indicativo de la tonalidad basandose en el espectro de energfa la complejidad computacional permanece bastante baja.
De acuerdo con un modo de realizacion preferido de la invencion el valor indicativo de la tonalidad para una de las lmeas espectrales se basa en una comparacion del valor de energfa para la respectiva lmea espectral y la suma de un numero predefinido de sus valores circundantes de energfa del espectro de energfa, o en el que el valor indicativo de la tonalidad para uno de los grupos de las lmeas espectrales se basa en una comparacion del valor de
5
10
15
20
25
30
35
40
45
50
55
60
ene^a para el respectivo grupo de lmeas espectrales y la suma de un numero predefinido de sus valores circundantes de ene^a del espectro de energfa. Comparando un valor de energfa con sus valores de energfa vecinos las areas pico de energfa o areas planas del espectro de energfa pueden identificarse facilmente de tal manera que el valor indicativo de la tonalidad puede calcularse de un modo facil.
De acuerdo con un modo de realizacion preferido de la invencion el valor indicativo de la tonalidad para una de las lmeas espectrales se basa en el valor indicativo de la tonalidad de la lmea espectral de una trama anterior de la senal de audio, o en el que el valor indicativo de la tonalidad para uno de los grupos de las lmeas espectrales se basa en el valor indicativo de la tonalidad del grupo de lmeas espectrales para una trama anterior de la senal de audio. Por medio de estas caractensticas la zona muerta se modificara con el transcurso del tiempo en un modo suave.
De acuerdo con un modo de realizacion preferido de la invencion el valor indicativo de la tonalidad se calcula por una formula
Tki - /(
pk ■-7,£+-"+JJft-i.J+pft+U+"'+pfc+7.f
pk,(
)-
en la que i es un mdice que indica una trama espedfica de la senal de audio, k es un mdice que indica una lmea espectral espedfica, Pkj es el valor de energfa de la lmea espectral k-esima de la trama i-esima, o en el que el valor indicativo de la tonalidad se calcula por una formula
T — J-7,i+~t+fV-i,f +^+1^ pm-7ri-i+•'
1 m,i J \ o . ' o .
p vU
pm. i-1
en la que i es un mdice que indica una trama espedfica de la senal de audio, m es un mdice que indica un grupo espedfico de lmeas espectrales, Pmj es el valor de energfa del grupo m-esimo de lmeas espectrales de la trama i- esima. Como se observara a partir de la formula el valor indicativo de la tonalidad se calcula a partir del valor de energfa de la trama i-esima, que es la trama actual, y a partir de la trama de orden i-1, que es la trama anterior. La formula puede cambiarse omitiendo la dependencia a partir de la trama de orden i-1. En este punto se calcula la suma de 7 valores de energfa vecinos a la izquierda y 7 a la derecha del valor de energfa k-esima y se divide por el respectivo valor de energfa. Usando esta formula un valor indicativo de tonalidad bajo indica una alta tonalidad.
De acuerdo con un modo de realizacion preferido de la invencion el codificador de audio comprende un dispositivo de calculo de frecuencia de inicio configurado para calcular una frecuencia de inicio para modificar la zona muerta, en el que la zona muerta solo esta modificada para las lmeas espectrales que representan una frecuencia mayor que o igual a la frecuencia de inicio. Esto significa que la zona muerta es fija para bajas frecuencias y variable para frecuencias mas altas. Estas caractensticas conducen a una mejor calidad de audio ya que el sistema auditivo humano es mas sensible a bajas frecuencias.
De acuerdo con un modo de realizacion preferido de la invencion el dispositivo de calculo de la frecuencia de inicio esta configurado para calcular la frecuencia de inicio en base una tasa de muestreo de la senal de audio y/o basandose en la tasa de bits maxima prevista para un flujo de bits producido desde la senal codificada. Por medio de estas caractensticas se optimizara la calidad del audio.
De acuerdo con un modo de realizacion preferido de la invencion el codificador de audio comprende un dispositivo de calculo de la transformada del coseno discreta modificada configurado para calcular la transformada del coseno discreta modificada a partir de la trama de la senal de audio y un dispositivo de calculo de la transformada del seno discreta modificada configurado para calcular una transformada del seno discreta modificada a partir de la trama de la senal de audio, en el que el dispositivo de calculo del espectro de energfa esta configurado para calcular el espectro de energfa basandose en la transformada del coseno discreta modificada y en la transformada del seno discreta modificada. La transformada del coseno discreta modificada tiene que calcularse de cualquier modo para los fines de codificacion la senal de audio. Por lo tanto, solo la transformada del seno discreta modificada tiene que calcularse adicionalmente para el fin de cuantificacion adaptativa a la tonalidad. Por lo tanto, puede reducirse la complejidad. Sin embargo, pueden usarse otras transformaciones tales como la transformada de Fourier discreta o la transformada de Fourier discreta impar.
De acuerdo con un modo de realizacion preferido de la invencion dispositivo de calculo del espectro de energfa esta configurado para calcular los valores de energfa de acuerdo con la formula Pkj = (MDCTr,)2 + (MDSTk,)2, en la que i es un mdice que indica una trama espedfica de la senal de audio, k es un mdice que indica una lmea espectral espedfica, MDCTkj es el valor de la transformada del coseno discreta modificada en la lmea espectral k-esima de la trama i-esima, MDSTkj es el valor de la transformada del seno discreta modificada en la lmea espectral k-esima de la trama i-esima, y Pkj es el valor de energfa de la lmea espectral k-esima de la trama i-esima. La formula anterior
5
10
15
20
25
30
35
40
45
50
55
60
permite el calculo de los valores de ene^a de un modo facil.
De acuerdo con un modo de realizacion preferido de la invencion el codificador de audio comprende un dispositivo de calculo de una senal de espectro configurado para producir la senal del espectro, en el que el dispositivo de calculo de la senal del espectro comprende un dispositivo de ajuste de amplitud configurado para establecer amplitudes de las lmeas espectrales de la senal del espectro de tal manera que se compensa una perdida de energfa debido a la modificacion de la zona muerta. Por medio de estas caractensticas la cuantificacion puede realizarse en un modo que conserva la energfa.
De acuerdo con un modo de realizacion preferido de la invencion el dispositivo de ajuste de amplitud esta configurado para establecer las amplitudes de la senal del espectro dependiendo de una modificacion de la zona muerta en la respectiva lmea espectral. Por ejemplo las lmeas espectrales, para las cuales la zona muerta esta ampliada, pueden amplificarse ligeramente para este fin.
De acuerdo con un modo de realizacion preferido de la invencion el dispositivo de calculo de la senal del espectro comprende un dispositivo de normalizacion. Por esta caractenstica la etapa posterior de cuantificacion puede realizarse de un modo facil.
De acuerdo con un modo de realizacion preferido de la invencion la transformada del coseno discreta modificada a partir de la trama de la senal de audio calculada por el dispositivo de calculo de la transformada del coseno discreta modificada se alimenta al dispositivo de calculo de la senal del espectro. Por esta caractenstica la transformada del coseno discreta modificada se usa para el fin de adaptacion de la cuantificacion y para el fin de calcular la senal codificada.
En un aspecto la invencion proporciona un sistema que comprende un codificador y un decodificador, en el que el codificador esta disenado de acuerdo con la invencion.
En un aspecto la invencion proporciona un metodo para codificar una senal de audio con el objetivo de producir a partir de la misma una senal codificada, comprendiendo el metodo las etapas:
extraer las tramas desde la senal de audio;
mapear las lmeas espectrales de una senal de espectro derivadas de la trama de la senal de audio a los indices de cuantificacion;
en el que se usa una zona muerta, en la cual las lmeas espectrales de entrada se mapean a cero; y modificar la zona muerta;
en el que se calcula al menos un valor indicativo de tonalidad para al menos una lmea espectral o para al menos un grupo de lmeas espectrales,
en el que la zona muerta para la al menos una lmea espectral o el al menos un grupo de lmeas espectrales se modifica dependiendo del respectivo valor indicativo de tonalidad.
En un aspecto la invencion proporciona un producto de programa informatico para realizar, cuando se ejecuta en una computadora o un procesador, el metodo de acuerdo con la invencion.
Las formas de realizacion preferidas de la invencion se analizan posteriormente con respecto a los dibujos adjuntos, en los que:
La Figura 1 ilustra una forma de realizacion de un codificador de acuerdo con la invencion y La Figura 2 ilustra el principio de funcionamiento de un codificador de acuerdo con la invencion.
La Figura 1 representa un codificador de audio 1 para codificar una senal de audio AS con el objetivo de producir a partir de la misma una senal codificada ES de acuerdo con la invencion. El codificador de audio 1 comprende:
un dispositivo de alineacion de tramas 2 configurado para extraer tramas F de la senal de audio AS;
un cuantificador 3 configurado para mapear las lmeas espectrales SL1-32 (vease la Figura 2) de una senal de espectro SPS derivada a partir de la trama F de la senal de audio AS a los indices de cuantificacion Io, I1; en el que las lmeas espectrales SL1-32 se mapean hasta el mdice de cuantificacion cero Io; y
un dispositivo de control 4 configurado para modificar la zona muerta DZ;
en el que el dispositivo de control 4 comprende un dispositivo de calculo de la tonalidad 5 configurado para calcular al menos un valor indicativo de tonalidad TI5-32 para al menos una lmea espectral SL1-32 o para al menos un grupo de
5
10
15
20
25
30
35
40
45
50
55
60
lmeas espectrales SL1-32,
en el que el dispositivo de control 4 esta configurado para modificar la zona muerta DZ para la al menos una lmea espectral SL1-32 o el al menos un grupo de lmeas espectrales SL1-32 dependiendo del respectivo valor indicativo de tonalidad TI5-32.
El dispositivo de alineacion de tramas 2 puede estar configurado para extraer tramas F de la senal de audio AS por medio de la aplicacion de una funcion de ventana a la senal de audio AS. En el procesamiento de la senal, una funcion de ventana (conocida tambien como funcion de apodizacion o funcion de reduccion) es una funcion matematica que tiene valor cero fuera de algun intervalo elegido. Por medio de la aplicacion de la funcion de ventana a la senal AS, la senal AS puede descomponerse en segmentos cortos, los cuales normalmente se llaman tramas F. Cuantificacion, en el procesamiento de senales de audio digital, es el proceso de mapeo de un conjunto grande de valores de entrada a un grupo de menor tamano (contable) - tal como redondeo de valores hasta alguna unidad de precision. Un dispositivo o funcion algontmica que realiza cuantificacion se llama un cuantificador.
De acuerdo con la invencion una senal de espectro SPS se calcula para las tramas F de la senal de audio AS. La senal del espectro SPS puede contener un espectro de cada una de las tramas F de la senal de audio AS, que es una senal de dominio de tiempo, en el que cada espectro es una representacion de una de las tramas F en el dominio de frecuencia. El espectro de frecuencia puede generarse por medio de una transformacion matematica de la senal AS, y los valores resultantes se presentan normalmente como amplitud frente a frecuencia.
La zona muerta DZ es la zona usada durante cuantificacion, en la que las lmeas espectrales SL1-32 (rangos de frecuencia) o grupos de lmeas espectrales SL1-32 (bandas de frecuencia) se mapean hasta el mdice de cuantificacion cero. La zona muerta DZ tiene un lfmite inferior, que normalmente esta a una amplitud de cero, y un lfmite superior, que puede variar para diferentes lmeas espectrales SL1-32 o grupos de lmeas espectrales SL1-32.
De acuerdo con la invencion la zona muerta DZ puede modificarse por medio de un dispositivo de control 4. El dispositivo de control 4 comprende un dispositivo de calculo de la tonalidad 5 que esta configurado para calcular al menos un valor indicativo de tonalidad TI5-32 para al menos una lmea espectral SL1-32 o para al menos un grupo lmeas espectrales SL1-32.
El termino “tonalidad” se refiere al caracter tonal de la senal del espectro SPS. En general puede decirse que la tonalidad es alta en el caso de que el espectro o una de sus partes comprenda componentes predominantemente periodicos, que significa que el espectro o la parte del mismo de una trama F comprende picos dominantes. El opuesto de un caracter tonal es un caracter con ruido. En el ultimo caso el espectro o la parte del mismo de una trama F es mas plano.
Adicionalmente, el dispositivo de control 4 esta configurado para modificar la zona muerta DZ para la al menos una lmea espectral SL1-32 o el al menos un grupo de lmeas espectrales SL1-32 dependiendo del respectivo valor indicativo de tonalidad TI5-32.
La presente invencion revela un esquema de cuantificacion con una zona muerta DZ adaptativa a la senal que
• no requiere ninguna informacion secundaria, permitiendo su uso en codec de medios existentes,
• decide antes de la cuantificacion que zona muerta DZ usar por rango o banda, ahorrando complejidad,
• puede determinar la zona muerta DZ por banda o por rango basandose en la frecuencia de la banda y/o tonalidad de la senal.
La invencion puede aplicarse en infraestructura de codificacion existente dado que solo se cambia el cuantificador de senal 3 en el codificador 1; el correspondiente decodificador sera capaz aun de leer el flujo de bits (sin modificar) producido a partir de la senal codificada y decodificar la salida. A diferencia de [6] y las referencias en el mismo, la zona muerta DZ para cada grupo de lmeas espectrales SL1-32 o para cada lmea espectral SL1-32 se selecciona antes de la cuantificacion, de modo que solo es necesaria una operacion de cuantificacion por grupo o lmea espectral SL1- 32. Finalmente, la decision del cuantificador no se limita a elegir entre dos valores posibles de zona muerta, sino un intervalo entero de valores. El esquema de cuantificacion adaptativo a la tonalidad definido con anterioridad puede implementarse en la trayectoria de excitacion codificada de transformacion (TCX) del codificador de LD-USAC, una variante de bajo retardo de xHE-AAC [4].
De acuerdo con un modo de realizacion preferido de la invencion el dispositivo de control 4 esta configurado para modificar la zona muerta DZ de tal manera que la zona muerta DZ en una de las lmeas espectrales SL1-32 es mas grande que la zona muerta DZ que esta en una de las lmeas espectrales SL1-32 que tiene una mayor tonalidad o de tal manera que la zona muerta DZ en uno de los grupos de lmeas espectrales SL1-32 es mas grande que la zona muerta DZ que esta en uno de los grupos de lmeas espectrales SL1-32 que tiene una mayor tonalidad. Por estas caracteristicas las regiones espectrales no tonales tenderan a cuantificarse a cero, que significa que la cantidad de
5
10
15
20
25
30
35
40
45
50
55
60
los datos puede reducirse.
De acuerdo con un modo de realizacion preferido de la invencion el dispositivo de control 4 comprende un dispositivo de calculo del espectro de energfa 6 configurado para calcular un espectro de energfa PS (vease tambien la Figura 2) de la trama F de la senal de audio AS, en el que el espectro de energfa PS comprende valores de energfa PS5-32 para las lmeas espectrales SL1-32 o grupos de lmeas espectrales SL1-32, en el que el dispositivo de calculo de la tonalidad 5 esta configurado para calcular el al menos un valor indicativo de tonalidad TI5-32 dependiendo del espectro de energfa PS. Calculando la tonalidad que indica un valor TI5-32 basandose en el espectro de energfa PS la complejidad informatica permanece bastante baja. Adicionalmente, la exactitud puede potenciarse.
De acuerdo con un modo de realizacion preferido de la invencion el valor indicativo de la tonalidad TI5-32 para una de las lmeas espectrales SL1-32 se basa en una comparacion del valor de energfa PS5-32 para la respectiva lmea espectral SL1-32 y la suma de un numero predefinido de sus valores circundantes de energfa PS5-32 del espectro de energfa PS, o en el que el valor indicativo de la tonalidad para uno de los grupos de las lmeas espectrales SL1-32 se basa en una comparacion del valor de energfa PS5-32 para el respectivo grupo de lmeas espectrales y la suma de un numero predefinido de sus valores circundantes de energfa PS5-32 del espectro de energfa. Comparando un valor de energfa PS5-32 con sus valores circundantes de energfa PS5-32 pueden identificarse facilmente areas pico o areas planas del espectro de energfa SP de tal manera que el valor indicativo de la tonalidad TI5-32 puede calcularse de un modo facil.
De acuerdo con un modo de realizacion preferido de la invencion el valor indicativo de la tonalidad TI5-32 para una de las lmeas espectrales SL1-32 se basa en el valor indicativo de la tonalidad TI5-32 de la lmea espectral SL1-32 de una trama anterior F de la senal de audio AS, o en el que el valor indicativo de la tonalidad TI5-32 para uno de los grupos de las lmeas espectrales SL1-32 se basa en el valor indicativo de la tonalidad TI5-32 del grupo de lmeas espectrales SL1-32 para una trama anterior F de la senal de audio AS. Por medio de estas caractensticas la zona muerta DZ se modificara con el transcurso del tiempo en un modo suave.
De acuerdo con un modo de realizacion preferido de la invencion el valor indicativo de la tonalidad TI5-32 se calcula por una formula
Ttu =
k.i
en la que i es un mdice que indica una trama espedfica F de la senal de audio AS, k es un mdice que indica una lmea espectral espedfica SL1-32, Pk.i es el valor de energfa PS5-32 de la lmea espectral k-esima SL1-32 de la trama i- esima, o en el que el valor indicativo de la tonalidad TI5-32 se calcula por una formula
T — *f'->"'L+pm+rt Prn-7.1-1 +“‘+Fm-U-t+f>m+U1 \
~ J V. „ . r 0 )■>
en la que i es un mdice que indica una trama espedfica F de la senal de audio AS, m es un mdice que indica un grupo espedfico de lmeas espectrales SL1-32, Pm.i es el valor de energfa PS5-32 del grupo m-esimo de lmeas espectrales SL1-32 de la trama i-esima. Como se observara a partir de la formula el valor indicativo de la tonalidad TI5- 32 se calcula a partir del valor de energfa PS5-32 de la trama i-esima, que es la trama actual F, y a partir de la trama de orden i-1 F, que es la trama anterior F. La formula puede cambiarse omitiendo la dependencia a partir de la trama de orden i-1 F. En este punto se calcula la suma de 7 valores de energfa vecinos a la izquierda y 7 a la derecha PS5- 32 del valor de energfa k-esimo PS5-32 de una cierta lmea espectral SL1-32 o se calcula el valor de la energfa m-esimo del grupo de lmeas espectrales SL1-32 y se divide por el respectivo valor de energfa PS5-32. Usando esta formula un valor indicativo de tonalidad bajo TI5-32 indica una alta tonalidad.
De acuerdo con un modo de realizacion preferido de la invencion el codificador de audio 1 comprende un dispositivo de calculo de frecuencia de inicio 7 configurado para calcular una frecuencia de inicio SF para modificar la zona muerta DZ, en el que la zona muerta DZ solo se modifica para las lmeas espectrales SL5-32 que representan una frecuencia mayor que o igual a la frecuencia de inicio SF. Esto significa que la zona muerta DZ es fija para bajas frecuencias y variable para frecuencias mas altas. Estas caractensticas conducen a una mejor calidad de audio ya que el sistema auditivo humano es mas sensible a bajas frecuencias.
De acuerdo con un modo de realizacion preferido de la invencion el dispositivo de calculo de frecuencia de inicio 7 esta configurado para calcular la frecuencia de inicio SF basandose en una tasa de muestreo de la senal de audio AS y/o basandose en una tasa de bits maxima prevista para un flujo de bits producido a partir de la senal codificada ES. Por medio de estas caractensticas se optimizara la calidad del audio.
5
10
15
20
25
30
35
40
45
50
55
60
De acuerdo con un modo de realizacion preferido de la invencion el codificador de audio 1 comprende un dispositivo de calculo de la transformada del coseno discreta modificada 8 configurado para calcular una transformada del coseno discreta modificada CT a partir de la trama F de la senal de audio AS y un dispositivo de calculo de la transformada del seno discreta modificada 9 configurado para calcular una transformada del seno discreta modificada ST a partir de la trama F de la senal de audio AS, en el que el dispositivo de calculo del espectro de energfa 6 esta configurado para calcular el espectro de energfa PS basandose en la transformada del coseno discreta modificada CT y en la transformada del seno discreta modificada ST. La transformada del coseno discreta modificada CT tiene que calcularse de cualquier modo en muchos casos para el fin de codificacion de la senal de audio AS. Por lo tanto, solo la transformada del seno discreta modificada ST tiene que calcularse adicionalmente para el fin de cuantificacion adaptativa a la tonalidad. Por lo tanto, puede reducirse la complejidad. Sin embargo, pueden usarse otras transformaciones tales como la transformada de Fourier discreta o la transformada de Fourier discreta impar.
De acuerdo con un modo de realizacion preferido de la invencion dispositivo de calculo del espectro de energfa 6 esta configurado para calcular los valores de energfa de acuerdo con la formula Pkj = (MDCTk,f + (MDST^i)2, en la que i es un mdice que indica una trama espedfica F de la senal de audio, k es un mdice que indica una lmea espectral espedfica SL1-32, MDCTkj es el valor de la transformada del coseno discreta modificada CT en la lmea espectral k-esima de la trama i-esima, MDSTkj es el valor de la transformada del seno discreta modificada ST en la lmea espectral k-esima de la trama i-esima, y Pkj es el valor de energfa PS5-32 de la lmea espectral k-esima de la trama i-esima. La formula anterior permite el calculo de los valores de energfa PS5-32 de un modo facil.
De acuerdo con un modo de realizacion preferido de la invencion el codificador de audio 1 comprende un dispositivo de calculo de una senal de espectro 10 configurado para producir la senal del espectro SPS, en el que el dispositivo de calculo de la senal del espectro 10 comprende un dispositivo de ajuste de amplitud 11 configurado para establecer amplitudes de las lmeas espectrales SL1-32 de la senal del espectro SPS de tal manera que se compensa una perdida de energfa debido a la modificacion de la zona muerta DZ. Por medio de estas caractensticas la cuantificacion puede realizarse en un modo que conserva la energfa.
De acuerdo con un modo de realizacion preferido de la invencion el dispositivo de ajuste de amplitud 11 esta configurado para establecer las amplitudes de la senal del espectro SPS dependiendo de una modificacion de la zona muerta DZ en la respectiva lmea espectral SL1-32. Por ejemplo las lmeas espectrales SL1-32, para las que la zona muerta DZ esta ampliada, pueden amplificarse ligeramente para este fin.
De acuerdo con un modo de realizacion preferido de la invencion el dispositivo de calculo de la senal del espectro 10 comprende un dispositivo de normalizacion 12. Por esta caractenstica la siguiente etapa de cuantificacion puede realizarse de un modo facil.
De acuerdo con un modo de realizacion preferido de la invencion la transformada del coseno discreta modificada CT a partir de la trama F de la senal de audio AS calculada por el dispositivo de calculo de la transformada del coseno discreta modificada 8 se alimenta al dispositivo de calculo de la senal del espectro 10. Por esta caractenstica la transformada del coseno discreta modificada CT se usa para el fin de adaptacion de la cuantificacion y para el fin de calcular la senal codificada ES.
La Figura 1 representa el flujo de datos e informacion de control en el codificador adaptativo inventivo 1. Debe reiterarse que las regiones espectrales no tonales por encima de una cierta frecuencia SF tenderan a cuantificarse a cero en forma bastante extensiva a bajas tasas de bits. Esto, sin embargo, tiene como finalidad: insercion de ruido aplicada sobre rangos cero en el decodificador reconstruiran suficientemente los espectros similares a ruido, y la cuantificacion cero ahorrara bits, que pueden usarse para cuantificar rangos de frecuencia baja de forma mas precisa.
La Figura 2 ilustra el principio de funcionamiento de un codificador de acuerdo con la invencion. En este documento, la zona muerta DZ de un codificador de audio 1 de acuerdo con la invencion, el espectro de energfa PS con sus valores de energfa PS5-32 de una trama F de una senal de audio AS, los valores indicativos de tonalidad TI5-32 y las lmeas espectrales SL1-32 del espectro SP se muestran en un sistema de coordenadas comun, en el que el eje x indica una frecuencia y el eje y indica amplitudes. Debe observarse que los indices de mapeo mayores que 1 no se muestran en la Figura 2 por simplificacion.
Por debajo de una frecuencia de inicio SF, que se ha calculado por el dispositivo de calculo de frecuencia de inicio 7, la zona muerta tiene un tamano fijo. En el ejemplo la lmea espectral SL1 finaliza fuera de la zona muerta de tal manera que se mapeara hasta el mdice uno I1, mientras que la lmea espectral SL7 finaliza dentro de la zona muerta DZ de tal manera que puede mapearse hasta el mdice 0 I0. Sin embargo, comenzando con la frecuencia de inicio SF y subiendo a frecuencias superiores, el tamano de la zona muerta DZ puede modificarse por el dispositivo de control
5
10
15
20
25
30
35
40
45
50
55
60
4. Para ese fin, los valores de ene^a PS5-32 se calculan como se describio con anterioridad. Adicionalmente, los valores indicativos de tonalidad TI5-32 se calculan a partir de los valores de energfa PS5-32.
En el area desde k=20 hasta k=23 el espectro de energfa PS tiene un pico que da como resultado valores indicadores de tonalidad bajos TI20-23 que indican una tonalidad alta. En las otras areas por encima de la frecuencia de inicio SF para el espectro de energfa PS son mas planas de tal manera que los valores indicativos de tonalidad TI 12-19 y TI24-32 son comparablemente superiores, que indica una tonalidad inferior en sus areas respectivas. Como resultado la zona muerta DZ se amplfa en el area desde k=12 a k=19 y en el area desde k=24 a k=32. Este aumento de la zona muerta DZ da como resultado que, por ejemplo, la lmea espectral SL12 y la lmea espectral SL25, que sin cuantificacion adaptativa a la tonalidad se habnan mapeado al mdice uno ahora se mapean al mdice cero. Esta cuantificacion a cero reduce la cantidad de los datos que se transmitiran al decodificador.
En una implementacion preferida de la invencion, la operacion del codificador se resume de la siguiente manera:
1. Durante la etapa de transformacion de tiempo a frecuencia, tanto una MDCT (parte del coseno) y una MDST (parte del seno) se calculan a partir de la senal de entrada en ventana para la trama dada.
2. La MDCT de la trama de entrada se usa para cuantificacion, codificacion y transmision. La MDST se utiliza adicionalmente para calcular un espectro de energfa por rango Pk = MDCTk2 + MDSTk2
3. Con Pk se calcula una medida de uniformidad espectral o tonalidad por banda de codificacion o preferentemente por rango. Varios metodos para lograr esto se documentan en la bibliograffa [1, 2, 3]. Preferentemente, se emplea una version de baja complejidad con solo algunas operaciones por rango. En el presente caso, se realiza una comparacion entre Pk y la suma de su Pk-7...k+7 circundantes y se potencia con una histeresis similar al rastreador de nacimiento/muerte descrito en [3]. Ademas, los rangos por debajo de una cierta frecuencia dependiente de la tasa de bits se consideran siempre tonales.
4. Como una etapa opcional, la medida de tonalidad o uniformidad puede utilizarse para realizar una leve amplificacion del espectro antes de la cuantificacion para compensar la perdida de energfa debido a una zona muerta de cuantificador grande. Con mayor precision, los rangos para los cuales se aplica una zona muerta grande del cuantificador se amplifican un bit, mientras que los rangos para los cuales se usa una zona muerta normal o cerca de lo normal (es decir una que tiende a conservar la energfa) no se modifican.
5. La medida de tonalidad o uniformidad de la etapa 3 ahora controla la eleccion de la zona muerta usada para cuantificar cada rango de frecuencia. Los rangos determinados como aquellos que tienen una alta tonalidad, lo que significa varios valores de Pk-7...k+7 / Pk, se cuantifican con una zona muerta por defecto (es decir escasamente conservadora de energfa), y los rangos con baja tonalidad se cuantifican con una nueva zona muerta ampliada. Un rango de baja tonalidad de este modo tiende a cuantificarse a cero con mayor frecuencia que un rango de alta tonalidad. Opcionalmente, el tamano de una zona muerta del rango puede definirse como una funcion continua de tonalidad de rangos, con un rango entre el tamano de la zona muerte por defecto (la mas pequena) y un tamano de zona muerta maximo.
Aunque algunos aspectos se han descrito en el contexto de un aparato, es claro que estos aspectos tambien representan una descripcion del metodo correspondiente, donde un bloque o dispositivo corresponde a una etapa del metodo o una caractenstica de una etapa del metodo. De manera analoga, los aspectos descritos en el contexto de una etapa del metodo tambien representan una descripcion de un bloque correspondiente o elemento o caractenstica de un aparato correspondiente. Algunas o la totalidad de las etapas del metodo pueden ejecutarse por (o con el uso de) un aparato de hardware, como por ejemplo, un microprocesador, una computadora programable o un circuito electronico. En algunas formas de realizacion, alguna o la totalidad de las etapas del metodo mas importantes pueden ejecutarse mediante un aparato de este tipo.
Dependiendo de ciertos requerimientos de implementacion, las formas de realizacion de la invencion pueden implementarse en hardware o en software. La implementacion puede realizarse con el uso de un medio de almacenamiento no transitorio tal como un medio de almacenamiento digital, por ejemplo un disco flexible, un DVD, un Blu-Ray, un CD, una ROM, una PROM y EPROM, una EEPROM o una memoria FLASH, que tienen senales de control electronicamente legibles almacenadas en ellos, que cooperan (o son capaces de cooperar) con un sistema informatico programable de tal manera que se realiza el respectivo metodo. Por lo tanto, el medio de almacenamiento digital puede ser legible por computadora.
Algunas de las formas de realizacion de acuerdo con la invencion comprende un soporte de datos que tiene senales de control electronicamente legibles, que son capaces de cooperar con un sistema informatico programable, de tal manera que se realiza uno de los metodos descritos en el presente documento.
En general, las formas de realizacion de la presente invencion pueden implementarse como un producto de
5
10
15
20
25
30
35
40
45
50
55
60
programa informatico con un codigo de programa, siendo el codigo de programa operativo para realizar uno de los metodos cuando el producto del programa informatico se ejecuta en una computadora. El codigo de programa puede almacenarse, por ejemplo, en un soporte legible por maquina.
Otras formas de realizacion comprenden el programa informatico para realizar uno de los metodos descritos en el presente documento, almacenado en un soporte legible por maquina.
En otras palabras, una forma de realizacion del metodo inventivo es, por lo tanto, un programa informatico que tiene un codigo de programa para realizar uno de los metodos descritos en el presente documento, cuando el programa informatico se ejecuta en una computadora.
Una forma de realizacion adicional del metodo de la invencion es, por lo tanto, un soporte de datos (o un medio de almacenamiento digital, o un medio legible por computadora) que comprende, registrado en el mismo, el programa informatico para realizar uno de los metodos descritos en el presente documento. El soporte de datos, el medio de almacenamiento digital o el medio registrado son tfpicamente tangibles y/o no transitorios.
Una forma de realizacion adicional del metodo de la invencion es, por lo tanto, un flujo de datos o una secuencia de senales que representan el programa informatico para realizar uno de los metodos descritos en el presente documento. El flujo de datos o la secuencia de senales pueden configurarse, por ejemplo, para transferirse por medio de una conexion de comunicacion de datos, por ejemplo, a traves de internet.
Una forma de realizacion adicional comprende un medio de procesamiento, por ejemplo, un dispositivo logico programable o una computadora, configurado para, o adaptado para, realizar uno de los metodos descritos en el presente documento.
Una forma de realizacion adicional comprende una computadora que tiene instalada en la misma el programa informatico para realizar uno de los metodos descritos en el presente documento.
Una forma de realizacion adicional de acuerdo con la invencion comprende un aparato o un sistema configurado para transferir (por ejemplo, electronica u opticamente) un programa informatico para realizar uno de los metodos descritos en el presente documento a un receptor. El receptor puede ser, por ejemplo, una computadora, un dispositivo movil, un dispositivo de memoria o similar. El aparato o sistema puede comprender, por ejemplo, un servidor de archivos para transferir el programa informatico al receptor.
En algunas formas de realizacion, un dispositivo logico programable (por ejemplo, un campo de matrices de puertas programables) puede usarse para realizar algunas o todas las funcionalidades de los metodos que se describen en el presente documento. En algunas formas de realizacion, un campo de matrices de puertas programables puede cooperar con un microprocesador para realizar uno de los metodos descritos en el presente documento. En general, los metodos se realizan preferentemente mediante cualquier aparato de hardware.
Las formas de realizacion descritas con anterioridad son simplemente ilustrativas para los principios de la presente invencion. Se entendera que las modificaciones y variaciones de las disposiciones y los detalles descritos en el presente documento resultaran obvias para otros expertos en la materia. Se pretende, por lo tanto, que unicamente esten limitadas por el alcance de las reivindicaciones de la patente y no por los detalles espedficos presentados a modo de descripcion y explicacion de las formas de realizacion en este documento.
Signos de referencia:
1 codificador de audio
2 dispositivo de alineacion de tramas
3 cuantificador
4 dispositivo de control
5 dispositivo de calculo de la tonalidad
6 dispositivo de calculo del espectro de energfa
7 dispositivo de calculo de frecuencia de inicio
8 dispositivo de calculo de transformada de coseno discreta modificada
9 dispositivo de calculo de transformada de seno discreta modificada
10 dispositivo de calculo de la senal de espectro
11 dispositivo de ajuste de amplitud
12 dispositivo de normalizacion
AS senal de audio
ES senal codificada
F trama
5
10
15
20
25
SL1-32
lmea espectral
SPS
serial de espectro
I
mdice
DZ
zona muerta
TI5-32
valor indicativo de tonalidad
PS
espectro de energfa
PS5-32
valor de energfa
SF
frecuencia de inicio
CT
transformada del coseno discreta modificada
ST
transformada del seno discreta modificada
Referencias:
[1] L. Daudet, “Sparse and Structured Decomposition of Signals with the Molecular Matching Pursuit,” IEEE Trans. on Audio, Speech, and Lang. Processing, Vol. 14, N .° 5, septiembre de 2006.
[2] F. Keiler, “Survey on Extraction of Sinusoids in Stationary Sounds,” in Proc. DAFX, 2002.
[3] R.J. McAulay y T.F. Quatieri, “Speech Analysis/Synthes based on a Sinusoidal Representation,” IEEE Trans. Acoustics, Speech, and Sig. Processing, Vol. 34, No. 4, agosto de 1986.
[4] M. Neuendorf et al., “MPEG Unified Speech and Audio Coding - The ISO/MPEG Standard for High-Efficiency Audio Coding de All Content Types,” in Proc. 132nd Convention de the AES, Budapest, Hungna, abril de 2012. Tambien aparece en el diario de la AES, 2013.
[5] M. Oger et al., “Model-Based Deadzone Optimization for Stack-Run Audio Coding con Uniform Scalar Cuantification,” in Proc. ICASSP 2008, Las Vegas, Estados Unidos, abril de 2008.
[6] M. Schug, documento EP2122615, “Apparatus and method for coding an information signal”, 2007.

Claims (17)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    REIVINDICACIONES
    1. Codificador de audio para codificar una senal de audio (AS) para producir a partir de la misma una senal codificada (ES), comprendiendo el codificador de audio (1):
    un dispositivo de alineacion de tramas (2) configurado para extraer tramas (F) de la senal de audio (AS); un cuantificador (3) configurado para mapear lmeas espectrales (SL1-32) de una senal de espectro (SPS) derivada desde la trama (F) de la senal de audio (AS) a los indices de cuantificacion (Io, I1), en el que el cuantificador (3) tiene una zona muerta (DZ), en la que se mapean las lmeas espectrales (SL1-32) hasta el mdice de cuantificacion cero (Io); y
    un dispositivo de control (4) configurado para modificar la zona muerta (DZ);
    en el que el dispositivo de control (4) comprende un dispositivo de calculo de la tonalidad (5) configurado para calcular al menos un valor indicativo de tonalidad (TI5-32) para al menos una lmea espectral (SL1-32) o para al menos un grupo de lmeas espectrales (SL1-32), en el que el dispositivo de control (4) esta configurado para modificar la zona muerta (DZ) para la al menos una lmea espectral (SL1-32) o el al menos un grupo de lmeas espectrales (SL1-32) dependiendo del respectivo valor indicativo de tonalidad (TI5-32).
  2. 2. Codificador de audio de acuerdo con la reivindicacion anterior, en el que el dispositivo de control (4) esta configurado para modificar la zona muerta (DZ) de tal manera que la zona muerta (DZ) en una de las lmeas espectrales (SL1-32) es mas grande que la zona muerta (DZ) que esta en una de las lmeas espectrales (SL1-32) que tiene una mayor tonalidad o de tal manera que la zona muerta (DZ) en uno de los grupos de lmeas espectrales (SL1- 32) es mas grande que la zona muerta (DZ) que esta en uno de los grupos de lmeas espectrales (SL1-32) que tiene una mayor tonalidad.
  3. 3. Codificador de audio de acuerdo con una de las reivindicaciones anteriores, en el que el dispositivo de control (4) comprende un dispositivo de calculo del espectro de energfa (6) configurado para calcular un espectro de energfa (PS) de la trama (F) de la senal de audio (AS), en el que el espectro de energfa (PS) comprende valores de energfa (PS5-32) para las lmeas espectrales (SL1-32) o grupos de lmeas espectrales (SL1-32), en el que el dispositivo de calculo de la tonalidad (4) esta configurado para calcular el al menos un valor indicativo de tonalidad (T5-32) dependiendo del espectro de energfa (PS).
  4. 4. Codificador de audio de acuerdo con la reivindicacion anterior, en el que el valor indicativo de la tonalidad (TI5-32) para una de las lmeas espectrales (SL1-32) se basa en una comparacion del valor de energfa (PS5-32) para la respectiva lmea espectral (SL1-32) y la suma de un numero predefinido de sus valores circundantes de energfa (P5-32) del espectro de energfa (PS), o en el que el valor indicativo de la tonalidad (TI5-32) para uno de los grupos de las lmeas espectrales (SL1-32) se basa en una comparacion del valor de energfa (PS5-32) para el respectivo grupo de lmeas espectrales (SL1-32) y la suma de un numero predefinido de sus valores circundantes de energfa (PS5-32) del espectro de energfa (PS).
  5. 5. Codificador de audio de acuerdo con una de las reivindicaciones anteriores, en el que el valor indicativo de la tonalidad (TI5-32) para una de las lmeas espectrales (SL1-32) se basa en el valor indicativo de la tonalidad (TI5-32) de la lmea espectral de una trama anterior (F) de la senal de audio (AS), o en el que el valor indicativo de la tonalidad (TI5- 32) para uno de los grupos de las lmeas espectrales (SL1-32) se basa en el valor indicativo de la tonalidad (TI5-32) del grupo de lmeas espectrales (SL1-32) para una trama anterior (F) de la senal de audio (AS).
  6. 6. Codificador de audio de acuerdo con una de las reivindicaciones 3 a 5, en el que el valor indicativo de la tonalidad (TI5 -32) se calcula por una formula
    T _ ffPk-U*.........'Fic-i,t+py.+i.i + '" ■'pk+?.i P
    k i ~ - ~.........Pk.i 1 Pki-i ........................................... ’ ’ ’
    en la que i es un mdice que indica una trama espedfica (F) de la senal de audio (AS), k es un mdice que indica una lmea espectral espedfica, Tkj es el valor indicativo de la tonalidad (TI5-32) de la lmea espectral k-esima de la trama i- esima (F), Pkj es el valor de energfa (PS5-32) de la lmea espectral k-esima de la trama i-esima (F), o en el que el valor indicativo de la tonalidad (TI5-32) se calcula por una formula
    imagen1
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    en la que i es un mdice que indica una trama espedfica (F) de la senal de audio (AS), m es un mdice que indica un grupo espedfico de lmeas espectrales (SL1-32), Pmi es el valor de energfa del grupo m-esimo de lmeas espectrales (SL1 -32) de la trama i-esima.
  7. 7. Codificador de audio de acuerdo con una de las reivindicaciones anteriores, en el que el codificador de audio (1) comprende un dispositivo de calculo de frecuencia de inicio (7) configurado para calcular una frecuencia de inicio (SF) para modificar la zona muerta (DZ), en el que la zona muerta (DZ) solo esta modificada para las lmeas espectrales (SL) que representan una frecuencia mayor que o igual a la frecuencia de inicio (SF).
  8. 8. Codificador de audio de acuerdo con la reivindicacion anterior, en el que el dispositivo de calculo de la frecuencia de inicio (7) esta configurado para calcular la frecuencia de inicio (SF) basandose en una tasa de muestreo de la senal de audio (AS) y/o basandose en una tasa de bits maxima prevista para un flujo de bits producido a partir de la senal codificada (ES).
  9. 9. Codificador de audio de acuerdo con una de las reivindicaciones 3 a 8, en el que el codificador de audio (1) comprende un dispositivo de calculo de la transformada del coseno discreta modificada (8) configurado para calcular una transformada del coseno discreta modificada (CT) a partir de la trama (F) de la senal de audio (AS) y un dispositivo de calculo de la transformada del seno discreta modificada (9) configurado para calcular una transformada del seno discreta modificada (ST) a partir de la trama (F) de la senal de audio (AS), en el que el dispositivo de calculo del espectro de energfa (6) esta configurado para calcular el espectro de energfa (PS) basandose en la transformada del coseno discreta modificada (CT) y en la transformada del seno discreta modificada (ST).
  10. 10. Codificador de audio de acuerdo con una de las reivindicaciones 3 a 9, en el que el dispositivo de calculo del espectro de energfa (6) esta configurado para calcular los valores de energfa (PS5-32) de acuerdo con una formula Pkj = (MDCTr,)2 + (MDSTkj)2, en la que i es un mdice que indica una trama espedfica de la senal de audio, k es un mdice que indica una lmea espectral espedfica, MDCTk,i es el valor de la transformada del coseno discreta modificada (CT) en la lmea espectral k-esima de la trama i-esima, MDSTkj es el valor de la transformada del seno discreta modificada (ST) en la lmea espectral k-esima de la trama i-esima, y Pkj es el valor de energfa (PS5-32) de la lmea espectral k-esima de la trama i-esima.
  11. 11. Codificador de audio de acuerdo con una de las reivindicaciones anteriores, en el que el codificador de audio (1) comprende un dispositivo de calculo de una senal de espectro (10) configurado para producir la senal del espectro (SPS), en el que el dispositivo de calculo de la senal del espectro (10) comprende un dispositivo de ajuste de amplitud (11) configurado para establecer amplitudes de las lmeas espectrales (SL1-32) de la senal del espectro (SPS) de tal manera que se compensa una perdida de energfa debido a la modificacion de la zona muerta (DZ).
  12. 12. Codificador de audio de acuerdo con la reivindicacion anterior, en el que el dispositivo de ajuste de amplitud (11) esta configurado para establecer las amplitudes de la senal del espectro (SPS) dependiendo de una modificacion de la zona muerta (DZ) en la respectiva lmea espectral.
  13. 13. Codificador de audio de acuerdo con la reivindicacion 11 o 12, en el que el dispositivo de calculo de la senal del espectro (10) comprende un dispositivo de normalizacion (12).
  14. 14. Codificador de audio de acuerdo con una de las reivindicaciones 11 a 13, en el que la transformada del coseno discreta modificada (CT) a partir de la trama (F) de la senal de audio (AS) calculada por el dispositivo de calculo de la transformada del coseno discreta modificada (8) se alimenta al dispositivo de calculo de la senal del espectro (10).
  15. 15. Un sistema que comprende un codificador (1) y un decodificador, en el que el codificador (1) esta disenado de acuerdo con una de las reivindicaciones 1 a 14.
  16. 16. Metodo para codificar una senal de audio (AS) para producir a partir de la misma una senal codificada (ES), comprendiendo el metodo las etapas:
    extraer tramas (F) de la senal de audio (AS);
    mapear las lmeas espectrales (SL1-32) de una senal de espectro (SPS) derivada desde la trama (F) de la senal de audio (AS) a los indices de cuantificacion (I0, I1), en el que se usa una zona muerta (DZ), en la que las lmeas espectrales de entrada (SL1-32) se mapean hasta el mdice de cuantificacion cero (I0); y modificar la zona muerta (DZ);
    en el que se calcula al menos un valor indicativo de tonalidad (TI5-32) para al menos una lmea espectral o para al menos un grupo de lmeas espectrales (SL1-32),
    en el que se modifica la zona muerta (DZ) para la al menos una lmea espectral o el al menos un grupo de lmeas espectrales (SL1-32) dependiendo del respectivo valor indicativo de tonalidad (TI5-32).
  17. 17. Producto de programa informatico para realizar, cuando se ejecuta en una computadora o un procesador, el 5 metodo de la reivindicacion 16.
ES14701558.0T 2013-01-29 2014-01-28 Cuantificación de señales de audio adaptativas por tonalidad de baja complejidad Active ES2613651T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361758191P 2013-01-29 2013-01-29
US201361758191P 2013-01-29
PCT/EP2014/051624 WO2014118171A1 (en) 2013-01-29 2014-01-28 Low-complexity tonality-adaptive audio signal quantization

Publications (1)

Publication Number Publication Date
ES2613651T3 true ES2613651T3 (es) 2017-05-25

Family

ID=50023575

Family Applications (1)

Application Number Title Priority Date Filing Date
ES14701558.0T Active ES2613651T3 (es) 2013-01-29 2014-01-28 Cuantificación de señales de audio adaptativas por tonalidad de baja complejidad

Country Status (20)

Country Link
US (3) US10468043B2 (es)
EP (1) EP2939235B1 (es)
JP (3) JP6334564B2 (es)
KR (1) KR101757341B1 (es)
CN (2) CN105103226B (es)
AR (1) AR095087A1 (es)
AU (1) AU2014211539B2 (es)
BR (1) BR112015018050B1 (es)
CA (1) CA2898789C (es)
ES (1) ES2613651T3 (es)
HK (1) HK1216263A1 (es)
MX (1) MX346732B (es)
MY (1) MY172848A (es)
PL (1) PL2939235T3 (es)
PT (1) PT2939235T (es)
RU (1) RU2621003C2 (es)
SG (1) SG11201505922XA (es)
TW (1) TWI524331B (es)
WO (1) WO2014118171A1 (es)
ZA (1) ZA201506319B (es)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112015018050B1 (pt) 2013-01-29 2021-02-23 Fraunhofer-Gesellschaft zur Förderung der Angewandten ForschungE.V. Quantização de sinal de áudio de tonalidade adaptativa de baixacomplexidade
EP3396670B1 (en) * 2017-04-28 2020-11-25 Nxp B.V. Speech signal processing
CN113539281A (zh) * 2020-04-21 2021-10-22 华为技术有限公司 音频信号编码方法和装置
US11348594B2 (en) * 2020-06-11 2022-05-31 Qualcomm Incorporated Stream conformant bit error resilience

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2841765B2 (ja) * 1990-07-13 1998-12-24 日本電気株式会社 適応ビット割当て方法及び装置
TW224553B (en) * 1993-03-01 1994-06-01 Sony Co Ltd Method and apparatus for inverse discrete consine transform and coding/decoding of moving picture
KR100330290B1 (ko) 1993-11-04 2002-08-27 소니 가부시끼 가이샤 신호부호화장치,신호복호화장치,및신호부호화방법
US6167093A (en) * 1994-08-16 2000-12-26 Sony Corporation Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission
DE19505435C1 (de) 1995-02-17 1995-12-07 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Bestimmen der Tonalität eines Audiosignals
JP3308764B2 (ja) * 1995-05-31 2002-07-29 日本電気株式会社 音声符号化装置
DE19614108C1 (de) * 1996-04-10 1997-10-23 Fraunhofer Ges Forschung Anordnung zur Vermessung der Koordinaten eines an einem Objekt angebrachten Retroreflektors
US5924064A (en) * 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns
US6301304B1 (en) * 1998-06-17 2001-10-09 Lsi Logic Corporation Architecture and method for inverse quantization of discrete cosine transform coefficients in MPEG decoders
US6704705B1 (en) * 1998-09-04 2004-03-09 Nortel Networks Limited Perceptual audio coding
DE10134471C2 (de) * 2001-02-28 2003-05-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7280700B2 (en) 2002-07-05 2007-10-09 Microsoft Corporation Optimization techniques for data compression
US8090577B2 (en) * 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP3881943B2 (ja) 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
US7318027B2 (en) * 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
US7333930B2 (en) 2003-03-14 2008-02-19 Agere Systems Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
US7738554B2 (en) * 2003-07-18 2010-06-15 Microsoft Corporation DC coefficient signaling at small quantization step sizes
JP4168976B2 (ja) * 2004-05-28 2008-10-22 ソニー株式会社 オーディオ信号符号化装置及び方法
FR2882458A1 (fr) * 2005-02-18 2006-08-25 France Telecom Procede de mesure de la gene due au bruit dans un signal audio
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US8059721B2 (en) * 2006-04-07 2011-11-15 Microsoft Corporation Estimating sample-domain distortion in the transform domain with rounding compensation
US7995649B2 (en) * 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
US20080049950A1 (en) * 2006-08-22 2008-02-28 Poletti Mark A Nonlinear Processor for Audio Signals
WO2008046492A1 (en) 2006-10-20 2008-04-24 Dolby Sweden Ab Apparatus and method for encoding an information signal
JP5065687B2 (ja) 2007-01-09 2012-11-07 株式会社東芝 オーディオデータ処理装置及び端末装置
US8498335B2 (en) * 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
ATE518224T1 (de) * 2008-01-04 2011-08-15 Dolby Int Ab Audiokodierer und -dekodierer
JP5262171B2 (ja) 2008-02-19 2013-08-14 富士通株式会社 符号化装置、符号化方法および符号化プログラム
WO2010001020A2 (fr) * 2008-06-06 2010-01-07 France Telecom Codage/decodage par plans de bits, perfectionne
PL3246918T3 (pl) * 2008-07-11 2023-11-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio, sposób dekodowania sygnału audio oraz program komputerowy
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
EP2430836B1 (en) * 2009-05-16 2016-08-17 Thomson Licensing Methods and apparatus for improved quantization rounding offset adjustment for video encoding
BR112012025878B1 (pt) * 2010-04-09 2021-01-05 Dolby International Ab sistema decodificador, sistema codificador, método de decodificação e método de codificação.
MX354812B (es) 2011-04-21 2018-03-22 Samsung Electronics Co Ltd Método para cuantificar coeficientes de codificación predictiva lineal, método de codificación de sonido, método para decuantificar coeficientes de codificación predictiva lineal, método de decodificación de sonido y medio de grabación.
TWI473078B (zh) * 2011-08-26 2015-02-11 Univ Nat Central 音訊處理方法以及裝置
US8885706B2 (en) * 2011-09-16 2014-11-11 Google Inc. Apparatus and methodology for a video codec system with noise reduction capability
BR112015018050B1 (pt) 2013-01-29 2021-02-23 Fraunhofer-Gesellschaft zur Förderung der Angewandten ForschungE.V. Quantização de sinal de áudio de tonalidade adaptativa de baixacomplexidade
EP3483879A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation

Also Published As

Publication number Publication date
CA2898789C (en) 2017-12-05
AU2014211539A1 (en) 2015-09-17
CN105103226B (zh) 2019-04-16
TWI524331B (zh) 2016-03-01
KR101757341B1 (ko) 2017-07-14
HK1216263A1 (zh) 2016-10-28
ZA201506319B (en) 2016-07-27
JP6526091B2 (ja) 2019-06-05
BR112015018050B1 (pt) 2021-02-23
MX2015009753A (es) 2015-11-06
JP2016510426A (ja) 2016-04-07
US11694701B2 (en) 2023-07-04
TW201440039A (zh) 2014-10-16
US10468043B2 (en) 2019-11-05
CN105103226A (zh) 2015-11-25
JP6334564B2 (ja) 2018-05-30
RU2621003C2 (ru) 2017-05-30
MX346732B (es) 2017-03-30
SG11201505922XA (en) 2015-08-28
US20210366499A1 (en) 2021-11-25
PL2939235T3 (pl) 2017-04-28
AU2014211539B2 (en) 2017-04-20
BR112015018050A2 (pt) 2017-07-18
US11094332B2 (en) 2021-08-17
KR20150118954A (ko) 2015-10-23
CA2898789A1 (en) 2014-08-07
PT2939235T (pt) 2017-02-07
JP6979048B2 (ja) 2021-12-08
JP2017151454A (ja) 2017-08-31
AR095087A1 (es) 2015-09-30
US20160027448A1 (en) 2016-01-28
RU2015136242A (ru) 2017-03-07
WO2014118171A1 (en) 2014-08-07
JP2019164367A (ja) 2019-09-26
EP2939235A1 (en) 2015-11-04
US20200090671A1 (en) 2020-03-19
CN110047499B (zh) 2023-08-29
MY172848A (en) 2019-12-12
EP2939235B1 (en) 2016-11-16
CN110047499A (zh) 2019-07-23

Similar Documents

Publication Publication Date Title
ES2604983T3 (es) Ajuste de nivel en el dominio del tiempo para decodificación o codificación de señales de audio
JP5245014B2 (ja) 領域に依存した算術符号化マッピングルールを使用した、オーディオ符号器、オーディオ復号器、オーディオ情報を符号化するための方法、オーディオ情報を復号するための方法、および、コンピュータプログラム
ES2532203T3 (es) Codificador de audio, decodificador de audio, método para codificar y decodificar una información de audio y programa de computación que obtiene un valor de contexto de sub-región basado en una norma de valores espectrales previamente decodificados
ES2660392T3 (es) Codificación de coeficientes espectrales de un espectro de una señal de audio
ES2635142T3 (es) Énfasis de baja frecuencia para la codificación basada en lpc en el dominio de la frecuencia
JP5456914B2 (ja) サンプリングレート依存型タイムワープコンター符号化を用いた、オーディオ信号復号器、オーディオ信号符号化器、方法、およびコンピュータプログラム
ES2693051T3 (es) Aparato y procedimiento para generar una señal mejorada mediante el uso de relleno de ruido independiente
ES2613651T3 (es) Cuantificación de señales de audio adaptativas por tonalidad de baja complejidad
ES2628127T3 (es) Cuantificador avanzado
ES2688021T3 (es) Adición de ruido de confort para modelar ruido de fondo a bajas tasas de bits
BR112015025009B1 (pt) Unidades de quantização e quantização inversa, codificador e decodificador, métodos para quantizar e dequantizar