ES2205238T3 - Procedimientos de codificacion y decodificacion de señales de audio, y codificador y decodificador de señales de audio. - Google Patents
Procedimientos de codificacion y decodificacion de señales de audio, y codificador y decodificador de señales de audio.Info
- Publication number
- ES2205238T3 ES2205238T3 ES97928529T ES97928529T ES2205238T3 ES 2205238 T3 ES2205238 T3 ES 2205238T3 ES 97928529 T ES97928529 T ES 97928529T ES 97928529 T ES97928529 T ES 97928529T ES 2205238 T3 ES2205238 T3 ES 2205238T3
- Authority
- ES
- Spain
- Prior art keywords
- quantification
- unit
- vector
- quantifier
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
PARA CODIFICAR UNA SEÑAL AUDIO, CON EL USO DE UN PROCEDIMIENTO DE CUANTIFICACION DE VECTORES, DISMINUYENDOSE ASI LA CANTIDAD DE DATOS, LA CODIFICACION LA REALIZA UNA UNIDAD CODIFICADORA (1). CUANDO SE REALIZA ESTA OPERACION, SE SELECCIONA UN CODIGO AUDIO QUE TIENE UNA DISTANCIA MINIMA ENTRE LAS DISTANCIAS AUDITIVAS ENTRE SUBVECTORES PRODUCIDO POR DIVISION DE UN VECTOR DE ENTRADA Y CODIGOS AUDIO EN UN LIBRO DE CODIGO DEL LADO DE TRANSMISION 29003. UNA PARTE CORRESPONDIENTE A UN ELEMENTO DE UN SUBVECTOR QUE TIENE UNA ELEVADA IMPORTANCIA AUDITIVA SE MANIPULA EN UNA UNIDAD DE SELECCION DE CODIGO AUDIO 2900102 MIENTRAS QUE NO TIENEN EN CUENTA LOS CODIGOS POSITIVOS Y NEGATIVOS QUE INDICAN SU INFORMACION EN CUANTO A FASE, Y SOMETIDOS A RECUPERACION COMPARATIVA CON RELACION A LOS CODIGOS AUDIO EN UN LIBRO DE CODIGO DEL LADO DE TRANSMISION 29003, Y LA INFORMACION SOBRE FASE CORRESPONDIENTE A UNA PARTE DEL ELEMENTO DEL SUBVECTOR, EXTRAIDA SEPARADAMENTE EN UNA UNIDAD DE EXTRACCION DE INFORMACION SOBREFASE 2900107, SE AÑADE AL RESULTADO OBTENIDO, SIENDO EL RESULTADO LA SALIDA EN FORMA DE INDICE DE CODIGO. DE ESE MODO, DISMINUYEN LA CANTIDAD DE CALCULOS EN LA RECUPERACION POR CODIGO DE LA CUANTIFICACION DE VECTORES Y EL NUMERO DE CODIGOS EN EL LIBRO DE CODIGOS, SIN QUE DISMINUYA POR ELLO LA CALIDAD DE UNA SEÑAL AUDIO, EN EL ASPECTO AUDITIVO, DURANTE LA OPERACION DE DECODIFICACION.
Description
Procedimiento de codificación y decodificación de
señales de audio, y codificador y decodificador de señales de
audio.
La presente invención se refiere a aparatos y
procedimientos de codificación, en los que una cantidad de una
característica, obtenida de una señal de audio, tal como una señal
de voz o una señal musical y, en especial, una señal obtenida
transformando una señal de audio del dominio del tiempo en una
señal de audio del dominio de la frecuencia, utilizando un
procedimiento como el de la transformada ortogonal, se codifica con
eficacia de tal forma que se expresa con menos cadenas codificadas
que la señal de audio original, así como a aparatos y
procedimientos de decodificación que tienen una estructura capaz de
decodificar una señal de audio de banda ancha y gran calidad,
utilizando todos o sólo una parte de los cadenas codificadas que
son señales codificadas.
Se han propuesto diversos procedimientos para
codificar y decodificar con eficacia las señales de audio. En
particular, en los últimos años, se ha propuesto el procedimiento
de audio MPEG para las señales de audio que tienen una banda de
frecuencias que sobrepasa los 20 kHz (por ejemplo, una señal
musical). En el procedimiento de codificación representado por el
procedimiento MPEG, una señal de audio del eje del tiempo se
transforma en datos del eje de la frecuencia, mediante una
transformada ortogonal (por ejemplo, una transformada de coseno) y,
en el eje de la frecuencia, se codifican los datos que tienen
importancia auditiva, mediante la característica de sensibilidad
auditiva de los seres humanos, mientras que los datos sin
importancia auditiva y los datos redundantes no se codifican. Para
expresar una señal de audio con una cantidad de datos
considerablemente inferior a la cantidad de datos de la señal
digital original, existe un procedimiento de codificación que
utiliza un método de cuantificación vectorial como el
TC-WVQ. Los procedimientos de audio MPEG y
TC-WVQ se describen en el estándar ISO/IEC
IS-11172-3 y en el documento de T.
Moriya y H. Suga: "An 8 Kbits transform coder for noisy
channels", Proc. ICASSP 89, pp. 196-199,
respectivamente. De ahora en adelante, la estructura del aparato de
codificación de audio convencional se describirá en relación con la
Figura 37. En la Figura 37, el número de referencia 1601 designa
una unidad FFT que transforma la frecuencia de una señal de
entrada, 1602 designa una unidad de cálculo de asignación de bits
adaptativa que codifica una banda concreta de la señal de entrada
con transformación de frecuencia, 1603 designa una unidad de
división de subbandas que divide la señal de entrada en una
pluralidad de bandas, 1604 designa una unidad de normalización de
factor de escala que normaliza los componentes de la pluralidad de
bandas y 1605 designa una unidad de cuantificación escalar.
A continuación, se describe el funcionamiento. La
señal de entrada entra en la unidad FFT 1601 y en la unidad de
división de subbandas 1603. En la unidad FFT 1601, la señal de
entrada se somete a transformación de frecuencia y entra en la
unidad de asignación de bits adaptativa 1602. En la unidad de
asignación de bits adaptativa 1602, se calcula qué cantidad de
datos debe darse a un componente de banda concreto, basándose en el
límite audible mínimo (definido de conformidad con la
característica auditiva de los seres humanos) y la característica
de enmascaramiento, y la asignación de las cantidades de datos a
cada una de las bandas se codifica como un índice.
Por otra parte, en la unidad de división de
subbandas 1603, la señal de entrada se divide en 32 bandas, por
ejemplo. En la unidad de normalización de factor de escala 1604, la
normalización para cada componente de banda obtenido en la unidad de
división de subbandas 1603 se lleva a cabo con un valor
representativo. El valor normalizado se cuantifica como un índice.
En la unidad de cuantificación escalar 1605, basándose en la
asignación de bits calculada por la unidad de cálculo de asignación
de bits adaptativa 1602, la salida de la unidad de normalización
del factor de escala 1604 se somete a cuantificación escalar y el
valor cuantificado se codifica como un índice.
Mientras tanto, se han propuesto diversos
procedimientos para codificar con eficacia una señal acústica. En
particular, en los últimos años, se codifican señales que tienen
una banda de frecuencias de alrededor de 20 kHz (por ejemplo,
señales musicales), mediante el procedimiento de audio MPEG u otro
similar. En los procedimientos representados por el procedimiento
MPEG, una señal de audio digital del eje del tiempo se transforma
en una señal del eje de la frecuencia mediante una transformada
ortogonal, y se dan cantidades de datos a los datos del eje de la
frecuencia (dándose prioridad al que tiene importancia auditiva)
teniendo en cuenta la característica de sensibilidad auditiva de los
seres humanos. Para expresar una señal que tiene una cantidad de
datos considerablemente inferior a la cantidad de datos de la señal
digital original, se emplea un procedimiento de codificación que
utiliza un método de cuantificación vectorial, como, por ejemplo, el
TCWVQ (Codificación de transformada para cuantificación vectorial
ponderada). El procedimiento de audio MPEG y TCWVQ se describen en
el estándar ISO/IEC IS-11172-3 y en
el documento de T. Moriya y H. Suga: "An 8 Kbits transform coder
for noisy channels", Proc. ICASSP 89, pp.
196-199, respectivamente.
En el aparato de codificación de señales de audio
convencional construido del modo descrito anteriormente, se utiliza
de forma generalizada el procedimiento de audio MPEG, de tal forma
que la codificación se lleva a cabo con una cantidad de datos de
64000 bits/s para cada canal. Con una cantidad de datos inferior a
ésta, el ancho de banda de frecuencias reproducible y la calidad
subjetiva de la señal de audio decodificada a veces se degradan
considerablemente, debido al motivo descrito a continuación. Como en
el ejemplo mostrado en la Figura 37, los datos codificados se
dividen grosso modo en tres partes principales: asignación de bits,
valor representativo de banda y valor cuantificado. Entonces,
cuando la relación de compresión es alta, no se asigna una cantidad
de datos suficiente al valor cuantificado. Además, en el aparato de
codificación de señales de audio convencional, por lo general, el
codificador y el decodificador se construyen con cantidades iguales
de datos para codificar y datos para decodificar. Por ejemplo, en un
procedimiento en el que se codifica una cantidad de datos de 128000
bits/s, se decodifica una cantidad de datos de 128000 bits en el
decodificador.
No obstante, en los aparatos de codificación y
decodificación de señales de audio convencionales, la codificación
y la decodificación debe llevarse a cabo con una cantidad de datos
fija para obtener sonido de buena calidad y, por consiguiente, es
imposible obtener sonido de alta calidad con una relación de
compresión alta.
Grant Davidson y Allen Gersho dan a conocer, en
el artículo "Multiple-stage vector excitation
coding of speech waveforms", publicado en 1988 IEEE, p. 163 y
ss., procedimientos de codificación de formas de onda de voz. Según
esta propuesta, la voz se representa aplicando una secuencia de
vectores de excitación a un filtro de generación de voz LPC
variable en el tiempo, en la que cada vector se selecciona a partir
de un libro de códigos utilizando una medida de rendimiento basada
en la percepción. La propuesta consiste en calcular de forma
consecutiva el vector de voz de entrada en varias etapas VQ
dispuestas en cascada, siendo el vector de entrada de cada etapa el
vector de error de cuantificación de la etapa anterior.
La presente invención pretende resolver los
problemas mencionados anteriormente y tiene como objetivo
proporcionar aparatos de codificación y decodificación de señales
de audio, y procedimientos de codificación y decodificación de
señales de audio, en los que se obtiene una alta calidad y una
amplia banda de frecuencias de reproducción, aun cuando la
codificación y la decodificación se lleven a cabo con una cantidad
de datos pequeña, y en los que, además, la cantidad de datos en la
codificación y la decodificación puede ser variable, es decir, no
fija.
Asimismo, en los aparatos de codificación de
señales de audio convencionales, la cuantificación se lleva a cabo
generando un índice de código correspondiente a un código que
proporciona una distancia auditiva mínima entre cada código
contenido en un bloque de códigos y un vector de característica de
audio. No obstante, cuando el número de códigos contenidos en el
libro de códigos es grande, la cantidad de cálculos para recuperar
un código óptimo aumenta de forma significativa. Además, cuando la
cantidad de datos contenida en el libro de códigos es grande, se
requiere una gran cantidad de memoria para la construcción del
aparato de codificación mediante hardware, lo que resulta poco
rentable. Asimismo, en la parte de recepción, se requiere una
recuperación y una cantidad de memoria correspondiente a los índices
de código.
La presente invención pretende resolver los
problemas mencionados anteriormente y tiene como objetivo
proporcionar un aparato de codificación de señales de audio que
reduzca el número de recuperaciones de códigos y que cuantifique con
eficacia las señales de audio con un libro de códigos que tenga un
número de códigos inferior, y un aparato de decodificación de
señales de audio que pueda decodificar las señales de audio.
Un procedimiento de codificación de señales de
audio según la presente invención (reivindicación 1) es un
procedimiento para codificar una cantidad de datos mediante
cuantificación vectorial, utilizando un método de cuantificación de
varias etapas que comprende un primer método de cuantificación
vectorial para efectuar la cuantificación vectorial de una
secuencia de señales de característica de frecuencia que se obtiene
mediante la transformación de la frecuencia de la señal de audio de
entrada, y un segundo método de cuantificación vectorial para
efectuar la cuantificación vectorial del componente de error de
cuantificación del primer método de cuantificación vectorial; en el
que, basándose en el espectro de la señal de audio de entrada y la
característica de sensibilidad auditiva que muestra la capacidad
auditiva de los seres humanos, se selecciona uno de los bloques de
frecuencias del componente de error de cuantificación del primer
método de cuantificación vectorial que tiene gran importancia para
la cuantificación y, en el segundo método de cuantificación
vectorial, se cuantifica el componente de error de cuantificación
del primer método de cuantificación respecto del bloque de
frecuencias seleccionado.
Un procedimiento de codificación de señales de
audio según la presente invención (reivindicación 2) es un
procedimiento para codificar una cantidad de datos mediante
cuantificación vectorial, utilizando un método de cuantificación de
varias etapas que comprende un método de cuantificación vectorial
de primera etapa para efectuar la cuantificación vectorial de una
secuencia de señales característica de frecuencia que se obtiene
mediante la transformación de la frecuencia de la señal de audio de
entrada, y métodos de cuantificación vectorial de segunda etapa y
siguientes para efectuar la cuantificación vectorial del componente
de error de cuantificación del método de cuantificación vectorial de
la etapa anterior; en el que, entre las diversas etapas de los
métodos de cuantificación según el método de cuantificación de
varias etapas, por lo menos un método de cuantificación vectorial
lleva a cabo la cuantificación vectorial utilizando, como
coeficientes de ponderación para la cuantificación, coeficientes de
ponderación en frecuencia calculados basándose en el espectro de la
señal de audio de entrada y la característica de sensibilidad
auditiva que muestra la capacidad auditiva de los seres humanos; y
basándose en el espectro de la señal de audio de entrada y la
característica de sensibilidad auditiva que muestra la capacidad
auditiva de los seres humanos, se selecciona uno de los bloques de
frecuencias del componente de error del método de cuantificación
vectorial de la primera etapa que tiene gran importancia para la
cuantificación y, en el método de cuantificación vectorial de la
segunda etapa, se cuantifica el componente de error de
cuantificación del método de cuantificación de la primera etapa con
respecto al bloque de frecuencias seleccionado.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 3) comprende: una unidad
de transformación tiempo-frecuencia para
transformar una señal de audio de entrada en una señal del dominio
de la frecuencia; una unidad de cálculo de envolvente espectral
para calcular la envolvente espectral de la señal de audio de
entrada; una unidad de normalización para normalizar la señal del
dominio de la frecuencia obtenida en la unidad de transformación
tiempo-frecuencia con la envolvente espectral
obtenida en la unidad de cálculo de envolvente espectral y obtener,
de ese modo, una señal residual; una unidad de cálculo de
ponderación auditiva para calcular coeficientes de ponderación en
frecuencia, basándose en el espectro de la señal de audio de
entrada y la característica de sensibilidad auditiva que muestra la
capacidad auditiva de los seres humanos; y una unidad de
cuantificación de varias etapas que tiene diversas etapas de
unidades de cuantificación vectorial conectadas en columnas, que
recibe la señal residual normalizada y en la que por lo menos una
de las unidades de cuantificación vectorial lleva a cabo la
cuantificación utilizando los coeficientes de ponderación obtenidos
en la unidad de ponderación.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 4) es un aparato de
codificación de señales de audio según la reivindicación 3, en el
que una pluralidad de unidades de cuantificación de las diversas
etapas de la unidad de cuantificación de varias etapas lleva a cabo
la cuantificación utilizando los coeficientes de ponderación
obtenidos en la unidad de ponderación, y dicha unidad de cálculo de
ponderación auditiva calcula los coeficientes de ponderación
individuales que van a ser utilizados en las diversas etapas de las
unidades de cuantificación, respectivamente.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 5) es un aparato de
codificación de señales de audio según la reivindicación 4 en el
que dicha unidad de cuantificación de varias etapas comprende: una
unidad de cuantificación de primera etapa para cuantificar la señal
residual normalizada por la unidad de normalización, utilizando la
envolvente espectral obtenida en la unidad de cálculo de envolvente
espectral como coeficientes de ponderación en los respectivos
dominios de frecuencia; una unidad de cuantificación de segunda
etapa para cuantificar una señal de error de cuantificación de la
unidad de cuantificación de primera etapa, utilizando los
coeficientes de ponderación calculados basándose en la correlación
entre la envolvente espectral y la señal de error de cuantificación
de la unidad de cuantificación de la primera etapa, como
coeficientes de ponderación en los respectivos dominios de
frecuencia y una unidad de cuantificación de la tercera etapa para
cuantificar una señal de error de cuantificación de la unidad de
cuantificación de segunda etapa, utilizando como coeficientes de
ponderación en los respectivos dominios de frecuencia los
coeficientes de ponderación obtenidos ajustando los coeficientes de
ponderación calculados por la unidad de cálculo de ponderación
auditiva, según la señal de entrada transformada en una señal del
dominio de la frecuencia por la unidad de transformación
tiempo-frecuencia y la característica auditiva,
basándose en la envolvente espectral, la señal de error de
cuantificación de la unidad de cuantificación de segunda etapa y la
señal residual normalizada por la unidad de normalización.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 6) comprende una unidad
de transformación tiempo-frecuencia para transformar
una señal de audio de entrada en una señal del dominio de la
frecuencia; una unidad de cálculo de envolvente espectral para
calcular la envolvente espectral de la señal de audio de entrada;
una unidad de normalización para normalizar la señal de dominio de
la frecuencia obtenida en la unidad de transformación
tiempo-frecuencia, con la envolvente espectral
obtenida en la unidad de cálculo de envolvente espectral para
obtener, de ese modo, una señal residual; un primer cuantificador
de vectores para cuantificar la señal residual normalizada por la
unidad de normalización; medios de selección auditiva para
seleccionar uno de los bloques de frecuencias del componente de
error de cuantificación del primer cuantificador de vectores que
tiene gran importancia para la cuantificación, basándose en el
espectro de la señal de audio de entrada y la característica de
sensibilidad auditiva que muestra la capacidad auditiva de los seres
humanos y un segundo cuantificador para cuantificar el componente
de error de cuantificación del primer cuantificador de vectores con
respecto al bloque de frecuencias seleccionado por los medios de
selección auditiva.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 7) es un aparato de
codificación de señales de audio según la reivindicación 6, en el
que los medios de selección auditiva seleccionan un bloque de
frecuencias utilizando, como escala de importancia para cuantificar,
un valor obtenido multiplicando el componente de error de
cuantificación del primer cuantificador de vectores, la señal de
envolvente espectral obtenida en la unidad de cálculo de envolvente
espectral y la característica inversa de la característica de
límite audible mínimo.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 8) es un aparato de
codificación de señales de audio según la reivindicación 6, en el
que dichos medios de selección auditiva seleccionan un bloque de
frecuencias utilizando, como escala de importancia para cuantificar,
un valor obtenido multiplicando la señal de envolvente espectral
obtenida en la unidad de cálculo de envolvente espectral y la
característica inversa de la característica de límite audible
mínimo.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 9) es un aparato de
codificación de señales de audio según la reivindicación 6, en el
que dichos medios de selección auditiva seleccionan un bloque de
frecuencias utilizando, como escala de importancia para cuantificar,
un valor obtenido multiplicando el componente de error de
cuantificación del primer cuantificador de vectores, la señal de
envolvente espectral obtenida en la unidad de cálculo de envolvente
espectral y la característica inversa de la característica obtenida
sumando la característica de límite audible mínimo y la
característica de enmascaramiento calculada a partir de la señal de
entrada.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 10) es un aparato de
codificación de señales de audio según la reivindicación 6, en el
que dichos medios de selección auditiva seleccionan un bloque de
frecuencias utilizando, como escala de importancia para cuantificar,
un valor obtenido multiplicando el componente de error de
cuantificación del primer cuantificador de vectores, la señal de
envolvente espectral obtenida en la unidad de cálculo de envolvente
espectral y la característica inversa de la característica obtenida
sumando la característica de límite audible mínimo y la
característica de enmascaramiento que se calcula a partir de la
señal de entrada y se corrige de conformidad con la señal residual
normalizada por la unidad de normalización, la señal de envolvente
espectral obtenida en la unidad de cálculo de envolvente espectral
y la señal de error de cuantificación de la unidad de cuantificación
de primera etapa.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 11) es un aparato de
codificación de señales de audio para codificar una cantidad de
datos mediante cuantificación vectorial, utilizando medios de
cuantificación de varias etapas que comprenden un primer
cuantificador de vectores para efectuar la cuantificación vectorial
de una señal de característica de frecuencia obtenida mediante la
transformación de la frecuencia de una señal de audio de entrada, y
un segundo cuantificador de vectores para efectuar la
cuantificación vectorial del componente de error de cuantificación
del primer cuantificador de vectores, en el que dichos medios de
cuantificación de varias etapas dividen la secuencia de señales de
característica de frecuencia en cadenas de coeficientes
correspondientes a por lo menos dos bandas de frecuencias, y cada
uno de los cuantificadores de vectores lleva a cabo la
cuantificación, de forma independiente, utilizando una pluralidad
de cuantificadores de vectores divididos que se preparan
adecuadamente para las respectivas cadenas de coeficientes.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 12) es un aparato de
codificación de señales de audio según la reivindicación 11, que
comprende además medios de normalización para normalizar la
secuencia de señales de característica de frecuencia.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 13) es un aparato de
codificación de señales de audio según la reivindicación 11, en el
que dichos medios de cuantificación seleccionan de forma adecuada
una de las bandas de frecuencias de la secuencia de señales de
característica de frecuencia que se van a cuantificar que tiene una
suma aditiva de energía elevada del error de cuantificación, y a
continuación cuantifican la banda seleccionada.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 14) es un aparato de
codificación de señales de audio según la reivindicación 11, en el
que los medios de cuantificación seleccionan de forma adecuada una
de las bandas de frecuencias de la secuencia de señales de
característica de frecuencia que se van a cuantificar, basándose en
la característica de sensibilidad auditiva que muestra la capacidad
auditiva de los seres humanos, teniendo dicha banda de frecuencias
una suma aditiva de energía elevada del error de cuantificación,
que se pondera asignando valores altos a las bandas cuya
característica de sensibilidad auditiva tiene gran importancia, y a
continuación los medios de cuantificación cuantifican la banda
seleccionada.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 15) es un aparato de
codificación de señales de audio según la reivindicación 11, en el
que los medios de cuantificación tienen un cuantificador de vectores
que funciona como una unidad de cuantificación de banda completa
que cuantifica, por lo menos una vez, todas las bandas de
frecuencias de la secuencia de señales de característica de
frecuencia que se van a cuantificar.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 16) es un aparato de
codificación de señales de audio según la reivindicación 11, en el
que los medios de cuantificación se construyen de tal forma que el
cuantificador de vectores de primera etapa calcula el error de
cuantificación de la cuantificación vectorial utilizando un método
de cuantificación vectorial con un libro de códigos y, además, el
cuantificador de vectores de segunda etapa efectúa la cuantificación
vectorial del error de cuantificación calculado.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 17) es un aparato de
codificación de señales de audio según la reivindicación 16, en el
que, como método de cuantificación vectorial, se utilizan vectores
de código (todos o parte de los cuales están invertidos) para la
recuperación de códigos.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 18) es un aparato de
codificación de señales de audio según la reivindicación 16, que
comprende además medios de normalización para normalizar la
secuencia de señales de característica de frecuencia, en el que el
cálculo de las distancias utilizadas para la recuperación de un
código óptimo en la cuantificación vectorial se lleva a cabo
calculando las distancias mediante ponderaciones constituidas por
los componentes normalizados de la señal de entrada procesados en
la unidad de normalización y extrayendo el código que tiene una
distancia mínima.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 19) es un aparato de
codificación de señales de audio según la reivindicación 18, en el
que las distancias se calculan mediante ponderaciones constituidas
tanto por los componentes normalizados de la secuencia de señales de
característica de frecuencia procesadas por los medios de
normalización como por un valor que tiene en cuenta la
característica de sensibilidad auditiva que muestra la capacidad
auditiva de los seres humanos, y en el que se extrae el código que
tiene la mínima distancia.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 20) es un aparato de
codificación de señales de audio según la reivindicación 12, en el
que los medios de normalización tienen una unidad de normalización
de perfil de frecuencias que normaliza de forma aproximada el
perfil de la secuencia de señales de característica de
frecuencia.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 21) es un aparato de
codificación de señales de audio según la reivindicación 12, en el
que dichos medios de normalización tienen una unidad de
normalización de amplitud de banda que divide la secuencia de
señales de característica de frecuencia en una pluralidad de
componentes de bandas unitarias continuas, y normalizan la secuencia
de señales dividiendo cada banda unitaria con un solo valor.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 22) es un aparato de
codificación de señales de audio según la reivindicación 11, en el
que dichos medios de cuantificación incluyen un cuantificador de
vectores para cuantificar las respectivas cadenas de coeficientes de
la secuencia de señales de característica de frecuencia de forma
independiente mediante cuantificadores de vectores divididos, e
incluyen un cuantificador de vectores que funciona como una unidad
de cuantificación de banda completa que cuantifica, por lo menos una
vez, todas las bandas de frecuencia de la señal de entrada que se
va a cuantificar.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 23) es un aparato de
codificación de señales de audio según la reivindicación 22, en el
que dichos medios de cuantificación comprenden un primer
cuantificador de vectores que comprende un cuantificador de
vectores divididos de banda baja, un cuantificador de vectores
divididos de banda intermedia y un cuantificador de vectores
divididos de banda alta, un segundo cuantificador de vectores
conectado después del primer cuantificador, y un tercer
cuantificador de vectores conectado después del segundo
cuantificador; la secuencia de señales de característica de
frecuencia introducida en los medios de cuantificación se divide en
tres bandas, y la secuencia de señales de característica de
frecuencia del componente de banda baja de entre las tres bandas es
cuantificada por el cuantificador de vectores divididos de banda
baja, la secuencia de señales de característica de frecuencia del
componente de banda intermedia de entre las tres bandas es
cuantificada por el cuantificador de vectores divididos de banda
intermedia y la secuencia de señales de característica de
frecuencia del componente de banda alta de entre las tres bandas es
cuantificada por el cuantificador de vectores divididos de banda
alta, de forma independiente; el error de cuantificación con
respecto a la secuencia de señales de característica de frecuencia
se calcula en cada uno de los cuantificadores de vectores divididos
que constituyen el primer cuantificador de vectores y el error de
cuantificación se introduce en el subsiguiente segundo
cuantificador de vectores; el segundo cuantificador de vectores
efectúa la cuantificación para el ancho de banda que va a ser
cuantificado por el segundo cuantificador de vectores, calcula el
error de cuantificación con respecto a la entrada del segundo
cuantificador de vectores y lo proporciona al tercer cuantificador
de vectores; y el tercer cuantificador de vectores efectúa la
cuantificación para el ancho de banda que va a ser cuantificado por
el tercer cuantificador de vectores.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 24) es un aparato de
codificación de señales de audio según la reivindicación 23, que
comprende además una primera unidad de selección de banda de
cuantificación entre el primer cuantificador de vectores y el
segundo cuantificador de vectores, y una segunda unidad de
selección de banda de cuantificación entre el segundo cuantificador
de vectores y el tercer cuantificador de vectores; en el que la
salida del primer cuantificador de vectores se introduce en la
primera unidad de selección de banda de cuantificación, y se
selecciona la banda que va a ser cuantificada por el segundo
cuantificador de vectores en la primera unidad de selección de
banda de cuantificación; el segundo cuantificador de vectores lleva
a cabo la cuantificación para el ancho de banda que va a ser
cuantificado por el segundo cuantificador de vectores, con respecto
a los errores de cuantificación de los tres primeros
cuantificadores de error seleccionados por la primera unidad de
selección de banda de cuantificación, calcula el error de
cuantificación con respecto a la entrada del segundo cuantificador
de vectores y lo proporciona a la segunda unidad de selección de
banda de cuantificación; la segunda unidad de selección de banda de
cuantificación selecciona la banda que va a ser cuantificada por el
tercer cuantificador de vectores; y el tercer cuantificador de
vectores efectúa la cuantificación para la banda seleccionada por
la segunda unidad de selección de banda de cuantificación.
Un aparato de codificación de señales de audio
según la presente invención (reivindicación 25) es un aparato de
codificación de señales de audio según la reivindicación 23, en el
que, en vez del primer cuantificador de vectores, se construye el
segundo cuantificador de vectores o el tercer cuantificador de
vectores utilizando el cuantificador de vectores divididos de banda
baja, el cuantificador de vectores divididos de banda intermedia y
el cuantificador de vectores divididos de banda alta.
Un aparato de decodificación de señales de audio
según la presente invención (reivindicación 26) es un aparato de
decodificación de señales de audio que recibe como entrada los
códigos proporcionados por el aparato de codificación de señales de
audio definido en la reivindicación 11, decodifica estos códigos
para generar una señal correspondiente a la señal de audio de
entrada original y comprende: una unidad de cuantificación inversa
para efectuar la cuantificación inversa utilizando, por lo menos,
una parte de los códigos proporcionados por los medios de
cuantificación del aparato de codificación de señales de audio; y
una unidad de transformación de frecuencia inversa para transformar
una secuencia de señales de característica de frecuencia
proporcionada por la unidad de cuantificación inversa en una señal
correspondiente a la señal de audio de entrada original.
Un aparato de decodificación de señales de audio
según la presente invención (reivindicación 27) es un aparato de
decodificación de señales de audio que recibe como entrada los
códigos proporcionados por el aparato de codificación de señales de
audio según la reivindicación 12, decodifica estos códigos para
generar una señal correspondiente a la señal de audio de entrada
original y comprende; una unidad de cuantificación inversa para
reproducir una secuencia de señales de característica de frecuencia;
una unidad de normalización inversa para reproducir los componentes
normalizados basándose en los códigos proporcionados por el aparato
de codificación de señales de audio, utilizando la secuencia de
señales de característica de frecuencia proporcionada por la unidad
de cuantificación inversa y multiplicando la secuencia de señales de
característica de frecuencia y los componentes normalizados; y una
unidad de transformación de frecuencia inversa para recibir la
salida de la unidad de normalización inversa y transformar la
secuencia de señales de característica de frecuencia en una señal
correspondiente a la señal de audio original.
Un aparato de decodificación de señales de audio
según la presente invención (reivindicación 28) es un aparato de
decodificación de señales de audio que recibe como entrada los
códigos proporcionados por el aparato de codificación de señales de
audio según la reivindicación 22, decodifica estos códigos para
generar una señal correspondiente a la señal de audio original y
comprende: una unidad de cuantificación inversa que efectúa la
cuantificación inversa utilizando los códigos obtenidos, ya sea de
todos los cuantificadores de vectores que constituyen los medios de
cuantificación del aparato de codificación de señales de audio o
bien de algunos de ellos.
Un aparato de decodificación de señales de audio
según la presente invención (reivindicación 29) es un aparato de
decodificación de señales de audio según la reivindicación 28, en el
que la unidad de cuantificación inversa efectúa la cuantificación
inversa de los códigos cuantificados en una banda establecida
ejecutando, de forma alternada, la cuantificación inversa de los
códigos cuantificados en la siguiente etapa y la cuantificación
inversa de los códigos cuantificados en una banda diferente de la
establecida; cuando no hay ningún código cuantificado en la
siguiente etapa durante la cuantificación inversa, la unidad de
cuantificación inversa ejecuta de forma continuada la
cuantificación inversa de los códigos cuantificados en la banda
diferente; y cuando no hay ningún código cuantificado en la banda
diferente, la unidad de cuantificación inversa ejecuta de forma
continuada la cuantificación inversa de los códigos cuantificados en
la siguiente etapa.
Un aparato de decodificación de señales de audio
según la presente invención (reivindicación 30) es un aparato de
decodificación de señales de audio que recibe como entrada los
códigos proporcionados por el aparato de codificación de señales de
audio según la reivindicación 23, decodifica estos códigos para
generar una señal correspondiente a la señal de audio de entrada
original y comprende una unidad de cuantificación inversa que
efectúa la cuantificación inversa utilizando sólo los códigos
proporcionados por el cuantificador de vectores divididos de banda
baja que forma parte del primer cuantificador de vectores, aun
cuando todos o parte de los tres cuantificadores de vectores
divididos que constituyen el primer cuantificador de vectores del
aparato de codificación de señales de audio generen códigos.
Un aparato de decodificación de señales de audio
según la presente invención (reivindicación 31) es un aparato de
decodificación de señales de audio según la reivindicación 30, en el
que la unidad de cuantificación inversa efectúa la cuantificación
inversa utilizando códigos proporcionados por el segundo
cuantificador de vectores, además de los códigos proporcionados por
el cuantificador de vectores divididos de banda baja que forma
parte del primer cuantificador de vectores.
Un aparato de decodificación de señales de audio
según la presente invención (reivindicación 32) es un aparato de
decodificación de señales de audio según la reivindicación 31, en el
que la unidad de cuantificación inversa lleva a cabo la
cuantificación inversa utilizando códigos proporcionados por el
cuantificador de vectores divididos de banda intermedia, que forma
parte del primer cuantificador de vectores, además de los códigos
proporcionados por el cuantificador de vectores divididos de banda
baja, que forma parte del primer cuantificador de vectores, y los
códigos proporcionados por el segundo cuantificador de
vectores.
Un aparato de decodificación de señales de audio
según la presente invención (reivindicación 33) es un aparato de
decodificación de señales de audio según la reivindicación 32, en el
que la unidad de cuantificación inversa lleva a cabo la
cuantificación inversa utilizando los códigos proporcionados por el
tercer cuantificador de vectores, además de los códigos
proporcionados por el cuantificador de vectores divididos de banda
baja, que forma parte del primer cuantificador de vectores, los
códigos proporcionados por el segundo cuantificador de vectores y
los códigos proporcionados por el cuantificador de vectores
divididos de banda intermedia, que forma parte del primer
cuantificador de vectores.
Un aparato de decodificación de señales de audio
según la presente invención (reivindicación 34) es un aparato de
decodificación de señales de audio según la reivindicación 33, en el
que la unidad de cuantificación inversa efectúa la cuantificación
inversa utilizando códigos proporcionados por el cuantificador de
vectores divididos de banda alta, que forma parte del primer
cuantificador de vectores, además de los códigos proporcionados por
el cuantificador de vectores divididos de banda baja, que forma
parte del primer cuantificador de vectores, los códigos
proporcionados por el segundo cuantificador de vectores, los
códigos proporcionados por el cuantificador de vectores divididos
de banda intermedia, que forma parte del primer cuantificador de
vectores, y los códigos proporcionados por el tercer cuantificador
de vectores.
\newpage
La Figura 1 es un diagrama que ilustra toda la
estructura de los aparatos de codificación y decodificación de
señales de audio según una primera forma de realización de la
presente invención.
La Figura 2 es un diagrama de bloques que ilustra
un ejemplo de unidad de normalización, que forma parte del aparato
de codificación de señales de audio descrito anteriormente.
La Figura 3 es un diagrama de bloques que ilustra
un ejemplo de unidad de normalización de perfil de frecuencias, que
forma parte del aparato de codificación de señales de audio
descrito anteriormente.
La Figura 4 es un diagrama que ilustra la
estructura detallada de una unidad de cuantificación del aparato de
codificación.
La Figura 5 es un diagrama de bloques que ilustra
la estructura del aparato de codificación de señales de audio según
una segunda forma de realización de la presente invención.
La Figura 6 es un diagrama de bloques que ilustra
la estructura de un aparato de codificación de señales de audio
según una tercera forma de realización de la presente
invención.
La Figura 7 es un diagrama de bloques que ilustra
las estructuras detalladas de la unidad de cuantificación y la
unidad de selección auditiva de cada etapa del aparato de
codificación de señales de audio mostrado en la Figura 6.
La Figura 8 es un diagrama que ilustra la
operación de cuantificación del cuantificador de vectores.
La Figura 9 es un diagrama que muestra la señal
de error zi, la envolvente espectral I1 y la característica de
límite audible mínimo hi.
La Figura 10 es un diagrama de bloques que
ilustra las estructuras detalladas de otros ejemplos de cada unidad
de cuantificación y una unidad de selección auditiva incluidos en
el aparato de codificación de señales de audio mostrado en la Figura
6.
La Figura 11 es un diagrama de bloques que
ilustra las estructuras detalladas de otros ejemplos de cada unidad
de cuantificación y una unidad de selección auditiva incluidos en
el aparato de codificación de señales de audio mostrado en la Figura
6.
La Figura 12 es un diagrama de bloques que
ilustra las estructuras detalladas de otros ejemplos de cada unidad
de cuantificación y una unidad de selección auditiva incluidos en
el aparato de codificación de señales de audio mostrado en la Figura
6.
La Figura 13 es un diagrama que ilustra un
ejemplo de selección del bloque de frecuencias que tiene la
importancia más alta (longitud W).
La Figura 14 es un diagrama de bloques que
ilustra la estructura del aparato de codificación de señales de
audio según una cuarta forma de realización de la presente
invención.
La Figura 15 es un diagrama de bloques que
ilustra la estructura del aparato de codificación de señales de
audio según una quinta forma de realización de la presente
invención.
La Figura 16 es un diagrama de bloques que
ilustra la estructura del aparato de codificación de señales de
audio según una sexta forma de realización de la presente
invención.
La Figura 17 es un diagrama de bloques que
ilustra la estructura del aparato de codificación de señales de
audio según una séptima forma de realización de la presente
invención.
La Figura 18 es un diagrama de bloques que
ilustra la estructura del aparato de codificación de señales de
audio según una octava forma de realización de la presente
invención.
La Figura 19 es un diagrama que ilustra con
detalle la operación de cuantificación efectuada en cada unidad de
cuantificación incluida en el aparato de codificación 1 según
cualquiera de las formas de realización primera a octava.
La Figura 20 es un diagrama que ilustra el
aparato de decodificación de señales de audio según una novena
forma de realización de la presente invención.
La Figura 21 es un diagrama que ilustra el
aparato de decodificación de señales de audio según una décima
forma de realización de la presente invención.
\newpage
La Figura 22 es un diagrama que ilustra el
aparato de decodificación de señales de audio según una
decimoprimera forma de realización de la presente invención.
La Figura 23 es un diagrama que ilustra el
aparato de decodificación de señales de audio según una
decimosegunda forma de realización de la presente invención.
La Figura 24 es un diagrama que ilustra el
aparato de decodificación de señales de audio según una
decimotercera forma de realización de la presente invención.
La Figura 25 es un diagrama que ilustra el
aparato de decodificación de señales de audio según una
decimocuarta forma de realización de la presente invención.
La Figura 26 es un diagrama que ilustra el
funcionamiento detallado de la unidad de cuantificación inversa que
forma parte del aparato de decodificación de señales de audio.
La Figura 27 es un diagrama que ilustra el
funcionamiento detallado de la unidad de normalización inversa, que
forma parte del aparato de decodificación de señales de audio.
La Figura 28 es un diagrama que ilustra el
funcionamiento detallado de la unidad de normalización inversa de
perfil de frecuencias que forma parte del aparato de decodificación
de señales de audio.
Forma de realización
1
La Figura 1 es un diagrama que ilustra toda la
estructura de los aparatos de codificación y decodificación de
señales de audio según una primera forma de realización de la
presente invención. En la Figura 1, el número de referencia 1
designa el aparato de codificación y el 2 designa el aparato de
decodificación. En el aparato de codificación 1, el número de
referencia 101 designa una unidad de división de tramas que divide
la señal de entrada en un número establecido de tramas; 102 designa
una unidad de multiplicación de ventana que multiplica la señal de
entrada y una función de ventana en el eje del tiempo; 103 designa
una unidad MDCT que efectúa la transformada discreta del coseno
modificada para la conversión tiempo-frecuencia de
la señal del eje del tiempo en una señal del eje de la frecuencia;
104 designa una unidad de normalización que recibe tanto la señal
del eje del tiempo proporcionada por la unidad de división de tramas
101 como los coeficientes MDCT proporcionados por la unidad MDCT
103, y normaliza los coeficientes MDCT; y 105 designa una unidad de
cuantificación que recibe los coeficientes MDCT normalizados y los
cuantifica. Aunque en esta forma de realización se emplea la MDCT
para la transformación tiempo-frecuencia, también
puede emplearse la transformada discreta de Fourier (DFT).
En el aparato de decodificación 2, el número de
referencia 106 designa una unidad de cuantificación inversa que
recibe la señal proporcionada por el aparato de codificación 1 y la
somete a cuantificación inversa; 107 designa una unidad de
normalización inversa que somete a normalización inversa la salida
de la unidad de cuantificación inversa 106; 108 designa una unidad
MDCT inversa que efectúa la transformada discreta del coseno
modificada de la salida de la unidad de normalización inversa 107;
109 designa una unidad de multiplicación de ventana y 110 designa
una unidad de solapamiento de tramas.
A continuación, se describe el funcionamiento de
los aparatos de codificación y decodificación de señales de audio
construidos de la forma descrita anteriormente.
Se parte del supuesto de que la señal que entra
en el aparato de codificación 1 es una secuencia de señales
digitales que es continua temporalmente (por ejemplo, una señal
digital obtenida mediante cuantificación de 16 bits a una velocidad
de muestreo de 48 kHz). Esta señal de entrada se acumula en la
unidad de división de tramas 101 hasta que se alcanza el mismo
número establecido y se proporciona cuando el número de muestras
acumuladas llega a tener una longitud de trama definida. Aquí, la
longitud de trama de la unidad de división de tramas 101 es, por
ejemplo, cualquiera de las siguientes cantidades de muestras: 128,
256, 512, 1024, 2048 y 4096. En la unidad de división de tramas 101,
también es posible generar la señal con una longitud de trama que
varía según la característica de la señal de entrada. Además la
unidad de división de tramas 101 se construye para obtener una
salida para cada longitud de desplazamiento indicado. Por ejemplo,
en el caso en que la longitud de trama es de 4096 muestras, cuando
se fija una longitud de desplazamiento igual a la mitad de la
longitud de trama, la unidad de división de tramas 101 proporciona
las últimas 4096 muestras cada vez que la longitud de trama es de
2048 muestras. En efecto, aun cuando la longitud de trama o la
velocidad de muestreo sean variables, es posible tener una
estructura en la que la longitud de desplazamiento fijada sea la
mitad de la longitud de trama.
La salida de la unidad de división de tramas 101
se introduce en la unidad de multiplicación de ventana 102 y en la
unidad de normalización 104. En la unidad de multiplicación de
ventana 102, la señal de salida de la unidad de división de tramas
101 se multiplica por una función de ventana en el eje del tiempo y
el resultado se proporciona desde la unidad de multiplicación de
ventana 102. Esto se muestra, por ejemplo, en la fórmula (1)
en la que xi es la salida de la unidad de
división de tramas 101, hi es la función de ventana y hxi es la
salida de la unidad de multiplicación de ventana 102. Además, i es
el sufijo del tiempo. La función de ventana hi mostrada en la
fórmula (1) es un ejemplo y, en consecuencia, no está limitada a la
mostrada en la fórmula (1). La selección de la función de ventana
depende de la característica de la señal de entrada, la longitud de
trama de la unidad de división de tramas 101 y las formas de las
funciones de ventana de las tramas que se hallan temporalmente
antes y después de la trama que se procesa. Por ejemplo, si se
supone que la longitud de trama de la unidad de división de tramas
101 es N, como la característica de la señal introducida en la
unidad de multiplicación de ventana 102, se calcula la potencia de
señal media de las señales introducidas cada vez que se cumple N/4
y, cuando la potencia media varía de forma significativa, el
cálculo mostrado en la fórmula (1) se ejecuta con una longitud de
trama inferior a N. Además, es deseable seleccionar de forma
adecuada la función de ventana según la forma de la función de
ventana de la trama anterior y la forma de la función de ventana de
la trama posterior, para que la forma de la función de ventana de
la presente trama no quede
distorsionada.
A continuación, la salida de la unidad de
multiplicación de ventana 102 se introduce en la unidad MDCT 103,
en la que se ejecuta la transformada discreta del coseno modificada
y se generan coeficientes MDCT. La fórmula (2) representa una
fórmula general de la transformada discreta del coseno
modificada.
Si se supone que los coeficientes MDCT generados
por la unidad MDCT 103 se expresan mediante yk en la fórmula (2), la
salida de la unidad MDCT 103 muestra la característica de
frecuencia, y su linealidad corresponde a un componente de
frecuencia inferior cuando la variable k de yk se acerca a 0,
mientras que corresponde a un componente de frecuencia superior
cuando la variable k se acerca a N/2-1 desde 0. La
unidad de normalización 104 recibe la señal del eje del tiempo
proporcionada por la unidad de división de tramas 101 y los
coeficientes MDCT proporcionados por la unidad MDCT 103, y
normaliza los coeficientes MDCT mediante varios parámetros.
Normalizar los coeficientes MDCT consiste en suprimir las
variaciones de los valores de los coeficientes MDCT. Dichos valores
varían considerablemente entre el componente de banda baja y el
componente de banda alta. Por ejemplo, cuando el componente de
banda baja es considerablemente superior al componente de banda
alta, se selecciona un parámetro que tiene un valor alto en el
componente de banda baja y un valor bajo en el componente de banda
alta, y los coeficientes MDCT se dividen por este parámetro para
suprimir sus variaciones. En la unidad de normalización 104, se
codifican los índices que expresan los parámetros utilizados para
la normalización.
La unidad de cuantificación 105 recibe los
coeficientes MDCT normalizados por la unidad de normalización 104 y
cuantifica los coeficientes MDCT. La unidad de cuantificación 105
codifica los índices que expresan los parámetros utilizados para la
cuantificación.
Por otra parte, en el aparato de decodificación
2, la decodificación se lleva a cabo utilizando los índices de la
unidad de normalización 104 del aparato de codificación 1, y los
índices de la unidad de cuantificación 105. En la unidad de
cuantificación inversa 106, los coeficientes MDCT normalizados se
reproducen utilizando los índices de la unidad de cuantificación
105. En la unidad de cuantificación inversa 106, la reproducción de
los coeficientes MDCT puede llevarse a cabo utilizando todos o
algunos de los índices. Naturalmente, la salida de la unidad de
normalización 104 y la salida de la unidad de cuantificación
inversa 106 no son siempre idénticas a las salidas anteriores a la
cuantificación, debido a la presencia de errores en la
cuantificación llevada a cabo por la unidad de cuantificación
105.
En la unidad de normalización inversa 107, los
parámetros utilizados para la normalización en el aparato de
codificación 1 se restauran a partir de los índices proporcionados
por la unidad de normalización 104 del aparato de codificación 1, y
la salida de la unidad de cuantificación inversa 106 se multiplica
por los parámetros para restaurar los coeficientes MDCT. En la
unidad MDCT inversa 108, los coeficientes MDCT proporcionados por
la unidad de normalización inversa 107 se someten a MDCT inversa y,
de ese modo, la señal del dominio de la frecuencia se restaura como
una señal del dominio del tiempo. El cálculo de la MDCT inversa
viene representado, por ejemplo, por la fórmula (3)
en la que yyk son los coeficientes MDCT
restaurados en la unidad de normalización inversa 107, y
xx(k) son los coeficientes MDCT inversos que se obtienen de
la unidad MDCT inversa
108.
La unidad de multiplicación de ventana 109 lleva
a cabo la multiplicación de ventana utilizando la salida
xx(k) de la unidad MDCT inversa 108. La multiplicación de
ventana se lleva a cabo utilizando la misma ventana utilizada por la
unidad de multiplicación de ventana 102 del aparato de codificación
B1, y se lleva a cabo el procedimiento mostrado, por ejemplo, en la
fórmula (4)
en la que zi es la salida de la unidad de
multiplicación de ventana
109.
La unidad de solapamiento de tramas 110 reproduce
la señal de audio mediante la salida de la unidad de multiplicación
de ventana 109. Puesto que la salida de la unidad de multiplicación
de ventana 109 es una señal solapada temporalmente, la unidad de
solapamiento de tramas 110 proporciona la señal de salida del
aparato de decodificación B2 utilizando, por ejemplo, la fórmula
(5)
en la que zm(i) es la i-ésima señal de
salida z(i) de la unidad de multiplicación de ventana 109 de
la m-ésima trama de tiempo, zm-1(i) es la
i-ésima señal de salida de la unidad de multiplicación de ventana
109 de la (m-1)-ésima trama de tiempo, SHIFT es el
número de muestra correspondiente a la longitud del desplazamiento
del aparato de codificación y out(i) es la señal de salida
del aparato de decodificación 2 de la m-ésima trama de tiempo de la
unidad de solapamiento de tramas
110.
A continuación se describirá en detalle un
ejemplo de unidad de normalización 104 en relación con la Figura 2.
En la Figura 2, el número de referencia 201 designa una unidad de
normalización de perfil de frecuencias que recibe las salidas de la
unidad de división de tramas 101 y la unidad MDCT 103; y 202
designa una unidad de normalización de amplitud de banda que recibe
la salida de la unidad de normalización de perfil de frecuencias
201 y lleva a cabo la normalización con referencia a una tabla de
bandas 203.
A continuación, se describe el funcionamiento. La
unidad de normalización de perfil de frecuencias 201 calcula un
perfil de frecuencias, es decir, una forma aproximada de las
frecuencias, mediante los datos del eje del tiempo proporcionados
por la unidad de división de tramas 101, y divide por éste los
coeficientes MDCT obtenidos de la unidad MDCT 103. Los parámetros
utilizados para expresar el perfil de frecuencias se codifican como
índices. La unidad de normalización de amplitud de banda 202 recibe
la señal de salida de la unidad de normalización de perfil de
frecuencias 201, y efectúa la normalización de cada banda mostrada
en la tabla de bandas 203. Por ejemplo, suponiendo que los
coeficientes MDCT proporcionados por la unidad de normalización de
perfil de frecuencias 201 son dct(i) (i = 0 \sim 2047) y
la tabla de bandas 203 es, por ejemplo, la Tabla 1 mostrada, se
calcula el valor medio de la amplitud de cada banda utilizando, por
ejemplo, la fórmula (6).
en la que bjlow y bjhigh son el índice i de banda
más baja y el índice i de banda más alta, respectivamente, entre
los cuales se halla el dct(i) de la j-ésima banda mostrada
en la tabla de bandas 203. Además, p es la norma en el cálculo de la
distancia (que es deseable que sea 2) y avej es la media de la
amplitud de cada número de banda j. La unidad de normalización de
amplitud de banda 202 cuantifica avej para obtener qavej y
normalizarlo utilizando, por ejemplo, la fórmula
(7).
Para cuantificar avej, puede emplearse
cuantificación escalar o cuantificación vectorial mediante el libro
de códigos. La unidad de normalización de amplitud de banda 202
codifica los índices de los parámetros utilizados para expresar
qavej.
Aunque la unidad de normalización 104 del aparato
de codificación 1 se construye utilizando la unidad de
normalización de perfil de frecuencias 201 y la unidad de
normalización de amplitud de banda 202 como se muestra en la Figura
2, también puede construirse utilizando ya sea la unidad de
normalización de perfil de frecuencias 201 ó bien la unidad de
normalización de amplitud de banda 202. Además, cuando no hay
ninguna variación significativa entre el componente de banda baja y
el componente de banda alta de los coeficientes MDCT obtenidos de
la unidad MDCT 103, la salida de la unidad MDCT 103 puede
introducirse directamente en la unidad de cuantificación 105 sin
utilizar las unidades 201 y 202.
A continuación, se describirá en detalle la
unidad de normalización de perfil de frecuencias 201 mostrada en la
Figura 2, en relación con la Figura 3. En la Figura 3, el número de
referencia 301 designa una unidad de análisis de predicción lineal
que recibe la salida de la unidad de división de tramas 101 y
efectúa el análisis predictivo lineal; 302 designa una unidad de
cuantificación de perfil que cuantifica el coeficiente obtenido en
la unidad de análisis de predicción lineal 301 y 303 designa una
unidad de normalización de característica de envolvente que
normaliza los coeficientes MDCT mediante la envolvente
espectral.
A continuación, se describirá el funcionamiento
de la unidad de normalización de perfil de frecuencias 201. La
unidad de análisis de predicción lineal 301 recibe la señal de
audio del eje del tiempo desde la unidad de división de tramas 101,
lleva a cabo la codificación predictiva lineal (LPC) y calcula los
coeficientes de predicción lineal (coeficientes LPC). Los
coeficientes de predicción lineal pueden obtenerse, por lo general,
calculando una función de autocorrelación de una señal sometida a
multiplicación de ventana (por ejemplo, una ventana de Hamming) y
resolviendo una ecuación normal o similar. Los coeficientes de
predicción lineal calculados de esta forma se convierten en
coeficientes de pares espectrales lineales (coeficientes LSP) o
similares y se cuantifican en la unidad de cuantificación de perfil
302. Puede emplearse la cuantificación vectorial o la cuantificación
escalar como método de cuantificación. A continuación, la
característica de transferencia de frecuencia (envolvente
espectral) expresada por los parámetros cuantificados por la unidad
de cuantificación de perfil 302 se calculan en la unidad de
normalización de característica de envolvente 303, y los
coeficientes MDCT obtenidos de la unidad MDCT 103 se dividen por la
característica que se va a normalizar. Para concretar, cuando los
coeficientes de predicción lineal equivalentes a los parámetros
cuantificados por la unidad de cuantificación de perfil 302 son
qlpc(i), la característica de transferencia de frecuencia
calculada por la unidad de normalización de característica de
envolvente 303 se obtiene mediante la fórmula (8)
en la que es deseable que ORDER sea 10 \sim 40
y fft( ) significa transformada de Fourier de alta velocidad.
Mediante la característica de transferencia de frecuencia calculada
env(i), la unidad de normalización de característica de
envolvente 303 efectúa la normalización utilizando, por ejemplo, la
fórmula (9)
siguiente
en la que mdct(i) es la señal de salida de
la unidad MDCT 103 y fdct(i) es la señal de salida
normalizada de la unidad de normalización de característica de
envolvente 303. El procedimiento de normalización de la cadena de
coeficientes MDCT se lleva a cabo en las etapas mencionadas
anteriormente.
A continuación, se describirá en detalle la
unidad de cuantificación 105 del aparato de codificación 1, en
relación con la Figura 4. En la Figura 4, el número de referencia
4005 designa una unidad de cuantificación de varias etapas que lleva
a cabo la cuantificación vectorial de la secuencia de señales de
característica de frecuencia (cadena de coeficientes MDCT) ajustada
mediante la unidad de normalización 104. La unidad de
cuantificación de varias etapas 4005 incluye un cuantificador de
primera etapa 40051, un cuantificador de segunda etapa 40052, ...,
un cuantificador de enésima etapa 40053 que se conectan en columna.
Además, 4006 designa una unidad de cálculo de ponderación auditiva
que recibe los coeficientes MDCT proporcionados por la unidad MDCT
103 y la envolvente espectral obtenida en la unidad de
normalización de característica de envolvente 303, y proporciona un
coeficiente de ponderación utilizado para la cuantificación, en la
unidad de cuantificación de varias etapas 4005, basada en la
característica de sensibilidad auditiva.
La cadena de coeficientes MDCT proporcionada por
la unidad MDCT 103 y la envolvente espectral LPC obtenida en la
unidad de normalización de característica de envolvente 303 entran
en la unidad de cálculo de ponderación auditiva 4006 y, con
respecto al espectro de la secuencia de señales de característica de
frecuencia proporcionada por la unidad MDCT 103, basándose en la
característica de sensibilidad auditiva que es la capacidad
auditiva de los seres humanos (por ejemplo, la característica de
límite audible mínimo y la característica de enmascaramiento
auditivo) se calcula una señal característica relativa a la
característica de sensibilidad auditiva y, además, se obtiene un
coeficiente de ponderación utilizado para la cuantificación,
basándose en la señal de característica y la envolvente
espectral.
Los coeficientes MDCT normalizados proporcionados
por la unidad de normalización 104 se cuantifican en el
cuantificador de la primera etapa 40051 de la unidad de
cuantificación de varias etapas 4005, utilizando el coeficiente de
ponderación obtenido por la unidad de cálculo de ponderación
auditiva 4006, y el componente de error de cuantificación
ocasionado por la cuantificación en el cuantificador de primera
etapa 40051 se cuantifica en el cuantificador de segunda etapa
40052 de la unidad de cuantificación de varias etapas 4005,
utilizando el coeficiente de ponderación obtenido por la unidad de
cálculo de ponderación auditiva 4006. A continuación, de la misma
forma mencionada anteriormente, se cuantifica. en cada etapa de la
unidad de cuantificación de varias etapas, un componente de error
de cuantificación ocasionado por la cuantificación en el
cuantificador de la etapa anterior. La codificación de la señal de
audio finaliza una vez que el componente de error de cuantificación
ocasionado por la cuantificación en el cuantificador de
(N-1)-ésima etapa ha sido cuantificado en el
cuantificador de N-ésima etapa 40053, utilizando el coeficiente de
ponderación obtenido por la unidad de cálculo de ponderación
auditiva 4006.
Como se ha descrito anteriormente, según el
aparato de codificación de señales de audio de la primera forma de
realización, la cuantificación vectorial se lleva a cabo en la
pluralidad de etapas de los cuantificadores de vectores 40051 \sim
40053 de los medios de cuantificación de varias etapas 4005,
utilizando como ponderación para la cuantificación un coeficiente
de ponderación en frecuencia, que se calcula en la unidad de cálculo
de ponderación auditiva 4006, basándose en el espectro de la señal
de audio de entrada, la característica de sensibilidad auditiva que
muestra la capacidad auditiva de los seres humanos y la envolvente
espectral LPC. Por consiguiente, puede obtenerse una cuantificación
eficaz utilizando la capacidad auditiva de los seres humanos.
En el aparato de codificación de señales de audio
mostrado en la Figura 4, la unidad de cálculo de ponderación
auditiva 4006 utiliza la envolvente espectral LPC para calcular el
coeficiente de ponderación. No obstante, esta unidad puede calcular
el coeficiente de ponderación utilizando sólo el espectro de la
señal de audio de entrada y la característica de sensibilidad
auditiva que muestra la capacidad auditiva de los seres humanos.
Además, en el aparato de codificación de señales
de audio mostrado en la Figura 4, la cuantificación se lleva a
cabo, en toda la pluralidad de etapas de los cuantificadores de
vectores de los medios de cuantificación de varias etapas 4005,
utilizando el coeficiente de ponderación obtenido en la unidad de
cálculo de ponderación auditiva 4006, basándose en la
característica de sensibilidad auditiva. Siempre que en alguna de
las diversas etapas de los cuantificadores de vectores de los
medios de cuantificación de varias etapas 4005 la cuantificación se
efectúe mediante el coeficiente de ponderación basado en la
característica de sensibilidad auditiva, la cuantificación será más
eficaz que la cuantificación en la que no se utiliza dicho
coeficiente de ponderación basado en la característica de
sensibilidad auditiva.
Forma de realización
2
La Figura 5 es un diagrama de bloques que ilustra
la estructura de un aparato de codificación de señales de audio
según una segunda forma de realización de la presente invención. A
continuación, se describirá sólo la estructura de la unidad de
cuantificación 105 del aparato de codificación 1, puesto que es la
única diferencia de esta forma de realización respecto de la forma
de realización mencionada anteriormente. En la Figura 5, el número
de referencia 50061 designa una primera unidad de cálculo de
ponderación auditiva que proporciona un coeficiente de ponderación
que será utilizado por el cuantificador de primera etapa 40051 de
los medios de cuantificación de varias etapas 4005, basándose en el
espectro de la señal de audio de entrada, la característica de
sensibilidad auditiva que muestra la capacidad auditiva de los
seres humanos y la envolvente espectral LPC; 50062 designa una
segunda unidad de cálculo de ponderación auditiva que proporciona un
coeficiente de ponderación que será utilizado por el cuantificador
de segunda etapa 40052 de los medios de cuantificación de varias
etapas 4005, basándose en el espectro de la señal de audio de
entrada, la característica de sensibilidad auditiva que muestra la
capacidad auditiva de los seres humanos y la envolvente espectral
LPC; y 50063 designa una tercera unidad de cálculo de ponderación
auditiva que proporciona un coeficiente de ponderación que será
utilizado por el cuantificador de N-ésima etapa 40053 de los medios
de cuantificación de varias etapas 4005, basándose en el espectro
de la señal de audio de entrada, la característica de sensibilidad
auditiva que muestra la capacidad auditiva de los seres humanos y
la envolvente espectral LPC.
En el aparato de codificación de señales de audio
según la primera forma de realización, en toda la pluralidad de
etapas de los cuantificadores de vectores de los medios de
cuantificación de varias etapas 4005, la cuantificación se lleva a
cabo utilizando el mismo coeficiente de ponderación obtenido en la
unidad de cálculo de ponderación auditiva 4006. No obstante, en el
aparato de codificación de señales de audio según esta segunda
forma de realización, en la pluralidad de etapas de los
cuantificadores de vectores de los medios de cuantificación de
varias etapas 4005, la cuantificación se lleva a cabo utilizando
los coeficientes de ponderación individuales obtenidos en las
unidades de cálculo de ponderación auditiva primera a tercera
50061, 50062 y 50063, respectivamente. En este aparato de
codificación de señales de audio según la segunda forma de
realización, la cuantificación puede llevarse a cabo efectuando la
ponderación de conformidad con la característica de ponderación en
frecuencia obtenida en las unidades de ponderación auditiva 50061 a
50063, basada en la capacidad auditiva y, por consiguiente,
reduciendo al mínimo el error debido a la cuantificación en cada
etapa de los medios de cuantificación de varias etapas 4005. Por
ejemplo, se calcula un coeficiente de ponderación basado en la
envolvente espectral en la primera unidad de ponderación auditiva
50061, se calcula un coeficiente de ponderación basado en la
característica de límite audible mínimo en la segunda unidad de
ponderación auditiva 50062 y se calcula un coeficiente de
ponderación basado en la característica de enmascaramiento auditivo
en la tercera unidad de ponderación auditiva 50063.
Como se ha descrito anteriormente, según el
aparato de codificación de señales de audio de la segunda forma de
realización, puesto que en la pluralidad de etapas de los
cuantificadores 40051 a 40053 de los medios de cuantificación de
varias etapas 4005 se efectúa la cuantificación mediante los
coeficientes de ponderación individuales obtenidos en las unidades
de cálculo de ponderación auditiva 50061 a 50063, respectivamente,
puede obtenerse una cuantificación efectiva utilizando con eficacia
la capacidad auditiva de los seres humanos.
Forma de realización
3
La Figura 6 es un diagrama de bloques que ilustra
la estructura de un aparato de codificación de señales de audio
según una tercera forma de realización de la presente invención. A
continuación, se describirá sólo la estructura de la unidad de
cuantificación 105 del aparato de codificación 1, puesto que es la
única diferencia de esta forma de realización respecto de la forma
de realización mencionada anteriormente. En la Figura 6, el número
de referencia 60021 designa una unidad de cuantificación de primera
etapa que efectúa la cuantificación vectorial de la señal MDCT
normalizada; 60023 designa una unidad de cuantificación de segunda
etapa que cuantifica la señal de error de cuantificación ocasionada
en la cuantificación de la unidad de cuantificación de primera etapa
60021; y 60022 designa unos medios de selección auditiva que
seleccionan, a partir del error de cuantificación ocasionado en la
cuantificación de la unidad de cuantificación de primera etapa
60021, la banda de frecuencias de más importancia para cuantificar
en la unidad de cuantificación de segunda etapa 60023, basándose en
la característica de sensibilidad auditiva.
A continuación, se describirá el funcionamiento.
Los coeficientes MDCT normalizados se someten a cuantificación
vectorial en la unidad de cuantificación de primera etapa 60021. En
los medios de selección auditiva 60022, basándose en la escala
auditiva, se selecciona una banda de frecuencias en la que la señal
de error ocasionada por la cuantificación vectorial es grande, y se
extrae un bloque de la misma. En la unidad de cuantificación de
segunda etapa 60023, la señal de error del bloque seleccionado se
somete a cuantificación vectorial. Los resultados obtenidos en las
respectivas unidades de cuantificación se proporcionan como
índices.
La Figura 7 es un diagrama de bloques que ilustra
en detalle las unidades de cuantificación de primera y segunda
etapa y la unidad de selección auditiva, incluidas en el aparato de
codificación de señales de audio mostrado en la Figura 6. En la
Figura 7, el número de referencia 7031 designa un primer
cuantificador de vectores que efectúa la cuantificación vectorial
de los coeficientes MDCT normalizados; y 70032 designa un
cuantificador inverso que efectúa la cuantificación inversa del
resultado de cuantificación del primer cuantificador 70031,
obteniéndose una señal del error de cuantificación zi ocasionado en
la cuantificación del primer cuantificador 70031, calculando la
diferencia entre la salida del cuantificador inverso 70032 y la
señal residual si. El número de referencia 70033 designa la
característica de sensibilidad auditiva hi que muestra la capacidad
auditiva de los seres humanos (aquí se utiliza la característica de
límite audible mínimo). El número de referencia 70035 designa un
selector que selecciona la banda de frecuencias que será
cuantificada por el segundo cuantificador de vectores 70036, a
partir de la señal de error de cuantificación zi ocasionado en la
cuantificación del primer cuantificador 70031. El número de
referencia 70034 designa una unidad de cálculo de escala de
selección que calcula una escala de selección para la operación de
selección del selector 70035, basándose en la señal de error zi, la
envolvente espectral LPC li y la característica de sensibilidad
auditiva hi.
A continuación, se describirá en detalle la
operación de selección de la unidad de selección auditiva.
En el primer cuantificador de vectores 70031, en
primer lugar, la señal residual de una trama que comprende N
elementos es dividida en una pluralidad de subvectores por un
divisor de vectores del primer cuantificador de vectores 70031
mostrado en la Figura 8(a), y los respectivos subvectores se
someten a cuantificación vectorial mediante los N elementos de
cuantificadores 1\simN del primer cuantificador de vectores 70031.
El procedimiento de división y cuantificación vectorial se describe
a continuación. Por ejemplo, como se muestra en la Figura
8(b), los N elementos dispuestos por orden ascendente de
frecuencia se dividen en NS elementos de subbloques a intervalos
iguales y NS elementos de subvectores que comprenden N/NS
elementos, de tal forma que se crea un subvector que sólo comprende
los primeros elementos de los respectivos subbloques, un subvector
que sólo comprende los segundos elementos de los mismos, y así
sucesivamente, y se efectúa la cuantificación vectorial de todos
los subvectores. El número de divisiones y otras cuestiones
similares se deciden basándose en la velocidad de codificación
deseada.
Tras la cuantificación vectorial, el
cuantificador inverso 70032 efectúa la cuantificación inversa del
código cuantificado para obtener la diferencia respecto de la señal
de entrada y proporcionar, de ese modo, una señal de error zi en el
primer cuantificador de vectores 70031 mostrado en la Figura
9(a).
A continuación, en el selector 70035, a partir de
la señal de error zi, se selecciona un bloque de frecuencias que
será cuantificado con más precisión por el segundo cuantificador
70036, basándose en el resultado seleccionado por la unidad de
cálculo de escala de selección 70034.
En la unidad de cálculo de escala de selección
70034, utilizando la señal de error zi, la envolvente espectral LPC
li (mostrada en la Figura 9(b)) obtenida en la unidad de
análisis LPC y la característica de sensibilidad auditiva hi, se
calcula para cada elemento de la trama dividida en N elementos en
el eje de la frecuencia,
g = (zi * li) /
hi.
Como característica de sensibilidad auditiva hi,
se utiliza, por ejemplo, la característica de límite audible mínimo
mostrada en la Figura 9(c). Esta característica muestra la
zona que no puede ser oída por los seres humanos, obtenida
experimentalmente. Por consiguiente, puede afirmarse que 1/hi, que
es el inverso de la característica de sensibilidad auditiva hi,
muestra la importancia auditiva de los seres humanos. Además, puede
afirmarse que el valor g, que se obtiene multiplicando la señal de
error zi, la envolvente espectral li y el inverso de la
característica de sensibilidad auditiva hi, muestra la importancia
de la cuantificación precisa en la frecuencia.
La Figura 10 es un diagrama de bloques que
ilustra en detalle otros ejemplos de las unidades de cuantificación
de primera y segunda etapa y la unidad de selección auditiva,
incluidas en el aparato de codificación de señales de audio mostrado
en la Figura 6. En la Figura 10, se utilizan los mismos números de
referencia que en la Figura 7 para designar partes iguales o
correspondientes. En el ejemplo mostrado en la Figura 10, la escala
de selección (importancia) g se obtiene utilizando la envolvente
espectral li y la característica de sensibilidad auditiva hi (sin
utilizar la señal de error zi), calculando,
g = li /
hi
La Figura 11 es un diagrama de bloques que
ilustra en detalle otros ejemplos de las unidades de cuantificación
de primera y segunda etapa y la unidad de selección auditiva,
incluidas en el aparato de codificación de señales de audio mostrado
en la Figura 6. En la Figura 11, se utilizan los mismos números de
referencia que en la Figura 7 para designar partes iguales o
correspondientes, y el número de referencia 11042 designa una
unidad de cálculo de cantidad de enmascaramiento que calcula la
cantidad para enmascarar mediante la característica de
enmascaramiento auditivo, a partir del espectro de la frecuencia de
audio de entrada que ha sido sometida a la transformada MDCT en la
unidad de transformación tiempo-frecuencia.
En el ejemplo mostrado en la Figura 11, la
característica de sensibilidad auditiva hi se obtiene de trama en
trama de la forma descrita a continuación. A partir de la
distribución espectral de la frecuencia de la señal de entrada, se
calcula la característica de enmascaramiento, que se suma a la
característica de límite audible mínimo para obtener, de ese modo,
la característica de sensibilidad auditiva hi de la trama. El
funcionamiento de la unidad de cálculo de escala de selección 70034
es idéntico al descrito en relación con la Figura 10.
La Figura 12 es un diagrama de bloques que
ilustra en detalle otros ejemplos de las unidades de cuantificación
de primera y segunda etapa y la unidad de selección auditiva,
incluidas en el aparato de codificación de señales de audio mostrado
en la Figura 6. En la Figura 12, se utilizan los mismos números de
referencia que en la Figura 7 para designar partes iguales o
correspondientes, y el número de referencia 12004 designa una
unidad de corrección de cantidad de enmascaramiento que corrige la
característica de enmascaramiento obtenida en la unidad de cálculo
de cantidad de enmascaramiento 110042, mediante la envolvente
espectral li, la señal residual si y la señal de error zi.
En el ejemplo mostrado en la Figura 12, la
característica de sensibilidad auditiva hi se obtiene de trama en
trama de la forma descrita a continuación. En primer lugar, se
calcula la característica de enmascaramiento a partir de la
distribución espectral de la frecuencia de la señal de entrada en
la unidad de cálculo de cantidad de enmascaramiento 110042. A
continuación, en la unidad de corrección de cantidad de
enmascaramiento 120043, se corrige la característica de
enmascaramiento calculada de conformidad con la envolvente
espectral li, la señal residual si y la señal de error zi. La
característica de sensibilidad de audio hi de la trama se obtiene
sumando la característica de límite audible mínimo a la
característica de enmascaramiento corregida. A continuación, se
describirá un ejemplo de procedimiento para corregir la
característica de enmascaramiento.
En un principio, se obtiene la frecuencia (fm) a
la que la característica de cantidad de enmascaramiento Mi, que ya
ha sido calculada, alcanza el valor máximo. Seguidamente, se
determina con qué precisión se reproduce la señal que tiene la
frecuencia fm a partir de la intensidad espectral de la frecuencia
fm en la entrada y el tamaño del espectro del error de
cuantificación. Por ejemplo,
\gamma = 1 -- (ganancia de
error de cuantificación de fm) / (ganancia de fm en la
entrada)
Cuando el valor de \gamma se aproxima a 1, no
es necesario transformar la característica de enmascaramiento
obtenida. Sin embargo, cuando este valor se aproxima a 0, la
característica de enmascaramiento se corrige para disminuirla. Por
ejemplo, la característica de enmascaramiento puede corregirse
mediante transformación a una potencia superior con el coeficiente
\gamma , de la siguiente forma:
(31)hi =
Mi^{\gamma}
A continuación, se describirá el funcionamiento
del selector 70035.
En el selector 70035, cada uno de los elementos
continuos de la trama se multiplica por una ventana (longitud W), y
se selecciona un bloque de frecuencias en el que el valor G
obtenido por acumulación de los valores de importancia g dentro de
la ventana alcanza el máximo. La Figura 13 es un diagrama que
muestra un ejemplo en el que se selecciona el bloque de frecuencias
(longitud W) que tiene más importancia. Para simplificar, se
establecerá una longitud de ventana que sea un entero múltiplo de
N/NS (en la Figura 13 se muestra una ventana cuya longitud no es un
entero múltiplo). A la vez que se aplica un desplazamiento de N/NS
elementos a la ventana, se calcula el valor G acumulado de valores
de importancia g dentro de la trama de la ventana y se selecciona un
bloque de frecuencias que tiene una longitud W que proporciona el
valor máximo de G.
En el segundo cuantificador de vectores 70032, el
bloque seleccionado de la trama de la ventana se somete a
cuantificación vectorial. Aunque el funcionamiento del segundo
cuantificador de vectores 70032 es idéntico al del primer
cuantificador de vectores 70031, ya que sólo se cuantifica, de la
forma descrita anteriormente, el bloque de frecuencias seleccionado
por el selector 70035 a partir de la señal de error zi, el número
de elementos de la trama que se van a someter a cuantificación
vectorial es pequeño.
Por último, en caso de que se utilice el código
del coeficiente de la envolvente espectral, los códigos
correspondientes a los resultados de cuantificación de los
respectivos cuantificadores de vectores, la escala de selección g
obtenida en cualquiera de las estructuras mostradas en las Figuras
7, 11 y 12 y la información que muestra a partir de qué elemento
empieza el bloque seleccionado por el selector 70035 se obtienen en
forma de índice.
Por otra parte, en caso de que se utilice la
escala de selección g obtenida en la estructura mostrada en la
Figura 10, puesto que sólo se utiliza la envolvente espectral li y
la característica de sensibilidad auditiva hi, la información (que
indica, por ejemplo, a partir de qué elemento empieza el bloque
seleccionado) puede obtenerse a partir del código del coeficiente
de envolvente espectral y la característica de sensibilidad auditiva
hi conocida previamente cuando se lleva a cabo la cuantificación
inversa. Por consiguiente, no es necesario proporcionar la
información relativa a la selección de bloque como un índice, lo
que representa una ventaja respecto de la compresibilidad.
Como se ha descrito anteriormente, según el
aparato de codificación de señales de audio de la tercera forma de
realización, basándose en el espectro de la señal de audio de
entrada y la característica de sensibilidad auditiva que muestra la
capacidad auditiva de los seres humanos, se selecciona el bloque de
frecuencias de más importancia para la cuantificación a partir de
los bloques de frecuencias del componente de error de cuantificación
del primer cuantificador de vectores, y se cuantifica el componente
de error de cuantificación del primer cuantificador respecto del
bloque seleccionado en el segundo cuantificador de vectores,
pudiéndose obtener de ese modo una eficaz cuantificación utilizando
la capacidad auditiva de los seres humanos. Además, en las
estructuras mostradas en las Figuras 7, 11 y 12, cuando se
selecciona el bloque de frecuencias de más importancia para la
cuantificación, la importancia se calcula basándose en el error de
cuantificación del primer cuantificador de vectores. De este modo,
se impide que una parte cuantificada favorablemente en el primer
cuantificador de vectores sea cuantificada de nuevo y que se genere
un error de forma inversa, manteniéndose una cuantificación de alta
calidad.
Además, cuando la importancia g se obtiene en la
estructura mostrada en la Figura 10, el número de índices generados
es inferior al número de índices generados cuando la importancia g
se obtiene en la estructura mostrada en cualquiera de las Figuras
7, 11 ó 12, lo que determina un aumento de la relación de
compresión.
En esta tercera forma de realización, la unidad
de cuantificación tiene la estructura de dos etapas que comprende
la unidad de cuantificación de primera etapa 60021 y la unidad de
cuantificación de segunda etapa 60023, y los medios de selección
auditiva 60022 se hallan entre la unidad de cuantificación de
primera etapa 60021 y la unidad de cuantificación de segunda etapa
60023. No obstante, la unidad de cuantificación puede tener una
estructura de tres o más etapas y los medios de selección auditiva
pueden estar situados entre las respectivas unidades de
cuantificación. Asimismo, como en la tercera forma de realización
mencionada anteriormente, en esta estructura puede llevarse a cabo
una cuantificación eficaz utilizando la capacidad auditiva de los
seres humanos.
Forma de realización
4
La Figura 14 es un diagrama de bloques que
ilustra la estructura de un aparato de codificación de señales de
audio según una cuarta forma de realización de la presente
invención. A continuación, se describirá solo la estructura de la
unidad de cuantificación 105 del aparato de codificación 1, puesto
que es la única diferencia de esta forma de realización respecto de
la forma de realización mencionada anteriormente. En la Figura, el
número de referencia 140011 designa un cuantificador de primera
etapa que efectúa la cuantificación vectorial de la señal MDCT si
obtenida de la unidad de normalización 104, utilizando el valor de
envolvente espectral li como coeficiente de ponderación. El número
de referencia 140012 designa un cuantificador inverso que efectúa
la cuantificación inversa del resultado de la cuantificación del
cuantificador de primera etapa 140011. Se obtiene una señal de
error de cuantificación zi de la cuantificación efectuada por el
cuantificador de primera etapa 140011, calculando la diferencia
entre la salida de este cuantificador inverso 140012 y la señal
residual proporcionada por la unidad de normalización 104. El número
de referencia 140013 designa un cuantificador de segunda etapa que
efectúa la cuantificación vectorial de la señal de error de
cuantificación zi de la cuantificación efectuada por el
cuantificador de primera etapa 140011 utilizando, como coeficiente
de ponderación, el resultado del cálculo obtenido en la unidad de
cálculo de ponderación 140017 descrita más adelante. El número de
referencia 140014 designa un cuantificador inverso que efectúa la
cuantificación inversa del resultado de la cuantificación del
cuantificador de segunda etapa 140013. Se obtiene una señal de
error de cuantificación z2i de la cuantificación efectuada por el
cuantificador de segunda etapa 140013, calculando la diferencia
entre la salida del cuantificador inverso 140014 y la señal de
error de cuantificación de la cuantificación efectuada por el
cuantificador de primera etapa 140011. El número de referencia
141005 designa un cuantificador de tercera etapa que efectúa la
cuantificación vectorial de la señal de error de cuantificación z2i
de la cuantificación efectuada por el cuantificador de segunda etapa
140013, utilizando como coeficiente de ponderación el resultado del
cálculo obtenido en la unidad de cálculo de ponderación auditiva
4006. El número de referencia 140016 designa una unidad de cálculo
de correlación que calcula la correlación entre la señal de error
de cuantificación zi de la cuantificación efectuada por el
cuantificador de primera etapa 140011 y el valor de envolvente
espectral li. El número de referencia 140017 designa una unidad de
cálculo de ponderación que calcula el coeficiente de ponderación
utilizado en la cuantificación efectuada por el cuantificador de
segunda etapa 140013.
A continuación, se describirá el funcionamiento.
En el aparato de codificación de señales de audio según la cuarta
forma de realización, se emplean tres etapas de cuantificadores y la
cuantificación vectorial se lleva a cabo utilizando ponderaciones
diferentes en los respectivos cuantificadores.
Inicialmente, en el cuantificador de primera
etapa 140013, la señal residual de entrada si se somete a
cuantificación vectorial utilizando, como coeficiente de
ponderación, el valor de envolvente espectral LPC li obtenido en la
unidad de cuantificación de perfil 302. En consecuencia, una parte
de energía espectral elevada (concentrada) se somete a ponderación,
lo que determina que se cuantifique con mayor eficacia una parte
que tiene importancia auditiva. Como cuantificador de vectores de
primera etapa 140013 puede utilizarse, por ejemplo, un
cuantificador idéntico al primer cuantificador de vectores 70031
según la tercera forma de realización.
El resultado de la cuantificación se somete a
cuantificación inversa en el cuantificador inverso 140012 y, a
partir de la diferencia entre éste y la señal residual de entrada
si, se obtiene la señal de error zi ocasionado por la
cuantificación.
Esta señal de error zi es sometida además a
cuantificación vectorial por el cuantificador de segunda etapa
140013. En este caso, basándose en la correlación entre la
envolvente espectral LPC li y la señal de error zi, se calcula un
coeficiente de ponderación en la unidad de cálculo de correlación
140016 y la unidad de cálculo de ponderación 140017.
Para concretar, en la unidad de cálculo de
correlación 140016, se calcula
\alpha = (\sum li \ \text{*}
\ zi)/(\sum li \ \text{*} \
li)
\alpha toma un valor que cumple 0 < \alpha
< 1 y muestra la correlación entre ambas. Cuando \alpha se
aproxima a 0, indica que la cuantificación de primera etapa se ha
efectuado con precisión basándose en la ponderación de la
envolvente espectral. Cuando \alpha se aproxima a 1, indica que
la cuantificación todavía no ha sido efectuada con precisión. Por lo
tanto, utilizando \alpha como coeficiente para ajustar el grado
de ponderación de la envolvente espectral li, se obtiene
(32)li^{\alpha}
y este resultado se utiliza como coeficiente de
ponderación para la cuantificación vectorial. Se puede mejorar la
precisión de la cuantificación volviendo a efectuar la ponderación
mediante la envolvente espectral según la precisión de la
cuantificación de la primera etapa y, a continuación, efectuando la
cuantificación de la forma indicada
anteriormente.
El resultado de la cuantificación efectuada por
el cuantificador de segunda etapa 140013 se somete a cuantificación
inversa en el cuantificador inverso 140014 de forma similar, y se
extrae una señal de error z2i que es sometida a cuantificación
vectorial por el cuantificador de tercera etapa 140015. El
coeficiente de ponderación auditiva esta vez es calculado por el
calculador de ponderación A19 de la unidad de cálculo de
ponderación auditiva 14006. Por ejemplo, utilizando la señal de
error z2i, la envolvente espectral LPC li y la señal residual si,
se obtiene:
N = \sum z2li \ \text{*} \
li
S = \sum si \ \text{*} \
li
\beta = 1 -
(N/S)
Por otra parte, en el calculador de
enmascaramiento auditivo 140018 de la unidad de cálculo de
ponderación auditiva 14006, la característica de enmascaramiento
auditivo mi se calcula, por ejemplo, según un modelo auditivo
utilizado en un procedimiento del estándar de audio MPEG. Ésta se
solapa con la característica de límite audible mínimo descrita
anteriormente hi para obtener la característica de enmascaramiento
Mi definitiva.
A continuación, la característica de
enmascaramiento Mi definitiva se eleva a una potencia superior
utilizando el coeficiente \beta calculado en la unidad de cálculo
de ponderación 140019, y el inverso de este valor se multiplica por
1 para obtener
(33)l/Mi^{\beta}
siendo este resultado utilizado como coeficiente
de ponderación para la cuantificación vectorial de la tercera
etapa.
Como se ha indicado anteriormente, en el aparato
de codificación de señales de audio según esta cuarta forma de
realización, la pluralidad de cuantificadores 140011, 140013 y
140015 llevan a cabo la cuantificación utilizando diferentes
coeficientes de ponderación (incluida la ponderación que tiene en
cuenta la característica de sensibilidad auditiva) y de ese modo
puede efectuarse una cuantificación efectiva utilizando eficazmente
la capacidad auditiva de los seres humanos.
Forma de realización
5
La Figura 15 es un diagrama de bloques que
ilustra la estructura de un aparato de codificación de señales de
audio según una quinta forma de realización de la presente
invención.
El aparato de codificación de señales de audio
según esta quinta forma de realización es una combinación de la
tercera forma de realización mostrada en la Figura 6 y la primera
forma de realización mostrada en la Figura 4. En el aparato de
codificación de señales de audio según la tercera forma de
realización mostrado en la Figura 6, se utiliza un coeficiente de
ponderación, que se obtiene utilizando la característica de
sensibilidad auditiva en la unidad de cálculo de ponderación
auditiva 4006, cuando se lleva a cabo la cuantificación en cada una
de las unidades de cuantificación. Gracias a la estructura del
aparato de codificación de señales de audio según la quinta forma
de realización, se obtienen los resultados proporcionados por la
primera forma de realización y la tercera forma de realización.
Asimismo, también es posible combinar la tercera
forma de realización mostrada en la Figura 6 con la estructura de
la segunda forma de realización o la cuarta forma de realización y,
entonces, el aparato de codificación de señales de audio obtenido
mediante cada combinación puede proporcionar tanto los resultados de
la segunda forma de realización y la tercera forma de realización,
como los resultados de la cuarta forma de realización y la tercera
forma de realización.
Aunque en las formas de realización primera a
cuarta mencionadas la unidad de cuantificación de varias etapas
tiene dos o tres etapas de unidades de cuantificación, huelga decir
que el número de etapas de la unidad de cuantificación puede ser de
cuatro o más.
Además, el orden de los coeficientes de
ponderación utilizados para la cuantificación vectorial en las
respectivas etapas de la unidad de cuantificación de varias etapas
no está limitado al descrito en las formas de realización
anteriores. Por ejemplo, el coeficiente de ponderación que tiene en
cuenta la característica de sensibilidad auditiva puede utilizarse
en la primera etapa y la envolvente espectral LPC puede utilizarse
en la segunda etapa y después de ésta.
\newpage
Forma de realización
6
La Figura 16 es un diagrama de bloques que
ilustra un aparato de codificación de señales de audio según una
sexta forma de realización de la presente invención. A
continuación, se describirá sólo la estructura de la unidad de
cuantificación 105 del aparato de codificación 1, puesto que es la
única diferencia de esta forma de realización respecto de la forma
de realización mencionada anteriormente.
En la Figura 16, el número de referencia 401
designa una primera unidad de subcuantificación, 402 designa una
segunda unidad de subcuantificación que recibe la salida de la
primera unidad de subcuantificación 401, y 403 designa una tercera
unidad de subcuantificación que recibe la salida de la segunda
unidad de subcuantificación 402.
A continuación, se describirá el funcionamiento
de la unidad de cuantificación 105. La señal introducida en la
primera unidad de subcuantificación 401 es la salida de la unidad
de normalización 104 del aparato de codificación, es decir, los
coeficientes MDCT. No obstante, en la estructura que no incluye una
unidad de normalización 104, la entrada es la salida de la unidad
MDCT 103. En la primera unidad de subcuantificación 401, los
coeficientes MDCT de entrada se someten a cuantificación escalar o
cuantificación vectorial, y se codifican índices que expresan los
parámetros utilizados para la cuantificación. Además, se calculan
los errores de cuantificación respecto de los coeficientes MDCT de
entrada ocasionados por la cuantificación y se proporcionan a la
segunda unidad de subcuantificación 402. En la primera unidad de
subcuantificación 401, pueden cuantificarse todos los coeficientes
MDCT o sólo una parte de ellos. Naturalmente, cuando sólo se
cuantifica una parte de estos coeficientes, los errores de
cuantificación de las bandas que no son cuantificadas por la
primera unidad de subcuantificación 401 serán los coeficientes MDCT
de entrada de las bandas no cuantificadas.
A continuación, la segunda unidad de
subcuantificación 402 recibe los errores de cuantificación de los
coeficientes MDCT obtenidos en la primera unidad de
subcuantificación 401 y los cuantifica. Como en la primera unidad de
subcuantificación 401, esta cuantificación puede ser escalar o
vectorial. La segunda unidad de subcuantificación 402 codifica los
parámetros utilizados para la cuantificación como índices. Además,
calcula los errores de cuantificación ocasionados por la
cuantificación y los proporciona a la tercera unidad de
subcuantificación 403. Esta tercera unidad de subcuantificación 403
es idéntica en cuanto a estructura a la segunda unidad de
subcuantificación.
No es necesario que los números de coeficientes
MDCT, es decir, los anchos de banda, que van a ser cuantificados
por la primera unidad de subcuantificación 401, la segunda unidad
de subcuantificación 402 y la tercera unidad de subcuantificación
403 sean iguales entre sí, ni que las bandas que se van a
cuantificar sean las mismas. Teniendo en cuenta la característica
auditiva de los seres humanos, es deseable que tanto la segunda
unidad de subcuantificación 402 como la tercera unidad de
subcuantificación 403 estén destinadas a cuantificar la banda de
los coeficientes MDCT que presentan el componente de baja
frecuencia.
Como se ha descrito anteriormente en relación con
la sexta forma de realización de la presente invención, cuando se
efectúa la cuantificación, la unidad de cuantificación se
proporciona en etapas, y el ancho de banda que va a ser cuantificado
por la unidad de cuantificación varía entre las etapas adyacentes,
cuantificándose de ese modo los coeficientes de una banda
arbitraria de los coeficientes MDCT de entrada, por ejemplo, los
coeficientes correspondientes al componente de baja frecuencia que
tiene importancia auditiva para los seres humanos. Por
consiguiente, aunque la señal de audio se codifique a una velocidad
binaria baja (es decir, con una alta relación de compresión), es
posible efectuar una reproducción de audio de alta definición en el
sector de recepción.
Forma de realización
7
A continuación, se describirá un aparato de
codificación de señales de audio según una séptima forma de
realización de la presente invención, en relación con la Figura 17.
A continuación, se describirá sólo la estructura de la unidad de
cuantificación 105 del aparato de codificación 1, puesto que es la
única diferencia de esta forma de realización respecto de la forma
de realización mencionada anteriormente. En la Figura 17, el número
de referencia 501 designa una primera unidad de subcuantificación
(cuantificador vectorial), 502 designa una segunda unidad de
subcuantificación y 503 designa una tercera unidad de
subcuantificación. Esta séptima forma de realización es diferente en
cuanto a estructura de la sexta forma de realización, en la medida
en que la primera unidad de cuantificación 501 divide los
coeficientes MDCT de entrada en tres bandas y cuantifica las
respectivas bandas de forma independiente. En general, cuando la
cuantificación se lleva a cabo mediante un método de cuantificación
vectorial, los vectores se forman extrayendo algunos elementos de
los coeficientes MDCT de entrada. En la primera unidad de
subcuantificación 501 según la séptima forma de realización, cuando
se crean vectores extrayendo algunos elementos de los coeficientes
MDCT, la cuantificación de la banda baja se lleva a cabo utilizando
sólo los elementos de la banda baja, la cuantificación de la banda
intermedia se lleva a cabo utilizando sólo los elementos de la
banda intermedia y la cuantificación de la banda alta se lleva a
cabo utilizando sólo los elementos de la banda alta, y de esta forma
las respectivas bandas se someten a cuantificación vectorial. La
primera unidad de subcuantificación 501 mostrada se compone de tres
cuantificadores de vectores divididos.
Aunque en esta séptima forma de realización, se
describe como ejemplo un procedimiento para dividir la banda que se
va a cuantificar en tres bandas (banda baja, banda intermedia y
banda alta), la banda puede dividirse en un número de bandas
distinto de tres. Además, respecto de la segunda unidad de
subcuantificación 502 y la tercera unidad de subcuantificación 503,
así como de la primera unidad de cuantificación 501, la banda que
se va a cuantificar puede dividirse en varias bandas.
Como se ha descrito anteriormente, según la
séptima forma de realización de la presente invención, cuando se
lleva a cabo la cuantificación, los coeficientes MDCT de entrada se
dividen en tres bandas y se cuantifican de forma independiente para
que el método de cuantificación de la banda de importancia auditiva
con prioridad pueda llevarse a cabo en la primera cuantificación.
Además, en las subsiguientes unidades de cuantificación 502 y 503,
los coeficientes MDCT de esta banda son sometidos a una posterior
cuantificación por etapas, con lo que se reduce todavía más el error
de cuantificación y se obtiene una reproducción de audio de
definición más alta en el sector de recepción.
Forma de realización
8
A continuación, se describirá un aparato de
codificación de señales de audio según una octava forma de
realización de la presente invención, en relación con la Figura 18.
A continuación, se describirá sólo la estructura de la unidad de
cuantificación 105 del aparato de codificación 1, puesto que es la
única diferencia de esta forma de realización respecto de la
primera forma de realización mencionada anteriormente. En la Figura
18, el número de referencia 601 designa una primera unidad de
subcuantificación, 602 designa una primera unidad de selección de
banda de cuantificación, 603 designa una segunda unidad de
subcuantificación, 604 designa una segunda unidad de selección de
banda de cuantificación y 605 designa una tercera unidad de
subcuantificación. Esta octava forma de realización es diferente en
cuanto a estructura de la sexta y la séptima forma de realización,
en la medida en que se añade la primera unidad de selección de banda
de cuantificación 602 y la segunda unidad de selección de banda de
cuantificación 604.
A continuación, se describirá el funcionamiento.
La primera unidad de selección de banda de cuantificación 602
calcula una banda, cuyos coeficientes MDCT van a ser cuantificados
por la segunda unidad de subcuantificación 602, utilizando el error
de cuantificación obtenido de la primera unidad de subcuantificación
601.
Por ejemplo, se calcula el valor j que incrementa
al máximo el término esum(j) proporcionado en la fórmula
(10), y se cuantifica la banda comprendida entre j*OFFSET y
j*OFFSET+ BANDWIDTH
siendo OFFSET la constante y BANDWITH la muestra
total correspondiente a un ancho de banda que va a ser cuantificado
por la segunda unidad de subcuantificación 603. La primera unidad
de selección de banda de cuantificación 602 codifica, por ejemplo,
el valor j que proporciona el valor máximo en la fórmula (10) como
un índice. La segunda unidad de subcuantificación 603 cuantifica la
banda seleccionada por la primera unidad de selección de banda de
cuantificación 602. La segunda unidad de selección de banda de
cuantificación 604 se ejecuta mediante la misma estructura que la
primera unidad de selección, excepto en que la entrada es el error
de cuantificación obtenido de la segunda unidad de
subcuantificación 603, y la banda seleccionada por la segunda unidad
de selección de banda de cuantificación 604 se introduce en la
tercera unidad de subcuantificación
605.
Aunque, en la primera unidad de selección de
banda de cuantificación 602 y la segunda unidad de selección de
banda de cuantificación 604, se selecciona la banda que va a ser
cuantificada por la siguiente unidad de cuantificación mediante la
fórmula (10), ésta puede calcularse mediante el valor obtenido
multiplicando el valor utilizado en la normalización por la unidad
de normalización 104 y el valor que tiene en cuenta la
característica de sensibilidad auditiva de los seres humanos en
relación con las frecuencias, como se muestra en la fórmula
(11)
en la que env(i) se obtiene dividiendo la
salida de la unidad MDCT 103 por la salida de la unidad de
normalización 104, y zxc(i) es la tabla que tiene en cuenta
la característica de sensibilidad auditiva de los seres humanos
relativa a las frecuencias, mostrándose un ejemplo de la misma en
el gráfico 2. En la fórmula (11), zxc(i) puede ser siempre 1
y, entonces no se
considera.
\newpage
GRÁFICO
2
Además, no es necesario proporcionar unidades de
selección de banda de cuantificación de varias etapas, es decir,
puede utilizarse sólo la primera unidad de selección de banda de
cuantificación 602 o la segunda unidad de banda de cuantificación
604.
Como se ha descrito anteriormente, según la
octava forma de realización, cuando la cuantificación se lleva a
cabo en varias etapas, se dispone una unidad de selección de banda
de cuantificación entre unidades de cuantificación de etapas
adyacentes para que la banda que se va a cuantificar sea variable.
De ese modo, la banda que se va a cuantificar puede variarse según
la señal de entrada, y el grado de libertad de la cuantificación
aumenta.
De ahora en adelante, se describirá con detalle
el funcionamiento del método de cuantificación de la unidad de
cuantificación incluida en el aparato de codificación 1 según
cualquiera de las formas de realización primera a octava, en
relación con las Figuras 1 y 19. Algunos de los coeficientes MDCT
normalizados 1401 introducidos en cada unidad de subcuantificación
se extraen según una regla para la generación de subvectores de
fuente de sonido 1403. Del mismo modo, si se supone que las cadenas
de coeficientes, que se obtienen dividiendo los coeficientes MDCT
que van a introducirse en la unidad de normalización 104 por los
coeficientes MDCT 1401 normalizados en la unidad de normalización
104, son componentes normalizados 1402, algunos de estos
componentes se extraen según la misma regla de extracción de
subvectores de fuente de sonido a partir de los coeficientes MDCT
1401, generándose de ese modo subvectores de ponderación 1404. La
regla para extraer los subvectores de fuente de sonido 1403 y los
subvectores de ponderación 1404 a partir de los coeficientes MDCT
1401 y los componentes normalizados 1402, respectivamente, se
muestra, por ejemplo, en la fórmula (14):
en la que el j-ésimo elemento del i-ésimo
subvector de fuente de sonido es el subvector_{i}(j), los
coeficientes MDCT son vector( ), el número total de elementos de
coeficientes MDCT es TOTAL, el número de elementos de subvectores de
fuente de sonido 1403 es CR, VTOTAL se establece en un valor igual
o superior a TOTAL y VTOTAL/CR debe ser un entero. Por ejemplo,
cuando TOTAL es 2048, CR = 19 y VTOTAL = 2052 o CR = 23 y VTOTAL =
2070 o CR = 21 y VTOTAL = 2079. Los subvectores de ponderación
19001404 pueden extraerse mediante el procedimiento de la fórmula
(14). El cuantificador de vectores 1405 selecciona, a partir de los
vectores de códigos del libro de códigos 1409, un vector de código
que se halla a una distancia mínima del subvector de fuente de
sonido 1403, tras haber sido ponderado mediante el subvector de
ponderación 1404. A continuación, el cuantificador 1405 proporciona
el índice del vector de código que se halla a la distancia mínima, y
un subvector residual 1404 que corresponde al error de
cuantificación entre el vector de código que se halla a la
distancia mínima y el subvector de fuente de sonido de entrada 1403.
A continuación, se describirá un ejemplo de un procedimiento de
cálculo concreto basado en la premisa de que el cuantificador de
vectores 1405 está constituido por tres componentes: unos medios de
cálculo de distancia 1406, unos medios de selección de código 1407
y unos medios de generación de residuo 1408. Los medios de cálculo
de distancia 1406 calculan la distancia entre el i-ésimo subvector
de fuente de sonido 1403 y el k-ésimo vector de código del libro de
códigos 1409 utilizando, por ejemplo, la fórmula
(15):
en la que wj es el j-ésimo elemento del subvector
de ponderación, ck(j) es el j-ésimo elemento del k-ésimo
vector de código, R y S son reglas para el cálculo de la distancia
(siendo deseable que los valores de R y S sean 1, 1,5 y 2). Estas
reglas R y S pueden tener diferentes valores. Además, dik es la
distancia que separa el k-ésimo vector de código del i-ésimo
subvector de fuente de sonido. Los medios de selección de código
1407 seleccionan el vector de código que tiene la distancia mínima
de todas las distancias calculadas mediante la fórmula (15) o
similar, y codifica el índice del mismo. Por ejemplo, cuando diu es
el valor mínimo, el índice que se va a codificar para el i-ésimo
subvector es u. Los medios de generación de residuo 1408 generan
subvectores residuales 1410 mediante los vectores de código
seleccionados por los medios de selección de código 1407, según la
fórmula
(16)
en la que el j-ésimo elemento del i-ésimo
subvector residual 1410 es resi(j), y el j-ésimo elemento
del vector de código seleccionado por los medios de selección de
código 1407 es cu(j). Los subvectores residuales 1410 se
conservan como coeficientes MDCT para ser cuantificados por las
subsiguientes unidades de subcuantificación, efectuando el
procedimiento inverso de la fórmula (14) o similar. No obstante,
cuando la banda que se está cuantificando no influye en las
subsiguientes unidades de subcuantificación, es decir, cuando no se
necesitan las subsiguientes unidades de subcuantificación para
llevar a cabo la cuantificación, los medios de generación de
residuo 1408, los subvectores residuales 1410 y la generación de
los coeficientes MDCT 1411 no son necesarios. Aunque el número de
vectores de código incluidos en el libro de códigos 1409 no se
indica, cuando se tiene en cuenta la capacidad de memoria, el
tiempo de cálculo y similares, el número deseado es de alrededor de
64.
Existe otra forma de realización del
cuantificador de vectores 1405 con la estructura descrita a
continuación. Los medios de cálculo de distancia 1406 calculan la
distancia utilizando la fórmula (17)
en la que K es el número total de vectores de
código utilizados para la recuperación de códigos del libro de
códigos
1409.
Los medios de selección de código 1407
seleccionan el valor de k que proporciona el valor mínimo de la
distancia dik calculada en la fórmula (17) y codifican el índice
del mismo. En este caso, k es un valor que oscila entre 0 y
2K-1. Los medios de generación de residuo 1408
generan los subvectores residuales 1410 utilizando la fórmula
(18).
Aunque el número de vectores de código incluidos
en el libro de códigos 1409 no está limitado, cuando se tienen en
cuenta la capacidad de memoria, el tiempo de cálculo y cuestiones
similares, es deseable que sea de alrededor de 64.
Además, aunque los subvectores de ponderación
1404 se generan a partir de los componentes normalizados 1402, es
posible generar subvectores de ponderación multiplicando los
subvectores de ponderación 1404 por una ponderación que tenga en
cuenta la característica auditiva de los seres humanos.
Forma de realización
9
A continuación, se describirá un aparato de
decodificación de señales de audio según una novena forma de
realización de la presente invención, en relación con las Figuras
20 a 24. Los índices proporcionados por el aparato de codificación 1
se dividen en términos generales en los índices proporcionados por
la unidad de normalización 104 y los índices proporcionados por la
unidad de cuantificación 105. Los índices proporcionados por la
unidad de normalización 104 se decodifican en la unidad de
normalización inversa 107 y los índices proporcionados por la
unidad de cuantificación 105 se decodifican en la unidad de
cuantificación inversa B106. La unidad de cuantificación inversa 106
puede efectuar la decodificación utilizando sólo una parte de los
índices proporcionados por la unidad de cuantificación 105.
Partiendo del supuesto de que la unidad de
cuantificación 105 tiene la estructura mostrada en la Figura 17, se
describe el caso en el que la cuantificación inversa se lleva a
cabo utilizando la unidad de cuantificación inversa que tiene la
estructura de la Figura 20. En la Figura 20, el número de
referencia 701 designa una primera unidad de cuantificación inversa
de componentes de banda baja. La primera unidad de cuantificación
inversa de componentes de banda baja 701 efectúa la decodificación
utilizando sólo los índices de los componentes de banda baja del
primer subcuantificador 501.
De este modo, independientemente de la cantidad
de datos transmitidos desde el aparato de codificación 1, puede
decodificarse una cantidad arbitraria de datos de la señal de audio
codificada y, en consecuencia, la cantidad de datos codificados
puede ser diferente de la cantidad de datos decodificados. Por lo
tanto, la cantidad de datos que se van a decodificar puede variarse
según el entorno de comunicación del sector de recepción,
pudiéndose obtener un sonido estable de alta definición y calidad
aun cuando se utilice una red telefónica pública corriente.
La Figura 21 es un diagrama que muestra la
estructura de la unidad de cuantificación inversa incluida en el
aparato de decodificación de señales de audio, que se emplea cuando
la cuantificación inversa se lleva a cabo en dos etapas. En la
Figura 21, el número de referencia 704 designa una segunda unidad
de cuantificación inversa. Esta segunda unidad de cuantificación
inversa 704 lleva a cabo la decodificación utilizando los índices
de la segunda unidad de subcuantificación 502. En consecuencia, la
salida de la primera unidad de cuantificación inversa de
componentes de banda baja 701 y la salida de la segunda unidad de
cuantificación inversa 704 se suman y la suma se obtiene desde la
unidad de cuantificación inversa 106. Esta suma se lleva a cabo en
la misma banda que la banda cuantificada por cada unidad de
subcuantificación en la cuantificación.
Como se ha descrito anteriormente, los índices de
la primera unidad de subcuantificación (banda baja) se decodifican
en la primera unidad de cuantificación inversa de componentes de
banda baja 701 y, una vez que los índices de la segunda unidad de
subcuantificación se han sometido a cuantificación inversa, la
salida de la primera unidad de cuantificación inversa de
componentes de banda baja 701 se suma a los mismos, es decir, la
cuantificación inversa se lleva a cabo en dos etapas. Por
consiguiente, la señal de audio cuantificada en varias etapas puede
decodificarse con precisión, obteniéndose un sonido de más alta
calidad.
Además, la Figura 22 es un diagrama que ilustra
la estructura de la unidad de cuantificación inversa incluida en el
aparato de decodificación de señales de audio, en el que la banda
objeto de procesamiento se amplía cuando se lleva a cabo la
cuantificación inversa de dos etapas. En la Figura 22, el número de
referencia 702 designa una primera unidad de cuantificación inversa
de componentes de banda intermedia. Esta primera unidad de
cuantificación inversa de componentes de banda intermedia 702 lleva
a cabo la decodificación utilizando los índices de los componentes
de banda intermedia de la primera unidad de subcuantificación 501.
En consecuencia, la salida de la primera unidad de cuantificación
inversa de componentes de banda baja 701, la salida de la segunda
unidad de cuantificación inversa 704 y la salida de la primera
unidad de cuantificación inversa de componentes de banda intermedia
702 se suman y la suma se obtiene desde la unidad de cuantificación
inversa 106. Esta suma se lleva a cabo en la misma banda que la
banda cuantificada por cada unidad de subcuantificación en la
cuantificación. De este modo, la banda del sonido reproducido se
amplía y se reproduce una señal de audio de más alta calidad.
Además, la Figura 23 es un diagrama que muestra
la estructura de la unidad de cuantificación inversa incluida en el
aparato de decodificación de señales de audio, en el que la
cuantificación inversa se lleva a cabo en tres etapas mediante dicha
unidad de cuantificación inversa que tiene la estructura de la
Figura 22. En la Figura 23, el número de referencia 705 designa una
tercera unidad de cuantificación inversa. La tercera unidad de
cuantificación inversa 705 lleva a cabo la decodificación utilizando
los índices de la tercera unidad de subcuantificación 503. En
consecuencia, la salida de la primera unidad de cuantificación
inversa de componentes de banda baja 701, la salida de la segunda
unidad de cuantificación inversa 704, la salida de la primera unidad
de cuantificación inversa de componentes de banda intermedia 702 y
la salida de la tercera unidad de cuantificación inversa 705 se
suman, y la suma se obtiene desde la unidad de cuantificación
inversa 106. Esta suma se lleva a cabo en la misma banda que la
banda cuantificada por cada unidad de subcuantificación en la
cuantificación.
Además, la Figura 24 es un diagrama que ilustra
la estructura de la unidad de cuantificación inversa incluida en el
aparato de decodificación de señales de audio, en el que la banda
objeto de procesamiento se amplía cuando se lleva a cabo la
cuantificación inversa de tres etapas en la unidad de cuantificación
inversa que tiene la estructura de la Figura 23. En la Figura 24,
el número de referencia 703 designa una primera unidad de
cuantificación inversa de componentes de banda alta. Esta primera
unidad de cuantificación inversa de componentes de banda alta 703
lleva a cabo la decodificación utilizando los índices de los
componentes de banda alta de la primera unidad de subcuantificación
501. En consecuencia, la salida de la primera unidad de
cuantificación inversa de componentes de banda baja 701, la salida
de la segunda unidad de cuantificación inversa 704, la salida de la
primera unidad de cuantificación inversa de componentes de banda
intermedia 702, la salida de la tercera unidad de cuantificación
inversa 705 y la salida de la primera unidad de cuantificación
inversa de componentes de banda alta 703 se suman y la suma se
obtiene desde la unidad de cuantificación inversa 106. Esta suma se
lleva a cabo en la misma banda que la banda cuantificada por cada
unidad de subcuantificación en la cuantificación.
Aunque esta novena forma de realización se
describe para el caso en el que la unidad de decodificación 106
efectúa la decodificación inversa de los datos cuantificados por la
unidad de cuantificación 105 que tiene la estructura de la Figura 7,
también es posible llevar a cabo una cuantificación inversa similar
aunque la unidad de cuantificación 105 tenga la estructura mostrada
en la Figura 16 ó 18.
Además, cuando la codificación se lleva a cabo
utilizando la unidad de cuantificación que tiene la estructura
mostrada en la Figura 17 y la decodificación se lleva a cabo
utilizando la unidad de cuantificación inversa que tiene la
estructura mostrada en la Figura 24, como se muestra en la Figura
25, una vez que se ha efectuado la cuantificación inversa de los
índices de banda baja de la primera unidad de subcuantificación, se
efectúa la cuantificación inversa de los índices de la segunda
unidad de subcuantificación 502 en la siguiente etapa y la
cuantificación inversa de los índices de banda intermedia de la
primera unidad de subcuantificación. De esta forma, la
cuantificación inversa para ampliar la banda y la cuantificación
inversa para reducir el error de cuantificación se repiten de forma
alternada. No obstante, cuando una señal codificada por la unidad de
cuantificación que tiene la estructura mostrada en la Figura 16 se
decodifica utilizando la unidad de cuantificación inversa que tiene
la estructura mostrada en la Figura 24, puesto que no existen bandas
divididas, los coeficientes cuantificados son decodificados de
forma sucesiva por la unidad de cuantificación inversa en la
siguiente etapa.
A continuación, se describe con detalle el
funcionamiento de la unidad de cuantificación inversa 107 que forma
parte del aparato de decodificación de señales de audio 2, en
relación con la Figura 1 y la Figura 26.
Por ejemplo, la unidad de cuantificación inversa
107 se compone de la primera unidad de cuantificación inversa de
banda baja 701 cuando tiene la unidad de cuantificación inversa
mostrada en la Figura 20, y se compone de dos unidades de
cuantificación inversa (la primera unidad de cuantificación inversa
de banda baja 701 y la segunda unidad de cuantificación inversa
704) cuando tiene la unidad de cuantificación inversa mostrada en la
Figura 21.
El cuantificador inverso de vectores 1501
reproduce los coeficientes MDCT mediante los índices de la unidad
de cuantificación de vectores 105. Cuando la unidad de
subcuantificación tiene la estructura mostrada en la Figura 20, la
cuantificación inversa se lleva a cabo de la forma descrita a
continuación. Se decodifica un número de índice y se selecciona un
vector de código del libro de códigos 1502 que tiene este número.
Se supone que el contenido del libro de códigos 1502 es idéntico al
del libro de códigos del aparato de codificación. El vector de
código seleccionado se convierte, como vector reproducido 1503, en
un coeficiente MDCT 1504 sometido a cuantificación inversa mediante
el procedimiento inverso de la fórmula (14).
Cuando la unidad de subcuantificación tiene la
estructura mostrada en la Figura 21, la cuantificación inversa se
lleva a cabo de la forma descrita a continuación. Se decodifica un
número de índice k y se selecciona un vector de código del libro de
códigos 1502 que tiene el número u calculado en la fórmula
(19).
Se genera un subvector reproducido mediante la
fórmula (20)
en la que el j-ésimo elemento del i-ésimo
subvector reproducido es
resi(j).
A continuación, se describe con detalle la
estructura de la unidad de normalización inversa 107 que forma
parte del aparato de decodificación de señales de audio B2, en
relación con la Figura 1 y la Figura 27. En la Figura 27, el número
de referencia 1201 designa una unidad de normalización inversa de
perfil de frecuencias, 1202 designa una unidad de normalización
inversa de amplitud de banda y 1203 designa una tabla de bandas. La
unidad de normalización inversa de perfil de frecuencias 1201 recibe
los índices de la unidad de normalización de perfil de frecuencias
1201, reproduce el perfil de frecuencias y multiplica la salida de
la unidad de cuantificación inversa 106 por el perfil de
frecuencias. La unidad de normalización inversa de amplitud de
banda 1202 recibe los índices de la unidad de normalización de
amplitud de banda 202 y restaura la amplitud de cada banda mostrada
en la tabla de bandas 1203, mediante multiplicación. Suponiendo que
el valor de cada banda restaurada mediante los índices de la unidad
de normalización de amplitud de banda B202 es qavej, el
funcionamiento de la unidad de normalización inversa de amplitud de
banda 1202 viene proporcionado por la fórmula (12)
en la que la salida de la unidad de normalización
inversa de perfil de frecuencias 1201 es n_dct(i) y la
salida de la unidad de normalización inversa de amplitud de banda
1202 es dct(i). Además, la tabla de bandas 1203 y la tabla de
bandas 203 son
idénticas.
A continuación, se describe con detalle la
estructura de la unidad de normalización inversa de perfil de
frecuencias 1201 que forma parte del aparato de decodificación de
señales de audio 2, en relación con la Figura 28. En la Figura 28,
el número de referencia 1301 designa una unidad de cuantificación
inversa de perfil y 1302 designa una unidad de cuantificación
inversa de características de envolvente. La unidad de
cuantificación inversa de perfil 1301 restaura los parámetros que
presentan el perfil de frecuencias (por ejemplo, los coeficientes
de predicción lineal), utilizando los índices de la unidad de
cuantificación de perfil 301 en el aparato de codificación. Cuando
los coeficientes restaurados son coeficientes de predicción lineal,
las características de envolvente cuantificadas se restauran
mediante un cálculo similar con la fórmula (8). Cuando los
coeficientes restaurados no son coeficientes de predicción lineal
(por ejemplo, cuando son coeficientes LSP), las características de
envolvente se restauran efectuando su transformación en
características de frecuencia. La unidad de cuantificación inversa
de características de envolvente 1302 multiplica las
características de envolvente restauradas por la salida de la unidad
de cuantificación inversa 106 de la forma mostrada en la fórmula
(13), proporcionando el siguiente resultado:
Claims (36)
1. Procedimiento de codificación de señales de
audio para codificar una cantidad de datos mediante cuantificación
vectorial, utilizando un método de cuantificación de varias etapas
que comprende un primer método de cuantificación vectorial para
efectuar la cuantificación vectorial de una secuencia de señales de
característica de frecuencia que se obtiene mediante la
transformación de la frecuencia de la señal de audio de entrada, y
un segundo método de cuantificación vectorial para efectuar la
cuantificación vectorial del componente de error de cuantificación
del primer método de cuantificación vectorial;
en el que, basándose en el espectro de la señal
de audio de entrada y la característica de sensibilidad auditiva
que muestra la capacidad auditiva de los seres humanos, se
selecciona uno de los bloques de frecuencias del componente de error
de cuantificación del primer método de cuantificación vectorial que
tiene gran importancia para la cuantificación y, en el segundo
método de cuantificación vectorial, se cuantifica el componente de
error de cuantificación del primer método de cuantificación respecto
del bloque de frecuencias seleccionado.
2. Procedimiento de codificación de señales de
audio para codificar una cantidad de datos mediante cuantificación
vectorial, utilizando un método de cuantificación de varias etapas
que comprende un método de cuantificación vectorial de primera etapa
para efectuar la cuantificación vectorial de una secuencia de
señales característica de frecuencia que se obtiene mediante la
transformación de la frecuencia de la señal de audio de entrada, y
métodos de cuantificación vectorial de segunda etapa y siguientes
para efectuar la cuantificación vectorial del componente de error
de cuantificación del método de cuantificación vectorial de la etapa
anterior;
en el que, entre las diversas etapas de los
métodos de cuantificación según el método de cuantificación de
varias etapas, por lo menos un método de cuantificación vectorial
lleva a cabo la cuantificación vectorial utilizando, como
coeficientes de ponderación para la cuantificación, coeficientes de
ponderación en frecuencia calculados basándose en el espectro de la
señal de audio de entrada y la característica de sensibilidad
auditiva que muestra la capacidad auditiva de los seres humanos;
y
basándose en el espectro de la señal de audio de
entrada y la característica de sensibilidad auditiva que muestra la
capacidad auditiva de los seres humanos, se selecciona uno de los
bloques de frecuencias del componente de error del método de
cuantificación vectorial de la primera etapa que tiene gran
importancia para la cuantificación y, en el método de
cuantificación vectorial de la segunda etapa, se cuantifica el
componente de error de cuantificación del método de cuantificación
de la primera etapa con respecto al bloque de frecuencias
seleccionado.
3. Aparato de codificación de señales de audio,
que comprende:
una unidad de transformación
tiempo-frecuencia (103) para transformar una señal
de audio de entrada en una señal del dominio de la frecuencia;
una unidad de cálculo de envolvente espectral
para calcular la envolvente espectral de la señal de audio de
entrada;
una unidad de normalización (104) para normalizar
la señal del dominio de la frecuencia obtenida en la unidad de
transformación tiempo-frecuencia (103) con la
envolvente espectral obtenida en la unidad de cálculo de envolvente
espectral y obtener, de ese modo, una señal residual;
una unidad de cálculo de ponderación auditiva
(4006) para calcular coeficientes de ponderación en frecuencia,
basándose en el espectro de la señal de audio de entrada y la
característica de sensibilidad auditiva que muestra la capacidad
auditiva de los seres humanos; y
una unidad de cuantificación de varias etapas
(4005) que tiene diversas etapas de unidades de cuantificación
vectorial conectadas en columnas, que recibe la señal residual
normalizada y en la que por lo menos una de las unidades de
cuantificación vectorial lleva a cabo la cuantificación utilizando
los coeficientes de ponderación obtenidos en la unidad de
ponderación.
4. Aparato de codificación de señales de audio
según la reivindicación 3, en el que una pluralidad de unidades de
cuantificación (40051, 40052 y 40053) de las diversas etapas de la
unidad de cuantificación de varias etapas (4005) lleva a cabo la
cuantificación utilizando los coeficientes de ponderación obtenidos
en la unidad de ponderación (4006), y dicha unidad de cálculo de
ponderación auditiva (4006) calcula los coeficientes de ponderación
individuales que van a ser utilizados en las diversas etapas de las
unidades de cuantificación (4005), respectivamente.
5. Aparato de codificación de señales de audio
según la reivindicación 4,
en el que dicha unidad de cuantificación de
varias etapas (4005) comprende:
una unidad de cuantificación de primera etapa
para cuantificar la señal residual normalizada por la unidad de
normalización, utilizando la envolvente espectral obtenida en la
unidad de cálculo de envolvente espectral como coeficientes de
ponderación en los respectivos dominios de frecuencia;
una unidad de cuantificación de segunda etapa
para cuantificar una señal de error de cuantificación de la unidad
de cuantificación de primera etapa, utilizando los coeficientes de
ponderación calculados basándose en la correlación entre la
envolvente espectral y la señal de error de cuantificación de la
unidad de cuantificación de la primera etapa, como coeficientes de
ponderación en los respectivos dominios de frecuencia y
una unidad de cuantificación de la tercera etapa
para cuantificar una señal de error de cuantificación de la unidad
de cuantificación de segunda etapa, utilizando como coeficientes de
ponderación en los respectivos dominios de frecuencia los
coeficientes de ponderación obtenidos ajustando los coeficientes de
ponderación calculados por la unidad de cálculo de ponderación
auditiva (4006), según la señal de entrada transformada en una
señal del dominio de la frecuencia por la unidad de transformación
tiempo-frecuencia (103) y la característica
auditiva, basándose en la envolvente espectral, la señal de error
de cuantificación de la unidad de cuantificación de segunda etapa y
la señal residual normalizada por la unidad de normalización.
6. Aparato de codificación de señales de audio,
que comprende:
una unidad de transformación
tiempo-frecuencia (103) para transformar una señal
de audio de entrada en una señal del dominio de la frecuencia;
una unidad de cálculo de envolvente espectral
para calcular la envolvente espectral de la señal de audio de
entrada;
una unidad de normalización (104) para normalizar
la señal de dominio de la frecuencia obtenida en la unidad de
transformación tiempo-frecuencia (103), con la
envolvente espectral obtenida en la unidad de cálculo de envolvente
espectral para obtener, de ese modo, una señal residual;
un primer cuantificador de vectores para
cuantificar la señal residual normalizada por la unidad de
normalización (104);
medios de selección auditiva para seleccionar uno
de los bloques de frecuencias del componente de error de
cuantificación del primer cuantificador de vectores que tiene gran
importancia para la cuantificación, basándose en el espectro de la
señal de audio de entrada y la característica de sensibilidad
auditiva que muestra la capacidad auditiva de los seres humanos,
y
un segundo cuantificador para cuantificar el
componente de error de cuantificación del primer cuantificador de
vectores con respecto al bloque de frecuencias seleccionado por los
medios de selección auditiva.
7. Aparato de codificación de señales de audio
según la reivindicación 6, en el que dichos medios de selección
auditiva seleccionan un bloque de frecuencias utilizando, como
escala de importancia para cuantificar, un valor obtenido
multiplicando el componente de error de cuantificación del primer
cuantificador de vectores, la señal de envolvente espectral
obtenida en la unidad de cálculo de envolvente espectral y la
característica inversa de la característica de límite audible
mínimo.
8. Aparato de codificación de señales de audio
según la reivindicación 6, en el que dichos medios de selección
auditiva seleccionan un bloque de frecuencias utilizando, como
escala de importancia para cuantificar, un valor obtenido
multiplicando la señal de envolvente espectral obtenida en la
unidad de cálculo de envolvente espectral y la característica
inversa de la característica de límite audible mínimo.
9. Aparato de codificación de señales de audio
según la reivindicación 6, en el que dichos medios de selección
auditiva seleccionan un bloque de frecuencias utilizando, como
escala de importancia para cuantificar, un valor obtenido
multiplicando el componente de error de cuantificación del primer
cuantificador de vectores, la señal de envolvente espectral
obtenida en la unidad de cálculo de envolvente espectral y la
característica inversa de la característica obtenida sumando la
característica de límite audible mínimo y la característica de
enmascaramiento calculada a partir de la señal de entrada.
10. Aparato de codificación de señales de audio
según la reivindicación 6, en el que dichos medios de selección
auditiva seleccionan un bloque de frecuencias utilizando, como
escala de importancia para cuantificar, un valor obtenido
multiplicando el componente de error de cuantificación del primer
cuantificador de vectores, la señal de envolvente espectral
obtenida en la unidad de cálculo de envolvente espectral y la
característica inversa de la característica obtenida sumando la
característica de límite audible mínimo y la característica de
enmascaramiento que se calcula a partir de la señal de entrada y se
corrige de conformidad con la señal residual normalizada por la
unidad de normalización, la señal de envolvente espectral obtenida
en la unidad de cálculo de envolvente espectral y la señal de error
de cuantificación de la unidad de cuantificación de primera
etapa.
11. Aparato de codificación de señales de audio
para codificar una cantidad de datos mediante cuantificación
vectorial, utilizando medios de cuantificación de varias etapas
(4005) que comprenden un primer cuantificador de vectores para
efectuar la cuantificación vectorial de una señal de característica
de frecuencia obtenida mediante la transformación de la frecuencia
de una señal de audio de entrada, y un segundo cuantificador de
vectores para efectuar la cuantificación vectorial del componente de
error de cuantificación del primer cuantificador de vectores,
en el que dichos medios de cuantificación de
varias etapas (4005) dividen la secuencia de señales de
característica de frecuencia en cadenas de coeficientes
correspondientes a por lo menos dos bandas de frecuencias, y cada
uno de los cuantificadores de vectores lleva a cabo la
cuantificación, de forma independiente, utilizando una pluralidad de
cuantificadores de vectores divididos que se preparan adecuadamente
para las respectivas cadenas de coeficientes.
12. Aparato de codificación de señales de audio
según la reivindicación 11, que comprende además medios de
normalización para normalizar la secuencia de señales de
característica de frecuencia.
13. Aparato de codificación de señales de audio
según la reivindicación 11, en el que dichos medios de
cuantificación seleccionan de forma adecuada una de las bandas de
frecuencias de la secuencia de señales de característica de
frecuencia que se van a cuantificar que tiene una suma aditiva de
energía elevada del error de cuantificación, y a continuación
cuantifican la banda seleccionada.
14. Aparato de codificación de señales de audio
según la reivindicación 11, en el que dichos medios de
cuantificación seleccionan de forma adecuada una de las bandas de
frecuencias de la secuencia de señales de característica de
frecuencia que se van a cuantificar, basándose en la característica
de sensibilidad auditiva que muestra la capacidad auditiva de los
seres humanos, teniendo dicha banda de frecuencias una suma aditiva
de energía elevada del error de cuantificación, que se pondera
asignando valores altos a las bandas cuya característica de
sensibilidad auditiva tiene gran importancia, y a continuación los
medios de cuantificación cuantifican la banda seleccionada.
15. Aparato de codificación de señales de audio
según la reivindicación 11, en el que dichos medios de
cuantificación tienen un cuantificador de vectores que funciona
como una unidad de cuantificación de banda completa que cuantifica,
por lo menos una vez, todas las bandas de frecuencias de la
secuencia de señales de característica de frecuencia que se van a
cuantificar.
16. Aparato de codificación de señales de audio
según la reivindicación 11, en el que dichos medios de
cuantificación se construyen de tal forma que el cuantificador de
vectores de primera etapa calcula el error de cuantificación de la
cuantificación vectorial utilizando un método de cuantificación
vectorial con un libro de códigos y, además, el cuantificador de
vectores de segunda etapa efectúa la cuantificación vectorial del
error de cuantificación calculado.
17. Aparato de codificación de señales de audio
según la reivindicación 16, en el que, como método de
cuantificación vectorial, se utilizan vectores de código (todos o
parte de los cuales están invertidos) para la recuperación de
códigos.
18. Aparato de codificación de señales de audio
según la reivindicación 16, que comprende además medios de
normalización para normalizar la secuencia de señales de
característica de frecuencia, en el que el cálculo de las distancias
utilizadas para la recuperación de un código óptimo en la
cuantificación vectorial se lleva a cabo calculando las distancias
mediante ponderaciones constituidas por los componentes normalizados
de la señal de entrada procesados en la unidad de normalización y
extrayendo el código que tiene una distancia mínima.
19. Aparato de codificación de señales de audio
según la reivindicación 18, en el que las distancias se calculan
mediante ponderaciones constituidas tanto por los componentes
normalizados de la secuencia de señales de característica de
frecuencia procesadas por los medios de normalización como por un
valor que tiene en cuenta la característica de sensibilidad
auditiva que muestra la capacidad auditiva de los seres humanos, y
en el que se extrae el código que tiene la mínima distancia.
20. Aparato de codificación de señales de audio
según la reivindicación 12, en el que dichos medios de
normalización tienen una unidad de normalización de perfil de
frecuencias que normaliza de forma aproximada el perfil de la
secuencia de señales de característica de frecuencia.
21. Aparato de codificación de señales de audio
según la reivindicación 12, en el que dichos medios de
normalización tienen una unidad de normalización de amplitud de
banda que divide la secuencia de señales de característica de
frecuencia en una pluralidad de componentes de bandas unitarias
continuas, y normalizan la secuencia de señales dividiendo cada
banda unitaria con un solo valor.
22. Aparato de codificación de señales de audio
según la reivindicación 11, en el que dichos medios de
cuantificación incluyen un cuantificador de vectores para
cuantificar las respectivas cadenas de coeficientes de la secuencia
de señales de característica de frecuencia de forma independiente
mediante cuantificadores de vectores divididos, e incluyen un
cuantificador de vectores que funciona como una unidad de
cuantificación de banda completa que cuantifica, por lo menos una
vez, todas las bandas de frecuencia de la señal de entrada que se
va a cuantificar.
23. Aparato de codificación de señales de audio
según la reivindicación 22,
en el que dichos medios de cuantificación
comprenden un primer cuantificador de vectores que comprende un
cuantificador de vectores divididos de banda baja, un cuantificador
de vectores divididos de banda intermedia y un cuantificador de
vectores divididos de banda alta, un segundo cuantificador de
vectores conectado después del primer cuantificador, y un tercer
cuantificador de vectores conectado después del segundo
cuantificador;
la secuencia de señales de característica de
frecuencia introducida en los medios de cuantificación se divide en
tres bandas, y la secuencia de señales de característica de
frecuencia del componente de banda baja de entre las tres bandas es
cuantificada por el cuantificador de vectores divididos de banda
baja, la secuencia de señales de característica de frecuencia del
componente de banda intermedia de entre las tres bandas es
cuantificada por el cuantificador de vectores divididos de banda
intermedia y la secuencia de señales de característica de
frecuencia del componente de banda alta de entre las tres bandas es
cuantificada por el cuantificador de vectores divididos de banda
alta, de forma independiente;
el error de cuantificación con respecto a la
secuencia de señales de característica de frecuencia se calcula en
cada uno de los cuantificadores de vectores divididos que
constituyen el primer cuantificador de vectores y el error de
cuantificación se introduce en el subsiguiente segundo
cuantificador de vectores;
el segundo cuantificador de vectores efectúa la
cuantificación para el ancho de banda que va a ser cuantificado por
el segundo cuantificador de vectores, calcula el error de
cuantificación con respecto a la entrada del segundo cuantificador
de vectores y lo proporciona al tercer cuantificador de vectores;
y
el tercer cuantificador de vectores efectúa la
cuantificación para el ancho de banda que va a ser cuantificado por
el tercer cuantificador de vectores.
24. Aparato de codificación de señales de audio
según la reivindicación 23, que comprende además una primera unidad
de selección de banda de cuantificación entre el primer
cuantificador de vectores y el segundo cuantificador de vectores, y
una segunda unidad de selección de banda de cuantificación entre el
segundo cuantificador de vectores y el tercer cuantificador de
vectores;
en el que la salida del primer cuantificador de
vectores se introduce en la primera unidad de selección de banda de
cuantificación, y se selecciona la banda que va a ser cuantificada
por el segundo cuantificador de vectores en la primera unidad de
selección de banda de cuantificación;
el segundo cuantificador de vectores lleva a cabo
la cuantificación para el ancho de banda que va a ser cuantificado
por el segundo cuantificador de vectores, con respecto a los
errores de cuantificación de los tres primeros cuantificadores de
error seleccionados por la primera unidad de selección de banda de
cuantificación, calcula el error de cuantificación con respecto a
la entrada del segundo cuantificador de vectores y lo proporciona a
la segunda unidad de selección de banda de cuantificación;
la segunda unidad de selección de banda de
cuantificación selecciona la banda que va a ser cuantificada por el
tercer cuantificador de vectores; y
el tercer cuantificador de vectores efectúa la
cuantificación para la banda seleccionada por la segunda unidad de
selección de banda de cuantificación.
25. Aparato de codificación de señales de audio
según la reivindicación 23, en el que, en lugar del primer
cuantificador de vectores, se construye el segundo cuantificador de
vectores o el tercer cuantificador de vectores utilizando el
cuantificador de vectores divididos de banda baja, el cuantificador
de vectores divididos de banda intermedia y el cuantificador de
vectores divididos de banda alta.
26. Aparato de decodificación de señales de audio
que recibe como entrada los códigos proporcionados por el aparato
de codificación de señales de audio según la reivindicación 11,
decodifica estos códigos para generar una señal correspondiente a
la señal de audio de entrada original y comprende:
una unidad de cuantificación inversa para
efectuar la cuantificación inversa utilizando, por lo menos, una
parte de los códigos proporcionados por los medios de
cuantificación del aparato de codificación de señales de audio;
y
una unidad de transformación de frecuencia
inversa para transformar una secuencia de señales de característica
de frecuencia proporcionada por la unidad de cuantificación inversa
en una señal correspondiente a la señal de audio de entrada
original.
27. Aparato de decodificación de señales de audio
que recibe como entrada los códigos proporcionados por el aparato
de codificación de señales de audio según la reivindicación 13,
decodifica estos códigos para generar una señal correspondiente a
la señal de audio de entrada original y comprende;
una unidad de cuantificación inversa para
reproducir una secuencia de señales de característica de
frecuencia;
una unidad de normalización inversa para
reproducir los componentes normalizados basándose en los códigos
proporcionados por el aparato de codificación de señales de audio,
utilizando la secuencia de señales de característica de frecuencia
proporcionada por la unidad de cuantificación inversa y
multiplicando la secuencia de señales de característica de
frecuencia y los componentes normalizados; y
\newpage
una unidad de transformación de frecuencia
inversa para recibir la salida de la unidad de normalización
inversa y transformar la secuencia de señales de característica de
frecuencia en una señal correspondiente a la señal de audio
original.
28. Aparato de decodificación de señales de audio
que recibe como entrada los códigos proporcionados por el aparato
de codificación de señales de audio según la reivindicación 22,
decodifica estos códigos para generar una señal correspondiente a
la señal de audio original y comprende:
una unidad de cuantificación inversa que efectúa
la cuantificación inversa utilizando los códigos obtenidos, ya sea
de todos los cuantificadores de vectores que constituyen los medios
de cuantificación del aparato de codificación de señales de audio o
bien de algunos de ellos.
29. Aparato de decodificación de señales de audio
según la reivindicación 28, en el que:
dicha unidad de cuantificación inversa efectúa la
cuantificación inversa de los códigos cuantificados en una banda
establecida ejecutando, de forma alternada, la cuantificación
inversa de los códigos cuantificados en la siguiente etapa y la
cuantificación inversa de los códigos cuantificados en una banda
diferente de la establecida;
cuando no hay ningún código cuantificado en la
siguiente etapa durante la cuantificación inversa, la unidad de
cuantificación inversa ejecuta de forma continuada la
cuantificación inversa de los códigos cuantificados en la banda
diferente; y
cuando no hay ningún código cuantificado en la
banda diferente, la unidad de cuantificación inversa ejecuta de
forma continuada la cuantificación inversa de los códigos
cuantificados en la siguiente etapa.
30. Aparato de decodificación de señales de audio
que recibe como entrada los códigos proporcionados por el aparato
de codificación de señales de audio según la reivindicación 23,
decodifica estos códigos para generar una señal correspondiente a
la señal de audio de entrada original y comprende:
una unidad de cuantificación inversa que efectúa
la cuantificación inversa utilizando sólo los códigos
proporcionados por el cuantificador de vectores divididos de banda
baja que forma parte del primer cuantificador de vectores, aun
cuando todos o parte de los tres cuantificadores de vectores
divididos que constituyen el primer cuantificador de vectores del
aparato de codificación de señales de audio generen códigos.
31. Aparato de decodificación de señales de audio
según la reivindicación 30, en el que dicha unidad de
cuantificación inversa efectúa la cuantificación inversa utilizando
códigos proporcionados por el segundo cuantificador de vectores,
además de los códigos proporcionados por el cuantificador de
vectores divididos de banda baja que forma parte del primer
cuantificador de vectores.
32. Aparato de decodificación de señales de audio
según la reivindicación 31, en el que dicha unidad de
cuantificación inversa lleva a cabo la cuantificación inversa
utilizando códigos proporcionados por el cuantificador de vectores
divididos de banda intermedia, que forma parte del primer
cuantificador de vectores, además de los códigos proporcionados por
el cuantificador de vectores divididos de banda baja, que forma
parte del primer cuantificador de vectores, y los códigos
proporcionados por el segundo cuantificador de vectores.
33. Aparato de decodificación de señales de audio
según la reivindicación 32, en el que dicha unidad de
cuantificación inversa lleva a cabo la cuantificación inversa
utilizando los códigos proporcionados por el tercer cuantificador de
vectores, además de los códigos proporcionados por el cuantificador
de vectores divididos de banda baja, que forma parte del primer
cuantificador de vectores, los códigos proporcionados por el segundo
cuantificador de vectores y los códigos proporcionados por el
cuantificador de vectores divididos de banda intermedia, que forma
parte del primer cuantificador de vectores.
34. Aparato de decodificación de señales de audio
según la reivindicación 33, en el que dicha unidad de
cuantificación inversa efectúa la cuantificación inversa utilizando
códigos proporcionados por el cuantificador de vectores divididos de
banda alta, que forma parte del primer cuantificador de vectores,
además de los códigos proporcionados por el cuantificador de
vectores divididos de banda baja, que forma parte del primer
cuantificador de vectores, los códigos proporcionados por el segundo
cuantificador de vectores, los códigos proporcionados por el
cuantificador de vectores divididos de banda intermedia, que forma
parte del primer cuantificador de vectores, y los códigos
proporcionados por el tercer cuantificador de vectores.
35. Procedimiento de codificación y
decodificación de señales de audio que recibe una secuencia de
señales de característica de frecuencia obtenida mediante la
transformación de la frecuencia de una señal de audio de entrada,
codifica y proporciona la señal codificada y decodifica la señal
codificada de salida para reproducir una señal correspondiente a la
señal de audio de entrada original:
en el que la secuencia de señales de
característica de frecuencia se divide en cadenas de coeficientes
correspondientes a por lo menos dos bandas de frecuencia, y estas
cadenas de coeficientes se cuantifican y proporcionan de forma
independiente; y
a partir de la señal cuantificada recibida, se
efectúa la cuantificación inversa de los datos de una banda
arbitraria correspondiente a la banda dividida para reproducir, de
ese modo, una señal correspondiente a la señal de audio de entrada
original,
en el que dicha cuantificación se lleva a cabo en
etapas y, a continuación, el error de cuantificación calculado es
sometido a una mayor cuantificación; y
dicha cuantificación inversa se efectúa
repitiendo, de forma alternada, una cuantificación destinada a
ampliar la banda y una cuantificación destinada a intensificar las
etapas de cuantificación en la cuantificación.
36. Procedimiento de codificación y
decodificación de señales de audio según la reivindicación 35, en
el que dicha cuantificación inversa destinada a ampliar la banda se
efectúa por orden según la característica psicológica auditiva de
los seres humanos.
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP17129696 | 1996-07-01 | ||
JP17129696A JP3246715B2 (ja) | 1996-07-01 | 1996-07-01 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
JP9240697 | 1997-04-10 | ||
JP9240697 | 1997-04-10 | ||
JP12584497 | 1997-05-15 | ||
JP12584497 | 1997-05-15 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2205238T3 true ES2205238T3 (es) | 2004-05-01 |
Family
ID=27307035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES97928529T Expired - Lifetime ES2205238T3 (es) | 1996-07-01 | 1997-07-01 | Procedimientos de codificacion y decodificacion de señales de audio, y codificador y decodificador de señales de audio. |
Country Status (8)
Country | Link |
---|---|
US (1) | US6826526B1 (es) |
EP (1) | EP0910067B1 (es) |
JP (1) | JP3246715B2 (es) |
KR (1) | KR100283547B1 (es) |
CN (1) | CN1156822C (es) |
DE (1) | DE69724126T2 (es) |
ES (1) | ES2205238T3 (es) |
WO (1) | WO1998000837A1 (es) |
Families Citing this family (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3344944B2 (ja) * | 1997-05-15 | 2002-11-18 | 松下電器産業株式会社 | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 |
US6904404B1 (en) | 1996-07-01 | 2005-06-07 | Matsushita Electric Industrial Co., Ltd. | Multistage inverse quantization having the plurality of frequency bands |
JP3246715B2 (ja) | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6370502B1 (en) * | 1999-05-27 | 2002-04-09 | America Online, Inc. | Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec |
KR100363259B1 (ko) * | 2000-05-16 | 2002-11-30 | 삼성전자 주식회사 | 인지 특성 가중 함수를 이용한 음성신호의 위상 양자화장치 및 방법 |
GB2396538B (en) * | 2000-05-16 | 2004-11-03 | Samsung Electronics Co Ltd | An apparatus and method for quantizing phase of speech signal using perceptual weighting function |
JP3426207B2 (ja) | 2000-10-26 | 2003-07-14 | 三菱電機株式会社 | 音声符号化方法および装置 |
EP1343143B1 (en) * | 2000-12-14 | 2011-10-05 | Sony Corporation | Analysis-synthesis of audio signal |
JP4300800B2 (ja) | 2000-12-22 | 2009-07-22 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びに記録媒体 |
DE10102159C2 (de) | 2001-01-18 | 2002-12-12 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erzeugen bzw. Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkasse, Codierer und skalierbarer Codierer |
DE60204038T2 (de) * | 2001-11-02 | 2006-01-19 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zum codieren bzw. decodieren eines audiosignals |
DE10328777A1 (de) * | 2003-06-25 | 2005-01-27 | Coding Technologies Ab | Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals |
CN1839426A (zh) * | 2003-09-17 | 2006-09-27 | 北京阜国数字技术有限公司 | 多分辨率矢量量化的音频编解码方法及装置 |
JP4609097B2 (ja) * | 2005-02-08 | 2011-01-12 | ソニー株式会社 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
JP4761506B2 (ja) * | 2005-03-01 | 2011-08-31 | 国立大学法人北陸先端科学技術大学院大学 | 音声処理方法と装置及びプログラム並びに音声システム |
MX2007012187A (es) * | 2005-04-01 | 2007-12-11 | Qualcomm Inc | Sistemas, metodos y aparatos para deformacion en tiempo de banda alta. |
TWI324336B (en) | 2005-04-22 | 2010-05-01 | Qualcomm Inc | Method of signal processing and apparatus for gain factor smoothing |
JP4635709B2 (ja) * | 2005-05-10 | 2011-02-23 | ソニー株式会社 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
CN100370834C (zh) * | 2005-08-08 | 2008-02-20 | 北京中星微电子有限公司 | 多模图像编解码芯片中的系数缩放计算模块 |
KR20080047443A (ko) * | 2005-10-14 | 2008-05-28 | 마츠시타 덴끼 산교 가부시키가이샤 | 변환 부호화 장치 및 변환 부호화 방법 |
WO2007114290A1 (ja) * | 2006-03-31 | 2007-10-11 | Matsushita Electric Industrial Co., Ltd. | ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法 |
JPWO2008047795A1 (ja) * | 2006-10-17 | 2010-02-25 | パナソニック株式会社 | ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法 |
US8886612B2 (en) * | 2007-10-04 | 2014-11-11 | Core Wireless Licensing S.A.R.L. | Method, apparatus and computer program product for providing improved data compression |
US8306817B2 (en) * | 2008-01-08 | 2012-11-06 | Microsoft Corporation | Speech recognition with non-linear noise reduction on Mel-frequency cepstra |
JP5262171B2 (ja) * | 2008-02-19 | 2013-08-14 | 富士通株式会社 | 符号化装置、符号化方法および符号化プログラム |
US9031243B2 (en) * | 2009-09-28 | 2015-05-12 | iZotope, Inc. | Automatic labeling and control of audio algorithms by audio recognition |
US20110145325A1 (en) * | 2009-12-16 | 2011-06-16 | Alcatel-Lucent Usa Inc. | Running an interactive multi-user application at a mobile terminal |
US20110145341A1 (en) * | 2009-12-16 | 2011-06-16 | Alcatel-Lucent Usa Inc. | Server platform to support interactive multi-user applications for mobile clients |
US8654859B1 (en) | 2009-12-17 | 2014-02-18 | Ambarella, Inc. | Low cost rate-distortion computations for video compression |
US20130030796A1 (en) * | 2010-01-14 | 2013-01-31 | Panasonic Corporation | Audio encoding apparatus and audio encoding method |
KR101850724B1 (ko) * | 2010-08-24 | 2018-04-23 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
CN103081007A (zh) * | 2010-09-17 | 2013-05-01 | 松下电器产业株式会社 | 量化装置及量化方法 |
KR101747917B1 (ko) * | 2010-10-18 | 2017-06-15 | 삼성전자주식회사 | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 |
JP5648123B2 (ja) | 2011-04-20 | 2015-01-07 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 音声音響符号化装置、音声音響復号装置、およびこれらの方法 |
WO2013035257A1 (ja) * | 2011-09-09 | 2013-03-14 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
JP6407150B2 (ja) * | 2013-06-11 | 2018-10-17 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音響信号の帯域幅拡張を行う装置及び方法 |
EP2830065A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
CN103714822B (zh) * | 2013-12-27 | 2017-01-11 | 广州华多网络科技有限公司 | 基于silk编解码器的子带编解码方法及装置 |
KR102132522B1 (ko) * | 2014-02-27 | 2020-07-09 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | 오디오/비디오 샘플 벡터의 피라미드 벡터 양자화 인덱싱 및 디인덱싱을 위한 방법 및 장치 |
EP2919232A1 (en) | 2014-03-14 | 2015-09-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and method for encoding and decoding |
SG10201808285UA (en) | 2014-03-28 | 2018-10-30 | Samsung Electronics Co Ltd | Method and device for quantization of linear prediction coefficient and method and device for inverse quantization |
CN112927703A (zh) | 2014-05-07 | 2021-06-08 | 三星电子株式会社 | 对线性预测系数量化的方法和装置及解量化的方法和装置 |
GB2538315A (en) * | 2015-05-15 | 2016-11-16 | Horseware Products Ltd | A closure system for the front end of a horse rug |
JP6475273B2 (ja) * | 2017-02-16 | 2019-02-27 | ノキア テクノロジーズ オーユー | ベクトル量子化 |
CN109036457B (zh) * | 2018-09-10 | 2021-10-08 | 广州酷狗计算机科技有限公司 | 恢复音频信号的方法和装置 |
CN113302688A (zh) * | 2019-01-13 | 2021-08-24 | 华为技术有限公司 | 高分辨率音频编解码 |
KR20210133554A (ko) * | 2020-04-29 | 2021-11-08 | 한국전자통신연구원 | 선형 예측 코딩을 이용한 오디오 신호의 부호화 및 복호화 방법과 이를 수행하는 부호화기 및 복호화기 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03228433A (ja) | 1990-02-02 | 1991-10-09 | Fujitsu Ltd | 多段ベクトル量子化方式 |
JP3114197B2 (ja) | 1990-11-02 | 2000-12-04 | 日本電気株式会社 | 音声パラメータ符号化方法 |
JPH0815261B2 (ja) | 1991-06-06 | 1996-02-14 | 松下電器産業株式会社 | 適応変換ベクトル量子化符号化法 |
JP3088163B2 (ja) | 1991-12-18 | 2000-09-18 | 沖電気工業株式会社 | Lsp係数の量子化方法 |
JPH05257498A (ja) * | 1992-03-11 | 1993-10-08 | Mitsubishi Electric Corp | 音声符号化方式 |
JPH0677840A (ja) | 1992-08-28 | 1994-03-18 | Fujitsu Ltd | ベクトル量子化装置 |
JPH06118998A (ja) * | 1992-10-01 | 1994-04-28 | Matsushita Electric Ind Co Ltd | ベクトル量子化装置 |
JP3239488B2 (ja) | 1992-11-30 | 2001-12-17 | 三菱電機株式会社 | 画像帯域分割符号化装置および画像帯域分割符号化方法 |
US5398069A (en) * | 1993-03-26 | 1995-03-14 | Scientific Atlanta | Adaptive multi-stage vector quantization |
CA2140779C (en) * | 1993-05-31 | 2005-09-20 | Kyoya Tsutsui | Method, apparatus and recording medium for coding of separated tone and noise characteristics spectral components of an acoustic signal |
JPH0764599A (ja) | 1993-08-24 | 1995-03-10 | Hitachi Ltd | 線スペクトル対パラメータのベクトル量子化方法とクラスタリング方法および音声符号化方法並びにそれらの装置 |
JPH07160297A (ja) * | 1993-12-10 | 1995-06-23 | Nec Corp | 音声パラメータ符号化方式 |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
JPH08123494A (ja) | 1994-10-28 | 1996-05-17 | Mitsubishi Electric Corp | 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置 |
JPH08137498A (ja) * | 1994-11-04 | 1996-05-31 | Matsushita Electric Ind Co Ltd | 音声符号化装置 |
JP3186013B2 (ja) * | 1995-01-13 | 2001-07-11 | 日本電信電話株式会社 | 音響信号変換符号化方法及びその復号化方法 |
JP3537008B2 (ja) | 1995-07-17 | 2004-06-14 | 株式会社日立国際電気 | 音声符号化通信方式とその送受信装置 |
JPH09127987A (ja) | 1995-10-26 | 1997-05-16 | Sony Corp | 信号符号化方法及び装置 |
JP3159012B2 (ja) * | 1995-10-26 | 2001-04-23 | 日本ビクター株式会社 | 音響信号の符号化装置及び復号化装置 |
JPH09281995A (ja) | 1996-04-12 | 1997-10-31 | Nec Corp | 信号符号化装置及び方法 |
US5809459A (en) * | 1996-05-21 | 1998-09-15 | Motorola, Inc. | Method and apparatus for speech excitation waveform coding using multiple error waveforms |
JP3246715B2 (ja) | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
-
1996
- 1996-07-01 JP JP17129696A patent/JP3246715B2/ja not_active Expired - Lifetime
-
1997
- 1997-07-01 WO PCT/JP1997/002271 patent/WO1998000837A1/ja active IP Right Grant
- 1997-07-01 CN CNB971957851A patent/CN1156822C/zh not_active Expired - Fee Related
- 1997-07-01 KR KR1019980709143A patent/KR100283547B1/ko not_active IP Right Cessation
- 1997-07-01 DE DE69724126T patent/DE69724126T2/de not_active Expired - Fee Related
- 1997-07-01 US US09/171,266 patent/US6826526B1/en not_active Expired - Lifetime
- 1997-07-01 ES ES97928529T patent/ES2205238T3/es not_active Expired - Lifetime
- 1997-07-01 EP EP97928529A patent/EP0910067B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
DE69724126D1 (de) | 2003-09-18 |
EP0910067B1 (en) | 2003-08-13 |
WO1998000837A1 (fr) | 1998-01-08 |
JP3246715B2 (ja) | 2002-01-15 |
DE69724126T2 (de) | 2004-06-09 |
JPH1020898A (ja) | 1998-01-23 |
KR100283547B1 (ko) | 2001-04-02 |
KR20000010994A (ko) | 2000-02-25 |
EP0910067A4 (en) | 2000-07-12 |
EP0910067A1 (en) | 1999-04-21 |
US6826526B1 (en) | 2004-11-30 |
CN1222997A (zh) | 1999-07-14 |
CN1156822C (zh) | 2004-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2205238T3 (es) | Procedimientos de codificacion y decodificacion de señales de audio, y codificador y decodificador de señales de audio. | |
ES2216367T3 (es) | Aparato de codificacion y de decodificacion de señales de audio. | |
US7243061B2 (en) | Multistage inverse quantization having a plurality of frequency bands | |
EP2308045B1 (en) | Compression of audio scale-factors by two-dimensional transformation | |
ES2717606T3 (es) | Codificación y decodificación de audio escalable usando un banco de filtros jerárquico | |
KR100958144B1 (ko) | 오디오 압축 | |
JP3344962B2 (ja) | オーディオ信号符号化装置、及びオーディオ信号復号化装置 | |
JPH09127990A (ja) | 音声符号化方法及び装置 | |
KR101414359B1 (ko) | 부호화 장치 및 부호화 방법 | |
KR100309727B1 (ko) | 오디오 신호 부호화 장치 및 복호화 장치와 오디오 신호 부호화 및 복호화 방법 | |
JPH07261800A (ja) | 変換符号化方法、復号化方法 | |
JP3087814B2 (ja) | 音響信号変換符号化装置および復号化装置 | |
JP4359949B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP3237178B2 (ja) | 符号化方法及び復号化方法 | |
JP3353267B2 (ja) | 音響信号変換符号化方法及び復号化方法 | |
JP3698418B2 (ja) | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 | |
EP0729132A2 (en) | Wide band signal encoder | |
CN111788628A (zh) | 编码装置、编码方法、程序以及记录介质 | |
JP4327420B2 (ja) | オーディオ信号符号化方法、及びオーディオ信号復号化方法 | |
JP4618823B2 (ja) | 信号符号化装置及び方法 | |
JP4993992B2 (ja) | 信号処理方法、信号処理装置及びプログラム | |
WO2018225412A1 (ja) | 符号化装置、復号装置、平滑化装置、逆平滑化装置、それらの方法、およびプログラム | |
JPH041800A (ja) | 音声帯域信号符号化方法 | |
Najafzadeh-Azghandi | Percept ual Coding of Narrowband Audio | |
JPH09127997A (ja) | 音声符号化方法及び装置 |